- Gemini 3.5 Flash ra mắt tại Google I/O 2026, nhanh hơn 4x và rẻ hơn một nửa so với frontier model tương đương.
- Gemini Spark là AI agent 24/7 chạy trên Cloud VM, sẽ beta cho Google AI Ultra subscribers Mỹ ngay tuần tới.
- Antigravity 2.0 demo build cả một OS từ đầu trong 12 giờ với chưa đến $1,000 tokens.
- TPU thế hệ 8 đạt ~3x computing power thế hệ trước, có thể scale trên 1 triệu TPUs toàn cầu.
TL;DR
Google I/O 2026 đánh dấu bước chuyển lịch sử từ AI hỗ trợ sang AI tự chủ. Gemini 3.5 Flash available ngay hôm nay - nhanh hơn 4x và rẻ hơn một nửa. Gemini Spark là AI agent 24/7 chạy trên Cloud VM kể cả khi bạn đã tắt máy. Antigravity 2.0 biến Google thành hub điều phối multi-agent. Search được cải tổ lần đầu sau 25 năm. TPU thế hệ 8 mạnh gấp 3 lần. Kính AR âm thanh ra mùa thu.
Kỷ nguyên Agentic AI chính thức bắt đầu
Sundar Pichai mở màn Google I/O 2026 với tuyên bố dứt khoát: đây không còn là AI trả lời câu hỏi - đây là AI tự lên kế hoạch, phân công và thực thi. Google gọi đây là "agentic Gemini era".
Năm ngoái, Google ra mắt Gemini 2.0 và Project Astra - AI có thể nhìn, nghe, nói theo thời gian thực. Năm nay bước tiếp theo: AI có thể làm. Làm 24/7. Làm trong khi bạn ngủ.
Gemini 3.5 Flash và Omni: nhanh hơn 4x, rẻ hơn một nửa
Gemini 3.5 Flash - sản phẩm trung tâm của I/O năm nay - available ngay cho tất cả người dùng và API. Con số ấn tượng nhất: nhanh hơn 4x các frontier model khác về output tokens/giây, với giá chưa tới một nửa.
Google ước tính nếu các công ty lớn đang xử lý ~1 trillion tokens/ngày chuyển 80% workload sang Flash, họ tiết kiệm hơn $1 tỷ mỗi năm. Flash nhắm rõ vào production workload quy mô lớn, không chỉ demo. Trên benchmark GDPVal - đo lường tác vụ có giá trị kinh tế thực - Flash vượt Gemini 3.1 Pro ở hầu hết chỉ tiêu dù là model nhỏ hơn.
Gemini 3.5 Pro - phiên bản flagship - đang test nội bộ, dự kiến ra tháng 6/2026.
Gemini Omni đi xa hơn: bất kỳ input nào (text, ảnh, video, audio) đều có thể tạo ra bất kỳ output nào. Phase đầu tập trung vào video generation và editing. Gemini Omni Flash available ngay hôm nay trên Gemini app, Google Flow, và YouTube Shorts cho paid subscribers.
Gemini Spark và Antigravity 2.0: agent làm việc 24/7
Gemini Spark là điểm nhấn lớn nhất I/O năm nay: AI agent chạy trên dedicated Google Cloud VM, hoạt động 24/7 kể cả khi bạn đã tắt máy. Spark dùng Gemini 3.5 Flash làm backbone, tích hợp sẵn Google Workspace (Gmail, Sheets, Docs). MCP support cho third-party apps đến trong vài tuần.
Spark nhận lệnh qua Gemini app, email hoặc chat. Mùa hè 2026, Spark mở rộng thành "agentic browser" trong Chrome - điều phối toàn bộ workflow browsing thay bạn. Beta tuần tới cho Google AI Ultra subscribers Mỹ (tier mới $100/tháng, thay thế tier cũ $200/tháng giảm từ $250).
Antigravity 2.0 không còn là coding platform đơn thuần - đây là hub điều phối cohort of autonomous AI agents. Phiên bản Flash tối ưu riêng cho Antigravity chạy nhanh hơn 12x so với frontier models. Demo tại I/O: nhóm subagents build toàn bộ OS từ đầu trong 12 giờ với dưới $1,000 tokens. Available toàn cầu, miễn phí, ngay hôm nay.
Google Search đổi diện mạo - lần đầu sau 25 năm
Search box mới hỗ trợ multimodal đầy đủ: text, ảnh, video, file, và cả Chrome tabs. AI Overviews và AI Mode gộp thành một interface duy nhất.
- Information Agents: monitor web 24/7 - theo dõi giá cổ phiếu, sneaker drops, tin tức chuyên ngành. Ra mùa hè 2026, Pro/Ultra trước.
- Generative UI: Search tự code interactive widgets theo từng query. Ra mùa hè 2026, miễn phí cho tất cả.
- Universal Cart + Agent Payments: giỏ hàng thông minh theo dõi qua Gmail/YouTube/web, tự detect item không tương thích, agent tự checkout theo rules bạn đặt sẵn.
TPU thế hệ 8 và kính AR
Google ra mắt TPU thế hệ 8 với kiến trúc dual chip: TPU 8t cho training và TPU 8i cho inference. TPU 8t đạt gần 3x computing power thế hệ trước, scale across hơn 1 triệu TPUs toàn cầu - largest training cluster từ trước đến nay. Cả hai chip đạt 2x performance-per-watt.
Android XR Audio Glasses ra mùa thu 2026, hợp tác Samsung (hardware), Gentle Monster và Warby Parker (thiết kế). Gemini nói trực tiếp vào tai, hỗ trợ cả Android lẫn iOS. Display glasses - overlay thông tin lên tầm nhìn thực - sẽ đến sau dòng audio.
SynthID đã watermark hơn 100 tỷ outputs (tương đương 60.000 năm audio). OpenAI, Kakao, ElevenLabs đều tham gia hệ sinh thái SynthID - tín hiệu ngành đang đồng thuận về content provenance.
Kết
Google I/O 2026 không phải sự kiện ra mắt model - đây là tuyên bố chiến lược. Google đặt cược rằng tương lai AI không phải chatbot, mà là agent: agent chạy trong nền, agent mua hàng thay bạn, agent code OS trong 12 giờ, agent monitor tin tức 24/7.
Câu hỏi thực tế duy nhất: bạn sẽ giao tác vụ nào cho agent trước tiên?
