- Google vừa bổ sung hai biến thể mới cho Deep Research trong Gemini API — bản tốc độ và bản Max dùng extended test-time compute — cùng MCP, native chart và File Search.
- Max đạt 93.3% DeepSearchQA và 54.6% HLE.
TL;DR
Ngày 21/4/2026, Google tung hai biến thể mới cho tác tử Deep Research trong Gemini API: deep-research-preview-04-2026 tối ưu cho tốc độ và stream UI, cùng deep-research-max-preview-04-2026 tối ưu cho chất lượng tối đa bằng extended test-time compute. Max đạt 93.3% trên DeepSearchQA và 54.6% trên Humanity's Last Exam (HLE), đồng thời cả hai biến thể đều bổ sung MCP support, native chart/infographic generation, File Search và collaborative planning. Lõi suy luận vẫn là Gemini 3 Pro.
What's new
Bản cập nhật lần này chia Deep Research thành hai làn đường rõ rệt, thay vì một model duy nhất như đợt ra mắt tháng 12/2025:
- Speed mode —
deep-research-preview-04-2026: ngân sách nhẹ, trả kết quả streaming để gắn thẳng vào UI client. Phù hợp chatbot research-assistant realtime. - Max mode —
deep-research-max-preview-04-2026: dùng nhiều test-time compute hơn (gấp đôi số lần search, gấp gần 4 lần input token), đổi lấy chất lượng SOTA trên các benchmark research dài hạn.
Quan trọng không kém: cả hai biến thể đều mở ra bốn năng lực mới mà bản tháng 12 chưa có:
- MCP (Model Context Protocol): kết nối sang MCP server bên ngoài để agent truy cập dữ liệu riêng (CRM, Linear, GitHub, wiki nội bộ) — thay thế cho Function Calling truyền thống.
- Native visualization: agent tự sinh biểu đồ và infographic khi được yêu cầu, không cần pipeline render rời.
- File Search: agent tra cứu trên kho tài liệu người dùng upload, kết hợp với tìm kiếm web.
- Collaborative planning: agent đề xuất kế hoạch nghiên cứu và cho phép người dùng tinh chỉnh qua nhiều lượt trước khi thực thi.
Why it matters
Deep Research không còn là "một endpoint viết báo cáo". Với MCP + File Search + native chart, nó trở thành block xây dựng duy nhất để dựng một sản phẩm phân tích chiều sâu: agent vừa crawl web, vừa đọc corpora nội bộ, vừa gọi tool riêng, vừa xuất chart — toàn bộ trong một task duy nhất. Các team trước đây phải tự khâu vòng lặp search-read-synthesize + dựng pipeline chart riêng giờ có thể gói gọn vào một lời gọi API.
Technical facts
| Thuộc tính | Speed (preview-04-2026) | Max (preview-04-2026) |
|---|---|---|
| Mục tiêu | Streaming UI, latency thấp | Comprehensiveness tối đa |
| Searches / task (ước lượng) | ~80 | ~160 |
| Input tokens / task | ~250k | ~900k |
| Output tokens / task | ~60k | ~80k |
| Chi phí / task | $1 – $3 | $3 – $7 |
| Reasoning core | Gemini 3 Pro | |
Điểm kỹ thuật cần lưu ý:
- Agent chạy ở chế độ async: bắt buộc
background=Truevàstore=True, client poll kết quả. - Research tối đa 60 phút, đa số task hoàn tất trong ~20 phút.
- Chưa hỗ trợ structured output (không có JSON schema response).
- Không dùng Function Calling tuỳ biến — mọi tool phải expose qua MCP server.
- Built-in tools mặc định: Google Search, URL Context, Code Execution.
- Input đa phương thức: text, PDF, ảnh.
Comparison
So với chính bản Deep Research ra mắt tháng 12/2025, Max nhảy vọt cả trên benchmark web research lẫn benchmark lý luận khó:
| Benchmark | Dec 2025 Deep Research | Apr 2026 Max | Delta |
|---|---|---|---|
| DeepSearchQA | 66.1% | 93.3% | +27.2pp |
| Humanity's Last Exam (HLE) | 46.4% | 54.6% | +8.2pp |
Ở lần ra mắt tháng 12, TechCrunch ghi nhận ChatGPT 5 Pro của OpenAI là "second khá sát" tổng thể và nhỉnh hơn trên BrowseComp. Với con số 93.3% DeepSearchQA của Max, Google đang đòi lại đường chạy dẫn đầu trên các task research dài hạn; số liệu head-to-head từ bên thứ ba với các bản 04-2026 chưa được công bố.
Use cases
- Tài chính: due diligence, investment memo, phân tích rủi ro — Max ăn được bộ tài liệu nội bộ + web + số liệu công khai rồi xuất chart so sánh.
- Biotech & khoa học: literature review, drug-toxicity safety, tổng hợp nhiều paper vào một report dài.
- Market research & competitive landscaping: agent crawl competitor site, tổng hợp pricing, xuất comparison table trực tiếp.
- Internal knowledge assistant: kết hợp File Search trên corpora công ty + MCP vào Linear/Jira/GitHub cho câu trả lời "grounded" đến từng ticket.
- Consumer research product: dùng Speed mode để stream kết quả về UI, giữ UX realtime.
Limitations & pricing
- Cả hai biến thể đang ở preview — API shape có thể đổi.
- Chỉ truy cập qua Interactions API, không có route
chat.completionstương đương. - Không hỗ trợ structured output; không dùng được custom Function Calling (phải đi qua MCP server).
- Ceiling 60 phút / task, client phải handle async polling.
- Visualization chỉ xuất khi yêu cầu rõ ràng trong prompt.
- Giá theo task (không theo token thuần): Speed $1–3, Max $3–7 — dễ tính budget hơn nhưng cũng dễ đắt nếu chạy loop vô tội vạ.
What's next
Google đã signal hai hướng tiếp theo: tích hợp sâu hơn vào Google Search, Google Finance, Gemini App và NotebookLM; và tiếp tục scale test-time compute để đẩy benchmark thêm. Với MCP đứng ở trung tâm, nhiều khả năng Gemini Deep Research sẽ nhanh chóng có "app store" các MCP connectors — giống cách ChatGPT mở rộng qua Apps/GPTs. Nếu đang xây sản phẩm research hoặc analyst-workflow, đây là lúc hợp lý để thử Max trên một vertical cụ thể trước khi khoá vào pipeline tự build.
Nguồn: ai.google.dev, Gemini API release notes, blog.google, @sundarpichai.
