Gemini API ra mắt Deep Research Max: 93.3% DeepSearchQA, hỗ trợ MCP và tự sinh biểu đồ

TL;DR

Ngày 21/4/2026, Google tung hai biến thể mới cho tác tử Deep Research trong Gemini API: deep-research-preview-04-2026 tối ưu cho tốc độ và stream UI, cùng deep-research-max-preview-04-2026 tối ưu cho chất lượng tối đa bằng extended test-time compute. Max đạt 93.3% trên DeepSearchQA và 54.6% trên Humanity's Last Exam (HLE), đồng thời cả hai biến thể đều bổ sung MCP support, native chart/infographic generation, File Search và collaborative planning. Lõi suy luận vẫn là Gemini 3 Pro.

What's new

Bản cập nhật lần này chia Deep Research thành hai làn đường rõ rệt, thay vì một model duy nhất như đợt ra mắt tháng 12/2025:

Speed mode — deep-research-preview-04-2026: ngân sách nhẹ, trả kết quả streaming để gắn thẳng vào UI client. Phù hợp chatbot research-assistant realtime.
Max mode — deep-research-max-preview-04-2026: dùng nhiều test-time compute hơn (gấp đôi số lần search, gấp gần 4 lần input token), đổi lấy chất lượng SOTA trên các benchmark research dài hạn.

Quan trọng không kém: cả hai biến thể đều mở ra bốn năng lực mới mà bản tháng 12 chưa có:

MCP (Model Context Protocol): kết nối sang MCP server bên ngoài để agent truy cập dữ liệu riêng (CRM, Linear, GitHub, wiki nội bộ) — thay thế cho Function Calling truyền thống.
Native visualization: agent tự sinh biểu đồ và infographic khi được yêu cầu, không cần pipeline render rời.
File Search: agent tra cứu trên kho tài liệu người dùng upload, kết hợp với tìm kiếm web.
Collaborative planning: agent đề xuất kế hoạch nghiên cứu và cho phép người dùng tinh chỉnh qua nhiều lượt trước khi thực thi.

Why it matters

Deep Research không còn là "một endpoint viết báo cáo". Với MCP + File Search + native chart, nó trở thành block xây dựng duy nhất để dựng một sản phẩm phân tích chiều sâu: agent vừa crawl web, vừa đọc corpora nội bộ, vừa gọi tool riêng, vừa xuất chart — toàn bộ trong một task duy nhất. Các team trước đây phải tự khâu vòng lặp search-read-synthesize + dựng pipeline chart riêng giờ có thể gói gọn vào một lời gọi API.

Technical facts

Thuộc tính	Speed (preview-04-2026)	Max (preview-04-2026)
Mục tiêu	Streaming UI, latency thấp	Comprehensiveness tối đa
Searches / task (ước lượng)	~80	~160
Input tokens / task	~250k	~900k
Output tokens / task	~60k	~80k
Chi phí / task	$1 – $3	$3 – $7
Reasoning core	Gemini 3 Pro

Điểm kỹ thuật cần lưu ý:

Agent chạy ở chế độ async: bắt buộc background=True và store=True, client poll kết quả.
Research tối đa 60 phút, đa số task hoàn tất trong ~20 phút.
Chưa hỗ trợ structured output (không có JSON schema response).
Không dùng Function Calling tuỳ biến — mọi tool phải expose qua MCP server.
Built-in tools mặc định: Google Search, URL Context, Code Execution.
Input đa phương thức: text, PDF, ảnh.

Comparison

So với chính bản Deep Research ra mắt tháng 12/2025, Max nhảy vọt cả trên benchmark web research lẫn benchmark lý luận khó:

Benchmark	Dec 2025 Deep Research	Apr 2026 Max	Delta
DeepSearchQA	66.1%	93.3%	+27.2pp
Humanity's Last Exam (HLE)	46.4%	54.6%	+8.2pp

Ở lần ra mắt tháng 12, TechCrunch ghi nhận ChatGPT 5 Pro của OpenAI là "second khá sát" tổng thể và nhỉnh hơn trên BrowseComp. Với con số 93.3% DeepSearchQA của Max, Google đang đòi lại đường chạy dẫn đầu trên các task research dài hạn; số liệu head-to-head từ bên thứ ba với các bản 04-2026 chưa được công bố.

Use cases

Tài chính: due diligence, investment memo, phân tích rủi ro — Max ăn được bộ tài liệu nội bộ + web + số liệu công khai rồi xuất chart so sánh.
Biotech & khoa học: literature review, drug-toxicity safety, tổng hợp nhiều paper vào một report dài.
Market research & competitive landscaping: agent crawl competitor site, tổng hợp pricing, xuất comparison table trực tiếp.
Internal knowledge assistant: kết hợp File Search trên corpora công ty + MCP vào Linear/Jira/GitHub cho câu trả lời "grounded" đến từng ticket.
Consumer research product: dùng Speed mode để stream kết quả về UI, giữ UX realtime.

Limitations & pricing

Cả hai biến thể đang ở preview — API shape có thể đổi.
Chỉ truy cập qua Interactions API, không có route chat.completions tương đương.
Không hỗ trợ structured output; không dùng được custom Function Calling (phải đi qua MCP server).
Ceiling 60 phút / task, client phải handle async polling.
Visualization chỉ xuất khi yêu cầu rõ ràng trong prompt.
Giá theo task (không theo token thuần): Speed $1–3, Max $3–7 — dễ tính budget hơn nhưng cũng dễ đắt nếu chạy loop vô tội vạ.

What's next

Google đã signal hai hướng tiếp theo: tích hợp sâu hơn vào Google Search, Google Finance, Gemini App và NotebookLM; và tiếp tục scale test-time compute để đẩy benchmark thêm. Với MCP đứng ở trung tâm, nhiều khả năng Gemini Deep Research sẽ nhanh chóng có "app store" các MCP connectors — giống cách ChatGPT mở rộng qua Apps/GPTs. Nếu đang xây sản phẩm research hoặc analyst-workflow, đây là lúc hợp lý để thử Max trên một vertical cụ thể trước khi khoá vào pipeline tự build.

Nguồn: ai.google.dev, Gemini API release notes, blog.google, @sundarpichai.

Gemini API ra mắt Deep Research Max: 93.3% DeepSearchQA, hỗ trợ MCP và tự sinh biểu đồ

TL;DR

What's new

Why it matters

Technical facts

Comparison

Use cases

Limitations & pricing

What's next

Tiếp tục lướt

Mind DeepResearch 30B của Li Auto vượt Gemini 3.1 trên benchmark deep research

AI Agent pops a root shell on Ubuntu 26.04 — on day one

OpenClaw v2026.4.24: Google Meet agents, full-agent voice, and DeepSeek V4 land in one release

CubeSandbox: Tencent vừa open-source nền tảng chạy hàng nghìn AI agent isolation thật trong vài mili-giây

GitHub Copilot SDK gặp React Native: bài học từ IssueCrush