xAI ra mắt Grok Build Beta: 8 AI Agent chạy song song trong terminal của bạn

TL;DR

xAI ra mắt Grok Build Beta cho toàn bộ SuperGrok và X Premium+ users từ 25/05/2026
Chạy tối đa 8 subagent song song, mỗi agent trên branch riêng - không ghi đè lẫn nhau
Plan Mode bật mặc định, local-first (code không rời máy), tương thích MCP servers
SWE-bench: 70.8% (model cũ) - kém Claude Code (87.6%) và Codex CLI (88.7%) khoảng 17 điểm
Giá: $99/tháng 6 tháng đầu, sau đó $299/tháng. Không có tier entry level
Cài đặt: curl -fsSL https://x.ai/cli/install.sh | bash

Grok Build là gì

Ngày 14/05/2026, xAI ra mắt Grok Build - CLI agentic đầu tiên của hãng dành cho lập trình viên chuyên nghiệp. Không giống chatbot thông thường, Grok Build chạy trực tiếp trong terminal, có thể lập kế hoạch, viết và chỉnh sửa file, chạy lệnh shell, và xây ứng dụng hoàn chỉnh từ prompt ngôn ngữ tự nhiên.

Đến ngày 25/05/2026, xAI mở rộng beta cho toàn bộ SuperGrok và X Premium+ users - không còn giới hạn ở nhóm SuperGrok Heavy như trước. Đây là động thái cạnh tranh trực tiếp với Claude Code của Anthropic và Codex CLI của OpenAI, trong bối cảnh thị trường AI coding agent đang tăng trưởng cực nhanh.

Tại sao xAI làm điều này ngay bây giờ

Elon Musk từng tuyên bố hồi tháng 4/2026 rằng sẽ mất đến tháng 5 để Grok bắt kịp Claude Opus 4.6 và tháng 6 để vượt qua. Trong khi đó, Anthropic đạt $30 tỷ ARR vào tháng 4/2026 - tăng gấp đôi chỉ trong hai tháng - phần lớn nhờ Claude Code.

Grok Build là câu trả lời của xAI với thị trường đó. Thay vì cạnh tranh trực diện về benchmark điểm cao nhất, xAI chọn hướng đi khác: kiến trúc song song với 8 subagent, Plan Mode mặc định, và local-first để phục vụ các đội nhóm trong ngành có yêu cầu bảo mật cao.

Tính năng chính

8 Subagent chạy song song

Đây là bet kiến trúc lớn nhất của Grok Build. Thay vì xử lý tuần tự như Claude Code hay Codex CLI, Grok Build có thể khởi chạy tối đa 8 subagent đồng thời. Mỗi agent hoạt động trên branch riêng của repository - một agent refactor module xác thực, agent khác viết test, agent thứ ba cập nhật tài liệu - tất cả không ghi đè lên nhau.

Lợi thế thực sự hiện ra với project lớn đa file, nơi các phần công việc độc lập với nhau. Với task nhỏ tightly-coupled, parallelism không mang lại lợi ích và có thể tạo thêm merge complexity.

Plan Mode bật mặc định

Một trong những phàn nàn phổ biến nhất với AI coding agent là: tool bắt đầu thực thi, đi sai hướng, và khi bạn nhận ra thì nó đã sửa hàng chục file. Grok Build giải quyết điều này bằng cách bắt buộc review kế hoạch trước. Agent đọc codebase, lên kế hoạch chi tiết, và trình bày để bạn approve - hoặc chỉnh sửa từng bước - trước khi một dòng code nào bị chạm tới. Sau đó, mọi thay đổi hiển thị dạng clean diff.

Local-first & air-gap

Toàn bộ code chạy trên máy bạn. Không có gì trong codebase được truyền lên server của xAI trong suốt session làm việc. Sau khi thiết lập ban đầu, Grok Build còn hỗ trợ môi trường offline (air-gap) - điểm cộng lớn cho developer trong ngành tài chính, y tế, chính phủ, hoặc làm việc dưới NDA.

Tương thích MCP và hệ sinh thái hiện có

Grok Build nhận diện ngay các convention khi chạy trong project folder: file AGENTS.md, plugins, hooks, skills, và đặc biệt là MCP servers. Nếu bạn đã cấu hình MCP servers cho Claude Code, chúng hoạt động với Grok Build mà không cần thiết lập lại. xAI gọi đây là "zero-friction migration path" - thay vì yêu cầu developer rebuild tooling, họ áp dụng chuẩn Anthropic đã xây.

Imagine - tạo ảnh & video trong CLI

Ngoài coding, Grok Build tích hợp Imagine để tạo ảnh và video ngay từ dòng lệnh. Đây là bước xAI mở rộng CLI thành nền tảng đa phương tiện thay vì chỉ là coding agent thuần túy.

So sánh Grok Build vs Claude Code vs Codex CLI: benchmark SWE-bench, giá và tính năng song song — Grok Build vs Claude Code vs Codex CLI - điểm SWE-bench, giá và parallel agents

Benchmark và so sánh

Số liệu hiện tại cần đọc kỹ: điểm 70.8% trên SWE-bench Verified thuộc về model cũ grok-code-fast-1 (deprecated 15/05/2026, retire 15/08/2026). Model đang chạy trong production CLI là grok-build-0.1 (ra mắt 20/05/2026), và xAI chưa công bố điểm benchmark cho model mới này.

Với các model hiện được benchmark:

Codex CLI (GPT-5.5): 88.7% SWE-bench Verified (dẫn đầu)
Claude Code (Opus 4.7): 87.6% SWE-bench Verified (về cơ bản ngang Codex)
Grok Build: 70.8% (model cũ) - khoảng cách khoảng 17 điểm

Khoảng cách này có ý nghĩa thực tế, nhưng cũng cần lưu ý: SWE-bench đo độ chính xác trên từng issue đơn lẻ, không đo throughput trên project lớn. Lợi thế parallel của Grok Build sẽ thể hiện trong thực tế, không phải trong benchmark đơn lẻ.

Giá và điều kiện dùng

Grok Build không có tier giá rẻ. Đây là điểm khác biệt lớn nhất so với đối thủ:

SuperGrok Heavy (intro): $99/tháng trong 6 tháng đầu (giảm 67%)
SuperGrok Heavy (standard): $299/tháng sau đó
API: $0.20/M input tokens, $1.50/M output tokens
So sánh: Claude Code từ $20/tháng, Codex CLI đi kèm ChatGPT Plus $20/tháng

Mức giá này định vị Grok Build rõ ràng là công cụ cho team có ngân sách, không phải indie developer hay sinh viên. Trong khi đó, Anthropic đang có thay đổi billing từ 15/06/2026 - programmatic usage qua SDK sẽ tính riêng theo API rate - nên chi phí thực tế của Claude Code cho team automation-heavy có thể tăng đáng kể.

Ai nên thử ngay

Phù hợp:

Team trong ngành tài chính, y tế, chính phủ - cần code không rời máy
Dự án lớn đa file cần xử lý song song nhiều task độc lập
Developer muốn Plan Mode bật mặc định, kiểm soát trước khi code bị chạm
Team đang dùng Claude Code muốn thử công cụ thứ hai với MCP sẵn có

Chưa phù hợp:

Solo developer với ngân sách hạn chế - không có tier $20
Production CI/CD - Grok Build còn early beta, chưa production-hardened
Task nhỏ, tightly-coupled - parallelism không có lợi

Sắp tới có gì

Hai điều đáng chú ý trong roadmap:

Arena Mode: Đã được xác nhận từ tháng 2/2026 qua code traces. Tính năng này cho phép nhiều agent độc lập giải cùng một bài toán, sau đó so sánh và xếp hạng các solution trước khi bạn thấy kết quả. Thay vì chấp nhận hay từ chối một output duy nhất, bạn chọn từ nhiều implementation có điểm chất lượng kèm theo. Arena Mode chưa live trong beta hiện tại.

Grok 5: xAI dự kiến tung Grok 5 trong tháng 5 hoặc tháng 6/2026 với 6 nghìn tỷ tham số và context window 1.5 triệu token. Khi Grok 5 thay thế grok-build-0.1 làm backend cho Grok Build, khoảng cách benchmark với Claude Code và Codex CLI nhiều khả năng sẽ thu hẹp đáng kể. Đây là lý do nên theo dõi sát trong vài tuần tới.

Kết

Grok Build là bet kiến trúc táo bạo của xAI - song song hóa thay vì tối ưu từng bước đơn lẻ, Plan Mode trước khi thực thi, và local-first cho team nhạy cảm về bảo mật. Điểm benchmark hiện tại thấp hơn đối thủ, nhưng model mới và Grok 5 sắp ra có thể thay đổi bức tranh này nhanh chóng.

Nếu bạn có SuperGrok hoặc X Premium+, thử ngay với curl -fsSL https://x.ai/cli/install.sh | bash. Còn nếu đang cân nhắc upgrade chỉ cho Grok Build, hãy đợi thêm vài tuần để xem Grok 5 mang lại gì. via xAI