TL;DR
TestingCatalog vừa leak loạt chi tiết về Grok Build và Grok Computer, hé lộ xAI đang chuẩn bị một desktop app thống nhất thay vì chỉ web. Grok Build có sẵn hai bản UI Local và Remote — bản Local chỉ make sense nếu chạy qua desktop app. Grok Computer khả năng cao là chính Grok Desktop app với Grok Build tích hợp, và nhiều khả năng sẽ drop đồng thời trên macOS + Windows. Khi ra mắt, Grok Build sẽ đi kèm Connectors, Arena Mode, Parallel Agents (tối đa 8 agent chạy song song).
Có gì mới
Leak lần này không phải là một announcement chính thức mà là tổng hợp từ nhiều lần dò code trace, settings page và UI trên Grok web. Bốn điểm đáng chú ý:
- Grok Build UI có 2 version — bản Local chạy Grok agent ngay trên máy người dùng (npm package + WebSocket localhost), bản Remote execute trên cloud xAI. Version Local chỉ hợp lý khi đi kèm desktop app — đây là tín hiệu rõ nhất.
- Grok Computer nhiều khả năng chính là Grok Desktop app, với Grok Build tích hợp sẵn. Vì UI web-based, rất cao khả năng macOS và Windows ship cùng một thời điểm.
- Bộ tính năng đi kèm: Connectors support, Arena mode (ranking output tự động), Parallel Agents mode (multi-agent side-by-side).
- Fire animation — một hiệu ứng UI đã được spot trước đó có thể trở thành signature visual cho Grok Computer.
Vì sao đáng quan tâm
Đây là lần đầu xAI tiến tới một sản phẩm coding agent toàn diện, ngang hàng với Claude Code và OpenAI Codex — nhưng với chiến lược khác: multi-agent orchestration + local-first. Nếu đúng roadmap, Grok Build sẽ là coding IDE đầu tiên cho phép spawn 8 agent cạnh tranh cùng lúc trong một session. Bước thêm của Grok Computer (agent điều khiển toàn bộ PC) cho thấy xAI đặt cược vào viễn cảnh AI agent thay thế knowledge worker ở cấp workflow, chứ không chỉ dừng ở chat box.
Technical facts
Model nền tảng là grok-code-fast-1, với các chỉ số đã được công bố trước đó:
| Property | Giá trị |
|---|---|
| SWE-Bench Verified | 70.8% |
| Context window | 256,000 tokens |
| Throughput | ~176 tokens/sec |
| Languages | TypeScript, Python, Java, Rust, C++, Go |
| Pricing API | $0.20 / 1M input · $1.50 / 1M output · cache reads free |
Về Parallel Agents: người dùng có thể launch tối đa 8 agent đồng thời, phân bổ giữa hai model Grok Code 1 Fast và Grok 4 Fast với limit 4 instance mỗi model. UI render responses side-by-side kèm context usage tracker — hợp lý cho vibe coding hoặc A/B test cách tiếp cận.
Arena Mode đi xa hơn: output của các agent được scoring và ranking tự động, thay vì chỉ hiển thị để user tự chọn. Framework tournament-style này gợi nhớ Google Gemini Enterprise.
So với Claude Code và OpenAI Codex
| Dimension | Grok Build | Claude Code | OpenAI Codex |
|---|---|---|---|
| Execution | Local-first CLI + remote | Cloud | Cloud |
| Parallel agents | Up to 8 (4/model) | Single | Single |
| Model routing | Grok Code 1 Fast + Grok 4 Fast | Claude 4.6 / 4.7 | GPT-5 family |
| SWE-Bench Verified | 70.8% | ~72% | ~69-74% |
| Desktop app | Đồn có (Grok Computer) | Có | Web-only |
| Pricing model | Credits (bundled + top-up) | Subscription + API | Subscription + API |
Điểm khác biệt lớn nhất nằm ở multi-agent parallel + Arena ranking. Claude Code và Codex đều đi theo single-agent; Grok Build đặt cược vào orchestration nhiều agent cạnh tranh — và để điều này work trên desktop, một app native gần như là bắt buộc.
Use cases thực tế
- Vibe coding with fallback: prompt một feature, 8 agent viết 8 variant, Arena ranking chọn version tốt nhất tự động.
- A/B code strategy: 4 instance Grok Code Fast cho speed + 4 instance Grok 4 Fast cho quality, so sánh trade-off trực tiếp.
- Desktop workflow automation (Grok Computer): agent tự click/type/fill form xuyên app cho knowledge worker xử lý task lặp.
- Air-gap dev: local-first design phù hợp enterprise không muốn code rời máy nội bộ.
Limitations & pricing
Một số điểm cần giữ đầu lạnh:
- Trang credits billing được mô tả là non-functional và early in development — commercial rollout có thể bị delay.
- Grok Build vẫn đang trong public waitlist, chưa GA.
- Infrastructure scaling cho 8-agent parallelism còn đang solve.
- GitHub integration chưa hoàn chỉnh trong early build.
- Remote environments marked coming soon; phiên bản đầu ưu tiên local.
Về pricing, model rumored là hybrid giống Claude Code / Codex: subscriber nhận monthly credit allotment bundled vào plan, mua thêm on-demand cho heavy usage. Tiers cụ thể (SuperGrok / SuperGrok Heavy) chưa công bố. Giá API grok-code-fast-1 hiện rẻ hơn Sonnet ~3× nếu tính theo input token.
Chặng tiếp theo
Theo timeline đã lộ, Elon Musk công bố dự án Macrohard — joint venture Tesla-xAI với $2B Tesla đầu tư — vào tháng 3/2026, và Grok Computer là consumer preview của Macrohard. Grok Computer beta đã đi từ private sang public testing trong tháng 4/2026. Musk từng nhắc tới mốc đạt capability parity đầy đủ vào June 2026 — cũng là khung thời gian khả dĩ cho desktop app drop đồng thời macOS + Windows. Tín hiệu thực tế tiếp theo đáng theo dõi: trang credits billing go live, và một keynote hoặc tweet từ Musk chốt ngày release.
Nguồn: TestingCatalog, testingcatalog.com, Parallel Agents & Arena, adwaitx.com.