Toàn Tập Hướng Dẫn Xây Dựng AI Agent Swarm - P2: Hạ Tầng và Cách Hoạt Động
Mooncake disaggregates prefill và decode cluster, đạt throughput tăng 525% và xử lý 75% requests nhiều hơn. Swarm hoạt động theo wave: wave đầu chạy subtask độc lập, wave sau xử lý task phụ thuộc kết quả trước. Kết hợp Kimi K2.6 làm execution layer ($0.95/M input token) với Claude Opus 4.8 làm planner và verifier - Opus 4.8 ít bỏ sót lỗi hơn 4x so với tiền nhiệm.
Toàn Tập Hướng Dẫn Xây Dựng AI Agent Swarm - P3: Patterns và Guardrails
4 pattern swarm: orchestrator-worker, critic-refiner, hierarchical, và Claw Groups (heterogeneous swarm với human-in-loop). Prompt template chuẩn cho decomposition, specialist agent, và aggregation. 7 guardrail bắt buộc: max iterations, session timeout, structured output enforcement, failure isolation, retry với exponential backoff, human checkpoint, và cost monitoring.
Toàn Tập Hướng Dẫn Xây Dựng AI Agent Swarm - P1: Kiến Trúc và Nền Tảng
Agent Swarm chạy subtask song song - thời gian tổng xấp xỉ max(A,B,C) thay vì A+B+C, giảm 3-4.5x wall-clock time. Kimi K2.6 là MoE 1 nghìn tỷ tham số, 32B active, 300 sub-agent đồng thời và 4.000 tool call mỗi session. Agent Swarm được train vào mô hình qua PARL - không phải framework gắn ở application layer. BrowseComp: swarm mode đạt 78.4%, tăng 17.8 điểm so với single-agent (60.6%).
Hermes Video Agent: pipeline tự động "1 URL vào - 1 clip (đã sub) ra", vừa open-source MIT
Một dev solo vừa mở mã Hermes-video-agent: bỏ vào 1 URL YouTube/TikTok/Douyin, AI agent tự tải, transcribe bằng Whisper, dịch bằng Kimi K2.6, OCR thay text trên màn, ghép phụ đề song ngữ bằng FFmpeg, rồi auto-post lên X. Toàn bộ chạy local, MIT, không khoá API key.
Cloudflare chạy AI review trên mọi GitLab MR: 131k lượt/tháng, $1.19/review, mix Kimi K2.5 + Opus 4.7 + GPT-5.4
Cloudflare vừa hé lộ hệ thống AI Code Review nội bộ — mỗi merge request trên GitLab đều bị 1 đội AI reviewer mổ xẻ, routing model theo độ phức tạp MR, chạy trên 5,169 repo. 131,246 review trong 30 ngày, trung vị 3 phút 39 giây, cache hit 85.7%.