7182026-06-02
Hướng Dẫn Xây Dựng AI Agent Swarms - P2: Hạ Tầng và Cách Hoạt Động
Mooncake disaggregates prefill và decode cluster, đạt throughput tăng 525% và xử lý 75% requests nhiều hơn. Swarm hoạt động theo wave: wave đầu chạy subtask độc lập, wave sau xử lý task phụ thuộc kết quả trước. Kết hợp Kimi K2.6 làm execution layer ($0.95/M input token) với Claude Opus 4.8 làm planner và verifier - Opus 4.8 ít bỏ sót lỗi hơn 4x so với tiền nhiệm.