Tất cả bài viết

// Posts#opus-4.8

7182026-06-02

Hướng Dẫn Xây Dựng AI Agent Swarms - P2: Hạ Tầng và Cách Hoạt Động

Mooncake disaggregates prefill và decode cluster, đạt throughput tăng 525% và xử lý 75% requests nhiều hơn. Swarm hoạt động theo wave: wave đầu chạy subtask độc lập, wave sau xử lý task phụ thuộc kết quả trước. Kết hợp Kimi K2.6 làm execution layer ($0.95/M input token) với Claude Opus 4.8 làm planner và verifier - Opus 4.8 ít bỏ sót lỗi hơn 4x so với tiền nhiệm.

ai-agentagent-swarmkimi-k2

9 phút đọc

7172026-06-01

Hướng Dẫn Xây Dựng AI Agent Swarms - P1: Kiến Trúc và Nền Tảng

Agent Swarm chạy subtask song song - thời gian tổng xấp xỉ max(A,B,C) thay vì A+B+C, giảm 3-4.5x wall-clock time. Kimi K2.6 là MoE 1 nghìn tỷ tham số, 32B active, 300 sub-agent đồng thời và 4.000 tool call mỗi session. Agent Swarm được train vào mô hình qua PARL - không phải framework gắn ở application layer. BrowseComp: swarm mode đạt 78.4%, tăng 17.8 điểm so với single-agent (60.6%).

ai-agentagent-swarmkimi-k2

9 phút đọc