Tất cả bài viết

// Posts#kimi-k2

7182026-06-02

Toàn Tập Hướng Dẫn Xây Dựng AI Agent Swarm - P2: Hạ Tầng và Cách Hoạt Động

Mooncake disaggregates prefill và decode cluster, đạt throughput tăng 525% và xử lý 75% requests nhiều hơn. Swarm hoạt động theo wave: wave đầu chạy subtask độc lập, wave sau xử lý task phụ thuộc kết quả trước. Kết hợp Kimi K2.6 làm execution layer ($0.95/M input token) với Claude Opus 4.8 làm planner và verifier - Opus 4.8 ít bỏ sót lỗi hơn 4x so với tiền nhiệm.

ai-agentagent-swarmkimi-k2

9 phút đọc

7192026-06-01

Toàn Tập Hướng Dẫn Xây Dựng AI Agent Swarm - P3: Patterns và Guardrails

4 pattern swarm: orchestrator-worker, critic-refiner, hierarchical, và Claw Groups (heterogeneous swarm với human-in-loop). Prompt template chuẩn cho decomposition, specialist agent, và aggregation. 7 guardrail bắt buộc: max iterations, session timeout, structured output enforcement, failure isolation, retry với exponential backoff, human checkpoint, và cost monitoring.

ai-agentagent-swarmkimi-k2

8 phút đọc

7172026-06-01

Toàn Tập Hướng Dẫn Xây Dựng AI Agent Swarm - P1: Kiến Trúc và Nền Tảng

Agent Swarm chạy subtask song song - thời gian tổng xấp xỉ max(A,B,C) thay vì A+B+C, giảm 3-4.5x wall-clock time. Kimi K2.6 là MoE 1 nghìn tỷ tham số, 32B active, 300 sub-agent đồng thời và 4.000 tool call mỗi session. Agent Swarm được train vào mô hình qua PARL - không phải framework gắn ở application layer. BrowseComp: swarm mode đạt 78.4%, tăng 17.8 điểm so với single-agent (60.6%).

ai-agentagent-swarmkimi-k2

9 phút đọc

#3892026-04-24

Hermes Video Agent: pipeline tự động "1 URL vào - 1 clip (đã sub) ra", vừa open-source MIT

Một dev solo vừa mở mã Hermes-video-agent: bỏ vào 1 URL YouTube/TikTok/Douyin, AI agent tự tải, transcribe bằng Whisper, dịch bằng Kimi K2.6, OCR thay text trên màn, ghép phụ đề song ngữ bằng FFmpeg, rồi auto-post lên X. Toàn bộ chạy local, MIT, không khoá API key.

video-pipelinekimi-k2video-automation

6 phút đọc

#0892025-06-28

Cloudflare chạy AI review trên mọi GitLab MR: 131k lượt/tháng, $1.19/review, mix Kimi K2.5 + Opus 4.7 + GPT-5.4

Cloudflare vừa hé lộ hệ thống AI Code Review nội bộ — mỗi merge request trên GitLab đều bị 1 đội AI reviewer mổ xẻ, routing model theo độ phức tạp MR, chạy trên 5,169 repo. 131,246 review trong 30 ngày, trung vị 3 phút 39 giây, cache hit 85.7%.

cloudflareai-code-reviewgitlab

7 phút đọc