- Ngày 20/04/2026, Moonshot phát hành Kimi K2.6 trên OpenRouter — model coding long-horizon với 262K context, kiến trúc Agent Swarm 100 sub-agent, rẻ hơn Claude Sonnet 4.6 tới 3.75 lần output.
- Bài này mổ xẻ con số, so sánh thẳng và xem lý do vì sao nó được gọi là 'systems engineer' thay vì chatbot.
TL;DR
Kimi K2.6 của Moonshot AI vừa lên OpenRouter ngày 20/04/2026. Đây là model coding long-horizon — tối ưu cho các tác vụ agentic chạy dài hàng trăm bước, không phải chatbot Q&A. Điểm đáng chú ý: context 262K token, Agent Swarm 100 sub-agent song song, giá $0.95 input / $4 output mỗi triệu token trên OpenRouter — rẻ hơn Claude Sonnet 4.6 khoảng 3–3.75 lần. Đã dùng được ngay trong mọi agent hỗ trợ OpenRouter (Cursor, Cline, Aider…).
Có gì mới
Moonshot mô tả K2.6 bằng một câu rất gợi: "behaves more like a systems engineer than a chatbot, with the stamina to decompose, execute, and optimize complex tasks." Dịch nôm na: model không chỉ trả lời, nó bẻ nhỏ yêu cầu, thực thi, và tối ưu xuyên suốt một session kéo dài.
Ba nâng cấp cụ thể so với K2.5:
- Reasoning trace sâu hơn — quá trình suy luận có cấu trúc, đỡ lạc giữa đường.
- Agent planning chắc hơn — giảm bottleneck khi phải chia thành chuỗi tác vụ tuần tự.
- Tool-call ổn định hơn ở mức nhiều bước — điều đã là điểm yếu của gần như mọi coding model trước đây.
Và kiến trúc đáng nói nhất kế thừa từ Kimi Code: Agent Swarm điều phối tới 100 sub-agent song song, cho ~4.5× tốc độ trên các tác vụ parallelize được — refactor monorepo đa file, batch migration, fix test hàng loạt.
Số liệu kỹ thuật
| Thông số | K2.6 (OpenRouter) | K2.5 | K2 Thinking |
|---|---|---|---|
| Context window | 262K | 262K | 262K |
| Input / 1M token | $0.95 | $0.44 | $0.60 |
| Output / 1M token | $4.00 | $2.00 | $2.50 |
| Ngày lên OpenRouter | 20/04/2026 | 27/01/2026 | 06/11/2025 |
| Định hướng | Long-horizon coding | Multimodal coding | Reasoning |
K2 Thinking (tiền nhiệm gần nhất về reasoning) đạt 71.3% SWE-Bench Verified, 61.1% SWE-Multilingual, 47.1% Terminal-Bench và duy trì ổn định 200–300 tool call liên tiếp. K2.5 base đạt 76.8% SWE-Bench Verified, 85% LiveCodeBench. Moonshot chưa công bố benchmark chính thức cho K2.6 tại thời điểm ra mắt, nhưng tester sớm mô tả cảm giác dùng là "Opus-flavored".
So sánh giá
Chỗ K2.6 tấn công mạnh là giá/hiệu năng. Cùng cỡ tác vụ coding agentic:
| Model | Input $/1M | Output $/1M | Chi phí tương đối |
|---|---|---|---|
| Claude Sonnet 4.6 | $3.00 | $15.00 | 1.0× (baseline) |
| Kimi K2.6 (OpenRouter) | $0.95 | $4.00 | ~0.27× |
| Kimi K2.6 (Moonshot direct) | $0.60 | $2.50 | ~0.17× |
Nói cách khác, nếu workload của bạn là agentic loop đốt output token (debug, refactor, viết test), chi phí có thể giảm 3–6 lần khi đổi từ Sonnet 4.6 sang K2.6.
Dùng vào việc gì
- Refactor monorepo đa ngôn ngữ — Agent Swarm chia việc, mỗi sub-agent xử một package.
- Long-running agent loop — chạy fix test, bump dependency, migration — những task cần stamina chứ không cần cleverness một phát.
- CI triage tự động — đọc log, tìm root cause, tạo PR fix.
- Infra & DB migration — viết script IaC, evolve schema theo plan nhiều bước.
- Plug vào coding agent hiện có — Cursor, Cline, Aider, Claude Code-style harness đều dùng được qua OpenRouter endpoint duy nhất.
Giới hạn & pricing
- Đang ở trạng thái preview — chưa có bảng benchmark chính thức của Moonshot cho K2.6.
- K2.6 focus coding text; nếu task nặng hình ảnh (visual agent, UI parsing) thì K2.5 vẫn là lựa chọn multimodal mặnh hơn.
- Giá cao hơn K2.5 ($0.95 vs $0.44 input) — không phải option rẻ nhất trên shelf Moonshot, bạn trả thêm để đổi lấy horizon dài hơn.
- Native INT4 quantization details chưa công bố (K2 Thinking có, K2.6 chờ xác nhận).
- Availability: model ID
moonshotai/kimi-k2.6trên OpenRouter; Kimi Code subscriber đã có từ 13/04/2026.
Chuyện sắp tới
Moonshot đang đi một lịch trình khá đều: K2 (7/2025) → K2 0905 (9/2025) → K2 Thinking (11/2025) → K2.5 (1/2026) → K2.6 (4/2026). Hai thứ đáng chờ: bảng benchmark chính thức của K2.6 và khả năng có K2.6 Thinking variant ghép reasoning depth với agent swarm. Tạm thời, nếu đang chạy agent tốn token hàng ngày mà budget căng, K2.6 là model đáng thử ngay trong tuần này.
Nguồn: OpenRouter, OpenRouter Moonshot models, Kimi K2.6 Code Preview, BuildFastWithAI, Moonshot Kimi K2 Thinking.
