- rtk là CLI proxy viết bằng Rust, chèn giữa AI coding agent và shell để lọc–nén output.
- Đúng như dân dev bảo: 'cảm giác token tụt thật'.
- Thực tế đo được: cargo test -99%, git diff -94%, phiên 30 phút từ 118k xuống 24k token.
TL;DR
rtk (Rust Token Killer) là CLI proxy mã nguồn mở, viết bằng Rust, chèn giữa AI coding agent (Claude Code, Codex, Cursor, Aider, Gemini CLI…) và shell. Khi agent chạy git status, cargo test, npm install, docker ps…, rtk chặn output thô, lọc – gom – cắt – khử trùng lặp, rồi chỉ đẩy phần "tín hiệu" vào context window của LLM. Kết quả đo thực tế: giảm 60–90% token trên các lệnh dev phổ thông, trung bình 89% noise bị bóc bỏ, phiên làm việc kéo dài ~3 lần trước khi đụng quota. Một file binary Rust duy nhất, zero dependency, overhead <10ms, chiếm <5MB RAM. Hỗ trợ 100+ lệnh, tích hợp transparent với 12 AI coding tool.
Bối cảnh: Vì sao AI coding agent "ngốn" token vô lý?
Mỗi lần Claude Code hay Codex chạy một lệnh shell, toàn bộ output thô được đổ thẳng vào context window. Model buộc phải "đọc" tất: banner, comment, blank line, progress bar, log lặp 200 dòng, path dài, metadata git… Theo đo đạc của tác giả Esteban Estrada, một phiên Claude Code 30 phút bình thường đốt ~150.000 token — 70% trong số đó không phải cho suy luận hay sinh code mà chỉ để "đọc" output shell.
rtk ra đời để đánh thẳng vào lớp lãng phí này. Do Patrick Szymkowiak sáng lập (cùng core contributor Florian Bruniaux, Adrien Eppling), dự án đã đạt ~30k sao GitHub, phát hành dưới giấy phép MIT / Apache-2.0, phiên bản hiện tại v0.37.1 (tháng 2/2026).
Cách rtk hoạt động
rtk dùng kiến trúc command proxy: main.rs route lệnh CLI qua enum Clap tới các filter module chuyên biệt trong src/cmds/*/. Mỗi filter thực thi lệnh gốc rồi áp 4 chiến lược nén:
- Smart Filtering — gỡ comment, blank line, boilerplate, separator trang trí, metadata vô nghĩa.
- Grouping — gom item tương tự. Thay vì liệt kê từng file, rtk rút thành
components/ (47 .tsx files). - Truncation — giữ đầu + cuối, cắt phần giữa lặp lại. Test output 200 ca pass → chỉ thấy vài dòng đầu + count + các ca fail.
- Deduplication — 5 warning giống hệt nhau gộp thành 1 dòng kèm
(×5).
Với Claude Code, rtk cài đặt một PreToolUse hook tự động viết lại lệnh Bash trước khi thực thi: git status → rtk git status. Claude "không biết" có phép biến đổi này, chỉ nhận output đã nén. Zero thay đổi workflow — đúng tinh thần mà dân dev thích: cài xong, quên đi.
Số liệu cụ thể
Đo từng lệnh đơn (nguồn: trang chủ rtk-ai.app):
| Lệnh | Không rtk | Với rtk | Tiết kiệm |
|---|---|---|---|
cargo test | ~4.823 token | ~11 token | -99% |
pytest -v | ~756 | ~24 | -96% |
git diff HEAD~1 | ~21.500 | ~1.259 | -94% |
git log --stat -10 | ~1.430 | ~194 | -86% |
cat src/main.rs | ~10.176 | ~504 | -95% |
git status | ~120 | ~30 | -75% |
ls -la src/ | ~3.200 | ~640 | -80% |
Benchmark tổng hợp phiên Claude Code 30 phút: ~118.000 → ~23.900 token (-80%), trong đó git add/commit/push -92%, cargo test / pytest / go test đều -90%.
Anecdote từ user thật: một developer chạy 15.720 lệnh trong vài tuần → tiết kiệm 138 triệu token. Một user khác trong discussion của Kilo-Org ghi nhận tiết kiệm 10 triệu token (89%) chỉ trong 2 tuần. Overhead thì không đáng bận tâm: <10ms/lệnh, <5MB RAM.
Ai hưởng lợi nhiều nhất?
- Dev dùng Claude Code / Cursor daily thường xuyên đụng quota mid-afternoon: rtk kéo dài phiên ~3× mà workflow không đổi.
- Người xài Aider / Gemini CLI / Cline với API key riêng (trả tiền per token): cắt ~70% hóa đơn API trên workflow CLI-heavy.
- Refactor lớn nhiều file: ghép rtk với Serena MCP đạt tổng tiết kiệm 90%+ — một case rename method across 12 file đi từ 74.700 → 6.960 token (-91%).
rtk phủ rộng hệ sinh thái: git/gh, cargo, go/golangci-lint, npm/pnpm/npx, ruff/pytest/pip/mypy, rspec/rubocop, dotnet, playwright/vitest/jest, docker/kubectl/aws. Kèm meta-command: rtk gain (dashboard savings), rtk discover (gợi ý tối ưu thêm), rtk proxy <cmd> (bypass filter khi cần).
Tích hợp với Claude Code, Codex, Cursor
rtk hỗ trợ 12 AI coding tool, cài 1 lệnh là xong:
| Tool | Lệnh init | Cơ chế |
|---|---|---|
| Claude Code | rtk init -g | PreToolUse bash hook (rewrite transparent) |
| Codex | rtk init -g --codex | AGENTS.md + RTK.md instructions |
| Cursor | rtk init -g --agent cursor | preToolUse hook (hooks.json) |
| GitHub Copilot (VS Code) | rtk init -g --copilot | PreToolUse hook |
| Gemini CLI | rtk init -g --gemini | BeforeTool hook |
| Windsurf / Cline / Kilo Code / Antigravity | rtk init --agent <name> | Project-scoped rules file |
Hạn chế & lưu ý
- Hook chỉ áp cho Bash tool. Các tool nội tại của Claude Code như
Read,Grep,Globkhông đi qua Bash, nên không bị rewrite tự động. Muốn rtk-filter cho workflow đó, gọi tường minhrtk read,rtk grep,rtk find. - Nén đôi khi quá tay. Đã có report rtk cắt quá mạnh output Playwright E2E khiến agent không debug được. Fallback:
rtk proxy <cmd>để nhận raw output, vẫn track metric. - Name collision trên crates.io với package "Rust Type Kit". KHÔNG chạy
cargo install rtk— sẽ lấy nhầm. Dùngbrew install rtk, script curl, hoặccargo install --git https://github.com/rtk-ai/rtk. - Windows native (cmd/PowerShell): không có auto-rewrite hook (cần Unix shell), fallback sang CLAUDE.md injection mode. Khuyến nghị dùng WSL để có full hook.
Cài đặt, giá & privacy
Cài:
# Homebrew (khuyến nghị)
brew install rtk
# Hoặc one-liner Linux/macOS
curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh | sh
# Cargo (nhớ --git để tránh name collision)
cargo install --git https://github.com/rtk-ai/rtk
# Kích hoạt hook cho Claude Code (hoặc đổi flag cho tool khác)
rtk init --globalGiá: core tool miễn phí, MIT / Apache-2.0. RTK Cloud (sắp ra, 381 team waitlist) cho team có SSO, dashboard team, rate-limit alert, audit log — từ $15/dev/tháng, free cho open-source.
Privacy: telemetry opt-in, tắt mặc định (GDPR Art. 6, 7). Chỉ thu aggregate metric ẩn danh (tên lệnh gói trong 3 từ đầu kiểu git, cargo). KHÔNG thu source code, path, argument, secret, env var, nội dung repo.
Lời kết & roadmap
Nhận xét gốc từ @laogui — "cảm giác token tụt thật, không rõ có phải ảo giác" — hóa ra là đo được. Với AI coding tool ngày càng tốn token theo giờ làm việc thật, tối ưu "lớp output shell" là đòn bẩy cao nhất mà không cần đổi quy trình. rtk là implement khá chuẩn: binary gọn, overhead không đáng kể, privacy sạch, tích hợp transparent.
Roadmap tiếp theo: mở rộng filter cho Docker, Kubernetes, GitHub CLI, thêm linter/formatter/package manager; tích hợp Mistral Vibe (đang chờ upstream); và RTK Cloud ra mắt chính thức cho team.
Nguồn: github.com/rtk-ai/rtk, rtk-ai.app, codestz.dev, MadPlay, Kilo-Org discussion.

