TL;DR
Quotio là một native macOS menu bar app (SwiftUI) do nguyenphutrong build, đóng vai trò command center cho mọi AI coding assistant của bạn. Bên trong, Quotio wrap CLIProxyAPI — một Go proxy đã 26.6k stars — vào một GUI đẹp và cho bạn: plug Claude / Gemini / Codex / Qwen / Vertex / iFlow / Antigravity / Kiro / GitHub Copilot qua OAuth (không cần API key), theo dõi quota real-time, configure Claude Code / OpenCode / Codex CLI / Gemini CLI / Amp CLI / Factory Droid chỉ 1 click, và auto-failover sang provider khác khi account hiện tại hit 429.
Tagline đúng là nỗi đau của mọi dev xài AI nặng: “Stop juggling AI accounts.” Repo đã đạt 4.3k stars, 46 releases trong ~4 tháng, MIT license, hoàn toàn free.

Có gì mới ở v0.15.0
Bản mới nhất v0.15.0 (2026-04-06) bổ sung:
- Custom providers xịn hơn: model selection + connection testing ngay trong sheet cấu hình.
- Kiro migration: quota API chuyển sang endpoint
Qmới, match headers với IDE Kiro; thêmlitellmProxyoption để fix compact failure với Kiro Claude models. - OAuth UX fix: không còn auto-open browser lúc re-auth — user chủ động click “Open Link” (ngăn trình duyệt bung ra không mong muốn khi đang focus code).
- Dashboard foreground: fix bug dashboard bị ẩn khi mở app lại từ background.
- Virtual model cache toggle: có option tắt route caching cho fallback — hữu ích khi debug.
Tại sao nó quan trọng
Nếu bạn dùng Claude Code cả ngày, bạn đã hiểu “cơn ác mộng 5-hour cap”. Flow thường thấy:
- Đang code ngon, prompt bị 429.
- Logout Claude, login account khác, update credentials, restart terminal.
- Paste lại context 20k tokens, chờ model hâm nóng — mất nhịp.
Quotio đóng thẳng vòng này: gom hết subscription về 1 local proxy, agent CLI bắn request tới http://127.0.0.1:8317/v1, quota cạn thì proxy tự động thử entry tiếp theo trong Fallback virtual model. Bạn không đổi endpoint, không logout, không mất context.
Technical facts
| Chỉ số | Giá trị |
|---|---|
| Language Quotio | Swift 95.8% (SwiftUI) |
| Backend | CLIProxyAPI — Go 99.9%, 26.6k ⭐ |
| GitHub stats | 4.3k stars · 266 forks · 41 contributors |
| Releases | 46 versions trong ~4 tháng (first commit 2025-12-20) |
| RAM footprint | <100 MB (tối ưu từ 150–250 MB ở v0.5.0) |
| Update polling | Atom feed mỗi 5 phút, ETag + 304 caching |
| Yêu cầu | macOS 14.0 Sonoma trở lên |
| License | MIT |
| i18n | EN / VI / ZH-Hans / FR (600+ keys) |

Providers được support
OAuth cho hầu hết (không cần nhập API key):
- Google Gemini · Anthropic Claude · OpenAI Codex · Qwen Code · iFlow · Antigravity · Kiro · GitHub Copilot
- Vertex AI (dùng Service Account JSON)
- Custom providers (tự khai báo endpoint + model mapping)
IDE monitor-only (theo dõi quota nhưng không route qua proxy): Cursor, Trae, Warp.
Quotio vs các lựa chọn khác
| Giải pháp | Điểm mạnh | Đánh đổi |
|---|---|---|
| Juggle API keys thủ công | Không cần cài gì thêm | Logout / relogin liên tục, mất context |
| CLIProxyAPI bare | Mạnh, linh hoạt, headless | Sửa YAML, không có UI quota |
| CodMate | Session manager + Git review + search | Nặng hơn, ít focus vào failover |
| Quotio | Menu bar nhẹ, 1-click config, dashboard real-time, smart failover | macOS only, chưa ký Apple |
3 routing strategy
- Round Robin — chia đều request giữa các accounts.
- Fill First — bơm max một account trước khi chuyển sang cái kế.
- Smart Fallback (v0.7.0+, đã ổn định qua nhiều bản) — tạo virtual model ánh xạ xuống danh sách provider theo thứ tự. Khi provider hiện tại trả 429, proxy retry entry kế tiếp. v0.7.3 thêm
FallbackFormatConverter: chuyển đổi message format Anthropic ↔ OpenAI ↔ Google, maptool_use/tool_calls, clean thinking blocks — prompt “just works” trên provider mới.

Ai hưởng lợi nhất
- Claude Code heavy users có nhiều sub Claude Pro + Gemini + Codex — dùng liên tục không đứt.
- Team dev muốn share proxy qua Cloudflare Tunnel (v0.7.1) — 1 máy chạy proxy, cả team dùng chung qua URL public tạm.
- Dev đa công cụ dùng Claude Code + OpenCode + Factory Droid — muốn 1 dashboard chung track quota toàn bộ.
- User Cursor / Trae / Warp muốn xem quota từ menu bar mà không cần vào từng app.

Limitations & pricing
- Giá: $0 — MIT open source.
- macOS only, yêu cầu 14.0 Sonoma trở lên. Linux / Windows users xài counterpart: ProxyPilot, ZeroLimit.
- Chưa ký Apple Developer: lần đầu mở sẽ bị Gatekeeper chặn, chạy
xattr -cr /Applications/Quotio.app. - Cursor / Trae / Warp chỉ monitor quota, không dùng làm proxy provider.
- Claude Code OAuth token TTL ~1 giờ — Quotio hiển thị nút re-auth khi cần.
- Cần internet cho OAuth flow.
What’s next
Roadmap nhìn từ CHANGELOG:
- Fallback Strategy rời nhãn Experimental sau vài tháng iterate.
- Provider coverage tiếp tục mở: GLM đã ship v0.5.1, community PR đều đặn.
- Custom provider ergonomics: prefix (v0.12.0), model testing (v0.15.0), sẽ còn thêm.
- Cadence phát hành rất nóng — gần như 2–3 release/tuần trong Q1/Q2 2026. Dự đoán v1.0 trong 2–3 tháng tới.
Nếu bạn đang đau đầu với 5-hour limit của Claude, Quotio đáng thử ngay tối nay: tải .dmg từ Releases, chạy xattr -cr, OAuth các account bạn có, và chuyển Claude Code route qua 127.0.0.1:8317. Zero disruption, zero API key, zero yak-shaving.
Nguồn: github.com/nguyenphutrong/quotio, router-for-me/CLIProxyAPI, quotio.dev, share từ @tom_doerr.
