TL;DR

Quotio là một native macOS menu bar app (SwiftUI) do nguyenphutrong build, đóng vai trò command center cho mọi AI coding assistant của bạn. Bên trong, Quotio wrap CLIProxyAPI — một Go proxy đã 26.6k stars — vào một GUI đẹp và cho bạn: plug Claude / Gemini / Codex / Qwen / Vertex / iFlow / Antigravity / Kiro / GitHub Copilot qua OAuth (không cần API key), theo dõi quota real-time, configure Claude Code / OpenCode / Codex CLI / Gemini CLI / Amp CLI / Factory Droid chỉ 1 click, và auto-failover sang provider khác khi account hiện tại hit 429.

Tagline đúng là nỗi đau của mọi dev xài AI nặng: “Stop juggling AI accounts.” Repo đã đạt 4.3k stars, 46 releases trong ~4 tháng, MIT license, hoàn toàn free.

Quotio dashboard hiển thị accounts, requests, tokens, success rate và provider list

Có gì mới ở v0.15.0

Bản mới nhất v0.15.0 (2026-04-06) bổ sung:

  • Custom providers xịn hơn: model selection + connection testing ngay trong sheet cấu hình.
  • Kiro migration: quota API chuyển sang endpoint Q mới, match headers với IDE Kiro; thêm litellmProxy option để fix compact failure với Kiro Claude models.
  • OAuth UX fix: không còn auto-open browser lúc re-auth — user chủ động click “Open Link” (ngăn trình duyệt bung ra không mong muốn khi đang focus code).
  • Dashboard foreground: fix bug dashboard bị ẩn khi mở app lại từ background.
  • Virtual model cache toggle: có option tắt route caching cho fallback — hữu ích khi debug.

Tại sao nó quan trọng

Nếu bạn dùng Claude Code cả ngày, bạn đã hiểu “cơn ác mộng 5-hour cap”. Flow thường thấy:

  1. Đang code ngon, prompt bị 429.
  2. Logout Claude, login account khác, update credentials, restart terminal.
  3. Paste lại context 20k tokens, chờ model hâm nóng — mất nhịp.

Quotio đóng thẳng vòng này: gom hết subscription về 1 local proxy, agent CLI bắn request tới http://127.0.0.1:8317/v1, quota cạn thì proxy tự động thử entry tiếp theo trong Fallback virtual model. Bạn không đổi endpoint, không logout, không mất context.

Technical facts

Chỉ sốGiá trị
Language QuotioSwift 95.8% (SwiftUI)
BackendCLIProxyAPI — Go 99.9%, 26.6k ⭐
GitHub stats4.3k stars · 266 forks · 41 contributors
Releases46 versions trong ~4 tháng (first commit 2025-12-20)
RAM footprint<100 MB (tối ưu từ 150–250 MB ở v0.5.0)
Update pollingAtom feed mỗi 5 phút, ETag + 304 caching
Yêu cầumacOS 14.0 Sonoma trở lên
LicenseMIT
i18nEN / VI / ZH-Hans / FR (600+ keys)

Quota screen hiển thị per-account bars với Claude 0% left, Gemini 3 Flash/Pro/Image 83-100% left

Providers được support

OAuth cho hầu hết (không cần nhập API key):

  • Google Gemini · Anthropic Claude · OpenAI Codex · Qwen Code · iFlow · Antigravity · Kiro · GitHub Copilot
  • Vertex AI (dùng Service Account JSON)
  • Custom providers (tự khai báo endpoint + model mapping)

IDE monitor-only (theo dõi quota nhưng không route qua proxy): Cursor, Trae, Warp.

Quotio vs các lựa chọn khác

Giải phápĐiểm mạnhĐánh đổi
Juggle API keys thủ côngKhông cần cài gì thêmLogout / relogin liên tục, mất context
CLIProxyAPI bareMạnh, linh hoạt, headlessSửa YAML, không có UI quota
CodMateSession manager + Git review + searchNặng hơn, ít focus vào failover
QuotioMenu bar nhẹ, 1-click config, dashboard real-time, smart failovermacOS only, chưa ký Apple

3 routing strategy

  • Round Robin — chia đều request giữa các accounts.
  • Fill First — bơm max một account trước khi chuyển sang cái kế.
  • Smart Fallback (v0.7.0+, đã ổn định qua nhiều bản) — tạo virtual model ánh xạ xuống danh sách provider theo thứ tự. Khi provider hiện tại trả 429, proxy retry entry kế tiếp. v0.7.3 thêm FallbackFormatConverter: chuyển đổi message format Anthropic ↔ OpenAI ↔ Google, map tool_use/tool_calls, clean thinking blocks — prompt “just works” trên provider mới.

Model Fallback screen với virtual model gemini-claude-opus-4-5-thinking map xuống Antigravity provider

Ai hưởng lợi nhất

  1. Claude Code heavy users có nhiều sub Claude Pro + Gemini + Codex — dùng liên tục không đứt.
  2. Team dev muốn share proxy qua Cloudflare Tunnel (v0.7.1) — 1 máy chạy proxy, cả team dùng chung qua URL public tạm.
  3. Dev đa công cụ dùng Claude Code + OpenCode + Factory Droid — muốn 1 dashboard chung track quota toàn bộ.
  4. User Cursor / Trae / Warp muốn xem quota từ menu bar mà không cần vào từng app.

AI Agent Setup hiển thị Claude Code Configured, Codex CLI Installed, Factory Droid Configured, Gemini CLI, OpenCode

Limitations & pricing

  • Giá: $0 — MIT open source.
  • macOS only, yêu cầu 14.0 Sonoma trở lên. Linux / Windows users xài counterpart: ProxyPilot, ZeroLimit.
  • Chưa ký Apple Developer: lần đầu mở sẽ bị Gatekeeper chặn, chạy xattr -cr /Applications/Quotio.app.
  • Cursor / Trae / Warp chỉ monitor quota, không dùng làm proxy provider.
  • Claude Code OAuth token TTL ~1 giờ — Quotio hiển thị nút re-auth khi cần.
  • Cần internet cho OAuth flow.

What’s next

Roadmap nhìn từ CHANGELOG:

  • Fallback Strategy rời nhãn Experimental sau vài tháng iterate.
  • Provider coverage tiếp tục mở: GLM đã ship v0.5.1, community PR đều đặn.
  • Custom provider ergonomics: prefix (v0.12.0), model testing (v0.15.0), sẽ còn thêm.
  • Cadence phát hành rất nóng — gần như 2–3 release/tuần trong Q1/Q2 2026. Dự đoán v1.0 trong 2–3 tháng tới.

Nếu bạn đang đau đầu với 5-hour limit của Claude, Quotio đáng thử ngay tối nay: tải .dmg từ Releases, chạy xattr -cr, OAuth các account bạn có, và chuyển Claude Code route qua 127.0.0.1:8317. Zero disruption, zero API key, zero yak-shaving.

Nguồn: github.com/nguyenphutrong/quotio, router-for-me/CLIProxyAPI, quotio.dev, share từ @tom_doerr.