TL;DR
SmallClaw là một AI agent framework local-first được thiết kế riêng cho small models (4B–32B params). Cho local LLM của bạn (qua Ollama, llama.cpp hoặc LM Studio) các tool thật: đọc/ghi file ở mức line-number, search web đa provider, điều khiển trình duyệt qua Playwright, chạy lệnh terminal — tất cả trong một web UI gọn nhẹ. Zero API cost, zero data ra ngoài máy. MIT license, ~246 sao GitHub, đã test trên một laptop 2019 với 8GB RAM.

Có gì mới
Trong khi cả hệ sinh thái agent framework đang đua nhau xếp tầng kiến trúc multi-agent (planner → executor → verifier), SmallClaw đi ngược lại: collapse toàn bộ vòng lặp về một LLM call duy nhất. Mỗi lượt, model nhận message, tự quyết định trả lời thẳng hay gọi tool, rồi feed result quay lại — không có agent phụ điều phối.
Lý do thiết kế rất thực tế: small models không giỏi phối hợp giữa nhiều vai trò. Bắt một mô hình 4B đóng vai planner, executor, và verifier cùng lúc thường ra kết quả lệch pha. Single-pass loop loại bỏ overhead đó, latency giảm đáng kể, và quan trọng hơn — nó hoạt động đáng tin cậy trên hardware tiêu dùng.
Tại sao đáng quan tâm
Đây là một trong những signal rõ nhất của làn sóng small model agent đang chín: open-weight 4B–32B đã đủ thông minh để thực thi tool calls phức tạp, miễn là framework xung quanh được thiết kế đúng.
- Privacy mặc định: code, file, prompt không bao giờ rời máy.
- Cost = $0: không subscription, không token bill cuối tháng.
- Offline-friendly: chạy trên máy bay, trong môi trường air-gapped, hoặc khi mạng chập chờn.
- Reproducible: cùng một model + cùng SKILL.md = cùng behavior, không bị provider thay đổi sau lưng.
Technical facts
| Hạng mục | Chi tiết |
|---|---|
| Ngôn ngữ | TypeScript 81.3%, HTML 17.8% |
| Yêu cầu | Node.js 18+ (khuyến nghị 20+) |
| LLM provider | Ollama, llama.cpp, LM Studio, hoặc OpenAI-compatible API |
| Kiến trúc | Single-pass tool-calling loop |
| Browser | Playwright instance (không cần Chrome đầy đủ) |
| Search | Tavily, Google, Brave, DuckDuckGo + fallback chain |
| License | MIT |
| Phiên bản | v1.1, ~15 commits, 246 ⭐ GitHub |
Một vài chi tiết engineering đáng chú ý: context window cố ý ngắn (chỉ giữ ~5 turn gần nhất) để tránh ngộp small model; bắt buộc đọc file trước khi sửa; native JSON tool-calling format thay vì text parsing; ưu tiên surgical edits theo line-number thay vì rewrite cả file. Tất cả đều là tối ưu hoá có chủ đích cho small model.
SmallClaw vs OpenClaw
SmallClaw là dự án em của OpenClaw (cùng nhà Xpose Market), nhắm khúc thị trường khác hẳn:
| Khía cạnh | SmallClaw | OpenClaw |
|---|---|---|
| Target model | Local 4B–70B | Cloud Claude / GPT-4 |
| Kiến trúc | Single-pass | Multi-agent (plan/exec/verify) |
| Chi phí | $0 | ~$100+/tháng |
| Channel | Web UI + CLI | 10+ messaging platform |
| Voice | Không | Có |
| Phù hợp | Privacy, offline, hobby/dev | Production multi-channel |
Use cases thực tế
Dựa trên khuyến nghị model theo RAM, đây là 3 kịch bản dễ đo lường nhất:
- 8GB RAM + qwen3:4b — laptop cũ 2019 vẫn chạy ngon. Đủ cho file edit, web research, draft tài liệu, viết blog post. Đây là cấu hình baseline mà repo đã verify.
- 16GB RAM + qwen2.5-coder:32b — sweet spot cho coding. Refactor module, fix bug nhỏ trong repo nội bộ, tự động hoá tác vụ lặp lại. Chất lượng code đủ tốt cho hầu hết thao tác hàng ngày.
- 32GB+ RAM + llama-3.3:70b — gần chạm sàn cloud frontier model cho reasoning phức tạp, vẫn local 100%.
Sweet-spot rõ nhất: lập trình viên có dữ liệu nhạy cảm (legal, y tế, tài chính), nhóm nội bộ làm trong môi trường air-gapped, và indie hacker không muốn đốt $100/tháng cho cloud agent.
Hạn chế & pricing
Pricing: hoàn toàn miễn phí, MIT license. Tuỳ chọn dùng paid search API (Tavily/Google/Brave) nếu muốn chất lượng search cao hơn DuckDuckGo.
Hạn chế cần biết trước khi xài:
- Không có voice / multi-channel messaging — chỉ web UI + CLI.
- Single-user scope, chưa phù hợp triển khai team-wide.
- Trần chất lượng do small model — reasoning phức tạp vẫn thua frontier cloud model.
- Dự án còn rất sớm (~15 commits, v1.1, chưa có release tag chính thức) — kỳ vọng có rough edges.
- Cần Ollama hoặc backend LLM tự host — không phải zero-config plug-and-play kiểu SaaS.
Roadmap & điều đáng theo dõi
Repo đang ở phase v1.1 sau khi đã ship single-pass v2 architecture. Hướng phát triển tự nhiên: nhiều SKILL.md community templates hơn, mở rộng provider support, và optional hybrid cloud fallthrough cho các tác vụ khó vượt sàn small model.
Trong bối cảnh Qwen 3.5, DeepSeek-Coder, Llama 3.3 đẩy chất lượng open-weight lên ngang ngửa cloud-mid tier, framework như SmallClaw chính là cầu nối để biến những model đó thành agent có ích thật sự — không chỉ là chatbot demo. Nếu bạn đã có Ollama trên máy và đang tìm cách thử agent loop mà không phải đăng ký API key nào, repo này đáng git clone tối nay.
Nguồn: GitHub XposeMarket/SmallClaw, Tom Doerr, Efficient Coder, OpenClaw API blog.


