SmallClaw: AI agent framework local-first cho small models, chạy ngon trên laptop 8GB RAM

Summary post

SmallClaw là agent framework mã nguồn mở (MIT) chạy hoàn toàn local với Ollama, biến qwen3:4b thành trợ lý có thể đọc ghi file, search web, điều khiển trình duyệt — không API key, không gửi data ra cloud, không tốn $1.

7phút đọc

8mục nội dung

6chủ đề

TL;DR

SmallClaw là một AI agent framework local-first được thiết kế riêng cho small models (4B–32B params). Cho local LLM của bạn (qua Ollama, llama.cpp hoặc LM Studio) các tool thật: đọc/ghi file ở mức line-number, search web đa provider, điều khiển trình duyệt qua Playwright, chạy lệnh terminal — tất cả trong một web UI gọn nhẹ. Zero API cost, zero data ra ngoài máy. MIT license, ~246 sao GitHub, đã test trên một laptop 2019 với 8GB RAM.

Giao diện web SmallClaw chạy qwen3:4b qua Ollama

Có gì mới

Trong khi cả hệ sinh thái agent framework đang đua nhau xếp tầng kiến trúc multi-agent (planner → executor → verifier), SmallClaw đi ngược lại: collapse toàn bộ vòng lặp về một LLM call duy nhất. Mỗi lượt, model nhận message, tự quyết định trả lời thẳng hay gọi tool, rồi feed result quay lại — không có agent phụ điều phối.

Lý do thiết kế rất thực tế: small models không giỏi phối hợp giữa nhiều vai trò. Bắt một mô hình 4B đóng vai planner, executor, và verifier cùng lúc thường ra kết quả lệch pha. Single-pass loop loại bỏ overhead đó, latency giảm đáng kể, và quan trọng hơn — nó hoạt động đáng tin cậy trên hardware tiêu dùng.

Tại sao đáng quan tâm

Đây là một trong những signal rõ nhất của làn sóng small model agent đang chín: open-weight 4B–32B đã đủ thông minh để thực thi tool calls phức tạp, miễn là framework xung quanh được thiết kế đúng.

Privacy mặc định: code, file, prompt không bao giờ rời máy.
Cost = $0: không subscription, không token bill cuối tháng.
Offline-friendly: chạy trên máy bay, trong môi trường air-gapped, hoặc khi mạng chập chờn.
Reproducible: cùng một model + cùng SKILL.md = cùng behavior, không bị provider thay đổi sau lưng.

Technical facts

Hạng mục	Chi tiết
Ngôn ngữ	TypeScript 81.3%, HTML 17.8%
Yêu cầu	Node.js 18+ (khuyến nghị 20+)
LLM provider	Ollama, llama.cpp, LM Studio, hoặc OpenAI-compatible API
Kiến trúc	Single-pass tool-calling loop
Browser	Playwright instance (không cần Chrome đầy đủ)
Search	Tavily, Google, Brave, DuckDuckGo + fallback chain
License	MIT
Phiên bản	v1.1, ~15 commits, 246 ⭐ GitHub

Một vài chi tiết engineering đáng chú ý: context window cố ý ngắn (chỉ giữ ~5 turn gần nhất) để tránh ngộp small model; bắt buộc đọc file trước khi sửa; native JSON tool-calling format thay vì text parsing; ưu tiên surgical edits theo line-number thay vì rewrite cả file. Tất cả đều là tối ưu hoá có chủ đích cho small model.

SmallClaw vs OpenClaw

SmallClaw là dự án em của OpenClaw (cùng nhà Xpose Market), nhắm khúc thị trường khác hẳn:

Khía cạnh	SmallClaw	OpenClaw
Target model	Local 4B–70B	Cloud Claude / GPT-4
Kiến trúc	Single-pass	Multi-agent (plan/exec/verify)
Chi phí	$0	~$100+/tháng
Channel	Web UI + CLI	10+ messaging platform
Voice	Không	Có
Phù hợp	Privacy, offline, hobby/dev	Production multi-channel

Use cases thực tế

Dựa trên khuyến nghị model theo RAM, đây là 3 kịch bản dễ đo lường nhất:

8GB RAM + qwen3:4b — laptop cũ 2019 vẫn chạy ngon. Đủ cho file edit, web research, draft tài liệu, viết blog post. Đây là cấu hình baseline mà repo đã verify.
16GB RAM + qwen2.5-coder:32b — sweet spot cho coding. Refactor module, fix bug nhỏ trong repo nội bộ, tự động hoá tác vụ lặp lại. Chất lượng code đủ tốt cho hầu hết thao tác hàng ngày.
32GB+ RAM + llama-3.3:70b — gần chạm sàn cloud frontier model cho reasoning phức tạp, vẫn local 100%.

Sweet-spot rõ nhất: lập trình viên có dữ liệu nhạy cảm (legal, y tế, tài chính), nhóm nội bộ làm trong môi trường air-gapped, và indie hacker không muốn đốt $100/tháng cho cloud agent.

Hạn chế & pricing

Pricing: hoàn toàn miễn phí, MIT license. Tuỳ chọn dùng paid search API (Tavily/Google/Brave) nếu muốn chất lượng search cao hơn DuckDuckGo.

Hạn chế cần biết trước khi xài:

Không có voice / multi-channel messaging — chỉ web UI + CLI.
Single-user scope, chưa phù hợp triển khai team-wide.
Trần chất lượng do small model — reasoning phức tạp vẫn thua frontier cloud model.
Dự án còn rất sớm (~15 commits, v1.1, chưa có release tag chính thức) — kỳ vọng có rough edges.
Cần Ollama hoặc backend LLM tự host — không phải zero-config plug-and-play kiểu SaaS.

Roadmap & điều đáng theo dõi

Repo đang ở phase v1.1 sau khi đã ship single-pass v2 architecture. Hướng phát triển tự nhiên: nhiều SKILL.md community templates hơn, mở rộng provider support, và optional hybrid cloud fallthrough cho các tác vụ khó vượt sàn small model.

Trong bối cảnh Qwen 3.5, DeepSeek-Coder, Llama 3.3 đẩy chất lượng open-weight lên ngang ngửa cloud-mid tier, framework như SmallClaw chính là cầu nối để biến những model đó thành agent có ích thật sự — không chỉ là chatbot demo. Nếu bạn đã có Ollama trên máy và đang tìm cách thử agent loop mà không phải đăng ký API key nào, repo này đáng git clone tối nay.

Nguồn: GitHub XposeMarket/SmallClaw, Tom Doerr, Efficient Coder, OpenClaw API blog.