TL;DR

CLI-Anything là framework Python mã nguồn mở do nhóm HKUDS (Hong Kong University Data Science) phát triển. Nó tự động sinh CLI (command-line interface) agent-native cho bất kỳ phần mềm nào có source code - từ GIMP, Blender, LibreOffice đến Obsidian và QGIS. AI agents gọi CLI này thay vì phải click chuột hoặc viết tay MCP server. Đạt 37.600 GitHub stars chỉ trong khoảng 23 ngày. License Apache 2.0.

CLI-Anything teaser: AI agents controlling desktop software via auto-generated CLI
Từ "quá nhiều app, quá ít CLI" - CLI-Anything sinh CLI agent-native cho mọi phần mềm

Vấn đề lớn của AI agents với phần mềm desktop

Coding agents làm việc tốt nhất qua CLI - structured output, deterministic, không có GUI render overhead. Nhưng thực tế phần lớn phần mềm chuyên nghiệp chỉ có GUI hoặc API không đầy đủ. Các giải pháp tạm thời hiện tại:

  • UI automation (Playwright, PyAutoGUI): brittle, chậm, vỡ mỗi khi UI cập nhật
  • Viết tay MCP server: mỗi app cần một integration riêng, tốn hàng tuần phát triển
  • Screenshot + LLM: tốn token, không reliable cho tác vụ chính xác

CLI-Anything giải quyết vấn đề này bằng cách tạo ra một conversion layer tự động, có thể áp dụng cho mọi software - thay vì xây từng điểm tích hợp riêng lẻ.

Pipeline 7 bước hoàn toàn tự động

Khi chạy /cli-anything <software-path>, framework thực hiện 7 bước liên tiếp:

  1. Codebase Analysis - phân tích source code để hiểu các tính năng
  2. CLI Design - thiết kế kiến trúc CLI phù hợp
  3. Implementation - sinh code Python dùng Click framework
  4. Test Planning - lên kế hoạch kiểm thử
  5. Test Implementation - viết unit tests + E2E tests
  6. Documentation - tạo SKILL.md và help text cho agent discovery
  7. PyPI Publishing - đóng gói, publish, cài được bằng pip install
CLI-Anything 7-phase pipeline architecture diagram
Pipeline 7 bước: từ source code đến CLI agent-native có thể cài qua pip

Mỗi CLI được sinh vào thư mục agent-harness/ gồm: software_cli.py (Click entry point với dual-mode REPL + subcommand), software_backend.py (subprocess wrapper gọi trực tiếp phần mềm thật), và SKILL.md (metadata giúp agent tự khám phá capabilities).

Điểm quan trọng: CLI không reimplementing software - nó gọi trực tiếp backend thật. Blender dùng Blender Python API, GIMP dùng Script-Fu, LibreOffice dùng headless mode. Kết quả là full feature parity với phần mềm gốc.

Các con số đáng chú ý

  • 2.280 passing tests - 1.682 unit + 579 E2E + 19 Node.js trên 34+ ứng dụng
  • 100% pass rate - mọi harness phải pass toàn bộ test suite trước khi merge
  • 37.600 GitHub stars trong ~23 ngày đầu (1.096 stars/ngày)
  • Fork ratio 5-9% so với typical 1.5-3% - tín hiệu production adoption thực sự
  • 4-6 harnesses merged mỗi tuần từ community đóng góp

Blender harness có 208 tests, GIMP có 107, LibreOffice có 158. Mỗi E2E test render artifact thật - không phải mock. Blender tạo 3D scene thật, GIMP thực hiện image manipulation thật.

So với MCP và UI automation

Khi nào dùng cái gì?

ApproachSetupĐộ bềnFeature coverage
CLI-AnythingTự động (phút)Cao - gọi backend trực tiếpĐầy đủ như phần mềm gốc
MCP server (viết tay)Vài tuầnCaoChỉ những gì dev chọn expose
UI automationNhanh ban đầuThấp - vỡ khi UI thay đổiMọi thứ nhìn thấy trên màn hình

CLI-Anything là generalized approach - một framework dùng cho mọi phần mềm thay vì n integration riêng lẻ. Bối cảnh rộng hơn: Q1/2026 chứng kiến 6 repo lớn đồng thời theo hướng "agent-native CLI", cộng hơn 130.000 stars trong 90 ngày. Google Workspace CLI và larksuite/cli cùng xu hướng - tín hiệu đây là platform primitive mới, không phải trend nhất thời.

Ai nên dùng ngay

  • Developer xây dựng AI agent pipeline cần điều khiển phần mềm sáng tạo (Blender, GIMP, Inkscape, Audacity)
  • MLOps/AI teams muốn agent tự thao tác ComfyUI hoặc Ollama không cần human in the loop
  • Automation engineers xây workflow với LibreOffice, Draw.io, n8n
  • Researchers cần agent kiểm soát QGIS (GIS), FreeCAD (CAD), hay phần mềm khoa học
Demo: AI agent tạo HTTPS handshake diagram bằng Draw.io qua CLI-Anything
Demo thực tế: AI agent dùng CLI-Anything để tạo sequence diagram HTTPS handshake đầy đủ trong Draw.io

Cài đặt và bước tiếp theo

Cài CLI-Hub để browse, install, update các harness có sẵn:

pip install cli-anything-hub

Dùng trong Claude Code:

/plugin marketplace add HKUDS/CLI-Anything
/cli-anything <path-to-software>

Tháng 4/2026, Obsidian CLI và QGIS CLI vừa được merge. Roadmap hướng tới enterprise SaaS như Notion, Linear, và Atlassian - nếu tốc độ 4-6 harnesses/tuần duy trì, đây sẽ trở thành standard interface layer cho mọi AI agent workflow.

Repo: github.com/HKUDS/CLI-Anything - via OSS Insight, Agent Wars