- Hermes Agent đạt 95.600 GitHub stars trong 7 tuần - framework agent phát triển nhanh nhất 2026.
- Agent với 20+ skills tự tạo hoàn thành research nhanh hơn 40% (benchmark Nous Research).
- 12 tích hợp chia 4 nhóm: Research (Firecrawl, Reddit, YouTube), Action (Browserbase, Bland, Stripe), Workspace (Google Workspace, Discord, GitHub), Memory (Readwise, Granola, Obsidian).
- Miễn phí, cron không giới hạn, chạy trên VPS $5/tháng.
TL;DR
Hermes Agent từ Nous Research là open-source AI agent framework (MIT license) ra mắt 25/02/2026, đạt 95.600 GitHub stars trong 7 tuần. Điểm khác biệt cốt lõi: Hermes tự tạo "skills" từ kinh nghiệm, nhớ qua các session, và chạy scheduled tasks không giới hạn. Nhưng nếu bạn mở Hermes lần đầu mà không gắn integration nào, nó trông chẳng khác gì ChatGPT trong Telegram. Bài này giải thích tại sao - và 12 integration nào biến nó thành superagent thật sự.
Não thông minh, tay bị trói
Ole Lehmann - creator của newsletter AI Solo (37.000 subscribers) - mô tả cảm giác đầu tiên khi dùng Hermes: "Sau 20 phút tôi đóng nó lại và nghĩ: cái này chỉ là Claude hay ChatGPT trong Telegram thôi, khác gì nhau?"
Đó là vấn đề của mọi người khi mới dùng Hermes. Nguyên nhân: không phải Hermes kém - mà là vì chưa gắn integration nào.
Hãy hình dung agent như một bộ não nổi trong bình thủy tinh. Thông minh, nói chuyện tốt, nhưng bị cô lập hoàn toàn khỏi cuộc sống thực của bạn. Không mắt, không tai, không tay. Integration là giác quan và tứ chi bạn gắn vào bộ não đó - càng nhiều giác quan, agent càng làm được nhiều việc thực tế hơn.

Hermes học và nhớ như thế nào
Trước khi vào danh sách integration, cần hiểu điều làm Hermes khác biệt về mặt kỹ thuật. Framework này có learning loop 5 bước chạy sau mỗi tác vụ phức tạp (5+ tool calls):
Nhận task từ user hoặc cron trigger
Query persistent memory (SQLite FTS5, ~10ms latency với 10.000+ documents)
Lên kế hoạch và thực thi với tools
Nếu dùng 5+ tool calls - tự viết skill file Markdown theo chuẩn agentskills.io
Index skill vào memory, dùng lại ở session sau
Kết quả đo được: agent với 20+ skills tự tạo hoàn thành tác vụ research nhanh hơn 40% so với instance mới (Nous Research benchmark). Sau 3-4 tuần dùng đều, agent bắt đầu cảm giác được cá nhân hóa - vì nó thực sự hiểu cách bạn làm việc.

4 nhóm integration cần thiết
Ole Lehmann nhận ra mọi setup Hermes hoạt động tốt đều làm được 4 việc: research, action, workspace, và memory. Thiếu một nhóm là agent "mù" theo một hướng.
Nhóm 1 - Research (mắt & tai)
Firecrawl: Web search xây dựng đặc biệt cho agents. Data sạch hơn, phản hồi nhanh hơn, dùng ít token hơn so với native search. Nên bật mặc định.
Reddit: Đọc được insight thật của người dùng về bất kỳ sản phẩm hay niche nào. Scoping ý tưởng mới trong 5 phút là biết ai đang bức xúc điều gì.
YouTube Transcripts: Kéo caption từ bất kỳ video nào - podcast dài, tutorial, conference talk đều thành notes có thể search. Ít ai gắn integration này nhất nhưng giá trị rất cao.
Nhóm 2 - Action (tay & giọng nói)
Browserbase: Truy cập browser thật - login, click, điều hướng trang có anti-scraper. Kết hợp Firecrawl + Browserbase: Hermes tự chọn tool phù hợp theo task.
Bland (hoặc Twilio): Cho Hermes giọng nói và số điện thoại - đặt bàn ăn, gọi xác nhận, agent làm thay trong khi bạn ngủ.
Stripe: Đọc revenue, customers, failed charges, refunds. Hỏi "tại sao customer này churned" - nhận câu trả lời kèm receipts ngay lập tức.
Nhóm 3 - Workspace (nơi bạn sống)
Google Workspace: Gmail + Calendar + Drive + Docs + Sheets trong một connector. Gắn cái này trước tất cả - agent không đọc được inbox thì không làm được gì cho bạn.
Discord: Gắn Hermes vào từng channel, chạy workflow khác nhau ở mỗi channel. Ví dụ: channel support - quét Gmail hàng sáng, kéo tickets ra Discord kèm priority tag.
GitHub: Mở PR, review code, triage issues. Non-negotiable nếu bạn ship code.
Nhóm 4 - Memory (bộ nhớ dài hạn)
Readwise: Mọi highlight từ sách, bài viết, tweets, podcasts - tất cả queryable. Giải quyết bài toán "dead knowledge" - highlight xong quên luôn vì chôn trong PDF không bao giờ mở lại.
Granola: Transcript searchable của mọi cuộc họp. Hỏi "client đó nói gì về giá tháng trước" - trả lời ngay lập tức.
Obsidian: Đọc toàn bộ vault, kết nối ý tưởng bạn đã quên mình có.
3 workflow thực tế khi stack 4+ integration
Mỗi integration đơn lẻ đã có ích. Nhưng khi stack lại, chúng làm được những việc bạn không nghĩ là có thể:

Sponsor filter: Có DM hay email về sponsorship - Hermes đọc, scrape website qua Firecrawl, scan Reddit + YouTube về company đó, đổ one-pager vào Discord kèm fit-rating cho audience của bạn.
Customer support agent: Mỗi sáng quét Gmail lấy support emails, categorize theo issue type, log vào Discord kèm priority. Cuối tuần tóm tắt 5 vấn đề lặp lại vào Obsidian.
Monday business dashboard: 8am thứ Hai - pull revenue/subs/refunds/churn từ Stripe, lấy follower growth từ X và LinkedIn qua Browserbase, post breakdown week-over-week vào Discord. 10 giây đọc thay vì 1 tiếng dashboard hopping.
So với ChatGPT và OpenClaw
Điểm khác biệt cốt lõi với Claude/ChatGPT: chúng là stateless - đóng tab là quên sạch. Hermes chạy như background process, nhớ qua sessions, không cần khởi động lại context từ đầu mỗi lần. Claude Code Routines giới hạn 5 runs/ngày (Pro tier); Hermes không giới hạn - chỉ bị chặn bởi API budget.
So với OpenClaw (345K GitHub stars): OpenClaw mạnh hơn về breadth (24+ platforms, 13.000+ community skills), nhưng tháng 3/2026 có 9 CVE trong 4 ngày bao gồm CVSS 9.9 - do marketplace không kiểm duyệt. Hermes: zero CVE tính đến nay, 118 skills curated security-scanned. Người dùng Reddit cũng nhận xét Hermes ổn định hơn giữa các version update.
Giới hạn cần biết
Self-learning bị tắt mặc định - phải enable trong
config.yaml, nhiều người bỏ qua bước này và không thấy sự khác biệt.Domain-specific learning - skill từ code review không transfer sang marketing copy.
API v0.x chưa stable - breaking changes giữa minor versions, chưa phù hợp cho production pipeline zero-tolerance.
Không phải IDE coding tool - cho pure code generation, Cursor hoặc Claude Code vẫn tốt hơn.
Kết
Hermes Agent sinh ra để dùng lâu dài trong workflow lặp lại - research, support, reporting. Nếu bạn gắn đủ integration và dùng đều trong 3-4 tuần, nó bắt đầu làm việc trước khi bạn yêu cầu. Đó là điểm khác biệt thật sự so với mọi chatbot bạn đã dùng.
Bắt đầu với Google Workspace + Firecrawl - 2 integration thiết yếu nhất. Sau đó thêm dần theo nhu cầu thực tế.
