- Hermes Agent của Nous Research không chỉ là bot Telegram thông minh hơn - đây là runtime AI tích lũy kỹ năng theo thời gian, với bộ nhớ 3 tầng và vòng học khép kín.
- Hầu hết người dùng chỉ dùng khoảng 8% tính năng thực sự.
- Bài viết này là 92% còn lại: 15 tính năng được xếp hạng theo tác động thực tế.
TL;DR
Hermes Agent (Nous Research, phát hành 25/2/2026) đạt 95.600 GitHub stars trong 7 tuần - framework agent phát triển nhanh nhất năm 2026. MIT license, chạy trên $5 VPS, kết nối 18 nền tảng nhắn tin từ một process.
Tích hợp vòng học khép kín: mỗi task phức tạp tự tạo skill file, tái dùng cho task tương tự sau này. Benchmarks nội bộ cho thấy agents với 20+ self-created skills hoàn thành task nhanh hơn 40% so với instance mới.
Vấn đề: hầu hết người dùng chỉ gõ prompt và đóng tab. Bài viết này là 15 tính năng bị bỏ qua, xếp theo tác động thực tế.
Bạn đang dùng 8% Hermes
Bạn kết nối Telegram. Chọn model. Gõ prompt, nhận câu trả lời. Đó là cách dùng của phần lớn người dùng - và đó là cách dùng lãng phí nhất có thể.
Hermes không được thiết kế như một chatbot phiên. Nó được thiết kế như một runtime dài hạn - agent chạy liên tục, tích lũy kiến thức, tự cải thiện qua từng task. Vấn đề là tính năng cốt lõi này bị tắt mặc định, và hầu hết hướng dẫn không bao giờ đề cập đến nó.
Dưới đây là 15 tính năng chia theo 5 nhóm. Bắt đầu từ setup.
Phần 1 - Setup bạn đã bỏ qua
1. SOUL.md + /personality
Hermes đọc SOUL.md mỗi lần khởi động. Nội dung trong file này trở thành giọng điệu, giá trị, và phong cách của agent - áp dụng cho mọi session, mọi nền tảng.
Thay vì gõ "bạn là Senior Go engineer, ưu tiên câu trả lời ngắn gọn" mỗi lần mở chat, viết một lần vào SOUL.md. Lệnh /personality cho phép bật/tắt các persona được đặt tên sẵn trong một session.
2. MEMORY.md + USER.md
Hai file persistent được đọc mỗi session. MEMORY.md là notebook dự án - facts, constraint, quyết định kỹ thuật. USER.md là những gì agent biết về bạn: timezone, coding style, tool preferences.
Lớp memory SQLite FTS5 bên dưới cho phép truy xuất qua 10.000+ document với độ trễ ~10ms. Memory từ 8 tuần trước có thể xuất hiện trong session hôm nay mà không cần nhắc lại.
3. /insights [days]
Analytics cross-session. Tokens đã dùng, providers được gọi, task nào bị stall. /insights 30 cho tháng vừa rồi trong vài giây.
4. /snapshot
Lưu toàn bộ trạng thái Hermes trước khi làm gì rủi ro. /snapshot restore <id> để quay lại. Rollback cho bản thân agent, không chỉ cho file.
Phần 2 - Kiểm soát trong khi agent đang chạy
5. /branch (alias /fork)
Rẽ nhánh session như git commit. Agent đang chạy theo hướng A, bạn muốn thử hướng B rủi ro hơn mà không mất context tốt. Branch rồi thử. Không ổn? Quay lại nhánh gốc.
6. /rollback
Filesystem checkpoints. Agent vô tình xóa hoặc ghi đè code của bạn? Không cần git reset. Hermes lưu checkpoint cho mọi file đã chạm vào. /rollback liệt kê, chọn mốc để restore.
7. /btw (alias /background)
Câu hỏi phụ chạy trên session riêng, dùng context hiện tại. Bạn tiếp tục làm việc - kết quả xuất hiện khi xong, không interrupt session chính.
8. /steer và /queue
Agent đang chạy task dài, bạn nhận ra nó đang deploy lên prod thay vì staging. Đừng kill. Gõ /steer dùng staging không phải prod - note này được inject vào context sau tool call tiếp theo, không interrupt turn, không phá prompt cache.
/queue xếp hàng prompt tiếp theo mà không interrupt lượt hiện tại.
9. /yolo, /fast, /reasoning
Ba toggle ít ai bật. /yolo bỏ approval cho lệnh nguy hiểm. /fast chuyển sang priority queue của OpenAI/Anthropic - latency thấp hơn đáng kể. /reasoning đặt effort level. Hầu hết người dùng giữ mặc định và thắc mắc tại sao session chậm.
Phần 3 - Thoát khỏi vendor lock-in
10. /model [--provider] [--global]
Một lệnh đổi model. Không restart. State mang theo.
Hermes hỗ trợ native: Nous Portal, OpenRouter (200+ models), OpenAI (bao gồm GPT-5.5 qua Codex OAuth), Anthropic, Google Gemini, NVIDIA NIM, AWS Bedrock, Xiaomi MiMo, Kimi, Vercel AI Gateway, Arcee, Step Plan, LM Studio, và hơn chục provider khác.
/model anthropic:claude-opus-4-7 cho task nặng. /model openrouter:kimi-k2 cho grunt work. Context không mất.
11. Auxiliary models
Agent nén context, tóm tắt session, tạo tiêu đề, xử lý vision qua các sub-model riêng. Bạn có thể route mỗi loại đến model khác nhau.
Ví dụ: Claude Opus 4.7 cho main brain, Haiku 4.5 cho nén context, model rẻ nhất cho tiêu đề. Multi-model routing kiểu này cắt chi phí 40-60% mà không giảm chất lượng output chính.
Phần 4 - Tầm với bạn chưa bật
12. Gateway 18 nền tảng
Telegram, Discord, Slack, WhatsApp, Signal, Email, SMS, Matrix, Mattermost, Feishu, WeCom, DingTalk, iMessage (qua BlueBubbles), Home Assistant, QQBot, Tencent Yuanbao, Microsoft Teams (qua plugin), và CLI. Một Hermes process điều khiển tất cả.
Điểm thực sự có giá trị: conversation continuity. Bắt đầu task trên CLI, hỏi thêm từ Telegram khi di chuyển, nhận kết quả qua Discord. Cùng một session.
13. /voice trên 4 nền tảng
CLI, Telegram DMs, Discord channels, Discord voice rooms. Gõ /voice và nói. Transcription local qua Whisper - không gửi audio lên server LLM. Đang lái xe, đang nấu ăn, mắt đang bận - vẫn dùng được agent.
14. Cron + /webhook-subscriptions
Scheduler tích hợp sẵn, viết bằng ngôn ngữ tự nhiên.
"Mỗi thứ Sáu 5pm, tóm tắt commits GitHub tuần này, post lên Slack #standups."
Kết hợp với /webhook-subscriptions: GitHub, Vercel, Stripe, uptime checker push payload thẳng vào DM của bạn mà không qua LLM. Zero token. Zero cost. Zero latency.
Bạn đang trả Zapier mỗi tháng cho chính xác điều này.
Phần 5 - Thứ phân biệt người dùng thực sự
15. Skills là slash commands
Đây là tính năng quan trọng nhất. 118 skills out of the box, mỗi skill là một slash command. Gõ /, autocomplete hiện ra.
/architecture-diagram, /excalidraw, /manim-video, /research-paper-writing, /linear, /google-workspace, /youtube-content, /claude-code, /systematic-debugging - và hơn 100 cái khác.
Quan trọng hơn: bạn có thể viết skill của riêng mình. Một custom skill /sage có thể tự động: tìm outlier trong niche của bạn, scout trends, draft thread theo giọng văn của bạn. Xây một lần. Gõ /sage trên bất kỳ session nào, bất kỳ nền tảng nào - chạy mãi mãi.
Tourists dùng slash command một lần một tuần. Người dùng thực sự đã build cả workflow vào đó.
Ai nên bắt đầu ngay
Developer hàng ngày: SOUL.md + /rollback + custom skill
Researcher: Cron scheduler + /insights + auxiliary models
Team nhỏ, nhiều platform: Gateway 18 nền tảng + /personality
Mobile worker: /voice + Telegram + /btw
DevOps: /webhook-subscriptions + /steer + /snapshot
Lưu y quan trọng: Self-learning bị tắt mặc định - phải bật trong ~/.hermes/config.toml. Không bật, Hermes hoạt động như chatbot thông thường và lời hứa "grows with you" không xảy ra.
Kết
Bạn cài Hermes với persistent memory, 100+ skills, filesystem rollback, session branching, 18 nền tảng, voice mode, multi-provider routing, cron, webhooks và custom slash commands - rồi dùng nó như một Telegram bot thông minh hơn một chút.
Tool không underdeliver. Bạn chưa bao giờ đưa cho nó những instructions nó đang chờ.
Via: GitHub NousResearch/hermes-agent, Hermes Agent Docs, TokenMix Research Lab Review.



