TL;DR
MaxHermes ra mắt 16/04/2026 (UTC+8) — sản phẩm cloud đầu tiên của MiniMax đóng gói nguyên bộ Hermes Agent của Nous Research thành dịch vụ managed. Khác với self-host: không server, không Docker, không API key juggling. Tích hợp sẵn Feishu, DingTalk, WeCom; chạy 24/7; bill qua Token Plan. Powered by MiniMax M2.7 — model open-source đứng top GDPval-AA (1495 ELO) và SWE-Pro (56.22%). Điểm khác biệt: agent tự viết skill document sau mỗi task phức tạp, lần sau dùng lại + tự patch khi gặp thông tin mâu thuẫn — gọi là "closed learning loop".
What's new
MaxHermes là lần đầu tiên MiniMax host Hermes Agent dưới dạng managed cloud product. Trước đây Hermes Agent yêu cầu user tự deploy: kiếm VPS $5/mo, cài Docker, cắm API key cho 1-N model provider, cấu hình bot Telegram/Discord/Slack. Với MaxHermes, MiniMax xoá toàn bộ phần đó:
- Zero deployment overhead — không server, không Docker, không key
- Native enterprise IM — Feishu, DingTalk, Enterprise WeChat (WeCom) ra-mắt-là-có-sẵn
- 24/7 managed — cron scheduler chạy ngầm, MiniMax lo uptime
- Bill qua Token Plan — subscribe Token Plan của MiniMax, dùng API key riêng (không phải pay-as-you-go key)
- Anchored to MiniMax M2.7 — không cần chọn model, không cấu hình
Đây là kết quả của partnership Nous Research × MiniMax công bố ngày 07/04/2026, khi M2.7 trở thành first-class provider trong open-source Hermes Agent qua Nous Portal.
Why it matters
Hermes Agent là open-source agent framework duy nhất hiện có closed learning loop — tức là agent thật sự tốt lên theo thời gian, không phải marketing. Sau task ≥5 tool calls, nó tự sinh ra một file Markdown gọi là "skill document" mô tả approach, edge case, domain knowledge. Lần sau gặp task tương tự → load skill thay vì reasoning lại từ đầu. Khi gặp thông tin contradicting/extending → tự patch ngay trong lúc dùng. Nous Research benchmark: agent dùng skill tự sinh hoàn thành research task nhanh hơn 40% so với fresh instance, không cần prompt tuning.
Trước MaxHermes, lợi ích này chỉ dành cho developer chịu khó tự host. MaxHermes đẩy nó vào tay enterprise dùng Feishu/DingTalk/WeCom — đối tượng chưa từng chạm tới "wave thứ ba" của AI agents (sau prompt-and-pray và RAG).
Technical facts
Engine bên dưới là MiniMax M2.7 — model 230B params, các benchmark đáng chú ý:

| Benchmark | M2.7 | Đối thủ gần nhất |
|---|---|---|
| SWE-Pro (programming, multi-language) | 56.22% | Match GPT-5.3-Codex |
| VIBE-Pro (end-to-end project delivery) | 55.6% | Gần Opus 4.6 (56.1%) |
| Terminal Bench 2 (system comprehension) | 57.0% | Top tier |
| GDPval-AA (office software ELO) | 1495 | Highest open-source, vượt GPT-5.3 |
| Toolathon (tool use) | 46.3% | Global top tier |
| MM Claw (real-world tasks) | 62.7% | Gần Sonnet 4.6 |
Cơ chế self-evolution không chỉ là agent học, mà cả model M2.7 cũng tự tiến hoá: trong test nội bộ, M2.7 chạy autonomously 100+ rounds tối ưu coding scaffold của chính nó (analyze failure → plan changes → modify code → eval → keep/revert), đạt +30% performance trên internal eval. Trên 22 ML competition (MLE Bench Lite của OpenAI), M2.7 đạt 66.6% medal rate trung bình, có 9 huy chương vàng.
Memory layer của Hermes Agent dùng FTS5 full-text search + LLM summary, đạt latency truy xuất ~10ms qua 10,000+ skill documents. M2.7 maintain 97% skill adherence khi tương tác cùng lúc với 40+ complex skills (mỗi skill 2,000+ tokens).
Comparison
Ba lựa chọn chính nếu bạn muốn agent self-improving:
| Tiêu chí | MaxHermes (cloud) | Hermes Agent (self-host) | OpenClaw |
|---|---|---|---|
| Deployment | Zero — click là chạy | VPS $5/mo + Docker + key | Consumer-grade defaults |
| Self-improving | Có (closed learning loop) | Có (closed learning loop) | Không — skill tĩnh |
| Model choice | Chỉ M2.7 | 200+ (OpenRouter, Anthropic, Ollama...) | Đa dạng |
| Platform integration | Feishu, DingTalk, WeCom | Telegram, Discord, Slack, WhatsApp, Signal, Matrix, CLI | 50+ platform |
| Data privacy | MiniMax cloud | Self-hosted, full sovereignty | Self-hosted |
| Security | Managed | Sandboxed Docker, zero CVE | CVE-2026-25253 (CVSS 8.8) |
| Pricing | Token Plan (chưa công bố tier) | $5-10/mo VPS + $15-80/mo API | Mã nguồn mở |
Nói gọn: MaxHermes đổi flexibility lấy convenience. Nếu bạn dùng Feishu/DingTalk/WeCom và không muốn nghĩ về infrastructure — MaxHermes hợp lý nhất. Nếu cần data sovereignty, đa model, đa platform Western (Telegram/Discord/Slack) — self-host vẫn là lựa chọn tốt hơn.
Use cases
5 kịch bản MiniMax demo và cộng đồng đang chạy thực tế:
- Live production debugging: M2.7 correlate monitoring metric với deployment timeline, statistical analysis trên trace, auto connect DB verify root cause, viết non-blocking index migration trước khi submit MR. MiniMax report nhiều incident được rút thời gian recovery xuống dưới 3 phút.
- Financial modeling + report drafting: Đọc annual report + earnings call, cross-reference research, build Excel revenue model, draft PPT + Word research report theo template. Demo trên TSMC — output dùng được làm first draft cho junior analyst.
- Scheduled enterprise reporting: Built-in cron scheduler nhận lệnh natural language. Pull analytics qua đêm → auto deliver daily/weekly performance report vào kênh DingTalk/WeCom mỗi sáng. Report tốt lên theo thời gian nhờ learning loop.
- 24/7 customer support + sales outreach: Deploy thẳng vào messaging channel để xử lý Q&A khách 24/7; persistent memory học FAQ qua interaction hàng ngày. Hoặc research prospect, personalize outreach, follow-up tự động.
- Long-term research assistant: Track experiment spec qua nhiều tuần, build dần skill document chuyên sâu cho từng domain. RL team của MiniMax report M2.7 handle 30-50% workflow nghiên cứu hàng ngày.
Limitations & pricing
Vài điểm cần biết trước khi subscribe:
- Pricing tier chưa công bố chi tiết — chỉ biết bill qua MiniMax Token Plan, dùng Token Plan API Key (khác pay-as-you-go key). Để so sánh: self-host Hermes Agent tốn $5-10/mo VPS + $15-80/mo cho LLM API ở mức trung bình, có thể vọt $400+/mo nếu heavy use.
- Data sovereignty — managed cloud nghĩa là conversation, project context, enterprise data đi qua server MiniMax. Self-host giữ data trên server của bạn.
- Platform restriction — chỉ Feishu/DingTalk/WeCom (regional skew sang enterprise IM Trung Quốc). Self-host hỗ trợ Telegram/Discord/Slack/WhatsApp/Signal/Matrix/CLI qua single gateway.
- Vendor lock-in — anchored vào M2.7. Self-host swap được sang OpenRouter, Anthropic, OpenAI, hay Ollama local zero-cost.
- API stability — Hermes Agent đi từ v0.1 (02/2026) tới v0.9 (13/04/2026) trong 2 tháng. Framework di chuyển nhanh, behavior có thể đổi giữa minor versions.
What's next
Roadmap MiniMax đã hint:
- Skillhub community integration — "MaxClaw users migrate skill + persona configs với một click". Cùng hướng với
hermes claw migratetrong open-source Hermes (auto import config, memory, skill, key từ OpenClaw). - Multimodal expansion — vision, audio, có thể cả robotics, theo thesis partnership Nous × MiniMax.
- Fully autonomous self-evolution — MiniMax tuyên bố giai đoạn tiếp theo agent sẽ tự coordinate data construction, model training, inference architecture, evaluation mà không cần human trong loop.
- Open-source Hermes velocity — v0.8.0 (08/04) có 209 PR merged, v0.9.0 (13/04) thêm local web dashboard + monitoring API. Tốc độ này gợi ý v1.0 không xa.
Nếu bạn đang chọn nền agent dài hạn cho team enterprise: thử MaxHermes trial trước khi commit. Nếu bạn là solo founder hoặc developer cần data sovereignty: stick với self-host Hermes Agent + M2.7 qua Nous Portal — bạn vẫn được engine tương đương, thêm full control.

Nguồn: KuCoin Flash, MiniMax API Docs, MiniMax M2.7 News, Hermes Agent GitHub, Hermes Agent docs.
