MaxHermes ra mắt: MiniMax đóng gói agent self-improving lên cloud, click một phát là chạy

TL;DR

MaxHermes ra mắt 16/04/2026 (UTC+8) — sản phẩm cloud đầu tiên của MiniMax đóng gói nguyên bộ Hermes Agent của Nous Research thành dịch vụ managed. Khác với self-host: không server, không Docker, không API key juggling. Tích hợp sẵn Feishu, DingTalk, WeCom; chạy 24/7; bill qua Token Plan. Powered by MiniMax M2.7 — model open-source đứng top GDPval-AA (1495 ELO) và SWE-Pro (56.22%). Điểm khác biệt: agent tự viết skill document sau mỗi task phức tạp, lần sau dùng lại + tự patch khi gặp thông tin mâu thuẫn — gọi là "closed learning loop".

What's new

MaxHermes là lần đầu tiên MiniMax host Hermes Agent dưới dạng managed cloud product. Trước đây Hermes Agent yêu cầu user tự deploy: kiếm VPS $5/mo, cài Docker, cắm API key cho 1-N model provider, cấu hình bot Telegram/Discord/Slack. Với MaxHermes, MiniMax xoá toàn bộ phần đó:

Zero deployment overhead — không server, không Docker, không key
Native enterprise IM — Feishu, DingTalk, Enterprise WeChat (WeCom) ra-mắt-là-có-sẵn
24/7 managed — cron scheduler chạy ngầm, MiniMax lo uptime
Bill qua Token Plan — subscribe Token Plan của MiniMax, dùng API key riêng (không phải pay-as-you-go key)
Anchored to MiniMax M2.7 — không cần chọn model, không cấu hình

Đây là kết quả của partnership Nous Research × MiniMax công bố ngày 07/04/2026, khi M2.7 trở thành first-class provider trong open-source Hermes Agent qua Nous Portal.

Why it matters

Hermes Agent là open-source agent framework duy nhất hiện có closed learning loop — tức là agent thật sự tốt lên theo thời gian, không phải marketing. Sau task ≥5 tool calls, nó tự sinh ra một file Markdown gọi là "skill document" mô tả approach, edge case, domain knowledge. Lần sau gặp task tương tự → load skill thay vì reasoning lại từ đầu. Khi gặp thông tin contradicting/extending → tự patch ngay trong lúc dùng. Nous Research benchmark: agent dùng skill tự sinh hoàn thành research task nhanh hơn 40% so với fresh instance, không cần prompt tuning.

Trước MaxHermes, lợi ích này chỉ dành cho developer chịu khó tự host. MaxHermes đẩy nó vào tay enterprise dùng Feishu/DingTalk/WeCom — đối tượng chưa từng chạm tới "wave thứ ba" của AI agents (sau prompt-and-pray và RAG).

Technical facts

Engine bên dưới là MiniMax M2.7 — model 230B params, các benchmark đáng chú ý:

MiniMax M2.7 benchmark so sánh với Sonnet 4.6, Opus 4.6, Gemini 3.1 Pro, GPT 5.4 — SWE Bench Pro, VIBE-Pro, GDPval-AA, MLE-Bench, Toolathon, MM-ClawBench

Benchmark	M2.7	Đối thủ gần nhất
SWE-Pro (programming, multi-language)	56.22%	Match GPT-5.3-Codex
VIBE-Pro (end-to-end project delivery)	55.6%	Gần Opus 4.6 (56.1%)
Terminal Bench 2 (system comprehension)	57.0%	Top tier
GDPval-AA (office software ELO)	1495	Highest open-source, vượt GPT-5.3
Toolathon (tool use)	46.3%	Global top tier
MM Claw (real-world tasks)	62.7%	Gần Sonnet 4.6

Cơ chế self-evolution không chỉ là agent học, mà cả model M2.7 cũng tự tiến hoá: trong test nội bộ, M2.7 chạy autonomously 100+ rounds tối ưu coding scaffold của chính nó (analyze failure → plan changes → modify code → eval → keep/revert), đạt +30% performance trên internal eval. Trên 22 ML competition (MLE Bench Lite của OpenAI), M2.7 đạt 66.6% medal rate trung bình, có 9 huy chương vàng.

Memory layer của Hermes Agent dùng FTS5 full-text search + LLM summary, đạt latency truy xuất ~10ms qua 10,000+ skill documents. M2.7 maintain 97% skill adherence khi tương tác cùng lúc với 40+ complex skills (mỗi skill 2,000+ tokens).

Comparison

Ba lựa chọn chính nếu bạn muốn agent self-improving:

Tiêu chí	MaxHermes (cloud)	Hermes Agent (self-host)	OpenClaw
Deployment	Zero — click là chạy	VPS $5/mo + Docker + key	Consumer-grade defaults
Self-improving	Có (closed learning loop)	Có (closed learning loop)	Không — skill tĩnh
Model choice	Chỉ M2.7	200+ (OpenRouter, Anthropic, Ollama...)	Đa dạng
Platform integration	Feishu, DingTalk, WeCom	Telegram, Discord, Slack, WhatsApp, Signal, Matrix, CLI	50+ platform
Data privacy	MiniMax cloud	Self-hosted, full sovereignty	Self-hosted
Security	Managed	Sandboxed Docker, zero CVE	CVE-2026-25253 (CVSS 8.8)
Pricing	Token Plan (chưa công bố tier)	$5-10/mo VPS + $15-80/mo API	Mã nguồn mở

Nói gọn: MaxHermes đổi flexibility lấy convenience. Nếu bạn dùng Feishu/DingTalk/WeCom và không muốn nghĩ về infrastructure — MaxHermes hợp lý nhất. Nếu cần data sovereignty, đa model, đa platform Western (Telegram/Discord/Slack) — self-host vẫn là lựa chọn tốt hơn.

Use cases

5 kịch bản MiniMax demo và cộng đồng đang chạy thực tế:

Live production debugging: M2.7 correlate monitoring metric với deployment timeline, statistical analysis trên trace, auto connect DB verify root cause, viết non-blocking index migration trước khi submit MR. MiniMax report nhiều incident được rút thời gian recovery xuống dưới 3 phút.
Financial modeling + report drafting: Đọc annual report + earnings call, cross-reference research, build Excel revenue model, draft PPT + Word research report theo template. Demo trên TSMC — output dùng được làm first draft cho junior analyst.
Scheduled enterprise reporting: Built-in cron scheduler nhận lệnh natural language. Pull analytics qua đêm → auto deliver daily/weekly performance report vào kênh DingTalk/WeCom mỗi sáng. Report tốt lên theo thời gian nhờ learning loop.
24/7 customer support + sales outreach: Deploy thẳng vào messaging channel để xử lý Q&A khách 24/7; persistent memory học FAQ qua interaction hàng ngày. Hoặc research prospect, personalize outreach, follow-up tự động.
Long-term research assistant: Track experiment spec qua nhiều tuần, build dần skill document chuyên sâu cho từng domain. RL team của MiniMax report M2.7 handle 30-50% workflow nghiên cứu hàng ngày.

Limitations & pricing

Vài điểm cần biết trước khi subscribe:

Pricing tier chưa công bố chi tiết — chỉ biết bill qua MiniMax Token Plan, dùng Token Plan API Key (khác pay-as-you-go key). Để so sánh: self-host Hermes Agent tốn $5-10/mo VPS + $15-80/mo cho LLM API ở mức trung bình, có thể vọt $400+/mo nếu heavy use.
Data sovereignty — managed cloud nghĩa là conversation, project context, enterprise data đi qua server MiniMax. Self-host giữ data trên server của bạn.
Platform restriction — chỉ Feishu/DingTalk/WeCom (regional skew sang enterprise IM Trung Quốc). Self-host hỗ trợ Telegram/Discord/Slack/WhatsApp/Signal/Matrix/CLI qua single gateway.
Vendor lock-in — anchored vào M2.7. Self-host swap được sang OpenRouter, Anthropic, OpenAI, hay Ollama local zero-cost.
API stability — Hermes Agent đi từ v0.1 (02/2026) tới v0.9 (13/04/2026) trong 2 tháng. Framework di chuyển nhanh, behavior có thể đổi giữa minor versions.

What's next

Roadmap MiniMax đã hint:

Skillhub community integration — "MaxClaw users migrate skill + persona configs với một click". Cùng hướng với hermes claw migrate trong open-source Hermes (auto import config, memory, skill, key từ OpenClaw).
Multimodal expansion — vision, audio, có thể cả robotics, theo thesis partnership Nous × MiniMax.
Fully autonomous self-evolution — MiniMax tuyên bố giai đoạn tiếp theo agent sẽ tự coordinate data construction, model training, inference architecture, evaluation mà không cần human trong loop.
Open-source Hermes velocity — v0.8.0 (08/04) có 209 PR merged, v0.9.0 (13/04) thêm local web dashboard + monitoring API. Tốc độ này gợi ý v1.0 không xa.

Nếu bạn đang chọn nền agent dài hạn cho team enterprise: thử MaxHermes trial trước khi commit. Nếu bạn là solo founder hoặc developer cần data sovereignty: stick với self-host Hermes Agent + M2.7 qua Nous Portal — bạn vẫn được engine tương đương, thêm full control.

Hermes Agent — open-source framework do Nous Research phát triển, là nền tảng MaxHermes đóng gói

Nguồn: KuCoin Flash, MiniMax API Docs, MiniMax M2.7 News, Hermes Agent GitHub, Hermes Agent docs.