TL;DR

MaxHermes ra mắt 16/04/2026 (UTC+8) — sản phẩm cloud đầu tiên của MiniMax đóng gói nguyên bộ Hermes Agent của Nous Research thành dịch vụ managed. Khác với self-host: không server, không Docker, không API key juggling. Tích hợp sẵn Feishu, DingTalk, WeCom; chạy 24/7; bill qua Token Plan. Powered by MiniMax M2.7 — model open-source đứng top GDPval-AA (1495 ELO) và SWE-Pro (56.22%). Điểm khác biệt: agent tự viết skill document sau mỗi task phức tạp, lần sau dùng lại + tự patch khi gặp thông tin mâu thuẫn — gọi là "closed learning loop".

What's new

MaxHermes là lần đầu tiên MiniMax host Hermes Agent dưới dạng managed cloud product. Trước đây Hermes Agent yêu cầu user tự deploy: kiếm VPS $5/mo, cài Docker, cắm API key cho 1-N model provider, cấu hình bot Telegram/Discord/Slack. Với MaxHermes, MiniMax xoá toàn bộ phần đó:

  • Zero deployment overhead — không server, không Docker, không key
  • Native enterprise IM — Feishu, DingTalk, Enterprise WeChat (WeCom) ra-mắt-là-có-sẵn
  • 24/7 managed — cron scheduler chạy ngầm, MiniMax lo uptime
  • Bill qua Token Plan — subscribe Token Plan của MiniMax, dùng API key riêng (không phải pay-as-you-go key)
  • Anchored to MiniMax M2.7 — không cần chọn model, không cấu hình

Đây là kết quả của partnership Nous Research × MiniMax công bố ngày 07/04/2026, khi M2.7 trở thành first-class provider trong open-source Hermes Agent qua Nous Portal.

Why it matters

Hermes Agent là open-source agent framework duy nhất hiện có closed learning loop — tức là agent thật sự tốt lên theo thời gian, không phải marketing. Sau task ≥5 tool calls, nó tự sinh ra một file Markdown gọi là "skill document" mô tả approach, edge case, domain knowledge. Lần sau gặp task tương tự → load skill thay vì reasoning lại từ đầu. Khi gặp thông tin contradicting/extending → tự patch ngay trong lúc dùng. Nous Research benchmark: agent dùng skill tự sinh hoàn thành research task nhanh hơn 40% so với fresh instance, không cần prompt tuning.

Trước MaxHermes, lợi ích này chỉ dành cho developer chịu khó tự host. MaxHermes đẩy nó vào tay enterprise dùng Feishu/DingTalk/WeCom — đối tượng chưa từng chạm tới "wave thứ ba" của AI agents (sau prompt-and-pray và RAG).

Technical facts

Engine bên dưới là MiniMax M2.7 — model 230B params, các benchmark đáng chú ý:

MiniMax M2.7 benchmark so sánh với Sonnet 4.6, Opus 4.6, Gemini 3.1 Pro, GPT 5.4 — SWE Bench Pro, VIBE-Pro, GDPval-AA, MLE-Bench, Toolathon, MM-ClawBench

BenchmarkM2.7Đối thủ gần nhất
SWE-Pro (programming, multi-language)56.22%Match GPT-5.3-Codex
VIBE-Pro (end-to-end project delivery)55.6%Gần Opus 4.6 (56.1%)
Terminal Bench 2 (system comprehension)57.0%Top tier
GDPval-AA (office software ELO)1495Highest open-source, vượt GPT-5.3
Toolathon (tool use)46.3%Global top tier
MM Claw (real-world tasks)62.7%Gần Sonnet 4.6

Cơ chế self-evolution không chỉ là agent học, mà cả model M2.7 cũng tự tiến hoá: trong test nội bộ, M2.7 chạy autonomously 100+ rounds tối ưu coding scaffold của chính nó (analyze failure → plan changes → modify code → eval → keep/revert), đạt +30% performance trên internal eval. Trên 22 ML competition (MLE Bench Lite của OpenAI), M2.7 đạt 66.6% medal rate trung bình, có 9 huy chương vàng.

Memory layer của Hermes Agent dùng FTS5 full-text search + LLM summary, đạt latency truy xuất ~10ms qua 10,000+ skill documents. M2.7 maintain 97% skill adherence khi tương tác cùng lúc với 40+ complex skills (mỗi skill 2,000+ tokens).

Comparison

Ba lựa chọn chính nếu bạn muốn agent self-improving:

Tiêu chíMaxHermes (cloud)Hermes Agent (self-host)OpenClaw
DeploymentZero — click là chạyVPS $5/mo + Docker + keyConsumer-grade defaults
Self-improvingCó (closed learning loop)Có (closed learning loop)Không — skill tĩnh
Model choiceChỉ M2.7200+ (OpenRouter, Anthropic, Ollama...)Đa dạng
Platform integrationFeishu, DingTalk, WeComTelegram, Discord, Slack, WhatsApp, Signal, Matrix, CLI50+ platform
Data privacyMiniMax cloudSelf-hosted, full sovereigntySelf-hosted
SecurityManagedSandboxed Docker, zero CVECVE-2026-25253 (CVSS 8.8)
PricingToken Plan (chưa công bố tier)$5-10/mo VPS + $15-80/mo APIMã nguồn mở

Nói gọn: MaxHermes đổi flexibility lấy convenience. Nếu bạn dùng Feishu/DingTalk/WeCom và không muốn nghĩ về infrastructure — MaxHermes hợp lý nhất. Nếu cần data sovereignty, đa model, đa platform Western (Telegram/Discord/Slack) — self-host vẫn là lựa chọn tốt hơn.

Use cases

5 kịch bản MiniMax demo và cộng đồng đang chạy thực tế:

  • Live production debugging: M2.7 correlate monitoring metric với deployment timeline, statistical analysis trên trace, auto connect DB verify root cause, viết non-blocking index migration trước khi submit MR. MiniMax report nhiều incident được rút thời gian recovery xuống dưới 3 phút.
  • Financial modeling + report drafting: Đọc annual report + earnings call, cross-reference research, build Excel revenue model, draft PPT + Word research report theo template. Demo trên TSMC — output dùng được làm first draft cho junior analyst.
  • Scheduled enterprise reporting: Built-in cron scheduler nhận lệnh natural language. Pull analytics qua đêm → auto deliver daily/weekly performance report vào kênh DingTalk/WeCom mỗi sáng. Report tốt lên theo thời gian nhờ learning loop.
  • 24/7 customer support + sales outreach: Deploy thẳng vào messaging channel để xử lý Q&A khách 24/7; persistent memory học FAQ qua interaction hàng ngày. Hoặc research prospect, personalize outreach, follow-up tự động.
  • Long-term research assistant: Track experiment spec qua nhiều tuần, build dần skill document chuyên sâu cho từng domain. RL team của MiniMax report M2.7 handle 30-50% workflow nghiên cứu hàng ngày.

Limitations & pricing

Vài điểm cần biết trước khi subscribe:

  • Pricing tier chưa công bố chi tiết — chỉ biết bill qua MiniMax Token Plan, dùng Token Plan API Key (khác pay-as-you-go key). Để so sánh: self-host Hermes Agent tốn $5-10/mo VPS + $15-80/mo cho LLM API ở mức trung bình, có thể vọt $400+/mo nếu heavy use.
  • Data sovereignty — managed cloud nghĩa là conversation, project context, enterprise data đi qua server MiniMax. Self-host giữ data trên server của bạn.
  • Platform restriction — chỉ Feishu/DingTalk/WeCom (regional skew sang enterprise IM Trung Quốc). Self-host hỗ trợ Telegram/Discord/Slack/WhatsApp/Signal/Matrix/CLI qua single gateway.
  • Vendor lock-in — anchored vào M2.7. Self-host swap được sang OpenRouter, Anthropic, OpenAI, hay Ollama local zero-cost.
  • API stability — Hermes Agent đi từ v0.1 (02/2026) tới v0.9 (13/04/2026) trong 2 tháng. Framework di chuyển nhanh, behavior có thể đổi giữa minor versions.

What's next

Roadmap MiniMax đã hint:

  • Skillhub community integration — "MaxClaw users migrate skill + persona configs với một click". Cùng hướng với hermes claw migrate trong open-source Hermes (auto import config, memory, skill, key từ OpenClaw).
  • Multimodal expansion — vision, audio, có thể cả robotics, theo thesis partnership Nous × MiniMax.
  • Fully autonomous self-evolution — MiniMax tuyên bố giai đoạn tiếp theo agent sẽ tự coordinate data construction, model training, inference architecture, evaluation mà không cần human trong loop.
  • Open-source Hermes velocity — v0.8.0 (08/04) có 209 PR merged, v0.9.0 (13/04) thêm local web dashboard + monitoring API. Tốc độ này gợi ý v1.0 không xa.

Nếu bạn đang chọn nền agent dài hạn cho team enterprise: thử MaxHermes trial trước khi commit. Nếu bạn là solo founder hoặc developer cần data sovereignty: stick với self-host Hermes Agent + M2.7 qua Nous Portal — bạn vẫn được engine tương đương, thêm full control.

Hermes Agent — open-source framework do Nous Research phát triển, là nền tảng MaxHermes đóng gói

Nguồn: KuCoin Flash, MiniMax API Docs, MiniMax M2.7 News, Hermes Agent GitHub, Hermes Agent docs.