Hermes Agent: AI agent đầu tiên tự tạo kỹ năng và không bao giờ quên

TL;DR

Hermes Agent là open-source AI agent framework của Nous Research, ra mắt tháng 2/2026. Điểm khác biệt duy nhất và quan trọng nhất: agent tự tạo kỹ năng từ kinh nghiệm thực tế rồi dùng lại cho lần sau - không cần bạn lập trình, không cần fine-tune model. MIT license, chạy local hoặc $5 VPS.

Vấn đề với AI agent thông thường

Hầu hết AI agent hiện tại đều reset hoàn toàn sau mỗi session. Bạn dạy nó cách deploy một Kubernetes pod hôm nay - ngày mai nó không nhớ gì. Mỗi lần là từ đầu, tốn thời gian, tốn token, và tốn kiên nhẫn của bạn.

Hermes giải quyết vấn đề này theo cách đơn giản nhưng hiệu quả: memory lưu facts, skills lưu procedures. Biết rằng pod Kubernetes bị crash là một fact. Biết chính xác chuỗi lệnh nào fix nó - đó là procedure, và đó là thứ mà memory thông thường không lưu được.

Ba tầng bộ nhớ - mỗi tầng một tốc độ

Hermes Agent three-tier memory system architecture diagram

Hermes không có một "memory" duy nhất. Nó có 3 tầng, mỗi tầng phục vụ mục đích khác nhau:

Tầng 1 - In-Prompt: Hai file markdown nhỏ - MEMORY.md (tối đa 2.200 ký tự) lưu project conventions, tool quirks, bài học kinh nghiệm; USER.md (tối đa 1.375 ký tự) lưu profile của bạn - tên, sở thích, level. Cả hai được inject vào system prompt như frozen snapshot khi session bắt đầu. Tốc độ: instant. Dung lượng: nhỏ.
Tầng 2 - Session Search: Mọi cuộc trò chuyện (CLI lẫn messaging) được lưu vào SQLite với full-text search (FTS5). Agent có thể tìm kiếm lịch sử hàng tuần. Khi memory tầng 1 đầy ~80%, agent tự consolidate - gộp các entry liên quan thành phiên bản súc tích hơn. Tốc độ: on-demand. Dung lượng: không giới hạn.
Tầng 3 - External Providers: 8 plugin pluggable như Honcho (dialectic memory), Holographic (local, HRR), Supermemory (context fencing). Chỉ một provider active tại một thời điểm. Khi active, Hermes tự prefetch relevant memories trước mỗi turn. Tốc độ: deeper. Dung lượng: deep model of you.

Triết lý thiết kế: facts quan trọng thì để trong memory, còn lại search on-demand.

Vòng lặp 6 bước tự tạo SKILL.md

Hermes Agent self-improvement loop - skill creation and management workflow

Đây là phần mạnh nhất của Hermes. Vòng lặp hoạt động như sau:

Agent gặp vấn đề (ví dụ: CrashLoopBackOff trên Kubernetes)
Trial & error: 5+ tool calls, lỗi, thử lại
Tìm được working solution
Gọi skill_manage(create) để lưu approach thành công thành một SKILL.md file
Skill được lưu vào ~/.hermes/skills/
Session tiếp theo, agent đọc skill và làm theo procedure đã được chứng minh - không phải khám phá lại từ đầu

Skill creation tự động trigger khi: task phức tạp (5+ tool calls), agent hit errors và recover được, bạn correct approach của nó, hoặc nó phát hiện non-trivial workflow.

Một skill là Markdown file với YAML frontmatter, có tên, mô tả, và procedure cụ thể. Tool skill_manage hỗ trợ 6 actions: create, patch (targeted fix, token-efficient hơn), edit (full rewrite), delete, write_file, remove_file. Trong thực tế, patch thường được ưu tiên vì rẻ hơn về token.

Progressive disclosure - đọc thông minh để tiết kiệm token

Skills Hub của Hermes hiện có 687 skills thuộc 18 categories (87 built-in + 79 optional + 505 từ cộng đồng). Nếu load hết mỗi lần thì tốn kinh khủng.

Giải pháp: progressive disclosure theo 3 level:

Level 0 - Agent thấy tên + mô tả ngắn (~3.000 token cho toàn bộ catalog)
Level 1 - Load full content của skill khi thực sự cần dùng
Level 2 - Drill vào specific reference files trong skill đó

Cơ chế này giữ token cost thấp trong khi vẫn có access đến toàn bộ thư viện kỹ năng.

Bắt đầu trong 60 giây

Hermes cài được trên Linux, macOS, WSL2, Android (Termux), Windows (early beta). Python 3.11+ được cài kèm. Yêu cầu tối thiểu: 8GB RAM cho API-based usage.

# Cài đặt
curl -sSL https://hermes-agent.nousresearch.com/install.sh | bash

# Setup wizard
hermes setup

# Bắt đầu chat
hermes

Nếu muốn dùng từ điện thoại qua Telegram: lấy bot token từ @BotFather, user ID từ @userinfobot, rồi chạy hermes gateway start --platform telegram.

Kết

Hermes Agent giải quyết đúng vấn đề mà mọi AI agent hiện tại bỏ qua: sự tích lũy theo thời gian. Không phải fine-tuning, không phải RAG phức tạp - chỉ là những file Markdown lưu lại cách bạn và agent đã giải quyết vấn đề, rồi dùng lại.

Bài tiếp theo sẽ đi sâu vào GEPA (Genetic-Pareto Prompt Evolution) và Curator - hai cơ chế đảm bảo skill library không bị bloated và luôn hoạt động hiệu quả hơn theo thời gian.

via Hermes Agent Docs · GitHub hermes-agent-self-evolution · Hermes Agent Masterclass - Avi Chawla