- Agent AI không thất bại vì thiếu intelligence - chúng thất bại vì architecture kém.
- Sau 60 ngày, 0xJeff đúc kết: building an agent là 90% architecture, 10% AI.
- Skill bundling giúp giảm từ 5000+ xuống còn 500 tokens mỗi session.
- x402 protocol cho phép agent tự trả phí tool bằng USDC mà không cần đăng ký thủ công.
TL;DR
Agent AI thất bại do architecture kém, không phải vì model thiếu thông minh - 90% là thiết kế, 10% là AI.
Đổi provider liên tục tốn 2-3 session debug mỗi lần - hãy chọn 1 provider rồi gắn bó.
Skill bundling: từ prompt 2000+ từ xuống còn directory ~100 dòng, tiết kiệm 5000+ tokens/session.
x402 protocol (Coinbase) biến agent thành người mua tool tự động bằng USDC - seed $5-10 là xài được hàng trăm premium tools.
Feedback loop 6 bước là cách nhanh nhất để "train" personal agent của bạn.
Hermes Analyst là gì?
Hermes Agent là self-improving AI agent MIT-licensed của Nous Research, thiết kế để sống trên server của bạn, ghi nhớ mọi thứ qua các session, và ngày càng thông minh hơn theo thời gian. Khác với các coding copilot hay chatbot thông thường, Hermes có built-in learning loop - tự tạo skills từ kinh nghiệm, tự nhớ preference của bạn, kết nối được qua Telegram, Discord, Slack, WhatsApp từ cùng một gateway.
0xJeff, một crypto investor/analyst nổi tiếng trong cộng đồng DeFi, đã dùng Hermes làm analyst agent trong 60 ngày qua nhiều workflow đầu tư thực tế. Bài viết này tổng hợp 6 bài học lớn nhất mà anh đúc kết được - để bạn không phải lặp lại những sai lầm tốn kém đó.
Bài học 1: Đừng nhảy provider liên tục
Trong 60 ngày, 0xJeff đã thử qua 5-6 provider setup: OpenRouter với Kimi-k2.6/Qwen/DeepSeek, OpenCode Go, DeepSeek direct API, Venice AI, Grok. Mỗi lần swap là 2-3 session debug API compatibility, auth flows, và timeout settings.
Bài học thực tế: DeepSeek direct API nhanh hơn rõ rệt so với OpenCode Go ($5/tháng) vì OpenCode Go routing multi-hop thêm 5-10 giây mỗi call. DeepSeek còn từng discount 75% direct API trước khi rollout cho OpenRouter. Chọn 1 provider rồi gắn bó - model bây giờ không còn là yếu tố phân biệt nữa, open-weight labs đã ngang tầm frontier labs về intelligence trong khi chi phí thấp hơn nhiều.
Bài học 2: Tools và skills quan trọng hơn model
Hermes tự tạo skill mỗi khi nhận ra bạn sẽ lặp lại workflow đó. Kết quả: workflow thủ công 3 phút giảm xuống còn 10 giây lần thứ hai. Công việc chính của bạn là trỏ agent đến đúng tool cho đúng việc.
Exa cho structured web search, Firecrawl cho JS-heavy sites - tốt hơn nhiều so với manual web search
Browser CDP tốt hơn headless browser (Playwright hay bị Cloudflare block)
Direct tool access qua API/MCP/markdown skill file cho output tốt hơn và tiết kiệm token hơn
Bài học 3: Memory là điểm khác biệt cốt lõi
Hermes có native memory qua User.md, Memory.md, Soul.md để hiểu bạn và thế giới. Nhưng để recall chính xác qua nhiều session dài, cần external memory provider như Hindsight.
Cảnh báo từ kinh nghiệm thực tế: Hindsight "Reflect" tốn tới 240 giây và hay timeout - dùng "Recall" cho time-sensitive cron jobs thay thế. Quan trọng hơn: đừng hook Hindsight vào OpenRouter với frontier models - 0xJeff đã burn $20-30/ngày khi kết nối Hindsight với Kimi-k2.6, và $50+ chỉ trong một ngày khi kết nối với Claude Sonnet 4.6 qua OpenRouter.
Bài học 4: Feedback loop 6 bước để train personal agent
Workflow hàng ngày mà 0xJeff chờ đón nhất lúc 10AM là morning brief - tổng hợp tất cả X accounts, news sources, portco developments, và Top 10 insights. Chất lượng output ngày càng tốt hơn nhờ feedback loop đơn giản:
Hermes tạo output
Đọc ngay và flag cái sai
Đưa correction cụ thể/next steps
Hermes encode correction thành permanent rule
Output tiếp theo tốt hơn
Lặp lại
Vấn đề chưa giải quyết được: echo chamber - "Why it matters" hay gravitate về holdings hiện có, các analyst thường nhắc đi nhắc lại NVIDIA, TSMC, MU, VRT, SIVE. Nếu bạn có giải pháp, anh ấy muốn nghe.
Bài học 5: x402 giải quyết friction tìm tool

x402 là open payment protocol của Coinbase, hồi sinh HTTP status code 402 "Payment Required" để biến nó thành payment rail cho AI agents. Cách hoạt động:
Agent gửi HTTP request đến server
Server trả về 402 + payment instructions
Agent tự construct USDC payment payload
Server verify và trả về resource
Toàn bộ diễn ra tự động, settlement dưới 2 giây, fee khoảng $0.0001/transaction. CDP của Coinbase cung cấp facilitator service hỗ trợ Base, Polygon, Arbitrum, Solana với free tier 1,000 transactions/tháng, sau đó $0.001/transaction.
Trước x402, 0xJeff mất rất nhiều thời gian tìm đúng tool: tìm MCP, đăng ký API free, cân nhắc có đáng trả không. Sau x402: 1 lệnh install, seed $5-10 USDC, xài được hàng trăm premium tools như Nansen, Exa/Firecrawl, Surf, BlockRun - mỗi call chỉ vài cent. via Coinbase CDP
Bài học 6: Skill bundling là bắt buộc

Ban đầu, mọi workflow của 0xJeff là một giant prompt. Skill điều tra onchain dump đạt 2000+ từ, phủ Dexscreener, Nansen, RPC endpoints, Cookie MCP, output format. Mỗi lần phát hiện bug, prompt lại dài thêm.
Giải pháp đơn giản: treat skill như directory, không phải prompt.
onchain-dump-investigation/
├── SKILL.md # Pipeline logic (~100 dòng)
├── references/
│ ├── nansen-agentcash.md # Endpoint shapes
│ ├── base-rpc-endpoints.md # Working RPCs
│ └── cookie-mcp-queries.md # Query templates
└── scripts/
└── check_wallets.shKết quả: một skill bundled đúng cách chỉ tốn ~500 tokens để load (SKILL.md + 2-3 reference files), thay vì 5000+ tokens re-explain context mỗi session. Sau 60 ngày và hàng trăm session, tiết kiệm này compound đáng kể. via Hermes Agent
Kết
Nếu có một sợi chỉ xuyên suốt 6 bài học này, đó là: building an agent là 90% architecture, 10% AI. Mọi người đều có quyền truy cập cùng một set models. Điều phân biệt agent hữu dụng và agent vô dụng là tool/skill design, memory persistence, feedback loop, và unit economics đủ bền để vận hành lâu dài.
Bản thân 0xJeff vẫn đang ở Phase 1 - tối ưu output quality và cải thiện workflow hiện tại. Anh đang thử nghiệm prediction market trading autonomous với small bankroll. Kết quả sẽ được chia sẻ nếu có gì đáng nói.
