// Posts#ai-agent
Agent của bạn cần Wiki và Bản ghi, không phải bàn làm việc rộng hơn
#6822026-05-18

Agent của bạn cần Wiki và Bản ghi, không phải bàn làm việc rộng hơn

GBrain, open-source bởi CEO Y Combinator Garry Tan ngày 5/4/2026, biến markdown thành knowledge graph searchable đạt P@5 49.1% và R@5 97.9%. Lossless Context Management thay thế sliding-window compaction bằng DAG-based summarization - không bao giờ mất một message nào. Hai công cụ bổ trợ nhau: GBrain xử lý bộ nhớ xuyên conversation, Lossless giữ lại toàn bộ lịch sử trong một session dài.

gbrainlossless-context-managementai-agent
7 phút đọc
GEPA và Curator: Bộ đôi tối ưu hóa biến Hermes Agent thành machine tự tiến hóa
#6782026-05-18

GEPA và Curator: Bộ đôi tối ưu hóa biến Hermes Agent thành machine tự tiến hóa

GEPA (Genetic-Pareto Prompt Evolution) dùng 35x ít rollouts hơn GRPO để cải thiện skill hiệu quả hơn 20% - chạy qua API $2-10/run, không cần GPU. Curator là background agent chạy 7 ngày/chu kỳ, tự gộp skill trùng và archive skill 90 ngày không dùng - không bao giờ auto-delete. v0.12 giảm cold start 57%, ra ngày 30/4/2026 với 1.096 commits từ 213 contributors.

hermes-agentgepanous-research
6 phút đọc
AI Agent của bạn cứ thất bại? Đây là hệ thống 8 bước để fix
#6642026-05-18

AI Agent của bạn cứ thất bại? Đây là hệ thống 8 bước để fix

Gartner dự đoán hơn 40% dự án agentic AI sẽ thất bại trước 2027 - chủ yếu vì thiếu hệ thống, không phải vì LLM kém. Framework 8 bước chuẩn (Define → Brain → Model → Tools → Memory → Orchestrate → Interface → Test) giúp agent đạt failure rate dưới 1%. Semantic caching giảm API call tới 70%, structured data governance giảm error rate AI apps tới 80%. Năm 2026, 40% enterprise apps sẽ có task-specific AI agents - cơ hội cho ai biết xây đúng cách.

ai-agentllmagentic-ai
7 phút đọc
276 Use Cases của Hermes Agent - Cộng Đồng Đang Xây Gì Vào Năm 2026
#6622026-05-17

276 Use Cases của Hermes Agent - Cộng Đồng Đang Xây Gì Vào Năm 2026

Một thread trên Reddit đã ghi lại 276 use cases thực tế của Hermes Agent, trải đều 16 danh mục từ GitHub, Reddit, Hacker News đến production deployment. Hermes Agent vượt 140.000 GitHub stars chỉ sau 3 tháng ra mắt và trở thành agent được dùng nhiều nhất thế giới theo OpenRouter. Chi phí vận hành chỉ từ $5/tháng trên VPS, hỗ trợ 200+ model và 6 nền tảng nhắn tin đồng thời. Không còn là chatbot - đây là hạ tầng cho lao động kỹ thuật số tự vận hành.

hermes-agentnous-researchai-agent
8 phút đọc
3 Blueprint xây AI Agent đăng bài X đúng giọng bạn - từ 8 phút/post đến tự động hoàn toàn
#6432026-05-15

3 Blueprint xây AI Agent đăng bài X đúng giọng bạn - từ 8 phút/post đến tự động hoàn toàn

Có 3 kiến trúc để xây AI agent đăng bài X theo đúng giọng bạn và tối ưu cho thuật toán. Blueprint 01 (Session Agent) chỉ cần Claude Code + CLAUDE.md, mỗi post mất 8 phút thay vì 45. Blueprint 02 (Approval Pipeline) batch cả tuần trong 30 phút với Telegram bot duyệt 1-tap. Blueprint 03 (Autonomous Stack) tự cải thiện mỗi tuần từ data thực, nhưng cần 1 tuần build và review monthly để tránh voice drift.

ai-agentclaude-codex-twitter
7 phút đọc
Harness Engineering (Phần 3): Anthropic, OpenAI, Nous Research Thiết Kế Harness Như Thế Nào?
#6372026-05-15

Harness Engineering (Phần 3): Anthropic, OpenAI, Nous Research Thiết Kế Harness Như Thế Nào?

Anthropic dùng Ralph Loop 3 agent (Planner + Generator + Evaluator) để build DAW hoàn chỉnh trong 3h50m - $124. OpenAI cho Codex tự đọc production logs bằng LogQL và tự mở PR trả nợ kỹ thuật. Nous Research dùng DSPy + GEPA để Harness tự tối ưu hóa chính nó. Và 3 nguyên tắc ngược trực giác bạn cần biết trước khi thêm bất kỳ tool nào.

harness-engineeringanthropicopenai
8 phút đọc
Tencent Giải Quyết Bộ Nhớ AI Agent: Token Giảm 61%, Persona Tăng 48%→76%
#6362026-05-15

Tencent Giải Quyết Bộ Nhớ AI Agent: Token Giảm 61%, Persona Tăng 48%→76%

TencentDB Agent Memory là hệ thống open-source (MIT) từ Tencent, giải quyết vấn đề agent mất ngữ cảnh qua kiến trúc 4 tầng tiến trình. Token tiêu thụ giảm 61.38% trên WideSearch benchmark. Persona coherence tăng từ 48% lên 76% trên PersonaMem. Chạy hoàn toàn local, không phụ thuộc external API.

tencentagent-memoryai-agent
6 phút đọc
html-anything: Khi AI Agent viết HTML thay bạn - từ Markdown thô đến bài đăng WeChat trong vài giây
#6352026-05-15

html-anything: Khi AI Agent viết HTML thay bạn - từ Markdown thô đến bài đăng WeChat trong vài giây

html-anything là open-source tool cho phép Claude Code, Codex, Cursor và 5 AI agent khác tự động tạo HTML ship-ready từ bất kỳ input nào. 75 template × 9 loại output, marginal cost $0, export 1-click lên WeChat và X. Repo mới 4 ngày tuổi đã đạt 1.1k sao trên GitHub.

html-anythingopen-sourceai-agent
7 phút đọc
Học một lệnh slash này và cách bạn dùng AI sẽ thay đổi hoàn toàn
#6342026-05-15

Học một lệnh slash này và cách bạn dùng AI sẽ thay đổi hoàn toàn

Lệnh /goal biến AI thành một worker tự chủ hoạt động liên tục - không cần bạn approve từng bước. Claude Code 2.1.139 và Codex CLI 0.128.0 đều ra mắt tính năng này trong tháng 5/2026. Đã có developer mất $6,000 chỉ trong một đêm vì chạy /goal mà không đặt giới hạn budget.

claude-codecodexai-agent
7 phút đọc
FDE: Vai trò mà OpenAI, Anthropic và Google đang đặt hơn 5 tỷ đô để cược vào
#6242026-05-13

FDE: Vai trò mà OpenAI, Anthropic và Google đang đặt hơn 5 tỷ đô để cược vào

Trong 10 ngày (4-12/5/2026), OpenAI, Anthropic và Google đồng loạt đặt cược vào FDE với tổng vốn vượt $5.5 tỷ. OpenAI lập DeployCo $4B mua Tomoro (+150 FDE); Anthropic nhúng FDE vào FIS nén điều tra AML từ ngày xuống phút. 95% pilot AI doanh nghiệp thất bại không vì model kém mà vì không ai deploy được. Gartner dự báo 70% doanh nghiệp từ bỏ dự án AI FDE-led vào 2028 vì chi phí cao và thiếu năng lực nội tại.

fdeforward-deployed-engineeropenai
7 phút đọc