Tất cả bài viết

// Posts#engineering

Featured#7312026-05-25

AI Agents Cũng Lão Hóa - Sau 100 Session, Agent Của Bạn Còn Đáng Tin Không

AgingBench phát hiện 4 cơ chế lão hóa khiến AI agent suy giảm dù model weights không thay đổi. Chỉ đổi compaction prompt tạo ra gap 4,5x về half-life. Typed-state overlay giảm accumulator error 47%. Forced re-read đẩy recall của Opus-4.7 từ 0,68 lên 0,91.

ai-agentbenchmarkllm

7 phút đọc

#6842026-05-18

Giảm 87% Chi Phí Token AI Agent trong 7 Ngày - Từ $4,800 Xuống $620/Tháng

AI agent tiêu tốn token 10-100x nhiều hơn chatbot vì re-send toàn bộ context mỗi bước - 70% trong số đó là waste. Playbook 7 ngày giúp giảm bill từ $4,800 xuống $620/tháng (87%) mà không giảm chất lượng output. Prompt caching Anthropic giảm 90% chi phí token cached, chỉ cần 1 cache hit để hoà vốn. Model routing Haiku/Sonnet/Opus theo task complexity - một team finance tiết kiệm $365,000/năm nhờ thay đổi này.

ai-agenttoken-optimizationprompt-caching

7 phút đọc

#5942026-05-11

4 Trụ Cột Agent Bền Vững - Phần 2: Building và Memory

Tool contract là một chiều trừ khi bạn enforce ngược lại - bug Stripe thực tế: model pass email vào customer_id, agent thông báo khách đang trả tiền không tìm thấy tài khoản. State poisoning hiện diện trong 73% production AI deployments. Phần 2 của series về engineering deficit.

ai-agenttool-validationstate-poisoning

7 phút đọc

#5932026-05-11

4 Trụ Cột Agent Bền Vững - Phần 1: 88% AI Agent Chết Trong Production - Vấn Đề Không Nằm Ở Model

88% dự án agent không bao giờ ra production theo IDC 2026. MIT đo 95% tỷ lệ thất bại. Chỉ 5% trong số 1.837 developer được khảo sát có agent thật sự chạy production. Lý do không phải model kém - mà là kỹ thuật xung quanh model. Bài này đặt tên cho vấn đề: engineering deficit.

ai-agentagentic-aiengineering

5 phút đọc

#5922026-05-10

6 Bệnh Thần Kinh của AI Agent - P2: Confabulation, Disinhibition và Anosognosia

Confabulation không phải hallucination: khi retrieval thất bại, agent bịa nguồn trông như thật thay vì thừa nhận không biết. Nghiên cứu HalluCitation 2026 tìm thấy gần 300 bài học thuật ACL/EMNLP có ít nhất 1 tài liệu tham khảo bịa đặt. Disinhibition là phanh control plane hỏng - agent đọc email phishing và thực sự gửi file đi. Anosognosia là bệnh nguy hiểm nhất: sai mà không biết mình sai.

ai-agentengineeringconfabulation

7 phút đọc

#5912026-05-10

6 Bệnh Thần Kinh của AI Agent - P1: Source Amnesia, Phantom Limb và Locked-in Syndrome

Khi AI agent mắc lỗi, bạn thường đổ lỗi cho model - nhưng vấn đề thực sự thường nằm ở runtime. Model cho agent "não", còn runtime cho nó "thân thể": mắt, tay, bộ nhớ, phanh, cơ chế tự kiểm tra. Bài này phân tích 3 trong 6 bệnh thần kinh đã được ánh xạ từ y học sang hành vi agent: Source Amnesia, Phantom Limb State và Locked-in Syndrome. Model mạnh hơn không chữa được những bệnh này.

ai-agentengineeringdebugging

6 phút đọc

#4842026-05-05

10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P2: ReAct, Multi-Agent và An Toàn

5 khái niệm nâng cao quyết định Agent của bạn có đáng tin cậy hay không: ReAct pattern, Multi-Agent collaboration, Error handling, Safety control và cách chọn framework đúng. Nhóm Multi-Agent thực tế chỉ 3-4 agent do coordination overhead tăng nhanh.

ai-agentreact-patternmulti-agent

7 phút đọc

#4832026-05-05

10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P1: Nền Tảng Kiến Trúc

AI Agent không phải chatbot thông minh hơn - đó là một hệ thống thực thi hoàn chỉnh gồm LLM, tool calling, task planning, memory và context management. Bài này giải thích 5 khái niệm nền tảng bạn phải nắm trước khi bắt tay code Agent. MCP tháng 3/2026 đã vượt 97 triệu monthly SDK downloads.

ai-agentllmmcp

7 phút đọc

#2392026-04-02

Agentic Memory: Khi AI Agent Thực Sự Biết Nhớ

Reflexion tăng pass@1 từ 80% lên 91% trên HumanEval chỉ bằng cách cho agent ghi nhớ lỗi quá khứ. Mem0 đạt 91.6 điểm trên benchmark LoCoMo với chỉ ~6.900 tokens/query, so với ~26.000 tokens của full-context. Agentic memory chia thành 4 loại riêng biệt - in-context, external, episodic, semantic - mỗi loại giải quyết một bài toán khác nhau. Voyager (Minecraft agent) có procedural memory nhanh hơn 15.3x so với agent không có memory.

agentic-memoryai-agentvector-database

7 phút đọc

#2202026-03-25

Agent Harness: Lý do thật sự khiến dự án AI agent của bạn không bao giờ ra được sản phẩm

80% thời gian của các team agent đang bị tiêu tốn vào việc xây hạ tầng, không phải giải quyết bài toán kinh doanh. Claude Code và agent tự làm dùng cùng một Claude API - nhưng kết quả cách nhau một trời một vực chỉ vì harness. Agent harness là lớp giữa model và ứng dụng mà hầu hết mọi người đang bỏ qua hoàn toàn.

ai-agentagent-harnessllm

7 phút đọc