Khóa học 22 chương thiết kế AI Agent - P2: Nền tảng, Bộ nhớ và Phối hợp đa-Agent

TL;DR

Series này đi sâu vào 11 chương đầu của agentic-ai-system-course - từ tool call đơn giản nhất đến hệ thống phối hợp đa-agent phức tạp. Mỗi khái niệm được trình bày như một pattern kiến trúc bền vững, không phụ thuộc vào LangChain, CrewAI hay bất kỳ framework nào cụ thể.

Nền tảng (Ch.01-04): Từ tool call đến agent loop

Block đầu tiên xây nền tảng nhận thức quan trọng nhất: AI agent không chỉ là LLM trả lời câu hỏi. Agent là hệ thống có thể tự chủ theo đuổi mục tiêu thông qua lập kế hoạch, ra quyết định, sử dụng tool, thích nghi dựa trên feedback và có bộ nhớ.

Ch.01 - One Tool Call: Đơn vị nguyên tử nhỏ nhất của agentic behavior. Một tool call là lúc model quyết định gọi một function cụ thể với tham số cụ thể để thu thập thông tin hoặc thực hiện hành động. Khác với chat thông thường: model không chỉ generate text mà ra quyết định thực thi.

Ch.02 - The Agent Loop: Vòng lặp cơ bản của mọi agent: observe → think → act → observe. Model nhận context, lập kế hoạch bước tiếp theo, gọi tool, nhận kết quả, cập nhật context và lặp lại. Đây là building block mà mọi agent phức tạp đều được build on top of.

Ch.03 - Tools as Contract: Tool không phải chỉ là function - đó là contract giữa model và hệ thống. Schema của tool (name, description, parameters) ảnh hưởng trực tiếp đến chất lượng quyết định của model. Thiết kế tool contract kém = model hallucinate tham số, gọi sai tool.

Ch.04 - Prompts & Caching: System prompt là nơi định nghĩa behavior của agent - không phải chỉ instruction mà còn là cách agent hiểu role của mình. Caching giảm latency và chi phí đáng kể khi system prompt dài hoặc context tái sử dụng nhiều.

Bộ nhớ và trạng thái (Ch.05-08): Từ context window đến persistent storage

Memory là thứ phân biệt agent thực sự với chatbot. Block này giải quyết câu hỏi: làm thế nào để agent "nhớ" và duy trì trạng thái qua các lần tương tác?

Ch.05 - Short-term Memory: In-context memory - những gì đang nằm trong context window hiện tại. Trade-off chính: context window dài hơn = tốn kém hơn và chậm hơn. Chiến lược nén context (compaction) và summarization giúp giữ thông tin quan trọng mà không bị tràn window.

Ch.06 - Long-term Memory: Lưu trữ ngoài context window - database, vector store, file system. Khác với short-term, long-term memory cần retrieval strategy: agent phải quyết định khi nào truy vấn và gì cần lấy ra. Đây là nơi RAG (Retrieval-Augmented Generation) phát huy vai trò.

Ch.07 - Writing & Curation: Agent không chỉ đọc memory mà còn viết vào đó. Câu hỏi quan trọng: khi nào nên lưu gì? Lưu quá nhiều = noise. Lưu quá ít = agent quên. Curation pipeline quyết định thông tin nào đủ quan trọng để persist.

Ch.08 - Persistence: Làm thế nào để trạng thái tồn tại qua các session, qua restart, qua crash? Serialization formats, storage backends và recovery strategy. Reference system Paperclip trong khóa học dùng durable Postgres state để minh họa pattern này trong code thực tế.

Kiến trúc AI Agent: từ tool calls đến multi-agent coordination

Phối hợp đa-agent (Ch.09-11): Planning và orchestration

Một agent đơn lẻ có giới hạn. Block này mở ra cách các agent làm việc cùng nhau để giải quyết vấn đề phức tạp hơn khả năng của từng cá thể.

Ch.09 - Planning: Trước khi thực thi, agent tốt cần lập kế hoạch. Decompose task thành sub-tasks, xác định dependencies, ước tính resources cần. Hai model phổ biến: ReAct (Reasoning + Acting xen kẽ) và Plan-and-Execute (lập toàn bộ kế hoạch trước rồi thực hiện). Mỗi cái có trade-off riêng về latency và độ linh hoạt.

Ch.10 - Multi-agent Delegation: Khi một task quá lớn hoặc cần specialization, orchestrator agent phân công cho sub-agents. Pattern chính: orchestrator nhận task, phân tích, giao việc cho sub-agent đúng chuyên môn, tổng hợp kết quả. Ví dụ từ khóa học: trong healthcare, một orchestrator điều phối agent chuyên về bảo hiểm, agent chuyên về lịch hẹn và agent chuyên về xét nghiệm.

Ch.11 - The Harness: Infrastructure bọc quanh các agents - orchestration logic, runtime, telemetry. Harness là thứ biến một LLM raw thành production-quality agent. Nó áp đặt discipline: timeout, retry logic, error handling, state management. Như Anthropic đã ghi lại: ngay cả frontier model cũng sẽ không đạt production quality nếu chạy trong bare loop không có harness.

Ứng dụng thực tế theo domain

Khóa học giới thiệu 3 domain enterprise để học viên hình dung kiến trúc trong thực tế:

Healthcare: Multi-agent hệ thống điều phối intake bệnh nhân, xác minh bảo hiểm, lên lịch, theo dõi xét nghiệm và lập kế hoạch xuất viện
Customer Support: Agents chuyên biệt xử lý triage ticket, knowledge retrieval, phân tích sentiment, routing leo thang và follow-up
Supply Chain: Liên tục tối ưu procurement, inventory, lịch sản xuất và logistics theo disruption và demand thay đổi real-time

Điểm chung: domain phức tạp với nhiều luồng xử lý song song, cần memory để nhớ context dài và cần phối hợp nhiều agent chuyên môn khác nhau.

Bước tiếp theo

Nắm vững 11 chương đầu là nền tảng để đọc phần khó nhất: đưa agent ra production. P3 của series này sẽ cover các chương còn lại - từ human-in-the-loop, MCP connectors đến observability, cost optimization, safety và proactive/self-evolving agents.

via GitHub - bryanyzhu/agentic-ai-system-course