TL;DR

Antonio Gullí - Engineering Director tại Google, Office of CTO - tổng hợp 21 design patterns để xây AI Agent, với runnable code trên 3 framework: LangChain/LangGraph, Crew AI và Google ADK.

Câu đầu tiên đáng đọc nhất trong sách nằm ở phần prologue: hầu hết thứ bạn đang gọi là "AI Agent" không phải Agent. Đây là bài đầu trong series 3 phần phân tích quyển sách này - phần 1 tập trung vào 4 cấp độ Agent và lý do Agent của bạn đang không hoạt động tốt như mong đợi.

Vì sao nó đáng đọc

IMG_7218.jpeg

Antonio Gullí là Senior Director tại Google với hơn 30 năm kinh nghiệm trong mảng AI, Search và Cloud. Ông đã từng dẫn dắt các nhóm kỹ thuật tại Google EMEA và là tác giả của quyển "Deep Learning for Keras" được nhiều kỹ sư ML biết đến. Lần này, ông áp dụng tư duy kỹ sư phần mềm vào việc xây AI Agent - thứ mà phần lớn tài liệu hiện tại vẫn đang tiếp cận theo kiểu thử-sai-và-viết-lại.

"Agentic Design Patterns" ra đời từ một quan sát rất thực tế: trong lĩnh vực phần mềm truyền thống, chúng ta có Design Patterns (Gang of Four, 1994) - những giải pháp đã được kiểm chứng cho các bài toán lặp đi lặp lại. AI Agent development đang thiếu đúng thứ đó. Kỹ sư mỗi người xây một kiểu, không có ngôn ngữ chung, không có blueprint để tham chiếu.

Sách giải quyết vấn đề này bằng 21 patterns, từ cơ bản đến nâng cao:

  • Foundational patterns: Prompt Chaining, Routing, Parallelization, Reflection, Tool Use (Function Calling), Planning

  • Advanced patterns: Multi-Agent Collaboration, Memory Management, Learning and Adaptation, Model Context Protocol, Goal Setting, Exception Handling, Human-in-the-Loop, Knowledge Retrieval (RAG), Inter-Agent Communication (A2A), Resource-Aware Optimization, Reasoning Techniques, Guardrails/Safety Patterns

Điểm khác biệt so với phần lớn tài liệu về Agent hiện tại: sách không overemphasize hệ sinh thái Google. Code examples được triển khai song song trên LangChain/LangGraph, Crew AI và Google ADK - bạn có thể học pattern rồi áp dụng vào bất kỳ stack nào.

Bạn đang xây gì - Agent hay chatbot?

Đây là câu hỏi quan trọng nhất trong sách, và câu trả lời thường không dễ nghe.

Gullí phân loại AI systems thành 4 cấp độ, và ranh giới giữa "chatbot" và "Agent thực sự" nằm ở Level 1:

4 cấp độ Agent: Level 0 (Bare LLM) đến Level 3 (Multi-Agent)

Level 0 - Bare LLM: LLM thuần, không tool, không memory, không hành động. Bạn hỏi, nó đoán dựa trên training data. Hỏi về kết quả Oscar 2025, nó bịa. Sách ghi thẳng: Level 0 không phải Agent.

Level 1 - Tool User: Agent bắt đầu dùng tool - search, API, database. Nhưng cái quan trọng không phải là "có thể gọi API" mà là tự mình phán đoán khi nào cần gọi, gọi gì, và xử lý kết quả như thế nào. Ví dụ từ sách: user hỏi "tuần này có phim gì mới?", Agent tự nhận ra thông tin này không có trong training data, chủ động gọi search tool, rồi tổng hợp kết quả. Bước then chốt là "tự nhận ra" - không phải người dùng chỉ đạo. Năng lực phán đoán đó là ngưỡng cửa Level 1.

Level 2 - Strategic Thinker: Thêm hai thứ: planning và Context Engineering. Agent không chỉ dùng tool mà còn tự lập kế hoạch nhiều bước và chủ động lọc thông tin. Ví dụ trong sách: user muốn tìm cà phê ở giữa hai địa điểm. Agent gọi map API, nhận về một đống dữ liệu, tự phán đoán "bước tiếp theo chỉ cần tên đường", cắt bớt output xuống thành một danh sách ngắn, rồi mới đưa vào local search tool. Mỗi bước đều đang làm information denoising. Ngoài ra Level 2 còn có khả năng tự kiểm tra lại kết quả sau khi xong việc.

Level 3 - Multi-Agent Collaboration: Từ một Agent toàn năng chuyển sang một team Agent chuyên biệt. Thay vì tạo ra một "super agent" làm tất cả, sách đề xuất cách tiếp cận như một đội dự án: Project Manager Agent + Research Agent + Designer Agent + Copywriter Agent. Ví dụ cho product launch: một "Project Manager Agent" điều phối, giao việc cho "Market Research Agent", "Product Design Agent", "Marketing Agent". Vấn đề phức tạp nhất ở Level 3 là communication: Agent truyền dữ liệu như thế nào, đồng bộ trạng thái ra sao, xử lý xung đột kiểu gì.

Tại sao Agent của bạn không dùng được

Đọc xong 4 cấp độ này, câu trả lời cho câu hỏi "Agent của tôi không hoạt động tốt" thường hiện ra ngay: model không phải vấn đề. Vấn đề là bạn đang giao task Level 2 hoặc Level 3 cho một system đang chạy ở Level 0 hoặc Level 1.

Điều này phổ biến hơn bạn nghĩ. Rất nhiều workflow được gọi là "AI Agent" thực ra chỉ là:

  • Một cái prompt dài gửi đến LLM

  • LLM trả về text

  • Code xung quanh parse và hiển thị text đó

Đó là Level 0 với lớp bọc ngoài. Nó không có khả năng tự quyết định dùng tool, không nhớ context giữa các bước, không tự điều chỉnh khi kết quả sai. Bạn có thể thay thế toàn bộ system đó bằng một `while True: response = llm.chat(input())` và hầu như không thấy sự khác biệt.

Framework mạnh đến đâu cũng không cứu được kiến trúc sai. Đây là điểm Gullí nhấn mạnh nhiều nhất trong phần mở đầu: building effective agentic systems requires more than just a powerful language model; it demands structure and design.

Kết - Phần 1

Sách "Agentic Design Patterns" đặt ra một cái khung rõ ràng để trả lời câu hỏi đầu tiên: hệ thống bạn đang xây đang ở cấp độ nào? Và với mỗi cấp độ, cần thêm gì để lên level tiếp theo?

Phần 2 sẽ đi vào hai concept kỹ thuật cốt lõi nhất trong sách: Context Engineering (khái niệm bị đánh giá thấp nhất theo tác giả) và Reflection Pattern - pattern có giá trị thực chiến cao nhất. Hai thứ này cộng lại là 80% lý do Level 2 Agent hoạt động tốt hơn Level 1 Agent.

via Yanhua