Hello-Agents: Dự án mã nguồn mở giúp bạn hiểu và tự xây AI Agent từ đầu

TL;DR

Datawhalechina ra mắt Hello-Agents vào ngày 1/3/2026 - một khóa học mã nguồn mở 16 chương dạy bạn xây AI Agent từ nguyên lý đầu tiên, không phải chỉ "click button" trên Dify hay Coze. Dự án đạt 51.8k stars sau vài tháng, lên GitHub Trending ngay ngày ra mắt. Miễn phí, song ngữ, kèm code thực hành đầy đủ.

Vấn đề mà Hello-Agents muốn giải quyết

Năm 2026, công cụ AI Agent đã xuất hiện khắp nơi: Dify, Coze, n8n, LangGraph, AutoGen. Hầu hết dev AI biết cách dùng các công cụ này - kéo thả node, cấu hình workflow, kết nối API. Nhưng rất ít người thực sự hiểu tại sao một agent hoạt động theo cách đó, hay làm sao để xây một agent từ đầu khi không có framework.

Hello-Agents gọi đây là khoảng cách giữa "software engineering agents" (workflow-driven, LLM chỉ là backend xử lý dữ liệu) và "AI-Native agents" thực sự - các agent tự lập luận, lập kế hoạch động và tự tiến hóa.

Lộ trình 16 chương

Curriculum chia thành 5 phần, tất cả đã hoàn thành:

Phần 1 - Nền tảng (Ch 1-3): Định nghĩa agent, lịch sử từ AI biểu tượng đến LLM-driven agents, cơ chế Transformer và giới hạn của LLM
Phần 2 - Xây dựng Agent (Ch 4-7): Tự code từ đầu các pattern ReAct, Plan-and-Solve, Reflection; tìm hiểu Coze/Dify/n8n; học LangGraph/AutoGen; rồi tự xây framework HelloAgents của riêng mình
Phần 3 - Nâng cao (Ch 8-12): Memory systems + RAG, context engineering, giao thức MCP/A2A/ANP, Agentic Reinforcement Learning (SFT → GRPO), đánh giá agent
Phần 4 - Case studies (Ch 13-15): Travel assistant, Deep Research Agent, Cyber Town simulation
Phần 5 - Capstone (Ch 16): Dự án tốt nghiệp tổng hợp

Sơ đồ vòng lặp ReAct: LLM - Tools - Environment

Sơ đồ trên minh họa vòng lặp ReAct mà Chapter 4 dạy bạn tự code: LLM suy nghĩ (Thought), gọi công cụ (Function Call), nhận kết quả từ môi trường (Observation), rồi lặp lại.

Điểm nổi bật kỹ thuật

Một số con số đáng chú ý từ curriculum:

Agentic RL thực tế: Training Qwen3-0.6B trên GSM8K - sau SFT đạt 40-50% accuracy, thêm GRPO tăng lên 60-70% (+20 điểm). Dataset gồm 7,473 training samples và 1,319 test samples.
LoRA hiệu quả: Rank r=8 giảm 256 lần số lượng trainable parameters - từ 16.7M xuống còn 65,536. Full fine-tuning cần ~12GB VRAM (FP16).
DeepSpeed ZeRO: ZeRO-3 giảm memory từ 6.2GB/GPU (standard DDP) xuống còn 2.8GB/GPU - cho phép train trên GPU phổ thông hơn.
Framework HelloAgents v1.0.2: Tự xây bằng native OpenAI API, abstraction đồng nhất Memory/RAG/RL/MCP thành "tool".

Hello-Agents GitHub stats: 50k stars, 6k forks, global rank #424

So sánh với các nền tảng khác

Hello-Agents không xem Dify, Coze, LangGraph là đối thủ - thực ra dự án dạy cả chúng trong Chapter 5-6 trước khi đi sâu vào nguyên lý:

Dify/Coze/n8n: Nhanh để ship sản phẩm, visual interface, nhưng ẩn hoàn toàn cơ chế bên trong. Sau khi dùng chúng, bạn biết cách nhưng không biết tại sao.
LangGraph/AutoGen: Code-first, linh hoạt hơn, nhưng vẫn là "dùng bánh xe có sẵn". Hello-Agents dạy bạn đúc bánh xe ở Chapter 7.
Microsoft AI Agents for Beginners: 12 bài học nền tảng tốt, nhưng không đi đến Agentic RL hay tự xây framework.
Hello-Agents: Bottom-up từ nguyên lý đầu tiên, bao gồm cả training pipeline và case studies phức tạp. Phù hợp với người muốn hiểu sâu, không chỉ dùng.

Hạn chế và yêu cầu

Prerequisites: Biết Python cơ bản và biết gọi LLM API. Không cần background toán sâu hay ML research.

Hạn chế cần lưu ý:

Không đi sâu vào toán thuần hoặc kiến trúc model mới - đây là học xây dựng với AI, không phải nghiên cứu AI
Chapter 11 (Agentic RL) cần GPU - Qwen3-0.6B cần ~12GB VRAM cho full fine-tuning (LoRA giảm đáng kể)
Nội dung chủ yếu tiếng Trung; bản tiếng Anh có nhưng một số chapter chưa dịch đầy đủ

Nên bắt đầu nếu bạn là...

Dev đang dùng Dify/Coze/n8n và muốn hiểu cơ chế thực sự đằng sau workflow
Software engineer muốn chuyển sang AI engineering, cần nền tảng vững về agent architecture
Sinh viên/researcher cần lộ trình có hệ thống từ lý thuyết đến thực hành
Người đã biết LangGraph/AutoGen và muốn đi sâu hơn vào lớp engineering bên dưới

Tiếp theo từ Hello-Agents

Dự án đã công bố sequel: "Training Agents from Scratch" (《从零开始训练智能体》) - ra đời sau khi Hello-Agents đạt 40k stars và survey cộng đồng cho thấy nhu cầu đi sâu vào model training. Phần này sẽ cover việc tự xây và train custom agent model cho các use case chuyên biệt.

Tháng 5/2026, dự án sẽ update learning roadmap và sẽ phát hành video tutorials theo từng chapter.

Truy cập: GitHub datawhalechina/hello-agents - Đọc online: datawhalechina.github.io/hello-agents - PDF: Releases