Repo 4.2k Star Dạy Build AI Agent Từ Đầu - Không Framework, Không Black Box

TL;DR

ai-agents-from-scratch là repository của Patric Gutersohn - dạy build AI agent hoàn toàn từ đầu mà không động đến LangChain hay CrewAI. 15 module tiến dần từ gọi LLM cơ bản lên đến Tree of Thought, Graph of Thought, và tool routing bằng embeddings. Repo đang có 4.2k star, 606 fork, và module 15 vừa được commit hôm nay. Philosophy: "Learn by building. Understand deeply, then use frameworks wisely." - via GitHub.

Vấn đề mà ai cũng gặp

Bạn follow tutorial LangChain, code chạy được, cảm giác hiểu. Rồi agent không chịu dùng tool đúng lúc - bạn debug 3 tiếng mà không biết sửa ở đâu. Đây chính xác là trải nghiệm của tác giả trước khi anh quyết định viết lại từ đầu.

Vấn đề không nằm ở LangChain hay CrewAI - framework của họ tốt. Vấn đề là hầu hết tutorial nhảy thẳng vào abstractions mà không giải thích cơ chế bên dưới. Khi có gì đó vỡ, developer không có mental model để debug. ai-agents-from-scratch ra đời để đóng cái gap này.

Cách repo này hoạt động

Không có abstraction nào được che giấu. Mỗi module là một executable JavaScript file chạy được ngay, kèm theo hai file tài liệu:

CODE.md - giải thích từng dòng code
CONCEPT.md - giải thích kiến trúc cấp cao

Tất cả chạy local qua node-llama-cpp với model GGUF - không phụ thuộc OpenAI API, không tốn tiền mỗi lần chạy thử. Công thức mà repo dạy là: AI Agent = LLM + System Prompt + Tools + Memory + Reasoning Pattern. Mỗi thành phần được build từ đầu, rõ ràng, có thể trace được.

Tiện ích PromptDebugger cho thấy chính xác model nhận input gì - system prompt, tool definitions, conversation history. Không có gì là black box.

15 module - học gì theo thứ tự

Mỗi module chỉ thêm đúng 1 khái niệm mới:

Introduction - gọi LLM lần đầu, hiểu inference pipeline
OpenAI Intro (optional) - so sánh local vs cloud API
Translation - system prompt, agent specialization
Think - reasoning với LLM, khi nào cần external tools
Batch - xử lý nhiều request song song, GPU batch
Coding - streaming, token budget, real-time output
Simple Agent - function calling, JSON schema cho tools
Simple Agent with Memory - persistent state qua sessions
ReAct Agent - vòng lặp Reason - Act - Observe
AoT Agent - Atom of Thought, lập kế hoạch atomic
Error Handling - retry policy, graceful degradation
Tree of Thought - beam search qua các nhánh lý luận
Graph of Thought - DAG merge nhiều nguồn thành 1 policy
Chain of Thought - reasoning có audit trail, chống early bias
Tool Routing (Embeddings) - cosine similarity để chọn đúng tool (mới nhất)

ReAct Pattern - nền tảng của modern AI agents

ReAct Pattern: vòng lặp Think - Act - Observe là nền tảng của modern AI agents — ReAct Pattern: Reason - Act - Observe. Thay vì trả lời thẳng, agent suy nghĩ, gọi tool, quan sát kết quả rồi lặp lại.

Module 9 là điểm chuyển tiếp quan trọng nhất trong cả curriculum. Trước đó agent chỉ trả lời - từ module này trở đi agent hành động. Vòng lặp ReAct hoạt động như sau:

Think: LLM phân tích query, quyết định cần làm gì tiếp theo
Act: Gọi tool (web search, calculator, database...) với đúng tham số
Observe: Nhận kết quả, đưa vào context
Lặp lại cho đến khi đủ thông tin để trả lời cuối

Đây là cơ chế bên dưới của hầu hết AI agent frameworks hiện đại. Khi bạn tự implement nó từ đầu một lần, behavior của LangChain hay CrewAI sẽ không còn là hộp đen nữa.

Sau khi hiểu, dùng framework mới thực sự có giá trị

Repo này không phải để thay thế LangChain hay CrewAI trong production. Roadmap Phase 2 thậm chí sẽ dạy rebuild LangChain core patterns từ đầu với code có thể đọc được - mục tiêu là hiểu tại sao framework làm vậy, không phải tránh dùng framework.

Khi đã nắm foundation, bạn sẽ tận dụng được các thứ framework cung cấp thêm: pre-built tool libraries, multi-agent orchestration, production error handling, observability - mà không bị mù khi có gì đó vỡ.

Giới hạn cần biết

JavaScript-first: Toàn bộ code là Node.js. Python version có ở repo riêng nhưng ít module hơn
Hardware: Cần tối thiểu 8GB RAM, khuyến nghị 16GB để chạy inference local mượt
Storage: Mỗi model GGUF chiếm 2-4GB disk
Không có production scope: Repo này là educational resource - không cover cloud deployment, multi-tenant, hay enterprise orchestration
Single contributor: Repo hiện chỉ có 1 contributor, tốc độ release phụ thuộc vào tác giả

Nên bắt đầu ở đây nếu...

Bạn đã dùng LangChain nhưng không hiểu tại sao agent hành xử như vậy khi gặp edge case - đây là repo dành cho bạn. Bạn muốn hiểu ReAct, memory, hay tool calling thực sự hoạt động như thế nào ở mức code - bắt đầu từ module 7 là ổn.

4.2k star trong thời gian ngắn và 495 Reddit upvotes trong 4 ngày đầu nói lên điều mà nhiều developer đang cảm: có rất nhiều tutorial dạy dùng AI framework, nhưng rất ít thứ dạy hiểu nó. Repository này lấp đúng chỗ trống đó.

GitHub: via pguso/ai-agents-from-scratch - Website: via agentsfromscratch.com