TL;DR

ai-agents-from-scratch là repository của Patric Gutersohn - dạy build AI agent hoàn toàn từ đầu mà không động đến LangChain hay CrewAI. 15 module tiến dần từ gọi LLM cơ bản lên đến Tree of Thought, Graph of Thought, và tool routing bằng embeddings. Repo đang có 4.2k star, 606 fork, và module 15 vừa được commit hôm nay. Philosophy: "Learn by building. Understand deeply, then use frameworks wisely." - via GitHub.

Vấn đề mà ai cũng gặp

Bạn follow tutorial LangChain, code chạy được, cảm giác hiểu. Rồi agent không chịu dùng tool đúng lúc - bạn debug 3 tiếng mà không biết sửa ở đâu. Đây chính xác là trải nghiệm của tác giả trước khi anh quyết định viết lại từ đầu.

Vấn đề không nằm ở LangChain hay CrewAI - framework của họ tốt. Vấn đề là hầu hết tutorial nhảy thẳng vào abstractions mà không giải thích cơ chế bên dưới. Khi có gì đó vỡ, developer không có mental model để debug. ai-agents-from-scratch ra đời để đóng cái gap này.

Cách repo này hoạt động

Không có abstraction nào được che giấu. Mỗi module là một executable JavaScript file chạy được ngay, kèm theo hai file tài liệu:

  • CODE.md - giải thích từng dòng code
  • CONCEPT.md - giải thích kiến trúc cấp cao

Tất cả chạy local qua node-llama-cpp với model GGUF - không phụ thuộc OpenAI API, không tốn tiền mỗi lần chạy thử. Công thức mà repo dạy là: AI Agent = LLM + System Prompt + Tools + Memory + Reasoning Pattern. Mỗi thành phần được build từ đầu, rõ ràng, có thể trace được.

Tiện ích PromptDebugger cho thấy chính xác model nhận input gì - system prompt, tool definitions, conversation history. Không có gì là black box.

15 module - học gì theo thứ tự

Mỗi module chỉ thêm đúng 1 khái niệm mới:

  1. Introduction - gọi LLM lần đầu, hiểu inference pipeline
  2. OpenAI Intro (optional) - so sánh local vs cloud API
  3. Translation - system prompt, agent specialization
  4. Think - reasoning với LLM, khi nào cần external tools
  5. Batch - xử lý nhiều request song song, GPU batch
  6. Coding - streaming, token budget, real-time output
  7. Simple Agent - function calling, JSON schema cho tools
  8. Simple Agent with Memory - persistent state qua sessions
  9. ReAct Agent - vòng lặp Reason - Act - Observe
  10. AoT Agent - Atom of Thought, lập kế hoạch atomic
  11. Error Handling - retry policy, graceful degradation
  12. Tree of Thought - beam search qua các nhánh lý luận
  13. Graph of Thought - DAG merge nhiều nguồn thành 1 policy
  14. Chain of Thought - reasoning có audit trail, chống early bias
  15. Tool Routing (Embeddings) - cosine similarity để chọn đúng tool (mới nhất)

ReAct Pattern - nền tảng của modern AI agents

ReAct Pattern: vòng lặp Think - Act - Observe là nền tảng của modern AI agents
ReAct Pattern: Reason - Act - Observe. Thay vì trả lời thẳng, agent suy nghĩ, gọi tool, quan sát kết quả rồi lặp lại.

Module 9 là điểm chuyển tiếp quan trọng nhất trong cả curriculum. Trước đó agent chỉ trả lời - từ module này trở đi agent hành động. Vòng lặp ReAct hoạt động như sau:

  1. Think: LLM phân tích query, quyết định cần làm gì tiếp theo
  2. Act: Gọi tool (web search, calculator, database...) với đúng tham số
  3. Observe: Nhận kết quả, đưa vào context
  4. Lặp lại cho đến khi đủ thông tin để trả lời cuối

Đây là cơ chế bên dưới của hầu hết AI agent frameworks hiện đại. Khi bạn tự implement nó từ đầu một lần, behavior của LangChain hay CrewAI sẽ không còn là hộp đen nữa.

Sau khi hiểu, dùng framework mới thực sự có giá trị

Repo này không phải để thay thế LangChain hay CrewAI trong production. Roadmap Phase 2 thậm chí sẽ dạy rebuild LangChain core patterns từ đầu với code có thể đọc được - mục tiêu là hiểu tại sao framework làm vậy, không phải tránh dùng framework.

Khi đã nắm foundation, bạn sẽ tận dụng được các thứ framework cung cấp thêm: pre-built tool libraries, multi-agent orchestration, production error handling, observability - mà không bị mù khi có gì đó vỡ.

Giới hạn cần biết

  • JavaScript-first: Toàn bộ code là Node.js. Python version có ở repo riêng nhưng ít module hơn
  • Hardware: Cần tối thiểu 8GB RAM, khuyến nghị 16GB để chạy inference local mượt
  • Storage: Mỗi model GGUF chiếm 2-4GB disk
  • Không có production scope: Repo này là educational resource - không cover cloud deployment, multi-tenant, hay enterprise orchestration
  • Single contributor: Repo hiện chỉ có 1 contributor, tốc độ release phụ thuộc vào tác giả

Nên bắt đầu ở đây nếu...

Bạn đã dùng LangChain nhưng không hiểu tại sao agent hành xử như vậy khi gặp edge case - đây là repo dành cho bạn. Bạn muốn hiểu ReAct, memory, hay tool calling thực sự hoạt động như thế nào ở mức code - bắt đầu từ module 7 là ổn.

4.2k star trong thời gian ngắn và 495 Reddit upvotes trong 4 ngày đầu nói lên điều mà nhiều developer đang cảm: có rất nhiều tutorial dạy dùng AI framework, nhưng rất ít thứ dạy hiểu nó. Repository này lấp đúng chỗ trống đó.

GitHub: via pguso/ai-agents-from-scratch - Website: via agentsfromscratch.com