ActiveGraph: Lớp Liên Tục Mà AI Agent Dài Hạn Đang Thiếu

TL;DR

Yohei Nakajima vừa công bố ActiveGraph - được ông gọi là "BabyAGI 4 moment". Thay vì xây riêng task manager, memory store, log, approval queue như hầu hết các agent framework hiện tại, ActiveGraph đề xuất gom tất cả về một graph trạng thái bền vững duy nhất. Graph ghi lại what is, event log ghi lại what happened - cả hai cùng cho phép agent reconstruct chính xác tại sao một claim tồn tại, evidence nào support nó, và behavior nào tạo ra nó. Code chưa public ("code to come soon"), nhưng concept đủ rõ để đặt câu hỏi nghiêm túc về cách chúng ta đang build agent.

Từ BabyAGI Đến ActiveGraph: 3 Năm Tích Lũy

Năm 2023, BabyAGI ra đời với khoảng 100 dòng Python. Ý tưởng cốt lõi chỉ có vậy: lấy output của LLM, biến nó thành một task, lưu task đó lại, và loop. Không có real tools, không có durable execution, không có production memory, không có error recovery.

Nhưng đó chính là điểm đặc biệt. Khi model output ngừng là disposable text và trở thành structured state, hệ thống bắt đầu hoạt động khác đi. Agent đột nhiên có tính liên tục - một task có thể tồn tại, được reprioritize, revisit, hoặc dùng làm context cho việc tiếp theo. Đây là insight cốt lõi mà BabyAGI chứng minh từ sớm.

Qua 3 năm, cấu trúc xung quanh vòng lặp cốt lõi đó cứ lớn dần:

Tasks trở thành dependency graphs
Tools trở thành plugins, plugins trở thành functions có logs/versions/triggers
Graph experiments khám phá structured memory và relationships
Các phiên bản sau thêm async execution, retries, multi-channel I/O, context management

Vòng lặp vẫn nhỏ. Nhưng infrastructure xung quanh vòng lặp cứ phình to. Và pattern đó dẫn thẳng đến ActiveGraph.

Vấn Đề Gốc Rễ: Agent Phản Xạ Vs. Agent Có Trạng Thái

Hầu hết agent systems hiện tại được tổ chức xung quanh phản xạ: prompt vào, model lý luận, tool được gọi, message trả về. Dù có thêm planner, memory, multi-agent handoff hay reflection, hầu hết vẫn xoay quanh một center: model call, message, next action.

Cách này hoạt động tốt cho short tasks. Nhưng sẽ khó khi agent cần chạy hàng giờ, hàng ngày, hoặc vô thời hạn. Lúc đó agent không chỉ cần answer tốt - nó cần maintain một bức tranh coherent, evolving về:

Nó tin gì, và tại sao
Điều gì đang xảy ra, điều gì đã thay đổi
Cái gì phụ thuộc cái gì, cái gì đã stale
Cái gì failed, cái gì đã được approved
Bước tiếp theo nên là gì

Nakajima dùng một phép so sánh hay: con người không phải stream processor. Chúng ta là persistent system tương tác qua streams. Conversation modify state - nó không define the being. Một AI real-time rất giỏi nhưng không có persistent state vẫn chỉ là: stream in, reaction out.

ActiveGraph: Graph Là Thực Tại, Event Log Là Lịch Sử

Diagram kiến trúc ActiveGraph: state nodes kết nối bằng semantic relations, Event Log timeline bên dưới

ActiveGraph không phải "agents as a graph". Không phải graph memory. Không phải workflow DAG. Câu hỏi nó đặt ra là: điều gì xảy ra khi toàn bộ operating reality của agent trở thành persistent state?

Trong ActiveGraph, graph là nơi mà mọi thứ cùng tồn tại trong một hệ thống evolving duy nhất: tasks, claims, evidence, documents, memories, decisions, risks, goals, tools, failures, và relationships. Các relations mang ngữ nghĩa cụ thể:

this supports that - bằng chứng ủng hộ claim
this contradicts that - hai thông tin mâu thuẫn
this depends on that - phụ thuộc thực thi
this was derived from that - nguồn gốc của thông tin

Song song với graph, event log ghi lại mọi thay đổi đã xảy ra. Graph đại diện cho what is, event log capture what happened. Cả hai cùng nhau cho phép reconstruct chính xác tại sao một claim tồn tại, evidence nào support nó, behavior nào tạo ra nó, và điều gì thay đổi sau đó.

Nakajima nhấn mạnh: trace này không phải debugging artifact. Nó là product.

Khi Mọi Thứ Đều Là State

Điểm khác biệt cốt lõi của ActiveGraph so với các module riêng lẽ: khi task, memory, claim, contradiction, decision, failed behavior, và proposed self-improvement đều là state trong cùng một hệ thống, những điều khác nhau trở nên tự nhiên:

Một claim không có evidence tự tạo ra research task
Hai claims mâu thuẫn tự trigger review
Dependency hoàn thành tự unblock công việc đang chờ
Source stale tự đánh dấu memo liên quan là stale
Memory update rủi ro có thể stay proposed cho đến khi được approve
Repeated failure tự suggest thay đổi behavior của hệ thống

Một run có thể pause, resume, fork, và explain itself. Đây là điểm khác biệt mấu chốt so với workflow DAG - DAG model computation (planner - researcher - critic - writer). ActiveGraph model the world the computation acts on. Bước tiếp theo emerge từ điều gì thay đổi trong thực tại - không hardcode vào process diagram.

Ai Nên Quan Tâm?

Nakajima nhận định ActiveGraph đặc biệt phù hợp cho các domain mà intermediate reasoning matters as much as final output:

Due diligence & research: preserve evolving structure đằng sau kết luận - claims, evidence, contradictions, risks, decisions, revisions
Legal & compliance: audit trail đầy đủ về tại sao một decision được đưa ra, evidence nào support nó
Scientific work: track mâu thuẫn giữa các sources, lineage của từng conclusion
Enterprise memory: agent dài hạn cần maintain coherent picture qua nhiều session, nhiều ngày

Tóm lại: agent nào cần output có thể trace được - memo, report, decision log - thì ActiveGraph đáng theo dõi.

Thực Trạng và Điều Chưa Chắc

ActiveGraph hiện tại chỉ là concept - chưa có code public. Nakajima tự thừa nhận: "not obvious that this architecture is 'the' answer", và ActiveGraph không phải AGI system. Các ingredients của nó - blackboard systems, event sourcing, rules engines, actor systems, reactive databases, knowledge graphs, version control - đều có lịch sử lâu dài. Câu hỏi mở là: liệu sự kết hợp này có thuộc về agent runtime layer không?

Trong bối cảnh 2026, memory đã là first-class architectural component với benchmark riêng (LoCoMo, LongMemEval, BEAM) - nhưng vẫn còn nhiều vấn đề chưa giải quyết: staleness, temporal abstraction ở scale lớn, cross-session identity. ActiveGraph không tự nhận giải quyết hết, nhưng đặt chúng trong một khung thống nhất hơn.

Kết

LLM cho chúng ta inference mạnh. Tool use cho model cách tương tác với thế giới. Real-time models cho chúng ta presence. Agent loops cho chúng ta persistence of execution. Nakajima lập luận rằng persistent agency có thể cần thêm một thứ nữa: continuity of state.

BabyAGI đã làm tasks trở nên persistent. ActiveGraph hỏi điều gì xảy ra khi toàn bộ operating reality của một agent trở thành persistent state - không phải như một feature bên trong loop, mà là substrate mà loop chạy trên đó.

Concept này xứng đáng được theo dõi. Code khi ra sẽ là lúc test thực sự bắt đầu.

via Yohei Nakajima trên X | The Future of Autonomous Agents | State of AI Agent Memory 2026