TL;DR

graphify (P1) cho agent biết dự án "trông như thế nào". Bài này nói về 2 tool còn lại: agentmemory giúp agent nhớ xuyên session với 95.2% độ chính xác truy xuất, và graphiti cho phép track fact theo thời gian qua knowledge graph bi-temporal. Kết hợp cả 3 là stack đầy đủ nhất hiện tại cho AI coding workflow.

agentmemory: Biến "Nhân Viên Mới" Thành "Nhân Viên Cũ Có Hồ Sơ"

Mỗi khi bạn mở session mới với Hermes hay Claude Code, agent quên sạch: quên convention bạn đã thống nhất, quên bug bạn vừa fix hôm qua, quên lý do tại sao bạn chọn thư viện X thay vì Y. Built-in memory như CLAUDE.md chỉ chứa được ~200 dòng và phải tự cập nhật tay.

agentmemory (17.6k GitHub stars, Apache-2.0) giải quyết điều này bằng cách chạy âm thầm ở nền, tự động capture mọi thứ agent làm qua hooks, nén thành searchable memory, và inject lại context liên quan khi session mới bắt đầu.

Ví dụ cụ thể: Session 1 bạn thiết lập JWT auth dùng jose middleware tại src/middleware/auth.ts. Session 2 bạn hỏi về rate limiting - agentmemory tự đưa lại context: "bạn đã dùng jose vì Edge compatibility, test đã cover token validation". Không cần giải thích lại.

Bên Trong agentmemory

agentmemory tổ chức memory theo 4 tầng, mô phỏng cách não người xử lý ký ức:

  • Working: tool use ngắn hạn trong session
  • Episodic: tóm tắt từng session
  • Semantic: fact và pattern tổng quát
  • Procedural: workflow và chuỗi lệnh đã hoạt động

Truy xuất dùng triple-stream hybrid search: BM25 keyword matching + vector cosine similarity + knowledge graph traversal, kết hợp qua Reciprocal Rank Fusion (k=60). Benchmark trên LongMemEval-S (500 câu hỏi): 95.2% Recall@5 và 98.6% Recall@10, so với BM25-alone là 86.2%. Trên in-house corpus (15 session thực tế): 100% top-5 hit rate, 14ms p50 latency.

Về token: built-in memory như CLAUDE.md tốn 22,000+ tokens ở 240 observations. agentmemory chỉ tốn ~1,900 tokens/session - và chi phí cả năm chỉ khoảng $10 nếu dùng cloud embedding, $0 nếu dùng local model.

agentmemory: 4-tier memory consolidation và kết nối xuyên session
agentmemory lưu memory theo 4 tầng và inject lại context liên quan khi session mới bắt đầu

Cài agentmemory

npm install -g agentmemory

Sau khi cài, tích hợp theo tài liệu plugin của từng agent (Hermes, Claude Code, Cursor, OpenCode). agentmemory expose 51 tools qua MCP, không lock-in vào bất kỳ agent cụ thể nào. Bao gồm viewer local tại port 3113 để xem live memory building và replay từng session.

Lưu ý quan trọng: chất lượng truy xuất phụ thuộc embedding model. Với local model nhẹ, độ chính xác sẽ thấp hơn benchmark. Để đạt 95.2% R@5 cần embedding model tốt.

graphiti: Knowledge Graph Theo Thời Gian

agentmemory ghi nhớ "agent đã làm gì". Nhưng nếu bạn cần biết "fact này đúng từ khi nào, thay đổi lúc nào, do ai nói" - đặc biệt trong knowledge base thay đổi liên tục hoặc dự án dài hạn - thì cần graphiti.

graphiti (26.5k stars, đạt 20,000 stars trong 14 tháng, Apache-2.0) là temporal knowledge graph engine của Zep. Điểm khác biệt chính so với GraphRAG và RAG truyền thống:

  • Bi-temporal fact: mỗi fact có validity window - khi thay đổi, fact cũ bị invalidate (không xóa), vẫn query được "trạng thái lúc T"
  • Full provenance: mọi entity, relationship đều trace ngược về raw episode (dữ liệu gốc)
  • Sub-second latency: so với GraphRAG mất vài giây đến vài chục giây
  • Incremental update: không cần recompute toàn bộ graph khi thêm dữ liệu mới
graphiti temporal knowledge graph: fact thay đổi theo thời gian
graphiti track fact theo thời gian - khi fact thay đổi, fact cũ grayed out nhưng vẫn query được

MCP Server 1.0 của graphiti đã ra mắt và có hàng trăm nghìn weekly users. Bạn cài MCP server, cấu hình vào Hermes hoặc bất kỳ agent hỗ trợ MCP, là agent có thể đọc và ghi vào knowledge graph của bạn trực tiếp. Hỗ trợ FalkorDB, Neo4j, Kuzu làm graph database backend.

Lưu ý: graphiti nặng hơn 2 tool trên. Cần cài đặt graph database backend, không phải plug-and-play ngay. Nếu chỉ cần "nhớ session trước làm gì", agentmemory đơn giản hơn nhiều.

Kết Hợp Cả Ba: Stack Đầy Đủ

Mỗi tool giải quyết một vấn đề khác nhau, không overlap:

  • graphify: bản đồ tĩnh của dự án - "đây trông như thế nào"
  • agentmemory: lịch sử làm việc - "hôm qua mình đã làm gì"
  • graphiti: knowledge động theo thời gian - "fact X đúng từ khi nào"

Workflow được đề xuất theo mức độ phức tạp:

  1. Người mới / dự án cá nhân: cài graphify trước. 10 phút setup, thu lợi ngay từ lần đầu dùng.
  2. Dùng agent hàng ngày: thêm agentmemory. Kết hợp bản đồ dự án + bộ nhớ session = agent hoạt động như nhân viên cũ thực sự.
  3. Team / dự án dài hạn / cần audit nguồn: thêm graphiti. Nặng nhất, nhưng cho khả năng track knowledge evolution mà 2 tool kia không có.

Có thêm: graphify repository đang có Issue #152 thảo luận tích hợp agentmemory đọc trực tiếp graph.json - kết hợp bản đồ cấu trúc với lịch sử làm việc thành một layer duy nhất.

Kết

Ba tool này giải quyết đúng 3 điểm yếu cốt lõi của AI agent trong môi trường thực tế: thiếu hiểu biết cấu trúc, thiếu bộ nhớ xuyên session, và thiếu khả năng track knowledge thay đổi theo thời gian. Cả 3 đều open-source, battle-tested với hàng chục nghìn stars và community đang phát triển mạnh.

Bắt đầu với graphify, cảm nhận sự khác biệt trong 10 phút đầu tiên.

via GitHub safishamsi/graphifyvia GitHub rohitg00/agentmemoryvia GitHub getzep/graphiti