- Notion chứa hàng trăm note nhưng các note hoàn toàn cô lập, AI trả lời từ đầu mỗi lần hỏi và token lãng phí một nửa, dữ liệu trên cloud của người khác dịch vụ tắt là mất.
- Hệ thống Hermes Agent + Obsidian + LLM Wiki giải quyết cả 3 bài toán này: hoàn toàn tự động, dữ liệu 100% local, kiến thức tích lũy không bắt đầu lại từ đầu.
- Pipeline chỉ có một câu lệnh: tài liệu đưa vào là tự thành mạng lưới liên kết.
TL;DR
Notion lưu hàng trăm note nhưng các note đó hoàn toàn cô lập. AI trả lời từ đầu mỗi lần bạn hỏi, không nhớ gì từ lần trước. Dữ liệu nằm trên server của người khác - một ngày dịch vụ đóng cửa, tất cả biến mất. Hệ thống Hermes Agent + Obsidian + LLM Wiki giải quyết cả 3 bài toán này, hoàn toàn tự động, 100% local. Pipeline cực đơn giản: tài liệu đưa vào là tự thành mạng lưới kiến thức liên kết.
Ba vấn đề quen thuộc
Bạn thấy một bài viết hay trên mạng. Copy paste vào Notion. Hai tuần sau muốn tìm lại, lục lọc mãi không ra.
Notion chứa vài trăm bài nhưng các note hoàn toàn cô lập. Bạn không biết một khái niệm đã xuất hiện ở bao nhiêu chỗ khác nhau, không biết các note liên quan đến nhau như thế nào. Mỗi lần hỏi AI, nó bắt đầu từ đầu, tạm thời ráp nối câu trả lời mà không có bộ nhớ gì từ lần trước - token tốn nửa, kết quả bằng không về mặt tích lũy.
Và toàn bộ dữ liệu đang nằm trên server của người khác. Dịch vụ tắt, dữ liệu mất.
Roland.W - tiến sĩ y học và kinh tế học, tác giả Sách trắng AI cho doanh nghiệp Trung Quốc - đã đặt ra bộ câu hỏi này rồi xây dựng một hệ thống giải quyết cả ba.
Giải pháp: ba công cụ, một pipeline

Kiến trúc LLM Wiki: Raw Sources → Wiki (LLM) → Schema, ba thao tác Ingest/Query/Lint và phân công vai trò người-AI
Pipeline hoạt động theo chuỗi thẳng: Tài liệu → AI chỉnh lý → Wiki tạo ra → Liên kết hai chiều. Toàn bộ không cần thao tác thủ công trên GUI. File ném vào là tự thành mạng.
Ba công cụ, ba vai trò:
Hermes Agent: engine tự động hóa - nhận lệnh, trích xuất kiến thức, tạo file theo chuẩn LLM Wiki
LLM Wiki: chuẩn cấu trúc file - định nghĩa cách tổ chức kiến thức
Obsidian: lớp hiển thị - trực quan hóa mạng lưới bằng liên kết hai chiều và Graph View
Obsidian - lớp hiển thị
Obsidian là công cụ ghi chú local với liên kết hai chiều, miễn phí hoàn toàn, chạy trên Windows, Mac và Linux. Đến năm 2026, Obsidian đã có hơn 1,5 triệu người dùng với mức tăng trưởng 22%/năm.
Tính năng cốt lõi là liên kết hai chiều. Trong note bạn gõ [[Claude-Code-Note]], Obsidian tự chuyển thành link tím. Nếu note đó tồn tại, click là nhảy qua. Nếu chưa có, click là tạo mới. Không cần duy trì thủ công.
Graph View chuyển toàn bộ note và các liên kết thành biểu đồ trực quan. Một cái nhìn là thấy cấu trúc kiến thức: node nào là đảo cô lập, node nào là trung tâm kết nối. Roland.W chia sẻ ảnh graph view của bộ Hermes + LLM Wiki mới setup - phần dày đặc nhất ở cuối biểu đồ là toàn bộ wiki vừa được AI xây dựng.
Tất cả dữ liệu đều ở local. Không upload lên bất kỳ server nào.
LLM Wiki - chuẩn cấu trúc kiến thức
LLM Wiki không phải ứng dụng độc lập. Đây là một bộ chuẩn cấu trúc file - định nghĩa cách tổ chức knowledge base để AI có thể tự xây và duy trì nó theo thời gian.
Ý tưởng cốt lõi xuất phát từ Andrej Karpathy: thay vì RAG truyền thống mỗi lần query lại bắt đầu từ đầu, LLM tích lũy tăng dần một wiki có cấu trúc từ tài liệu của bạn. Kiến thức được compile một lần và duy trì liên tục.
Cấu trúc file tiêu chuẩn:
knowledge_base/
├── raw/sources/ # Tài liệu gốc (không sửa)
├── wiki/entities/ # Thực thể: người, tool, dự án
├── wiki/concepts/ # Khái niệm: phương pháp, nguyên lý
├── wiki/index.md # Catalog - entry point cho LLM
└── wiki/log.md # Nhật ký cập nhậtMỗi lần tài liệu mới được nhập, wiki không chỉ index mà thật sự hiểu: trích thực thể, khái niệm, quan hệ, rồi tạo hoặc cập nhật các trang wiki tương ứng. Các trang được lưu local. Mâu thuẫn giữa các tài liệu được đánh dấu.

Knowledge graph trong LLM Wiki: 49 trang, 84 liên kết - node màu phân loại Entity, Concept, Source, Query
nashsu - tác giả LLM Wiki app - đã implement Karpathy's pattern thành desktop app đầy đủ với nhiều cải tiến: 2-step Chain-of-Thought ingest (phân tích trước, generate sau), 4-Signal Knowledge Graph, SHA256 incremental cache (file không đổi thì skip, tiết kiệm token), và Chrome extension để clip bài web tự động.
Tại sao khác với RAG?
RAG truyền thống: mỗi query → retrieve từ raw documents → generate từ đầu. Không tích lũy. Mỗi lần đều là "tạm thời ráp nối".
LLM Wiki: tài liệu được compile một lần thành wiki có cấu trúc → mọi query sau đều dựa trên wiki đã tích lũy. Khi bạn nhập tài liệu thứ 50, AI không cần đọc lại 49 tài liệu trước - nó đã ở trong wiki rồi.
Phần 2 sẽ đi vào chi tiết Hermes Agent - engine tự động hóa toàn bộ quá trình, hướng dẫn cài đặt từng bước và 3 rules đơn giản để vận hành hệ thống.
Nguồn
via LLM Wiki - nashsu/llm_wiki | Hermes Agent - NousResearch
