TL;DR

Notion lưu hàng trăm note nhưng các note đó hoàn toàn cô lập. AI trả lời từ đầu mỗi lần bạn hỏi, không nhớ gì từ lần trước. Dữ liệu nằm trên server của người khác - một ngày dịch vụ đóng cửa, tất cả biến mất. Hệ thống Hermes Agent + Obsidian + LLM Wiki giải quyết cả 3 bài toán này, hoàn toàn tự động, 100% local. Pipeline cực đơn giản: tài liệu đưa vào là tự thành mạng lưới kiến thức liên kết.

Ba vấn đề quen thuộc

Bạn thấy một bài viết hay trên mạng. Copy paste vào Notion. Hai tuần sau muốn tìm lại, lục lọc mãi không ra.

Notion chứa vài trăm bài nhưng các note hoàn toàn cô lập. Bạn không biết một khái niệm đã xuất hiện ở bao nhiêu chỗ khác nhau, không biết các note liên quan đến nhau như thế nào. Mỗi lần hỏi AI, nó bắt đầu từ đầu, tạm thời ráp nối câu trả lời mà không có bộ nhớ gì từ lần trước - token tốn nửa, kết quả bằng không về mặt tích lũy.

Và toàn bộ dữ liệu đang nằm trên server của người khác. Dịch vụ tắt, dữ liệu mất.

Roland.W - tiến sĩ y học và kinh tế học, tác giả Sách trắng AI cho doanh nghiệp Trung Quốc - đã đặt ra bộ câu hỏi này rồi xây dựng một hệ thống giải quyết cả ba.

Giải pháp: ba công cụ, một pipeline

LLM Wiki architecture diagram - ba lớp kiến trúc và ba thao tác cốt lõi

Kiến trúc LLM Wiki: Raw Sources → Wiki (LLM) → Schema, ba thao tác Ingest/Query/Lint và phân công vai trò người-AI

Pipeline hoạt động theo chuỗi thẳng: Tài liệu → AI chỉnh lý → Wiki tạo ra → Liên kết hai chiều. Toàn bộ không cần thao tác thủ công trên GUI. File ném vào là tự thành mạng.

Ba công cụ, ba vai trò:

  • Hermes Agent: engine tự động hóa - nhận lệnh, trích xuất kiến thức, tạo file theo chuẩn LLM Wiki

  • LLM Wiki: chuẩn cấu trúc file - định nghĩa cách tổ chức kiến thức

  • Obsidian: lớp hiển thị - trực quan hóa mạng lưới bằng liên kết hai chiều và Graph View

Obsidian - lớp hiển thị

Obsidian là công cụ ghi chú local với liên kết hai chiều, miễn phí hoàn toàn, chạy trên Windows, Mac và Linux. Đến năm 2026, Obsidian đã có hơn 1,5 triệu người dùng với mức tăng trưởng 22%/năm.

Tính năng cốt lõi là liên kết hai chiều. Trong note bạn gõ [[Claude-Code-Note]], Obsidian tự chuyển thành link tím. Nếu note đó tồn tại, click là nhảy qua. Nếu chưa có, click là tạo mới. Không cần duy trì thủ công.

Graph View chuyển toàn bộ note và các liên kết thành biểu đồ trực quan. Một cái nhìn là thấy cấu trúc kiến thức: node nào là đảo cô lập, node nào là trung tâm kết nối. Roland.W chia sẻ ảnh graph view của bộ Hermes + LLM Wiki mới setup - phần dày đặc nhất ở cuối biểu đồ là toàn bộ wiki vừa được AI xây dựng.

Tất cả dữ liệu đều ở local. Không upload lên bất kỳ server nào.

LLM Wiki - chuẩn cấu trúc kiến thức

LLM Wiki không phải ứng dụng độc lập. Đây là một bộ chuẩn cấu trúc file - định nghĩa cách tổ chức knowledge base để AI có thể tự xây và duy trì nó theo thời gian.

Ý tưởng cốt lõi xuất phát từ Andrej Karpathy: thay vì RAG truyền thống mỗi lần query lại bắt đầu từ đầu, LLM tích lũy tăng dần một wiki có cấu trúc từ tài liệu của bạn. Kiến thức được compile một lần và duy trì liên tục.

Cấu trúc file tiêu chuẩn:

knowledge_base/
├── raw/sources/     # Tài liệu gốc (không sửa)
├── wiki/entities/   # Thực thể: người, tool, dự án
├── wiki/concepts/   # Khái niệm: phương pháp, nguyên lý
├── wiki/index.md    # Catalog - entry point cho LLM
└── wiki/log.md      # Nhật ký cập nhật

Mỗi lần tài liệu mới được nhập, wiki không chỉ index mà thật sự hiểu: trích thực thể, khái niệm, quan hệ, rồi tạo hoặc cập nhật các trang wiki tương ứng. Các trang được lưu local. Mâu thuẫn giữa các tài liệu được đánh dấu.

LLM Wiki knowledge graph - mạng lưới thực thể và khái niệm

Knowledge graph trong LLM Wiki: 49 trang, 84 liên kết - node màu phân loại Entity, Concept, Source, Query

nashsu - tác giả LLM Wiki app - đã implement Karpathy's pattern thành desktop app đầy đủ với nhiều cải tiến: 2-step Chain-of-Thought ingest (phân tích trước, generate sau), 4-Signal Knowledge Graph, SHA256 incremental cache (file không đổi thì skip, tiết kiệm token), và Chrome extension để clip bài web tự động.

Tại sao khác với RAG?

RAG truyền thống: mỗi query → retrieve từ raw documents → generate từ đầu. Không tích lũy. Mỗi lần đều là "tạm thời ráp nối".

LLM Wiki: tài liệu được compile một lần thành wiki có cấu trúc → mọi query sau đều dựa trên wiki đã tích lũy. Khi bạn nhập tài liệu thứ 50, AI không cần đọc lại 49 tài liệu trước - nó đã ở trong wiki rồi.

Phần 2 sẽ đi vào chi tiết Hermes Agent - engine tự động hóa toàn bộ quá trình, hướng dẫn cài đặt từng bước và 3 rules đơn giản để vận hành hệ thống.

Nguồn

via LLM Wiki - nashsu/llm_wiki | Hermes Agent - NousResearch