TL;DR

Andrej Karpathy vừa publish một GitHub gist đơn giản đến mức đáng kinh ngạc - và nó thay đổi cách chúng ta dùng AI mãi mãi. Ý tưởng: thay vì để AI tìm kiếm lại từ đống file mỗi khi hỏi, hãy để nó xây và duy trì một wiki markdown liên kết - tích lũy, cập nhật, và thông minh hơn theo thời gian.

Kết hợp với Obsidian và Claude Code, bạn có một AI second brain thực sự hoạt động: nhớ mọi quyết định bạn đã đưa ra, kết nối các ý tưởng rời rạc, và trả lời câu hỏi từ chính ghi chú của bạn - không bịa, không hallucinate từ training data.

  • Gist gốc: llm-wiki.md của Andrej Karpathy - 14,000 sao trong 1 tuần
  • Setup time: 5 phút
  • Chi phí: Obsidian miễn phí, Claude Code ~2-5 USD/tháng cho workflow hàng ngày
  • Ai dùng được: Developer, researcher, writer, business professional - bất kỳ ai xử lý nhiều thông tin

Vấn Đề Bạn Đang Gặp

Bạn đã bao giờ bực mình vì điều này chưa: mỗi lần mở chat mới với AI, bạn phải giải thích lại context từ đầu. Dự án X đang ở giai đoạn nào, bạn đã quyết định gì tuần trước, kiến trúc hệ thống ra sao... Cứ phải re-prompt. Cứ phải bắt đầu từ zero.

Đây là hạn chế cơ bản của hầu hết hệ thống AI hiện tại - bao gồm cả RAG, NotebookLM, ChatGPT file uploads. Chúng hoạt động theo mô hình: upload file - LLM tìm kiếm đoạn liên quan - trả lời - quên ngay. Không có tích lũy. Không có bộ nhớ thực sự.

Karpathy gọi đây là "rediscovering knowledge from scratch on every question" - và ông đã thiết kế một giải pháp khác hoàn toàn.

LLM Wiki Pattern Là Gì

Andrej Karpathy - đồng sáng lập OpenAI, cựu giám đốc AI tại Tesla - publish gist llm-wiki.md ngày 4 tháng 4 năm 2026. Ý tưởng lấy cảm hứng từ khái niệm "Memex" của Vannevar Bush năm 1945: một kho kiến thức cá nhân với các liên kết liên tưởng giữa tài liệu.

Điểm khác biệt cốt lõi so với RAG:

"Instead of just retrieving from raw documents at query time, the LLM incrementally builds and maintains a persistent wiki. The knowledge is compiled once and then kept current, not re-derived on every query."

Nói đơn giản: thay vì AI là cái máy tìm kiếm, AI trở thành người biên tập wiki của bạn - đọc nguồn mới, cập nhật trang liên quan, ghi nhận mâu thuẫn, và duy trì tất cả nhất quán. Bạn chỉ cần đặt câu hỏi vào cái wiki đã được tổng hợp sẵn - không cần tìm kiếm lại từ đầu.

Kiến Trúc 3 Lớp

Hệ thống có 3 lớp tách biệt rõ ràng:

LớpNội dungAi quản lý
Raw sourcesFile gốc: bài viết, paper, transcript, notes - bất biếnBạn
WikiMarkdown pages: summary, entity pages, concept pages, cross-referencesLLM viết và duy trì
Schema (CLAUDE.md)Config định nghĩa cấu trúc wiki, quy ước, workflowBạn + LLM cùng phát triển

Ngoài ra có 2 file đặc biệt: index.md (catalog tất cả pages, LLM cập nhật mỗi lần ingest) và log.md (lịch sử append-only các thao tác - dùng grep "^## \[" log.md | tail -5 để xem 5 entry gần nhất).

Ba thao tác chính:

  • Ingest: Drop file vào raw collection, LLM đọc, tổng hợp, cập nhật 10-15 wiki pages liên quan
  • Query: Hỏi wiki (đã được tổng hợp sẵn) - chất lượng trả lời tốt hơn vì context đã có cấu trúc
  • Lint: Kiểm tra sức khỏe wiki - tìm mâu thuẫn, orphan pages, cross-reference thiếu, claim lỗi thời

Cài Đặt Trong 5 Phút

Bước 1: Tải Obsidian tại obsidian.md - miễn phí, local-first, lưu file dưới dạng .md thuần túy. Tạo một Vault (thực chất là một folder trên máy).

Bước 2: Cài Claude Code - yêu cầu Node.js và Anthropic API key:

npm install -g @anthropic-ai/claude-code

Mở terminal, cd vào folder Vault của Obsidian, chạy claude.

Bước 3: Paste system prompt của Karpathy vào Claude Code. Copy từ gist gốc. Claude sẽ tạo cấu trúc wiki ban đầu và hướng dẫn bạn nhập dữ liệu đầu tiên.

Bước 4: Nhập dữ liệu đầu tiên. Export notes từ Notion (CSV), copy bài viết đã viết, dump transcript, thêm bookmarks. Vault rỗng không có giá trị - bắt đầu với ít nhất 5-10 file là đủ để thấy hệ thống hoạt động.

Tip quan trọng: Cài Obsidian Web Clipper - extension Chrome cho phép clip bài web thành markdown vào vault với 1 click. Sau đó nói với Claude Code: "Tôi vừa thêm bài [X] vào Obsidian, hãy ingest vào wiki."

Workflow Thực Tế Đáng Dùng Nhất

Dưới đây là 5 workflow đã được kiểm chứng, cho thấy hệ thống này vượt xa một notes app bình thường:

  • Weekly review tự động: "Tóm tắt daily notes tuần này, nhóm theo project, highlight quyết định và action items." Claude đọc 5-7 notes, tạo 1 trang review - thay thế 30 phút làm thủ công.
  • Project brief tức thì: "Đọc tất cả notes tagged 'project-alpha', tạo project brief gồm goals, decisions, open questions." Từ 1 giờ viết từ đầu xuống còn 10 phút chỉnh sửa.
  • Knowledge Q&A: "Tôi đã quyết định gì về database schema của project-alpha?" Claude tìm, đọc, trích dẫn từ chính notes của bạn - không bịa.
  • Meeting notes sang action items: Dump transcript raw vào vault. Claude parse, xác định ai cam kết gì, tạo file action-items có deadline.
  • Chuẩn bị meeting: "Chuẩn bị cho cuộc gọi 14h với [Client]." Claude scan vault, pull context liên quan, tạo briefing doc với open questions từ các buổi trước.

Hạn Chế Cần Biết Trước

Đây không phải hệ thống hoàn hảo. Một số gotcha thực tế:

  • Token cost tăng theo vault size: Scan 20 notes không lọc = tới 50,000 tokens. Dùng MCP bridge khi vault vượt 500 notes. Trên 2,000 notes: chậm và đắt với direct file access. Trên 5,000 notes: nên split thành active/archive vault.
  • Sync conflict: Claude Code viết file trong khi Obsidian đang mở = conflict. Workaround: dùng Claude Code cho read-heavy tasks, Obsidian cho write/link tasks. Đóng Obsidian trước khi Claude tạo/sửa file.
  • Wikilinks mismatch: Claude mặc định dùng standard Markdown links, Obsidian dùng [[wikilinks]]. Thêm rule vào CLAUDE.md: "Use [[wikilinks]] for internal note references."
  • Lossy compression risk: AI tóm tắt có thể bỏ sót caveats, minority views, edge cases. Với decision-critical information, luôn giữ raw sources và cross-check.
  • Không có native memory: Claude Code không nhớ giữa các session. Continuity đến từ session logs được lưu vào vault - đọc log trước mỗi session mới để khôi phục context.

Tiếp Theo Của Trend Này

Sau khi gist của Karpathy viral, cộng đồng open-source đã cho ra đời hàng chục công cụ chỉ trong vài tuần: SwarmVault (v3.1.0 với 48 agent integrations), ΩmegaWiki (23 Claude Code skills), Keppi (graph traversal thay semantic search), llmwiki-cli, WikiLoom, Kompl.

Roadmap của trend này đang hướng đến: graph traversal thay thế semantic search; multi-agent coordination (nhiều AI cùng dùng 1 wiki mà không ghi đè nhau); multimodal ingestion liên tục (voice via Whisper, ảnh via Claude vision, CSV/PPTX/DOCX); và provenance tracking để chống hallucination (mỗi claim trace được về đúng đoạn nguồn gốc).

Ba thứ hội tụ đúng lúc tạo ra trend này: Obsidian đạt 1.5 triệu users (local-first markdown), Claude Code có MCP support (đọc folder chuẩn hóa), và Karpathy validate pattern bằng uy tín cá nhân. Đây không phải hype - đây là permission để stop xây RAG pipeline phức tạp và chỉ cần để AI đọc file của bạn.

Nguon: Karpathy llm-wiki.md, Code With Seb, MindStudio.