TL;DR

Ngày 2 tháng 4 năm 2026, Andrej Karpathy đăng lên X mô tả cách anh dừng dùng AI để viết code và bắt đầu dùng AI để xây dựng knowledge base. 18.7 triệu views, 41k+ bookmarks. GitHub Gist đạt 5,000+ stars trong vài ngày.

Ý tưởng cốt lõi: đừng để AI tìm kiếm thông tin mỗi lần hỏi - hãy để AI xây dựng và duy trì một wiki ngày càng thông minh hơn. Ba thư mục, một file hướng dẫn, setup dưới 30 phút.

Vì sao mọi "second brain" đều chết sau 2 tuần

Notion, Obsidian, Roam - bạn bắt đầu với đầy nhiệt huyết rồi bỏ quên. Đây không phải vấn đề của bạn. Đây là vấn đề thiết kế.

Điểm thất bại luôn nằm ở maintenance: không ai duy trì hệ thống quá tuần thứ hai vì chi phí tổ chức kiến thức cao hơn giá trị truy xuất được. Cập nhật cross-references, giữ summaries current, ghi nhận khi thông tin mới mâu thuẫn với cũ - đây là việc buồn tẻ mà human không chịu làm lâu dài.

Mọi AI tool hiện tại vẫn mắc cùng lỗi: NotebookLM, ChatGPT uploads, Notion AI đều retrieve at query time. Session kết thúc là reset. AI không bao giờ thực sự tích lũy hiểu biết về domain của bạn.

Karpathy đã tìm ra điều gì

Câu hỏi anh đặt ra: Thay vì để AI xử lý raw sources mỗi lần hỏi, tại sao không để AI compile chúng một lần và duy trì kết quả đó mãi mãi?

Kết quả là pattern "LLM Wiki": một tập hợp file Markdown có liên kết, nằm giữa bạn và raw sources. Mỗi lần thêm nguồn mới, AI đọc, trích xuất thông tin quan trọng, tích hợp vào wiki - cập nhật entity pages, revise summaries, flag mâu thuẫn. Kiến thức được compile một lần rồi giữ mãi, không reset theo session.

Wiki của Karpathy về một topic duy nhất phát triển đến ~100 bài viết và 400,000 từ mà anh không tự viết một chữ nào. AI làm toàn bộ: viết, link, categorize, và kiểm tra consistency.

pasted image

Kiến trúc 3 thư mục (setup 5 phút)

second-brain/
├── raw/      (nơi dump mọi thứ)
├── wiki/     (AI viết và duy trì)
├── outputs/  (báo cáo và câu trả lời)
└── CLAUDE.md (hướng dẫn vận hành)

raw/: meeting notes, article clips, competitor screenshots, briefs, SOPs, podcast transcripts, email threads. Không rename, không organize - chỉ dump. Append-only, AI đọc nhưng không bao giờ sửa.

wiki/: territory của AI. Nó đọc raw/, xác định topics, tạo organized articles, link lại, duy trì index. Bạn không bao giờ chỉnh bằng tay.

outputs/: mọi câu trả lời AI tạo ra khi bạn query - briefings, comparisons, decision frameworks. Mỗi output feeds back vào future answers.

File CLAUDE.md là thứ phân biệt hệ thống thông minh với hệ thống tệ. Nó nói cho AI biết knowledge base của bạn về gì, cách cấu trúc, và rules cần tuân theo. Không có file này, AI improvise mỗi lần và output quality dao động khủng khiếp. Với nó, mọi interaction đều theo framework decision-making của bạn.

Ai nên dùng ngay

Nhóm

Use case

Lợi ích

Product Managers

Stakeholder memory - meeting notes tích lũy thành page về preferences của CTO

Vào meeting biết trước objections sắp tới

Weekend builders

Dump planning notes cuối session, resume trong 5 phút

Không mất 60 phút vào trạng thái mỗi cuối tuần

Founders/SMB

Strategy notes, briefs, competitor research tập trung một chỗ

$20/tháng thay $5,000-15,000/tháng fractional CoS

Researchers

50+ papers ingest với contradiction detection tự động

Connections nổi lên mà human bỏ qua

Engineers

Debug notes - AI build page per problem type

Query trước khi debug từ đầu khi bug quay lại

Sau 30 ngày dùng đều, hệ thống thường đạt 50-80 interconnected pages. Compounding effect bắt đầu: hỏi một câu và wiki trả lời với thứ bạn đã quên mình biết - note từ hai tháng trước xuất hiện để giải quyết vấn đề hôm nay.

Karpathy nêu thẳng use case business: "internal wiki maintained by LLMs, fed by Slack threads, meeting transcripts, project documents, customer calls. The wiki stays current because the LLM does the maintenance that no one on the team wants to do."

Giới hạn thực tế và bước tiếp theo

Hệ thống hoạt động tốt với cá nhân và small team. Những limitations cần biết:

  • Context window ceiling: index.md có thể vượt context window khi wiki qua vài trăm articles - lúc đó cần RAG retrieval layer.

  • Lossy compression: LLM rewrite raw docs có thể drop caveats, edge cases. Lỗi ở article đầu backlink vào article sau. Human review cần thiết nếu accuracy quan trọng.

  • Không enterprise-ready: thiếu permissions, multi-user edits, audit logs, concurrent queries.

Cộng đồng đã build nhiều tool mở rộng pattern này: SwarmVault (50+ formats, 48 AI coding agents, MIT, offline via Ollama), Kompl (NLP pre-processing để giảm noise), Synthadoc (YouTube ingest, web search fan-out, zero-API-key với Claude Code). Hướng đang phát triển: multimodal wikis, team deployment, hybrid RAG+graph để vượt context window limit.

Pattern này không phải product hoàn chỉnh - là ý tưởng cốt lõi để bạn adapt. Karpathy mô tả gist của mình là "idea file" để copy-paste vào bất kỳ AI agent nào, agent sẽ build specifics cùng với bạn.

Ba thư mục. Một file hướng dẫn. Bắt đầu với 15 phút dump tài liệu bạn đã có.

Via: llm-wiki GitHub Gist, CodersEra, Aakash Gupta.