TL;DR

arXiv đang nhận ~30.000 bài/tháng - nhiều hơn bất kỳ nhà nghiên cứu nào có thể xử lý. Omar Shaikh (@omarsar0) vừa chia sẻ cách ông giải quyết bài toán này: một workflow đa agent biến luồng papers thành LLM Artifacts - các thực thể động mà ông có thể tương tác, đặt câu hỏi, và kích hoạt experiments ngay trong giao diện. Đây là bước tiến hóa tự nhiên từ LLM Wikis mà Andrej Karpathy đề xuất tháng 4/2026, chuyển từ "lưu trữ tri thức" sang "hành động trên tri thức".

Bức tranh thực tế: Không ai đọc kịp

Số liệu từ Paper Espresso - hệ thống curation đã chạy 35 tháng liên tục - cho thấy mức độ của vấn đề:

  • arXiv nhận gần 30.000 bài nộp/tháng, không có dấu hiệu chậm lại
  • Ngay cả hệ thống curation thông minh nhất cũng chỉ chọn được 2-3% có impact thực sự cao (dựa trên community upvotes từ HuggingFace Daily Papers)
  • Các topic AI có median half-life chỉ 1 tháng sau khi đạt đỉnh - tức là nếu bạn chậm hơn 4 tuần, cơ hội đã qua
  • Papers kết hợp topic mới lạ, không conventional: 2.0x upvotes so với papers thông thường

Keyword alerts, social media, RSS feeds - tất cả đều reactive: bạn phải biết mình cần tìm gì trước. Không có công cụ nào proactive theo dõi và synthesis liên tục.

Karpathy đặt viên đá đầu tiên: LLM Wiki

Tháng 4/2026, Andrej Karpathy publish gist llm-wiki.md - đạt 5.000+ stars trong vài ngày. Ý tưởng cốt lõi:

Thay vì dùng RAG (LLM re-discover từ raw sources mỗi lần query), để LLM xây dựng và duy trì một wiki markdown persistent. Mỗi lần thêm source mới, LLM không chỉ index - nó đọc, extract thông tin quan trọng, và tích hợp vào wiki đang có: cập nhật entity pages, flag mâu thuẫn, cập nhật cross-references. Tri thức được compile một lần, giữ current liên tục.

Kết quả: wiki là persistent, compounding artifact. Cross-references đã có sẵn. Mâu thuẫn đã được flag. Synthesis đã phản ánh tất cả những gì bạn đã đọc. Ở quy mô vừa phải (~100 sources, vài trăm pages), một file index.md đủ để LLM navigate mà không cần embedding-based RAG infrastructure.

Trong vòng 4 ngày, các implementation như Kompl, SwarmVault, ΩmegaWiki, Synthadoc, NEXUS xuất hiện. Community đón nhận mạnh vì nó giải quyết pain point thực: mỗi session AI mới là bắt đầu từ zero.

LLM Artifacts - bước kế tiếp: từ lưu trữ sang hành động

Omar Shaikh xây trên nền đó và tiến thêm một bước: LLM Artifacts. Workflow của ông:

  1. Automation chạy hàng ngày, curate papers từ arXiv theo personalized rules & insights
  2. Papers được index và chuyển thành LLM Wikis (searchable, reusable)
  3. Từ wiki đó, agents sinh ra Artifacts - không phải static report

Artifact là gì? Là một thực thể động mà:

  • Tương tác trực tiếp với agents
  • Có thể inject vào bất cứ lúc nào: insights mới, components, suggested experiments, action items
  • Researcher có thể đặt câu hỏi về bất kỳ paper nào và kích hoạt experiment tự động chạy background ngay từ trong artifact

Cơ sở hạ tầng phía sau là một Electron app orchestrator - giao diện để researcher click và trigger actions. Không phải single prompt, không phải single agent: nhiều proactive agents phối hợp để surface facts, knowledge, insights mà researcher có thể act on ngay.

"This is more than a visual. It's not a single prompt. It's several proactive agents coordinating to surface interesting facts, knowledge, and insights that I can act on as a researcher." - Omar Shaikh

Ai nên quan tâm ngay

Workflow này phù hợp nhất với:

  • AI researchers & academics đang đối mặt với information overload. Thay vì curate thủ công, bạn set rules một lần, automation làm phần còn lại.
  • Developers với large codebase: SwarmVault (một trong các tools trong ecosystem) compile codebase thành knowledge graph, cho AI agent bounded context packs thay vì dump 200k tokens raw files mỗi session.
  • Teams cần internal wiki sống: LLM Wiki pattern phù hợp với corpus nhỏ-vừa, chậm thay đổi, curated bởi human. Slack threads, meeting transcripts, project docs có thể trở thành wiki luôn up-to-date.

Điều khác biệt với các tool hiện tại như NotebookLM hay ChatGPT file uploads: đó là reactive (bạn upload, nó trả lời). LLM Artifacts là proactive - agents chủ động surface insights bạn chưa biết mình cần.

Những giới hạn cần biết

Pattern này còn non trẻ và có những giới hạn rõ ràng:

  • Lossy compression: wiki pages là derived content, có thể drop caveats, minority views, exact wording. Summary errors trở thành permanent trong knowledge base.
  • Update cascades: thêm một source mới có thể trigger cập nhật 10-15 pages. Ở scale lớn, đây là graph maintenance problem nghiêm túc.
  • Scale wall: tốt nhất với corpus nhỏ-vừa. Khi corpus lớn, vẫn cần RAG mechanics (vector search, chunking, reranking). Vấn đề enterprise (multi-user, permissions, audit logs) chưa được giải quyết.
  • Multi-agent overhead: coordination nhiều agents có thể tạo communication bottlenecks và tăng chi phí đáng kể.

Tiếp theo trên bản đồ

Ecosystem đang phát triển nhanh. Roadmap community đang hướng đến:

  • Routing tables thay thế index.md đơn thuần khi corpus tăng lên hàng nghìn pages
  • Local web UI, graph views, evals, và rollback/audit features cho production readiness
  • Hybrid/federated multi-agent orchestration - cân bằng giữa centralized control và decentralized flexibility
  • Standardized protocols (MCP + A2A) để agents từ các hệ thống khác nhau cộng tác

Hướng đi dài hạn: dynamic agent ecosystems tự tổ chức theo task, như human teams - không cố định topology, không cần centralized director.

Nguồn: Omar Shaikh (@omarsar0) trên X, Andrej Karpathy - llm-wiki.md, Paper Espresso (arXiv 2604.04562).