vibe working & agentic AI

// Posts#rag

#5012026-05-06

Firecrawl Agent: Bỏ Qua Pipeline RAG, Chỉ Cần URL + Câu Hỏi

Firecrawl Agent endpoint cho phép truyền URL + câu hỏi tự nhiên và nhận về grounded answer ngay lập tức - không cần scrape, chunk, embed hay vector DB. Agent chạy với 2 model: spark-1-mini (giảm 60% chi phí) và spark-1-pro cho nghiên cứu phức tạp. Pricing: Free 1,000 credits/tháng; Standard $83/tháng với 100,000 credits và 500 req/min. Đang ở Preview stage với 5 lượt chạy miễn phí mỗi ngày.

firecrawlai-agentweb-scraping

5 phút đọc

#3982026-04-25

Cognee: open-source memory layer đưa AI agents thoát khỏi 'mất trí' sau mỗi session

Cognee thay RAG bằng pipeline ECL (Extract, Cognify, Load) + Memify, biến dữ liệu thành knowledge graph lai vector — chạy trong 6 dòng code, đạt ~90% accuracy so với ~60% của RAG, vừa gọi $7.5M seed.

cogneeai-agentsknowledge-graph

7 phút đọc

#3192026-04-18

LLM Wiki: Khi Karpathy dạy AI tích lũy kiến thức thay vì chỉ tra cứu

Ngày 2/4/2026, Andrej Karpathy công bố pattern LLM Wiki - tweet đạt 16 triệu lượt xem, GitHub gist 5.000+ stars trong vài ngày. Pattern này giải quyết điểm mù lớn nhất của RAG: kiến thức biến mất sau mỗi phiên. LLM Wiki biến AI thành công cụ tích lũy tri thức - 1 nguồn có thể cập nhật 10-15 trang wiki liên kết, và wiki của Karpathy đã đạt 100 bài viết, 400.000 từ trên một chủ đề nghiên cứu duy nhất.

llm-wikikarpathyrag

7 phút đọc

#2352026-04-02

LLM Wiki của Karpathy: Khi AI Trở Thành Người Quản Lý Kiến Thức Của Bạn

Ngày 2/4/2026, Andrej Karpathy công bố "LLM Knowledge Bases" - pattern dùng AI xây dựng wiki markdown tự duy trì, đạt 16 triệu views và 5,000 GitHub stars chỉ trong vài ngày. Wiki của ông đạt ~100 bài viết, ~400,000 từ mà không cần tự viết một chữ. Pattern này cắt giảm token consumption lên đến 95% so với RAG thông thường và hoạt động hoàn toàn không cần vector database.

llm-wikikarpathyknowledge-base

7 phút đọc

#2012026-03-19

LiteParse: parser PDF mã nguồn mở của LlamaIndex chạy local, không cần LLM

LlamaIndex vừa open-source LiteParse — CLI Node.js parse PDF, Office, ảnh ngay trên máy bằng thuật toán grid projection thuần heuristic. Không VLM, không API key, không GPU. Chạy mili-giây mỗi trang nhưng vẫn giữ được layout đa cột và bảng nguyên vẹn cho LLM đọc.

liteparsellamaindexpdf-parsing

8 phút đọc

#1802026-03-06

Awesome LLM Apps: Kho 100+ Template AI Agent & RAG Hot Nhất GitHub với 111k Stars

Awesome LLM Apps đạt 111k stars và 16.4k forks trên GitHub - kho template AI Agent & RAG lớn nhất hiện tại. 100+ app production-ready chạy được ngay trong 30 giây, 13 danh mục từ Starter Agents đến Voice AI và MCP. Provider-agnostic: switch giữa Claude, Gemini, GPT, Llama, Qwen, xAI chỉ bằng một thay đổi config. Apache-2.0 license, miễn phí hoàn toàn, không paywall.

llmai-agentrag

6 phút đọc

3632026-03-03

Kỷ Nguyên Multi-Agent: Building the Model Không Còn Là Thách Thức Khó Nhất

Agentic RAG tốn 3-10x token và 2-5x latency so với one-pass RAG, đẩy latency p95 lên tới 10-15 giây. Model performance giảm sau 32.000 tokens dù context window có thể lên đến hàng triệu. Tối ưu KV-cache giảm chi phí 10x nhờ tỷ lệ 100:1 input-to-output token. Context engineering đang thay thế prompt engineering làm kỹ năng cốt lõi của AI developer.

multi-agentcontext-engineeringrag

6 phút đọc

#1622026-02-20

10 Kiến trúc RAG cho Enterprise AI 2026: Từ Naive RAG đến Agentic Graph RAG

Hybrid RAG kết hợp vector + BM25 là baseline production mặc định cho enterprise 2026. GraphRAG outperform Hybrid khi queries phụ thuộc relationship giữa entities. Agentic RAG xử lý multi-hop nhưng tốn 3-10x token và latency p50 = 4-8 giây. Lựa chọn kiến trúc RAG sai là lý do chính khiến dự án GenAI enterprise thất bại sau giai đoạn demo.

ragai-engineeringllm

8 phút đọc

#1492026-02-02

10 Kiến trúc RAG cho Enterprise AI 2026: Từ Naive RAG đến Agentic Graph RAG

ragai-engineeringllm

8 phút đọc

Featured#1312026-01-19

MCP, RAG & Skills: 3 trụ cột context của mọi AI Agent 2026

Ba mảnh ghép không thay thế nhau mà cộng gộp: MCP chuẩn hoá việc gọi tool, RAG nạp kiến thức ngoài training, Skills cắt prompt bloat bằng progressive disclosure. Đây là cách chúng khớp với nhau trong một agent hiện đại.

ai-agentsmcprag

7 phút đọc

Firecrawl Agent: Bỏ Qua Pipeline RAG, Chỉ Cần URL + Câu Hỏi

Cognee: open-source memory layer đưa AI agents thoát khỏi 'mất trí' sau mỗi session

LLM Wiki: Khi Karpathy dạy AI tích lũy kiến thức thay vì chỉ tra cứu

LLM Wiki của Karpathy: Khi AI Trở Thành Người Quản Lý Kiến Thức Của Bạn

LiteParse: parser PDF mã nguồn mở của LlamaIndex chạy local, không cần LLM

Awesome LLM Apps: Kho 100+ Template AI Agent &amp; RAG Hot Nhất GitHub với 111k Stars

Kỷ Nguyên Multi-Agent: Building the Model Không Còn Là Thách Thức Khó Nhất

10 Kiến trúc RAG cho Enterprise AI 2026: Từ Naive RAG đến Agentic Graph RAG

10 Kiến trúc RAG cho Enterprise AI 2026: Từ Naive RAG đến Agentic Graph RAG

MCP, RAG & Skills: 3 trụ cột context của mọi AI Agent 2026

Awesome LLM Apps: Kho 100+ Template AI Agent & RAG Hot Nhất GitHub với 111k Stars