GraphGen: Sinh Dữ Liệu Huấn Luyện LLM từ Knowledge Graph
GraphGen là framework open-source tạo synthetic training data cho LLM từ knowledge graph, dùng ECE metric để nhắm vào knowledge gap cụ thể. Benchmark với Qwen2.5-7B: +15.5 điểm AIME25 (toán), +14.4 điểm SeedBench (nông nghiệp), +6.7 điểm GPQA-Diamond so với baseline tốt nhất. Sinh ~50,000 samples trong 2 giờ trên 8 A100, output đa dạng hơn 59% (MTLD 75.8 vs 47.6). Apache 2.0, cài bằng uv pip install graphg.
Cognee: open-source memory layer đưa AI agents thoát khỏi 'mất trí' sau mỗi session
Cognee thay RAG bằng pipeline ECL (Extract, Cognify, Load) + Memify, biến dữ liệu thành knowledge graph lai vector — chạy trong 6 dòng code, đạt ~90% accuracy so với ~60% của RAG, vừa gọi $7.5M seed.
Tự xây Knowledge Graph cho blog bằng PHP và JSON-LD — không plugin, không API
Tutorial mới của freeCodeCamp chỉ cách dùng PHP thuần + JSON-LD để tự sinh knowledge graph cho blog: phát hiện entity, liên kết bài viết, đa ngôn ngữ — tăng khả năng được ChatGPT và Perplexity trích dẫn lên gấp 3 lần.
3 GitHub Agent Projects Cho AI Coding - P2: agentmemory, graphiti và Bộ Ba Hoàn Chỉnh
agentmemory tự động ghi nhớ xuyên session với 95.2% độ chính xác truy xuất, chỉ tốn ~1,900 tokens/session thay vì 22,000+ với built-in memory. graphiti xây knowledge graph có thời gian - track fact thay đổi theo thời gian với sub-second latency, 26.5k stars và MCP Server 1.0 đã có hàng trăm nghìn weekly users.
3 GitHub Agent Projects Cho AI Coding - P1: graphify, Bản Đồ Dự Án
graphify biến toàn bộ codebase thành knowledge graph có thể query, giảm 71.5 lần token so với đọc thô. Đạt 53.3k GitHub stars, hỗ trợ 31 ngôn ngữ lập trình, chạy trên Hermes, Claude Code, Cursor và 10+ agent tool. Cài một lệnh, chạy /graphify . là agent có ngay bản đồ dự án đầy đủ.
Cognee: xây agent không bao giờ quên với knowledge graph + embeddings
Cognee biến text thô thành knowledge graph có embedding trên mỗi node. Retrieval chạy đồng thời qua similarity và relationship — vượt RAG truyền thống ở bài benchmark multi-hop HotPotQA (0.93 vs 0.40 correctness). Apache 2.0, 16.7k+ sao GitHub, vừa gọi $7.5M seed.