Turbovec - Vector Index Xây Dựng Trên TurboQuant Của Google Research
Turbovec là vector index viết Rust dựa trên TurboQuant của Google Research. Nén 10 triệu vectors từ 31 GB xuống 4 GB (tỉ lệ 8x), vẫn nhanh hơn FAISS 12-20% trên ARM. Không cần training phase, hỗ trợ LangChain/LlamaIndex. Mã nguồn mở, hoàn toàn miễn phí.
Claude Context: MCP Plugin giúp Claude Code tiết kiệm 39% token bằng semantic search
Claude Context là MCP plugin open-source của Zilliz, thay thế grep-only bằng hybrid BM25 + vector search trên toàn codebase. Benchmark chính thức: 44.4K token so với 73.4K (-39.4%) và 5.3 tool calls so với 8.3 (-36.3%). Monorepo 12,000 file được index trong 3-6 phút, hỗ trợ OpenAI, VoyageAI, Ollama và Gemini. MIT license, self-host hoàn toàn được với Milvus + Ollama, không cần trả thêm gì ngoài ops cost.
Blockify và IdeaBlocks: Giảm corpus RAG 40x, tăng độ chính xác y tế 261%
Blockify giảm kích thước corpus xuống còn 2.5% kích thước gốc trong khi giữ lại 99% factual integrity. Token tiêu thụ mỗi query giảm 3.09x - từ 1,515 xuống 490 tokens. Độ chính xác vector search tăng 2.29x so với chunking truyền thống. Trong thử nghiệm lâm sàng với Llama 3.2 3B chạy on-device, Blockify cải thiện độ chính xác trung bình 261% và lên đến 650% với trường hợp DKA management.