TL;DR

SocratiCode là codebase context engine open-source: chạy một lệnh npx -y socraticode, tool này tự dựng Qdrant vector DB và Ollama embedding model qua Docker, index toàn bộ codebase, rồi kết nối vào Claude, Cursor, Copilot hoặc bất kỳ MCP host nào. Không API key, không YAML config, không setup infra.

Benchmark trên VS Code (2.45M dòng TypeScript/JavaScript, 5.300+ file) với Claude Opus 4.6: 61% ít token hơn, 84% ít tool calls hơn, nhanh hơn 37 lần so với grep-based AI exploration. Miễn phí, AGPL-3.0, 100% local.

Vấn đề AI coding tools đang bỏ qua

AI coding assistant hiện tại thường làm một trong hai việc khi cần hiểu codebase: grep từ khóa, hoặc đọc file từng cái một khi được nhắc đến. Cả hai đều thiếu structural knowledge - module nào chịu trách nhiệm gì, component nào kết nối nhau, refactor một hàm sẽ break những gì.

Hậu quả thực tế: AI cần 6-7 tool calls cho mỗi câu hỏi kiến trúc, mỗi grep scan mất 2-3.5 giây, và nếu bạn đổi sang AI tool khác thì mất toàn bộ index đã build. SocratiCode precompute cấu trúc codebase một lần, AI query thẳng vào đó thay vì phải khám phá lại từ đầu mỗi lần.

Dưới nắp capô

Stack kỹ thuật của SocratiCode:

  • Hybrid search: Dense vector semantic search kết hợp BM25 keyword search, fused bằng Reciprocal Rank Fusion. Semantic search tìm code liên quan khái niệm dù không có từ đó trong source; BM25 match chính xác function name và identifier. Bạn được cả hai trong mỗi query - không cần tuning.
  • AST-aware chunking: File split theo ranh giới function/class bằng ast-grep, không phải theo số dòng tùy tiện. Kết quả search chính xác hơn đáng kể so với line-based chunking.
  • Polyglot dependency graph: Static analysis 18+ ngôn ngữ, build cross-file dependency graph, detect circular dependency, visualize qua Mermaid hoặc interactive offline HTML explorer với Cytoscape.js.
  • Symbol-level impact analysis: Trước khi refactor, query blast radius - biết chính xác file nào và function nào sẽ break. Call-flow tracing từ entry point đến callees.
  • File watcher real-time: Index tự update khi có thay đổi (debounced 2 giây). Nhiều AI agent share chung một index với automatic cross-process coordination.

Infrastructure chạy hoàn toàn local: Qdrant (port 16333/16334) và Ollama (port 11435) đều là Docker container được SocratiCode tự manage - dùng port khác mặc định để tránh conflict với instance bạn đang chạy sẵn.

Con số biết nói

Test trực tiếp trên VS Code repository với Claude Opus 4.6:

MetricGrep-basedSocratiCodeDelta
Context data250.510 bytes96.485 bytes-61.5%
Tool calls31 steps5 steps-84%
Tốc độ/query2-3.5 giây60-90ms37x nhanh hơn

Codebase 3M+ lines: first-time indexing dưới 10 phút trên MacBook Pro M4. Scale tới 40+ triệu dòng code. File được xử lý song song theo batch 50, tự checkpoint - crash hay ngắt kết nối không mất tiến độ. Test suite: 634 tests (477 unit, 137 integration, 20 E2E).

Không thay thế - upgrade tool bạn đang dùng

Index của Cursor hay Copilot bị lock vào tool đó - đổi tool là mất index. SocratiCode ngược lại: index một lần, dùng được cho Claude Code, Cursor, Copilot, Windsurf, Gemini CLI đồng thời, share chung một index.

Tính năng chỉ có ở SocratiCode so với built-in AI indexes:

  • Hybrid search fused semantic + BM25 - Claude Code, Cursor, Copilot chưa có
  • Symbol-level blast radius - biết đúng thứ gì sẽ break trước khi đụng vào code
  • Call-flow tracing từ entry point đến callees
  • Interactive visual graph explorer (offline, vendored Cytoscape.js)
  • Cross-project search qua nhiều repo trong một query
  • Branch-aware indexing - mỗi Git branch có index riêng, ideal cho CI/CD
  • Multi-agent collaboration - nhiều AI agent share chung 1 index, auto-coordinated

Hạn chế và khi nào nên dùng

Cần biết trước khi cài:

  • Cần Docker đang chạy. Không có Docker = không hoạt động được.
  • macOS/Windows: Docker container không access GPU - với codebase lớn nên cài native Ollama để có Metal/CUDA acceleration.
  • Static analysis không detect dynamic dispatch, Spring @Autowired, Angular DI, Rails has_many - blast radius có thể miss caller đến qua DI framework.
  • Chỉ tương thích với AI tool hỗ trợ MCP hoặc có native plugin.

Ai nên dùng ngay: codebase lớn (monorepo, 100k+ lines), dùng nhiều AI tool khác nhau, cần refactor an toàn, hoặc team chạy multi-agent workflow song song. Phù hợp kém hơn nếu codebase nhỏ, chỉ cần tìm exact string, hoặc môi trường không chạy được Docker.

Cài đặt ngay

SocratiCode v1.7.2 (2026-04-28), 1.600+ GitHub stars, phát triển rất nhanh - từ v1.3 lên v1.7 chỉ trong 5 tuần.

  • Claude Code: claude plugin marketplace add giancarloerra/socraticode
  • Cursor: /add-plugin https://github.com/giancarloerra/socraticode
  • MCP config (bất kỳ host): npx -y socraticode

Cloud version (shared team index, SSO/SAML, VPC/air-gapped deployment) đang private beta - request early access trên GitHub repo.

Nguồn: github.com/giancarloerra/SocratiCode, The Menon Lab.