Bạn có thể extend GitHub Copilot CLI với bất kỳ UI nào bạn muốn — đây là cách
Copilot CLI không chỉ là agent trong terminal. Nó có một extension harness chạy như Node.js child process qua JSON-RPC, cho phép bạn dựng custom slash command, UI elicitation dialog, hook chặn tool call và inject context — tất cả trong một file extension.mjs hot-reload mid-session.
Ghost OS: bộ não "mắt và tay" cho AI agent trên macOS — không cần screenshot
Ghost OS là MCP server mã nguồn mở (MIT) đọc accessibility tree macOS thay vì screenshot, cho AI agent điều khiển bất kỳ app native nào với 29 tool, độ trễ 50–500ms và self-learning recipes lưu dạng JSON.
Claudeculator: công cụ build settings.json cho Claude Code, kèm cost estimator real-time
Daniel Avila vừa ra mắt Claudeculator — web tool free build settings.json cho Claude Code, đồng thời ước lượng chi phí $/tháng dựa trên model, prompt caching, hooks, MCP và lịch sử hội thoại. Beta, hosted trên Vercel.
Aletheia: AI của Google DeepMind giải 6/10 bài toán mới và đạt 91.9% IMO-ProofBench
Aletheia, agent toán học chạy trên Gemini 3 Deep Think, vừa tự giải 6/10 bổ đề chưa từng công bố trong FirstProof và đạt 91.9% trên IMO-ProofBench Advanced — bỏ xa GPT-5.2 (35.7%). Một bước ngoặt cho automated theorem proving không cần can thiệp con người.
7 Primitives AI Agent Không Bao Giờ Cũ
Context engineering quyết định thứ gì vào model window, không phải cách viết prompt. Single-agent đánh bại multi-agent trong 64% benchmark task với chi phí thấp hơn 2x. Evals biến agent thành sản phẩm thật thay vì demo. MCP là giao thức chuẩn kết nối tool - học shape của nó, bỏ qua phần còn lại.
10 Kiến trúc RAG cho Enterprise AI 2026: Từ Naive RAG đến Agentic Graph RAG
Hybrid RAG kết hợp vector + BM25 là baseline production mặc định cho enterprise 2026. GraphRAG outperform Hybrid khi queries phụ thuộc relationship giữa entities. Agentic RAG xử lý multi-hop nhưng tốn 3-10x token và latency p50 = 4-8 giây. Lựa chọn kiến trúc RAG sai là lý do chính khiến dự án GenAI enterprise thất bại sau giai đoạn demo.
Sampler: biến mọi shell command thành dashboard terminal chỉ với một file YAML
Sampler là tool Go nhỏ gọn (14.5k stars) chạy bất kỳ shell command nào theo lịch và vẽ kết quả thành runchart, sparkline, gauge, barchart hoặc ASCII art ngay trong terminal — kèm trigger alert. Không cần Prometheus, không cần Grafana, chỉ cần một file YAML.
Cognee: xây agent không bao giờ quên với knowledge graph + embeddings
Cognee biến text thô thành knowledge graph có embedding trên mỗi node. Retrieval chạy đồng thời qua similarity và relationship — vượt RAG truyền thống ở bài benchmark multi-hop HotPotQA (0.93 vs 0.40 correctness). Apache 2.0, 16.7k+ sao GitHub, vừa gọi $7.5M seed.
Google ra mắt Deep Research và Deep Research Max: agent nghiên cứu tự hành chạy trên Gemini 3.1 Pro
Google DeepMind công bố hai agent nghiên cứu tự hành — Deep Research và Deep Research Max — chạy trên Gemini 3.1 Pro. Chúng tự lên kế hoạch, duyệt web, đọc tài liệu nội bộ và xuất báo cáo trích dẫn đầy đủ, sẵn sàng cho due diligence, phân tích cạnh tranh và nghiên cứu tài chính chuyên sâu.
GEPA kéo Haiku 4.5 từ 65% lên 85% pass rate — tune CLAUDE.md tự động, không đổi model
GEPA (ICLR 2026 Oral) dùng LLM đọc execution trace để tự đề xuất sửa prompt, kéo Claude Haiku 4.5 từ 65% lên 85% pass rate chỉ bằng cách optimize file CLAUDE.md — không swap model, không fine-tune, dùng 35× ít rollouts hơn RL.