// Posts
Bạn có thể extend GitHub Copilot CLI với bất kỳ UI nào bạn muốn — đây là cách
#1672026-02-28

Bạn có thể extend GitHub Copilot CLI với bất kỳ UI nào bạn muốn — đây là cách

Copilot CLI không chỉ là agent trong terminal. Nó có một extension harness chạy như Node.js child process qua JSON-RPC, cho phép bạn dựng custom slash command, UI elicitation dialog, hook chặn tool call và inject context — tất cả trong một file extension.mjs hot-reload mid-session.

github-copilotcopilot-clideveloper-tools
7 phút đọc
Ghost OS: bộ não "mắt và tay" cho AI agent trên macOS — không cần screenshot
#1662026-02-27

Ghost OS: bộ não "mắt và tay" cho AI agent trên macOS — không cần screenshot

Ghost OS là MCP server mã nguồn mở (MIT) đọc accessibility tree macOS thay vì screenshot, cho AI agent điều khiển bất kỳ app native nào với 29 tool, độ trễ 50–500ms và self-learning recipes lưu dạng JSON.

ghost-osai-agentscomputer-use
7 phút đọc
Claudeculator: công cụ build settings.json cho Claude Code, kèm cost estimator real-time
#1652026-02-26

Claudeculator: công cụ build settings.json cho Claude Code, kèm cost estimator real-time

Daniel Avila vừa ra mắt Claudeculator — web tool free build settings.json cho Claude Code, đồng thời ước lượng chi phí $/tháng dựa trên model, prompt caching, hooks, MCP và lịch sử hội thoại. Beta, hosted trên Vercel.

claude-codeclaudeculatordeveloper-tools
6 phút đọc
Aletheia: AI của Google DeepMind giải 6/10 bài toán mới và đạt 91.9% IMO-ProofBench
#1642026-02-24

Aletheia: AI của Google DeepMind giải 6/10 bài toán mới và đạt 91.9% IMO-ProofBench

Aletheia, agent toán học chạy trên Gemini 3 Deep Think, vừa tự giải 6/10 bổ đề chưa từng công bố trong FirstProof và đạt 91.9% trên IMO-ProofBench Advanced — bỏ xa GPT-5.2 (35.7%). Một bước ngoặt cho automated theorem proving không cần can thiệp con người.

aletheiagemini-3-deep-thinkgoogle-deepmind
8 phút đọc
7 Primitives AI Agent Không Bao Giờ Cũ
#1632026-02-22

7 Primitives AI Agent Không Bao Giờ Cũ

Context engineering quyết định thứ gì vào model window, không phải cách viết prompt. Single-agent đánh bại multi-agent trong 64% benchmark task với chi phí thấp hơn 2x. Evals biến agent thành sản phẩm thật thay vì demo. MCP là giao thức chuẩn kết nối tool - học shape của nó, bỏ qua phần còn lại.

context-engineeringai-agenttool-design
7 phút đọc
10 Kiến trúc RAG cho Enterprise AI 2026: Từ Naive RAG đến Agentic Graph RAG
#1622026-02-20

10 Kiến trúc RAG cho Enterprise AI 2026: Từ Naive RAG đến Agentic Graph RAG

Hybrid RAG kết hợp vector + BM25 là baseline production mặc định cho enterprise 2026. GraphRAG outperform Hybrid khi queries phụ thuộc relationship giữa entities. Agentic RAG xử lý multi-hop nhưng tốn 3-10x token và latency p50 = 4-8 giây. Lựa chọn kiến trúc RAG sai là lý do chính khiến dự án GenAI enterprise thất bại sau giai đoạn demo.

ragai-engineeringllm
8 phút đọc
Sampler: biến mọi shell command thành dashboard terminal chỉ với một file YAML
#1602026-02-20

Sampler: biến mọi shell command thành dashboard terminal chỉ với một file YAML

Sampler là tool Go nhỏ gọn (14.5k stars) chạy bất kỳ shell command nào theo lịch và vẽ kết quả thành runchart, sparkline, gauge, barchart hoặc ASCII art ngay trong terminal — kèm trigger alert. Không cần Prometheus, không cần Grafana, chỉ cần một file YAML.

samplerterminal-dashboarddevtools
6 phút đọc
Cognee: xây agent không bao giờ quên với knowledge graph + embeddings
#1592026-02-19

Cognee: xây agent không bao giờ quên với knowledge graph + embeddings

Cognee biến text thô thành knowledge graph có embedding trên mỗi node. Retrieval chạy đồng thời qua similarity và relationship — vượt RAG truyền thống ở bài benchmark multi-hop HotPotQA (0.93 vs 0.40 correctness). Apache 2.0, 16.7k+ sao GitHub, vừa gọi $7.5M seed.

cogneeai-memoryknowledge-graph
7 phút đọc
Google ra mắt Deep Research và Deep Research Max: agent nghiên cứu tự hành chạy trên Gemini 3.1 Pro
#1582026-02-19

Google ra mắt Deep Research và Deep Research Max: agent nghiên cứu tự hành chạy trên Gemini 3.1 Pro

Google DeepMind công bố hai agent nghiên cứu tự hành — Deep Research và Deep Research Max — chạy trên Gemini 3.1 Pro. Chúng tự lên kế hoạch, duyệt web, đọc tài liệu nội bộ và xuất báo cáo trích dẫn đầy đủ, sẵn sàng cho due diligence, phân tích cạnh tranh và nghiên cứu tài chính chuyên sâu.

gemini-3-1-prodeep-researchgoogle-deepmind
7 phút đọc
GEPA kéo Haiku 4.5 từ 65% lên 85% pass rate — tune CLAUDE.md tự động, không đổi model
#1572026-02-18

GEPA kéo Haiku 4.5 từ 65% lên 85% pass rate — tune CLAUDE.md tự động, không đổi model

GEPA (ICLR 2026 Oral) dùng LLM đọc execution trace để tự đề xuất sửa prompt, kéo Claude Haiku 4.5 từ 65% lên 85% pass rate chỉ bằng cách optimize file CLAUDE.md — không swap model, không fine-tune, dùng 35× ít rollouts hơn RL.

gepaclaude-haiku-4-5prompt-optimization
7 phút đọc