Nghiên cứu: Harness phức tạp hơn không có nghĩa là AI agent tốt hơn
432 lần thử nghiệm cho thấy Gemini 2.5 Flash mất 29-38 điểm VTSR khi harness phức tạp hơn. Qwen3.5-122B đạt đỉnh 91.7% VTSR chính xác ở strict harness - ngược hoàn toàn kỳ vọng. Model 2B Gemma4:e2B ổn định 91.7% khắp mọi điều kiện - ngang với model mạnh hơn nhiều.
10 Lớp Kiến Trúc để Autonomous Agents Thực Sự Tự Hành - Không Chỉ Generate Output
Autonomous agents cần 3 mặt phẳng - 10 lớp để trở thành asset class thực sự: từ danh tính (ERC-8004 với 128,000 agents trên 24 chain) đến thanh toán (x402 xử lý 15 triệu giao dịch/tháng). Gartner dự báo 40%+ dự án agentic AI sẽ bị hủy trước 2028 vì thiếu governance. EU AI Act enforcement tháng 8/2026 - phạt tới €35M hoặc 7% doanh thu toàn cầu.
PAI: Khi AI không còn là chatbot mà trở thành hệ điều hành cuộc sống của bạn
PAI (Personal AI Infrastructure) v5.0.0 đạt 12,400+ GitHub stars với 45 skills, 171 workflows và 37 hooks - không phải chatbot mà là Life Operating System xây trên Claude Code. Hệ thống nhớ mọi quyết định, tự tổng hợp briefing mỗi sáng và tiết kiệm 30-90 phút làm việc mỗi ngày. Miễn phí, MIT license, cài trong 1 lệnh.
HelixDB: Kết hợp Graph và Vector Database trong một nền tảng duy nhất cho AI apps
HelixDB là open-source graph-vector database viết bằng Rust, kết hợp semantic search và relationship traversal trong một DB thay vì hai. Benchmark trên AWS cho thấy nhanh hơn Neo4j 16x cho graph lookups và 5.9x cho traversal với dataset 4 triệu edges. YC W25 backed, 4,100+ GitHub stars, license AGPL-3.0, self-hosted miễn phí.
OpenAI ra mắt MRC - Giao thức mạng mới cho siêu máy tính AI
MRC (Multipath Reliable Connection) là giao thức mạng mới của OpenAI, giải quyết tắc nghẽn trong các cụm GPU cực lớn. Phun gói tin qua 128-256 đường dẫn đồng thời, đạt 96% băng thông lý thuyết (770 Gb/s) và phục hồi sự cố trong vài chục micro-giây. Đang chạy production tại Microsoft Fairwater và Oracle Abilene với 42.000+ GPU, đã train ChatGPT và Codex. Mở hoàn toàn qua Open Compute Project - không độc quyền.
The AI Paradox: Rising Investment, Lagging ROI
Năm 2025, thế giới chi 1,76 nghìn tỷ USD cho AI - Gartner dự báo con số tăng thêm 47% lên 2,59 nghìn tỷ vào 2026. Nhưng nghiên cứu từ MIT chỉ ra 95% tổ chức có ROI bằng 0 dù đã đổ 30-40 tỷ USD vào Generative AI. Chỉ 6% thu hồi vốn trong dưới 1 năm, trong khi công nghệ thông thường hoàn vốn sau 7-12 tháng. Big Tech không thể dừng vì FOMO - 91% doanh nghiệp có kế hoạch tăng ngân sách AI tiếp đến tháng 8/2026.
Exa Deep Max: Agentic Search SOTA với Latency Nhanh Hơn 20 Lần
Exa vừa công bố Deep Max — endpoint agentic search kết hợp frontier LLM với hàng chục lời gọi Exa Search song song, đạt state-of-the-art trên HLE-Search, FRAMES, Deep Search QA, với độ trễ nhanh hơn đối thủ tới 92 lần.