Google open-source AX: Runtime phân tán cho AI agent chạy hàng giờ không sập
Google vừa công bố AX (Agent eXecutor) - open-source distributed runtime viết bằng Go, giải quyết bài toán vận hành AI agent long-running trong production. AX hỗ trợ resume tự động sau khi crash, trajectory branching để test nhiều hướng quyết định, và tích hợp với LangGraph, ADK, A2A Protocol. Dự án đang ở giai đoạn preview, install qua: go install github.com/google/ax/cmd/ax@latest.
ActiveGraph: Lớp Liên Tục Mà AI Agent Dài Hạn Đang Thiếu
Yohei Nakajima - tác giả BabyAGI - vừa công bố ActiveGraph, kiến trúc biến toàn bộ thực tại của agent thành một graph trạng thái bền vững duy nhất. Không phải workflow DAG, không phải graph memory - ActiveGraph model the world the computation acts on. Code chưa public nhưng concept đủ rõ để thay đổi cách chúng ta nghĩ về agent dài hạn.
Warp Oz: Điều Phối Claude Code, Codex và Warp Agent Song Song Trên Cloud
Warp nâng cấp Oz thành control plane đa harness đầu tiên, chạy Claude Code, Codex và Warp Agent song song trên cloud. Lệnh /orchestrate phân chia task phức tạp cho nhiều subagent, mỗi agent trong Docker container riêng. Agent Memory - bộ nhớ xuyên harness - đang research preview, giúp agent học phong cách code của team. Nội bộ Warp, Oz viết 60% số PR và chặn gần $60,000 gian lận trong một buổi sáng.
Agent output: tại sao tôi chuyển sang HTML và không quay lại
Bài của Thariq (Anthropic) về HTML agent output đạt 12.6 triệu views - và một developer đã thực sự áp dụng vào workflow thực tế. Chỉ 51ms overhead để chuyển Markdown sang HTML mỗi lần agent chạy. Công thức artifact contract gồm 3 phần: Markdown làm source, HTML làm review surface, chat làm notification. HBR gọi tình trạng đọc Markdown report mãi là 'AI Brain Fry' - tăng cognitive load 19% và decision fatigue 33%.
Helio: AI Không Phải Tool - Là Đồng Nghiệp. Mô Hình Workspace Mới Nhất 2026
Helio là AI Native Workforce nơi AI colleague ngồi cùng channel, nhận cùng task và tự chạy cả khi bạn offline - không cần viết config file hay thiết kế agent workflow. Một pipeline 4 agent (researcher + copywriter + editor + SEO) hoàn thành trong 4 phút so với nửa ngày nếu dùng OpenClaw. Mỗi AI có email thật, calendar riêng và persistent memory - là first-class citizen trong hệ thống, không phải bot hay sidebar.
Giải mã Multi-Agent AI: Từ ReAct Loop đến Deep Research Enterprise
Multi-agent system của Anthropic vượt trội single-agent 90.2% trên bài test nghiên cứu phức tạp, nhờ kiến trúc Lead Agent - Sub-Agents song song - Citation Agent. Context isolation là lý do cốt lõi: mỗi sub-agent có context window độc lập, tránh 'context rot' khi xử lý nhiều chủ đề. Parallel tool calling cắt 90% thời gian so với tìm kiếm tuần tự. Token tiêu thụ cao hơn 15x chat thông thường - chỉ hợp lý khi task value đủ cao.
Làm AI Agent Đầu Tiên Với Hermes và Grok
Hermes Agent - open-source AI agent của NousResearch - đạt 157k GitHub stars, hiện ở v0.14.0 với SuperGrok OAuth tích hợp. Agent không chỉ là chatbot: gồm 5 thành phần brain, tools, memory, rules, loop - chạy vòng perceive-reason-execute liên tục. Cài bằng 1 lệnh curl, kết nối Grok không cần API key riêng nếu có SuperGrok. Phù hợp nhất cho personal workflow, research automation, và daily briefing tự động qua Telegram.
Hermes Agent v0.14.0 ra mắt: pip install, browser nhanh 180x, Grok 1M context
Hermes Agent v0.14.0 "The Foundation Release" ra mắt ngày 16/5/2026 với 808 commits và 545 issues đã đóng. Browser automation nhanh hơn 180x nhờ persistent Chrome DevTools connection. Cold-start giảm ~19 giây, grok-4.3 được bump lên 1M token context window. pip install hermes-agent giờ hoạt động trực tiếp từ PyPI.
Chỉ 1 Lệnh /goal, Claude Code Tự Chẩn Đoán Và Tăng Tốc Độ Internet Của Bạn Lên Gấp Đôi
CJ Zafir chỉ gõ '/goal make my internet network faster' và Claude Code tự chạy speedtest-cli, kiểm tra DNS, MTU, Wi-Fi rồi fix 3 vấn đề - không cần thêm lệnh nào. /goal là tính năng agent tự hành của Claude Code, chạy vòng lặp Observe-Act-Verify liên tục mà không cần approve từng bước. Stripe triển khai cho 1.370 kỹ sư, Ramp giảm 80% thời gian điều tra sự cố nhờ Claude Code.
Giảm 87% Chi Phí Token AI Agent trong 7 Ngày - Từ $4,800 Xuống $620/Tháng
AI agent tiêu tốn token 10-100x nhiều hơn chatbot vì re-send toàn bộ context mỗi bước - 70% trong số đó là waste. Playbook 7 ngày giúp giảm bill từ $4,800 xuống $620/tháng (87%) mà không giảm chất lượng output. Prompt caching Anthropic giảm 90% chi phí token cached, chỉ cần 1 cache hit để hoà vốn. Model routing Haiku/Sonnet/Opus theo task complexity - một team finance tiết kiệm $365,000/năm nhờ thay đổi này.