Dụng Cụ cho Mọi Tác Vụ: Dynamic Workflows trong Claude Code
Anthropic phát hành dynamic workflows, cho phép Claude viết harness tùy chỉnh và điều phối hàng chục tác nhân song song trong một session. Tính năng này giải quyết bài toán máy tính bị sa lầy trong bối cảnh dài (agentic laziness, self-bias, goal drift). Workflows động có sẵn trong Claude Code CLI/Desktop, VS Code extension cho Max/Team/Enterprise plans.
Hermes Agent Kanban: Khi Một Agent Không Đủ Sức Gánh Cả Dự Án
Hermes Agent Kanban là hệ thống quản lý task durable, SQLite-backed, cho phép nhiều AI agent chuyên biệt cộng tác trên workflow phức tạp mà không bị giới hạn bởi context window. Dispatcher tự động tick mỗi 60 giây, phát hiện crash bằng POSIX kill probe, và phục hồi task trong cùng một chu kỳ. Kiến trúc peer-to-peer thay thế mô hình subagent swarm dễ vỡ bằng receipts có thể kiểm chứng, dependency DAG tự động, và structured handoff giữa các agent.
22 Hack của Agentic Engineering - Hướng dẫn của Matt Van Horn (June 2026)
2026 là "Year of Trust" cho agentic engineering: chỉ 15% LLM output là tool calls (85% text là waste). Custom agents + 50 lines code + 3 tools tự động hoá toàn bộ task hàng ngày. Multi-agent orchestration chạy song song (3-100 agents) cho cross-validation, 4x tăng tốc (12+ min → 3 min). Top 2% engineers chạy agent sandboxes dạng best-of-N pattern, chuyển từ in-loop (terminal) sang out-loop (autonomous teams).
Harness: Tạo Agent Team cho Claude Code Chỉ Bằng Một Câu Lệnh
Harness là Claude Code plugin tạo agent team hoàn chỉnh từ một câu prompt, áp dụng 6 pattern kiến trúc đã được kiểm chứng. A/B test trên 15 task kỹ thuật cho thấy chất lượng output tăng +60% (49.5 lên 79.3), 15/15 win-rate, variance giảm -32%. Repo harness-100 đi kèm cung cấp sẵn 100 agent team production-ready cho 10 domain.
Hermes Agent v0.15.0: The Velocity Release - AI agent mã nguồn mở vừa tăng tốc 4.500 lần
Hermes Agent v0.15.0 ra mắt ngày 28/05/2026 với 1.302 commits từ 321 contributors. session_search nhanh hơn 4.500 lần, từ 30 giây xuống 20ms và miễn phí hoàn toàn. Core code giảm 76%: run_agent.py từ 16.083 dòng xuống 3.821 dòng chia thành 14 module. Kanban tiến hóa thành nền tảng đa agent thực sự với Swarm topology 1 lệnh.
Khóa học 22 chương thiết kế AI Agent - P2: Nền tảng, Bộ nhớ và Phối hợp đa-Agent
Từ một tool call đơn giản đến hệ thống đa-agent phối hợp hoàn chỉnh: khóa học agentic AI phân tích kiến trúc cốt lõi qua 11 chương đầu. Agent loop, memory ngắn hạn và dài hạn, planning, orchestration harness - mọi thứ được giải thích bằng pattern kiến trúc, không gắn với framework cụ thể.
Warp Oz: Điều Phối Claude Code, Codex và Warp Agent Song Song Trên Cloud
Warp nâng cấp Oz thành control plane đa harness đầu tiên, chạy Claude Code, Codex và Warp Agent song song trên cloud. Lệnh /orchestrate phân chia task phức tạp cho nhiều subagent, mỗi agent trong Docker container riêng. Agent Memory - bộ nhớ xuyên harness - đang research preview, giúp agent học phong cách code của team. Nội bộ Warp, Oz viết 60% số PR và chặn gần $60,000 gian lận trong một buổi sáng.
Helio: Khi AI Trở Thành Đồng Nghiệp Thật Sự Trong Channel Của Bạn
Helio đặt AI trực tiếp vào IM như một đồng nghiệp - email riêng, channel chung, task board chung. 4 AI agents hoàn thành content pipeline trong 4 phút, không cần một dòng config. Hỗ trợ BYOK miễn phí, hiện đã public beta trên macOS.
Helio: AI Không Phải Tool - Là Đồng Nghiệp. Mô Hình Workspace Mới Nhất 2026
Helio là AI Native Workforce nơi AI colleague ngồi cùng channel, nhận cùng task và tự chạy cả khi bạn offline - không cần viết config file hay thiết kế agent workflow. Một pipeline 4 agent (researcher + copywriter + editor + SEO) hoàn thành trong 4 phút so với nửa ngày nếu dùng OpenClaw. Mỗi AI có email thật, calendar riêng và persistent memory - là first-class citizen trong hệ thống, không phải bot hay sidebar.
Giải mã Multi-Agent AI: Từ ReAct Loop đến Deep Research Enterprise
Multi-agent system của Anthropic vượt trội single-agent 90.2% trên bài test nghiên cứu phức tạp, nhờ kiến trúc Lead Agent - Sub-Agents song song - Citation Agent. Context isolation là lý do cốt lõi: mỗi sub-agent có context window độc lập, tránh 'context rot' khi xử lý nhiều chủ đề. Parallel tool calling cắt 90% thời gian so với tìm kiếm tuần tự. Token tiêu thụ cao hơn 15x chat thông thường - chỉ hợp lý khi task value đủ cao.
Top 10 AI Papers Tuần May 11-17: Nous Research 2 Đột Phá Training, DeepMind Giải Toán 60 Năm
Nous Research ra mắt Lighthouse Attention - tăng tốc forward pass 21× tại 512K context trên single B200 mà không đổi deployed model. Token Superposition Training cắt 2.5× thời gian pretraining 10B-A1B MoE từ 12,311 xuống 4,768 GPU-hours. AI Co-Mathematician của Google DeepMind đạt 48% FrontierMath Tier 4, SOTA mới, và đã giúp giải bài toán nhóm mở suốt 60 năm. The Memory Curse cho thấy context window lớn hơn làm giảm khả năng hợp tác của LLM agents trong 18/28 cài đặt thử nghiệm.
Hermes Agent: 4 cấp độ setup từ prototype đến đội AI tự động
Hermes Agent v0.6.0 giới thiệu kiến trúc multi-agent 4 cấp - từ 1 agent prototype đến đội AI chạy hoàn toàn tự động qua cron. Trên benchmark network design, setup đa agent đạt 75-85% success rate so với chain-of-thought baseline. Hermes 4.3 36B đạt 93.8% trên MATH-500 - cạnh tranh với các model lớn hơn. Software miễn phí MIT, chỉ trả chi phí API ($0.13/M input tokens với Hermes 4 70B).
Codex xây dựng. Claude Code review. Hermes điều phối. Tất cả trên một Kanban board.
Ba agent AI chạy song song trên một Kanban board dùng lệnh /goal - Codex builds, Claude Code reviews, Hermes orchestrates. Claude Code v2.1.139 tích hợp /goal native: agent tự vòng lặp đến khi điều kiện hoàn thành, không cần nhắc lại. Hermes Agent v0.13.0 ra Kanban SQLite-backed: 9 collaboration patterns, dispatcher 60 giây/tick, circuit breaker sau 5 lần fail.
Hermes Agent chạy 24/7 không cần bật máy - Cron, Scheduling và Agent chuyên biệt
Hermes Agent có built-in cron scheduler bằng ngôn ngữ tự nhiên - không cần viết cron expression. Researcher agent gửi daily digest AI/ML mỗi 8 giờ sáng tự động. Designer tự học visual style từ reference images và encode thành skill. Programmer delegate sang Claude Code để tận dụng Max subscription.
InkOS: AI Agent viết tiểu thuyết tự động - 452.000 từ, 100% audit pass
InkOS là open-source multi-agent system viết, kiểm tra và sửa tiểu thuyết tự động, có human review gates giữ tác giả kiểm soát toàn bộ. Benchmark thực chiến: 31 chương, 452.191 từ, 100% audit pass rate với 7 truth files và pipeline 10 agent. Miễn phí hoàn toàn - AGPL-3.0, chi phí chỉ là tiền LLM API. Roadmap tiếp theo: interactive fiction, partial chapter intervention, custom agent plugin.
Dựng hệ thống 4-agent với Claude Code trong một cuối tuần
Một đội chuyên gia luôn vượt trội một generalist làm một mình - đúng với cả AI lẫn tổ chức người. Claude Code Agent Teams ship từ tháng 2/2026, optimal 3-5 teammates với 5-6 task mỗi người. Specialist agent đạt 95-99% accuracy trong domain hẹp so với generalist. Một hệ thống content thực tế: 25 phút cho 1 bài, chi phí ~95 USD/tháng, ROI 10-20x.
Xây dựng hệ thống 4-agent với Claude: Từ zero đến production trong một cuối tuần
Hệ thống 4 agent chuyên biệt outperform single agent lên đến +90.2% theo đo lường nội bộ của Anthropic. Orchestrator-worker pattern chiếm 70% production deployments thực tế, execution song song giảm thời gian xử lý đến 90%. Bài này hướng dẫn từng bước xây team 4 agent trên Claude Code - Research, Production, Quality, Distribution - và kết nối chúng qua một orchestrator điều phối.
Tôi build hệ thống 4 agent tự động viết content X - đây là cách nó hoạt động
Hệ thống gồm 4 agent chuyên biệt: Researcher kéo tweet và lưu vào database, Idea Maker chọn từ 13 hook formulas để tạo angle, Writer match đúng giọng văn của chủ nhân. Toàn bộ pipeline build bằng Claude Code, chỉ cần markdown prompts và CLI tools. Draft cuối đẩy thẳng vào Typefully - không cần copy-paste thủ công.
4 Trụ Cột Agent Bền Vững - Phần 3: Harness và Orchestration
3 harness changes - không đụng model - collapse Claude Code từ 2.200 ký tự thinking xuống 600 trong 6 tuần, API retry rate tăng 80 lần. Multi-agent cho 90.2% performance tốt hơn nhưng 68.9% security exposure cao hơn. Phần cuối series về 4 trụ cột agent production-grade.
Hermes Agent v0.13.0 - The Tenacity Release: Multi-Agent Kanban, /goal và 8 bản vá bảo mật
Hermes Agent v0.13.0 ra mắt ngày 7 tháng 5 năm 2026 với 864 commits và 588 merged PRs. Multi-Agent Kanban durable giờ hỗ trợ zombie detection, heartbeat và hallucination recovery. Lệnh /goal mới giữ agent focus xuyên suốt session dài không bị lạc hướng. Bản vá 8 lỗ hổng P0, bao gồm lỗ hổng CVSS 8.1 Discord cross-guild DM bypass.
Hướng dẫn cài đặt Hermes Agent và chạy nhiều agent chuyên biệt cùng lúc
Hermes Agent cài bằng một lệnh curl. Skills Hub có 687 skills sẵn. Profiles cho phép chạy nhiều agent hoàn toàn độc lập - mỗi agent có SOUL.md, memory, skills, và Telegram bot riêng. Designer, Programmer, Researcher: ba agent khác nhau hoàn toàn dù chạy cùng model.
Paper2Video: AI tự động biến bài báo khoa học thành video presentation
PaperTalker - hệ thống multi-agent từ NUS - tự động tạo video presentation từ paper LaTeX với chi phí $0.001/video. Đạt PresentQuiz 84.2%, vượt human-made 10%. Mã nguồn mở MIT, chấp nhận tại NeurIPS 2025 Workshop. Yêu cầu GPU 48GB VRAM để self-host.
LLM Artifacts: Khi kiến thức nghiên cứu trở thành thứ bạn có thể hành động ngay
Mỗi tháng arXiv nhận ~30.000 bài nộp - không ai đọc kịp. Omar Shaikh (@omarsar0) chia sẻ workflow biến luồng papers thành LLM Artifacts động: agent tự curate, index, và cho phép tự động hóa experiments ngay trong artifact. LLM Artifacts là bước tiến hóa tự nhiên từ LLM Wikis của Karpathy - từ lưu trữ sang hành động.
Multi-Agent Orchestration: Khi AI biết phân công lao động
Multi-agent vượt single-agent Claude Opus 4 tới 90.2% trong benchmark nghiên cứu. Mỗi sub-agent có context window riêng, cùng chia sẻ filesystem để phối hợp - đây là kiến trúc đang reshape cách AI xử lý bài toán phức tạp. Token tiêu tốn gấp 15 lần chat thường, nhưng tốc độ xử lý tăng tới 90% nhờ song song hóa.
Bốn kiến trúc multi-agent: khi nào dùng gì và sự thật về production
Benchmark mới nhất test 10.000 tài liệu SEC qua 5 LLM lớn cho thấy Reflexive đạt F1 cao nhất nhưng tốn gấp 2.3 lần chi phí. Hierarchical Supervisor là lựa chọn tốt nhất cho hầu hết workload production với 98.5% độ chính xác tại 60.7% chi phí. Parallel nhanh hơn Sequential tới 1.84 lần nhưng là pattern kém hiệu quả token nhất. Gartner dự báo hơn 40% pilot AI agent sẽ bị huỷ vào 2027 - kiến trúc mới là nguyên nhân.
10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P2: ReAct, Multi-Agent và An Toàn
5 khái niệm nâng cao quyết định Agent của bạn có đáng tin cậy hay không: ReAct pattern, Multi-Agent collaboration, Error handling, Safety control và cách chọn framework đúng. Nhóm Multi-Agent thực tế chỉ 3-4 agent do coordination overhead tăng nhanh.
10 AI Agent Miễn Phí Hoạt Động 24/7 - P2: Open WebUI, MetaGPT, CrewAI, AutoGen, Mem0
5 AI agent chuyên biệt còn lại trong danh sách: Open WebUI tự host ChatGPT cá nhân, MetaGPT cho software development, CrewAI với 5.2 triệu lượt tải/tháng, AutoGen của Microsoft đang vào maintenance mode, và Mem0 - bộ nhớ dài hạn cho mọi AI agent.
MiroFish: Sinh viên 20 tuổi xây engine dự đoán tương lai bằng 60.000 AI Agent trong 10 ngày
MiroFish là Swarm Intelligence Engine open-source xây dựng trong 10 ngày bởi sinh viên 20 tuổi Guo Hangjiang, đã đạt 60.900 stars và 9.500 forks trên GitHub. Thay vì hỏi một LLM đơn lẻ, engine tạo hàng nghìn AI agent độc lập với nhân cách và ký ức riêng, cho chúng tương tác trong một thế giới kỹ thuật số song song để dự đoán tương lai. Dự án nhận 30 triệu RMB (~4,1 triệu USD) seed funding từ Shanda Group chỉ 24 giờ sau demo.
Kiến trúc Agentic AI: Mental Model để thiết kế hệ thống đa tác tử
Hệ thống multi-agent dùng gấp 15 lần token so với chat nhưng mang lại cải thiện hiệu suất 90.2% so với single-agent. Anthropic xác định 5 pattern orchestration chuẩn: Sequential, Concurrent, Group Chat, Handoff, và Magentic. Kiến trúc gồm 8 tầng từ Orchestration đến Foundation, mỗi tầng có vai trò không thể thiếu. MCP đang trở thành chuẩn giao tiếp giữa agent và tool trong năm 2026.
Tôi chạy multi-agent Hermes Agent suốt nhiều tuần - đây là những gì tôi thực sự dùng nó để làm
Hermes Agent của Nous Research miễn phí, không bị khóa vào model nào, chạy được trên VPS $5 hoặc GPU cũ của bạn - nhưng hầu hết mọi người bị kẹt vì bắt đầu từ công nghệ thay vì từ vấn đề. Xây dựng một đội agent chuyên biệt xung quanh điểm ma sát thực tế của bạn và công cụ này mới thực sự có ích. Chạy 4 agent chỉ tốn $0-30/tháng bằng cách kết hợp free model, gói flat-rate và local hardware.
67 Claude Skills - Phần 3: Writing, Design, Business và Multi-Agent
Skills không chỉ dành cho developer. Có 20+ marketing skills bao gồm CRO, copywriting, email flows. Frontend Design (Anthropic) đạt 277,000 installs. Stochastic Multi-Agent Consensus spawn nhiều sub-agents giải cùng vấn đề rồi aggregate kết quả. Phần 3 hoàn thành bức tranh đầy đủ của 67 skills và hướng dẫn wire vào workflow.
TradingAgents-CN: Khi AI Mô Phỏng Cả Một Phòng Quant Wall Street
TradingAgents-CN đạt 25.2k stars - bản fork A-shares/HK/US của framework multi-agent LLM từ UCLA/MIT. 8 Agent LLM phối hợp mô phỏng nguyên xi một investment bank team. MongoDB + Redis tăng hiệu năng 10x, deploy Docker 5 phút. Backtest AAPL đạt +26.62% vs Buy&Hold -5.23% - nhưng đây là simulation, không phải live trading.
Multi-Agent Orchestration: Khi một AI không còn đủ
Anthropic's multi-agent research system vượt single Opus 4 tới 90.2% hiệu suất trên internal evaluation - token usage giải thích 80% variance. Kiến trúc hub-and-spoke chia task cho specialist agents chuyên biệt, mỗi agent chỉ làm một việc cực tốt. Quy tắc bị vi phạm nhiều nhất: context KHÔNG tự động truyền giữa agents - phải pass tường minh hoàn toàn. Ba failure mode phổ biến nhất là narrow decomposition, lost context, và telephone effect.
Tôi đã chạy TradingAgents với DeepSeek - đây là những gì các tutorial không nói với bạn
TradingAgents v0.2.4 thêm DeepSeek khiến chi phí phân tích 100 mã giảm từ $480 xuống còn $27. Framework đa agent của UCLA/Tauric Research đạt 68k+ stars nhờ điểm mấu chốt này, không phải vì tính năng mới. Cơ chế tranh luận bull-bear thực sự xử lý confirmation bias - nhưng đây là công cụ nghiên cứu, không phải robot giao dịch tự động.
Claude Sub-agents vs. Agent Teams - Hai paradigm, một quyết định kiến trúc
Sub-agents chạy cô lập, fire-and-forget, phù hợp pipeline 2-4 bước tuần tự. Agent Teams dùng shared task list peer-to-peer, rẻ hơn 3-5 lần ở quy mô 10+ agents song song. Chọn sai kiến trúc là sai ngay từ đầu - không phải optimize sau.
OneManCompany: Khi 1 Người Có Thể Chạy Cả Một Công Ty AI
OneManCompany (OMC) là open-source AI OS phát hành năm 2026, cho phép 1 người vận hành công ty đầy đủ với AI agents đóng vai Engineer, Designer, HR và COO. Trên benchmark PRDBench, OMC đạt 84.67% success rate - vượt state-of-the-art 15.48 điểm phần trăm so với các multi-agent framework trước đó. Cài đặt 1 lệnh npx, miễn phí, Apache-2.0, chạy trên macOS/Windows/Linux.
Claude Code tự động xây CMS: khi AI chạy 5 task liên tiếp không cần can thiệp
claude-mem đạt 73.9k GitHub stars sau 7 tháng - plugin giúp Claude Code nhớ mọi thứ qua các session. Một demo cho thấy Claude tự chạy 5 task liên tiếp (98.8k tokens, 5h 42m) để nâng cấp toàn bộ CMS y tế mà không cần hỏi lại người dùng. Smart compression giảm context 95%, từ 10,000 tokens xuống còn ~500 tokens. Cài bằng một lệnh: npx claude-mem install.
Agency Không Nhân Viên: 6 Claude Agent Tự Động Kiếm $32,000/Tháng
Một developer Trung Quốc xây 6 AI agent trên Claude Sonnet 4.6 để vận hành toàn bộ agency UI design - không contractor, không project manager, không team. Chi phí API chỉ $480/tháng trong khi doanh thu đạt $32,000/tháng, ROI gần 66:1. Hunter tự tìm 200 site lỗi thời mỗi ngày, Pitcher gửi 28 proposal cá nhân hóa kèm mockup trước-sau, và con người chỉ cần can thiệp khi invoice vượt $5,000.
AI Operating System: 6 Bước Xây Dựng Hệ Thống Tự Động Hóa Toàn Diện
95% dự án AI thất bại trước khi ra production - không phải vì model kém mà vì thiếu kiến trúc và governance. Chi phí thực sự của một AI agent system thường gấp 7-8 lần ngân sách ban đầu: ngân sách $50K thường leo lên ~$380K khi tính đủ integration, orchestration và compliance. 6 bước xây dựng AI OS từ đầu theo thứ tự: workflow đơn - phân chia vai trò - shared memory - kết nối tool - decision loop - human oversight.
AI Operating System: Không Phải Chatbot, Đây Là Hạ Tầng Mới Của Doanh Nghiệp
AI Operating System không phải là chatbot hay model AI đơn lẻ - mà là một lớp điều phối thông minh gồm 6 tầng phối hợp như một công ty số. Multi-agent AI vượt trội single-agent Claude Opus tới 90.2% trong đánh giá nội bộ của Anthropic. Nhân viên trung bình chuyển đổi app ~1.200 lần mỗi ngày, mất 9% thời gian làm việc mỗi năm - AI OS giải quyết đúng bài toán này. Đây có thể là dịch chuyển lớn nhất trong phần mềm kể từ thời điểm cloud computing xuất hiện.
Kỷ Nguyên Multi-Agent: Building the Model Không Còn Là Thách Thức Khó Nhất
Agentic RAG tốn 3-10x token và 2-5x latency so với one-pass RAG, đẩy latency p95 lên tới 10-15 giây. Model performance giảm sau 32.000 tokens dù context window có thể lên đến hàng triệu. Tối ưu KV-cache giảm chi phí 10x nhờ tỷ lệ 100:1 input-to-output token. Context engineering đang thay thế prompt engineering làm kỹ năng cốt lõi của AI developer.
ViMax: Framework AI Tạo Video Tự Động Từ Một Câu Lệnh, Mã Nguồn Mở Từ HKU
ViMax là framework AI mã nguồn mở từ Đại học Hong Kong, điều phối 12 agent chuyên biệt để tạo video dài nhiều phút với nhân vật nhất quán hoàn toàn tự động. Tiết kiệm 40-60% thời gian sản xuất so với làm thủ công, rút ngắn từ 10-12 ngày xuống còn 4-5 ngày. Hoàn toàn miễn phí theo giấy phép MIT, hơn 8.100 stars trên GitHub.
AI Agents: The Complete Course - P2: Xây dựng multi-agent hoạt động thực sự
Build agent chạy được là dễ - build agent đáng tin cậy trong production là chuyện khác. Evaluation từ ngày đầu giúp catch lỗi trước users. Memory dynamic và Knowledge static là hai thứ hoàn toàn khác nhau. Phần lớn production systems dùng ít nhất 2 trong 3 loại guardrails.
Agentic Design Patterns: 21 Pattern để Xây AI Agent Thực Sự - P3: Multi-Agent, Memory và 3 Bước Làm Ngay
Multi-Agent không phải càng phức tạp càng tốt: 3 trong 6 topology là đủ cho hầu hết use case (Single Agent, Peer-to-Peer, Supervisor). Memory có 3 tầng: Session (hết conversation là mất), State (hết task là xóa), Memory (persistent cross-session dùng vector DB). Level 2 single Agent với Reflection và Context Engineering đã đủ cho 80% bài toán thực tế - đừng vội lên Level 3.
Agentic Design Patterns: 21 Pattern để Xây AI Agent Thực Sự - P1: Bạn Đang Xây Agent hay Chatbot?
Antonio Gullí (Engineering Director, Google) hệ thống hóa 21 design patterns để xây AI Agent trong quyển sách 472 trang. Điểm đau nhất trong sách: hầu hết thứ mọi người gọi là "AI Agent" thực ra là Level 0 - LLM trần, không tool, không memory. Sách cover code examples trên 3 framework: LangChain/LangGraph, Crew AI, Google ADK.