Bốn kiến trúc multi-agent: khi nào dùng gì và sự thật về production
Benchmark mới nhất test 10.000 tài liệu SEC qua 5 LLM lớn cho thấy Reflexive đạt F1 cao nhất nhưng tốn gấp 2.3 lần chi phí. Hierarchical Supervisor là lựa chọn tốt nhất cho hầu hết workload production với 98.5% độ chính xác tại 60.7% chi phí. Parallel nhanh hơn Sequential tới 1.84 lần nhưng là pattern kém hiệu quả token nhất. Gartner dự báo hơn 40% pilot AI agent sẽ bị huỷ vào 2027 - kiến trúc mới là nguyên nhân.
Harness Engineering (Phần 4): Giải Phẫu Cơ Sở Hạ Tầng Biến LLM Thành Agent Thực Sự
LangChain tăng 13.7 điểm trên TerminalBench 2.0 mà không đổi model - chỉ thay harness. Agent harness là toàn bộ cơ sở hạ tầng bao quanh LLM: orchestration loop, tools, memory, context management, guardrails. 12 thành phần phân biệt chatbot demo với agent production-grade.
7 Primitives AI Agent Không Bao Giờ Cũ
Context engineering quyết định thứ gì vào model window, không phải cách viết prompt. Single-agent đánh bại multi-agent trong 64% benchmark task với chi phí thấp hơn 2x. Evals biến agent thành sản phẩm thật thay vì demo. MCP là giao thức chuẩn kết nối tool - học shape của nó, bỏ qua phần còn lại.