// Popular Articles
Bốn kiến trúc multi-agent: khi nào dùng gì và sự thật về production
Benchmark mới nhất test 10.000 tài liệu SEC qua 5 LLM lớn cho thấy Reflexive đạt F1 cao nhất nhưng tốn gấp 2.3 lần chi phí. Hierarchical Supervisor là lựa chọn tốt nhất cho hầu hết workload production với 98.5% độ chính xác tại 60.7% chi phí. Parallel nhanh hơn Sequential tới 1.84 lần nhưng là pattern kém hiệu quả token nhất. Gartner dự báo hơn 40% pilot AI agent sẽ bị huỷ vào 2027 - kiến trúc mới là nguyên nhân.
Agent Skills: Hướng dẫn chi tiết xây skill từ SKILL.md đến production
Progressive disclosure hoạt động 3 tầng: 30-50 token/skill lúc startup, full body khi triggered, scripts/references chỉ load khi cần. Description là trigger duy nhất - viết sai là skill không bao giờ chạy. Dynamic context injection (!git diff HEAD) inject live data trước khi LLM đọc. Skills kế thừa toàn bộ permissions của agent - 36% community skills có lỗ hổng bảo mật.
Agent Memory Engineering: Tại sao memory không thể copy giữa Claude Code, Codex và Hermes
Memory là điểm hợp nhất giữa model và harness - không phải chỉ là dữ liệu. Claude Code, Codex (OpenAI) và Hermes (Nous Research) dùng ba kiến trúc hoàn toàn khác nhau, khiến memory không thể chuyển giữa các agent chỉ bằng cách copy file. Vector database đã thua - người thắng là “ LLM + markdown + filesystem tools “