- Harness là Claude Code plugin tạo agent team hoàn chỉnh từ một câu prompt, áp dụng 6 pattern kiến trúc đã được kiểm chứng.
- A/B test trên 15 task kỹ thuật cho thấy chất lượng output tăng +60% (49.5 lên 79.3), 15/15 win-rate, variance giảm -32%.
- Repo harness-100 đi kèm cung cấp sẵn 100 agent team production-ready cho 10 domain.
TL;DR
Harness là một meta-skill cho Claude Code - thay vì tự tay viết agent definitions, skill files và orchestration protocols, bạn chỉ cần gõ "build a harness for this project" và Harness sẽ phân tích domain, chọn pattern phù hợp rồi tạo ra toàn bộ cấu trúc agent team. Dự án đạt 4.7k stars trên GitHub và kết quả A/B test cho thấy chất lượng output tăng đáng kể với các task phức tạp.

Harness - công cụ tạo agent team cho Claude Code
Vấn Đề Nó Giải Quyết
Khi bạn muốn dùng multi-agent với Claude Code, việc thiết lập thủ công đòi hỏi khá nhiều bước: viết .claude/agents/*.md cho từng agent, định nghĩa input/output protocol, thiết lập orchestration logic, xử lý error handling và wire communication giữa các agent. Với task phức tạp cần 3-5 agent chuyên biệt, quá trình này có thể mất vài giờ chỉ để setup.
Harness giải quyết đúng điểm nghẽn này. Thay vì code từ đầu, nó hoạt động như một team-architecture factory - bạn mô tả domain, nó sinh ra toàn bộ cấu trúc.
Cách Hoạt Động: Pipeline 6 Pha
Sau khi trigger, Harness chạy qua 6 pha tuần tự:
Domain Analysis - phân tích codebase, xác định loại task, phát hiện conflict với agent hiện có
Team Architecture Design - chọn pattern phù hợp trong 6 pattern có sẵn
Agent Definition Generation - tạo file
.claude/agents/*.mdvới role, principles, I/O protocolSkill Generation - tạo skill files với Progressive Disclosure (metadata nhẹ, chi tiết load khi cần)
Integration & Orchestration - wire agents với nhau qua message-based, task-based hoặc file-based data passing
Validation & Testing - verify trigger, dry-run test, so sánh with/without-skill
6 Pattern Kiến Trúc
Đây là phần cốt lõi của Harness. Mỗi pattern được thiết kế cho một loại workload khác nhau:

Agent team phối hợp theo pattern Pipeline với các node chuyên biệt
Pipeline - output của agent này là input của agent tiếp theo. Phù hợp với workflow tuyến tính như code generation → review → testing → deployment
Fan-out/Fan-in - nhiều agent xử lý song song, kết quả tổng hợp lại. Dùng cho deep research hay code audit đa chiều
Expert Pool - tùy context mà gọi agent chuyên biệt phù hợp, không phải lúc nào cũng dùng hết
Producer-Reviewer - một agent sinh output, một agent review và cho feedback. Tốt cho content production hay webtoon
Supervisor - agent trung tâm phân phối task động cho các agent con. YouTube content creator dùng pattern này tốt
Hierarchical Delegation - top-down recursive, agent cấp cao ủy quyền dần xuống. Phù hợp với data pipeline phức tạp
Kết Quả Benchmark
Tác giả chạy A/B test trên 15 task kỹ thuật ở 3 mức độ khó, so sánh output có và không có Harness (via revfactory/claude-code-harness):
Metric | Không có Harness | Có Harness | Cải thiện |
|---|---|---|---|
Điểm chất lượng trung bình | 49.5 | 79.3 | +60% |
Win rate | - | - | 15/15 (100%) |
Variance output | - | - | -32% |
Điểm đáng chú ý: hiệu quả tăng tỉ lệ thuận với độ phức tạp của task. Task cơ bản cải thiện +23.8 điểm, task nâng cao +29.6, task expert lên đến +36.2. Harness càng phát huy khi task càng khó.
Lưu ý: đây là kết quả author-measured A/B, n=15, chưa có third-party replication độc lập. Nhóm tác giả khuyến nghị tự chạy pilot 2-4 tuần để đo số liệu cụ thể cho use case của mình.
Cài Đặt và Quick Start
Cài đặt qua Claude Code marketplace chỉ cần 2 lệnh:
/plugin marketplace add revfactory/harness
/plugin install harness@harness-marketplaceYêu cầu bắt buộc: bật Agent Teams trong Claude Code:
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1Sau khi cài, trigger bằng prompt tự nhiên:
Build a harness for deep research. I need an agent team that can investigate
any topic from multiple angles - web search, academic sources, community
sentiment - then cross-validate findings and produce a comprehensive report.Harness sẽ tự nhận diện pattern phù hợp (Fan-out/Fan-in cho deep research) và generate toàn bộ agent team.
Giới Hạn Cần Biết
Claude Code only - Harness hiện chỉ chạy trên Claude Code runtime. Codex có thể dùng meta-harness thay thế
Benchmark chưa được verify độc lập - +60% là số của tác giả, chưa có third-party replication
Phụ thuộc Claude Code limits - MCP tool output mặc định giới hạn 25K token, khuyến nghị tối đa 5-6 MCP server cùng lúc
Chưa có cross-runtime - kế hoạch tích hợp với meta-harness, harness-init, OpenRig đang trên roadmap
Ai Nên Dùng Ngay
Harness phù hợp nhất với:
Developer làm task phức tạp cần nhiều agent phối hợp - code review đa chiều, research tổng hợp, pipeline phức tạp
Senior engineer muốn scale productivity - commit một harness lên version control là toàn team được dùng
Team mới bắt đầu với multi-agent - thay vì mày mò từ đầu, Harness cho pattern đã được kiểm chứng
Nếu task của bạn đơn giản và well-defined (ví dụ CI bot chạy test và post result), bạn không cần Harness - wire thủ công sẽ nhanh hơn. Harness phát huy giá trị khi task có nhiều agent, extended session và communication protocol phức tạp.
Kết
Harness đặt ra một hướng thú vị trong không gian multi-agent: thay vì cung cấp agent có sẵn (catalog), nó cung cấp factory tạo ra agent team phù hợp với domain cụ thể của bạn. 4.7k stars trong thời gian ngắn cho thấy cộng đồng Claude Code đang đón nhận hướng tiếp cận này.
Nếu bạn đang dùng Claude Code và có task cần 2+ agent phối hợp, Harness là điểm khởi đầu đáng thử. Repo cũng đi kèm harness-100 với 100 agent team production-ready để tham khảo.
