TL;DR

Harness là một meta-skill cho Claude Code - thay vì tự tay viết agent definitions, skill files và orchestration protocols, bạn chỉ cần gõ "build a harness for this project" và Harness sẽ phân tích domain, chọn pattern phù hợp rồi tạo ra toàn bộ cấu trúc agent team. Dự án đạt 4.7k stars trên GitHub và kết quả A/B test cho thấy chất lượng output tăng đáng kể với các task phức tạp.

Harness - The Team-Architecture Factory for Claude Code

Harness - công cụ tạo agent team cho Claude Code

Vấn Đề Nó Giải Quyết

Khi bạn muốn dùng multi-agent với Claude Code, việc thiết lập thủ công đòi hỏi khá nhiều bước: viết .claude/agents/*.md cho từng agent, định nghĩa input/output protocol, thiết lập orchestration logic, xử lý error handling và wire communication giữa các agent. Với task phức tạp cần 3-5 agent chuyên biệt, quá trình này có thể mất vài giờ chỉ để setup.

Harness giải quyết đúng điểm nghẽn này. Thay vì code từ đầu, nó hoạt động như một team-architecture factory - bạn mô tả domain, nó sinh ra toàn bộ cấu trúc.

Cách Hoạt Động: Pipeline 6 Pha

Sau khi trigger, Harness chạy qua 6 pha tuần tự:

  1. Domain Analysis - phân tích codebase, xác định loại task, phát hiện conflict với agent hiện có

  2. Team Architecture Design - chọn pattern phù hợp trong 6 pattern có sẵn

  3. Agent Definition Generation - tạo file .claude/agents/*.md với role, principles, I/O protocol

  4. Skill Generation - tạo skill files với Progressive Disclosure (metadata nhẹ, chi tiết load khi cần)

  5. Integration & Orchestration - wire agents với nhau qua message-based, task-based hoặc file-based data passing

  6. Validation & Testing - verify trigger, dry-run test, so sánh with/without-skill

6 Pattern Kiến Trúc

Đây là phần cốt lõi của Harness. Mỗi pattern được thiết kế cho một loại workload khác nhau:

Agent team architecture generated by Harness

Agent team phối hợp theo pattern Pipeline với các node chuyên biệt

  • Pipeline - output của agent này là input của agent tiếp theo. Phù hợp với workflow tuyến tính như code generation → review → testing → deployment

  • Fan-out/Fan-in - nhiều agent xử lý song song, kết quả tổng hợp lại. Dùng cho deep research hay code audit đa chiều

  • Expert Pool - tùy context mà gọi agent chuyên biệt phù hợp, không phải lúc nào cũng dùng hết

  • Producer-Reviewer - một agent sinh output, một agent review và cho feedback. Tốt cho content production hay webtoon

  • Supervisor - agent trung tâm phân phối task động cho các agent con. YouTube content creator dùng pattern này tốt

  • Hierarchical Delegation - top-down recursive, agent cấp cao ủy quyền dần xuống. Phù hợp với data pipeline phức tạp

Kết Quả Benchmark

Tác giả chạy A/B test trên 15 task kỹ thuật ở 3 mức độ khó, so sánh output có và không có Harness (via revfactory/claude-code-harness):

Metric

Không có Harness

Có Harness

Cải thiện

Điểm chất lượng trung bình

49.5

79.3

+60%

Win rate

-

-

15/15 (100%)

Variance output

-

-

-32%

Điểm đáng chú ý: hiệu quả tăng tỉ lệ thuận với độ phức tạp của task. Task cơ bản cải thiện +23.8 điểm, task nâng cao +29.6, task expert lên đến +36.2. Harness càng phát huy khi task càng khó.

Lưu ý: đây là kết quả author-measured A/B, n=15, chưa có third-party replication độc lập. Nhóm tác giả khuyến nghị tự chạy pilot 2-4 tuần để đo số liệu cụ thể cho use case của mình.

Cài Đặt và Quick Start

Cài đặt qua Claude Code marketplace chỉ cần 2 lệnh:

/plugin marketplace add revfactory/harness
/plugin install harness@harness-marketplace

Yêu cầu bắt buộc: bật Agent Teams trong Claude Code:

CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

Sau khi cài, trigger bằng prompt tự nhiên:

Build a harness for deep research. I need an agent team that can investigate
any topic from multiple angles - web search, academic sources, community
sentiment - then cross-validate findings and produce a comprehensive report.

Harness sẽ tự nhận diện pattern phù hợp (Fan-out/Fan-in cho deep research) và generate toàn bộ agent team.

Giới Hạn Cần Biết

  • Claude Code only - Harness hiện chỉ chạy trên Claude Code runtime. Codex có thể dùng meta-harness thay thế

  • Benchmark chưa được verify độc lập - +60% là số của tác giả, chưa có third-party replication

  • Phụ thuộc Claude Code limits - MCP tool output mặc định giới hạn 25K token, khuyến nghị tối đa 5-6 MCP server cùng lúc

  • Chưa có cross-runtime - kế hoạch tích hợp với meta-harness, harness-init, OpenRig đang trên roadmap

Ai Nên Dùng Ngay

Harness phù hợp nhất với:

  • Developer làm task phức tạp cần nhiều agent phối hợp - code review đa chiều, research tổng hợp, pipeline phức tạp

  • Senior engineer muốn scale productivity - commit một harness lên version control là toàn team được dùng

  • Team mới bắt đầu với multi-agent - thay vì mày mò từ đầu, Harness cho pattern đã được kiểm chứng

Nếu task của bạn đơn giản và well-defined (ví dụ CI bot chạy test và post result), bạn không cần Harness - wire thủ công sẽ nhanh hơn. Harness phát huy giá trị khi task có nhiều agent, extended session và communication protocol phức tạp.

Kết

Harness đặt ra một hướng thú vị trong không gian multi-agent: thay vì cung cấp agent có sẵn (catalog), nó cung cấp factory tạo ra agent team phù hợp với domain cụ thể của bạn. 4.7k stars trong thời gian ngắn cho thấy cộng đồng Claude Code đang đón nhận hướng tiếp cận này.

Nếu bạn đang dùng Claude Code và có task cần 2+ agent phối hợp, Harness là điểm khởi đầu đáng thử. Repo cũng đi kèm harness-100 với 100 agent team production-ready để tham khảo.