Harness Engineering - Kỹ thuật thứ ba mà mọi developer dùng AI agent cần học

TL;DR

Harness Engineering là kỷ luật thiết kế môi trường thực thi xung quanh AI agent - tầng thứ ba sau Prompt Engineering và Context Engineering.
5 subsystem cốt lõi: Instructions, State, Verification, Scope, Session Lifecycle.
Cùng model Opus 4.5: solo agent ($9/20 phút) = game hỏng; 3-agent harness ($200/6 giờ) = game hoàn chỉnh.
OpenAI tạo ra 1 triệu dòng production code và 1.500 pull request trong 5 tháng với đội 3 người, không viết tay một dòng nào.
learn-harness-engineering là khóa học miễn phí: 12 bài giảng, 6 projects, 15 ngôn ngữ, đang có 9.8k sao trên GitHub.

Vấn đề bạn đã gặp

Bạn giao một task cho Claude hoặc Codex trong repo của mình. Agent bắt đầu tốt - đọc file, viết code, trông có vẻ năng suất. Rồi có gì đó sai. Nó bỏ qua một bước. Nó phá test. Nó báo xong nhưng thực ra không có gì hoạt động. Bạn tốn nhiều thời gian dọn dẹp hơn là nếu tự làm từ đầu.

Đây không phải lỗi của model. Đây là lỗi của harness.

Vấn đề này có tên gọi chính thức từ tháng 2/2026, khi Mitchell Hashimoto - người tạo ra Terraform và đồng sáng lập HashiCorp - chia sẻ một thói quen ông phát triển khi làm việc với AI agent: mỗi lần agent mắc lỗi, ông không chỉ sửa lỗi đó, ông còn engineer một fix vĩnh viễn vào môi trường agent. Ông gọi đây là "engineering the harness". Trong vài tuần, cả OpenAI lẫn Anthropic đều xuất bản bài viết kỹ thuật mở rộng khái niệm này, và Harness Engineering trở thành một kỷ luật chính thức.

Harness Engineering là gì?

Để hiểu tại sao nó quan trọng, hãy nhìn vào 3 tầng phát triển AI agent:

Prompt Engineering - tối ưu những gì bạn nói với model trong một lượt hội thoại.
Context Engineering - quản lý những gì model có thể thấy trong context window.
Harness Engineering - thiết kế thế giới mà agent vận hành trong nhiều giờ tự động, hàng trăm quyết định, không cần giám sát liên tục.

Hai tầng đầu định hình chất lượng một lượt hội thoại. Tầng thứ ba định hình việc agent có thể vận hành ổn định hàng giờ mà không cần bạn ngồi trông hay không.

Một cách hình dung: model là CPU, context window là RAM hạn chế. Harness là hệ điều hành - quản lý memory, khởi tạo môi trường, định nghĩa các tool driver, cho phép agent tập trung vào reasoning.

5 subsystem cốt lõi

Một harness tốt bao gồm 5 thành phần, mỗi thành phần có một nhiệm vụ duy nhất:

Instructions: Nói với agent làm gì, theo thứ tự nào, và cần đọc gì trước khi bắt đầu. Không phải một file khổng lồ - mà là cấu trúc progressive disclosure mà agent tự điều hướng theo nhu cầu. AGENTS.md hoặc CLAUDE.md chỉ là bản đồ, không phải bách khoa toàn thư.
State: Theo dõi những gì đã làm, đang làm, và cần làm tiếp theo. Lưu xuống disk để session sau pick up chính xác chỗ session trước dừng lại - không cần bắt đầu lại từ đầu.
Verification: Chỉ test suite pass mới tính là bằng chứng hoàn thành. Agent không được tuyên bố xong mà không có runnable proof.
Scope: Một feature mỗi lần. Không overreach. Không half-finish ba thứ cùng lúc. Không rewrite feature list để ẩn công việc chưa làm xong.
Session Lifecycle: Khởi tạo khi bắt đầu. Dọn dẹp khi kết thúc. Để lại clean restart path cho session tiếp theo.

Bằng chứng từ thực tế

Anthropic đã chạy một thử nghiệm có kiểm soát: cùng một model (Opus 4.5), cùng một prompt ("build a 2D retro game editor").

Solo agent (không harness): $9, 20 phút - game khởi động được nhưng entity-to-runtime connections bị hỏng ở code level.
3-agent harness (Planner + Generator + Evaluator): $200, 6 giờ - game hoàn chỉnh có thể chơi được, với AI-assisted level generation, sprite animation và sound effects.

Model không thay đổi. Chỉ có harness thay đổi.

Với kiến trúc 3 agent lấy cảm hứng từ GAN: Planner mở rộng prompt ngắn thành product spec đầy đủ, Generator triển khai từng feature, Evaluator dùng Playwright MCP để click qua app như user thật - test UI, API endpoint, database state. Nếu một criterion nào thấp hơn ngưỡng, sprint fail và Generator nhận feedback cụ thể để sửa.

Khi Anthropic nâng lên Opus 4.6, harness được đơn giản hóa đáng kể - bỏ sprint construct, bỏ context reset - và thử nghiệm trên Digital Audio Workstation (DAW) đầy đủ tính năng trong trình duyệt: 3 giờ 50 phút, $124.70.

OpenAI cũng công bố kết quả tương tự với Codex: một đội 3 người bắt đầu với repo trống vào tháng 8/2025, trong 5 tháng tạo ra hơn 1 triệu dòng production code và 1.500 pull request đã merge, không viết tay một dòng nào. Ngưỡng cụ thể: service phải khởi động dưới 800 milliseconds trước khi task được tính là hoàn thành. Codex task chạy hơn 6 giờ liên tục - thường là khi engineers đang ngủ.

Một trường hợp khác từ team Cognition (Devin): họ phát hiện model bắt đầu tắt dần khi context window gần đầy - không phải vì task xong, mà vì nó "cảm nhận" được giới hạn đang đến gần. Fix của họ là harness engineering thuần túy: bật 1 triệu token context beta nhưng cap thực tế ở 200.000 tokens, khiến model tin rằng còn nhiều runway. Anxiety biến mất. Không cần thay model.

Khóa học learn-harness-engineering

Repo walkinglabs/learn-harness-engineering tổng hợp những lý thuyết và thực hành Harness Engineering tiên tiến nhất từ OpenAI, Anthropic, Cursor, LangChain và Martin Fowler thành một khóa học project-based có cấu trúc.

Con số hiện tại: 9.8k sao, 1.1k forks, 19+ contributors, 15 ngôn ngữ (bao gồm tiếng Việt).

12 bài giảng, mỗi bài trả lời một câu hỏi cốt lõi:

L01: Tại sao model mạnh vẫn thất bại trên task thực tế?
L02: Harness thực sự có nghĩa là gì?
L03: Tại sao repo phải là source of truth duy nhất?
L04: Tại sao một file instruction khổng lồ không hiệu quả?
L05-L12: Continuity, initialization, scope control, feature lists, verification, E2E testing, observability, clean state.

6 projects đều làm việc trên cùng một app Electron:

P01: So sánh prompt-only vs. rules-first trực tiếp
P02: Cấu trúc lại repo để agent đọc được
P03: Multi-session continuity - agent pick up đúng chỗ dừng
P04: Scope control - không làm quá nhiều hay quá ít
P05: Self-verification - agent tự kiểm tra công việc của mình
P06: Capstone - xây harness hoàn chỉnh từ đầu

Mỗi project: solution của project trước là starter của project sau. App tiến hóa cùng với kỹ năng harness của bạn. Ngoài ra còn có Resource Library với copy-ready templates (AGENTS.md, feature_list.json, init.sh) để dùng ngay vào repo của mình.

Ai nên học?

Khóa học dành cho những người đã đang dùng coding agent và muốn cải thiện stability - không phải cho người mới tìm hiểu AI từ đầu. Cụ thể:

Engineers đang dùng Claude Code, Codex và thấy kết quả không ổn định, agent hay tuyên bố xong sớm, hoặc session sau không nhớ session trước.
Tech leads cần hiểu environment design ảnh hưởng thế nào đến output của AI agent ở quy mô team.
Researchers và AI builders muốn có framework có hệ thống để evaluate harness design.

Yêu cầu kỹ thuật: thành thạo terminal và git, đọc/viết được code ít nhất một ngôn ngữ, biết đọc logs và debug cơ bản. Cần có Claude Code, Codex, hoặc coding agent tương tự để chạy projects.

Nguyên tắc thiết kế để xóa bỏ

Một trong những insight sâu sắc nhất của lĩnh vực này: mỗi component trong harness encode một giả định về giới hạn của model. Sprint decomposition cần thiết khi model mất coherence trên task dài. Context reset cần thiết khi model lo lắng về context window. Evaluator agent cần thiết khi self-evaluation bias không kiểm soát được.

Nhưng những giả định này sẽ hết hạn. Opus 4.6 tốt hơn Opus 4.5 đến mức một số component trở thành overhead không cần thiết. Câu hỏi đầu tiên sau mỗi model release không phải là "tôi có thể thêm gì?" mà là "tôi có thể xóa gì?"

Không gian harness combination không thu hẹp khi model giỏi hơn - nó dịch chuyển. Công việc của AI engineer là terus-menerus tìm ra combination mới tiếp theo, đẩy model đến những task phức tạp hơn những gì nó có thể làm ở baseline.

Kết

Nếu bạn đang dùng coding agent và thấy kết quả không ổn định, câu trả lời nhiều khả năng không nằm ở model. Nó nằm ở harness.

learn-harness-engineering là điểm khởi đầu tốt nhất hiện có cho chủ đề này: miễn phí, có cấu trúc, project-based, và tổng hợp trực tiếp từ những gì OpenAI và Anthropic đang làm trong production.

via walkinglabs/learn-harness-engineering