Agent Harness: Lý do thật sự khiến dự án AI agent của bạn không bao giờ ra được sản phẩm

TL;DR

Agent = LLM (não) + Harness (thân + thần kinh) + domain logic (nghề nghiệp). Thiếu harness thì LLM chỉ là não nằm trên bàn - không làm được gì.
Claude Code và agent tự xây dùng cùng Claude API, nhưng Claude Code thắng vì harness cực kỳ tinh vi: context assembly, diff mechanism, error recovery, model routing.
Phần lớn team agent đang dùng 80% thời gian để xây hạ tầng harness thay vì giải quyết bài toán kinh doanh.
AI industry đang phân hóa thành 3 lớp: Model (OpenAI/Anthropic/Google) - Harness Platform - Agent Application. Vị trí nguy hiểm nhất là ở giữa.

Ba lớp mà hầu hết mọi người đang nhầm lẫn

Công thức được đúc kết từ cộng đồng engineering: Agent = Model + Harness. Nếu anh không phải model, anh là harness.

LLM là não. Nó chỉ nhận text và trả text. Anh bảo nó "đọc file này", nó không tự làm được. Anh bảo nó "chạy đoạn code này xem output", nó cũng không. Thậm chí "đợi 5 giây rồi tiếp tục" - LLM không có khái niệm thời gian. Não thông minh nhất thế giới nếu lấy ra khỏi hộp sọ và đặt lên bàn thì không làm được gì.

Agent Harness là thân và hệ thần kinh. Nó cung cấp cho LLM khả năng tương tác với thế giới thực: đọc file system, chạy sandbox, quản lý context, nhớ trạng thái qua session, xử lý lỗi, kiểm soát quyền. Một production harness cần ít nhất 11 thành phần: orchestration loop, tool system, memory, context management, prompt construction, output parsing, state management, error handling, guardrails, verification loops, và subagent orchestration.

Agent là người có nghề. Luật sư, kế toán, bác sĩ - tất cả có cùng cấu trúc sinh học (LLM + harness tương tự), nhưng khác nhau vì domain knowledge, công cụ, và tiêu chí thành công. Một sales agent và một customer service agent có thể chạy cùng Claude, cùng harness framework - nhưng khác nhau ở business logic và workflow.

Ba lớp kiến trúc AI: Model Layer, Harness Layer, Agent Layer

Tại sao Claude Code thì được còn agent của bạn thì không

Câu hỏi nhiều người gặp: cùng dùng Claude API, tại sao Claude Code khiến anh cảm giác AI đang thay thế junior engineer, còn agent tự xây lại cứ sai hỏng?

Câu trả lời: Claude Code thắng ở harness. Model là như nhau. Phần khác biệt là engineering infrastructure.

Cụ thể Claude Code đã làm những gì mà DIY agent không làm:

Context assembly: Trước mỗi request, harness tự động gom: file đang mở, file vừa sửa, git uncommitted changes, lỗi terminal gần nhất. DIY agent thường dump cả thư mục vào prompt, model ngập trong context không liên quan rồi bắt đầu sai.
Diff mechanism: Claude Code không generate file mới rồi overwrite - cách đó thất bại với file trên vài trăm dòng. Thay vào đó: model chỉ output structured patch, harness apply patch lên file thật và rollback nếu fail.
Error recovery: Test fail, compile lỗi - harness tự capture output và feed lại vào input model để tiếp tục fix. Model không tự biết hành động của nó gây ra hậu quả gì - harness là người "dịch" hậu quả đó cho model.
Model routing: Một lần "sửa bug" có thể dùng nhiều model: lightweight model cho intent recognition và file retrieval, strong model cho complex reasoning. Harness quyết định routing.

Dữ liệu từ cộng đồng: LangChain thay đổi chỉ phần harness infrastructure (giữ nguyên model, nguyên weights) và nhảy từ ngoài top 30 lên rank 5 TerminalBench 2.0. Thêm verification loop cải thiện output quality 2-3x. via Addy Osmani

Model quyết định trần, harness quyết định tỉ lệ hiện thực hóa. Hai người IQ bằng nhau, một người được đào tạo chuyên nghiệp và có đầy đủ công cụ, một người tay không - kết quả hoàn toàn khác nhau.

80% thời gian đang biến mất ở đâu

Nhìn vào daily work của hầu hết team agent, ta thấy một thực tế: họ không đang giải quyết bài toán kinh doanh. Họ đang xây hạ tầng.

Team muốn làm trading agent dùng 2 trong 3 tháng để: connect market data API, xây order execution API, log từng quyết định giao dịch, làm anomaly rollback, monitoring stability. Thời gian còn lại mới đến chiến lược giao dịch, kiểm soát rủi ro - thứ mà team thực sự giỏi.

Team muốn làm marketing agent thì kỹ sư ngập trong: xử lý tool call fail, CRM/ad platform auth, A/B test data feedback, context bị cắt sau nhiều turns.

Điều này không phải vấn đề của một team. Theo khảo sát enterprise: 46% tổ chức coi tích hợp với hệ thống hiện có là thách thức số 1, 40% kể đến security/compliance. Chỉ 3% công ty đang scale agentic AI thành công qua nhiều phòng ban, dù 62% đang thử nghiệm. via Arcade.dev State of AI Agents 2026

Giao cho team SaaS xây harness từ đầu tương đương bảo team e-commerce tự viết database engine. Họ có thể làm được - nhưng đến lúc xong thì market window đã qua.

Harness Platform - AWS của thời AI

Những năm 90, muốn làm e-commerce anh phải tự viết web server, tự implement HTTP, tự quản lý database storage engine, tự mua rack server. Hôm nay chỉ cần AWS, Vercel, và tập trung vào business logic. Web infrastructure được chuẩn hóa thành platform - ứng dụng mới bùng nổ.

AI agent đang ở giai đoạn "web chưa có AWS".

CREAO là một trong những harness platform đang xuất hiện. Trong cuộc thi agent trading họ tổ chức (25/5/2026), người tham gia chỉ cần tập trung vào một việc: chiến lược giao dịch. Market data, tool calling, state management, observability, error recovery - CREAO lo toàn bộ. Họ vừa raise $10M vòng mới từ Prosperity7 Ventures, tổng funding $25M trong chưa đầy 1 năm. via VentureBeat

Concept này còn có tên "Harness-as-a-Service" (HaaS): thay vì build trên LLM API (trả về completion), build trên harness API (trả về runtime). Claude Agent SDK, Codex SDK, OpenAI Agents SDK đều đang đi hướng này.

47% tổ chức hiện đang dùng hybrid build-and-buy: kết hợp off-the-shelf harness với custom domain logic. Đây là mô hình hợp lý nhất - giống cách enterprise adopt các infrastructure technology trước đây.

Ba lớp của AI industry và vị trí nào nguy hiểm nhất

Nhìn toàn cảnh, AI industry đang phân hóa thành 3 lớp với số phận khác nhau:

Lớp 1 - Model: OpenAI, Anthropic, Google, DeepSeek. Cực kỳ capital-intensive. Cuối cùng sẽ hội tụ về vài công ty toàn cầu. DeepSeek đã bắt đầu xây đội ngũ Agent Harness riêng - tín hiệu cho thấy ngay cả model player cũng hiểu harness quan trọng đến mức nào.

Lớp 2 - Harness Platform: Sẽ là AWS của thời AI. Rào cản không phải một điểm kỹ thuật đơn lẻ, mà là chiều sâu engineering + chiều rộng ecosystem + khả năng customer success. Sau khi Claude Code leak 512,000 dòng source code vào tháng 3/2026, blueprint của production harness trở thành public knowledge - open-source harnesses bùng nổ (claw-code 100K GitHub stars trong 24h, OpenCode 127K+). Điều này cho thấy harness đang commoditize nhanh.

Lớp 3 - Agent Application: Sẽ có hàng nghìn công ty.护城河không nằm ở công nghệ mà ở hiểu biết về khách hàng, workflow, và domain sau nhiều năm tích lũy. Harness là điện nước thuê, không phải lợi thế cạnh tranh.

Vị trí nguy hiểm nhất: Những "half-baked agent product" - không đủ infra để là platform, không đủ domain depth để là application. Bị hai đầu ép chặt, sẽ bị market loại bỏ sớm nhất.

Kết

Câu hỏi dành cho bất kỳ team nào đang làm agent: team mình thực sự giỏi cái gì?

Nếu câu trả lời là "hiểu khách hàng, hiểu business, hiểu workflow" - thì đó là lợi thế cạnh tranh thật sự. Harness là hạ tầng - giao cho platform chuyên nghiệp và dùng 100% năng lực vào bài toán kinh doanh.

Khách hàng không trả tiền thêm vì anh "tự xây agent framework". Họ trả tiền vì anh hiểu business của họ hơn bất kỳ ai khác. via The Anatomy of an Agent Harness