Dựng hệ thống 4-agent với Claude Code trong một cuối tuần

TL;DR

Hầu hết mọi người nghĩ dựng một hệ thống multi-agent cần bằng khoa học máy tính, nền tảng DevOps và ba cuối tuần debug hạ tầng. Không phải vậy. Nó chỉ cần hiểu rõ một nguyên lý: một đội chuyên gia luôn vượt trội một generalist làm việc một mình. Khi bạn bắt một Claude instance vừa research, vừa viết, vừa review, vừa phân phối trong cùng một session, bạn nhận output trung bình ở mọi hạng mục - context liên tục đổi, tiêu chuẩn chất lượng xung đột, model tối ưu cho quá nhiều thứ một lúc. Khi bạn dựng bốn agent chuyên biệt với vai trò rõ ràng và một Orchestrator điều phối, mỗi agent làm đúng một việc thật tốt.

So sánh kiến trúc subagents và Agent Teams trong Claude Code — Subagents chỉ report kết quả lên main agent; Agent Teams cho phép teammates nhắn trực tiếp với nhau qua shared task list. Nguồn: Claude Code docs.

Vấn đề của một agent làm tất cả

Mọi tác vụ knowledge work phức tạp đều đi qua bốn pha: tiếp nhận và research, sản xuất, kiểm soát chất lượng, output và phân phối. Một agent context-switching giữa cả bốn pha tạo ra output không nhất quán về chất lượng, chậm khi thực thi, và khó debug khi có gì đó hỏng.

Bài toán không chỉ là chất lượng. Một agent chạy bốn pha tuần tự mất gấp bốn lần thời gian so với bốn agent chạy song song khi workflow cho phép. Với một content operation sản xuất 20 bài mỗi tuần, riêng khác biệt về parallelism đã đủ biện minh cho kiến trúc này.

Có lý do kỹ thuật phía sau. Generalist agent gặp token bloat - xử lý nhiều domain cần prompt dài vượt 8K token, tăng cả latency lẫn chi phí. Chúng cũng hay overfit sai intent, chọn sai tool cho ý định thực của bạn. Trong khi đó, specialist model đạt 95-99% accuracy trong domain cụ thể như medical imaging hay fraud detection - thứ mà hệ thống generalist khó với tới. Ngay cả ở tầng kiến trúc model, Mixtral MoE chỉ activate 12.9B trong tổng 45B parameters mỗi token: chuyên môn hóa thắng dense model về hiệu năng trên mỗi đơn vị compute.

Tại sao là bốn agent, không phải một

Con số bốn không tùy tiện. Bốn agent là cấu trúc đội tối thiểu khả thi phủ trọn vòng đời knowledge work. Bốn agent chuyên biệt cho output nhất quán vì mỗi agent có một việc, nhanh vì agent chạy song song ở nơi workflow cho phép, dễ debug vì lỗi được cô lập tại agent nơi nó xảy ra.

Đây cũng là khuyến nghị chính thức. Tài liệu Claude Code đề xuất bắt đầu với 3-5 teammates cho hầu hết workflow, mỗi teammate ôm 5-6 task để duy trì năng suất mà không bị context-switching quá đà. Ba teammate tập trung thường vượt trội năm teammate phân tán.

Kiến trúc 4-agent và Orchestrator

Hệ thống bốn agent Research, Write, Review, Publish kết nối qua Orchestrator trung tâm — Bốn agent chuyên biệt, một Orchestrator điều phối luồng và xử lý lỗi.

Research Agent - thu thập và tổng hợp thông tin. Input: một topic hoặc brief. Output: một research brief có cấu trúc. Không bao giờ: viết, edit, hay publish.
Production Agent - biến research brief thành content hoàn chỉnh. Input: brief của Research Agent. Output: bản draft đầu tiên. Yếu tố quan trọng nhất là voice profile - trích xuất pattern từ 10 bài tốt nhất của bạn để content nghe như bạn viết.
Quality Agent - đánh giá và cải thiện output. Chấm điểm 5 tiêu chí (voice match, hook strength, information density, CTA clarity, format compliance). Ngưỡng đạt: 8/10 trên cả năm. Dưới ngưỡng thì trả lại Production Agent kèm revision brief cụ thể, không feedback mơ hồ.
Distribution Agent - format và deploy content đã duyệt. Twitter/X cần tối đa 280 ký tự mỗi tweet, thread cho nội dung dài; LinkedIn cho phép câu dài hơn, cấu trúc narrative; Newsletter cần header đầy đủ, HTML-compatible.

Orchestrator không phải agent thứ năm - nó là logic routing kết nối bốn agent thành một workflow mạch lạc. Nhiệm vụ: chia task đầu vào thành brief cho từng agent, monitor output folder, chuyển output đúng cho agent kế tiếp, xử lý revision và failure. Orchestrator không bao giờ bỏ qua Quality Agent, không tự duyệt output của mình, không ra quyết định sáng tạo - chỉ route và quản lý.

Dựng từng agent: từ zero đến chạy được

Cài Claude Code, tạo project directory, dựng folder structure agent dùng: inbox/ (task vào), research-briefs/, drafts/, approved-content/, distribution/, logs/. Tạo một CLAUDE.md gốc định nghĩa system overview, agent roster, folder structure, shared standards (mọi file đặt tên YYYY-MM-DD-[type]-[topic].md), quality bar và hard rules (không bao giờ xóa file, không publish mà chưa có Quality Agent approve, log mọi action trước khi làm).

Mỗi agent là một file system prompt riêng - ví dụ research-agent.md định nghĩa identity ("bạn là specialist research agent, chỉ làm research brief, không viết content"), trigger, pre-task checklist, research process, output format, quality standard, logging. Lặp lại pattern này cho cả bốn agent. Trên Claude Code v2.1.32 trở lên, bật flag CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS để dùng Agent Teams - team lead spawn teammates, mỗi teammate có context window riêng, tự claim task từ shared list.

Lần chạy end-to-end đầu tiên mất 15-30 phút tùy độ phức tạp. Sau vài chục lần, hệ thống thấy không thể thiếu.

Cái giá phải trả: khi nào KHÔNG nên dùng

Agent teams tốn token nhiều hơn hẳn một session đơn - mỗi teammate là một Claude instance riêng, token scale tuyến tính theo số teammate. Multi-agent chỉ hợp lý với khoảng 5% tác vụ agent-assisted, không phải tất cả. Parallel execution chỉ hoạt động khi các agent không đụng cùng file - hai teammate edit cùng file dẫn tới overwrite.

Agent Teams hiện vẫn experimental: không có session resumption với in-process teammates, task status đôi khi lag, chỉ một team mỗi lead cùng lúc, không nested team. Với tác vụ tuần tự, edit cùng file, hay nhiều dependency - một session đơn hoặc subagents hiệu quả hơn. Quy tắc: chỉ scale lên khi công việc thật sự hưởng lợi từ teammates chạy đồng thời.

Hiệu ứng cộng dồn sau 30 ngày

Hệ thống 4-agent không chỉ cho output tốt hơn một agent - nó cho output tốt hơn mỗi tháng vì mỗi agent tích lũy context về cái gì hiệu quả. Research Agent học nguồn nào khán giả bạn phản hồi tốt. Production Agent học góc nào drive engagement nhiều nhất. Quality Agent học ngưỡng giữa tốt và xuất sắc thực sự nằm ở đâu cho giọng văn cụ thể của bạn.

Một hệ thống content automation thực tế chạy với chi phí khoảng 95 USD/tháng (Claude Pro, image generation, SEO tools, hosting), một bài hoàn chỉnh mất khoảng 25 phút wall-clock time với 5-10 phút human attention, và trong tháng tốt mang lại ROI 10-20x từ affiliate commission. Một người chạy một đội 4-agent sản xuất output của một đội bốn người - với nhiều nhất quán hơn, nhanh hơn, và một feedback loop khiến mỗi bài tốt hơn bài trước.

Dựng agent đầu tiên cuối tuần này. Thêm một agent mỗi tuần. Đến tuần thứ tư bạn có cả đội chạy.

via Claude Code docs - Orchestrate teams of Claude Code sessions, CyrilXBT trên X