Claude Code - Bài 4: Subagents - 1 người làm việc của 3, không chờ, không lãng phí context

TL;DR

Bài cuối trong series 7 tips. Subagents không chỉ là "tính năng pro" - đây là cách dùng Claude Code đúng với mô hình agentic. Hiểu 3 use case cốt lõi, bạn biến 1 agent thành team.

Context window - tài nguyên quý nhất bạn đang lãng phí

Hãy nhìn vào một session làm việc thực tế: bạn hỏi Claude Code tìm bug trong codebase. AI đọc 50 file, chạy 20 grep, xem 5 log file. Tất cả context đó - hàng trăm nghìn tokens - nằm trong main conversation. Bạn còn 40% context budget để làm việc thực sự.

Đây là lúc "dumb zone" bắt đầu. Theo đo lường từ cộng đồng:

40% context utilization: model bắt đầu kém nhạy
70%+: precision giảm rõ rệt
85%+: hallucination tăng đột biến
83.5%: auto-compact kích hoạt, lossy compression

Trên model 1M token (Opus 4.6, Sonnet 4.6), context rot bắt đầu có ảnh hưởng từ khoảng 300-400K tokens. Cộng đồng đồng thuận: manual /compact ở 60% fill, không để auto-compact xử lý.

Subagent - không chỉ là tiết kiệm token

Subagent isolation: main context sạch 30%, 3 subagents chạy song song trả về summary

Giá trị thực sự của Subagent không phải tiết kiệm token - mà là context isolation. Subagent chạy trong conversation window hoàn toàn độc lập:

Không nhìn thấy lịch sử main conversation
Không bị bias bởi các assumption bạn đã build up trước đó
Không bị "dumb zone" của main session ảnh hưởng

Đây tương đương với việc gọi một đồng nghiệp chưa tham gia cuộc hội thoại lần nào vào xem xét vấn đề. Họ nhìn thấy thứ bạn đã blind spot.

3 use case dùng 80% trường hợp

1. Outsource "noisy" research tasks

Chạy test, scan log, đọc hàng trăm file tài liệu, search codebase - những task này tạo ra biển trung gian data nhưng bạn chỉ cần kết luận. Thay vì để main context bị ngập:

"Dùng subagent để investigate tại sao module payment đang fail. Tóm tắt findings trong 200 words."

Subagent đọc 200 file trong context của nó, trả về 2 đoạn tóm tắt. Main conversation vẫn ở 30% utilization.

2. Independent second opinion

Design doc, execution plan, code bạn vừa viết - tự review gần như zero value vì bạn quá quen với nó. Một subagent bắt đầu từ zero, không bị bias bởi conversation history:

"Review design doc này. Tìm architectural holes và assumptions chưa được validate."

Đây chính là cách workflow Design→Plan→Build dùng automated review gate - không phải Claude chính tự review, mà subagent review.

3. Async background long tasks

Đây là use case bị underestimate nhất. Chạy full test suite, build toàn project, refactor lớn - những task mất 5-30 phút. Bạn không cần ngồi chờ:

Ctrl+B

Push task ra background. Main conversation mở lại ngay lập tức. Bạn làm feature tiếp, viết doc tiếp, review module khác. Khi subagent xong nó notify tự động. 1 người làm việc song song của 3 - đây mới là leverage thực sự.

Làm thế nào để bắt đầu

Không cần setup phức tạp. Một vài cách gọi subagent đơn giản:

"Dùng subagent để tìm tất cả file liên quan đến authentication module"
"Spawn một subagent review PR diff này - không cần biết conversation history"
"Background task: chạy full test suite và report khi xong" + Ctrl+B

Tổng kết series 7 tips

Sau 4 bài, đây là 7 nguyên tắc cốt lõi:

Mindset đồng nghiệp: Brief đủ 4 yếu tố - mục tiêu, yêu cầu, context, nghiệm thu
CLAUDE.md: Hợp đồng hành vi cứng, dưới 200 dòng, chỉ hard constraints
Skills: Đóng gói workflow lặp thành slash command - đừng giải thích lại 2 lần
Memory Repository: Hệ thống cross-conversation cho AI thực sự "nhớ" bạn
Hooks: Automation 100% reliable - không dựa vào prompt cho hành vi bắt buộc
Design→Plan→Build: Tách định nghĩa vấn đề khỏi thực thi - bạn là boss, AI là executor
Subagents: Context isolation + async parallel work - multiply leverage

Không cần bật tất cả 7 thứ từ đầu. Bắt đầu từ bất kỳ tip nào giải quyết pain hiện tại của bạn. Mỗi lần thêm 1 thứ, workflow nhàn hơn 1 chút. Sau 1 tháng, bạn có một AI thực sự biết bạn là ai và làm việc thế nào.

via @FakeMaidenMaker - Claude Code Advanced Best Practices 2026