Warp Oz: Điều Phối Claude Code, Codex và Warp Agent Song Song Trên Cloud

TL;DR

Warp vừa nâng cấp lớn Oz (ngày 19/5/2026), biến nó thành control plane đa harness đầu tiên cho cloud coding agent. Thay vì bị khóa vào một model hay framework, bạn giờ có thể điều phối Claude Code, Codex và Warp Agent cùng lúc - mỗi harness xử lý phần việc phù hợp nhất với nó, dưới một hệ thống quản trị duy nhất.

/orchestrate: lệnh mới để tự động phân chia task cho nhiều agent song song
Agent Memory (research preview): bộ nhớ xuyên harness, agent học và nhớ cách team làm việc
Self-hosting mở rộng: Kubernetes, không cần Docker, tích hợp với môi trường dev hiện có

Từ terminal đến control plane

Warp bắt đầu như một terminal thông minh. Oz - ra mắt tháng 2/2026 - là bước đi tiếp theo: platform để chạy, theo dõi và điều phối coding agent trên cloud. Ba tháng sau, Warp vừa thực hiện nâng cấp quan trọng nhất kể từ khi ra mắt.

Vấn đề mà Oz giải quyết rất thực tế: khi bạn muốn chạy 5-10 agent cùng lúc, laptop bắt đầu hết CPU, hết RAM, hết git checkout. Bạn phải tự dựng cloud infra để sandbox, track output, share với team. Oz thay thế toàn bộ việc đó bằng một platform có sẵn.

Và lần nâng cấp này thêm một lớp nữa: multi-harness. Không chỉ chạy một loại agent, Oz giờ điều phối nhiều framework AI khác nhau trong cùng một workflow.

Tại sao đây là thời điểm đúng

Theo số liệu từ Warp: dù hầu hết tổ chức đã dùng AI coding tool, ít hơn 1 trong 10 thực sự deploy agent lên production. Điểm tắc không phải ý định - mà là hạ tầng.

"2025 là năm của interactive agent. 2026 sẽ là năm của agent orchestration." - Zach Lloyd, CEO Warp

Các công ty muốn agent chạy tự động, có governance, có audit trail, không bị vendor lock-in vào một model hay harness duy nhất. Đây chính xác là những gì Oz đang xây dựng.

Ba tính năng cốt lõi

1. Multi-harness orchestration

Oz giờ hỗ trợ Claude Code, Codex và Warp Agent chạy trong cloud với quản trị thống nhất. Warp Agent đóng vai trò parent orchestrator duy nhất - phân tích task, chia nhỏ thành subtask, dispatch Claude Code cho các bước nặng về code review, dispatch Codex cho các tác vụ chỉnh sửa hàng loạt, sau đó tổng hợp kết quả.

Warp terminal với lệnh /orchestrate — Lệnh /orchestrate trong Warp terminal - điểm khởi đầu để triển khai multi-agent workflow

Mỗi subagent khi chạy cục bộ được cấp worktree riêng, khi chạy cloud được cấp Docker container riêng biệt. Bạn có thể bắt đầu tương tác local, rồi handoff lên cloud khi cần nhiều compute hoặc chạy qua đêm - context và artifact tự động chuyển theo, không cần copy-paste prompt lại từ đầu.

2. Agent Memory (research preview)

Đây là tính năng có thể thay đổi cách teams làm việc với AI theo thời gian dài. Agent Memory là bộ nhớ persistent, chia sẻ xuyên tất cả harness - Warp Agent, Claude Code, Codex - chạy bất đồng bộ (không tốn token, không tăng latency).

Warp Oz web app với Memory tab — Oz web app - tab Memory hiển thị agent profile và lịch sử các run, bao gồm bộ nhớ được sử dụng

Agent tự động extract facts và outcomes sau mỗi conversation - ví dụ agent review code sẽ học coding style của team, agent production nhớ deployment topology, agent data sẽ biết cấu trúc database của bạn. Memory có thể scoped cho cá nhân hoặc chia sẻ toàn team. Toàn bộ lịch sử thay đổi memory được ghi lại để audit.

3. Self-hosting linh hoạt hơn

Enterprise giờ có thể chạy Oz trong Kubernetes pods, với hoặc không có Docker, trong môi trường remote dev hiện có - không cần thay đổi setup. SOC 2 Type II, Zero Data Retention, SSO & SCIM đều có sẵn.

Con số từ thực tế

Warp không chỉ bán sản phẩm - họ dùng chính Oz trong công việc hàng ngày:

60% số PR nội bộ Warp được viết bởi Oz agent (và tỷ lệ này vẫn tăng)
Fraud-bot chạy mỗi 8 giờ (3 lần/ngày) - phát hiện gian lận và tự động tạo PR để vá lỗ hổng bảo mật. Trong một buổi sáng, bot này đã chặn gần $60,000 gian lận - trước đó team phải kiểm tra thủ công 1-2 lần/tuần
Porting mermaid.js sang Rust: dùng parallel agent, mỗi agent xử lý một loại diagram, dùng Computer Use để so sánh kết quả với bản gốc
Setup cloud environment: dưới 5 phút

Nền tảng hiện phục vụ hơn 800,000 developer, trong đó có hơn nửa số công ty trong Fortune 500.

Ai nên dùng ngay

Oz hiện tại phù hợp nhất với:

Engineering team đang chạy nhiều agent song song và bắt đầu gặp giới hạn CPU/RAM local
Team muốn automation định kỳ: bug fix, doc update, security check - chạy scheduled agent thay vì làm thủ công
Enterprise cần governance: audit trail, per-team billing, credit cap, least-privilege permission cho từng agent

Nếu bạn vẫn đang chạy agent interactively trong IDE, Oz chưa phải ưu tiên. Nhưng nếu bạn đang nghĩ đến việc deploy agent tự động trong tổ chức, đây là platform đáng xem xét nhất hiện tại.

Giới hạn cần biết

Một số điểm cần lưu ý trước khi bắt đầu:

Multi-harness orchestration: đang ở beta, có sẵn cho tất cả user
Agent Memory: research preview, cần đăng ký waitlist theo team - chỉ chạy harness bên thứ ba (Claude Code, Codex) ở chế độ cloud, chưa hỗ trợ local
Warp Agent là orchestrator duy nhất: Claude Code và Codex chỉ có thể là subagent, không thể là parent
Pricing: Oz miễn phí cho tất cả Warp user (free và paid), tính phí theo credits = AI inference + compute. Khi dùng Codex, OpenAI bill inference trực tiếp vào tài khoản bạn; Warp chỉ tính compute & platform credits

Phía trước

Roadmap rõ ràng là đưa Agent Memory lên general availability và graduate multi-harness khỏi beta. Warp cũng cho thấy ý định mở rộng số lượng harness được hỗ trợ - kiến trúc được thiết kế để thêm framework mới khi ecosystem phát triển.

Điều thú vị hơn là hướng đi dài hạn: Oz không định cạnh tranh với Cursor hay Copilot Workspace ở layer IDE. Thay vào đó, Oz muốn là infrastructure layer - lớp nằm phía trên mọi harness, điều phối chúng theo nhu cầu, lưu organizational knowledge theo thời gian.

Bắt đầu tại warp.dev/oz hoặc đọc thêm tại blog chính thức của Zach Lloyd. Đăng ký waitlist Agent Memory tại warp.dev/oz/agent-memory.