TL;DR

CubeSandbox - Sandbox AI agent của Tencent Cloud

Ngày 21/4/2026, Tencent Cloud open-source toàn bộ CubeSandbox - sandbox chạy code AI agent với boot time dưới 60ms, memory mỗi instance dưới 5MB, hardware-level isolation qua KVM microVM, và tương thích hoàn toàn với E2B SDK. Hoàn toàn miễn phí, tự host, Apache 2.0.

Docker container không đủ cho AI agent

Phần lớn sandbox AI agent hiện nay chạy trên Docker container. Nhanh, nhẹ - nhưng có một điểm yếu chết người: tất cả container trên cùng một host đều dùng chung kernel của hệ điều hành. Nếu code do LLM sinh ra khai thác được lỗ hổng kernel, kẻ tấn công có thể thoát khỏi container và kiểm soát toàn bộ máy chủ.

Virtual machine truyền thống giải quyết vấn đề đó bằng kernel riêng biệt, nhưng lại tốn 20MB+ RAM mỗi instance và boot mất vài giây - quá chậm và quá tốn kém với mô hình thanh toán per-invocation của LLM agent.

CubeSandbox đến để lấp đúng khoảng trống đó: isolation mạnh như VM, tốc độ gần như container.

Bên dưới nắp capô

CubeSandbox xây trên RustVMMKVM - mỗi agent chạy trong một microVM riêng với Guest OS kernel độc lập. Không shared kernel, không container escape risk.

Ba kỹ thuật tạo nên tốc độ:

  • Resource pool pre-provisioning - pool kernel image sẵn sàng, không cần khởi tạo từ đầu mỗi lần
  • Snapshot cloning qua reflink - clone disk image theo kiểu copy-on-write, không copy toàn bộ
  • EPT Lazy Load & lock optimization - giảm contention khi tạo nhiều sandbox đồng thời

Network isolation do CubeVS (eBPF virtual switch) xử lý - filter traffic giữa các instance ở tầng kernel, không qua userspace. Mỗi sandbox có thể được cấu hình egress policy riêng biệt.

Runtime được viết lại bằng Rust với CoW memory reuse: chia sẻ memory pages giữa các instance, chỉ tạo bản copy khi có thao tác ghi. Kết quả: từ 20MB+ xuống còn dưới 5MB mỗi instance.

Con số biết nói

MetricDockerE2B (Firecracker)CubeSandbox
Cold start~200ms~150ms<60ms (avg 67ms)
Memory/instanceShared kernel20MB+<5MB
IsolationThấp (shared kernel)CaoCực cao (kernel + eBPF)
DensityCaoTrung bình2000+ sandbox/96-core node
E2B compatibleKhôngNativeDrop-in
Chi phíRẻPer-invocation billingMiễn phí (tự host)

Trong production thực tế tại Tencent: Yuanbao AI programming migrate sang CubeSandbox và giảm 95.8% CPU-hour consumption. Storage tiết kiệm 90%+ so với approach truyền thống. MiniMax dùng CubeSandbox để chạy hàng trăm nghìn heterogeneous sandbox (Linux, Windows, Android) đồng thời cho agent RL training.

Thay E2B: chỉ cần 3 dòng config

CubeSandbox implement đầy đủ E2B SDK interface. Để migrate từ E2B (hoặc bất kỳ stack nào dùng OpenAI Python SDK), chỉ cần thay 3 biến môi trường:

  • CUBE_TEMPLATE_ID
  • E2B_API_URL
  • E2B_API_KEY

Không cần sửa một dòng business logic nào. Không Kubernetes, không infrastructure phức tạp - một script setup duy nhất cài toàn bộ stack trong vài phút, hỗ trợ cả single-node lẫn multi-node cluster.

Điểm khác biệt lớn nhất so với E2B managed: hoàn toàn self-hosted, không có session timeout 5-10 phút, không có per-invocation billing. Phù hợp cho agent loop dài hoặc RL training cần chạy liên tục.

Ai nên dùng ngay

  • AI agent developer đang trả tiền cho E2B hoặc managed sandbox khác - migration không cần đổi code
  • Foundation model lab cần chạy agent RL training ở scale lớn - 100K+ instances/phút, scheduling phân tán
  • Enterprise cần compliance nghiêm ngặt - full private deployment, không phụ thuộc cloud provider nước ngoài, Apache 2.0 auditability
  • Indie hacker / startup muốn isolation mạnh nhưng không có ngân sách cho managed service

Yêu cầu tối thiểu: KVM-enabled x86_64 Linux (physical machine, cloud bare-metal, hoặc WSL2 với nested virtualization enabled).

Tiếp theo

Tính năng quan trọng nhất trên roadmap: event-level snapshot rollback - lưu checkpoint trạng thái sandbox ở mức millisecond và revert nhanh khi agent hành xử không mong muốn. Cho phép fork sandbox từ bất kỳ saved state nào, cực kỳ hữu ích cho agent RL training.

Dài hạn hơn, Tencent Cloud sẽ kết hợp CubeSandbox với TACO AI Acceleration Engine và FlexKV cache system thành full-stack "Secure Sandbox + Inference Acceleration + Cache Optimization".

Nguồn: GitHub TencentCloud/CubeSandbox, PR Newswire, BestHub.