Tencent open-source CubeSandbox: boot AI agent trong 60ms, thay thế E2B miễn phí

TL;DR

CubeSandbox - Sandbox AI agent của Tencent Cloud

Ngày 21/4/2026, Tencent Cloud open-source toàn bộ CubeSandbox - sandbox chạy code AI agent với boot time dưới 60ms, memory mỗi instance dưới 5MB, hardware-level isolation qua KVM microVM, và tương thích hoàn toàn với E2B SDK. Hoàn toàn miễn phí, tự host, Apache 2.0.

Docker container không đủ cho AI agent

Phần lớn sandbox AI agent hiện nay chạy trên Docker container. Nhanh, nhẹ - nhưng có một điểm yếu chết người: tất cả container trên cùng một host đều dùng chung kernel của hệ điều hành. Nếu code do LLM sinh ra khai thác được lỗ hổng kernel, kẻ tấn công có thể thoát khỏi container và kiểm soát toàn bộ máy chủ.

Virtual machine truyền thống giải quyết vấn đề đó bằng kernel riêng biệt, nhưng lại tốn 20MB+ RAM mỗi instance và boot mất vài giây - quá chậm và quá tốn kém với mô hình thanh toán per-invocation của LLM agent.

CubeSandbox đến để lấp đúng khoảng trống đó: isolation mạnh như VM, tốc độ gần như container.

Bên dưới nắp capô

CubeSandbox xây trên RustVMM và KVM - mỗi agent chạy trong một microVM riêng với Guest OS kernel độc lập. Không shared kernel, không container escape risk.

Ba kỹ thuật tạo nên tốc độ:

Resource pool pre-provisioning - pool kernel image sẵn sàng, không cần khởi tạo từ đầu mỗi lần
Snapshot cloning qua reflink - clone disk image theo kiểu copy-on-write, không copy toàn bộ
EPT Lazy Load & lock optimization - giảm contention khi tạo nhiều sandbox đồng thời

Network isolation do CubeVS (eBPF virtual switch) xử lý - filter traffic giữa các instance ở tầng kernel, không qua userspace. Mỗi sandbox có thể được cấu hình egress policy riêng biệt.

Runtime được viết lại bằng Rust với CoW memory reuse: chia sẻ memory pages giữa các instance, chỉ tạo bản copy khi có thao tác ghi. Kết quả: từ 20MB+ xuống còn dưới 5MB mỗi instance.

Con số biết nói

Metric	Docker	E2B (Firecracker)	CubeSandbox
Cold start	~200ms	~150ms	<60ms (avg 67ms)
Memory/instance	Shared kernel	20MB+	<5MB
Isolation	Thấp (shared kernel)	Cao	Cực cao (kernel + eBPF)
Density	Cao	Trung bình	2000+ sandbox/96-core node
E2B compatible	Không	Native	Drop-in
Chi phí	Rẻ	Per-invocation billing	Miễn phí (tự host)

Trong production thực tế tại Tencent: Yuanbao AI programming migrate sang CubeSandbox và giảm 95.8% CPU-hour consumption. Storage tiết kiệm 90%+ so với approach truyền thống. MiniMax dùng CubeSandbox để chạy hàng trăm nghìn heterogeneous sandbox (Linux, Windows, Android) đồng thời cho agent RL training.

Thay E2B: chỉ cần 3 dòng config

CubeSandbox implement đầy đủ E2B SDK interface. Để migrate từ E2B (hoặc bất kỳ stack nào dùng OpenAI Python SDK), chỉ cần thay 3 biến môi trường:

CUBE_TEMPLATE_ID
E2B_API_URL
E2B_API_KEY

Không cần sửa một dòng business logic nào. Không Kubernetes, không infrastructure phức tạp - một script setup duy nhất cài toàn bộ stack trong vài phút, hỗ trợ cả single-node lẫn multi-node cluster.

Điểm khác biệt lớn nhất so với E2B managed: hoàn toàn self-hosted, không có session timeout 5-10 phút, không có per-invocation billing. Phù hợp cho agent loop dài hoặc RL training cần chạy liên tục.

Ai nên dùng ngay

AI agent developer đang trả tiền cho E2B hoặc managed sandbox khác - migration không cần đổi code
Foundation model lab cần chạy agent RL training ở scale lớn - 100K+ instances/phút, scheduling phân tán
Enterprise cần compliance nghiêm ngặt - full private deployment, không phụ thuộc cloud provider nước ngoài, Apache 2.0 auditability
Indie hacker / startup muốn isolation mạnh nhưng không có ngân sách cho managed service

Yêu cầu tối thiểu: KVM-enabled x86_64 Linux (physical machine, cloud bare-metal, hoặc WSL2 với nested virtualization enabled).

Tính năng quan trọng nhất trên roadmap: event-level snapshot rollback - lưu checkpoint trạng thái sandbox ở mức millisecond và revert nhanh khi agent hành xử không mong muốn. Cho phép fork sandbox từ bất kỳ saved state nào, cực kỳ hữu ích cho agent RL training.

Dài hạn hơn, Tencent Cloud sẽ kết hợp CubeSandbox với TACO AI Acceleration Engine và FlexKV cache system thành full-stack "Secure Sandbox + Inference Acceleration + Cache Optimization".

Nguồn: GitHub TencentCloud/CubeSandbox, PR Newswire, BestHub.