- Figure AI vừa công bố demo mới: robot Figure 03 chạy trên Helix 02 tự xịt lau bàn, hốt đồ chơi, ném gối lên sofa, xoay remote bấm tắt TV — tất cả từ một neural network duy nhất, không can thiệp con người.
TL;DR
- Figure AI phát hành demo phòng khách (09/03/2026): robot Figure 03 chạy trên hệ Helix 02 tự dọn phòng khách lộn xộn — không code mới, không thuật toán đặc thù, không can thiệp con người.
- Một mạng neural duy nhất điều khiển toàn bộ cơ thể trực tiếp từ pixel camera: đi, cầm đồ, giữ thăng bằng, xoay remote, ném gối, lách qua khe hẹp giữa bàn và sofa.
- Kiến trúc 3 lớp System 0 / S1 / S2 chạy từ 1 kHz xuống đến reasoning semantic, thay thế 109.504 dòng C++ hand-engineered bằng một neural prior 10M params.
- Benchmark trước đó: 61 loco-manipulation actions liên tiếp trong 4 phút khi nạp/dỡ máy rửa bát — task dài nhất, phức tạp nhất từng được humanoid tự hoàn thành.

What's new
Tháng 1/2026 Figure ra mắt Helix 02 với demo dọn bếp. Tháng 3/2026 họ đẩy bài toán khó hơn: phòng khách. Từ góc nhìn robotics, phòng khách là quái vật — đồ rải ngẫu nhiên, đồ mềm (khăn, gối) dynamics khó đoán, đồ đạc tạo hành lang hẹp, phần lớn hành động vừa đi vừa thao tác.
Trong demo, cùng một hệ Helix 02 (không retrain đặc thù, không code mới) học được các hành vi:
- Lau mặt bàn phối hợp dụng cụ: xịt chai lên mặt bẩn rồi miết khăn mạnh để lau sạch.
- Quản lý vật mềm dynamic: tháo khăn khỏi cánh tay, vắt qua vai, kẹp dưới nách để giải phóng tay.
- Bimanual manipulation: bê thùng bằng hai tay, hốt khối đồ chơi từ bàn và sofa vào thùng.
- Whole-body strategy: kẹp thùng dưới một bên nách để rảnh cả hai tay nhặt đồ chơi tiếp.
- Ném có kiểm soát: tung gối trở lại sofa bằng chuyển động nhanh, đúng quỹ đạo.
- In-hand reorientation: cầm remote, xoay lại trong tay, bấm đúng nút tắt TV.
- Navigate khe hẹp: đi bước ngang (side-step) qua gap giữa bàn cà phê và sofa trong khi vẫn cầm đồ.
Why it matters
Robotics truyền thống chia locomotion và manipulation thành hai controller riêng, nối bằng state machine: walk → stop → stabilize → reach → grasp → walk again. Cách tiếp cận này brittle — chỉ cần vật dịch nhẹ hoặc contact bất ngờ là hành vi đổ vỡ. Boston Dynamics nổi tiếng với MPC + toán học phức tạp cho balance, nhưng behaviors chủ yếu là replay motion plan offline.
Helix 02 đi hướng ngược lại: một mạng neural duy nhất reasoning toàn thân đồng thời. Đi trong khi mang đồ, điều chỉnh thăng bằng trong khi với tay, recovery lỗi real-time. Khi tay bận, robot dùng hông đóng ngăn kéo, dùng chân nâng cửa máy rửa bát — cả cơ thể làm công cụ.
"Helix 02 là neural system duy nhất điều khiển toàn bộ cơ thể trực tiếp từ pixel, cho phép dexterity và autonomy dài-horizon trên quy mô cả căn phòng." — Figure AI
Technical facts
Kiến trúc 3 lớp chạy song song ở 3 timescale khác nhau — pixels-to-torque:
| Lớp | Vai trò | Tần số | Chi tiết |
|---|---|---|---|
| System 2 | Semantic reasoning | Chậm | Đọc cảnh, hiểu ngôn ngữ, sinh latent goal (vd: "Walk to the dishwasher and open it") |
| System 1 | Visuomotor policy | 200 Hz | Transformer nhận head cameras + palm cameras + fingertip tactile + proprioception → joint targets toàn thân |
| System 0 | Whole-body control | 1 kHz | 10M params, học từ 1.000+ giờ human motion, thay 109.504 dòng C++ |
Training System 0: hoàn toàn trong simulation trên 200.000+ môi trường song song với domain randomization, transfer thẳng sang robot thật. Dataset: hơn 1.000 giờ motion data của người đã retarget về joint-level, cộng sim-to-real reinforcement learning.
Phần cứng Figure 03:
- Fingertip tactile sensors: cảm nhận lực nhỏ tới 3 gram — đủ cảm nhận một chiếc ghim giấy.
- Palm cameras: visual feedback khi vật bị khuất khỏi head camera.
- Motor range: trải 4 bậc độ lớn — từ chuyển động ngón tay cỡ milimet tới di chuyển cỡ cả căn phòng, cùng một network.
Comparison
| Khía cạnh | Helix 01 (2025) | Helix 02 (2026) |
|---|---|---|
| Phạm vi điều khiển | Chỉ phần thân trên | Toàn thân: chân, thân, đầu, tay, cổ tay, ngón |
| Input sensor | Joint state + head camera | Head + palm cameras + tactile + proprioception |
| Whole-body controller | Hand-engineered C++ | Neural System 0 (10M params) |
| Task horizon | Short-horizon, upper-body | 4 phút, 61 actions, full room |
| Loco-manipulation | Không | Đi + thao tác liên tục |
Use cases
- Gia đình: dọn phòng khách, giặt là, nạp/dỡ máy rửa bát full-size, phân loại đồ chơi, lau bàn.
- Nhà máy: nhặt linh kiện kim loại nhỏ khỏi hộp bừa bộn — demo tại Figure BotQ manufacturing facility.
- Precision tasks: bóc từng viên thuốc khỏi vỉ, đẩy đúng 5 ml từ ống tiêm, mở nắp chai bằng force-controlled actuation.
Điểm đáng chú ý: mọi task trên cùng chạy trên cùng một bộ weights. Thêm task mới = thêm demonstration, không cần code mới. Đây là luận điểm cốt lõi của Figure về "scalable humanoid intelligence".
Limitations & pricing
Figure tự mô tả kết quả là "early" — chưa có consumer product, chưa công bố giá, chưa mở đặt hàng cá nhân. Demo vẫn trong studio Figure set up, chưa có dữ liệu nhà thật ở đủ đa dạng điều kiện ánh sáng / bố trí / vật dụng. Nguồn công khai cũng chưa có fail rate, battery life, hay setup time giữa các task.
What's next
Roadmap Figure: tiếp tục scale data, thêm task mới chỉ bằng cách thêm demonstration. CEO Brett Adcock dự đoán humanoid có thể làm việc autonomously ngay trong 2026. Demo phòng khách có thể chỉ là bước khởi đầu — nếu cùng một architecture mà thêm vài trăm giờ data mỗi tháng là robot biết thêm task mới, timeline sản phẩm thật có thể nhanh hơn mọi người nghĩ.
Về mặt meme: robot làm việc không than phiền, còn con người thì cần playlist và vài phút chuẩn bị tinh thần mới bắt đầu dọn nhà được.
Nguồn: Figure AI — Helix 02 Living Room Tidy, Introducing Helix 02, Interesting Engineering, The Robot Report.





