TL;DR

  • Figure AI phát hành demo phòng khách (09/03/2026): robot Figure 03 chạy trên hệ Helix 02 tự dọn phòng khách lộn xộn — không code mới, không thuật toán đặc thù, không can thiệp con người.
  • Một mạng neural duy nhất điều khiển toàn bộ cơ thể trực tiếp từ pixel camera: đi, cầm đồ, giữ thăng bằng, xoay remote, ném gối, lách qua khe hẹp giữa bàn và sofa.
  • Kiến trúc 3 lớp System 0 / S1 / S2 chạy từ 1 kHz xuống đến reasoning semantic, thay thế 109.504 dòng C++ hand-engineered bằng một neural prior 10M params.
  • Benchmark trước đó: 61 loco-manipulation actions liên tiếp trong 4 phút khi nạp/dỡ máy rửa bát — task dài nhất, phức tạp nhất từng được humanoid tự hoàn thành.

Figure 03 humanoid đang cúi xuống dọn mặt bàn trong phòng khách

What's new

Tháng 1/2026 Figure ra mắt Helix 02 với demo dọn bếp. Tháng 3/2026 họ đẩy bài toán khó hơn: phòng khách. Từ góc nhìn robotics, phòng khách là quái vật — đồ rải ngẫu nhiên, đồ mềm (khăn, gối) dynamics khó đoán, đồ đạc tạo hành lang hẹp, phần lớn hành động vừa đi vừa thao tác.

Trong demo, cùng một hệ Helix 02 (không retrain đặc thù, không code mới) học được các hành vi:

  • Lau mặt bàn phối hợp dụng cụ: xịt chai lên mặt bẩn rồi miết khăn mạnh để lau sạch.
  • Quản lý vật mềm dynamic: tháo khăn khỏi cánh tay, vắt qua vai, kẹp dưới nách để giải phóng tay.
  • Bimanual manipulation: bê thùng bằng hai tay, hốt khối đồ chơi từ bàn và sofa vào thùng.
  • Whole-body strategy: kẹp thùng dưới một bên nách để rảnh cả hai tay nhặt đồ chơi tiếp.
  • Ném có kiểm soát: tung gối trở lại sofa bằng chuyển động nhanh, đúng quỹ đạo.
  • In-hand reorientation: cầm remote, xoay lại trong tay, bấm đúng nút tắt TV.
  • Navigate khe hẹp: đi bước ngang (side-step) qua gap giữa bàn cà phê và sofa trong khi vẫn cầm đồ.

Why it matters

Robotics truyền thống chia locomotion và manipulation thành hai controller riêng, nối bằng state machine: walk → stop → stabilize → reach → grasp → walk again. Cách tiếp cận này brittle — chỉ cần vật dịch nhẹ hoặc contact bất ngờ là hành vi đổ vỡ. Boston Dynamics nổi tiếng với MPC + toán học phức tạp cho balance, nhưng behaviors chủ yếu là replay motion plan offline.

Helix 02 đi hướng ngược lại: một mạng neural duy nhất reasoning toàn thân đồng thời. Đi trong khi mang đồ, điều chỉnh thăng bằng trong khi với tay, recovery lỗi real-time. Khi tay bận, robot dùng hông đóng ngăn kéo, dùng chân nâng cửa máy rửa bát — cả cơ thể làm công cụ.

"Helix 02 là neural system duy nhất điều khiển toàn bộ cơ thể trực tiếp từ pixel, cho phép dexterity và autonomy dài-horizon trên quy mô cả căn phòng." — Figure AI

Technical facts

Kiến trúc 3 lớp chạy song song ở 3 timescale khác nhau — pixels-to-torque:

LớpVai tròTần sốChi tiết
System 2Semantic reasoningChậmĐọc cảnh, hiểu ngôn ngữ, sinh latent goal (vd: "Walk to the dishwasher and open it")
System 1Visuomotor policy200 HzTransformer nhận head cameras + palm cameras + fingertip tactile + proprioception → joint targets toàn thân
System 0Whole-body control1 kHz10M params, học từ 1.000+ giờ human motion, thay 109.504 dòng C++

Training System 0: hoàn toàn trong simulation trên 200.000+ môi trường song song với domain randomization, transfer thẳng sang robot thật. Dataset: hơn 1.000 giờ motion data của người đã retarget về joint-level, cộng sim-to-real reinforcement learning.

Phần cứng Figure 03:

  • Fingertip tactile sensors: cảm nhận lực nhỏ tới 3 gram — đủ cảm nhận một chiếc ghim giấy.
  • Palm cameras: visual feedback khi vật bị khuất khỏi head camera.
  • Motor range: trải 4 bậc độ lớn — từ chuyển động ngón tay cỡ milimet tới di chuyển cỡ cả căn phòng, cùng một network.

Comparison

Khía cạnhHelix 01 (2025)Helix 02 (2026)
Phạm vi điều khiểnChỉ phần thân trênToàn thân: chân, thân, đầu, tay, cổ tay, ngón
Input sensorJoint state + head cameraHead + palm cameras + tactile + proprioception
Whole-body controllerHand-engineered C++Neural System 0 (10M params)
Task horizonShort-horizon, upper-body4 phút, 61 actions, full room
Loco-manipulationKhôngĐi + thao tác liên tục

Use cases

  • Gia đình: dọn phòng khách, giặt là, nạp/dỡ máy rửa bát full-size, phân loại đồ chơi, lau bàn.
  • Nhà máy: nhặt linh kiện kim loại nhỏ khỏi hộp bừa bộn — demo tại Figure BotQ manufacturing facility.
  • Precision tasks: bóc từng viên thuốc khỏi vỉ, đẩy đúng 5 ml từ ống tiêm, mở nắp chai bằng force-controlled actuation.

Điểm đáng chú ý: mọi task trên cùng chạy trên cùng một bộ weights. Thêm task mới = thêm demonstration, không cần code mới. Đây là luận điểm cốt lõi của Figure về "scalable humanoid intelligence".

Limitations & pricing

Figure tự mô tả kết quả là "early" — chưa có consumer product, chưa công bố giá, chưa mở đặt hàng cá nhân. Demo vẫn trong studio Figure set up, chưa có dữ liệu nhà thật ở đủ đa dạng điều kiện ánh sáng / bố trí / vật dụng. Nguồn công khai cũng chưa có fail rate, battery life, hay setup time giữa các task.

What's next

Roadmap Figure: tiếp tục scale data, thêm task mới chỉ bằng cách thêm demonstration. CEO Brett Adcock dự đoán humanoid có thể làm việc autonomously ngay trong 2026. Demo phòng khách có thể chỉ là bước khởi đầu — nếu cùng một architecture mà thêm vài trăm giờ data mỗi tháng là robot biết thêm task mới, timeline sản phẩm thật có thể nhanh hơn mọi người nghĩ.

Về mặt meme: robot làm việc không than phiền, còn con người thì cần playlist và vài phút chuẩn bị tinh thần mới bắt đầu dọn nhà được.

Nguồn: Figure AI — Helix 02 Living Room Tidy, Introducing Helix 02, Interesting Engineering, The Robot Report.