// Posts
Stackelberg PPO: robot tự mọc tay để đẩy, mọc chân để đi — chỉ với 1 reward duy nhất
#1862026-03-10

Stackelberg PPO: robot tự mọc tay để đẩy, mọc chân để đi — chỉ với 1 reward duy nhất

Schmidhuber và team KAUST/IDSIA biến co-design body+brain của robot thành một game leader-follower. Kết quả: robot tự tiến hoá thành tay đẩy hộp, chân di chuyển — vượt SoTA 20.66% trung bình, 32.02% trên task 3D phức tạp, dùng ít hơn 39% sample. Paper poster ICLR 2026 ngày 25/04.

stackelberg-ppomorphology-control-co-designiclr-2026
6 phút đọc
Helix 02 tự dọn phòng khách: một mạng neural, 61 hành động, zero code mới
#1852026-03-10

Helix 02 tự dọn phòng khách: một mạng neural, 61 hành động, zero code mới

Figure AI vừa công bố demo mới: robot Figure 03 chạy trên Helix 02 tự xịt lau bàn, hốt đồ chơi, ném gối lên sofa, xoay remote bấm tắt TV — tất cả từ một neural network duy nhất, không can thiệp con người.

figure-aihelix-02humanoid-robot
7 phút đọc
Glean + Gamma: Tìm context công ty rồi biến thành slide, tất cả trong một prompt
#1842026-03-10

Glean + Gamma: Tìm context công ty rồi biến thành slide, tất cả trong một prompt

Gamma vừa trở thành MCP app chạy thẳng trong Glean Assistant. Hỏi Glean một câu về dự án, kho tài liệu hay cập nhật nội bộ — rồi yêu cầu biến kết quả thành presentation ngay trong cùng khung chat. Không cần copy-paste, không nhảy tab.

gleangammamcp
6 phút đọc
MetaClaw: agent AI tự học, tự cập nhật trọng số ngay trong lúc bạn trò chuyện — không cần GPU
#1832026-03-09

MetaClaw: agent AI tự học, tự cập nhật trọng số ngay trong lúc bạn trò chuyện — không cần GPU

MetaClaw biến mỗi cuộc hội thoại thành tín hiệu học. Vừa chèn skill vào prompt tức thời, vừa fine-tune LoRA trên cloud trong lúc bạn ngủ hoặc họp. Kimi-K2.5 nhảy từ 21.4% lên 40.6%, gần bằng GPT-5.2 baseline.

metaclawllm-agentonline-rl
8 phút đọc
LatentSync: ByteDance Open-Source Model Lip-Sync Tốt Nhất Hiện Tại
#1822026-03-08

LatentSync: ByteDance Open-Source Model Lip-Sync Tốt Nhất Hiện Tại

LatentSync của ByteDance đạt 94% SyncNet accuracy trên HDTF, vượt qua Wav2Lip, DINet, MuseTalk về mọi chỉ số chất lượng. Chỉ cần 8GB VRAM để chạy inference, hoàn toàn miễn phí và open-source. Dựa trên Stable Diffusion 1.5 với cơ chế TREPA độc quyền giúp giữ temporal consistency mà không làm giảm độ chính xác lip-sync.

latentsyncbytedancelip-sync
6 phút đọc
Terence Tao hỏi câu hỏi nguy hiểm nhất về AI: Dùng công cụ cực mạnh nhưng không đáng tin thì sao?
#1812026-03-07

Terence Tao hỏi câu hỏi nguy hiểm nhất về AI: Dùng công cụ cực mạnh nhưng không đáng tin thì sao?

Terence Tao cảnh báo AI được tối ưu để nghe có vẻ đúng, không phải để đúng thật sự - khoảng cách đó tạo ra "chiếc gương thuyết phục" tự tin đưa lời khuyên sai trong y tế và tài chính. AI hallucination gây thiệt hại 67,4 tỷ USD toàn cầu năm 2024; tỷ lệ sai ở y tế 15,6%, tài chính 76,7%. Tao đề xuất kết hợp AI với công cụ xác minh chính thức như Lean để đóng khoảng cách giữa thuyết phục và chính xác.

aiterence-taoai-hallucination
6 phút đọc
Awesome LLM Apps: Kho 100+ Template AI Agent & RAG Hot Nhất GitHub với 111k Stars
#1802026-03-06

Awesome LLM Apps: Kho 100+ Template AI Agent & RAG Hot Nhất GitHub với 111k Stars

Awesome LLM Apps đạt 111k stars và 16.4k forks trên GitHub - kho template AI Agent & RAG lớn nhất hiện tại. 100+ app production-ready chạy được ngay trong 30 giây, 13 danh mục từ Starter Agents đến Voice AI và MCP. Provider-agnostic: switch giữa Claude, Gemini, GPT, Llama, Qwen, xAI chỉ bằng một thay đổi config. Apache-2.0 license, miễn phí hoàn toàn, không paywall.

llmai-agentrag
6 phút đọc
WhisperX: Tăng tốc Whisper 70 lần, timestamp từng từ và nhận diện người nói
#1792026-03-05

WhisperX: Tăng tốc Whisper 70 lần, timestamp từng từ và nhận diện người nói

WhisperX đạt tốc độ 70x real-time với large-v2 nhờ batched inference và VAD Cut & Merge, nhanh hơn Whisper gốc 11.8 lần trên benchmark chính thức. Timestamp word-level chính xác ±50ms, so với ±500ms của Whisper - cải thiện 10 lần. DER ~8% trong điều kiện chuẩn, tích hợp pyannote-audio để phân biệt từng người nói. Miễn phí hoàn toàn, BSD-2-Clause license, 21.8k GitHub stars.

whisperxopenai-whisperspeech-recognition
7 phút đọc
AI Engineering from Scratch - Curriculum mã nguồn mở để hiểu AI thật sự, không phải chỉ gọi API
#7652026-03-03

AI Engineering from Scratch - Curriculum mã nguồn mở để hiểu AI thật sự, không phải chỉ gọi API

503 bài học, 20 phases, khoảng 320 giờ - curriculum AI hoàn toàn miễn phí do Rohit Ghumare xây dựng trong 18 tháng. Triết lý cốt lõi: tự viết thuật toán từ toán thô trước khi dùng PyTorch hay tiktoken. Mỗi bài kết thúc bằng một artifact dùng được ngay - repo ship 388 skills và 99 prompt templates. Phase 19 Capstone có 17 sản phẩm end-to-end từ coding agent đến multi-agent software engineering team.

ai-engineeringmachine-learningopen-source
6 phút đọc
Dan Koe: Cách học bất cứ thứ gì nhanh gấp 10x với AI
#1782026-03-03

Dan Koe: Cách học bất cứ thứ gì nhanh gấp 10x với AI

Dan Koe chia sẻ framework 5 bước kết hợp project-based learning và AI để học nhanh gấp 10x. Kết hợp đúng cách, bạn có thể nắm một kỹ năng trong 2 tuần thay vì 6 tháng. AI chỉ phát huy tác dụng khi được dùng như nhân viên số với prompt 500-2000 chữ - không phải máy đoán mò từ 1 câu.

dan-koeai-toolshoc-tap
7 phút đọc