Phala tăng tốc vLLM loading trong GPU TEE lên 32 lần — và vì sao đây là mảnh ghép cuối cho confidential AI
Inference trong GPU TEE chỉ overhead <7%. Nhưng cold-start thì kinh khủng — tải một model 70B có thể mất vài phút vì bounce buffer encrypt bằng CPU. Phala vừa nén con số đó xuống 32 lần.
ALICE: Công cụ open-source quản lý dataset YOLO end-to-end cho camera cá nhân
ALICE gộp toàn bộ vòng đời huấn luyện YOLO cho camera nhà — từ hút snapshot Frigate NVR, annotate, dedup pHash, auto-label, train tới export ONNX — vào một web UI duy nhất chạy trên máy bạn.
Crucix: chạy trung tâm OSINT trị giá 6 con số trên laptop của bạn — miễn phí, tự host
Governments chi hàng triệu USD build hệ thống gom open-source data. Crucix cho bạn cùng power đó trên localhost — 27 nguồn, quét 15 phút/lần, alert qua Telegram/Discord, zero cloud.
Factory mở quyền truy cập Droid Computers: máy bền vững để điều phối agent lập trình từ xa
Factory vừa mở Droid Computers — những cỗ máy bền vững (persistent) để chạy và điều phối Droid từ xa. Có thể spin trên cloud của Factory hoặc biến máy của bạn thành Droid Computer, với filesystem, credentials và cấu hình được giữ nguyên giữa các phiên làm việc.
Duix Avatar: Công cụ digital human mã nguồn mở, offline hoàn toàn và miễn phí
Duix Avatar (GuijiAI) là bộ công cụ tạo digital human mã nguồn mở với 13.300 stars trên GitHub, chạy hoàn toàn offline - không cần cloud, không cần internet. Latency chỉ 120ms trên thiết bị thực, so với 3-5 giây của HeyGen hay Synthesia. Miễn phí hoàn toàn theo giấy phép Apache 2.0, hỗ trợ Windows, Ubuntu, Android, iOS và các thiết bị IoT.
ReasoningBank: Google dạy AI agent học từ cả thành công lẫn thất bại — success rate tăng +34.2%
Google Cloud AI Research vừa công bố ReasoningBank — một memory framework cho LLM agent, chuyển trải nghiệm (bao gồm cả lỗi) thành chiến lược tái sử dụng được. Kết quả: +8.3 điểm success rate trên WebArena, -16% interaction steps, mở ra một chiều scaling mới cho AI agent.
NVIDIA Asset Harvester: Biến video lái xe thành 3D asset trong vài giây
NVIDIA vừa mở mã Asset Harvester — pipeline image-to-3D biến 1–4 ảnh sparse từ log xe tự hành thành 3D Gaussian splat đầy đủ, plug thẳng vào NuRec để chạy closed-loop simulation. Paper arXiv:2604.18468, code Apache-2.0, weights Open Model License.
Fooocus: Tạo ảnh AI chất lượng cao mà không cần biết gì về Stable Diffusion
Fooocus là công cụ tạo ảnh AI offline miễn phí, đạt 48.9k GitHub stars. Từ lúc tải về đến ảnh đầu tiên chưa đến 3 lần nhấp chuột, yêu cầu GPU NVIDIA tối thiểu 4GB VRAM. Chạy trên Stable Diffusion XL, đạt tốc độ ~1.35 giây/iteration trên RTX 3060. Hiện ở trạng thái LTS - chỉ vá bug, không phát triển tính năng mới.
Replit Auto-Protect: Bảo vệ app 24/7, tự vá CVE trong lúc bạn ngủ
Replit vừa ra mắt Auto-Protect — lớp giám sát bảo mật luôn-bật, tự quét CVE mới, chuẩn bị sẵn patch đã test, rồi gửi email link 1-click để dev apply. Dành cho solo builder và vibe coder không có team security.
6 one-liner eBPF cứu ca trực on-call lúc 3 giờ sáng
Pager kêu 3h sáng, service flapping, dashboard không thấy gì lạ. Đây là 6 lệnh bcc-tools kernel-native giúp bạn tìm ra thủ phạm trong vài phút — mà Grafana không bao giờ thấy.