// Posts
Phala tăng tốc vLLM loading trong GPU TEE lên 32 lần — và vì sao đây là mảnh ghép cuối cho confidential AI
#1072025-10-13

Phala tăng tốc vLLM loading trong GPU TEE lên 32 lần — và vì sao đây là mảnh ghép cuối cho confidential AI

Inference trong GPU TEE chỉ overhead <7%. Nhưng cold-start thì kinh khủng — tải một model 70B có thể mất vài phút vì bounce buffer encrypt bằng CPU. Phala vừa nén con số đó xuống 32 lần.

phala-networkgpu-teevllm
7 phút đọc
ALICE: Công cụ open-source quản lý dataset YOLO end-to-end cho camera cá nhân
#1062025-10-12

ALICE: Công cụ open-source quản lý dataset YOLO end-to-end cho camera cá nhân

ALICE gộp toàn bộ vòng đời huấn luyện YOLO cho camera nhà — từ hút snapshot Frigate NVR, annotate, dedup pHash, auto-label, train tới export ONNX — vào một web UI duy nhất chạy trên máy bạn.

yolofrigate-nvropen-source
7 phút đọc
Crucix: chạy trung tâm OSINT trị giá 6 con số trên laptop của bạn — miễn phí, tự host
#1052025-10-11

Crucix: chạy trung tâm OSINT trị giá 6 con số trên laptop của bạn — miễn phí, tự host

Governments chi hàng triệu USD build hệ thống gom open-source data. Crucix cho bạn cùng power đó trên localhost — 27 nguồn, quét 15 phút/lần, alert qua Telegram/Discord, zero cloud.

crucixosintopen-source
7 phút đọc
Factory mở quyền truy cập Droid Computers: máy bền vững để điều phối agent lập trình từ xa
#1042025-10-03

Factory mở quyền truy cập Droid Computers: máy bền vững để điều phối agent lập trình từ xa

Factory vừa mở Droid Computers — những cỗ máy bền vững (persistent) để chạy và điều phối Droid từ xa. Có thể spin trên cloud của Factory hoặc biến máy của bạn thành Droid Computer, với filesystem, credentials và cấu hình được giữ nguyên giữa các phiên làm việc.

factory-aidroidai-agents
6 phút đọc
Duix Avatar: Công cụ digital human mã nguồn mở, offline hoàn toàn và miễn phí
#1032025-09-30

Duix Avatar: Công cụ digital human mã nguồn mở, offline hoàn toàn và miễn phí

Duix Avatar (GuijiAI) là bộ công cụ tạo digital human mã nguồn mở với 13.300 stars trên GitHub, chạy hoàn toàn offline - không cần cloud, không cần internet. Latency chỉ 120ms trên thiết bị thực, so với 3-5 giây của HeyGen hay Synthesia. Miễn phí hoàn toàn theo giấy phép Apache 2.0, hỗ trợ Windows, Ubuntu, Android, iOS và các thiết bị IoT.

digital-humanopen-sourceai-avatar
7 phút đọc
ReasoningBank: Google dạy AI agent học từ cả thành công lẫn thất bại — success rate tăng +34.2%
#1022025-09-30

ReasoningBank: Google dạy AI agent học từ cả thành công lẫn thất bại — success rate tăng +34.2%

Google Cloud AI Research vừa công bố ReasoningBank — một memory framework cho LLM agent, chuyển trải nghiệm (bao gồm cả lỗi) thành chiến lược tái sử dụng được. Kết quả: +8.3 điểm success rate trên WebArena, -16% interaction steps, mở ra một chiều scaling mới cho AI agent.

reasoningbankgoogle-researchai-agents
8 phút đọc
NVIDIA Asset Harvester: Biến video lái xe thành 3D asset trong vài giây
#1012025-09-29

NVIDIA Asset Harvester: Biến video lái xe thành 3D asset trong vài giây

NVIDIA vừa mở mã Asset Harvester — pipeline image-to-3D biến 1–4 ảnh sparse từ log xe tự hành thành 3D Gaussian splat đầy đủ, plug thẳng vào NuRec để chạy closed-loop simulation. Paper arXiv:2604.18468, code Apache-2.0, weights Open Model License.

nvidiaautonomous-driving3d-gaussian-splatting
7 phút đọc
Fooocus: Tạo ảnh AI chất lượng cao mà không cần biết gì về Stable Diffusion
#1002025-09-25

Fooocus: Tạo ảnh AI chất lượng cao mà không cần biết gì về Stable Diffusion

Fooocus là công cụ tạo ảnh AI offline miễn phí, đạt 48.9k GitHub stars. Từ lúc tải về đến ảnh đầu tiên chưa đến 3 lần nhấp chuột, yêu cầu GPU NVIDIA tối thiểu 4GB VRAM. Chạy trên Stable Diffusion XL, đạt tốc độ ~1.35 giây/iteration trên RTX 3060. Hiện ở trạng thái LTS - chỉ vá bug, không phát triển tính năng mới.

ai-imagestable-diffusionopen-source
6 phút đọc
Replit Auto-Protect: Bảo vệ app 24/7, tự vá CVE trong lúc bạn ngủ
#0992025-09-25

Replit Auto-Protect: Bảo vệ app 24/7, tự vá CVE trong lúc bạn ngủ

Replit vừa ra mắt Auto-Protect — lớp giám sát bảo mật luôn-bật, tự quét CVE mới, chuẩn bị sẵn patch đã test, rồi gửi email link 1-click để dev apply. Dành cho solo builder và vibe coder không có team security.

replitauto-protectsecurity
6 phút đọc
6 one-liner eBPF cứu ca trực on-call lúc 3 giờ sáng
#0982025-09-13

6 one-liner eBPF cứu ca trực on-call lúc 3 giờ sáng

Pager kêu 3h sáng, service flapping, dashboard không thấy gì lạ. Đây là 6 lệnh bcc-tools kernel-native giúp bạn tìm ra thủ phạm trong vài phút — mà Grafana không bao giờ thấy.

ebpfbcc-toolssre
7 phút đọc