Hermes Agent: 4 cấp độ setup từ prototype đến đội AI tự động
Hermes Agent v0.6.0 giới thiệu kiến trúc multi-agent 4 cấp - từ 1 agent prototype đến đội AI chạy hoàn toàn tự động qua cron. Trên benchmark network design, setup đa agent đạt 75-85% success rate so với chain-of-thought baseline. Hermes 4.3 36B đạt 93.8% trên MATH-500 - cạnh tranh với các model lớn hơn. Software miễn phí MIT, chỉ trả chi phí API ($0.13/M input tokens với Hermes 4 70B).
Dạy AI 'tại sao' trước khi dạy 'làm gì': Anthropic công bố Model Spec Midtraining
MSM giảm agentic misalignment từ 54% xuống 7% trên Qwen3-32B, vượt xa deliberative alignment baseline 14%. Kỹ thuật này cần ít dữ liệu hơn 40-60 lần so với fine-tuning thông thường. Mã nguồn và model đã mở trên GitHub và HuggingFace.
Cognee: open-source memory layer đưa AI agents thoát khỏi 'mất trí' sau mỗi session
Cognee thay RAG bằng pipeline ECL (Extract, Cognify, Load) + Memify, biến dữ liệu thành knowledge graph lai vector — chạy trong 6 dòng code, đạt ~90% accuracy so với ~60% của RAG, vừa gọi $7.5M seed.
MultiWorld - Video World Model đầu tiên sinh video đa agent, đa góc nhìn
Nhóm HKU & Sreal AI công bố MultiWorld — framework open-source sinh video có thể điều khiển nhiều agent cùng lúc, nhất quán qua nhiều camera. Dataset 21M+ frame, đã có checkpoint + code ngày 21/4/2026.
ml-intern: Hugging Face vừa ra con agent tự train model từ 1 dòng prompt - đập Claude Code 10 điểm GPQA
Hugging Face vừa open-source ml-intern: agent đọc paper, đi theo citation graph, kéo dataset, viết script, chạy training trên A100, tự diagnose khi reward collapse. Từ Qwen3-1.7B nâng GPQA 10% → 32% trong <10 giờ — Claude Code best chỉ 22.99%. Beat Codex trên HealthBench 60% bằng synthetic data nó tự sinh.
MegaStyle: Tencent mở mã nguồn 'khoảnh khắc ImageNet' cho style transfer
Tencent vừa công bố trọn bộ code, dataset 1.4M ảnh và hai pretrained model cho MegaStyle — hệ thống style transfer dựa trên FLUX vượt 7 baseline SOTA, đưa style transfer đến cột mốc quy mô giống ImageNet ngày xưa.
Thunderbolt: Đội Thunderbird vừa mở mã nguồn AI client tự host — chọn model, giữ data
MZLA (đội Thunderbird) ngày 16/04/2026 ra mắt Thunderbolt — AI client nguồn mở MPL 2.0, chạy cloud hay Ollama tùy chọn, deploy Docker/Kubernetes, có đủ app web + iOS + Android + Mac + Linux + Windows. Mục tiêu: Firefox-vs-IE moment cho thị trường AI enterprise.
CEO của Y Combinator thức đến 2 giờ sáng để build gì? GBrain - bộ não thứ hai bằng AI
Garry Tan open-source GBrain vào tháng 4/2026 - hệ thống AI cá nhân có 100,000 trang kiến thức và hơn 100 skills chuyên biệt. Book Mirror xử lý 22 chương sách trong 40 phút, tạo ra 30,000 từ ánh xạ từng idea vào cuộc sống thực của người dùng. Kiến trúc "Fat Skills, Fat Code, Thin Harness" cho phép model AI là thành phần có thể thay thế - không phải sản phẩm cuối cùng. MIT license, miễn phí, cài trong 30 phút.
ERNIE-Image: Baidu mở mã nguồn mô hình text-to-image 8B chạy trên 1 GPU 24GB, đè cả FLUX.2 ở khả năng render chữ
Baidu vừa đưa ERNIE-Image lên ERNIE Bot và mở mã nguồn dưới Apache 2.0. Mô hình 8B DiT này dẫn đầu open-weights ở GenEval, OneIG và LongTextBench, render chữ tiếng Anh và tiếng Trung sắc nét trong cùng một lần inference, chạy đủ trên một consumer GPU 24GB và đã được 50+ nền tảng sáng tạo tích hợp.
Cognee: xây agent không bao giờ quên với knowledge graph + embeddings
Cognee biến text thô thành knowledge graph có embedding trên mỗi node. Retrieval chạy đồng thời qua similarity và relationship — vượt RAG truyền thống ở bài benchmark multi-hop HotPotQA (0.93 vs 0.40 correctness). Apache 2.0, 16.7k+ sao GitHub, vừa gọi $7.5M seed.