// Posts#open-source-ai
Hermes Agent: 4 cấp độ setup từ prototype đến đội AI tự động
#6562026-05-16

Hermes Agent: 4 cấp độ setup từ prototype đến đội AI tự động

Hermes Agent v0.6.0 giới thiệu kiến trúc multi-agent 4 cấp - từ 1 agent prototype đến đội AI chạy hoàn toàn tự động qua cron. Trên benchmark network design, setup đa agent đạt 75-85% success rate so với chain-of-thought baseline. Hermes 4.3 36B đạt 93.8% trên MATH-500 - cạnh tranh với các model lớn hơn. Software miễn phí MIT, chỉ trả chi phí API ($0.13/M input tokens với Hermes 4 70B).

hermes-agentmulti-agentai-orchestration
7 phút đọc
Dạy AI 'tại sao' trước khi dạy 'làm gì': Anthropic công bố Model Spec Midtraining
#4872026-05-06

Dạy AI 'tại sao' trước khi dạy 'làm gì': Anthropic công bố Model Spec Midtraining

MSM giảm agentic misalignment từ 54% xuống 7% trên Qwen3-32B, vượt xa deliberative alignment baseline 14%. Kỹ thuật này cần ít dữ liệu hơn 40-60 lần so với fine-tuning thông thường. Mã nguồn và model đã mở trên GitHub và HuggingFace.

anthropicai-alignmentmodel-spec
6 phút đọc
Cognee: open-source memory layer đưa AI agents thoát khỏi 'mất trí' sau mỗi session
#3982026-04-25

Cognee: open-source memory layer đưa AI agents thoát khỏi 'mất trí' sau mỗi session

Cognee thay RAG bằng pipeline ECL (Extract, Cognify, Load) + Memify, biến dữ liệu thành knowledge graph lai vector — chạy trong 6 dòng code, đạt ~90% accuracy so với ~60% của RAG, vừa gọi $7.5M seed.

cogneeai-agentsknowledge-graph
7 phút đọc
MultiWorld - Video World Model đầu tiên sinh video đa agent, đa góc nhìn
#3432026-04-21

MultiWorld - Video World Model đầu tiên sinh video đa agent, đa góc nhìn

Nhóm HKU & Sreal AI công bố MultiWorld — framework open-source sinh video có thể điều khiển nhiều agent cùng lúc, nhất quán qua nhiều camera. Dataset 21M+ frame, đã có checkpoint + code ngày 21/4/2026.

multiworldvideo-world-modelmulti-agent
6 phút đọc
ml-intern: Hugging Face vừa ra con agent tự train model từ 1 dòng prompt - đập Claude Code 10 điểm GPQA
#3462026-04-21

ml-intern: Hugging Face vừa ra con agent tự train model từ 1 dòng prompt - đập Claude Code 10 điểm GPQA

Hugging Face vừa open-source ml-intern: agent đọc paper, đi theo citation graph, kéo dataset, viết script, chạy training trên A100, tự diagnose khi reward collapse. Từ Qwen3-1.7B nâng GPQA 10% → 32% trong <10 giờ — Claude Code best chỉ 22.99%. Beat Codex trên HealthBench 60% bằng synthetic data nó tự sinh.

ml-internhugging-faceai-agent
7 phút đọc
MegaStyle: Tencent mở mã nguồn 'khoảnh khắc ImageNet' cho style transfer
#3452026-04-21

MegaStyle: Tencent mở mã nguồn 'khoảnh khắc ImageNet' cho style transfer

Tencent vừa công bố trọn bộ code, dataset 1.4M ảnh và hai pretrained model cho MegaStyle — hệ thống style transfer dựa trên FLUX vượt 7 baseline SOTA, đưa style transfer đến cột mốc quy mô giống ImageNet ngày xưa.

megastylestyle-transfertencent
6 phút đọc
Thunderbolt: Đội Thunderbird vừa mở mã nguồn AI client tự host — chọn model, giữ data
#3032026-04-16

Thunderbolt: Đội Thunderbird vừa mở mã nguồn AI client tự host — chọn model, giữ data

MZLA (đội Thunderbird) ngày 16/04/2026 ra mắt Thunderbolt — AI client nguồn mở MPL 2.0, chạy cloud hay Ollama tùy chọn, deploy Docker/Kubernetes, có đủ app web + iOS + Android + Mac + Linux + Windows. Mục tiêu: Firefox-vs-IE moment cho thị trường AI enterprise.

thunderboltmozillamzla
7 phút đọc
CEO của Y Combinator thức đến 2 giờ sáng để build gì? GBrain - bộ não thứ hai bằng AI
#2992026-04-15

CEO của Y Combinator thức đến 2 giờ sáng để build gì? GBrain - bộ não thứ hai bằng AI

Garry Tan open-source GBrain vào tháng 4/2026 - hệ thống AI cá nhân có 100,000 trang kiến thức và hơn 100 skills chuyên biệt. Book Mirror xử lý 22 chương sách trong 40 phút, tạo ra 30,000 từ ánh xạ từng idea vào cuộc sống thực của người dùng. Kiến trúc "Fat Skills, Fat Code, Thin Harness" cho phép model AI là thành phần có thể thay thế - không phải sản phẩm cuối cùng. MIT license, miễn phí, cài trong 30 phút.

gbraingarry-tanpersonal-ai
7 phút đọc
ERNIE-Image: Baidu mở mã nguồn mô hình text-to-image 8B chạy trên 1 GPU 24GB, đè cả FLUX.2 ở khả năng render chữ
#2912026-04-15

ERNIE-Image: Baidu mở mã nguồn mô hình text-to-image 8B chạy trên 1 GPU 24GB, đè cả FLUX.2 ở khả năng render chữ

Baidu vừa đưa ERNIE-Image lên ERNIE Bot và mở mã nguồn dưới Apache 2.0. Mô hình 8B DiT này dẫn đầu open-weights ở GenEval, OneIG và LongTextBench, render chữ tiếng Anh và tiếng Trung sắc nét trong cùng một lần inference, chạy đủ trên một consumer GPU 24GB và đã được 50+ nền tảng sáng tạo tích hợp.

ernie-imagebaidutext-to-image
7 phút đọc
Cognee: xây agent không bao giờ quên với knowledge graph + embeddings
#1592026-02-19

Cognee: xây agent không bao giờ quên với knowledge graph + embeddings

Cognee biến text thô thành knowledge graph có embedding trên mỗi node. Retrieval chạy đồng thời qua similarity và relationship — vượt RAG truyền thống ở bài benchmark multi-hop HotPotQA (0.93 vs 0.40 correctness). Apache 2.0, 16.7k+ sao GitHub, vừa gọi $7.5M seed.

cogneeai-memoryknowledge-graph
7 phút đọc