Tất cả bài viết

// Posts#open-source-llm

#6782026-05-18

GEPA và Curator: Bộ đôi tối ưu hóa biến Hermes Agent thành machine tự tiến hóa

GEPA (Genetic-Pareto Prompt Evolution) dùng 35x ít rollouts hơn GRPO để cải thiện skill hiệu quả hơn 20% - chạy qua API $2-10/run, không cần GPU. Curator là background agent chạy 7 ngày/chu kỳ, tự gộp skill trùng và archive skill 90 ngày không dùng - không bao giờ auto-delete. v0.12 giảm cold start 57%, ra ngày 30/4/2026 với 1.096 commits từ 213 contributors.

hermes-agentgepanous-research

6 phút đọc

#6622026-05-17

276 Use Cases của Hermes Agent - Cộng Đồng Đang Xây Gì Vào Năm 2026

Một thread trên Reddit đã ghi lại 276 use cases thực tế của Hermes Agent, trải đều 16 danh mục từ GitHub, Reddit, Hacker News đến production deployment. Hermes Agent vượt 140.000 GitHub stars chỉ sau 3 tháng ra mắt và trở thành agent được dùng nhiều nhất thế giới theo OpenRouter. Chi phí vận hành chỉ từ $5/tháng trên VPS, hỗ trợ 200+ model và 6 nền tảng nhắn tin đồng thời. Không còn là chatbot - đây là hạ tầng cho lao động kỹ thuật số tự vận hành.

hermes-agentnous-researchai-agent

8 phút đọc

#5112026-05-06

Tìm Zero-Day Với Bất Kỳ Model Nào: Bí Quyết Nằm Ở Orchestration

Niels Provos chứng minh tìm zero-day không cần model frontier đắt tiền - framework IronCurtain open-source dùng Claude Opus 4.6 và GLM 5.1 đã tái hiện lỗi 27 năm tuổi trong OpenBSD. Chi phí audit toàn bộ codebase giờ chỉ $30-$150 với Sonnet và Opus 4.6. Bug 18 năm tuổi trong thư viện nền tảng bị tìm ra hoàn toàn tự động, không cần con người can thiệp.

ai-securityzero-dayvulnerability-research

7 phút đọc

#3872026-04-24

DeepSeek V4 chạy mượt trên Huawei Ascend 950: Hào CUDA của Nvidia chính thức nứt

Ai cũng đang nhìn con số 1.6T tham số và giá $1.74/1M token của DeepSeek V4. Nhưng câu chuyện thật sự nằm ở phần cứng: đây là mô hình frontier đầu tiên không lệ thuộc Nvidia top-tier. Huawei Ascend 950 supernode đạt 20ms inference cho V4-Pro — hào compute địa chính trị đang co lại rất nhanh.

deepseek-v4huawei-ascendopen-source-llm

7 phút đọc

#3832026-04-24

Kimi K2.6 tự tay refactor engine tài chính 8 năm tuổi: +185% throughput sau 13 giờ chạy một mình

Moonshot AI tung Kimi K2.6 (GA 21/04/2026) — model open-weight 1T MoE chạy autonomous 12+ giờ, điều phối 300 sub-agent. Case study nổi bật: K2.6 tự overhaul exchange-core (matching engine tài chính 8 năm tuổi, đã tối ưu sát trần), đọc flame graph, đổi thread topology 4ME+2RE → 2ME+1RE, và bật throughput trung vị lên +185% (0.43 → 1.24 MT/s), peak +133% (1.23 → 2.86 MT/s) sau 13 giờ, 1,000+ tool call, 4,000+ dòng code sửa.

kimi-k2-6moonshot-aiopen-source-llm

8 phút đọc

#3812026-04-23

500+ AI tự nghiên cứu AI: 72 giờ điên rồ đầu tiên của Hugging Face ml-intern

Hugging Face vừa thả ml-intern — AI agent tự đọc paper, tự dựng dataset, tự train model. Sau 72 giờ, hơn 500 dự án nghiên cứu tự động chạy song song liên tục trên Space, sinh ra những kiến trúc kỳ quái như transformer thay thế bằng năng lượng tối thiểu và attention mô phỏng não người.

ml-internhugging-faceai-agents

7 phút đọc

#3772026-04-23

Brave Ocelot: mô hình tóm tắt web mã nguồn mở, chạy ngay trên máy bạn

Brave vừa open-source Ocelot — một mô hình AI do chính Brave huấn luyện, chuyên làm một việc duy nhất: tóm tắt nội dung web, và quan trọng hơn, chạy hoàn toàn trên thiết bị người dùng. Không gửi nội dung trang lên cloud, không cần tài khoản, không tính phí API.

braveoceloton-device-ai

6 phút đọc

#3662026-04-22

Kimi K2.6 Agent Swarm: 300 sub-agents × 4,000 steps, và output là file thật chứ không phải chat

Moonshot AI open-source Kimi K2.6 (20/04/2026) với Agent Swarm mở rộng lên 300 sub-agents × 4,000 bước, tự code liên tục 13 giờ, và một lần chạy ra 100+ file — vượt GPT-5.4 trên SWE-Bench Pro, dẫn đầu HLE-Full w/ tools.

kimi-k2-6moonshot-aiagent-swarm

8 phút đọc

#3592026-04-22

Kimi K2.6 Agent: Một prompt ra cả website — video hero, WebGL shader, backend thật

Moonshot AI vừa đẩy Kimi K2.6 Code Preview ra cho subscriber: 1T params MoE, context 256K, swarm 300 agent, và quan trọng nhất — sinh được website React 19 với hero video, shader GLSL, 3D Three.js và auth + database chỉ từ một prompt.

kimi-k2-6moonshot-aiopen-source-llm

7 phút đọc

#2892026-04-15

Baidu mở mã nguồn ERNIE-Image 8B: mô hình text-to-image chạy trên GPU tiêu dùng, fine-tune thoải mái

Baidu vừa open-source ERNIE-Image — Diffusion Transformer 8B, Apache 2.0, chạy 24GB VRAM, đánh bại FLUX.2-klein và Qwen-Image trên GenEval. Rendering chữ Trung + Nhật cực đậm, tùy biến được cho brand riêng.

ernie-imagebaiduopen-source-llm

6 phút đọc