clawd.rip - Biên niên 38 lần Claude gặp sự cố
clawd.rip ghi lại 38+ sự cố của Claude AI từ tháng 10/2023 đến tháng 5/2026 qua 5 danh mục: Policy, Reliability, Quality, Safety, Legal. Bug cache tháng 3/2026 âm thầm tăng chi phí thêm $949-$1,582/user trong 3 tháng. Settlement vụ sách lậu hơn $1.5 tỷ - 465,000 cuốn sách. Năm 2026 chiếm hơn 20 sự cố chỉ trong 5 tháng.
Hermes Agent v0.15.0: The Velocity Release - AI agent mã nguồn mở vừa tăng tốc 4.500 lần
Hermes Agent v0.15.0 ra mắt ngày 28/05/2026 với 1.302 commits từ 321 contributors. session_search nhanh hơn 4.500 lần, từ 30 giây xuống 20ms và miễn phí hoàn toàn. Core code giảm 76%: run_agent.py từ 16.083 dòng xuống 3.821 dòng chia thành 14 module. Kanban tiến hóa thành nền tảng đa agent thực sự với Swarm topology 1 lệnh.
Claude Opus 4.8 Ra Mắt: Sharper Judgment, Dynamic Workflows và Fast Mode Rẻ Hơn 3x
Anthropic phát hành Claude Opus 4.8 ngày 28/5/2026, chỉ 41 ngày sau Opus 4.7, với giá không đổi $5/$25 per 1M tokens. Agentic coding đạt 69.2% SWE-bench Pro - bỏ xa GPT-5.5 (58.6%) và Gemini 3.1 Pro (54.2%). Fast mode mới chạy 2.5x nhanh hơn và rẻ hơn 3x ($10/$50 per 1M thay vì $30/$150). Model còn ít khả năng bỏ sót lỗi code hơn Opus 4.7 tới 4 lần.
lanshu-awesome-ai-video-kit: Bộ công cụ prompt engineering AI video mã nguồn mở cho doanh nghiệp
lanshu-awesome-ai-video-kit là bộ công cụ open-source với 543 prompt đã kiểm tra thực tế trên 16 model AI video. GitHub Action tự động giám sát 32 endpoint chính thức mỗi tuần để đảm bảo prompt không bị lỗi thời. Bộ 7 Claude Code Skills tích hợp sẵn giúp tự động chọn model, dịch prompt và debug lỗi. Dự án đạt 228 stars sau vài ngày ra mắt, hoàn toàn miễn phí theo giấy phép MIT.
FluxMem: kiến trúc bộ nhớ tự tiến hóa cho LLM Agent từ Zhejiang và Alibaba
FluxMem mô hình hóa bộ nhớ agent thành một heterogeneous graph có thể tự chỉnh sửa qua 3 giai đoạn. Trên LoCoMo, framework đạt 95.06 LMJ với GPT-4.1-mini, vượt EverMemOS (93.05) và Full Context (81.23). Trên GAIA với Kimi K2, success rate nhảy từ 52.12 lên 64.85, tăng tuyệt đối 12.73 điểm. Trên Mind2Web realistic, Cross-Task SR đạt 8.1 - hơn gấp đôi AWM (3.6).
Các mô hình AI tạo ảnh open-source tốt nhất 2026, bạn đã thử chưa ?
Năm 2026, landscape mô hình sinh ảnh open-source đã bùng nổ với hàng loạt cái tên mới vượt mặt cả Midjourney và DALL-E 3 trên benchmark chuẩn. HiDream-I1 đạt HPSv2.1 score 33.82, cao hơn Midjourney V6 (30.29) và DALL-E 3 (31.44). FLUX.2 ra mắt tháng 11/2025 với 32B params, hỗ trợ multi-reference tới 10 ảnh/lần. HunyuanImage-3.0 của Tencent là mô hình open-source lớn nhất với 80B params và 64 experts.
Cách xây dựng "Company Brain" - Bộ não AI cho doanh nghiệp bằng kiến trúc 5 lớp
Single Grain xây dựng hệ thống AI với 500K+ tokens persistent memory, 90+ daily crons, và 2.862 Gong call transcripts tự động hóa thành operational playbooks. Một ví dụ ingestion hàng ngày: 15 cuộc gọi cho ra 390 insights + 470 facts + 125 frameworks. Báo cáo hàng tuần từ 25 phút data pulling + hàng giờ follow-up rút xuống còn dưới 60 giây. Company brain thực sự không phải là kho lưu trữ - đó là intelligence layer biết cái gì cần retrieve, cái gì đáng tin, và ai được phép dùng nó.
Nghiên cứu: Harness phức tạp hơn không có nghĩa là AI agent tốt hơn
432 lần thử nghiệm cho thấy Gemini 2.5 Flash mất 29-38 điểm VTSR khi harness phức tạp hơn. Qwen3.5-122B đạt đỉnh 91.7% VTSR chính xác ở strict harness - ngược hoàn toàn kỳ vọng. Model 2B Gemma4:e2B ổn định 91.7% khắp mọi điều kiện - ngang với model mạnh hơn nhiều.
xAI ra mắt Grok Build Beta: 8 AI Agent chạy song song trong terminal của bạn
xAI mở rộng Grok Build Beta cho tất cả SuperGrok và X Premium+ users từ ngày 25/05/2026. Công cụ chạy tối đa 8 subagent song song trên branch riêng biệt - kiến trúc khác hoàn toàn so với Claude Code và Codex CLI. Điểm SWE-bench hiện tại là 70.8%, thấp hơn đối thủ nhưng model grok-build-0.1 mới chưa được benchmark. Grok 5 dự kiến nâng cấp trong tháng 6/2026 với 6 nghìn tỷ tham số.
Repo 4.2k Star Dạy Build AI Agent Từ Đầu - Không Framework, Không Black Box
ai-agents-from-scratch là repo 4.2k star dạy build AI agent từ đầu, không LangChain, không CrewAI. 15 module tiến dần từ LLM cơ bản đến Tree of Thought - 100% JavaScript, chạy local với node-llama-cpp. Module 15 vừa ra hôm nay: tool routing bằng embeddings. Phase 2 roadmap: rebuild LangChain từ scratch với code có thể đọc được.