← Tất cả bài viết

Tag: #agentic-ai

23 bài viết

Hermes Agent Harness: 9 thành phần tạo nên sự khác biệt, cộng thêm gateway, profile và cron
#7322026-05-29

Hermes Agent Harness: 9 thành phần tạo nên sự khác biệt, cộng thêm gateway, profile và cron

Aparna Dhinakaran phân tích 9 thành phần harness chuẩn, cộng 3 subsystem ngoài framework của Hermes Agent. Provider abstraction được khen là vượt Claude Code. Summary budget scale 20% với floor 2000 token và ceiling 12000. Session storage dùng SQLite + FTS5 + WAL, mỗi compression tạo child session với lineage chain. Gap còn lại: delegate_task chưa thành first-class orchestration plane với durable child-run control.

hermes-agentnousresearchagent-harness
8 phút đọc
Claude Opus 4.8 Ra Mắt: Sharper Judgment, Dynamic Workflows và Fast Mode Rẻ Hơn 3x
#7282026-05-28

Claude Opus 4.8 Ra Mắt: Sharper Judgment, Dynamic Workflows và Fast Mode Rẻ Hơn 3x

Anthropic phát hành Claude Opus 4.8 ngày 28/5/2026, chỉ 41 ngày sau Opus 4.7, với giá không đổi $5/$25 per 1M tokens. Agentic coding đạt 69.2% SWE-bench Pro - bỏ xa GPT-5.5 (58.6%) và Gemini 3.1 Pro (54.2%). Fast mode mới chạy 2.5x nhanh hơn và rẻ hơn 3x ($10/$50 per 1M thay vì $30/$150). Model còn ít khả năng bỏ sót lỗi code hơn Opus 4.7 tới 4 lần.

claudeanthropicai-model
6 phút đọc
FluxMem: kiến trúc bộ nhớ tự tiến hóa cho LLM Agent từ Zhejiang và Alibaba
#7262026-05-27

FluxMem: kiến trúc bộ nhớ tự tiến hóa cho LLM Agent từ Zhejiang và Alibaba

FluxMem mô hình hóa bộ nhớ agent thành một heterogeneous graph có thể tự chỉnh sửa qua 3 giai đoạn. Trên LoCoMo, framework đạt 95.06 LMJ với GPT-4.1-mini, vượt EverMemOS (93.05) và Full Context (81.23). Trên GAIA với Kimi K2, success rate nhảy từ 52.12 lên 64.85, tăng tuyệt đối 12.73 điểm. Trên Mind2Web realistic, Cross-Task SR đạt 8.1 - hơn gấp đôi AWM (3.6).

llm-agentmemory-architecturefluxmem
9 phút đọc
Khóa học 22 chương thiết kế AI Agent - P3: Production, Observability và Agency
#7142026-05-23

Khóa học 22 chương thiết kế AI Agent - P3: Production, Observability và Agency

Đưa AI agent từ prototype ra production là thách thức lớn nhất - Gartner dự báo 50% deployment failure đến từ thiếu governance. Khóa học agentic AI giải quyết vấn đề này qua 11 chương cuối: human-in-the-loop, MCP connectors, observability end-to-end, cost optimization, safety và proactive agents tự tiến hóa.

ai-agentagentic-aiobservability
6 phút đọc
Khóa học 22 chương thiết kế AI Agent - P2: Nền tảng, Bộ nhớ và Phối hợp đa-Agent
#7132026-05-23

Khóa học 22 chương thiết kế AI Agent - P2: Nền tảng, Bộ nhớ và Phối hợp đa-Agent

Từ một tool call đơn giản đến hệ thống đa-agent phối hợp hoàn chỉnh: khóa học agentic AI phân tích kiến trúc cốt lõi qua 11 chương đầu. Agent loop, memory ngắn hạn và dài hạn, planning, orchestration harness - mọi thứ được giải thích bằng pattern kiến trúc, không gắn với framework cụ thể.

ai-agentagentic-aisystem-design
5 phút đọc
Khóa học 22 chương thiết kế AI Agent - P1: Triết lý và Tổng quan
#7122026-05-23

Khóa học 22 chương thiết kế AI Agent - P1: Triết lý và Tổng quan

Repo GitHub mới nhất dạy bạn thiết kế, xây dựng và vận hành AI agent production-grade chỉ trong 22 chương - hoàn toàn miễn phí. Triết lý cốt lõi: đọc cùng AI assistant, để AI viết code, bạn đặt câu hỏi đúng. Không gắn với LangChain hay bất kỳ framework nào - chỉ pattern kiến trúc bền vững theo thời gian. Phù hợp cả người kỹ thuật lẫn non-technical.

ai-agentagentic-aisystem-design
5 phút đọc
10 Lớp Kiến Trúc để Autonomous Agents Thực Sự Tự Hành - Không Chỉ Generate Output
#6862026-05-20

10 Lớp Kiến Trúc để Autonomous Agents Thực Sự Tự Hành - Không Chỉ Generate Output

Autonomous agents cần 3 mặt phẳng - 10 lớp để trở thành asset class thực sự: từ danh tính (ERC-8004 với 128,000 agents trên 24 chain) đến thanh toán (x402 xử lý 15 triệu giao dịch/tháng). Gartner dự báo 40%+ dự án agentic AI sẽ bị hủy trước 2028 vì thiếu governance. EU AI Act enforcement tháng 8/2026 - phạt tới €35M hoặc 7% doanh thu toàn cầu.

autonomous-agentsagentic-aierc-8004
9 phút đọc
Làm AI Agent Đầu Tiên Với Hermes và Grok
#6732026-05-19

Làm AI Agent Đầu Tiên Với Hermes và Grok

Hermes Agent - open-source AI agent của NousResearch - đạt 157k GitHub stars, hiện ở v0.14.0 với SuperGrok OAuth tích hợp. Agent không chỉ là chatbot: gồm 5 thành phần brain, tools, memory, rules, loop - chạy vòng perceive-reason-execute liên tục. Cài bằng 1 lệnh curl, kết nối Grok không cần API key riêng nếu có SuperGrok. Phù hợp nhất cho personal workflow, research automation, và daily briefing tự động qua Telegram.

ai-agenthermes-agentgrok
6 phút đọc
Hermes Agent v0.14.0 ra mắt: pip install, browser nhanh 180x, Grok 1M context
#6712026-05-19

Hermes Agent v0.14.0 ra mắt: pip install, browser nhanh 180x, Grok 1M context

Hermes Agent v0.14.0 "The Foundation Release" ra mắt ngày 16/5/2026 với 808 commits và 545 issues đã đóng. Browser automation nhanh hơn 180x nhờ persistent Chrome DevTools connection. Cold-start giảm ~19 giây, grok-4.3 được bump lên 1M token context window. pip install hermes-agent giờ hoạt động trực tiếp từ PyPI.

hermes-agentnous-researchai-agent
7 phút đọc
Chỉ 1 Lệnh /goal, Claude Code Tự Chẩn Đoán Và Tăng Tốc Độ Internet Của Bạn Lên Gấp Đôi
#6702026-05-18

Chỉ 1 Lệnh /goal, Claude Code Tự Chẩn Đoán Và Tăng Tốc Độ Internet Của Bạn Lên Gấp Đôi

CJ Zafir chỉ gõ '/goal make my internet network faster' và Claude Code tự chạy speedtest-cli, kiểm tra DNS, MTU, Wi-Fi rồi fix 3 vấn đề - không cần thêm lệnh nào. /goal là tính năng agent tự hành của Claude Code, chạy vòng lặp Observe-Act-Verify liên tục mà không cần approve từng bước. Stripe triển khai cho 1.370 kỹ sư, Ramp giảm 80% thời gian điều tra sự cố nhờ Claude Code.

claude-codeai-agentanthropic
6 phút đọc
Cursor Composer 2.5: Ngang Hàng Frontier, Chi Phí Bằng 1/10
#6682026-05-18

Cursor Composer 2.5: Ngang Hàng Frontier, Chi Phí Bằng 1/10

Cursor Composer 2.5 ra mắt ngày 18/5/2026, đạt 79.8% SWE-Bench Multilingual - tăng 6.1 điểm so với Composer 2. Giá Standard chỉ $0.50/$2.50 per triệu token, rẻ hơn Claude Opus 4.7 khoảng 10 lần input và 30 lần output. Model được train với 25x nhiều synthetic tasks hơn, dùng kỹ thuật mới 'targeted RL with textual feedback'. Cursor đang hợp tác xAI train model kế tiếp trên Colossus 2 với 1 triệu H100-equivalents.

cursorcomposer-2-5ai-coding
6 phút đọc
5 Tool Trước Khi Build Bất Kỳ Agentic System Nào
#6532026-05-18

5 Tool Trước Khi Build Bất Kỳ Agentic System Nào

direnv + secrets manager ngăn pattern vi phạm phổ biến nhất năm 2026 - API key commit nhầm vào git. LiteLLM proxy cắt 30-60% hoá đơn AI nhờ response caching theo prompt hash. uv nhanh hơn pip 10-100x và uv.lock đảm bảo mọi người dùng cùng dependency chính xác. mitmproxy là lớp giám sát duy nhất giúp bạn thực sự thấy agent đang làm gì trong production.

agentic-aideveloper-toolssecurity
7 phút đọc
AI Agent của bạn cứ thất bại? Đây là hệ thống 8 bước để fix
#6492026-05-18

AI Agent của bạn cứ thất bại? Đây là hệ thống 8 bước để fix

Gartner dự đoán hơn 40% dự án agentic AI sẽ thất bại trước 2027 - chủ yếu vì thiếu hệ thống, không phải vì LLM kém. Framework 8 bước chuẩn (Define → Brain → Model → Tools → Memory → Orchestrate → Interface → Test) giúp agent đạt failure rate dưới 1%. Semantic caching giảm API call tới 70%, structured data governance giảm error rate AI apps tới 80%. Năm 2026, 40% enterprise apps sẽ có task-specific AI agents - cơ hội cho ai biết xây đúng cách.

ai-agentllmagentic-ai
7 phút đọc
GitHub ra mắt GH-600: Chứng chỉ Agentic AI Developer đầu tiên - Từ viết code đến điều hành đội agent
#6312026-05-16

GitHub ra mắt GH-600: Chứng chỉ Agentic AI Developer đầu tiên - Từ viết code đến điều hành đội agent

GitHub ra mắt GitHub Certified: Agentic AI Developer (GH-600) - chứng chỉ đầu tiên xác nhận kỹ năng vận hành AI agent trong SDLC production. 6 domain từ MCP server đến multi-agent orchestration. Beta đang mở với 80% giảm giá (code GH600Flanders) đến 31/5/2026, GA tháng 7/2026. Điểm đạt 700/1000, thi 120 phút, giá $165 USD.

github-certificationagentic-aigh-600
7 phút đọc
4 Trụ Cột Agent Bền Vững - Phần 1: 88% AI Agent Chết Trong Production - Vấn Đề Không Nằm Ở Model
#5782026-05-11

4 Trụ Cột Agent Bền Vững - Phần 1: 88% AI Agent Chết Trong Production - Vấn Đề Không Nằm Ở Model

88% dự án agent không bao giờ ra production theo IDC 2026. MIT đo 95% tỷ lệ thất bại. Chỉ 5% trong số 1.837 developer được khảo sát có agent thật sự chạy production. Lý do không phải model kém - mà là kỹ thuật xung quanh model. Bài này đặt tên cho vấn đề: engineering deficit.

ai-agentagentic-aiengineering
5 phút đọc
HeavySkill: Suy luận nặng trở thành kỹ năng nội tại của LLM
#5572026-05-08

HeavySkill: Suy luận nặng trở thành kỹ năng nội tại của LLM

HeavySkill biến heavy thinking thành 2 giai đoạn song song và tổng hợp tuần tự, đạt 100% AIME25 với Kimi K2 và DeepSeek V3.2. GPT-OSS-20B tăng từ 69.7% lên 85.5% trên LiveCodeBench. Open-source Apache-2.0, tích hợp trực tiếp Claude Code không cần sửa code.

heavyskilltest-time-scalingllm-reasoning
6 phút đọc
Cloudflare sa thải 1.100 nhân viên vì AI - doanh thu kỷ lục $639,8M không cứu được 20% lực lượng
#5492026-05-07

Cloudflare sa thải 1.100 nhân viên vì AI - doanh thu kỷ lục $639,8M không cứu được 20% lực lượng

Cloudflare sa thải 1.100 nhân viên (20% lực lượng) ngay khi Q1 2026 đạt doanh thu kỷ lục $639,8M, tăng 34% YoY. AI agent thay thế toàn bộ các vị trí support, HR và finance nội bộ - productivity tăng tới 100x ở một số nhóm. Gói severance trả lương đến hết năm 2026 nhưng nhân viên chỉ nhận email 1 giờ trước khi bị nghỉ. Cổ phiếu NET giảm 18-24% ngay sau thông báo.

cloudflareai-layoffstech-news
5 phút đọc
RAG tiến hóa như thế nào: Từ Retrieval đơn giản đến Agentic AI
#5392026-05-07

RAG tiến hóa như thế nào: Từ Retrieval đơn giản đến Agentic AI

RAG đã trải qua 6 giai đoạn tiến hóa - từ keyword search thủ công đến Agentic AI tự lên kế hoạch và tự sửa lỗi. Agentic RAG tốn 3-10x token và thêm 2-5x latency, nhưng đáng giá với các tác vụ multi-hop phức tạp, y tế, pháp lý. MCP trở thành chuẩn Linux Foundation tháng 12/2025 - báo hiệu RAG sắp biến thành tầng hạ tầng cốt lõi của mọi ứng dụng AI.

ragagentic-aillm
8 phút đọc
Multi-Agent Orchestration: Khi AI biết phân công lao động
#4782026-05-06

Multi-Agent Orchestration: Khi AI biết phân công lao động

Multi-agent vượt single-agent Claude Opus 4 tới 90.2% trong benchmark nghiên cứu. Mỗi sub-agent có context window riêng, cùng chia sẻ filesystem để phối hợp - đây là kiến trúc đang reshape cách AI xử lý bài toán phức tạp. Token tiêu tốn gấp 15 lần chat thường, nhưng tốc độ xử lý tăng tới 90% nhờ song song hóa.

multi-agentai-architectureclaude
7 phút đọc
Kiến trúc Agentic AI: Mental Model để thiết kế hệ thống đa tác tử
#4452026-05-02

Kiến trúc Agentic AI: Mental Model để thiết kế hệ thống đa tác tử

Hệ thống multi-agent dùng gấp 15 lần token so với chat nhưng mang lại cải thiện hiệu suất 90.2% so với single-agent. Anthropic xác định 5 pattern orchestration chuẩn: Sequential, Concurrent, Group Chat, Handoff, và Magentic. Kiến trúc gồm 8 tầng từ Orchestration đến Foundation, mỗi tầng có vai trò không thể thiếu. MCP đang trở thành chuẩn giao tiếp giữa agent và tool trong năm 2026.

agentic-aimulti-agentai-architecture
8 phút đọc
Tại sao LLM agent sụp đổ khi task dài: Không phải do reasoning, mà do số bước
#4022026-04-26

Tại sao LLM agent sụp đổ khi task dài: Không phải do reasoning, mà do số bước

RL training cho LLM agent sụp đổ hoàn toàn khi task vượt 20-30 bước, dù reasoning complexity không đổi - đây là reframing quan trọng nhất trong agentic AI 2026. Hai thủ phạm: exploration failure (quá nhiều đường đi) và credit assignment hỏng (bước đúng bị phạt vì trajectory dài thất bại). Macro actions và subgoals giải quyết cả hai, còn horizon generalization cho phép train trên task ngắn nhưng chạy được task dài.

agentic-aillm-engineeringreinforcement-learning
7 phút đọc
OpenAI Codex ra mắt Auto-review: một AI giám sát AI để code chạy 7 tiếng không cần bạn ngồi canh
#3632026-04-23

OpenAI Codex ra mắt Auto-review: một AI giám sát AI để code chạy 7 tiếng không cần bạn ngồi canh

Codex v0.124.0 đưa Auto-review lên trạng thái stable — agent reviewer thứ hai tự đánh giá rủi ro và duyệt các bước nhạy cảm (chạy test, build, shell, network) thay con người, mở đường cho các task dài hàng giờ và nhiều agent chạy song song.

openaicodexai-coding
7 phút đọc
Claude Code tự động xây CMS: khi AI chạy 5 task liên tiếp không cần can thiệp
#3002026-04-17

Claude Code tự động xây CMS: khi AI chạy 5 task liên tiếp không cần can thiệp

claude-mem đạt 73.9k GitHub stars sau 7 tháng - plugin giúp Claude Code nhớ mọi thứ qua các session. Một demo cho thấy Claude tự chạy 5 task liên tiếp (98.8k tokens, 5h 42m) để nâng cấp toàn bộ CMS y tế mà không cần hỏi lại người dùng. Smart compression giảm context 95%, từ 10,000 tokens xuống còn ~500 tokens. Cài bằng một lệnh: npx claude-mem install.

claude-codeclaude-memmulti-agent
6 phút đọc