Tag: #llm-engineering

6 bài viết

#6762026-05-19

Giải mã Multi-Agent AI: Từ ReAct Loop đến Deep Research Enterprise

Multi-agent system của Anthropic vượt trội single-agent 90.2% trên bài test nghiên cứu phức tạp, nhờ kiến trúc Lead Agent - Sub-Agents song song - Citation Agent. Context isolation là lý do cốt lõi: mỗi sub-agent có context window độc lập, tránh 'context rot' khi xử lý nhiều chủ đề. Parallel tool calling cắt 90% thời gian so với tìm kiếm tuần tự. Token tiêu thụ cao hơn 15x chat thông thường - chỉ hợp lý khi task value đủ cao.

multi-agentai-agentdeep-research

7 phút đọc

#6272026-05-15

Lộ Trình AI Engineer Miễn Phí 14 Tuần - Phần 2: Deep Learning, LLM Engineering và Deploy

Phần 2 của lộ trình AI Engineer 14 tuần miễn phí, bao gồm Deep Learning với Karpathy, LLM Engineering với RAG và quantization xuống 4-bit, AI Agents với Microsoft (62.600 stars) và Anthropic MCP, cùng cách deploy và đánh giá hệ thống AI production. mlabonne/llm-course (79.400 stars) là tài nguyên gần nhất với một LLM engineering curriculum open-source đầy đủ hiện có. Trong tuyển dụng AI hiện đại, GitHub thường quan trọng hơn CV - đây là lý do lộ trình này buộc bạn phải build và deploy thực sự.

ai-engineerdeep-learningllm-engineering

8 phút đọc

#6212026-05-15

Tencent Giải Quyết Bộ Nhớ AI Agent: Token Giảm 61%, Persona Tăng 48%→76%

TencentDB Agent Memory là hệ thống open-source (MIT) từ Tencent, giải quyết vấn đề agent mất ngữ cảnh qua kiến trúc 4 tầng tiến trình. Token tiêu thụ giảm 61.38% trên WideSearch benchmark. Persona coherence tăng từ 48% lên 76% trên PersonaMem. Chạy hoàn toàn local, không phụ thuộc external API.

tencentagent-memoryai-agent

6 phút đọc

#5742026-05-10

Harness Engineering (Phần 2): 5 Chiều Thiết Kế Biến AI Agent Từ Vô Dụng Thành Production-Ready

Vercel xóa 80% tools của agent: success rate tăng từ 80% lên 100%, nhanh hơn 3.5 lần, giảm 37% token. Anthropic dùng Ralph Loop để AI làm việc qua nhiều ngày mà không mất trí nhớ. Đây là bản thiết kế chi tiết 5 chiều cốt lõi của Harness Engineering - từ Context Management đến Architectural Guardrails.

harness-engineeringai-agentcontext-management

8 phút đọc

#4022026-04-26

Tại sao LLM agent sụp đổ khi task dài: Không phải do reasoning, mà do số bước

RL training cho LLM agent sụp đổ hoàn toàn khi task vượt 20-30 bước, dù reasoning complexity không đổi - đây là reframing quan trọng nhất trong agentic AI 2026. Hai thủ phạm: exploration failure (quá nhiều đường đi) và credit assignment hỏng (bước đúng bị phạt vì trajectory dài thất bại). Macro actions và subgoals giải quyết cả hai, còn horizon generalization cho phép train trên task ngắn nhưng chạy được task dài.

agentic-aillm-engineeringreinforcement-learning

7 phút đọc

#1122026-01-09

AI Agent Tech Stack 2025: 9 lớp kiến trúc mọi developer cần biết

9 lớp kiến trúc từ frontend đến GPU quyết định liệu agent của bạn có chạy ổn định ở production hay mãi stuck trong vòng lặp. LangChain đạt 5/10 DX trong benchmark 90 ngày của Nextbuild, PydanticAI dẫn đầu 8/10 và bắt được 23 production bugs LangChain bỏ sót. CrewAI không có token budget cap mặc định - một run uncapped trên Gemini đã tốn $414. McKinsey 2025: 62% doanh nghiệp đang thử nghiệm AI agents, 23% đã scale ở ít nhất một chức năng.

ai-agentlangchaincrewai

7 phút đọc