Tag: #llm

54 bài viết

7782026-06-15

Coding Agent Hay Phá Luật Hơn Viết Code Sai: Bằng Chứng Từ 20.574 Phiên Thực Tế

Nghiên cứu phân tích 20.574 phiên coding agent thực tế: lỗi phổ biến nhất là vi phạm ràng buộc developer, chiếm 38.33% - không phải viết code sai. Agent CLI vi phạm ràng buộc nhiều hơn IDE (49.49% vs 32.26%), nhưng IDE lại lỗi implement gần gấp 3 lần. 91.49% tình huống vẫn đòi developer sửa tay dù agent đã báo xong.

ai-agentcoding-agentdeveloper-tools

6 phút đọc

7772026-06-15

AI không tiết kiệm thời gian như bạn nghĩ - Và nghiên cứu 2.691 người chứng minh điều đó

Nghiên cứu từ Stanford, NYU, MIT và Princeton AI Lab khảo sát 2.691 người: kỳ vọng AI tiết kiệm 55,7 giây nhưng thực tế chỉ 7,5 giây. Người dùng còn đánh giá thấp mức độ mình dùng AI: nghĩ là 33% task nhưng thực tế đã dùng tới 47%. Carryover effect khiến mỗi lần dùng AI làm tăng khả năng dùng tiếp ở lần sau, kể cả khi tự làm nhanh hơn.

airesearchproductivity

5 phút đọc

#7702026-06-12

Google ra mắt OKF: Định dạng mở để AI Agent tự quản lý tri thức

Google Cloud phát hành Open Knowledge Format (OKF) v0.1 ngày 12/6/2026, chính thức hóa ý tưởng LLM Wiki của Andrej Karpathy thành một open specification. Spec chỉ 451 dòng, dùng markdown thuần với YAML frontmatter, không cần SDK hay platform độc quyền. Chỉ một trường bắt buộc duy nhất là type - mọi thứ còn lại là tùy chọn.

ai-agentgoogle-cloudopen-source

6 phút đọc

#7582026-06-05

Gemini Enterprise Agentic RAG: khi RAG biết tự đào lại đến khi đủ dữ kiện

Google Research và Google Cloud công bố framework Agentic RAG mới trong Gemini Enterprise Agent Platform, đang ở public preview. Trên FramesQA (824 query, 2,676 PDF), accuracy cải thiện tới 34% so với vanilla RAG. Cross-corpus đạt 90.1% accuracy khi Planner Agent phải chọn đúng 1 trong 4 corpus, latency chỉ chậm hơn single-corpus trong vòng 3%. Điểm khác biệt: Sufficient Context Agent quyết định khi nào dữ liệu đủ và buộc hệ thống search tiếp khi chưa đủ.

Tag: #llm

Coding Agent Hay Phá Luật Hơn Viết Code Sai: Bằng Chứng Từ 20.574 Phiên Thực Tế

AI không tiết kiệm thời gian như bạn nghĩ - Và nghiên cứu 2.691 người chứng minh điều đó

Google ra mắt OKF: Định dạng mở để AI Agent tự quản lý tri thức

Gemini Enterprise Agentic RAG: khi RAG biết tự đào lại đến khi đủ dữ kiện

Toàn Tập Hướng Dẫn Xây Dựng AI Agent Swarm - P2: Hạ Tầng và Cách Hoạt Động

Toàn Tập Hướng Dẫn Xây Dựng AI Agent Swarm - P1: Kiến Trúc và Nền Tảng

Kimi K2.6 thay thế cả team dev: Blueprint xây dựng AI Agency $80k/tháng

Microsoft mở mã SkillOpt: train file SKILL.md như neural network

Claude Opus 4.8 Ra Mắt: Sharper Judgment, Dynamic Workflows và Fast Mode Rẻ Hơn 3x

Repo 4.2k Star Dạy Build AI Agent Từ Đầu - Không Framework, Không Black Box

AI Agents Cũng Lão Hóa - Sau 100 Session, Agent Của Bạn Còn Đáng Tin Không

Qwen3.7-Max ra mắt: AI Agent chạy 35 giờ không nghỉ, bước tiến mới từ Alibaba

Inference Engine cho LLM: Kiến trúc và nền tảng bạn cần hiểu trước khi chọn

AI Agent của bạn cứ thất bại? Đây là hệ thống 8 bước để fix

Xây dựng LLM Architecture từ đầu - Phần 3: Dự án thực tế và 5 cách kiếm tiền với LLM Skills

Xây dựng LLM Architecture từ đầu - Phần 2: Tokenization, Embeddings, Attention và RAG

Xây dựng LLM Architecture từ đầu - Phần 1: Python, Neural Networks và Transformer

4 Trụ Cột Agent Bền Vững - Phần 1: 88% AI Agent Chết Trong Production - Vấn Đề Không Nằm Ở Model

6 Bệnh Thần Kinh của AI Agent - P1: Source Amnesia, Phantom Limb và Locked-in Syndrome

Harness Engineering (Phần 6): Khi Scaffolding Quan Trọng Hơn Model

Claude Managed Agents: xây agent AI trong vài giờ thay vì vài tháng

PageIndex: Khi RAG Bỏ Hẳn Vector Database Mà Vẫn Đạt 98.7% Accuracy

10 Repos Giảm Token Bill AI Agent Tới 80% - Không Ai Kiểm Tra Cái Đang Gửi Đi

RAG tiến hóa như thế nào: Từ Retrieval đơn giản đến Agentic AI

Foundations of Large Language Models - Cuốn sách 247 trang miễn phí bạn nên đọc ngay

Andrej Karpathy vừa cho bạn khoá học LLM tốt nhất thế giới - miễn phí trên YouTube

7 GitHub repos để học AI thật sự trong 2026 (tất cả miễn phí)

PageIndex: Xuất sắc trong niche của nó - nhưng Twitter đang hype quá mức

Multi-Agent Orchestration: Khi AI biết phân công lao động

2 Kiểu Kỹ Sư Tạo Ra AI Agent Thực Sự Hoạt Động

10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P2: ReAct, Multi-Agent và An Toàn

10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P1: Nền Tảng Kiến Trúc

Harness Engineering (Phần 1): Tại sao Claude Opus 4.7 và GPT-5.4 đạt 0% khi làm việc thật?

Kiến trúc Agentic AI: Mental Model để thiết kế hệ thống đa tác tử

8 kỹ thuật prompting để LLM trả lời tốt hơn (không cần đổi model)

GraphGen: Sinh Dữ Liệu Huấn Luyện LLM từ Knowledge Graph

Cách Viết System Prompt Claude Thực Sự Đưa Vào Production

TradingAgents-CN: Khi AI Mô Phỏng Cả Một Phòng Quant Wall Street

Multi-Agent Orchestration: Khi một AI không còn đủ

AI Đừng Gật Đầu Nữa: Bộ Quy Tắc Truth-First cho Codex

Harness Engineering: Vì Sao AI Của Bạn Vẫn Làm Sai Và Cách Sửa

Agentic Memory: Khi AI Agent Thực Sự Biết Nhớ

Agent Harness: Lý do thật sự khiến dự án AI agent của bạn không bao giờ ra được sản phẩm

Awesome LLM Apps: Kho 100+ Template AI Agent &amp; RAG Hot Nhất GitHub với 111k Stars

AI Engineering from Scratch - Curriculum mã nguồn mở để hiểu AI thật sự, không phải chỉ gọi API

Hello-Agents: Dự án mã nguồn mở giúp bạn hiểu và tự xây AI Agent từ đầu

10 Kiến trúc RAG cho Enterprise AI 2026: Từ Naive RAG đến Agentic Graph RAG

7 GitHub Repos Web Scraping Được Xây Dựng Cho AI

10 Kiến trúc RAG cho Enterprise AI 2026: Từ Naive RAG đến Agentic Graph RAG

AI Agents: The Complete Course - P1: Nền tảng và cách hoạt động

Agentic Design Patterns: 21 Pattern để Xây AI Agent Thực Sự - P2: Context Engineering và Reflection Pattern

Agentic Design Patterns: 21 Pattern để Xây AI Agent Thực Sự - P1: Bạn Đang Xây Agent hay Chatbot?

Cuốn sách mã nguồn mở giúp bạn thiết kế AI Agent đúng cách - từ beginner tới enterprise

20 GitHub Accounts Mọi AI Builder Cần Follow - Phần 1: Nền Tảng và Training

Awesome LLM Apps: Kho 100+ Template AI Agent & RAG Hot Nhất GitHub với 111k Stars