Tất cả bài viết

// Posts#coding-agents

#6152026-05-13

Nền tảng agent tự cải thiện: Khi coding agent build, chạy và tự nâng cấp chính mình

Agno ra mắt agent platform mà coding agent (Claude Code) có thể build, chạy và tự cải thiện đệ quy chỉ với 5 prompt. Vòng lặp Improve - Hill Climb giúp agent tự nâng cấp gần như không cần can thiệp thủ công. Stack: FastAPI + PostgreSQL + Docker, deploy Railway chỉ $20/tháng, từ ý tưởng đến agent hoàn chỉnh trong 5-10 phút.

agnocoding-agentsai-platform

7 phút đọc

#5872026-05-10

Harness Engineering (Phần 6): Khi Scaffolding Quan Trọng Hơn Model

Claude Opus 4.6 xếp hạng #33 trên Terminal Bench 2.0 trong native harness, nhưng vọt lên #5 chỉ bằng cách thay đổi cấu hình - không đụng vào model. ~98.4% codebase của Claude Code là infrastructure, chỉ 1.6% là AI decision logic. Harness engineering - discipline thiết kế scaffolding xung quanh model - đang trở thành kỹ năng cốt lõi của agentic era.

harness-engineeringcoding-agentsai-engineering

7 phút đọc

#3632026-04-22

Multica: Bản Open-Source Của ChatGPT Workspace Agents — Biến Coding Agent Thành Đồng Nghiệp Thật

Multica là nền tảng open-source quản lý coding agent như một thành viên team: giao việc, theo dõi tiến độ, gom kỹ năng tái sử dụng. 19k sao GitHub, 51 release, tự host được — đây là lựa chọn thay thế minh bạch cho ChatGPT workspace agents đóng.

multicaopen-sourceai-agents

7 phút đọc

#2712026-04-11

Harness Engineering (Phần 5): Harness Là Lợi Thế Cạnh Tranh Mới

deepagents-cli của LangChain nhảy từ ngoài Top 30 lên Top 5 trên Terminal-Bench 2.0 với mức tăng 13.7 điểm — mà model bên dưới không đổi. Meta-Harness của Stanford đạt 76.4% trên cùng benchmark khi dùng Claude Opus 4.6. Team Frontier của OpenAI đã ship hơn 1 triệu dòng code production với zero dòng code do người viết, chỉ với 3-7 kỹ sư. Harness mới là moat, không phải model.

agent-harnessagentic-engineeringllm-infrastructure

7 phút đọc