Agent Skills workflow pipeline: DEFINE PLAN BUILD VERIFY SHIP

TL;DR

Addy Osmani - Chrome engineering lead tại Google, tác giả cuốn Learning Patterns - vừa phát hành agent-skills: bộ 21 workflow templates dạng markdown dành cho AI coding agents. Repo đạt 37.3k stars, 4.2k forks trên GitHub, MIT license. Mục tiêu: buộc AI agents tuân thủ đúng quy trình kỹ thuật cấp senior - từ viết spec, lập kế hoạch, build tăng dần, test, review đến ship - thay vì để agent tự ý đi đường tắt và bỏ qua những bước quan trọng không hiển thị trong diff.

Vấn đề AI agent hay bỏ qua

AI coding agents cực kỳ giỏi viết code. Nhưng chúng hành xử như một junior engineer thông minh nhưng thiếu kinh nghiệm: luôn tìm đường ngắn nhất đến kết quả, bỏ qua những bước "không thấy trong code" như viết spec, test-first, hay giới hạn scope của PR.

Osmani mô tả chính xác: “Senior-engineering work - surfacing assumptions, sizing changes, writing the spec, leaving evidence, refusing to merge what can't be reviewed - is exactly what an agent will skip unless you make it impossible to skip.”

Nếu bạn chỉ dùng system prompt thông thường kiểu “hãy viết test đầy đủ”, agent đọc xong rồi... vẫn bỏ qua test khi cảm thấy task đủ đơn giản. agent-skills giải quyết bằng cách biến quy trình thành executable workflow có checkpoint, không phải prose tĩnh.

agent-skills hoạt động như thế nào

Mỗi skill là một file SKILL.md với cấu trúc chuẩn gồm:

  • When to Use: điều kiện kích hoạt skill

  • Process steps: các bước tuần tự có thể verify

  • Anti-Rationalization Table: bảng liệt kê lý do agent hay dùng để bỏ qua bước, kèm phản biện

  • Verification Requirements: exit criteria cụ thể - tests passing, build output, runtime data

  • Cross-references: liên kết đến skill liên quan, tránh lặp nội dung

Ví dụ anti-rationalization trong skill spec-driven-development: “This task is too simple to need a spec” - phản biện: “Acceptance criteria still apply. Five lines is fine.”

21 skills được chia theo 6 phase của vòng đời phát triển phần mềm: Define → Plan → Build → Verify → Review → Ship. Một router skill tự động load đúng skill cần thiết vào context, tránh token bloat khi load cả 21 skill cùng lúc - thiết kế mà Osmani gọi là progressive disclosure.

Ngoài skills, repo còn có:

  • 7 slash commands: /spec, /plan, /build, /test, /review, /code-simplify, /ship

  • 3 agent personas chuyên biệt: code-reviewer (Staff Engineer), test-engineer (QA), security-auditor

  • 4 reference checklists: testing-patterns, security, performance, accessibility

Skill cards với các bước spec plan build test review ship và anti-rationalization speech bubbles

Cài đặt nhanh

Cách 1 - Claude Code marketplace (khuyến nghị):

/plugin marketplace add addyosmani/agent-skills
/plugin install agent-skills@addy-agent-skills

Sau khi install, các slash commands (/spec, /plan, /build...) tự available trong mọi phiên Claude Code.

Cách 2 - Drop trực tiếp vào bất kỳ AI tool nào:
Copy các file SKILL.md vào system prompt của Cursor, Gemini CLI, Codex, Aider, Windsurf, OpenCode, hoặc Kiro IDE. Cùng một file, chạy trên mọi harness.

Cách 3 - Dùng làm team documentation:
Dùng workflows như internal engineering playbook mà không cần tích hợp AI agent.

Google engineering trong từng skill

Osmani nhúng thẳng các practice từ Software Engineering at Google vào từng skill:

  • Hyrum's Law: mọi hành vi observable của API đều sẽ có người phụ thuộc vào - áp dụng trong skill API design

  • Beyonce Rule: nếu bạn muốn test nó, hãy viết test - áp dụng trong skill testing

  • Chesterton's Fence: đừng xóa code nếu chưa hiểu tại sao nó tồn tại - áp dụng trong skill simplification

  • Test pyramid: ~80% unit / 15% integration / 5% e2e

  • PR size: ~100 lines là target, trunk-based development

  • Shift Left: test và security review sớm nhất có thể trong pipeline

So sánh với system prompt và Cursor Rules

Tiêu chí

System prompt thuần

Cursor Rules

agent-skills

Cấu trúc

Prose tĩnh

Config file

Executable workflow

Checkpoint

Không

Không

Có, exit criteria rõ

Anti-rationalization

Không

Không

Có mỗi skill

Multi-phase SDLC

Tuỳ người viết

Tuỳ người viết

6 phase chuẩn hoá

Portability

Theo tool

Cursor only

Mọi AI harness

Token overhead

Thấp

Thấp

Giảm qua router

Ai nên dùng ngay

  • Developer cá nhân muốn AI output của mình đạt production-ready, không chỉ “chạy được trên máy mình”

  • Engineering teams cần chuẩn hóa quy trình khi nhiều người dùng AI cùng lúc - mọi PR đều qua cùng quality gate dù ai đang review

  • Long-running agent sessions kéo dài 30+ giờ, nơi mỗi bước bỏ qua tích lũy thành technical debt khó debug về sau

  • Tổ chức muốn xây internal skill system riêng dựa trên framework này - MIT license, fork thoải mái

Kết

agent-skills không phải tool magic làm AI giỏi hơn - nó là scaffolding kỷ luật: buộc AI agent làm đúng những bước mà senior engineer sẽ làm nhưng agent sẽ bỏ qua nếu không có ai kiểm tra. Với 37k+ stars trong thời gian ngắn, đây rõ ràng là vấn đề nhiều team đang gặp phải.

Nếu bạn đang dùng Claude Code, thử ngay: /plugin marketplace add addyosmani/agent-skills. Nếu dùng Cursor hoặc Gemini CLI, drop SKILL.md vào system prompt. Cùng một file, cùng một kỷ luật.

Via: addyosmani/agent-skills ·VoltAgent/awesome-agent-skills