TL;DR

Hệ sinh thái Agent Skills phát triển nhanh: Anthropic Skill Directory có partner skills từ Atlassian, Figma, Stripe, Canva, Cloudflare và nhiều đối tác khác. Skills không bị lock-in vào Claude - cùng file SKILL.md hoạt động trên Cursor, Codex, Gemini CLI, VS Code Copilot, JetBrains Junie. Skill-creator đi kèm eval system đầy đủ: benchmark with-skill vs baseline, tối ưu description qua nhiều vòng, track success rate. Skills có tiềm năng thương mại thực sự: từ công cụ cá nhân tiết kiệm thời gian đến sản phẩm AI bán được.

Hệ sinh thái: Skill Directory và partner skills

Khi công bố Agent Skills thành open standard ngày 18/12/2025, Anthropic ra mắt Skill Directory với partner skills từ các công ty lớn:

  • Atlassian: Skills cho Jira và Trello - biến spec thành backlog, triage issue, sinh status report đúng chuẩn quy trình của Atlassian
  • Figma: Tự động áp dụng brand style guidelines vào tài liệu marketing
  • Stripe: Tích hợp luồng payment vào workflow AI
  • Canva, Notion, Cloudflare, Zapier: Kết nối workflow AI với các platform phổ biến

Anthropic cũng mở kho GitHub công khai tại via github.com/anthropics/skills với hai loại Skills:

  • Open source (Apache 2.0): Skills mẫu cho Creative, Development và Enterprise workflows
  • Source-available: Skills xử lý tài liệu (docx, pdf, pptx, xlsx) - đây là Skills thực tế chạy các tính năng chỉnh sửa tài liệu của Claude, được chia sẻ như reference cho developer

Cài đặt Skills từ kho này trực tiếp trong Claude Code bằng cách đăng ký repository như một plugin marketplace.

Cross-tool: không bị lock-in vào Claude

Đây là cam kết lớn nhất của open standard: cùng một thư mục Skill, đặt vào đường dẫn tương ứng của mỗi tool là dùng được ngay.

  • Claude Code: ~/.claude/skills/
  • Cursor: ~/.cursor/skills/
  • Codex, Gemini CLI, JetBrains Junie: đường dẫn tương tự của từng tool

Thực tế vận hành: Skills bạn viết hôm nay cho Claude Code có thể softlink sang Cursor ngày mai - không cần viết lại, không cần chỉnh sửa. Đây là lợi ích lớn nhất của tiêu chuẩn mở so với các giải pháp độc quyền.

Claude Code còn có thêm một số tính năng mở rộng của riêng mình bên trên spec chuẩn: invocation control (disable-model-invocation, user-invocable), subagent execution (context: fork), và dynamic context injection với cú pháp !. Các tính năng này hoạt động với Claude Code, nhưng Skill vẫn portable sang tool khác nếu tool đó không hiểu các trường đó - chúng đơn giản bị bỏ qua.

Enterprise: quản lý Skills toàn tổ chức

Với gói Team và Enterprise, admin có dashboard trung tâm để:

  • Quyết định Skills nào được phép triển khai cho nhân viên
  • Set Skills nào bật mặc định cho toàn tổ chức
  • Kiểm soát Skills từ nguồn bên ngoài

Điều này cho phép doanh nghiệp chuẩn hóa quy trình: một Skill cho code review đúng theo security policy, một Skill cho viết tài liệu đúng format nội bộ, một Skill cho triage bug theo SLA - triển khai nhất quán cho toàn team mà không cần mỗi người tự cài và tự cấu hình.

Eval system và vòng lặp cải thiện

skill-creator - meta-Skill chính thức của Anthropic - có hệ thống benchmark tích hợp:

  • Tạo test case trong evals/evals.json: mỗi case có prompt (câu hỏi giả lập) và expected_output (mô tả kết quả mong muốn)
  • Chạy so sánh song song: with-skill (có Skill) vs. baseline (không có Skill)
  • Grader agent chấm điểm từng assertion
  • Báo cáo tổng hợp: pass rate, thời gian, token usage

Phần quan trọng nhất là tối ưu hóa description - yếu tố quyết định Skill có được trigger đúng lúc không. Quy trình: viết 20 eval query (8-10 trường hợp phải trigger + 8-10 trường hợp không được trigger, phần không trigger phải là "near miss" chia sẻ context với Skill nhưng thực ra cần thứ khác), chạy 5 vòng tối ưu với 60% train / 40% test split, chọn description có test score cao nhất.

Một vòng iteration thực tế: /daily Skill của một tác giả cần đến v6 mới ổn định. v1 thiếu bước, v3 thêm rule tính tuần cho ngày trong tuần, v5 thêm chế độ nhẹ cho mobile. Skill không phải cài một lần xong - nó là tài liệu sống của workflow của bạn.

Khi nào không nên làm Skill

Không phải mọi thứ đều đáng đóng gói thành Skill:

  • Task một lần: Dùng prompt thông thường, đơn giản và nhanh hơn
  • Quy trình chưa ổn định: Nếu bạn chưa biết mình sẽ làm gì, đừng đóng gói sớm - thiết kế dựa trên tưởng tượng rất dễ thành over-engineering
  • Tìm kiếm sự hoàn hảo ở v1: Skill v1 luôn không hoàn hảo. Dùng thật, thấy chỗ sai, mới chỉnh. Đừng dừng lại vì v1 chưa đủ tốt - thực ra chưa có gì đủ tốt ở v1 cả

Tiềm năng thương mại

Skills có thể là sản phẩm - không chỉ công cụ cá nhân.

Trước đây, xây một AI app dọc cần team kỹ thuật, thời gian phát triển dài và chi phí lớn. Với Skills: một người biết rõ một ngành có thể đóng gói kinh nghiệm của mình thành Skill và phân phối đến người dùng. Không cần code backend, không cần hosting.

Một số hướng thực tế:

  • Bán Skill như sản phẩm: Tương tự bán prompt nhưng giá trị cao hơn - Skill bao gồm cả logic thực thi (scripts), tài liệu tham chiếu (references), và quy trình được kiểm thử (evals)
  • API-as-a-service: Đóng gói Skill thành endpoint, gắn vào sản phẩm có sẵn
  • Gói Skill dọc cho ngành: Người có 10 năm kinh nghiệm trong một ngành có thể chuyển hóa kinh nghiệm đó thành Skill - và người dùng không cần biết ngành đó vẫn làm được việc

Anthropic mô tả Skills như "Steam Workshop" so với game - chính nhờ kiến trúc mở rộng được mà AI agent mới có "vòng đời vô hạn".

Kết series

Sau 4 bài, bức tranh toàn cảnh của Agent Skills đã rõ: một tiêu chuẩn mở cho phép đóng gói kiến thức quy trình thành module AI tái sử dụng, không bị lock-in vào bất kỳ platform nào, và có hệ sinh thái đang lớn nhanh từ cả Anthropic lẫn cộng đồng.

Điều thực sự thay đổi không phải công nghệ mà là mô hình: AI không còn là thứ bạn phải dạy lại mỗi ngày. Skill tốt nhất không được thiết kế ra - nó lớn dần từ những lần bạn thấy mình lặp lại một thứ gì đó lần thứ ba. Mở terminal, cài skill-creator, và viết SKILL.md đầu tiên của bạn từ đoạn text bạn hay paste nhất.

So sánh With Skill vs Baseline - eval system