TL;DR

Sentry công bố skill-writer — một meta-skill mã nguồn mở nằm trong repo getsentry/skills. Nó không hoàn thành task nghiệp vụ, mà cung cấp cho AI Agent một quy trình 7 bước chuẩn để viết các skill khác. Điểm khác biệt: mọi bước đều có input/output rõ ràng, nguồn được chấm điểm tin cậy, và depth gate chặn khâu viết nếu coverage chưa đủ. Kết quả: việc tạo skill trở thành thao tác kỹ thuật có thể tái lập và kiểm toán, thay vì nghệ thuật prompt-hacking.

Có gì mới

Repo getsentry/skills từ lâu đã chứa 25+ skill Sentry dùng nội bộ (code-review, commit, find-bugs, security-review...). Điểm nóng ở đợt cập nhật này là skill-writer — được đóng dấu là canonical entry point duy nhất để tạo hoặc sửa skill khác. Tài liệu repo nhấn mạnh: "Use sentry-skills:skill-writer as the canonical skill for creating and updating skills."

Skill-writer phân loại mọi skill về 1 trong 5 kiểu chuẩn:

  • workflow-process — thao tác lặp lại, CI/task orchestration
  • integration-documentation — tích hợp SDK/framework
  • security-review — phát hiện và vá lỗ hổng
  • skill-authoring — viết/đánh giá các skill khác (skill-writer tự thuộc loại này)
  • generic — mục đích chung

Vì sao đáng chú ý

Hầu hết repo "prompt template" hiện nay là bộ sưu tập phẳng — copy-paste và cầu mong kết quả ổn định. Skill-writer áp ba kỷ luật kỹ thuật phần mềm vào khâu viết instruction: provenance (mỗi nguồn được tag canonical/secondary/untrusted kèm confidence score), hard stop rules (depth gate chặn viết khi coverage chưa đạt), và tách bạch việc sáng tạo với việc xác định (authoring theo template cố định, synthesis & evaluation có gate). Đây là lần đầu một tổ chức vận hành production publish công khai một framework nghiêm ngặt đến vậy cho việc viết AI instruction.

Chi tiết kỹ thuật

Quy trình 7 bước closed-loop, mỗi bước có input/output và hard stop rule:

  1. Resolve target & path — phân biệt create/update/synthesize/iterate, classify skill vào 1 trong 5 loại, áp nguyên tắc "minimum path" để tránh over-execution.
  2. Synthesis — thu thập đa nguồn (spec, repo conventions như AGENTS.md, upstream implementation, domain docs), tag trust level cho từng nguồn, mở rộng coverage đa vòng gồm core behaviors, edge cases, negative examples, remediation patterns, version diffs. Depth gate chặn khâu viết nếu coverage chưa đủ.
  3. Iteration — khi cải tiến từ ví dụ thực tế: capture & anonymize example (tag positive/negative, true-positive/false-positive), replay trên working set & holdout set, log behavior delta.
  4. Authoring — viết SKILL.md với tông ra lệnh ("Read the diff", không "This reads the diff"); field description phải chứa trigger phrase ngôn ngữ tự nhiên dạng ngôi thứ ba; dùng đường dẫn tương đối (references/..., scripts/...), cấm hardcode path tuyệt đối.
  5. Description optimization — build bộ should-trigger + should-not-trigger query để giảm đồng thời false positive và false negative.
  6. Evaluation — mặc định qualitative so sánh behavior trước/sau. Với integration-docs và skill-authoring áp deep rubric (API coverage, known-issues, use-case coverage, gap-handling). Benchmark định lượng chỉ khi user yêu cầu.
  7. Registration & validation — đăng ký vào vị trí canonical, chạy validation nhanh, vẫn bị depth gate chặn output hời hợt.

Depth gate với loại integration-documentation rất cụ thể:

Yêu cầuNgưỡng
references/api-surface.mdbắt buộc
references/common-use-cases.md≥ 6 use case downstream
references/troubleshooting-workarounds.md≥ 8 cặp issue/remediation

Ngoài ra: SKILL.md dưới 500 dòng, name 1–64 ký tự lowercase-hyphen, description tối đa 1024 ký tự.

Triết lý thiết kế

Skill-writer không chỉ là template quy trình; nó đúc kết một phương pháp luận riêng cho việc "engineering agent instructions".

Degrees of Freedom Matching

Điều chỉnh độ chặt instruction theo "fragility" của task: task dễ vỡ như format commit message, schema output API → step chính xác và format cứng; task fragility trung bình như ưu tiên khi code review → nguyên tắc + ví dụ; task fragility thấp như "explain this code" → chỉ mục tiêu và ràng buộc. Tránh cả over-constrain (tốn context) lẫn under-constrain (kết quả thiếu nhất quán).

Progressive Loading với Decision Table

Thay vì load mọi reference file, dùng bảng điều kiện để Agent tự chọn file cần:

Ngôn ngữ phát hiệnĐọc
Pythonreferences/python.md
JavaScriptreferences/javascript.md

Chống anti-pattern "nạp tất tần tật reference" gây cạn context window.

Thư viện workflow patterns

  • Sequential: quy trình nhiều bước kèm checklist
  • Conditional: branch theo đặc trưng input
  • Feedback loop: validate-fix-retry, phù hợp task nhạy chất lượng như code gen, doc edit
  • Plan-Validate-Execute: tạo plan file trước, validate xong mới execute — lý tưởng cho thao tác batch và destructive

Giới hạn & pricing

Skill-writer miễn phí, open-source qua marketplace plugin của Sentry. Các giới hạn thực tế:

  • Đánh giá mặc định là qualitative — muốn benchmark định lượng nghiêm ngặt phải yêu cầu riêng.
  • Depth gate cho integration-docs đẩy chi phí research lên cao — overkill cho skill dùng một lần.
  • Quy ước dựa trên Claude Code / AGENTS.md, agent khác phải adapt.
  • Chỉ là instruction, không phải runtime — bạn tự chịu trách nhiệm thực thi.

Điều đáng theo dõi tiếp theo

Sentry còn publish sibling skill skill-scanner để audit skill cho prompt injection, malicious script, secret exposure, supply-chain risk. Bước tiến tự nhiên là closed-loop governance: skill-writer tạo, skill-scanner audit, EVAL.md replay regression. Nếu bạn đang vận hành một tập agent skill nội bộ, đây là template đáng copy thay vì tự phát minh lại quy trình.

Nguồn: getsentry/skills, skill-writer source, Sentry Agent Skills docs.