- Liran Tal vừa phát hành repolyze v1.1.3 — một CLI Node.js gói lại bộ git command chẩn đoán codebase từ bài viết của Ally Piechowski, xuất JSON sẵn cho AI agent và toolchain.
- Chạy `npx repolyze --json .` là có bản đồ churn, bus factor, bug cluster và crisis pattern trong vài giây.
TL;DR
repolyze là CLI Node.js của Liran Tal, phát hành v1.1.3 ngày 17/04/2026, chạy bộ git command chẩn đoán repo và xuất JSON cho AI agent. Gốc ý tưởng: bài viết của Ally Piechowski ngày 08/04/2026 "The Git Commands I Run Before Reading Any Code" từng lên top Hacker News. Yêu cầu Node.js >=24 và git trên PATH. Không cần cài, gõ npx repolyze --json . là có báo cáo sức khoẻ repo trong vài giây.
Có gì mới
Thay vì copy-paste 5 đoạn git one-liner từ blog của Piechowski rồi mắt thường so sánh, repolyze gói chúng lại thành một lệnh duy nhất và trả về output có cấu trúc. Điểm khác biệt quan trọng: chế độ JSON. Bạn pipe thẳng vào một LLM hoặc agent coding, và mô hình biết ngay file nào là hotspot, ai là maintainer chính, tháng nào nhịp commit chết dần — trước khi sửa dòng đầu tiên.
Tool là TypeScript thuần (88.5% repo), bin command repolyze trỏ tới dist/bin/cli.cjs, license Apache-2.0. Inspiration thứ hai là fallow-rs, một tool Rust cùng triết lý static-analysis-qua-git-history.
Vì sao đáng chú ý
Onboarding một codebase lạ vẫn là một trong những khoảnh khắc tốn năng lượng nhất của dev. Bạn không biết bắt đầu đọc từ đâu, file nào là bãi mìn, ai là người duy nhất hiểu module auth. Piechowski lập luận rằng git log đã chứa sẵn câu trả lời — chỉ cần biết hỏi đúng. repolyze biến quy trình đó từ ritual cá nhân thành một công cụ lặp lại được, chia sẻ được, và — quan trọng với 2026 — agent đọc được.
Với ai dùng AI coding agent, đây là mảnh ghép context nhỏ nhưng giá trị cao: thay vì nạp 500 file vào context window, bạn đưa agent một JSON 2KB mô tả hotspot và bus factor, và agent đủ tỉnh để đọc đúng 10 file quan trọng nhất trước. Cùng nguyên lý với repomix hay llms.txt — nhưng repolyze không nạp code, nó nạp metadata về code, giữ token budget rẻ và tập trung vào tín hiệu rủi ro thay vì nội dung.
Thông số kỹ thuật
| Thuộc tính | Giá trị |
|---|---|
| Phiên bản | 1.1.3 (17/04/2026) |
| Runtime | Node.js >=24.0.0 (bắt buộc) |
| Ngôn ngữ nguồn | TypeScript |
| Phụ thuộc runtime | git trên PATH |
| Package manager | npm / pnpm / npx |
| License | Apache-2.0 |
| Tác giả | Liran Tal |
Cài nhanh hoặc chạy thẳng:
# Zero-install
npx repolyze --json .
# Cài global
npm install -g repolyze
pnpm add -g repolyze
# Flags
repolyze --json <path> # output JSON
repolyze --verbose <path> # echo git invocations ra stderr
repolyze --helpNó đo cái gì
repolyze phản chiếu 5 nhóm câu hỏi trong bài của Piechowski, đều là những git command bạn có thể tự chạy nhưng ngại gõ:
- Churn hotspots — 20 file bị sửa nhiều nhất trong năm qua. File đứng đầu thường là file mà cả team ngại đụng.
- Bus factor —
git shortlog -sn --no-merges. Nếu một người chiếm ≥60% commit, đó là rủi ro nhân sự. - Bug clusters — lọc commit có keyword
fix|bug|broken, đếm theo file. File vừa churn cao vừa bug cao = code nguy hiểm nhất. - Velocity — commit/tháng. Nhịp đang tăng, phẳng, hay tắt dần?
- Crisis patterns — đếm commit chứa
revert|hotfix|emergency|rollback. Vài cái/năm là bình thường; vài tuần/lần là team không tin quy trình deploy của mình.
Dùng lúc nào
- Onboarding: chạy ngay sau khi clone, trước khi mở IDE.
- Due diligence: audit một dependency hoặc repo chuẩn bị mua lại.
- AI coding agent: pipe JSON vào prompt để agent biết file nào là hotspot trước khi edit.
- CI health report: chạy hàng tháng, cảnh báo khi crisis-commit tăng bất thường.
- Maintainer OSS: định lượng bus factor, làm căn cứ xin budget hoặc tuyển co-maintainer.
Hạn chế & giá
Miễn phí, Apache-2.0. Vài caveat đáng biết trước khi đưa vào quy trình team:
- Engine chặt: chỉ chạy Node.js v24+. Node 20/22 sẽ từ chối.
- Bug cluster dựa trên keyword commit message — repo không có commit discipline sẽ under-report.
- Chỉ đọc git local, không gọi GitHub API, nên không có signal từ issue, PR, code review.
- Project còn sớm (16 sao lúc viết bài), API JSON có thể đổi theo minor version.
Tiếp theo
Chưa có roadmap public, nhưng hướng rõ ràng: schema JSON ổn định hơn cho agent, thêm signal bảo mật sâu hơn mức grep keyword, và có thể enrichment từ GitHub API. Nếu bạn đang xây pipeline cho AI coding agent đọc repo, đây là một trong số ít công cụ sẵn sàng ngay hôm nay — chạy thử mất đúng 10 giây.
Nguồn: lirantal/repolyze, piechowski.io, Hacker News.

