- HeadlessX v2.1.2 là platform self-hosted kết hợp scraping engine (Camoufox — Firefox patched ở C++ level), queue-backed workflow, web dashboard và MCP endpoint cho AI agent.
- MIT license, 1.9k sao GitHub, 5 operator live và 12+ đang phát triển.
TL;DR
HeadlessX là nền tảng self-hosted cho web scraping và agent workflow, do @saifyxpro phát triển. Khác với Browserless hay ScrapingBee, HeadlessX chạy hoàn toàn trên server của bạn, dùng Camoufox — bản Firefox patched ở C++ level để đạt 0% detection rate trên Cloudflare, Akamai, Datadome. Kèm web dashboard, queue Redis, API bảo vệ và MCP endpoint cho AI agent (Claude Code, Cursor, Warp, Windsurf). MIT license, v2.1.2 ra ngày 2026-03-25, 1.9k sao GitHub.

What's new — có gì đáng chú ý
Không chỉ là một wrapper quanh Puppeteer, HeadlessX đóng gói toàn bộ stack scraping thành một dịch vụ cài 1 lệnh:
- 5 operator live: Website (scrape, crawl, map, screenshot), Google AI Search, Tavily, Exa, YouTube
- Web dashboard quản lý job, API key, session cookie
- Queue backend dùng Redis — scale được số job song song thay vì block request handler
- MCP remote endpoint — AI agent gọi trực tiếp các operator như tool
- CLI skill packs cài sẵn cho Cursor, Claude Code, Warp, Windsurf
- n8n community node riêng — nhúng scraping/screenshot/PDF vào workflow n8n
Why it matters
Anti-bot đang càng khó. Stealth plugin kiểu puppeteer-extra-stealth vá ở tầng JavaScript — dễ bị phát hiện qua fingerprint mismatch. HeadlessX đi đường khác: patch binary browser ở C++, sửa Canvas, WebGL, AudioContext, WebRTC ngay trong engine. Kết quả: pass BrowserScan, Pixelscan, Cloudflare challenge, Datadome và Akamai mà không cần thêm residential proxy.
Điểm thứ hai: MCP endpoint biến HeadlessX thành tool layer cho AI agent. Claude Code hay Cursor có thể gọi Website operator để scrape, Exa để search deep, YouTube để lấy transcript — tất cả qua một self-hosted endpoint, không phụ thuộc API trả phí.
Technical facts
| Property | Value |
|---|---|
| Version | v2.1.2 (2026-03-25) |
| License | MIT |
| GitHub stars | 1.9k / 244 forks |
| Browser engine | Camoufox (Firefox, patched C++) |
| Live operators | 5 (Website, Google AI Search, Tavily, Exa, YouTube) |
| Planned operators | 12+ (Maps, X, LinkedIn, IG, Amazon, Reddit, FB...) |
| Runtime stack | Node 22+, pnpm 10.32.1+, PostgreSQL, Redis, Docker, Python/uv, Go |
| Default ports | web 34872, API 38473, PG 35432, Redis 36379 |
| Install | npm i -g @headlessx-cli/core → headlessx init |
Cloudflare bypass — demo thực tế
Trong dashboard, chạy Website Scraper trỏ vào URL có Cloudflare challenge. Camoufox tự giải, trả về HTML render sau khi qua challenge — không cần cấu hình proxy riêng:

Comparison — HeadlessX vs alternatives
| Thuộc tính | HeadlessX | Browserless | Puppeteer raw |
|---|---|---|---|
| Hosting | Self-hosted | Cloud SaaS | Self-hosted |
| Browser | Camoufox (Firefox) | Chromium | Chromium/FF/WebKit |
| Anti-detect | C++ binary patch | JS stealth | Không (DIY) |
| MCP cho AI agent | ✅ Built-in | ❌ | ❌ |
| Dashboard + queue | ✅ | API-only | Code-only |
| Giá | Free (MIT) | Trả phí | Free |
Use cases
- Scraping site có anti-bot nặng: e-commerce, trade data, supplier directory, manufacturer catalog
- AI agent research: Claude Code/Cursor gọi Website + Exa + Tavily operator qua MCP để tổng hợp thông tin
- SERP intelligence: theo dõi Google AI Search cho chiến dịch SEO
- YouTube pipeline: lấy metadata, subtitle cho transcript hoặc dataset
- n8n automation: cắm node HeadlessX để scrape/screenshot/PDF inline workflow
- Availability monitor: check TLS visa slot, concert ticket, product restock
Limitations & pricing
Miễn phí MIT, nhưng bạn trả giá bằng độ phức tạp hạ tầng: cần Node 22+, pnpm, Docker, PostgreSQL, Redis, Python/uv và Go cùng lúc. Không phải single-binary. Khuyến nghị Ubuntu 22.04+/Debian 12, 4 core CPU, 8–16GB RAM, 20GB SSD.
Claim "0% detection" là vendor claim — hiện tại work tốt nhưng Cloudflare/Datadome vẫn sẽ iterate. Một số operator (Google AI Search) cần one-time "Build Cookies" setup. Headfox engine riêng và Web AI Agent workspace (/web) vẫn trong roadmap "coming soon".
What's next
Roadmap public của tác giả gồm Web AI Agent workspace tương tác ngay trong dashboard, Headfox — engine Firefox in-house thay thế Camoufox, cùng 12+ operator mới: Google Maps, Twitter/X, LinkedIn, Instagram, Amazon, Facebook, Reddit, và một loạt scraper chuyên dụng cho supplier/trade data.
Nếu bạn đang dựng pipeline data cho agent AI hoặc phải vượt anti-bot thường xuyên, HeadlessX đáng thử ngay. Clone repo, chạy headlessx init và test operator Website trên một URL Cloudflare bất kỳ trong 10 phút. So sánh với cost của Browserless (tính theo concurrent session) hoặc ScrapingBee (tính theo request), self-hosted HeadlessX trên một VPS 8GB có thể chạy hàng chục nghìn job mỗi ngày với chi phí cố định vài chục đô. Trade-off rõ ràng: bạn đổi sự tiện lợi API-as-a-service lấy kiểm soát toàn bộ stack và bypass rate khó match được.
Nguồn: github.com/saifyxpro/HeadlessX, headlessx.saify.me, @tom_doerr on X.


