Agent output: tại sao tôi chuyển sang HTML và không quay lại

TL;DR

Thariq Shihipar từ Anthropic Claude Code team publish bài "The Unreasonable Effectiveness of HTML" ngày 08/05/2026, đạt 12.6 triệu views. Luận điểm cốt lõi: Markdown đã trở thành bottleneck cho agent output - không phải vì nó tệ, mà vì con người không thể đọc nổi 200 dòng plain text mỗi ngày. Một developer tên Vox đã thử áp dụng ngay vào scheduled agents của mình: kết quả là 51ms overhead và không còn muốn quay lại.

Vấn đề thực sự là gì?

Vox chạy một hệ thống agent tên "X Manager" - tự động hóa việc quản lý X/Twitter với hơn chục stage mỗi ngày: scan timeline, check mentions, aggregate key accounts, generate draft. Sau mỗi stage, agent dump khoảng 2.000 từ vào Telegram.

Nội dung đúng. Nhưng ông không đọc được.

Ban đầu ông nghĩ vấn đề là độ dài - thêm constraint tóm tắt cho agent. Sau đó mới nhận ra: độ dài chỉ là triệu chứng. Vấn đề thật sự là Telegram không được thiết kế để review 2.000 từ technical report. Nó là IM tool, xây để nhận 5-dòng notification.

Sai lầm cốt lõi: dùng Markdown làm review surface. Markdown là format tốt để viết và để agent đọc - nhưng ép con người review cả trang Markdown mỗi ngày thì drains energy thật sự.

Cùng một nội dung: Markdown wall-of-text 240 dòng vs HTML report có tabs, chart, và KPI nổi bật — Cùng một spec - Markdown cần scroll 240 dòng, HTML render thành dashboard đọc được ngay

Artifact contract: 3 output cho mỗi agent run

Vox đổi "delivery contract" cho các cron job. Mỗi lần chạy thật bây giờ produce 3 thứ:

Chat summary 5 dòng vào Telegram: verdict, stage state, next action. Không hơn.
Markdown file persistent dưới content/memory/daily/ - source of truth, input cho agent tiếp theo.
HTML report vào thư mục outbound - review surface dành cho người đọc.

Quy tắc ngắn gọn: Markdown stays the source. HTML is for humans. Telegram is just for notifications.

Chi phí để chạy convert Markdown 22.4KB sang HTML là 51ms mỗi lần. Với một task agent chạy vài phút, đó là dưới mức noise floor.

Tại sao HTML thắng cho human review

Có lý do khoa học rõ ràng: 30% vỏ não người được dành cho visual processing. Hearing chỉ 3%, touch 8%. Andrej Karpathy gọi đây là "the 10-lane superhighway of information into brain."

Markdown chỉ có bold, header, và bullet point. HTML có thể render:

8 loại thông tin một HTML file có thể chứa: Tables, Design, Illustrations, Code, Interaction, Workflows, Spatial, Images — 8 loại thông tin HTML có thể biểu diễn - Markdown không thể làm được phần lớn trong số này

Table thật (không phải ASCII art)
SVG diagram và flowchart inline
Interactive element với JavaScript (slider, toggle, knob)
Code snippet có syntax highlight
Spatial layout với absolute positioning

Thariq Shihipar (kỹ sư Anthropic) nói thẳng: "I tend to not actually read more than a 100-line markdown file, and I certainly am not able to get anyone else in my organization to read it."

HBR tháng 3/2026 đặt tên cho hiện tượng này là "AI Brain Fry": người dùng AI nhiều bị information overload tăng 19%, mental effort tăng 14%, decision fatigue tăng 33%.

HTML render đẹp chưa đủ - cần artifact contract

Chỉ convert Markdown sang HTML không phải là đủ. Một agent report thực sự có thể dùng được phải preserve đủ các field này:

Source chain: stage trước đã thấy gì, dùng nguồn nào
Direction từ user trong ngày đó
Stage state hiện tại
Risks và factual guardrails
Budget và tools đã dùng
Public action nào cần confirm (quan trọng: post lên X cần manual approval)
Next action

HTML đẹp + artifact contract mới tính là delivery. Thiếu contract thì chỉ có một tờ giấy đẹp vô dụng.

Khi nào nên áp dụng

Vox áp dụng rule này cho mọi scheduled agent: Claude Code trên long task, Codex cho batch refactor, subagent trên multi-step reasoning. Bất kỳ agent nào chạy hơn 1-2 phút đều không nên kết thúc bằng wall of text trong chat.

Ngược lại, Markdown vẫn là lựa chọn đúng cho:

Agent-to-agent communication (machine reads, greps, indexes)
Version-controlled source file (diff readable)
RAG pipeline input (Markdown đạt 60.7% table extraction accuracy vs HTML 53.6%)

HTML tốn token hơn - clean HTML gấp 2-3x Markdown, HTML có CSS+JS có thể gấp 8-10x. Nhưng với context window 1M+ token hiện tại, đây không còn là vấn đề cản trở.

Ecosystem phía sau xu hướng này

Cộng đồng phản ứng nhanh. Repo html-anything từ team OpenDesign ra mắt với tagline "Markdown is the draft. HTML is what humans read." Tool này zero API key, reuse session CLI đã login (Claude Code, Cursor, Codex...), 75 skill template cho 9 loại surface khác nhau.

Enterprise đã đi trước rất lâu: Anthropic Claude Artifacts đã generate "tens of millions" interactive HTML output. OpenAI thêm HTML/React rendering vào ChatGPT Canvas. Salesforce Agentforce xử lý 4 triệu session trên 133.000+ agent với Adaptive Response Formats.

Cũng có phản biện đáng nghe. Kurtis Redux publish "The Unreasonable Ineffectiveness of HTML" - lập luận rằng HTML diff noisy, XSS risk với arbitrary JavaScript, và version control khó maintain hơn Markdown. Google phát triển A2UI protocol riêng: agent request pre-approved UI component thay vì viết raw HTML - an toàn hơn cho enterprise.

Kết

Bài học từ Vox: thay đổi output format cho vài cron job mất 3 bước - đổi hàm output, thêm HTML template, ghi artifact ra thư mục outbound. Overhead thực tế: 51ms. Lợi ích: không còn phải stare vào wall of text mỗi ngày.

Nguyên tắc đơn giản nhất để áp dụng ngay: nếu agent task chạy hơn 1 phút và output dành cho người đọc - format đó nên là HTML, không phải Markdown pasted vào chat.

Tham khảo: via Anthropic blog - Thariq Shihipar | html-anything repo