GPT-5.5 ra mắt: frontier model mới của OpenAI, 82.7% Terminal-Bench, rẻ bằng nửa đối thủ

TL;DR

Ngày 23/04/2026, OpenAI công bố GPT-5.5 — frontier model mới, tập trung vào agentic coding, computer use, knowledge work và scientific research. Model đạt 82.7% trên Terminal-Bench 2.0 (SOTA) và 58.6% trên SWE-Bench Pro, đồng thời dùng ít token hơn GPT-5.4 cho cùng task. Đã rollout ngay trong ChatGPT và Codex cho tier Plus/Pro/Business/Enterprise; API "coming soon". Greg Brockman gọi đây là "a new class of intelligence".

Có gì mới

GPT-5.5 được OpenAI định vị là "smartest frontier model yet" với 4 trục năng lực:

Agentic coding — tự lập kế hoạch, chạy tool, xử lý task end-to-end trong 1 pass.
Computer use — điều khiển browser/OS với ít hướng dẫn hơn.
Knowledge work — reasoning sâu trên context dài.
Scientific research — những tín hiệu đầu tiên về khả năng nghiên cứu thực thụ.

Model ra lò chỉ 6 tuần sau GPT-5.4 (05/03/2026) — nhịp iteration nhanh kỷ lục của OpenAI, phản ánh áp lực cạnh tranh trực diện với Anthropic ở mảng enterprise.

Vì sao quan trọng

Ba điểm đáng chú ý:

Chi phí frontier rẻ đi một nửa. Trên Artificial Analysis Coding Agent Index, GPT-5.5 đạt SOTA nhưng chi phí chỉ bằng một nửa các model frontier coding cạnh tranh. Đây là cú đánh thẳng vào pricing power của đối thủ.
Hallucination resistance thực chiến. CIO Bank of New York, bà Leigh-Ann Russell, xác nhận model cho "meaningful improvements in accuracy and hallucination resistance" — chất lượng cần cho ngành tài chính có kiểm định.
Token efficiency = tiền thật. Cùng latency như 5.4 nhưng tốn ít token hơn cho cùng đầu việc trong Codex. Với 4 triệu active Codex users, khoản tiết kiệm token là rất lớn.

Số liệu kỹ thuật

Benchmark	GPT-5.5	GPT-5.4	Ghi chú
Terminal-Bench 2.0	82.7%	< 82.7%	SOTA — command-line agent, planning + tool coordination
SWE-Bench Pro	58.6%	57.7%	Real-world GitHub issues, giải xong end-to-end
Coding Agent Index (Artificial Analysis)	SOTA	—	Chi phí bằng ½ đối thủ frontier
Per-token latency	≈ GPT-5.4	baseline	Không đánh đổi tốc độ lấy intelligence
Token usage (Codex tasks)	thấp hơn đáng kể	baseline	Ít retry, ít token cho cùng task

So với Claude Opus 4.1 (23.1% SWE-Bench Pro) và GPT-5 gốc (23.3%), bước nhảy của dòng 5.x rất rõ rệt.

Giá & khả dụng

ChatGPT: có mặt ngay cho Plus, Pro, Business, Enterprise trong app và Codex.
GPT-5.5 Pro: rollout cho Pro, Business, Enterprise trong ChatGPT.
API: "coming soon" — chưa có ngày cụ thể.
Pricing API dự kiến: GPT-5.5 $5/M input, $30/M output, context window 1M token. Bản Pro $30/M input, $180/M output.
Free/Go: chưa có thông tin — khả năng cao truy cập giới hạn hoặc trễ.

Use cases

Người hưởng lợi nhiều nhất:

Codex users (4M active): task coding end-to-end nhanh hơn, retry ít hơn, tiết kiệm token.
Dev team enterprise: tự động hoá pipeline (GitHub issue → patch → PR) với độ chính xác cao hơn.
Knowledge workers (9M paying business users): phân tích document dài, research dự án, viết báo cáo.
Ngành compliance / tài chính: hallucination resistance đủ tốt để Bank of New York đưa vào pilot.
Researcher: reasoning đa bước cho ý tưởng khoa học — OpenAI coi đây là hướng lớn tiếp theo.

Hạn chế & an toàn

API chưa mở, ai chờ integration phải đợi thêm.
Không công bố giá token cho Free/Go — có thể là tier cuối được tiếp cận.
OpenAI nói đây là "strongest set of safeguards to date", nên một số prompt sẽ bị chặn theo policy mới.
Benchmark nội bộ OpenAI — chờ third-party (Artificial Analysis đã xác nhận Coding Agent Index) và review cộng đồng để kiểm chứng số liệu SWE-Bench Pro trên dataset mở.

Bức tranh cạnh tranh

OpenAI đang vận hành ở quy mô khó tưởng tượng vài năm trước: 900 triệu weekly active users, 50 triệu+ subscriber, 9 triệu paying business users trên ChatGPT và 4 triệu active users trên Codex. Mỗi iteration model ảnh hưởng trực tiếp tới doanh thu và retention, và việc ra 5.5 chỉ 6 tuần sau 5.4 là tín hiệu: release cadence đang trở thành vũ khí chiến lược, không chỉ là kết quả R&D.

Đối thủ lớn nhất — Anthropic — hiện vẫn giữ ưu thế về một số bench dài, nhưng con số "chi phí bằng nửa" trên Coding Agent Index cộng với SWE-Bench Pro 58.6% đặt OpenAI vào vị thế hợp đồng enterprise rất khó từ chối, nhất là cho các team dev đang chi trả lớn cho Codex.

Tiếp theo là gì

Brockman mô tả GPT-5.5 là "big step towards more agentic and intuitive computing" — ám chỉ hướng sắp tới là agent nhiều bước, ít hướng dẫn. Với cadence 6 tuần, kịch bản khả dĩ: API GPT-5.5 mở trong vài tuần, kèm biến thể mini/nano cho đại chúng, và một iteration kế tiếp (5.6 hoặc dòng agent chuyên biệt) trước mùa hè 2026. Dev nên bắt đầu thử 5.5 trong Codex ngay hôm nay để quen với cách model mới plan và gọi tool — thói quen prompt cũ (hướng dẫn từng bước) có thể đang làm giảm hiệu quả của intelligence mới này.

Nguồn: OpenAI, Fortune, @OpenAIDevs, StreetInsider.

GPT-5.5 ra mắt: frontier model mới của OpenAI, 82.7% Terminal-Bench, rẻ bằng nửa đối thủ

TL;DR

Có gì mới

Vì sao quan trọng

Số liệu kỹ thuật

Giá & khả dụng

Use cases

Hạn chế & an toàn

Bức tranh cạnh tranh

Tiếp theo là gì

Tiếp tục lướt

Qwen3.6-27B chạy local trên MacBook Pro: model 27B đánh bại 397B trên benchmark coding

acpx 0.6.0: Điều khiển Claude và Codex qua một giao thức duy nhất

GPT-Image-2 + Seedance 2.0: Vẽ "sơ đồ chuyển động camera" để điều khiển video AI

Codex giờ tự mở browser: build, click, debug frontend như một user thật

GPT-5.5 trên ParseBench: thắng bảng biểu, thua giá tiền — và Opus 4.7 vẫn dẫn về độ trung thực