TL;DR

Ngày 23/04/2026, OpenAI công bố GPT-5.5 — model mà họ gọi là "a new class of intelligence for real work". Điểm đáng chú ý nhất không nằm ở một benchmark đơn lẻ, mà ở việc Codex được mở rộng thành một workspace: trình duyệt in-app để click thử UI, computer use điều khiển macOS, artifact viewer preview PDF/Slides, và context window 400K token trong Codex. GPT-5.5 rẻ token hơn GPT-5.4 trên cùng task, dù giá per-token cao hơn.

GPT-5.5 vs GPT-5.4, Claude Opus và Gemini trên Artificial Analysis Intelligence Index

What's new

OpenAI ship đồng thời ba biến thể: GPT-5.5 (mặc định), GPT-5.5 Thinking (chế độ suy luận sâu cho bài hard), và GPT-5.5 Pro (độ chính xác tối đa cho task khó nhất). Theo chính post của OpenAIDevs trên X: "With GPT-5.5, Codex now gets more of the job done across the browser, files, docs, and your computer."

  • Browser use mở rộng: Codex bật trình duyệt in-app cho local dev server + file-backed pages, tự click qua rendered UI, chụp screenshot, reproduce visual bug và verify fix ngay trong app.
  • Computer use trên macOS: Codex nhìn, click, gõ để chạy native app test, simulator flow, chỉnh setting app rủi ro thấp, fix bug chỉ gặp qua GUI.
  • Artifact viewer: preview PDF, spreadsheet, slide deck, document ngay trong sidebar trước khi commit/share.
  • Pull request sâu hơn: inspect GitHub PR trong sidebar, review comment trên diff, bảo Codex giải thích feedback và tự sửa theo review.
  • Memories (nơi có): mang preference, project convention, recurring pattern từ thread cũ sang thread mới.

Why it matters

Trước đây Codex dừng ở mức generate code. Với 5.5, vòng lặp viết → chạy → nhìn kết quả → sửa được nén gọn trong app: dev không phải chuyển qua lại browser/IDE để check một UI bug hay một responsive glitch nữa. Đây là bước mà OpenAI gọi thẳng là "agentic and intuitive computing" — và là mảnh ghép để Brockman/Altman đưa ChatGPT + Codex + AI browser thành một "superapp" thống nhất cho enterprise.

Technical facts

Những con số đáng nhớ từ release:

PropertyValue
Context window (Codex)400K tokens
Fast mode1.5× tốc độ token, 2.5× chi phí
Latency vs GPT-5.4Bằng per-token latency
Token efficiencyÍt token hơn đáng kể trên cùng task Codex
PricingCao hơn GPT-5.4 per-token, bù lại nhờ efficiency
Risk classification"High" (không chạm "Critical" threshold)
Red-team/Test partners~200 trusted early-access partners
Cách GPT-5.4 ra mắt7 tuần (GPT-5.4 ra 05/03/2026)

Một chi tiết thú vị: OpenAI nói GPT-5.5 và Codex tự giúp cải thiện chính hạ tầng inference phục vụ nó — "the model helped improve the infrastructure that serves it".

Comparison — GPT-5.5 vs GPT-5.4 vs Claude Opus 4.7 vs Gemini 3.1 Pro

Bảng so sánh benchmark GPT-5.5 Thinking và Pro với GPT-5.4, Claude Opus 4.7, Gemini 3.1 Pro

BenchmarkGPT-5.5 ThinkingGPT-5.4 ThinkingGPT-5.5 ProClaude Opus 4.7Gemini 3.1 Pro
Terminal-Bench 2.0 (agentic terminal)82.7%75.1%69.4%68.5%
GDPval (knowledge work)84.9%83.0%82.3%80.3%67.3%
OSWorld-Verified (computer use)78.7%75.0%78.0%
BrowseComp (agentic browsing)84.4%82.7%90.1%79.3%85.9%
FrontierMath Tier 1–351.7%47.6%52.4%43.8%36.9%
FrontierMath Tier 435.4%27.1%39.6%22.9%16.7%
CyberGym (cybersecurity)81.8%79.0%73.1%

Gap nổi nhất: FrontierMath Tier 4 — GPT-5.5 Pro 39.6% so với Opus 4.7 22.9% và Gemini 3.1 Pro 16.7%. Trong BrowseComp (nhiệm vụ duyệt web agentic), GPT-5.5 Pro cũng dẫn 90.1%.

Use cases

  • Frontend debug: kể cho Codex một UI bug, nó bật browser in-app, click qua flow, chụp screenshot, xác nhận fix đã chạy.
  • Native macOS app testing: điều khiển simulator, chạy qua flow đăng nhập, chỉnh setting rủi ro thấp, fix bug chỉ thấy trên GUI.
  • PR review workflow: inspect PR ngay trong sidebar, bảo Codex giải thích reviewer comment, tự apply change và check lại.
  • Knowledge work: biến input lộn xộn thành spreadsheet/deck/PDF dùng được, preview ngay trong artifact viewer.
  • Scientific research: CRO Mark Chen nói model có "meaningful gains on scientific and technical research workflows", kể cả hỗ trợ drug discovery.

Limitations & pricing

  • Chưa có API lúc ra mắt — OpenAI nói "very soon", đang làm việc với partner về safeguard.
  • Computer use không có ở EEA, UK, Thụy Sĩ tại thời điểm launch.
  • Chỉ paid tiers: GPT-5.5 cho Plus/Pro/Business/Enterprise trong ChatGPT + Codex; Codex thêm Edu và Go; GPT-5.5 Pro chỉ cho Pro/Business/Enterprise.
  • Giá per-token cao hơn GPT-5.4, dù Codex được tuning để dùng ít token hơn.
  • Phân loại "High" risk cho khả năng có thể khuếch đại pathway gây hại — chưa chạm "Critical" nhưng đủ để OpenAI triển khai "strongest set of safeguards to date".

What's next

API rollout là ưu tiên gần nhất — khi Safety/Preparedness xong phần partner onboarding, GPT-5.5 và 5.5 Pro sẽ mở cho developer tự build. Xa hơn, OpenAI tiếp tục đẩy vision superapp: gộp ChatGPT + Codex + AI browser thành một tool đa năng cho enterprise. Chief Scientist Jakub Pachocki nói thẳng: "we see pretty significant improvements in the short term, extremely significant improvements in the medium term." Bốn release trong 5 tháng (Nov, Dec, Mar, Apr) cho thấy nhịp ship không có dấu hiệu chậm lại.

Nguồn: OpenAI Developer Community, Codex Changelog, 9to5Mac, TechCrunch, CNBC.