TL;DR

Ngày 23/04/2026, OpenAI công bố GPT-5.5 — mô hình base được retrain hoàn toàn lần đầu kể từ GPT-4.5, codename "Spud". Thông điệp cốt lõi: thông minh hơn mà không chậm hơn. GPT-5.5 khớp đúng per-token latency của GPT-5.4 trong môi trường serving thực tế, thắng 9/10 benchmark dùng chung, và hoàn thành cùng một tác vụ Codex với ít token hơn, ít retry hơn. Rollout ngay cho Plus, Pro, Business, Enterprise trên ChatGPT và Codex. API chưa có — "very soon".

OpenAI GPT-5.5 launch hero

Có gì mới

GPT-5.5 được OpenAI định vị là "a new class of intelligence for real work" — nhóm mô hình dành cho agentic computer use. Thay vì phải chia nhỏ prompt và giám sát từng bước, bạn giao cho 5.5 một tác vụ "messy, multi-part" và nó tự plan, gọi tool, tự kiểm tra, điều hướng qua ambiguity, và chạy tới khi xong.

OpenAI tập trung vào 4 mảng: agentic coding, computer use, knowledge work, và early scientific research — những domain mà tiến bộ phụ thuộc vào việc suy luận xuyên context và hành động qua thời gian. Một phiên bản cao cấp hơn, GPT-5.5 Pro, được tung cho Pro/Business/Enterprise trong ChatGPT để xử lý câu hỏi single-shot khó nhất.

Vì sao đáng chú ý

Thông thường mô hình lớn hơn = chậm hơn trên cùng phần cứng. GPT-5.5 phá được cái trade-off đó bằng cách co-design inference stack với NVIDIA GB200 và GB300 NVL72 — và ironically, team OpenAI dùng chính Codex + GPT-5.5 để tìm và áp dụng các tối ưu hóa trong serving stack. Mô hình tự giúp cải thiện hạ tầng serve chính nó.

Bối cảnh kinh doanh cũng quan trọng không kém. Nội bộ OpenAI đã ở trạng thái "Code Red" từ tháng 12/2025 khi thấy ARR của Anthropic sprint từ $9B lên $30B. GPT-5.5 là phát súng phản công B2B rõ nhất — thiết kế để "làm được việc", không chỉ trả lời.

Số liệu kỹ thuật

Trên 10 benchmark dùng chung với GPT-5.4, GPT-5.5 thắng 9 (regression duy nhất Tau2-bench Telecom -0.9pp nằm trong noise ở ngưỡng 98.9%).

BenchmarkGPT-5.4GPT-5.5Δ
ARC-AGI-2 (Verified)73.3%85.0%+11.7
MCP Atlas67.2%75.3%+8.1
Terminal-Bench 2.075.1%82.7%+7.6
OSWorld-Verified75.0%78.7%+3.7
FrontierMath (T1–3)47.6%51.7%+4.1
SWE-Bench Pro57.7%58.6%+0.9
GDPval (44 occupations)84.9%matches/beats pros

Long-context recall là điểm bứt phá ít được chú ý. Graphwalks BFS ở bucket >128K: GPT-5.4 rớt xuống 21.4%, GPT-5.5 đạt 73.7% ở 256K và 45.4% ở 1M tokens. Cửa sổ context vẫn giữ 1M input / 128K output trên API; Codex cap 400K.

Artificial Analysis Intelligence Index — GPT-5.5 dẫn đầu

Về tốc độ: GPT-5.5 khớp đúng per-token latency của GPT-5.4 trong real-world serving. Codex có Fast mode mới — 1.5× tokens/s với 2.5× cost cho flow tương tác cần chờ nhanh.

So sánh với Claude và Gemini

Trên Terminal-Bench 2.0, khoảng cách không còn là marginal:

  • GPT-5.5: 82.7%
  • Claude Opus 4.7: 69.4%
  • Gemini 3.1 Pro: 68.5%

Trên BrowseComp (tìm thông tin khó online), GPT-5.5 Pro đạt 90.1%, vượt Gemini 3.1 Pro ở 85.9%. Claude vẫn dẫn ở SWE-Bench Pro (64.3% vs 58.6%), nhưng OpenAI cáo buộc Anthropic có "signs of memorization" trên một subset.

Bảng so sánh benchmark GPT-5.5 vs GPT-5.4 vs Claude Opus 4.7 vs Gemini 3.1 Pro

Use cases thực tế

OpenAI chia sẻ vài case nội bộ cho thấy giá trị concrete:

  • Finance: review 24.771 tờ K-1 (hơn 71.000 trang), cắt 2 tuần processing time, tự loại personal data.
  • Business reporting: tự động hóa báo cáo tuần, tiết kiệm 5–10 giờ/tuần.
  • Comms: xử lý 6 tháng dữ liệu speaking requests, tự build risk-scoring framework, auto-approve low-risk.
  • Engineering: giải long-horizon task có median human completion time ~20 giờ (Expert-SWE internal).

Hơn 85% nhân viên OpenAI đã dùng Codex hàng tuần — trải dài eng, finance, marketing. Pietro Schirano (CEO MagicPath) chốt một câu: "It genuinely feels like I'm working with a higher intelligence, and there's almost a sense of respect."

Hạn chế & giá

Giá API tăng gấp đôi trên cả input và output so với GPT-5.4:

TierInput ($/1M)Output ($/1M)
GPT-5.5 Standard$5.00$30.00
Batch/Flex (0.5×)$2.50$15.00
Priority (2.5×)$12.50$75.00
GPT-5.5 Pro (6× base)$30.00$180.00
GPT-5.4 (tham chiếu)$2.50$15.00

Sam Altman lập luận trên X: vì 5.5 dùng ít token hơn và ít retry hơn, bill thực tế "không hề gấp đôi" — chỉ dịch chuyển ít ở dưới 2×. Các điểm cần lưu ý:

  • API chưa có — OpenAI nói "very soon", đang xử lý safety + scaling. Đây là khoảng trễ đáng kể cho enterprise build trên API.
  • Không dành cho free tier.
  • Modalities giữ nguyên: text + image in, text out. Không có audio/video trong API surface.
  • Stricter cyber-risk classifiers có thể gây khó chịu ban đầu cho một số user — OpenAI thừa nhận "some users may find annoying initially".
  • Nhân viên an toàn đã test với gần 200 trusted early-access partners trước release.

Bước tiếp theo

GPT-5.5 là mô hình OpenAI đang dùng để xây unified desktop "super-app" — gộp ChatGPT + Codex + agent browser Atlas vào một session duy nhất, thiết kế cho intent-aware reasoning. GPT-5.2 Thinking sẽ retired vào 05/06/2026 sau 3 tháng legacy window. Sam Altman khẳng định "iterative deployment" là trụ cột chiến lược — dù 5.5 đã đủ giỏi, kỳ vọng "rapid improvements" tiếp tục.

Kể từ tháng 8/2025, OpenAI đã ship GPT-5, 5.1, 5.2, 5.3-Codex, 5.4 và giờ là 5.5 — tất cả dưới một năm. Cadence 7 tuần giữa 5.4 và 5.5 cho thấy OpenAI đang đua tốc độ với Anthropic và Google ở mức độ chưa từng có.

Nguồn: openai.com, Decrypt, TNW, LLM Stats, Interesting Engineering.