- OpenAI vừa tung GPT-5.5 — model mạnh nhất hiện tại, chỉ 6 tuần sau GPT-5.4.
- Đạt 82.7% Terminal-Bench 2.0, 58.6% SWE-Bench Pro, state-of-the-art Coding Agent Index với chi phí bằng nửa đối thủ frontier.
- Có mặt ngay trong ChatGPT và Codex cho Plus/Pro/Business/Enterprise, API sắp ra.
TL;DR
Ngày 23/04/2026, OpenAI công bố GPT-5.5 — frontier model mới, tập trung vào agentic coding, computer use, knowledge work và scientific research. Model đạt 82.7% trên Terminal-Bench 2.0 (SOTA) và 58.6% trên SWE-Bench Pro, đồng thời dùng ít token hơn GPT-5.4 cho cùng task. Đã rollout ngay trong ChatGPT và Codex cho tier Plus/Pro/Business/Enterprise; API "coming soon". Greg Brockman gọi đây là "a new class of intelligence".
Có gì mới
GPT-5.5 được OpenAI định vị là "smartest frontier model yet" với 4 trục năng lực:
- Agentic coding — tự lập kế hoạch, chạy tool, xử lý task end-to-end trong 1 pass.
- Computer use — điều khiển browser/OS với ít hướng dẫn hơn.
- Knowledge work — reasoning sâu trên context dài.
- Scientific research — những tín hiệu đầu tiên về khả năng nghiên cứu thực thụ.
Model ra lò chỉ 6 tuần sau GPT-5.4 (05/03/2026) — nhịp iteration nhanh kỷ lục của OpenAI, phản ánh áp lực cạnh tranh trực diện với Anthropic ở mảng enterprise.
Vì sao quan trọng
Ba điểm đáng chú ý:
- Chi phí frontier rẻ đi một nửa. Trên Artificial Analysis Coding Agent Index, GPT-5.5 đạt SOTA nhưng chi phí chỉ bằng một nửa các model frontier coding cạnh tranh. Đây là cú đánh thẳng vào pricing power của đối thủ.
- Hallucination resistance thực chiến. CIO Bank of New York, bà Leigh-Ann Russell, xác nhận model cho "meaningful improvements in accuracy and hallucination resistance" — chất lượng cần cho ngành tài chính có kiểm định.
- Token efficiency = tiền thật. Cùng latency như 5.4 nhưng tốn ít token hơn cho cùng đầu việc trong Codex. Với 4 triệu active Codex users, khoản tiết kiệm token là rất lớn.
Số liệu kỹ thuật
| Benchmark | GPT-5.5 | GPT-5.4 | Ghi chú |
|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | < 82.7% | SOTA — command-line agent, planning + tool coordination |
| SWE-Bench Pro | 58.6% | 57.7% | Real-world GitHub issues, giải xong end-to-end |
| Coding Agent Index (Artificial Analysis) | SOTA | — | Chi phí bằng ½ đối thủ frontier |
| Per-token latency | ≈ GPT-5.4 | baseline | Không đánh đổi tốc độ lấy intelligence |
| Token usage (Codex tasks) | thấp hơn đáng kể | baseline | Ít retry, ít token cho cùng task |
So với Claude Opus 4.1 (23.1% SWE-Bench Pro) và GPT-5 gốc (23.3%), bước nhảy của dòng 5.x rất rõ rệt.
Giá & khả dụng
- ChatGPT: có mặt ngay cho Plus, Pro, Business, Enterprise trong app và Codex.
- GPT-5.5 Pro: rollout cho Pro, Business, Enterprise trong ChatGPT.
- API: "coming soon" — chưa có ngày cụ thể.
- Pricing API dự kiến: GPT-5.5
$5/M input,$30/M output, context window 1M token. Bản Pro$30/M input,$180/M output. - Free/Go: chưa có thông tin — khả năng cao truy cập giới hạn hoặc trễ.
Use cases
Người hưởng lợi nhiều nhất:
- Codex users (4M active): task coding end-to-end nhanh hơn, retry ít hơn, tiết kiệm token.
- Dev team enterprise: tự động hoá pipeline (GitHub issue → patch → PR) với độ chính xác cao hơn.
- Knowledge workers (9M paying business users): phân tích document dài, research dự án, viết báo cáo.
- Ngành compliance / tài chính: hallucination resistance đủ tốt để Bank of New York đưa vào pilot.
- Researcher: reasoning đa bước cho ý tưởng khoa học — OpenAI coi đây là hướng lớn tiếp theo.
Hạn chế & an toàn
- API chưa mở, ai chờ integration phải đợi thêm.
- Không công bố giá token cho Free/Go — có thể là tier cuối được tiếp cận.
- OpenAI nói đây là "strongest set of safeguards to date", nên một số prompt sẽ bị chặn theo policy mới.
- Benchmark nội bộ OpenAI — chờ third-party (Artificial Analysis đã xác nhận Coding Agent Index) và review cộng đồng để kiểm chứng số liệu SWE-Bench Pro trên dataset mở.
Bức tranh cạnh tranh
OpenAI đang vận hành ở quy mô khó tưởng tượng vài năm trước: 900 triệu weekly active users, 50 triệu+ subscriber, 9 triệu paying business users trên ChatGPT và 4 triệu active users trên Codex. Mỗi iteration model ảnh hưởng trực tiếp tới doanh thu và retention, và việc ra 5.5 chỉ 6 tuần sau 5.4 là tín hiệu: release cadence đang trở thành vũ khí chiến lược, không chỉ là kết quả R&D.
Đối thủ lớn nhất — Anthropic — hiện vẫn giữ ưu thế về một số bench dài, nhưng con số "chi phí bằng nửa" trên Coding Agent Index cộng với SWE-Bench Pro 58.6% đặt OpenAI vào vị thế hợp đồng enterprise rất khó từ chối, nhất là cho các team dev đang chi trả lớn cho Codex.
Tiếp theo là gì
Brockman mô tả GPT-5.5 là "big step towards more agentic and intuitive computing" — ám chỉ hướng sắp tới là agent nhiều bước, ít hướng dẫn. Với cadence 6 tuần, kịch bản khả dĩ: API GPT-5.5 mở trong vài tuần, kèm biến thể mini/nano cho đại chúng, và một iteration kế tiếp (5.6 hoặc dòng agent chuyên biệt) trước mùa hè 2026. Dev nên bắt đầu thử 5.5 trong Codex ngay hôm nay để quen với cách model mới plan và gọi tool — thói quen prompt cũ (hướng dẫn từng bước) có thể đang làm giảm hiệu quả của intelligence mới này.
Nguồn: OpenAI, Fortune, @OpenAIDevs, StreetInsider.
