OpenAI tung GPT-5.5 chỉ 6 tuần sau GPT-5.4: 84.9% GDPval, ngang ngửa con người

TL;DR

OpenAI phát hành GPT-5.5 ngày 23/4/2026, chỉ 6 tuần sau GPT-5.4. Model mới đạt 84.9% trên GDPval — benchmark đo năng lực làm việc tri thức thực tế — vượt Claude Opus 4.7 (80%) và GPT-5.4 (83%), đồng thời ngang hoặc vượt con người ở ~85% task. Giá API gấp đôi GPT-5.4: $5 / 1M input, $30 / 1M output. Có sẵn ngay trên ChatGPT và Codex cho người dùng trả phí; API sẽ mở trong vài tuần tới.

Có gì mới

Luận điểm trung tâm của bản phát hành là: GPT-5.5 "intuits what you need before you ask" — nhìn một vấn đề mơ hồ và tự xác định bước tiếp theo, gần như không cần bạn viết prompt chi tiết. OpenAI gọi đây là model "hiệu quả nhất từ trước đến nay cho công việc có giá trị kinh tế".

Co-founder Greg Brockman mô tả đây là "một hạng intelligence mới" và "bước lớn tiến tới agentic và intuitive computing". Ba điểm đáng chú ý:

Tự chủ hơn: xử lý workflow nhiều bước với ít hướng dẫn từ người dùng.
Ít token hơn, sắc hơn: "faster, sharper thinker for fewer tokens compared to 5.4" — tiết kiệm chi phí inference dù đơn giá tăng.
Chống ảo giác tốt hơn: tuning riêng cho ngành được quản lý chặt (tài chính, y tế, pháp lý).

Vì sao quan trọng

Cadence 6 tuần giữa GPT-5.4 và GPT-5.5 chính là câu chuyện. Các frontier labs đang chạy đua cung cấp enterprise value trước khi đối thủ kịp bắt kịp. Với 900 triệu người dùng hàng tuần, 50 triệu subscriber trả phí và 4 triệu Codex user, OpenAI không chỉ bán model — họ bán một sản phẩm đang thành "superapp" cho công việc tri thức.

Điểm 84.9% GDPval có nghĩa gì thực tế? Benchmark này đo khả năng AI tạo ra sản phẩm công việc hoàn chỉnh (slide bán hàng, bảng kế toán, sơ đồ sản xuất) cho 44 nghề trong top ngành đóng góp GDP Mỹ. Ngang hoặc vượt con người ở ~85% task là ngưỡng mà việc "AI làm xong để con người review" bắt đầu trở thành lựa chọn rẻ hơn "con người làm từ đầu" ở nhiều vị trí.

Số liệu kỹ thuật

Benchmark	GPT-5.5	GPT-5.4	Claude Opus 4.7
GDPval (knowledge work, 44 nghề)	84.9%	83%	80%
OSWorld-Verified (computer use)	78.7%	75%	—
Terminal-Bench 2.0	Dẫn đầu (hẹp)	—	Claude Mythos Preview #2
Expert-SWE (long-horizon coding)	Vượt GPT-5.4, ít token hơn	Baseline	—

Demo được OpenAI nhấn mạnh: một giáo sư toán dựng ứng dụng algebraic geometry chạy được từ một prompt duy nhất trong 11 phút. Đây là loại task mà GPT-5.4 sẽ cần nhiều vòng prompt và debug.

So với GPT-5.4 và đối thủ

GPT-5.5 là bước tiến incremental, không phải đột phá paradigm — Fortune mô tả đây là "advancement in agentic capabilities" chứ không phải leap như GPT-5 → GPT-5.4. Nhưng trong bức tranh cạnh tranh:

Claude Mythos Preview (Anthropic) đang dẫn Terminal-Bench 2.0 cho đến hôm qua — GPT-5.5 thắng nhưng chênh lệch "narrow". Anthropic có khả năng lật lại ở bản GA.
Grok 5 (xAI) và Gemini 3.2 (Google) dự kiến ra Q2 2026 — window dẫn đầu của OpenAI có thể chỉ tính bằng tuần.
Chiến lược OpenAI: không chờ đối thủ, xuất một model mới mỗi 6 tuần, buộc thị trường luôn đo mình theo tiêu chuẩn mới nhất của họ.

Use cases

Nghiên cứu khoa học: tạo app chuyên biệt từ mô tả ngắn (demo algebraic geometry).
Dịch vụ tài chính: Bank of New York đang test cho automation doanh nghiệp — khả năng chống ảo giác là unlock cho workflow bị quản chế.
Agent điều khiển máy tính: OSWorld 78.7% và Terminal-Bench lead biến GPT-5.5 thành lựa chọn mạnh nhất cho agent tự click, duyệt, thao tác file thay người dùng.
Coding dài hạn: Expert-SWE cải tiến hướng vào Codex user làm task nhiều file, nhiều giờ.
ChatGPT mainstream: pitch "intuits what you need" nhắm thẳng vào Plus/Pro — giảm gánh prompt engineering cho người dùng phổ thông.

Giới hạn & giá

Giá API: $5 / 1M input tokens, $30 / 1M output tokens — gấp 2 lần GPT-5.4. Không phải lựa chọn rẻ cho khối lượng lớn.
Chưa có bản mini/nano: GPT-5.4 có mini $0.75/M và nano $0.20/M — GPT-5.5 hiện chỉ có bản full, tier rẻ hơn có thể đến sau.
API chưa live ngay: ChatGPT + Codex mở cửa ngày 1, API "in the near future".
Improvement incremental: nếu bạn đang hài lòng với GPT-5.4, chênh lệch thực tế trên nhiều task có thể không biện minh được chi phí gấp đôi.
Cửa sổ cạnh tranh hẹp: Claude Mythos, Grok 5, Gemini 3.2 đều đang lấp ló — Terminal-Bench lead hôm nay có thể bay ngày mai.

Điều gì tới tiếp

API GPT-5.5 mở đầy đủ trong vài tuần. Pipeline Q2 2026 đáng theo dõi: bản GA của Claude Mythos, Grok 5 của xAI, và Gemini 3.2 của Google. Nếu OpenAI giữ nhịp 6 tuần, GPT-5.6 sẽ rơi vào đầu tháng 6 — trùng với cửa sổ phát hành dự kiến của các đối thủ. Cuộc đua này đã chuyển từ "ai mạnh hơn" sang "ai ship nhanh hơn" — và 6 tuần đang là tempo mới.

Nguồn: Fortune, OpenAI, VentureBeat, Inc., TechCrunch.

OpenAI tung GPT-5.5 chỉ 6 tuần sau GPT-5.4: 84.9% GDPval, ngang ngửa con người

TL;DR

Có gì mới

Vì sao quan trọng

Số liệu kỹ thuật

So với GPT-5.4 và đối thủ

Use cases

Giới hạn & giá

Điều gì tới tiếp

Tiếp tục lướt

Qwen-Image Vừa Bẻ Khoá "Sharper Instruction Following" — Và Đây Không Phải Screenshot

GPT-Image-2 + Seedance 2.0: Vẽ "sơ đồ chuyển động camera" để điều khiển video AI

Chandra OCR 2: Mô hình OCR open-source 4B đánh bại Gemini, dots.ocr và olmOCR

Codex giờ tự mở browser: build, click, debug frontend như một user thật

GPT-5.5 trên ParseBench: thắng bảng biểu, thua giá tiền — và Opus 4.7 vẫn dẫn về độ trung thực