Claude Opus 4.8 Ra Mắt: Sharper Judgment, Dynamic Workflows và Fast Mode Rẻ Hơn 3x

TL;DR

Claude Opus 4.8 ra ngày 28/5/2026, 41 ngày sau Opus 4.7 - cadence nhanh nhất từ trước đến nay của Anthropic.
Giá chuẩn giữ nguyên $5/$25 per 1M tokens; Fast mode mới rẻ hơn 3x ($10/$50), chạy 2.5x tốc độ.
SWE-bench Pro: 69.2%, dẫn GPT-5.5 (58.6%) và Gemini 3.1 Pro (54.2%) trên agentic coding.
Dynamic workflows (research preview): Claude Code chạy hàng trăm subagent song song cho các task phức tạp.
Mythos-class models được hứa hẹn sẽ ra trong "vài tuần tới" - Opus 4.8 có thể là điểm kết của dòng Opus 4.x.

Claude Opus 4.8 là gì?

Anthropic mô tả Opus 4.8 là "effective collaborator" - phán đoán sắc bén hơn, trung thực hơn về tiến độ của chính nó, và có thể làm việc độc lập lâu hơn so với các phiên bản trước. Đây không phải bản nâng cấp đột phá về benchmark tổng thể, mà là một bước tiến thực dụng tập trung vào độ tin cậy và chi phí vận hành.

Bên cạnh model, Anthropic đồng thời ra mắt ba tính năng mới: Dynamic workflows (research preview), Effort control trên claude.ai và Cowork, và cập nhật Messages API cho phép chèn system entries giữa chừng mà không phá vỡ prompt cache.

Những con số ấn tượng

Bảng benchmark so sánh Opus 4.8 với Opus 4.7 và các đối thủ chính tháng 5/2026:

Benchmark	Opus 4.8	Opus 4.7	GPT-5.5	Gemini 3.1 Pro
SWE-bench Verified	88.6%	87.6%	~88%	-
SWE-bench Pro (agentic coding)	69.2%	64.3%	58.6%	54.2%
Terminal-Bench 2.1	74.6%	66.1%	78.2%	-
OSWorld-Verified (computer use)	83.4%	82.3%	78.7%	76.2%
HLE w/ tools	57.9%	54.7%	<57.9%	-
GDPval-AA (Elo)	1890	1753	1769	-

Mức tăng ấn tượng nhất là GDPval-AA (+137 Elo so với Opus 4.7) và Terminal-Bench 2.1 (+8.5 điểm). GDPval-AA 1890 tương đương win rate ~67% khi đối đầu trực tiếp GPT-5.5 trên các tác vụ knowledge work rộng - đây là lần đầu tiên trong dòng Opus 4.x Anthropic đạt được khoảng cách không thể phủ nhận so với OpenAI trên benchmark này.

Một con số đáng chú ý khác: Opus 4.8 ít bỏ sót lỗi trong code tự viết hơn Opus 4.7 tới 4 lần - ít hallucinate fix, chủ động nói "tôi không chắc" nhiều hơn, ít gây ra vòng back-and-forth không cần thiết hơn. via MacRumors

Dynamic Workflows và Effort Control

Dynamic Workflows - Claude Code chạy hàng trăm subagent song song

Dynamic workflows (hiện là research preview trong Claude Code) thay đổi cách tiếp cận các task lớn. Thay vì một instance Claude xử lý tuần tự, Opus 4.8 sẽ lập kế hoạch, triển khai hàng chục đến hàng trăm subagent song song, rồi tự verify kết quả trước khi báo cáo. Use case điển hình: migration codebase hàng trăm nghìn dòng code, refactor quy mô lớn với test suite có sẵn làm tiêu chí thành công.

Tính năng này hiện chỉ có cho Claude Code trên Enterprise, Team và Max plan. Chi phí có thể tăng nhanh với hàng trăm cuộc gọi song song - mặc định Anthropic để một supervisor trên Opus 4.8 và các subagent dùng tier rẻ hơn, nhưng bạn có thể tùy chỉnh qua API.

Effort control là dial mới gồm 5 mức: Low / Medium / High / xHigh / Max. Opus 4.8 mặc định ở mức High trên claude.ai và Cowork. Mức Max dành cho các task nặng và workflow dài - tiêu thụ nhiều thinking budget nhất. via 9to5Mac

So sánh với đối thủ

Opus 4.8 dẫn đầu trên hầu hết benchmark agentic, nhưng có hai điểm cần lưu ý:

GPT-5.5 vẫn thắng Terminal-Bench 2.1 (78.2% vs 74.6%) - nếu stack của bạn là single agent trong shell, GPT-5.5 vẫn cạnh tranh.
Opus 4.8 dùng nhiều hơn ~30% turns để hoàn thành cùng task với GPT-5.5 - quality cao hơn nhưng đi kèm overhead chi phí inference thực.
Về multimodal và chart reasoning, Gemini 3.1 Pro vẫn là lựa chọn tốt hơn - Anthropic không tập trung cải thiện vision trong bản này.
Về giá: Opus 4.8 là model frontier đắt nhất hiện tại. DeepSeek V4-Pro rẻ hơn 12x input và 29x output. Pattern 2026 phổ biến: dùng Opus 4.8 làm planner, model rẻ hơn làm executor.

Giá và cách dùng

Mode	Input ($/1M)	Output ($/1M)	Ghi chú
Standard	$5	$25	Không đổi so với Opus 4.7
Fast (research preview)	$10	$50	~2.5x tốc độ, trước đây $30/$150
Cached read	~$0.50	-	Giảm 90% chi phí input
Batch API	$2.50	$12.50	50% off, async only

Model có context window 1 triệu tokens trên Anthropic API, Amazon Bedrock và Google Vertex AI (riêng Microsoft Foundry giới hạn 200K tokens lúc launch). Max output 128K tokens.

Để bật Fast mode trong Claude Code: gõ /fast. Trên API, cần liên hệ account manager hoặc đăng ký waitlist. via 9to5Google

Ai nên chuyển sang ngay

Developer và engineering team đang dùng Opus 4.7 cho agentic coding - upgrade là no-brainer vì giá không đổi, benchmark tốt hơn rõ rệt, và ít lỗi code hơn.
Ai đang trả tiền cho Opus 4.7 Fast mode ($30/$150) - chuyển sang 4.8 Fast mode ($10/$50) là tiết kiệm ngay 3x.
Enterprise và Max plan users muốn thử dynamic workflows cho migrations lớn hoặc bug sweep quy mô.
API developer cần prompt caching hiệu quả hơn - threshold cache giảm xuống còn 1,024 tokens (từ trước cao hơn nhiều), giúp các agentic loop ngắn tiết kiệm 90% chi phí input.

Nếu workload chủ yếu là terminal agent loop thuần túy hoặc chart/image reasoning, GPT-5.5 và Gemini 3.1 Pro vẫn là lựa chọn đáng cân nhắc.

Chuyện gì tiếp theo?

Opus 4.8 là điểm dừng thứ tư của dòng Opus 4.5: 4.5 (tháng 11/2025) - 4.6 (tháng 2/2026) - 4.7 (tháng 4/2026) - 4.8 (tháng 5/2026). Với việc Anthropic hứa hẹn Mythos-class models sẽ đến trong "vài tuần tới", đây có thể là bản point release cuối cùng của dòng Opus 4.x.

Claude Mythos - hiện đang được test giới hạn qua Project Glasswing với các đối tác như Apple để tìm lỗ hổng bảo mật trong macOS - sẽ đại diện cho thế hệ model tiếp theo, vượt xa giới hạn hiện tại của Opus 4.8. Opus 4.8 được định vị là "cầu nối" cuối cùng trước khi thế hệ đó đến tay người dùng đại chúng. via Codersera