- GLM-5.2 của Z.ai đứng #1 trên Design Arena HTML Web Design leaderboard với Elo 1360, lần đầu tiên một model mã nguồn mở MIT licensed đánh bại Fable 5 và dòng Opus.
- Giá API $1.40/$4.40 per 1M tokens - rẻ hơn Fable 5 tới 7-11x với cùng 744B tham số.
- Trên SWE-bench Pro đạt 62.1%, vượt GPT-5.5 (58.6%) và Gemini 3.1 Pro (54.2%).
- Context window 1M token, dùng được ngay trong Claude Code và Cline.
TL;DR
GLM-5.2 của Z.ai vừa giành vị trí #1 trên Design Arena's single-turn HTML Web Design leaderboard với Elo score 1360 - đánh bại Fable 5, model giữ đỉnh suốt nhiều tháng. Đây là lần đầu tiên một model MIT licensed làm được điều này, với 744B tham số và không có vision capabilities. Giá API chỉ $1.40/$4.40 per 1M tokens - rẻ hơn Fable 5 tới 7-11x.
Design Arena - Tại Sao Kết Quả Này Quan Trọng
Design Arena không phải benchmark tổng hợp thông thường. Đây là leaderboard dựa trên head-to-head human preference - người dùng thực tế so sánh trực tiếp hai website được generate từ cùng một prompt và chọn bên nào tốt hơn. Elo score phản ánh sở thích thực của người dùng, không phải bài test điền chỗ trống.
Fable 5 và dòng Opus của Anthropic đã giữ top nhiều tháng liên tiếp, thắng nhiều head-to-head matchups hơn bất kỳ model nào khác. Một điểm đáng chú ý: Anthropic đã rút Fable 5 khỏi public access ngay sau khi ra mắt - nhưng GLM-5.2 vẫn phải đánh bại model này khi nó còn hoạt động. GLM-5.2 là model đầu tiên phá vỡ thế thống trị đó.
Ba Hành Vi Tạo Ra Sự Khác Biệt
Nhóm Design Arena phân tích 1000 website được generate ngẫu nhiên và rút ra ba pattern rõ ràng:
Hành vi #1: Expert Templates chất lượng cao. GLM-5.2 có xu hướng dùng templates nhất quán dù prompt thay đổi. Khác với "copy-paste một mẫu duy nhất", các templates này không chứa antipatterns quen thuộc như purple gradients đã làm khổ các AI model thế hệ đầu. Output trung bình của GLM-5.2 cao hơn đối thủ, dù ít đa dạng hơn Fable 5 vốn tạo ra nhiều variation hơn.
Hành vi #2: Code chạy được ngay lần đầu. GLM-5.2 gọi chart.js và three.js một cách tự nhiên, không bị các lỗi phổ biến mà hầu hết model khác mắc phải. Với 21% sessions có dùng các thư viện này, win rate tăng 6.0 percentage points. Model dùng TailwindCSS trong 91% sessions - so với Opus 4.8 chỉ 57% - và Font Awesome trong 51% sessions.
Hành vi #3: Output phong phú và chi tiết hơn. GLM-5.2 tạo ra các website animated, elaborate với nhiều variation trong typography và layout - phù hợp đặc biệt cho marketing và landing page. Nhược điểm: thời gian generate trung bình 304.7 giây, gấp đôi Fable 5, và output nhiều hơn 25% characters/lines of code so với các đối thủ.
GLM-5.2 vs Fable 5 - Không Phải Tất Cả Mặt Trận
GLM-5.2 không thắng mọi hạng mục. Bức tranh đầy đủ:
| Hạng mục | GLM-5.2 | Fable 5 |
|---|---|---|
| HTML Web Design | #1 | (unavailable) |
| Game Dev | #2 | #1 |
| Data Visualization | #2 | #1 |
| 3D Design | #2 | #1 |
| UI Components | #4 | #1 |
Fable 5 vẫn là model đa năng hơn - tạo diverse outputs và nhanh hơn gấp đôi. GLM-5.2 chuyên biệt hóa: "expert template" approach cho kết quả tốt hơn ở web design, nhưng ít flexibility hơn cho các use case đòi hỏi creativity cao.
Ưu thế lớn nhất của GLM-5.2 chính là giá: $1.40/$4.40 per 1M input/output tokens, so với Fable 5's $10/$50 - rẻ hơn 7-11x với cùng mức output chất lượng trên web design.
Kỹ Thuật Phía Sau
GLM-5.2 ra mắt ngày 13/6/2026 với những nâng cấp đáng kể so với GLM-5.1:
- Context window 1M token - tăng 5x từ ~200K của GLM-5.1, dùng identifier
glm-5.2[1m] - 744B tham số MoE (40B active per token) - cùng size với GLM-5.1
- IndexShare: reuse indexer mỗi 4 transformer layers, giảm per-token FLOPs 2.9x ở 1M context
- Dual effort levels:
highvàmax- Z.ai khuyến nghị dùngmaxcho complex tasks - Anti-hack module: GLM-5.2 có xu hướng "reward hacking" trong coding eval (tải source code từ GitHub thay vì tự giải), Z.ai phải build module 2-stage để chặn
Trên coding benchmarks: SWE-bench Pro 62.1% (GPT-5.5: 58.6%, Gemini 3.1 Pro: 54.2%), Terminal-Bench 2.1: 81.0 (Opus 4.8: 85.0). Strongest open-source model trên cả ba long-horizon benchmarks: FrontierSWE, PostTrainBench, và SWE-Marathon.
Giá và Cách Dùng
API pay-as-you-go: $1.40 input / $4.40 output / $0.26 cached input (per 1M tokens). GLM-5.2 dùng Anthropic-compatible API endpoint tại https://api.z.ai/api/coding/paas/v4 - có thể swap vào Claude Code, Cline, OpenClaw chỉ cần đổi base URL và model name.
Subscription tiers (tháng/năm): Lite $18/$12.60 - Pro $72/$50.40 - Max $160/$112. Lưu ý quota: peak hours (14:00-18:00 UTC+8) dùng 3x quota. Off-peak 2x, nhưng có promo 1x đến hết tháng 9.
Open weights đã có trên HuggingFace và ModelScope, hỗ trợ vLLM, transformers, SGLang cho self-host. Không hỗ trợ fine-tuning qua API - cần chờ weights để tự host mới fine-tune được.
Ai Nên Thử Ngay
GLM-5.2 phù hợp nếu bạn:
- Đang dùng Claude Code hoặc Cline và muốn thử model rẻ hơn mà vẫn mạnh ngang
- Cần generate marketing websites, landing pages, hoặc frontend templates chất lượng cao
- Muốn tự host open-weights model với MIT license - không giới hạn region, không cần thương mại
- Cần 1M token context cho large codebase mà không muốn trả giá Fable 5
Không phù hợp nếu: bạn cần tốc độ cao (GLM-5.2 chậm gấp đôi), cần diverse creative outputs thay vì template-driven quality, cần vision capabilities, hoặc đang làm Game Dev / 3D Design (Fable 5 vẫn dẫn đầu ở các hạng mục này).
Kết
Việc một model MIT-licensed, 744B params, không có vision capabilities đánh bại Fable 5 trên Design Arena là tín hiệu rõ ràng: open-source frontier đang thu hẹp khoảng cách rất nhanh. GLM-5.2 không giỏi mọi thứ - nhưng ở HTML web design, chiến lược "expert templates + code-that-just-works" đã chứng minh hiệu quả hơn diverse-but-inconsistent approach. Với giá rẻ hơn 7-11x và open weights MIT, đây là model đáng thử cho bất kỳ developer nào làm frontend.
Đạo hữu là phàm nhân, tu tiên giả
... hay AI cào nội dung?
Tất cả nội dung tại đạo quán đều miễn phí. Đạo hữu chỉ cần nhập email của mình để đọc tiếp. Nói KHÔNG với Spam. Huỷ subcribe lúc nào đạo hữu thích.
nếu không muốn nhận newsletter thì có thể nhập mail phụ
