TL;DR

Ngày 24/04/2026, DeepSeek công bố V4 Pro — MoE 1.6T total / 49B active, context 1M token, MIT license, giá $1.74 / $3.48 per M token (input/output). Một ngày sau, người dùng @Tur24Tur chạy thử nghiệm 2/3: cho agent dùng V4 Pro bypass root detection của 1 app Android private chỉ trong 16 phút và 102 tool call. Reviewer là Claude Opus 4.7 — đánh giá phương pháp "strong". Đây là một trong những demo agentic-coding thuyết phục nhất của model open-source kể từ khi ra mắt.

Có gì mới

DeepSeek V4 Pro không chỉ là bản nâng cấp tham số. Ba điểm thực sự thay đổi cách dùng:

  • Agent-first: tinh chỉnh riêng cho Claude Code, OpenClaw, OpenCode, CodeBuddy. DeepSeek đang dùng V4 Pro làm coding agent nội bộ — feedback nội bộ nói "vượt Sonnet 4.5, tiệm cận Opus 4.6 ở chế độ non-thinking".
  • Hiệu năng dài context: ở 1M token, V4 Pro chỉ tốn 27% FLOPs/token10% KV cache so với V3.2 — nhờ Token-wise compression + DeepSeek Sparse Attention (DSA).
  • API kép: hỗ trợ cả OpenAI ChatCompletions lẫn Anthropic format. Đổi 1 dòng model, giữ nguyên base_url. Có 2 mode: non-thinking và thinking (reasoning_effort=high|max).

Thí nghiệm: bypass root detection trong 16 phút

Yêu cầu cho agent: phân tích APK đã decompile, tìm tất cả cơ chế root detection, viết Frida script bypass, verify trên thiết bị thật qua ADB. App là private — không show tên hay screenshot — nhưng dùng kỹ thuật phổ thông.

Agent chọn cách tiếp cận dynamic-first → static → dynamic-verify:

Dynamic phase

  • Khởi động frida-server trên device.
  • Launch app KHÔNG có Frida — quan sát hành vi tự nhiên, ghi nhận popup "Your device is rooted".
  • uiautomator dump bắt UI tree → có ngay text chính xác của dialog.
  • Screenshot làm evidence + logcat để xác định class nào trigger.

Static phase

  • Grep source jadx tìm pattern root detection.
  • Tìm ra 13+ class obfuscated. Trace toàn bộ chain:
ActivityLifecycleCallbacks → Kotlin coroutine → 5 check song song (TracerPid, emulator, su binary, /proc/mounts, Xposed/Zygisk) → SafetyNet/Play Integrity → AlertDialog → finishAffinity()

Script writing

Agent viết Frida script 317 dòng, 14 hook qua 7 layer:

  1. Java-level root detection methods
  2. Coroutine blocking (hook ở mức suspend function — không trivial)
  3. Dialog callback interception
  4. Exit prevention với stack-trace check (tránh chặn nhầm finishAffinity() hợp lệ)
  5. AlertDialog monitoring
  6. RootBeer library bypass (isRooted, isRootedWithBusyBox)
  7. SafetyNet hooks

Self-debug

  • Lần chạy đầu: hook signature sai → throw error.
  • Agent đọc stderr, sửa script, relaunch.
  • Lần 2: coroutine bị intercept thành công, không còn popup, app load nội dung bình thường.
  • Tap qua các tab navigation để verify full functionality.
  • Clean restart để xác nhận bypass nhất quán.

Vì sao đáng chú ý

Có 3 thứ làm thí nghiệm này khác với "AI tự động viết code" thông thường:

  • Quyết định dynamic-first là đúng phương pháp. uiautomator dump cho biết chính xác text popup, từ đó static analysis biết grep gì. Một pentester thiếu kinh nghiệm dễ lao thẳng vào jadx và lạc trong 13 class obfuscated.
  • Hook ở mức suspend function của Kotlin coroutine. Coroutine compile ra state machine — nhìn bytecode obfuscated rất khó nhận ra. Việc agent xác định đây là điểm đúng để hook là dấu hiệu hiểu sâu Android internals, không chỉ pattern matching.
  • Self-debug loop. Hook signature fail là lỗi runtime kinh điển khi viết Frida cho code obfuscated. Agent đọc lỗi, fix, retry — đây là điểm phân biệt agentic coding với code-completion.

Technical facts về DeepSeek V4 Pro

Đặc điểmV4-ProV4-Flash
Total params1.6T284B
Active params49B13B
Context1M token1M token
Pre-train tokens33T32T
Giá input ($/M)$1.74$0.14
Giá output ($/M)$3.48$0.28
Weights size (HF)865GB160GB
LicenseMITMIT

V4-Pro hiện là model open-weights lớn nhất — vượt Kimi K2.6 (1.1T) và GLM-5.1 (754B), gấp đôi V3.2 (685B).

So sánh giá với các model frontier

ModelInput ($/M)Output ($/M)
DeepSeek V4 Pro$1.74$3.48
Gemini 3.1 Pro$2.00$12.00
GPT-5.4$2.50$15.00
Claude Sonnet 4.6$3.00$15.00
Claude Opus 4.7$5.00$25.00

V4 Pro rẻ hơn Opus 4.7 khoảng 5–7× ở mức giá output. Với agentic workload (nhiều tool call, output dài), khoảng cách này gấp lên rất nhanh.

Giới hạn & lưu ý

  • Reasoning vẫn trễ frontier 3–6 tháng. Pro-Max mode vượt GPT-5.2 và Gemini-3.0-Pro nhưng vẫn dưới GPT-5.4 và Gemini-3.1-Pro trên reasoning chuẩn.
  • Hardware: 865GB weights → cloud API thực tế hơn local cho hầu hết team. Flash quantize (160GB) có thể chạy trên Mac 128GB.
  • SafetyNet/Play Integrity full bypass vẫn cần Magisk/Shamiko + Zygisk — Frida không tự một mình giải quyết được attestation server-side.
  • Native JNI: nếu app đẩy logic root check xuống .so (C/C++), phải dùng Interceptor.attach trên native exports — Java-level hook không đụng tới.

Tiếp theo

Tác giả thread cho biết experiment 3 sẽ là AngularJS sandbox escape + CSP bypass XSS. Về phía DeepSeek, mốc cần nhớ: deepseek-chatdeepseek-reasoner sẽ retire vào 24/07/2026, 15:59 UTC — hiện đang route sang V4-Flash. Team nào còn dùng tên cũ trong production cần migrate trước hạn.

Nguồn: DeepSeek API Docs, Simon Willison, Atlas Cloud, Redfox Security, @Tur24Tur thread.