DeepSeek V4 Pro phá root detection của 1 app Android trong 16 phút

TL;DR

Ngày 24/04/2026, DeepSeek công bố V4 Pro — MoE 1.6T total / 49B active, context 1M token, MIT license, giá $1.74 / $3.48 per M token (input/output). Một ngày sau, người dùng @Tur24Tur chạy thử nghiệm 2/3: cho agent dùng V4 Pro bypass root detection của 1 app Android private chỉ trong 16 phút và 102 tool call. Reviewer là Claude Opus 4.7 — đánh giá phương pháp "strong". Đây là một trong những demo agentic-coding thuyết phục nhất của model open-source kể từ khi ra mắt.

Có gì mới

DeepSeek V4 Pro không chỉ là bản nâng cấp tham số. Ba điểm thực sự thay đổi cách dùng:

Agent-first: tinh chỉnh riêng cho Claude Code, OpenClaw, OpenCode, CodeBuddy. DeepSeek đang dùng V4 Pro làm coding agent nội bộ — feedback nội bộ nói "vượt Sonnet 4.5, tiệm cận Opus 4.6 ở chế độ non-thinking".
Hiệu năng dài context: ở 1M token, V4 Pro chỉ tốn 27% FLOPs/token và 10% KV cache so với V3.2 — nhờ Token-wise compression + DeepSeek Sparse Attention (DSA).
API kép: hỗ trợ cả OpenAI ChatCompletions lẫn Anthropic format. Đổi 1 dòng model, giữ nguyên base_url. Có 2 mode: non-thinking và thinking (reasoning_effort=high|max).

Thí nghiệm: bypass root detection trong 16 phút

Yêu cầu cho agent: phân tích APK đã decompile, tìm tất cả cơ chế root detection, viết Frida script bypass, verify trên thiết bị thật qua ADB. App là private — không show tên hay screenshot — nhưng dùng kỹ thuật phổ thông.

Agent chọn cách tiếp cận dynamic-first → static → dynamic-verify:

Dynamic phase

Khởi động frida-server trên device.
Launch app KHÔNG có Frida — quan sát hành vi tự nhiên, ghi nhận popup "Your device is rooted".
uiautomator dump bắt UI tree → có ngay text chính xác của dialog.
Screenshot làm evidence + logcat để xác định class nào trigger.

Static phase

Grep source jadx tìm pattern root detection.
Tìm ra 13+ class obfuscated. Trace toàn bộ chain:

ActivityLifecycleCallbacks → Kotlin coroutine → 5 check song song (TracerPid, emulator, su binary, /proc/mounts, Xposed/Zygisk) → SafetyNet/Play Integrity → AlertDialog → finishAffinity()

Script writing

Agent viết Frida script 317 dòng, 14 hook qua 7 layer:

Java-level root detection methods
Coroutine blocking (hook ở mức suspend function — không trivial)
Dialog callback interception
Exit prevention với stack-trace check (tránh chặn nhầm finishAffinity() hợp lệ)
AlertDialog monitoring
RootBeer library bypass (isRooted, isRootedWithBusyBox)
SafetyNet hooks

Self-debug

Lần chạy đầu: hook signature sai → throw error.
Agent đọc stderr, sửa script, relaunch.
Lần 2: coroutine bị intercept thành công, không còn popup, app load nội dung bình thường.
Tap qua các tab navigation để verify full functionality.
Clean restart để xác nhận bypass nhất quán.

Vì sao đáng chú ý

Có 3 thứ làm thí nghiệm này khác với "AI tự động viết code" thông thường:

Quyết định dynamic-first là đúng phương pháp. uiautomator dump cho biết chính xác text popup, từ đó static analysis biết grep gì. Một pentester thiếu kinh nghiệm dễ lao thẳng vào jadx và lạc trong 13 class obfuscated.
Hook ở mức suspend function của Kotlin coroutine. Coroutine compile ra state machine — nhìn bytecode obfuscated rất khó nhận ra. Việc agent xác định đây là điểm đúng để hook là dấu hiệu hiểu sâu Android internals, không chỉ pattern matching.
Self-debug loop. Hook signature fail là lỗi runtime kinh điển khi viết Frida cho code obfuscated. Agent đọc lỗi, fix, retry — đây là điểm phân biệt agentic coding với code-completion.

Technical facts về DeepSeek V4 Pro

Đặc điểm	V4-Pro	V4-Flash
Total params	1.6T	284B
Active params	49B	13B
Context	1M token	1M token
Pre-train tokens	33T	32T
Giá input ($/M)	$1.74	$0.14
Giá output ($/M)	$3.48	$0.28
Weights size (HF)	865GB	160GB
License	MIT	MIT

V4-Pro hiện là model open-weights lớn nhất — vượt Kimi K2.6 (1.1T) và GLM-5.1 (754B), gấp đôi V3.2 (685B).

So sánh giá với các model frontier

Model	Input ($/M)	Output ($/M)
DeepSeek V4 Pro	$1.74	$3.48
Gemini 3.1 Pro	$2.00	$12.00
GPT-5.4	$2.50	$15.00
Claude Sonnet 4.6	$3.00	$15.00
Claude Opus 4.7	$5.00	$25.00

V4 Pro rẻ hơn Opus 4.7 khoảng 5–7× ở mức giá output. Với agentic workload (nhiều tool call, output dài), khoảng cách này gấp lên rất nhanh.

Giới hạn & lưu ý

Reasoning vẫn trễ frontier 3–6 tháng. Pro-Max mode vượt GPT-5.2 và Gemini-3.0-Pro nhưng vẫn dưới GPT-5.4 và Gemini-3.1-Pro trên reasoning chuẩn.
Hardware: 865GB weights → cloud API thực tế hơn local cho hầu hết team. Flash quantize (160GB) có thể chạy trên Mac 128GB.
SafetyNet/Play Integrity full bypass vẫn cần Magisk/Shamiko + Zygisk — Frida không tự một mình giải quyết được attestation server-side.
Native JNI: nếu app đẩy logic root check xuống .so (C/C++), phải dùng Interceptor.attach trên native exports — Java-level hook không đụng tới.

Tác giả thread cho biết experiment 3 sẽ là AngularJS sandbox escape + CSP bypass XSS. Về phía DeepSeek, mốc cần nhớ: deepseek-chat và deepseek-reasoner sẽ retire vào 24/07/2026, 15:59 UTC — hiện đang route sang V4-Flash. Team nào còn dùng tên cũ trong production cần migrate trước hạn.

Nguồn: DeepSeek API Docs, Simon Willison, Atlas Cloud, Redfox Security, @Tur24Tur thread.

DeepSeek V4 Pro phá root detection của 1 app Android trong 16 phút

TL;DR

Có gì mới

Thí nghiệm: bypass root detection trong 16 phút

Dynamic phase

Static phase

Script writing

Self-debug

Vì sao đáng chú ý

Technical facts về DeepSeek V4 Pro

So sánh giá với các model frontier

Giới hạn & lưu ý

Tiếp theo

Tiếp tục lướt

Mind DeepResearch 30B của Li Auto vượt Gemini 3.1 trên benchmark deep research

Huihui4-8B-A4B: cắt 96 expert khỏi Gemma 4 mà perplexity vẫn đẹp hơn bản gốc

Carnice-V2-27b: a 27B open-source agent model built on Qwen3.6 lands on Hugging Face

Qwen3.6-27B chạy local trên MacBook Pro: model 27B đánh bại 397B trên benchmark coding

DeepSeek V4 Pro tự hack 3 challenge PortSwigger và 1 app Android — review bởi Claude Opus 4.7