// Posts#video-vlm
VLMaxxing: Dạy Video VLM Bỏ Qua Những Gì Không Thay Đổi - Không Cần Training
#10132026-05-07

VLMaxxing: Dạy Video VLM Bỏ Qua Những Gì Không Thay Đổi - Không Cần Training

VLMaxxing (arXiv 2605.03351) dạy video VLM tái sử dụng trạng thái visual thay vì xử lý lại mọi frame giống hệt nhau. Kỹ thuật training-free đạt 14.90-35.92x tăng tốc cho follow-up query trên Qwen2.5-VL-7B, không drift độ chính xác qua 93 câu hỏi. C-VISION pruning trên Gemma 4-E4B đạt 54 fps, giảm 42.2% thời gian xử lý vision tower. Mã nguồn mở tại github.com/jfbastien/VLMaxxing.

video-vlmai-researchcomputer-vision
6 phút đọc