Grok 4.3 Beta: xAI âm thầm thả mô hình xem video dài và trả về tóm tắt + timestamp trong vài giây

TL;DR

xAI vừa thả Grok 4.3 Beta vào ngày 17/04/2026 — không thông cáo báo chí, chỉ âm thầm xuất hiện trong model picker của grok.com với nhãn "Early Access". Điểm nhấn duy nhất đáng chú ý: native video understanding. Bạn upload một video dài, Grok tự xem, trả về tóm tắt rõ ràng, timestamp chapters có cấu trúc, và narrative breakdown chi tiết trong vài giây. Cộng thêm 2 triệu token context, PDF/PPT/XLSX generate trực tiếp trong chat, và timing "đá đểu" đúng 1 ngày sau khi Anthropic ship Claude Opus 4.7.

Có gì mới

Grok 4.3 không phải một cú nhảy thế hệ — nó là bản nâng cấp chiến thuật, đánh trúng chỗ đối thủ còn yếu. Các feature chính:

Native video input: đẩy thẳng file video vào chat, không cần transcribe trước. Grok xem, hiểu, và có thể trả lời câu hỏi về từng khoảnh khắc.
Structured timestamps: model tự chia video thành chapters giống YouTube chapters — ghi rõ mốc thời gian, tiêu đề đoạn, tóm tắt nội dung đoạn.
Narrative breakdown: không chỉ tóm tắt mà còn kể lại mạch truyện / luận điểm / hành động trong video theo trình tự.
Document generation: xuất PDF, PowerPoint slides, và spreadsheet trực tiếp trong chat — bỏ luôn bước export sang tool khác.
Reasoning sâu hơn: kết quả multi-step task tốt hơn Grok 4.20, được cho là nhờ training run dài hơn và số tham số gấp đôi (chưa xác nhận chính thức).
Grok Computer integration: agent desktop tự động của xAI mở rộng beta cùng lúc.

Vì sao đáng chú ý

Đây là lần đầu một mô hình chủ lực xem video dài như một input first-class — không cần tiền xử lý, không cần nối công cụ transcription + vision riêng biệt. Với creators, educators, researchers, và team nội bộ, workflow "upload cut thô → nhận chapters + notes + slides" rút ngắn vài giờ công xuống vài giây prompt. Timing cũng rất có tính toán: 4.3 xuất hiện đúng 1 ngày sau Claude Opus 4.7, như một phản đòn nhắm vào khoảng trống long-context + native video mà Anthropic và OpenAI hiện chưa có tier tương đương.

Số liệu kỹ thuật

Thuộc tính	Grok 4.3 Beta
Ngày ra mắt	17/04/2026
Context window	2,000,000 tokens
Kiến trúc Heavy mode	16-agent ensemble
Parameter count	~2× Grok 4.20 (chưa xác nhận)
Video input	Native — file video thẳng
Outputs đặc thù video	Summary, timestamp chapters, narrative breakdown
Platforms	grok.com, iOS, Android
Native docs	PDF, .pptx, .xlsx trong chat

So với Claude Opus 4.7 và GPT-5.4

Tính năng	Grok 4.3	Claude Opus 4.7	GPT-5.4
Context window	2M tokens	200K	128K
Native video input	Có	Không	Hạn chế
Memory xuyên phiên	Không	Projects	Có
Gen doc PDF/PPT/XLSX native	Có	Không	Không
Computer-use agent	Grok Computer (beta)	—	Mạnh hơn hiện tại

Điểm khác biệt gai góc nhất của Grok 4.3 nằm ở 2M context và native long-form video — hai thứ cả Claude lẫn GPT đều chưa đấu được ở tier hiện tại.

Ai hưởng lợi nhất

Video creators: feedback AI trên footage thô trước khi edit; tự động tạo YouTube chapters từ cut cuối.
Podcaster / lecturer: biến recording 60–90 phút thành notes có cấu trúc, trích dẫn theo timestamp.
Team research & ops: tóm tắt meeting recording, action items, summary gửi team ngay.
Enterprise workflow: one-prompt cho ra PDF report hoặc slide deck có phân tích sẵn.
Ngành dọc như CRE: walk-through video của bất động sản → inspection report tự động.

Hạn chế & giá

Giá: khóa sau SuperGrok Heavy tier $300/tháng. Standard SuperGrok ($30/tháng) chưa có access.
Không có memory xuyên phiên — mỗi session mới phải giới thiệu lại context. Đây là điểm yếu bị cộng đồng chỉ trích nặng nhất so với Claude Projects / ChatGPT memory.
Beta tag: chất lượng output và availability có thể đổi bất cứ lúc nào.
xAI chưa công bố số liệu benchmark chính thức cho 4.3, cũng chưa công bố giới hạn độ dài video tối đa.
Không có press release chính thức — toàn bộ thông tin đang từ community observations và demo của các KOL như Wes Roth.

Sắp tới

Cộng đồng ước tính bản GA cho tier SuperGrok chuẩn sẽ rơi vào giữa đến cuối tháng 5/2026, nhưng xAI chưa xác nhận lịch. Trên roadmap tiếp theo gồm: mở rộng beta Grok Computer, GA đầy đủ cho 4.3, và nhiều khả năng sẽ có 4.3 mini/fast variants phục vụ developer qua API. Với tốc độ ship hiện tại, cuộc đua long-context + multimodal đang nóng đến mức mỗi tuần là một mô hình mới.

Nguồn: Phemex News, BuildFastWithAI, PiunikaWeb, The AI Pixel, Wes Roth trên X.

Grok 4.3 Beta: xAI âm thầm thả mô hình xem video dài và trả về tóm tắt + timestamp trong vài giây

TL;DR

Có gì mới

Vì sao đáng chú ý

Số liệu kỹ thuật

So với Claude Opus 4.7 và GPT-5.4

Ai hưởng lợi nhất

Hạn chế & giá

Sắp tới

Tiếp tục lướt

Qwen-Image Vừa Bẻ Khoá "Sharper Instruction Following" — Và Đây Không Phải Screenshot

Chandra OCR 2: Mô hình OCR open-source 4B đánh bại Gemini, dots.ocr và olmOCR

DeepSeek-V4 ra mắt: 1M token context với 10% KV cache và 27% FLOPs của V3.2

DeepSeek V4 lộ diện: 1.6 nghìn tỷ tham số, context 1M token, rẻ hơn GPT-5.5 gấp 7 lần

Grok Voice Think Fast 1.0 quét sạch τ-voice Bench: 67.3% overall, 73.7% telecom — bỏ xa OpenAI và Google