TL;DR

xAI vừa thả Grok 4.3 Beta vào ngày 17/04/2026 — không thông cáo báo chí, chỉ âm thầm xuất hiện trong model picker của grok.com với nhãn "Early Access". Điểm nhấn duy nhất đáng chú ý: native video understanding. Bạn upload một video dài, Grok tự xem, trả về tóm tắt rõ ràng, timestamp chapters có cấu trúc, và narrative breakdown chi tiết trong vài giây. Cộng thêm 2 triệu token context, PDF/PPT/XLSX generate trực tiếp trong chat, và timing "đá đểu" đúng 1 ngày sau khi Anthropic ship Claude Opus 4.7.

Có gì mới

Grok 4.3 không phải một cú nhảy thế hệ — nó là bản nâng cấp chiến thuật, đánh trúng chỗ đối thủ còn yếu. Các feature chính:

  • Native video input: đẩy thẳng file video vào chat, không cần transcribe trước. Grok xem, hiểu, và có thể trả lời câu hỏi về từng khoảnh khắc.
  • Structured timestamps: model tự chia video thành chapters giống YouTube chapters — ghi rõ mốc thời gian, tiêu đề đoạn, tóm tắt nội dung đoạn.
  • Narrative breakdown: không chỉ tóm tắt mà còn kể lại mạch truyện / luận điểm / hành động trong video theo trình tự.
  • Document generation: xuất PDF, PowerPoint slides, và spreadsheet trực tiếp trong chat — bỏ luôn bước export sang tool khác.
  • Reasoning sâu hơn: kết quả multi-step task tốt hơn Grok 4.20, được cho là nhờ training run dài hơn và số tham số gấp đôi (chưa xác nhận chính thức).
  • Grok Computer integration: agent desktop tự động của xAI mở rộng beta cùng lúc.

Vì sao đáng chú ý

Đây là lần đầu một mô hình chủ lực xem video dài như một input first-class — không cần tiền xử lý, không cần nối công cụ transcription + vision riêng biệt. Với creators, educators, researchers, và team nội bộ, workflow "upload cut thô → nhận chapters + notes + slides" rút ngắn vài giờ công xuống vài giây prompt. Timing cũng rất có tính toán: 4.3 xuất hiện đúng 1 ngày sau Claude Opus 4.7, như một phản đòn nhắm vào khoảng trống long-context + native video mà Anthropic và OpenAI hiện chưa có tier tương đương.

Số liệu kỹ thuật

Thuộc tínhGrok 4.3 Beta
Ngày ra mắt17/04/2026
Context window2,000,000 tokens
Kiến trúc Heavy mode16-agent ensemble
Parameter count~2× Grok 4.20 (chưa xác nhận)
Video inputNative — file video thẳng
Outputs đặc thù videoSummary, timestamp chapters, narrative breakdown
Platformsgrok.com, iOS, Android
Native docsPDF, .pptx, .xlsx trong chat

So với Claude Opus 4.7 và GPT-5.4

Tính năngGrok 4.3Claude Opus 4.7GPT-5.4
Context window2M tokens200K128K
Native video inputKhôngHạn chế
Memory xuyên phiênKhôngProjects
Gen doc PDF/PPT/XLSX nativeKhôngKhông
Computer-use agentGrok Computer (beta)Mạnh hơn hiện tại

Điểm khác biệt gai góc nhất của Grok 4.3 nằm ở 2M contextnative long-form video — hai thứ cả Claude lẫn GPT đều chưa đấu được ở tier hiện tại.

Ai hưởng lợi nhất

  • Video creators: feedback AI trên footage thô trước khi edit; tự động tạo YouTube chapters từ cut cuối.
  • Podcaster / lecturer: biến recording 60–90 phút thành notes có cấu trúc, trích dẫn theo timestamp.
  • Team research & ops: tóm tắt meeting recording, action items, summary gửi team ngay.
  • Enterprise workflow: one-prompt cho ra PDF report hoặc slide deck có phân tích sẵn.
  • Ngành dọc như CRE: walk-through video của bất động sản → inspection report tự động.

Hạn chế & giá

  • Giá: khóa sau SuperGrok Heavy tier $300/tháng. Standard SuperGrok ($30/tháng) chưa có access.
  • Không có memory xuyên phiên — mỗi session mới phải giới thiệu lại context. Đây là điểm yếu bị cộng đồng chỉ trích nặng nhất so với Claude Projects / ChatGPT memory.
  • Beta tag: chất lượng output và availability có thể đổi bất cứ lúc nào.
  • xAI chưa công bố số liệu benchmark chính thức cho 4.3, cũng chưa công bố giới hạn độ dài video tối đa.
  • Không có press release chính thức — toàn bộ thông tin đang từ community observations và demo của các KOL như Wes Roth.

Sắp tới

Cộng đồng ước tính bản GA cho tier SuperGrok chuẩn sẽ rơi vào giữa đến cuối tháng 5/2026, nhưng xAI chưa xác nhận lịch. Trên roadmap tiếp theo gồm: mở rộng beta Grok Computer, GA đầy đủ cho 4.3, và nhiều khả năng sẽ có 4.3 mini/fast variants phục vụ developer qua API. Với tốc độ ship hiện tại, cuộc đua long-context + multimodal đang nóng đến mức mỗi tuần là một mô hình mới.

Nguồn: Phemex News, BuildFastWithAI, PiunikaWeb, The AI Pixel, Wes Roth trên X.