TL;DR

Lex Fridman vừa ra tập podcast #496 với Jean-Baptiste Kempf (lead developer VLC) và Kieran Kunhya (FFmpeg contributor, người đứng sau account @FFmpeg nổi tiếng trên X). Đây là cuộc đối thoại hiếm gặp nhất về hai phần mềm quan trọng nhất nhưng ít được biết đến nhất trong lịch sử công nghệ: FFmpeg - thư viện xử lý video/audio mà YouTube, Netflix, Chrome đều dựa vào - và VLC - trình phát nhạc/video đã được tải hơn 6 tỷ lần. Cả hai đều là open source, đều do tình nguyện viên xây dựng, và đều đang đối mặt với cuộc khủng hoảng tài chính nghiêm trọng.

Lex Fridman Podcast #496 - FFmpeg và VLC với Jean-Baptiste Kempf

Hai phần mềm vô hình vận hành internet

FFmpeg là bộ thư viện low-level cho phép decode, encode, transcode và filter hầu như mọi định dạng video/audio từng tồn tại. Bạn xem video trên YouTube? FFmpeg. Stream Netflix? FFmpeg. Dùng Google Chrome để phát video? FFmpeg. Nhắn tin video trên Discord? FFmpeg. Không nói quá khi gọi đây là "bộ máy hơi nước" của toàn bộ internet video.

VLC ra đời năm 1996 như một dự án sinh viên tại Ecole Centrale Paris - mục tiêu ban đầu chỉ là stream video từ chảo vệ tinh qua mạng nội bộ của trường. Ngày nay, VLC là "binary star system" cùng FFmpeg theo cách Lex Fridman gọi: VLC phụ thuộc vào codec của FFmpeg để phát file, còn FFmpeg phụ thuộc vào lượng người dùng VLC để phát hiện edge cases và lỗi mới. Hai cái tên, một hệ sinh thái.

Jean-Baptiste Kempf - người đã cứu VLC khỏi cái chết năm 2005 khi dự án chỉ còn 2 developer tích cực - từ chối hàng chục triệu USD đề nghị mua lại chỉ để giữ VLC hoàn toàn miễn phí, không quảng cáo, không tracking. Đó là triết lý cốt lõi của cả hai dự án: xây vì tình yêu với kỹ thuật, không phải vì tiền.

Những con số khiến bạn kinh ngạc

Dưới đây là các con số kỹ thuật được tiết lộ trong podcast:

MetricGiá trị
VLC total downloads6+ tỷ (CES 2025)
dav1d Assembly lines240.000 dòng handwritten (79.9% Assembly, 19.6% C)
Speedup vs C code10x - 62x (SIMD optimization)
VLC compiled size16 triệu dòng code trên Windows
VLC modules~500 plugins, hơn 800 contributors
AV2 vs AV130% ít bandwidth hơn cho cùng chất lượng
Kyber latency target4ms glass-to-glass (đã đạt 7ms trong testing)
Core VLC team~5 người; Core FFmpeg team: 10-15 người

Con số đáng suy nghĩ nhất: 30% video Netflix và 50% video YouTube hiện dùng AV1 - codec được decode bởi dav1d, một thư viện do nhóm tình nguyện viên VideoLAN viết với 240.000 dòng Assembly tay.

Drama với Google: khi AI spam lỗi bảo mật vào dự án của volunteers

Một trong những chủ đề nóng nhất trong podcast là cuộc đối đầu giữa FFmpeg và Google cuối 2025. Google dùng AI agent "Big Sleep" để quét lỗ hổng bảo mật trong FFmpeg và phát hiện... một bug "mức độ trung bình" trong codec của game Rebel Assault 2 từ năm 1995.

Vấn đề không phải ở việc tìm bug - mà ở cách xử lý. Google áp deadline 90 ngày public disclosure theo chính sách Project Zero mới, không kèm patch, không hỗ trợ tài chính. Với team volunteer đang gánh hàng trăm issue AI-generated wordy và tất cả đều được đánh dấu "high priority", đây gần như là denial-of-service bằng bug reports.

Kieran Kunhya - người đứng sau account @FFmpeg trên X - gọi đây là "CVE slop" và đặt câu hỏi thẳng: "Có thực sự công bằng khi các tập đoàn nghìn tỷ USD dùng AI tìm lỗi trong code hobby của người khác, rồi đòi volunteers phải vá gấp?"

Câu chuyện kết thúc có hậu: sau cuộc "rap battle" trên X, Google điều chỉnh chính sách, bắt đầu gửi patch kèm báo cáo, và donations cho FFmpeg tăng đáng kể. Nhưng tổng donations vẫn chưa đủ để trả lương cho dù chỉ 1 developer full-time.

FFmpeg và VLC - ở khắp mọi nơi bạn không ngờ

Một trong những phần thú vị nhất của podcast là danh sách những nơi FFmpeg và VLC đang chạy:

  • NASA Perseverance rover - dùng FFmpeg để nén ảnh và video trước khi truyền về Trái Đất từ Sao Hỏa. FFmpeg thực sự là phần mềm đa hành tinh.
  • CERN Large Hadron Collider - dùng VLC để stream camera từ vòng gia tốc dài 27km qua mạng multicast nội bộ.
  • SpaceX và ESA - dùng VLC để monitor rocket launches.
  • Formula 1 paddocks - các kỹ sư dùng VLC để phát live broadcast feed.
  • Quân đội Mỹ trong Chiến tranh Afghanistan - VLC dùng để stream phim từ RTSP server giúp giữ tinh thần lính trên chiến trường.
  • CIA (Vault 7 leak) - tạo modified VLC với DLL độc hại để đánh cắp tài liệu người dùng. VideoLAN phải ra tuyên bố: chỉ tải VLC từ videolan.org.

Đó là chưa kể YouTube, Netflix, Chrome, Firefox (Linux), Blender, HandBrake, Kodi, Plex - tất cả đều dựa trực tiếp vào FFmpeg libraries.

Tương lai: AV2, AI subtitles, và... codec cho não người

JB Kempf và Kieran Kunhya chia sẻ những gì đang đến:

  • VLC 4.0 "Otto Chriek" - đang phát triển, sẽ kèm offline AI subtitles (demo tại CES 2025): tự động tạo phụ đề realtime và dịch sang nhiều ngôn ngữ, hoàn toàn local, không cần internet.
  • AV2 + dav2d - codec thế hệ tiếp theo, 30% tốt hơn AV1. VideoLAN đã demo decoder dav2d chạy trong VLC tại CES.
  • Kyber - startup mới của JB: SDK cho ultra-low latency (mục tiêu 4ms) điều khiển robot, drone, xe từ xa qua QUIC/UDP.
  • Sandboxing VLC - chia VLC thành nhiều process riêng biệt (demuxing, decoding, filtering) để ngăn exploit khi crash - thách thức kỹ thuật lớn vì cần xử lý gigabits/s mem copies.
  • Và dài hạn hơn - theo JB: "Tương lai có thể có VLC cho Neuralink. FFmpeg -i input format human brain." Multimedia sẽ mở rộng ra mọi thứ con người có thể cảm nhận.

Vì sao điều này quan trọng với bạn

FFmpeg và VLC là ví dụ sống động nhất về sức mạnh của open source: một nhóm nhỏ kỹ sư - làm vì đam mê, không phải vì tiền - đã xây dựng hạ tầng mà cả internet video phụ thuộc vào. Không có quảng cáo, không có VC funding, không có exit strategy.

Nhưng tập podcast này cũng là lời cảnh tỉnh: mô hình đó đang gặp áp lực chưa từng có từ AI-generated bug reports, từ các tập đoàn nghìn tỷ USD cư xử như với vendor thương mại, từ burnout của một nhóm volunteer quá nhỏ gánh trên vai quá nhiều.

Nếu bạn đang dùng VLC, donate một chút. Nếu bạn đang dùng FFmpeg trong sản phẩm công ty, hãy nghĩ đến việc sponsor. Và ít nhất - hãy xem tập podcast này: đây là 4 tiếng đồng hồ tôn vinh những người đang âm thầm giữ cho internet video tiếp tục chạy.

Nguon: Lex Fridman Podcast #496 - X.com, The New Stack, TechCrunch.