OpenAI tự làm chip - Jalapeño đặt dấu hỏi lên ngôi vương của Nvidia

TL;DR

OpenAI vừa ra mắt Jalapeño - chip AI đầu tiên do chính họ thiết kế, hợp tác sản xuất với Broadcom. Đây là ASIC (Application-Specific Integrated Circuit) chuyên dụng cho inference - tức là quá trình xử lý hàng trăm triệu câu hỏi mỗi ngày trên ChatGPT và Codex. Chip được hoàn thiện trong vỏn vẹn 9 tháng - chu kỳ phát triển ASIC nhanh nhất lịch sử ngành bán dẫn hiệu năng cao. Mục tiêu dài hạn: 10 gigawatt compute bằng silicon tự làm vào 2029. Với Nvidia, đây không phải cú đấm knock-out - nhưng là lần đầu tiên khách hàng lớn nhất của họ công khai tuyên bố không muốn phụ thuộc mãi vào GPU của người khác nữa.

Bối cảnh: Cuộc đua silicon AI

Hàng năm, OpenAI chi hàng tỉ USD mua GPU Nvidia để phục vụ ChatGPT và huấn luyện model mới. Đây là chi phí vận hành lớn nhất của công ty - và Nvidia, với hệ sinh thái CUDA gần như độc quyền, có toàn quyền định giá.

Google hiểu điều này từ rất sớm và bắt đầu làm TPU từ năm 2016. Amazon có Trainium và Inferentia. Microsoft có Maia. Meta có MTIA. Gần như mọi hyperscaler lớn đều đã tự thiết kế ít nhất một chip AI - vừa để cắt giảm chi phí, vừa để không bị "giam cầm" vào một nhà cung cấp duy nhất.

OpenAI là cái tên cuối cùng gia nhập danh sách đó - và với quy mô inference khổng lồ của ChatGPT, Jalapeño có tiềm năng là thách thức mang tính cấu trúc nhất với vị thế của Nvidia từ trước đến nay.

Jalapeño là gì và được làm ra thế nào

So sánh ASIC Inference (Jalapeño) vs General GPU (Nvidia) — ASIC chuyên dụng cho inference tiết kiệm ~50% chi phí so với GPU đa năng theo CEO Broadcom

Jalapeño không phải GPU. Đây là ASIC - chip được thiết kế từ đầu với một mục đích duy nhất: chạy inference LLM hiệu quả nhất có thể.

Trong khi GPU của Nvidia được thiết kế để làm mọi thứ - training, inference, rendering, simulation - Jalapeño chỉ làm một việc. Và đó chính là lợi thế: khi bạn biết chính xác workload mình sẽ chạy, bạn có thể tối ưu từng transistor cho đúng việc đó.

Về kiến trúc: một compute chiplet lớn (ước tính ~840 mm², gần giới hạn reticle size của EUV lithography là 858 mm²) được bao quanh bởi 6 module HBM3/4 thay vì DRAM rẻ tiền hơn. Kết quả là throughput cực cao kết hợp latency thấp - lý tưởng cho agentic AI và real-time coding như Codex.

Điều đặc biệt nhất không phải là chip - mà là tốc độ làm ra nó. Từ lần phác thảo thiết kế đầu tiên đến khi tape-out (xuất bản thiết kế để đúc chip) chỉ mất 9 tháng. Thông thường, một ASIC high-performance mất 1,5-2 năm. Một phần tốc độ này đến từ việc OpenAI dùng chính model của mình để tối ưu hóa quá trình thiết kế - một vòng lặp tự cải thiện đáng chú ý: ChatGPT giúp làm ra phần cứng sẽ chạy ChatGPT.

5 con số cần nhớ về Jalapeño

9 tháng - thời gian từ thiết kế đến tape-out, được tuyên bố là chu kỳ ASIC high-performance nhanh nhất lịch sử
~840 mm² - kích thước compute chiplet ước tính, cực lớn so với chip inference thông thường, gần đến giới hạn vật lý của quy trình EUV
6 HBM3/4 - số module high-bandwidth memory bao quanh chiplet, đảm bảo low latency cho reasoning và agentic workloads
10 gigawatt - mục tiêu compute capacity bằng chip tự làm vào 2029, tương đương output của 10 lò phản ứng hạt nhân
~50% - mức tiết kiệm chi phí so với GPU thông thường theo CEO Broadcom Hock Tan (chưa có benchmark độc lập xác nhận)

Tại sao Nvidia nên lo - dù không phải ngay hôm nay

Jalapeño không đe dọa Nvidia bằng cách cạnh tranh trực tiếp trên thị trường mở - chip này không bán ra ngoài. Mối đe dọa nằm ở tầng sâu hơn: nó thay đổi động lực đàm phán và cấu trúc thị trường dài hạn.

Pricing power bị thách thức. Khi OpenAI có thể tự làm chip với chi phí thấp hơn đáng kể, họ có đòn bẩy mặc cả cứng hơn với Nvidia kể cả cho phần hardware vẫn cần mua. Nvidia không còn có thể định giá như thể không có lựa chọn nào khác.

Inference - thị trường lớn nhất - đang trượt khỏi tay Nvidia. Inference chiếm phần lớn chi phí compute AI trong dài hạn: training xảy ra một lần, inference xảy ra mỗi giây. Khi Google, Amazon, Microsoft, Meta và giờ là OpenAI đều chuyển inference sang ASIC nội bộ, thị phần inference của Nvidia sẽ co lại theo từng năm.

Broadcom hưởng lợi kép. Broadcom đang trở thành nhà thiết kế silicon phía sau toàn bộ ngành AI - từ Google TPU, Meta MTIA đến Jalapeño của OpenAI, và gần đây còn ký thỏa thuận lớn với Anthropic. Đây là đối thủ cấu trúc đáng ngại hơn AMD, vì Broadcom không cạnh tranh trực diện mà âm thầm ăn vào volume.

Thị trường phản ứng khá bình tĩnh: cổ phiếu Nvidia chỉ giảm nhẹ sau thông báo, trong khi Broadcom tăng ~2%. Các analyst lớn như Bernstein vẫn giữ rating Outperform cho cả hai cổ phiếu. Lý do họ đưa ra: demand AI chưa có dấu hiệu chững lại, và Nvidia vẫn là nhà cung cấp không thể thay thế trong training. Nhưng đó là nhìn ngắn hạn.

Đừng vội kết luận: những giới hạn cần biết

Trước khi tuyên bố đây là "kết thúc của Nvidia", cần nhìn rõ những gì Jalapeño không làm được và những ẩn số còn lại.

Chỉ inference, không training. Training model frontier vẫn cần H100/B200 của Nvidia - và OpenAI thẳng thắn thừa nhận điều này. CUDA ecosystem trong training quá sâu, quá rộng để bất kỳ ai thay thế trong vài năm tới. Đây là diversification ở rìa, không phải ly hôn.

Chưa có benchmark độc lập. Mọi con số hiện tại đến từ internal testing của OpenAI. "Substantially better performance-per-watt" là claim - chưa phải fact được xác minh bởi bên thứ ba. Báo cáo kỹ thuật đầy đủ được hứa hẹn sẽ công bố trong vài tháng tới. Vendor benchmarks lúc ra mắt luôn cần một mức độ hoài nghi nhất định.

9 tháng tape-out không bằng gigawatt-scale production. Làm ra engineering sample và sản xuất hàng loạt ở quy mô gigawatt là hai thứ hoàn toàn khác nhau. Supply chain từ TSMC, rủi ro địa chính trị, và độ phức tạp của rack deployment ở quy mô đó đều là ẩn số lớn cần thời gian chứng minh.

Jalapeño chỉ phục vụ nội bộ OpenAI - ít nhất là trong giai đoạn đầu. Không có thị trường bên ngoài, không có ecosystem phần mềm mở. Bất kỳ ai khác muốn inference hiệu quả vẫn phải quay lại mua GPU Nvidia hoặc tìm giải pháp riêng.

Kết: Không phải cuối game - chỉ là đầu game mới

Jalapeño là tín hiệu rõ nhất từ trước đến nay rằng kỷ nguyên "Nvidia độc quyền toàn stack AI" đang dần thay đổi. Không phải vì một công ty làm chip tốt hơn - mà vì toàn bộ những khách hàng lớn nhất của Nvidia đồng loạt quyết định không muốn phụ thuộc vào một nhà cung cấp duy nhất mãi nữa.

Viễn cảnh thực tế sắp tới không phải là "Nvidia sụp đổ". Mà là một thị trường phân mảnh hơn: Nvidia giữ training và phần inference cần flexibility lớn, còn ASIC nội bộ chiếm dần phần inference chuyên biệt ở scale khổng lồ. Trong thế giới đó, Nvidia vẫn rất lớn - nhưng margin sẽ không còn được bảo vệ bởi sự phụ thuộc như trước.

Câu hỏi thực sự không phải là "Jalapeño có đánh bại Nvidia không?" - mà là "Nvidia có thể tạo ra giá trị gì khác ngoài GPU performance và CUDA lock-in?" Đó là bài toán mà Jensen Huang sẽ phải trả lời trong vài năm tới.

via OpenAI