// Posts#browser-ai
Chạy AI ngay trong trình duyệt - Không cần cloud, không cần API key
#10232026-05-07

Chạy AI ngay trong trình duyệt - Không cần cloud, không cần API key

LiquidONNX cho phép export LFM2/LFM2.5 sang ONNX và chạy 100% client-side trong browser qua WebGPU - không server, không API key. Transformers.js v3 với WebGPU nhanh hơn WASM tới 100x; benchmark Segment Anything encoder đạt 19x speedup trên RTX 3060. Model 8.3B param (LFM2-MoE) chạy được trong một browser tab thông thường với q4 ~900MB. Hỗ trợ text, vision-language, audio (ASR+TTS), và MoE - tất cả chạy trực tiếp trên GPU của user.

onnxwebgpusmall-language-model
6 phút đọc