#9372026-05-07
Stanford CS336: Bài giảng giải mã toàn bộ kiến trúc LLM mainstream trong 3 năm qua
Stanford CS336 Spring 2026 Lecture 3 là bài giảng miễn phí của GS Tatsu Hashimoto phân tích 19+ mô hình LLM từ 2017-2025 - từ GPT đến LLaMA 4, DeepSeek V3, Gemma 3. Kết luận chính: phần lớn LLM hiện đại hội tụ về cùng tập thiết kế - Pre-norm, RMS Norm, SwiGLU, RoPE, GQA. Llama 4 đạt context 10 triệu token; DeepSeek V3 dùng MLA để nén KV cache - hai ngoại lệ nổi bật trong xu hướng chung. Toàn bộ course CS336 miễn phí trên YouTube.