- Phần 2 của lộ trình AI Engineer 14 tuần miễn phí, bao gồm Deep Learning với Karpathy, LLM Engineering với RAG và quantization xuống 4-bit, AI Agents với Microsoft (62.600 stars) và Anthropic MCP, cùng cách deploy và đánh giá hệ thống AI production.
- mlabonne/llm-course (79.400 stars) là tài nguyên gần nhất với một LLM engineering curriculum open-source đầy đủ hiện có.
- Trong tuyển dụng AI hiện đại, GitHub thường quan trọng hơn CV - đây là lý do lộ trình này buộc bạn phải build và deploy thực sự.
TL;DR
Phần 1 đã bao phủ setup, AI fundamentals và ML foundations - nền tảng giúp bạn không bị lạc khi đến phần này. Phần 2 đi vào ba giai đoạn quyết định nhất: Deep Learning từ raw Python, LLM Engineering thực chiến với RAG và quantization, và AI Agents kết nối với thế giới thực. Kết thúc bằng deployment và xây dựng portfolio - phần mà 90% tutorial bỏ qua nhưng lại là thứ quyết định bạn có được nhận hay không.
Tuần 6-7 - Deep Learning: Karpathy cách không ai dạy
Đây là giai đoạn thay đổi cách bạn nghĩ về AI hoàn toàn.
Andrej Karpathy - "Neural Networks: Zero to Hero" vẫn là một trong những tài nguyên AI học tốt nhất từng được tạo ra. Thay vì ẩn sau framework, nó dạy neural network từ raw Python và toán học thuần: backpropagation, activations, tokenization, transformer, attention mechanism - mọi thứ đều trở nên hiểu được vì hệ thống được xây dựng từng mảnh một.
Prerequisites của Karpathy rất thực tế: Python vững chắc và khái niệm toán cơ bản ở mức trung học (đạo hàm, gaussian). Không cần bằng toán đại học.
Curriculum bao gồm:
Xây micrograd - implement backpropagation từ đầu (2h25m)
Xây makemore - bigram language model → MLP → WaveNet (nhiều phần)
Build GPT từ scratch theo paper "Attention is All You Need" (1h56m)
Build GPT Tokenizer với Byte Pair Encoding (2h13m)
Một mẹo cực kỳ hữu ích trong giai đoạn này: chạy local model song song với Ollama:
ollama run llama3Nhìn một LLM chạy local trong khi cùng lúc tự tay build transformer nhỏ hơn tạo ra cầu nối giữa lý thuyết và hệ thống AI thực tế mà hầu hết khóa học không bao giờ cung cấp được.
Tuần 8-10 - LLM Engineering: Từ RAG đến Quantization
Sau khi deep learning fundamentals đã rõ, lộ trình chuyển sang modern LLM engineering - nơi các khái niệm như RAG, fine-tuning, LoRA, QLoRA, quantization, vector databases và evaluation bắt đầu có nghĩa thực sự.
Tài nguyên chính: mlabonne/llm-course với 79.400 stars - gần nhất với một LLM engineering curriculum open-source đầy đủ hiện có trên thế giới. Đây là các kỹ thuật core cần nắm:
Quantization: chuyển đổi model weights từ 16-bit xuống 4-bit hoặc 8-bit để chạy trên consumer hardware (GPTQ, AWQ, GGUF với llama.cpp)
Fine-tuning với LoRA/QLoRA: điều chỉnh LLM cho use case cụ thể mà không cần full training từ đầu
RAG: Retrieval-Augmented Generation với vector databases
Evaluation: đánh giá chất lượng output LLM bằng DeepEval, RAGAS, LLM-as-a-Judge
Đồng thời, học prompt engineering trực tiếp từ các công ty đang build frontier models:
OpenAI Academy - prompt engineering theo cách engineering thực sự
Anthropic documentation - giải thích prompting như một kỷ luật kỹ thuật, không phải "magic words"

Project gợi ý ở giai đoạn này: build một RAG system trên notes cá nhân dùng ChromaDB hoặc LanceDB. Kết quả là một second brain có thể tìm kiếm được, chạy bằng local AI models và embeddings. Vừa học được kỹ thuật, vừa tạo ra thứ thực sự hữu ích cho bản thân.
Tuần 11-12 - AI Agents: Lĩnh vực đang thay đổi ngành nhanh nhất
AI agents là khu vực hiện đang thay đổi ngành nhanh nhất - và cũng là nơi hai GitHub repo từ Microsoft cực kỳ giá trị:
microsoft/ai-agents-for-beginners - 62.600 stars, 21.000 forks, 12+ bài học về tool use, orchestration, memory systems, workflows và multi-agent architectures
Anthropic MCP courses - Model Context Protocol đang nhanh chóng trở thành standard cách AI systems kết nối với tools, APIs và môi trường bên ngoài
Đây là giai đoạn các project trở nên thực sự ấn tượng:
Autonomous research agents tự động tìm kiếm và tổng hợp thông tin
Browser agents điều khiển trình duyệt
Workflow automations kết nối nhiều hệ thống
Local assistants với memory dài hạn
AI file systems biết ngữ cảnh
Tuần 13-14 - Deploy, Evaluation và Portfolio
Đây là phần mà hầu hết tutorial hoàn toàn bỏ qua - và cũng là phần quyết định bạn có được nhận vào vị trí AI engineer hay không.
Một AI system deploy mà không có evaluation về cơ bản là một cỗ máy hallucination đang chờ fail. Đó là lý do tại sao các công cụ như DeepEval, RAGAS và LLM-as-a-Judge quan trọng đến vậy - chúng cho phép đo lường chất lượng output một cách hệ thống trước khi hệ thống đến tay người dùng thực.
Deploy các project bằng:
Hugging Face Spaces - nhanh, miễn phí, cộng đồng lớn
Gradio - prototype UI cho ML models chỉ vài dòng code
Streamlit - web app đơn giản cho data science projects
Vercel - nếu muốn full web application
Mỗi project nghiêm túc cần có:
Evaluation metrics rõ ràng
Safety checks cho edge cases
Architecture diagram giải thích hệ thống
GitHub documentation đầy đủ
Public demo người khác có thể dùng thử
GitHub là CV mới trong tuyển dụng AI
Điều quan trọng nhất của toàn bộ lộ trình này: nó tránh được sai lầm lớn nhất mà beginner mắc phải - tiêu thụ vô tận mà không build.
Những người thực sự trở thành AI engineer không phải là những người bookmark 200 tutorial. Họ là những người mở terminal, làm vỡ hệ thống, fix lại, deploy project - và lặp lại quá trình đó cho đến khi mọi thứ thực sự có nghĩa.
Trong tuyển dụng AI hiện đại, GitHub thường quan trọng hơn CV. Một portfolio với 5-6 project được deploy, có documentation rõ ràng và evaluation metrics cụ thể sẽ nói lên nhiều hơn bất kỳ chứng chỉ nào.
Nền giáo dục AI tốt nhất trong lịch sử đang có sẵn miễn phí - câu hỏi duy nhất là ai sẵn sàng đi đủ sâu để tận dụng chúng.
Kết
Xem lại Phần 1 nếu chưa đọc để bắt đầu từ setup và AI fundamentals. Toàn bộ 14 tuần, miễn phí hoàn toàn - chỉ cần thời gian, kỷ luật và sẵn sàng build thực sự.
