- Series MLOps for DevOps của techiescamp đã ra mắt 8 edition, viết riêng cho DevOps/Platform/SRE engineer - không cần background data science.
- GitHub repo đạt 359 stars và 162 forks với tech stack Kubernetes, Airflow, KServe, Kubeflow và Evidently AI.
- Mọi khái niệm ML được giải thích qua analogies DevOps quen thuộc.
- Code Apache 2.0 miễn phí, nội dung guides All Rights Reserved.
TL;DR

MLOps for DevOps Engineers là series thực hành mã nguồn mở của DevOpsCube (techiescamp) - đã có 8 edition, dành riêng cho DevOps, Platform và SRE engineer muốn mở rộng sang MLOps. Không cần background data science. Mọi thứ chạy trên Kubernetes và Docker quen thuộc.
Bài toán mà phần lớn DevOps đang gặp
Khi team ML bắt đầu triển khai mô hình lên production, DevOps engineer thường rơi vào tình huống khó xử: phải setup infrastructure cho một quy trình mình chưa hiểu rõ. Tại sao model cần retrain? Feature store là gì? Tại sao không thể monitor ML model giống ứng dụng thông thường?
Hầu hết tài nguyên MLOps trên thị trường viết cho data scientist học infrastructure. Series này làm ngược lại: viết cho infrastructure engineer học vừa đủ ML để vận hành hệ thống ML hiệu quả.
"MLOps không phải career switch. Đây là extension của DevOps." - DevOpsCube
Analogy dễ hiểu nhất: training một ML model giống như build CI/CD pipeline cho Java app. Nếu bạn không hiểu code Java được build như thế nào, bạn khó thiết kế được workflow đúng. Tương tự với ML - bạn không cần trở thành data scientist, nhưng cần hiểu ML workflow để infrastructure bạn dựng mới thực sự có ý nghĩa.
Bên trong 8 edition
Toàn bộ series xoay quanh một use case thực tế duy nhất: dự đoán attrition (nghỉ việc) của nhân viên trong tổ chức khoảng 500.000 người. Một bài toán, end-to-end, giữ focus vào infrastructure và operations - không phải data science theory.
Series chia thành 3 track lớn:
- Traditional ML: Train, serve, automate và monitor model thực tế trên Kubernetes
- Foundational Models: Serve LLM trong production với vLLM, TGI và Ollama
- LLM-Powered DevOps: Monitor K8s cluster, build RAG pipeline và AI agent với LLM
Các phase được phát triển theo thứ tự:
| Phase | Nội dung | Trạng thái |
|---|---|---|
| Phase 1 | Local Dev & Pipelines + K8s Deploy & Model Serving | Hoàn thành |
| Phase 2 | Enterprise Orchestration (DVC, Airflow, Feast, Kubeflow) | Đang phát triển |
| Phase 3+ | Monitor & Observe, Foundational Models, LLM-Powered DevOps | Đã lên kế hoạch |
Tech stack bạn sẽ làm việc cùng
Không có tool mới hay lạ - đây là điểm mạnh của series. Toàn bộ sử dụng công cụ mà DevOps engineer đã biết, kết hợp với MLOps tooling tiêu chuẩn:
| Category | Tools |
|---|---|
| Data Pipeline | Python, Airflow |
| Model Training | scikit-learn |
| API / Serving | FastAPI, Flask, Docker, KServe |
| ML Orchestration | Kubeflow, MLflow Pipelines |
| Monitoring | Prometheus, Grafana, Evidently AI |
| Infrastructure | Kubernetes, Helm, GitHub Actions |
Yêu cầu đầu vào: Kubernetes ở mức intermediate, working knowledge về AWS EKS, và Python cơ bản (đọc và chạy script là đủ). Không cần background ML.
Khác gì so với tài nguyên MLOps khác?
Điểm khác biệt lớn nhất là góc nhìn ngược. Thay vì dạy data scientist cách deploy model, series này dạy DevOps engineer cách vận hành hệ thống ML mà không cần trở thành data scientist.
GitHub repo hiện có 359 stars và 162 forks - cho thấy nhu cầu thực sự từ cộng đồng DevOps. Codebase gồm 74.9% Python, 11% HTML và 5.8% Shell scripting. Mỗi edition đi kèm working code trong repo để bạn follow và build theo thực tế.
Với tài nguyên MLOps truyền thống, bạn thường phải vượt qua nhiều lớp ML theory trước khi chạm được vào phần infrastructure. Series này bỏ qua tất cả những đó - bạn bắt tay vào code ngay từ edition đầu tiên, dùng tools quen thuộc, với context là một bài toán production thực tế.
Ai nên bắt đầu ngay?
Series phù hợp nếu bạn là:
- DevOps / Platform engineer đang hoặc sắp làm việc với ML team
- SRE cần monitor và vận hành ML workload trên Kubernetes
- Infrastructure engineer muốn hiểu MLOps để đóng góp hiệu quả hơn vào dự án AI
Nếu bạn đang quản lý Kubernetes cluster và thỉnh thoảng nghe data scientist nhờ "setup feature store" mà không biết bắt đầu từ đâu - đây là series dành cho bạn. Toàn bộ mã nguồn có thể fork và chạy theo, mỗi edition có hướng dẫn step-by-step.
Còn gì phía trước
Phase 2 đang tiếp tục với Kubeflow Explained for MLOps (coming next), tiếp theo là Hands-on Kubeflow trên Kubernetes và MLflow. Sau đó series sẽ mở rộng sang Foundational Models (vLLM, TGI, Ollama) và LLM-Powered DevOps - bao gồm monitor K8s cluster bằng LLM, build RAG pipeline và AI agent.
Series được dual-license: code (Apache 2.0) miễn phí hoàn toàn; nội dung guides All Rights Reserved. Commercial use: liên hệ contact@devopscube.com.
Nguồn: github.com/techiescamp/mlops-for-devops, devopscube.com/devops-to-mlops.
