TL;DR

DevOps to MLOps - learning path overview với Phase 1 và Phase 2

MLOps for DevOps Engineers là series thực hành mã nguồn mở của DevOpsCube (techiescamp) - đã có 8 edition, dành riêng cho DevOps, Platform và SRE engineer muốn mở rộng sang MLOps. Không cần background data science. Mọi thứ chạy trên Kubernetes và Docker quen thuộc.

Bài toán mà phần lớn DevOps đang gặp

Khi team ML bắt đầu triển khai mô hình lên production, DevOps engineer thường rơi vào tình huống khó xử: phải setup infrastructure cho một quy trình mình chưa hiểu rõ. Tại sao model cần retrain? Feature store là gì? Tại sao không thể monitor ML model giống ứng dụng thông thường?

Hầu hết tài nguyên MLOps trên thị trường viết cho data scientist học infrastructure. Series này làm ngược lại: viết cho infrastructure engineer học vừa đủ ML để vận hành hệ thống ML hiệu quả.

"MLOps không phải career switch. Đây là extension của DevOps." - DevOpsCube

Analogy dễ hiểu nhất: training một ML model giống như build CI/CD pipeline cho Java app. Nếu bạn không hiểu code Java được build như thế nào, bạn khó thiết kế được workflow đúng. Tương tự với ML - bạn không cần trở thành data scientist, nhưng cần hiểu ML workflow để infrastructure bạn dựng mới thực sự có ý nghĩa.

Bên trong 8 edition

Toàn bộ series xoay quanh một use case thực tế duy nhất: dự đoán attrition (nghỉ việc) của nhân viên trong tổ chức khoảng 500.000 người. Một bài toán, end-to-end, giữ focus vào infrastructure và operations - không phải data science theory.

Series chia thành 3 track lớn:

  • Traditional ML: Train, serve, automate và monitor model thực tế trên Kubernetes
  • Foundational Models: Serve LLM trong production với vLLM, TGI và Ollama
  • LLM-Powered DevOps: Monitor K8s cluster, build RAG pipeline và AI agent với LLM

Các phase được phát triển theo thứ tự:

PhaseNội dungTrạng thái
Phase 1Local Dev & Pipelines + K8s Deploy & Model ServingHoàn thành
Phase 2Enterprise Orchestration (DVC, Airflow, Feast, Kubeflow)Đang phát triển
Phase 3+Monitor & Observe, Foundational Models, LLM-Powered DevOpsĐã lên kế hoạch

Tech stack bạn sẽ làm việc cùng

Không có tool mới hay lạ - đây là điểm mạnh của series. Toàn bộ sử dụng công cụ mà DevOps engineer đã biết, kết hợp với MLOps tooling tiêu chuẩn:

CategoryTools
Data PipelinePython, Airflow
Model Trainingscikit-learn
API / ServingFastAPI, Flask, Docker, KServe
ML OrchestrationKubeflow, MLflow Pipelines
MonitoringPrometheus, Grafana, Evidently AI
InfrastructureKubernetes, Helm, GitHub Actions

Yêu cầu đầu vào: Kubernetes ở mức intermediate, working knowledge về AWS EKS, và Python cơ bản (đọc và chạy script là đủ). Không cần background ML.

Khác gì so với tài nguyên MLOps khác?

Điểm khác biệt lớn nhất là góc nhìn ngược. Thay vì dạy data scientist cách deploy model, series này dạy DevOps engineer cách vận hành hệ thống ML mà không cần trở thành data scientist.

GitHub repo hiện có 359 stars và 162 forks - cho thấy nhu cầu thực sự từ cộng đồng DevOps. Codebase gồm 74.9% Python, 11% HTML và 5.8% Shell scripting. Mỗi edition đi kèm working code trong repo để bạn follow và build theo thực tế.

Với tài nguyên MLOps truyền thống, bạn thường phải vượt qua nhiều lớp ML theory trước khi chạm được vào phần infrastructure. Series này bỏ qua tất cả những đó - bạn bắt tay vào code ngay từ edition đầu tiên, dùng tools quen thuộc, với context là một bài toán production thực tế.

Ai nên bắt đầu ngay?

Series phù hợp nếu bạn là:

  • DevOps / Platform engineer đang hoặc sắp làm việc với ML team
  • SRE cần monitor và vận hành ML workload trên Kubernetes
  • Infrastructure engineer muốn hiểu MLOps để đóng góp hiệu quả hơn vào dự án AI

Nếu bạn đang quản lý Kubernetes cluster và thỉnh thoảng nghe data scientist nhờ "setup feature store" mà không biết bắt đầu từ đâu - đây là series dành cho bạn. Toàn bộ mã nguồn có thể fork và chạy theo, mỗi edition có hướng dẫn step-by-step.

Còn gì phía trước

Phase 2 đang tiếp tục với Kubeflow Explained for MLOps (coming next), tiếp theo là Hands-on Kubeflow trên Kubernetes và MLflow. Sau đó series sẽ mở rộng sang Foundational Models (vLLM, TGI, Ollama) và LLM-Powered DevOps - bao gồm monitor K8s cluster bằng LLM, build RAG pipeline và AI agent.

Series được dual-license: code (Apache 2.0) miễn phí hoàn toàn; nội dung guides All Rights Reserved. Commercial use: liên hệ contact@devopscube.com.

Nguồn: github.com/techiescamp/mlops-for-devops, devopscube.com/devops-to-mlops.