曙海培训-MLOps（模型部署与监控）培训课程-曙海培训中心,全国连锁

MLOps（模型部署与监控）培训课程

【培训对象】
机器学习工程师、数据科学家、DevOps工程师，以及希望将机器学习模型高效、稳定地部署到生产环境的技术团队。
【培训目标】
一、理解MLOps的核心概念和挑战，掌握构建机器学习持续集成与持续交付（CI/CD）流水线的方法。
二、熟练使用主流MLOps工具和平台（如Kubeflow, MLflow, Airflow等）实现模型的版本管理、部署和监控。
三、具备将模型部署为高可用、可扩展的在线推理服务或离线批处理作业的能力。
四、建立模型监控和漂移检测机制，实现对生产环境模型的全生命周期管理。
【培训内容介绍】
一、 MLOps简介与价值：从ML实验到生产落地的挑战，MLOps的核心原则。
二、 ML项目开发环境标准化：使用Docker和Conda等工具保证环境一致性。
三、实验跟踪与模型版本管理：使用MLflow、Weights & Biases等工具记录参数、指标和模型产物。
四、 ML流水线构建：使用Kubeflow Pipelines、Apache Airflow编排数据准备、训练、评估等步骤。
五、模型持续集成（CI）与持续交付（CD）：在代码仓库中管理模型和代码，自动化触发构建和测试。
六、模型部署策略：在线服务（REST/gRPC API）、批处理、边缘计算部署。
七、模型服务框架：使用TensorFlow Serving、TorchServe、ONNX Runtime等部署高性能模型服务。
八、 A/B测试与金丝雀发布：在生产环境中安全地测试新模型。
九、模型监控：监控模型预测性能（延迟、吞吐量）和预测质量（准确性、数据漂移）。
十、模型漂移检测与触发重训练：检测概念漂移和数据漂移，并自动触发模型重训练流水线。
十一、 MLOps平台与工具链：Kubeflow、Seldon Core、BentoML等开源MLOps平台的对比与实践。
十二、实战演练：构建一个完整的MLOps流水线，涵盖从代码提交到模型部署、监控的全过程。

MLOps（模型部署与监控）培训课程-曙海培训中心

培训班介绍