培训对象:算法工程师、计算机视觉研究人员、机器视觉工程师、需要将深度学习应用于工业视觉场景的技术人员。
培训目标:
掌握深度学习视觉任务的核心网络结构(CNN、ResNet、YOLO、U-Net),理解其设计原理与适用场景。
熟练使用PyTorch或TensorFlow框架进行数据集制作、模型训练、评估与优化。
掌握模型部署方法(TensorRT、ONNX),能够将训练好的模型部署到实际生产环境,实现工业缺陷检测等任务。
培训内容介绍:
深度学习环境搭建:安装PyTorch/TensorFlow框架,配置CUDA与cuDNN,使用GPU加速训练,熟悉Jupyter Notebook开发环境。
图像数据准备与增强:收集工业缺陷图像,使用标注工具(LabelImg、Labelme)进行标注,划分训练集/验证集/测试集,实现数据增强(翻转、旋转、缩放、色彩抖动)。
卷积神经网络基础:理解卷积层、池化层、全连接层、激活函数、批归一化的原理,构建简单的CNN分类网络。
经典分类网络:掌握ResNet、EfficientNet等经典分类网络的结构特点,使用预训练模型进行迁移学习,应对小样本工业场景。
目标检测基础:理解目标检测的核心思想,对比两阶段检测器(Faster R-CNN)与单阶段检测器(YOLO、SSD)的差异。
YOLOv8实战:使用YOLOv8框架训练目标检测模型,配置数据集文件,调整训练超参数,评估模型精度(mAP)。
语义分割基础:理解语义分割的任务定义,掌握全卷积网络(FCN)、U-Net的结构特点,适用于像素级缺陷分割。
U-Net实战:使用U-Net进行缺陷分割,准备分割数据集,训练模型,评估IoU(交并比)指标,可视化分割结果。
模型训练优化:掌握学习率调整策略、早停法、正则化技术,处理类别不平衡问题,提升模型泛化能力。
模型评估与调试:使用混淆矩阵、PR曲线、ROC曲线评估模型,分析错误案例,迭代优化数据集与模型。
模型部署(ONNX):将PyTorch/TensorFlow模型转换为ONNX格式,验证转换后的推理结果,实现跨平台部署。
模型部署(TensorRT):使用TensorRT对模型进行量化与优化,加速推理速度,满足工业实时性要求。