曙海培训-数字图像处理与计算机视觉培训课程体系（选修）-曙海培训中心,全国连锁

数字图像处理与计算机视觉培训课程体系（选修）

（含软件工具）

体系定位：本课程是计算机视觉工程师的核心能力矩阵，面向具备线性代数与编程基础的图像处理入门开发者、计算机视觉算法工程师、人工智能应用研究员及三维视觉技术专家。课程完整覆盖从图像信号处理→特征提取→传统视觉→深度学习视觉→三维视觉的技术演进路径，每个技术模块均绑定主流工业级/开源软件工具，帮助学员建立从算法原理到工程落地的完整能力闭环。学员可根据自身技术方向与职业目标，自主选修任一专题，各专题独立成章。

专题一：图像处理基础与数学工具

培训目标：帮助学员建立数字图像的数学表示体系，理解图像从连续信号到离散数字的转换本质，掌握颜色模型、直方图、质量评价、频域分析等核心理论基础，并熟练使用主流图像处理工具库完成基础开发。

模块	主要培训内容	软件工具
图像数字化	采样与量化、空间/灰度分辨率、图像文件格式、色彩深度与色域	OpenCV、PIL/Pillow、scikit-image
颜色模型	RGB/CMYK/HSV/CIE Lab/YUV色彩空间、色彩空间转换、伽马校正	OpenCV、ColorMine、Halcon
直方图分析	直方图计算与可视化、均衡化、匹配、CLAHE	OpenCV、Matplotlib、ImageJ
图像质量评价	MSE/PSNR、SSIM、VIF、无参考图像质量评价	scikit-image、IQA库、TID2008
傅里叶变换	连续/离散傅里叶变换、FFT、频谱可视化、幅值与相位	NumPy、OpenCV、SciPy
频域分析基础	低通/高通/带通/带阻滤波器频域设计、卷积定理	OpenCV、SciPy、MATLAB
工程实践	图像读写与显示、色彩空间转换、直方图均衡化实现	OpenCV + Python/C++

前置要求：高等数学、线性代数、Python/C++编程基础

专题二：图像增强与复原

培训目标：使学员系统掌握改善图像视觉质量与恢复退化图像的核心方法，理解空间域与频域滤波的统一框架，并熟练使用专业图像处理软件完成各类增强与复原任务。

模块	主要培训内容	软件工具
点运算增强	灰度变换、对比度拉伸、灰度切片、位平面分解	OpenCV、scikit-image、Halcon
空间域滤波	平滑滤波（均值/高斯/中值）、锐化滤波（拉普拉斯/梯度）	OpenCV、SciPy、Halcon
频域滤波	理想/巴特沃斯/高斯低通/高通滤波、同态滤波、陷波滤波	OpenCV、SciPy、NI Vision
噪声建模	高斯/椒盐/泊松/乘性噪声、噪声参数估计	OpenCV、NumPy、ImageJ
去噪算法	均值/中值/自适应滤波、NLM、双边滤波、BM3D	OpenCV、scikit-image、BM3D库
图像复原	退化模型、逆滤波、维纳滤波、约束最小二乘、盲去卷积	OpenCV、MATLAB、Halcon
超分辨率	插值方法、重建超分、学习超分基础	OpenCV、SRGAN、ESPCN
工程实践	实时图像增强管线设计、噪声仿真与去噪评估	OpenCV + Halcon

前置要求：专题一或具备同等图像处理基础

专题三：图像分割技术

培训目标：使学员深入理解将图像划分为有意义的区域或对象的数学方法与算法体系，掌握从经典阈值分割到现代主动轮廓模型的完整技术脉络，并熟练使用专业分割工具解决工业/医学场景问题。

模块	主要培训内容	软件工具
阈值分割	全局阈值（Otsu/熵方法）、局部自适应阈值、多阈值分割	OpenCV、scikit-image、Halcon
边缘检测	Roberts/Sobel/Prewitt、Laplacian、Canny、亚像素边缘	OpenCV、Halcon、Matrox
区域生长与分裂合并	种子点选择、生长准则、区域合并与分裂	OpenCV、ITK、3D Slicer
分水岭算法	距离变换、形态学分水岭、标记控制分水岭	OpenCV、scikit-image、CellProfiler
活动轮廓模型	参数活动轮廓（Snake）、几何活动轮廓（水平集）	OpenCV、ITK-SNAP、Seg3D
图割分割	能量函数建模、图割优化框架、GrabCut	OpenCV、max-flow/min-cut库
超像素分割	SLIC算法、SEEDS算法、超像素应用	OpenCV、scikit-image、VLFeat
工程实践	医学图像分割系统、工业缺陷检测分割应用	OpenCV + Halcon + ITK

前置要求：专题一或具备同等图像处理基础

专题四：特征提取与描述

培训目标：使学员系统掌握从图像中提取稳定、可重复、具有判别力的局部特征的核心算法，理解特征描述子的数学本质与设计哲学，并熟练使用主流特征库解决图像匹配、目标识别、三维重建等任务。

模块	主要培训内容	软件工具
角点检测	Harris角点、Shi-Tomasi角点、亚像素角点定位	OpenCV、VLFeat、Halcon
尺度空间理论	高斯尺度空间、LoG/DoG近似、特征尺度选择	OpenCV、scikit-image、VLFeat
局部特征描述	SIFT、SURF、ORB、BRISK、FREAK、AKAZE	OpenCV、VLFeat、COLMAP
梯度直方图特征	HOG特征、块归一化、DPM模型	OpenCV、dlib、scikit-image
纹理特征	LBP及其变体、灰度共生矩阵、Gabor滤波器	OpenCV、scikit-image、Mahotas
形状描述子	傅里叶描述子、Hu矩/Zernike矩、形状上下文	OpenCV、scikit-image、PCL
特征匹配	暴力匹配、FLANN、比率测试、交叉验证、RANSAC	OpenCV、PCL、COLMAP
工程实践	图像检索系统、全景拼接、三维重建特征管线	OpenCV + COLMAP + PCL

前置要求：专题一、线性代数、概率论基础

专题五：图像压缩与编码

培训目标：使学员深入理解图像数据压缩的数学原理与工程标准，掌握从熵编码到变换编码的完整压缩技术栈，并熟练使用主流编解码库进行图像压缩应用开发。

模块	主要培训内容	软件工具
信息熵与编码基础	信息熵、条件熵、冗余度、平均码长	Python信息论库
熵编码	霍夫曼编码、算术编码、自适应编码	自定义实现、JPEG库
预测编码	DPCM原理、最佳线性预测、无损/有损预测编码	OpenCV、PNG库
变换编码	KL变换、DCT变换、小波变换	OpenCV、NumPy、PyWavelets
JPEG标准	色彩空间转换、分块DCT、量化表、Zig-Zag扫描	libjpeg、OpenCV、PIL
JPEG2000	小波变换、EBCOT、率失真优化、渐进传输	OpenJPEG、Kakadu
HEVC与VVC	帧内/帧间预测、变换单元、编码树单元	x265、VVC参考软件
工程实践	压缩质量与码率权衡分析、移动端图像压缩	libjpeg-turbo + x265

前置要求：专题一、概率论与数理统计

专题六：目标检测与识别

培训目标：使学员系统掌握从传统机器学习到深度学习的目标检测算法演进脉络，理解两阶段与单阶段检测器的设计哲学与工程实现差异，具备使用主流检测框架完成工业级目标检测任务的模型训练、优化与部署能力。

模块	主要培训内容	软件工具
传统目标检测	滑动窗口、Haar+AdaBoost、HOG+SVM	OpenCV、scikit-learn、dlib
深度学习检测基础	边界框表示、IoU、NMS、锚框设计	PyTorch、TensorFlow、MMDetection
两阶段检测器	Faster R-CNN、RPN、RoI Align、Mask R-CNN	Detectron2、MMDetection、Torchvision
单阶段检测器	YOLO系列、SSD、RetinaNet、Focal Loss	YOLOv5/v8、MMDetection、Ultralytics
无锚框检测器	FCOS、CenterNet、CornerNet	MMDetection、CenterNet实现
检测模型优化	数据增强、难例挖掘、多尺度训练、剪枝量化	Albumentations、MMDetection、TensorRT
多目标跟踪	SORT、DeepSORT、BoT-SORT	OpenCV、DeepSORT实现、BoxMOT
工程实践	工业质检检测系统、移动端检测部署	YOLOv8 + TensorRT + ONNX

前置要求：专题四、深度学习框架基础（PyTorch/TensorFlow）

专题七：语义分割与实例分割

培训目标：使学员深入理解图像像素级分类与个体实例分割的核心算法体系，掌握全卷积网络、编解码架构、注意力机制在分割任务中的应用，具备使用主流分割框架解决医学影像、自动驾驶、遥感图像等复杂分割问题的能力。

模块	主要培训内容	软件工具
语义分割基础	全卷积网络、反卷积与上采样、跳跃连接	PyTorch、MMSegmentation、segmentation_models
编解码架构	U-Net、特征融合、深度监督、3D U-Net	MONAI、nnUNet、PyTorch
多尺度与上下文	DeepLab系列、空洞卷积、ASPP、PSPNet	MMSegmentation、PyTorch
注意力机制	SENet、CBAM、Non-local、TransUNet	PyTorch、SegFormer
实例分割	Mask R-CNN、SOLO、YOLACT	Detectron2、MMDetection
实时分割	ICNet、BiSeNet、SwiftNet	MMSegmentation、TensorRT
全景分割	Panoptic FPN、UPSNet	Detectron2、MMDetection
工程实践	医学图像分割系统、自动驾驶道路分割	MONAI + nnUNet + PyTorch

前置要求：专题六或具备同等目标检测基础

专题八：三维视觉与重建

培训目标：使学员系统掌握从二维图像恢复三维结构的核心算法体系，理解立体视觉、运动恢复结构、多视图几何的数学原理与工程实现，掌握神经辐射场等前沿三维重建技术，并熟练使用主流三维视觉软件工具构建完整三维重建系统。

模块	主要培训内容	软件工具
立体匹配	对极几何、本征/基础矩阵、立体校正、视差计算	OpenCV、Halcon、MATLAB
结构光与深度传感	编码结构光、相位测量、ToF原理	OpenCV、Halcon、Intel RealSense SDK
运动恢复结构	特征跟踪、本质矩阵分解、三角化、PnP、光束法平差	COLMAP、OpenMVG、Theia
多视图几何	射影几何、张量、多视图重建流程	COLMAP、Meshroom、RealityCapture
点云处理	滤波/下采样、法向量估计、ICP配准、分割分类	PCL、Open3D、CloudCompare
表面重建	泊松重建、移动立方体、Delaunay三角化、纹理映射	Open3D、MeshLab、PCL
神经辐射场	体积密度与颜色场、位置编码、体渲染、NeRF优化	NeRF-PyTorch、Instant-NGP、Nerfstudio
3D重建前沿	3D高斯泼溅、神经点云、SDF表示、生成式重建	3D高斯泼溅、Kaolin、PyTorch3D
工程实践	多视图三维重建管线、数字孪生场景重建	COLMAP + Open3D + Nerfstudio

前置要求：专题四、线性代数、多视图几何基础

选修建议与学习路径

学员角色	建议选修专题	核心软件工具链	学习目标
图像处理入门/转型工程师	专题一 + 专题二	OpenCV + scikit-image	建立数字图像处理完整认知，掌握增强与复原基础能力
计算机视觉算法工程师	专题四 + 专题六 + 专题七	OpenCV + PyTorch + MMDetection/MMSegmentation	精通特征提取与深度学习视觉，具备目标检测/分割项目经验
工业视觉/质检工程师	专题三 + 专题六	Halcon + OpenCV + YOLO	掌握图像分割与缺陷检测算法，解决工业场景实际问题
三维视觉/重建工程师	专题四 + 专题八	COLMAP + Open3D + PCL + Nerfstudio	精通三维重建与视觉几何，具备多视图/SfM/NeRF工程能力
视频编码/图像压缩工程师	专题五	libjpeg-turbo + x265 + OpenJPEG	掌握图像压缩核心标准与算法，优化带宽与存储效率
自动驾驶感知工程师	专题六 + 专题七 + 专题八	YOLO + MMSegmentation + Open3D	贯通目标检测、分割、三维视觉全栈感知能力
医学影像分析工程师	专题三 + 专题七	ITK + MONAI + nnUNet	掌握医学图像分割与特征提取，解决临床辅助诊断问题
计算机视觉研究员	全八专题	OpenCV + PyTorch + COLMAP + NeRF	建立从像素到三维理解的完整知识体系，具备前沿算法创新能力

数字图像处理与计算机视觉培训课程体系（选修）-曙海培训中心

培训班介绍