体系定位:本课程是计算机视觉工程师的核心能力矩阵,面向具备线性代数与编程基础的图像处理入门开发者、计算机视觉算法工程师、人工智能应用研究员及三维视觉技术专家。课程完整覆盖从图像信号处理→特征提取→传统视觉→深度学习视觉→三维视觉的技术演进路径,每个技术模块均绑定主流工业级/开源软件工具,帮助学员建立从算法原理到工程落地的完整能力闭环。学员可根据自身技术方向与职业目标,自主选修任一专题,各专题独立成章。
培训目标:帮助学员建立数字图像的数学表示体系,理解图像从连续信号到离散数字的转换本质,掌握颜色模型、直方图、质量评价、频域分析等核心理论基础,并熟练使用主流图像处理工具库完成基础开发。
|
模块 |
主要培训内容 |
软件工具 |
|
图像数字化 |
采样与量化、空间/灰度分辨率、图像文件格式、色彩深度与色域 |
OpenCV、PIL/Pillow、scikit-image |
|
颜色模型 |
RGB/CMYK/HSV/CIE Lab/YUV色彩空间、色彩空间转换、伽马校正 |
OpenCV、ColorMine、Halcon |
|
直方图分析 |
直方图计算与可视化、均衡化、匹配、CLAHE |
OpenCV、Matplotlib、ImageJ |
|
图像质量评价 |
MSE/PSNR、SSIM、VIF、无参考图像质量评价 |
scikit-image、IQA库、TID2008 |
|
傅里叶变换 |
连续/离散傅里叶变换、FFT、频谱可视化、幅值与相位 |
NumPy、OpenCV、SciPy |
|
频域分析基础 |
低通/高通/带通/带阻滤波器频域设计、卷积定理 |
OpenCV、SciPy、MATLAB |
|
工程实践 |
图像读写与显示、色彩空间转换、直方图均衡化实现 |
OpenCV + Python/C++ |
前置要求:高等数学、线性代数、Python/C++编程基础
培训目标:使学员系统掌握改善图像视觉质量与恢复退化图像的核心方法,理解空间域与频域滤波的统一框架,并熟练使用专业图像处理软件完成各类增强与复原任务。
|
模块 |
主要培训内容 |
软件工具 |
|
点运算增强 |
灰度变换、对比度拉伸、灰度切片、位平面分解 |
OpenCV、scikit-image、Halcon |
|
空间域滤波 |
平滑滤波(均值/高斯/中值)、锐化滤波(拉普拉斯/梯度) |
OpenCV、SciPy、Halcon |
|
频域滤波 |
理想/巴特沃斯/高斯低通/高通滤波、同态滤波、陷波滤波 |
OpenCV、SciPy、NI Vision |
|
噪声建模 |
高斯/椒盐/泊松/乘性噪声、噪声参数估计 |
OpenCV、NumPy、ImageJ |
|
去噪算法 |
均值/中值/自适应滤波、NLM、双边滤波、BM3D |
OpenCV、scikit-image、BM3D库 |
|
图像复原 |
退化模型、逆滤波、维纳滤波、约束最小二乘、盲去卷积 |
OpenCV、MATLAB、Halcon |
|
超分辨率 |
插值方法、重建超分、学习超分基础 |
OpenCV、SRGAN、ESPCN |
|
工程实践 |
实时图像增强管线设计、噪声仿真与去噪评估 |
OpenCV + Halcon |
前置要求:专题一或具备同等图像处理基础
培训目标:使学员深入理解将图像划分为有意义的区域或对象的数学方法与算法体系,掌握从经典阈值分割到现代主动轮廓模型的完整技术脉络,并熟练使用专业分割工具解决工业/医学场景问题。
|
模块 |
主要培训内容 |
软件工具 |
|
阈值分割 |
全局阈值(Otsu/熵方法)、局部自适应阈值、多阈值分割 |
OpenCV、scikit-image、Halcon |
|
边缘检测 |
Roberts/Sobel/Prewitt、Laplacian、Canny、亚像素边缘 |
OpenCV、Halcon、Matrox |
|
区域生长与分裂合并 |
种子点选择、生长准则、区域合并与分裂 |
OpenCV、ITK、3D Slicer |
|
分水岭算法 |
距离变换、形态学分水岭、标记控制分水岭 |
OpenCV、scikit-image、CellProfiler |
|
活动轮廓模型 |
参数活动轮廓(Snake)、几何活动轮廓(水平集) |
OpenCV、ITK-SNAP、Seg3D |
|
图割分割 |
能量函数建模、图割优化框架、GrabCut |
OpenCV、max-flow/min-cut库 |
|
超像素分割 |
SLIC算法、SEEDS算法、超像素应用 |
OpenCV、scikit-image、VLFeat |
|
工程实践 |
医学图像分割系统、工业缺陷检测分割应用 |
OpenCV + Halcon + ITK |
前置要求:专题一或具备同等图像处理基础
培训目标:使学员系统掌握从图像中提取稳定、可重复、具有判别力的局部特征的核心算法,理解特征描述子的数学本质与设计哲学,并熟练使用主流特征库解决图像匹配、目标识别、三维重建等任务。
|
模块 |
主要培训内容 |
软件工具 |
|
角点检测 |
Harris角点、Shi-Tomasi角点、亚像素角点定位 |
OpenCV、VLFeat、Halcon |
|
尺度空间理论 |
高斯尺度空间、LoG/DoG近似、特征尺度选择 |
OpenCV、scikit-image、VLFeat |
|
局部特征描述 |
SIFT、SURF、ORB、BRISK、FREAK、AKAZE |
OpenCV、VLFeat、COLMAP |
|
梯度直方图特征 |
HOG特征、块归一化、DPM模型 |
OpenCV、dlib、scikit-image |
|
纹理特征 |
LBP及其变体、灰度共生矩阵、Gabor滤波器 |
OpenCV、scikit-image、Mahotas |
|
形状描述子 |
傅里叶描述子、Hu矩/Zernike矩、形状上下文 |
OpenCV、scikit-image、PCL |
|
特征匹配 |
暴力匹配、FLANN、比率测试、交叉验证、RANSAC |
OpenCV、PCL、COLMAP |
|
工程实践 |
图像检索系统、全景拼接、三维重建特征管线 |
OpenCV + COLMAP + PCL |
前置要求:专题一、线性代数、概率论基础
培训目标:使学员深入理解图像数据压缩的数学原理与工程标准,掌握从熵编码到变换编码的完整压缩技术栈,并熟练使用主流编解码库进行图像压缩应用开发。
|
模块 |
主要培训内容 |
软件工具 |
|
信息熵与编码基础 |
信息熵、条件熵、冗余度、平均码长 |
Python信息论库 |
|
熵编码 |
霍夫曼编码、算术编码、自适应编码 |
自定义实现、JPEG库 |
|
预测编码 |
DPCM原理、最佳线性预测、无损/有损预测编码 |
OpenCV、PNG库 |
|
变换编码 |
KL变换、DCT变换、小波变换 |
OpenCV、NumPy、PyWavelets |
|
JPEG标准 |
色彩空间转换、分块DCT、量化表、Zig-Zag扫描 |
libjpeg、OpenCV、PIL |
|
JPEG2000 |
小波变换、EBCOT、率失真优化、渐进传输 |
OpenJPEG、Kakadu |
|
HEVC与VVC |
帧内/帧间预测、变换单元、编码树单元 |
x265、VVC参考软件 |
|
工程实践 |
压缩质量与码率权衡分析、移动端图像压缩 |
libjpeg-turbo + x265 |
前置要求:专题一、概率论与数理统计
培训目标:使学员系统掌握从传统机器学习到深度学习的目标检测算法演进脉络,理解两阶段与单阶段检测器的设计哲学与工程实现差异,具备使用主流检测框架完成工业级目标检测任务的模型训练、优化与部署能力。
|
模块 |
主要培训内容 |
软件工具 |
|
传统目标检测 |
滑动窗口、Haar+AdaBoost、HOG+SVM |
OpenCV、scikit-learn、dlib |
|
深度学习检测基础 |
边界框表示、IoU、NMS、锚框设计 |
PyTorch、TensorFlow、MMDetection |
|
两阶段检测器 |
Faster R-CNN、RPN、RoI Align、Mask R-CNN |
Detectron2、MMDetection、Torchvision |
|
单阶段检测器 |
YOLO系列、SSD、RetinaNet、Focal Loss |
YOLOv5/v8、MMDetection、Ultralytics |
|
无锚框检测器 |
FCOS、CenterNet、CornerNet |
MMDetection、CenterNet实现 |
|
检测模型优化 |
数据增强、难例挖掘、多尺度训练、剪枝量化 |
Albumentations、MMDetection、TensorRT |
|
多目标跟踪 |
SORT、DeepSORT、BoT-SORT |
OpenCV、DeepSORT实现、BoxMOT |
|
工程实践 |
工业质检检测系统、移动端检测部署 |
YOLOv8 + TensorRT + ONNX |
前置要求:专题四、深度学习框架基础(PyTorch/TensorFlow)
培训目标:使学员深入理解图像像素级分类与个体实例分割的核心算法体系,掌握全卷积网络、编解码架构、注意力机制在分割任务中的应用,具备使用主流分割框架解决医学影像、自动驾驶、遥感图像等复杂分割问题的能力。
|
模块 |
主要培训内容 |
软件工具 |
|
语义分割基础 |
全卷积网络、反卷积与上采样、跳跃连接 |
PyTorch、MMSegmentation、segmentation_models |
|
编解码架构 |
U-Net、特征融合、深度监督、3D U-Net |
MONAI、nnUNet、PyTorch |
|
多尺度与上下文 |
DeepLab系列、空洞卷积、ASPP、PSPNet |
MMSegmentation、PyTorch |
|
注意力机制 |
SENet、CBAM、Non-local、TransUNet |
PyTorch、SegFormer |
|
实例分割 |
Mask R-CNN、SOLO、YOLACT |
Detectron2、MMDetection |
|
实时分割 |
ICNet、BiSeNet、SwiftNet |
MMSegmentation、TensorRT |
|
全景分割 |
Panoptic FPN、UPSNet |
Detectron2、MMDetection |
|
工程实践 |
医学图像分割系统、自动驾驶道路分割 |
MONAI + nnUNet + PyTorch |
前置要求:专题六或具备同等目标检测基础
培训目标:使学员系统掌握从二维图像恢复三维结构的核心算法体系,理解立体视觉、运动恢复结构、多视图几何的数学原理与工程实现,掌握神经辐射场等前沿三维重建技术,并熟练使用主流三维视觉软件工具构建完整三维重建系统。
|
模块 |
主要培训内容 |
软件工具 |
|
立体匹配 |
对极几何、本征/基础矩阵、立体校正、视差计算 |
OpenCV、Halcon、MATLAB |
|
结构光与深度传感 |
编码结构光、相位测量、ToF原理 |
OpenCV、Halcon、Intel RealSense SDK |
|
运动恢复结构 |
特征跟踪、本质矩阵分解、三角化、PnP、光束法平差 |
COLMAP、OpenMVG、Theia |
|
多视图几何 |
射影几何、张量、多视图重建流程 |
COLMAP、Meshroom、RealityCapture |
|
点云处理 |
滤波/下采样、法向量估计、ICP配准、分割分类 |
PCL、Open3D、CloudCompare |
|
表面重建 |
泊松重建、移动立方体、Delaunay三角化、纹理映射 |
Open3D、MeshLab、PCL |
|
神经辐射场 |
体积密度与颜色场、位置编码、体渲染、NeRF优化 |
NeRF-PyTorch、Instant-NGP、Nerfstudio |
|
3D重建前沿 |
3D高斯泼溅、神经点云、SDF表示、生成式重建 |
3D高斯泼溅、Kaolin、PyTorch3D |
|
工程实践 |
多视图三维重建管线、数字孪生场景重建 |
COLMAP + Open3D + Nerfstudio |
前置要求:专题四、线性代数、多视图几何基础
|
学员角色 |
建议选修专题 |
核心软件工具链 |
学习目标 |
|
图像处理入门/转型工程师 |
专题一 + 专题二 |
OpenCV + scikit-image |
建立数字图像处理完整认知,掌握增强与复原基础能力 |
|
计算机视觉算法工程师 |
专题四 + 专题六 + 专题七 |
OpenCV + PyTorch + MMDetection/MMSegmentation |
精通特征提取与深度学习视觉,具备目标检测/分割项目经验 |
|
工业视觉/质检工程师 |
专题三 + 专题六 |
Halcon + OpenCV + YOLO |
掌握图像分割与缺陷检测算法,解决工业场景实际问题 |
|
三维视觉/重建工程师 |
专题四 + 专题八 |
COLMAP + Open3D + PCL + Nerfstudio |
精通三维重建与视觉几何,具备多视图/SfM/NeRF工程能力 |
|
视频编码/图像压缩工程师 |
专题五 |
libjpeg-turbo + x265 + OpenJPEG |
掌握图像压缩核心标准与算法,优化带宽与存储效率 |
|
自动驾驶感知工程师 |
专题六 + 专题七 + 专题八 |
YOLO + MMSegmentation + Open3D |
贯通目标检测、分割、三维视觉全栈感知能力 |
|
医学影像分析工程师 |
专题三 + 专题七 |
ITK + MONAI + nnUNet |
掌握医学图像分割与特征提取,解决临床辅助诊断问题 |
|
计算机视觉研究员 |
全八专题 |
OpenCV + PyTorch + COLMAP + NeRF |
建立从像素到三维理解的完整知识体系,具备前沿算法创新能力 |