希望系统掌握深度学习理论与应用的数据科学家、算法工程师
从事人工智能相关领域的软件开发人员、技术负责人
需要将深度学习技术应用于计算机视觉、自然语言处理等场景的研发人员
高校计算机、自动化、数学等专业的教师和高年级学生
具备机器学习基础、希望深入掌握深度学习技术的进阶学习者
通过本课程的系统学习,使学员全面掌握深度学习的核心原理与工程实践方法。学员将能够理解深度神经网络的基本结构、训练机制与优化技巧,熟练使用主流深度学习框架(PyTorch/TensorFlow)进行模型开发,掌握卷积神经网络、循环神经网络、Transformer、生成模型等主流架构的原理与应用,具备独立解决计算机视觉、自然语言处理等实际问题的能力,为从事人工智能研发工作或深造打下坚实基础。
深度学习概述与发展:介绍深度学习的历史演进,从感知机到深度神经网络的复兴,分析深度学习在图像识别、语音识别、自然语言处理等领域的突破性应用。讲解深度学习与机器学习的区别与联系,理解端到端学习的优势。介绍当前深度学习的前沿方向(大模型、多模态、生成式AI)及未来趋势,建立对深度学习生态的整体认知。
神经网络基础与反向传播算法:系统讲解神经元模型、激活函数(Sigmoid、Tanh、ReLU、Leaky ReLU)及其导数特性。学习多层感知机(MLP)的结构与表达能。深入剖析前向传播与反向传播算法的数学原理,通过计算图理解梯度流动。掌握损失函数的选择(均方误差、交叉熵)及其在分类/回归任务中的应用。
深度学习框架与开发环境:介绍主流深度学习框架(PyTorch、TensorFlow、Keras)的特点与选型原则。学习PyTorch的核心概念:张量(Tensor)、自动微分(Autograd)、计算图、Dataset与DataLoader。掌握使用PyTorch构建神经网络模型的完整流程:模型定义、损失函数配置、优化器选择、训练循环、模型保存与加载。通过简单分类任务演练框架使用技巧。
卷积神经网络(CNN)与计算机视觉:讲解卷积层的工作原理:卷积核、步长、填充、通道、感受野。掌握池化层的作用与常见类型(最大池化、平均池化)。深入剖析经典CNN架构:LeNet-5、AlexNet、VGGNet、GoogLeNet、ResNet的核心设计思想与演进逻辑。学习目标检测、图像分割的基础方法(如Faster R-CNN、U-Net)。通过图像分类任务实现CNN模型的构建与优化。
循环神经网络(RNN)与序列建模:介绍循环神经网络在时间序列、自然语言处理中的应用。学习RNN的基本结构、时间步展开、梯度消失与爆炸问题。深入讲解长短期记忆网络(LSTM)的门控机制:遗忘门、输入门、输出门,理解其如何解决长程依赖。掌握门控循环单元(GRU)的简化结构。通过文本生成或情感分析案例演练RNN应用。
Transformer与注意力机制:讲解注意力机制的思想起源:让模型关注输入中的重要部分。学习自注意力(Self-Attention)的计算过程:查询、键、值、注意力权重、缩放点积。深入剖析Transformer架构的核心组件:多头注意力、位置编码、前馈网络、层归一化、残差连接。了解BERT、GPT等预训练语言模型的基本原理。通过文本分类或机器翻译任务初步体验Transformer应用。
生成模型:GAN、VAE与扩散模型:介绍生成式模型的目标与分类。学习自编码器(Autoencoder)的基本结构:编码器-解码器、重构损失。深入讲解变分自编码器(VAE)的原理与重参数化技巧。掌握生成对抗网络(GAN)的核心思想:生成器与判别器的博弈训练,了解经典GAN变体(DCGAN、WGAN)。介绍扩散模型(Diffusion Models)的基本原理及其在图像生成中的优势。通过图像生成案例演练生成模型应用。
自监督学习与预训练模型:讲解自监督学习的核心思想:从数据本身构造监督信号。学习对比学习(Contrastive Learning)的代表方法:SimCLR、MoCo、CLIP的原理。掌握掩码语言建模(Masked Language Modeling)在BERT中的应用。了解大规模预训练模型(ResNet、BERT、ViT)的迁移学习方法:微调(Fine-tuning)、线性探测(Linear Probing)。通过预训练模型完成下游任务实战。
模型优化与训练技巧:系统学习深度学习训练的优化方法。掌握梯度下降变体:SGD、Momentum、AdaGrad、RMSProp、Adam及其参数配置。学习学习率调度策略:阶梯下降、余弦退火、预热。深入讲解正则化技术:L1/L2正则化、Dropout、Batch Normalization、Layer Normalization。掌握超参数调优方法:网格搜索、随机搜索、贝叶斯优化。通过实战案例分析过拟合、欠拟合的诊断与解决。
模型部署与加速:介绍深度学习模型从训练到部署的全流程。学习模型压缩技术:量化(Quantization)、剪枝(Pruning)、知识蒸馏(Knowledge Distillation)。掌握ONNX中间格式的转换与使用。学习推理引擎:TensorRT、OpenVINO、ONNX Runtime的配置与应用。了解在移动端、边缘设备上的部署方案(如TensorFlow Lite、PyTorch Mobile)。通过图像分类模型部署案例演练完整流程。
多模态学习与前沿拓展:介绍多模态学习的概念与应用场景(图文匹配、视频理解)。学习多模态表示学习的基本方法:联合嵌入、协同学习。深入剖析CLIP、Flamingo等典型多模态模型的架构。了解大语言模型(LLM)的关键技术:预训练、有监督微调(SFT)、基于人类反馈的强化学习(RLHF)。介绍科研智能体、具身智能等前沿应用方向。
综合项目实战:端到端深度学习应用开发:给定典型应用场景(如图像分类系统、文本情感分析、目标检测应用、生成式图像修复),学员综合运用所学知识完成从数据准备、模型设计、训练优化、模型评估到部署上线的完整深度学习项目流程。项目要求包含模型对比分析、性能优化、可视化展示等环节。最终进行项目展示与讨论,总结深度学习工程实践中的关键决策和问题解决经验,实现从理论到工程实践的全面提升