自动驾驶决策规划算法工程师、ADAS系统开发人员、人工智能算法工程师、智能车辆研究人员。
理解自动驾驶决策规划的分层架构(全局路径规划、行为决策、运动规划)。
掌握基于规则与基于学习的决策方法(状态机、决策树、强化学习)。
能够独立开发基于AI的决策规划算法,实现车辆在复杂场景下的决策与规划。
自动驾驶决策规划概述:决策规划在自动驾驶系统中的位置(感知→决策→规划→控制);决策规划的分层结构(任务规划、行为决策、运动规划);典型场景下的决策挑战(交叉路口、匝道汇入、无保护左转)。
全局路径规划:基于图搜索的路径规划(Dijkstra、A、D);基于采样的规划(RRT、PRM);车道级路径规划(考虑车道线、交通规则);路径的平滑与优化。
行为决策基础:行为决策的任务(车道保持、换道、超车、跟车、停车);基于有限状态机(FSM)的决策;状态机的设计(状态、事件、转移);层次化状态机。
基于规则的决策:规则的来源(交通法规、驾驶经验);规则库的构建;冲突解决机制(优先级);规则的局限性(复杂场景、长尾问题)。
基于学习的决策(一):监督学习:用人类驾驶数据训练决策模型;行为克隆(模仿学习);输入特征(感知信息、自车状态);输出(离散动作、连续动作);数据集的构建与标注。
基于学习的决策(二):深度强化学习:强化学习的基本概念(智能体、状态、动作、奖励、策略);马尔可夫决策过程(MDP);深度Q网络(DQN);策略梯度方法(PPO、DDPG);多智能体强化学习。
运动规划基础:路径规划与轨迹规划的区别;轨迹的表示(多项式曲线、样条曲线);轨迹的约束(动力学约束、运动学约束、避障约束、舒适性约束)。
基于优化的运动规划:目标函数的设计(平滑性、效率、安全性);约束条件的建模;优化求解方法(二次规划QP、非线性优化);常用求解器(OSQP、IPOPT)。
基于采样的运动规划:快速扩展随机树(RRT*);概率路线图(PRM);采样效率的优化;轨迹的剪枝与优化。
决策与规划的耦合:行为决策对轨迹规划的指导(目标车道、目标速度);轨迹规划对决策的反馈(可行性验证);决策与规划的协同优化。
交互式决策:考虑其他交通参与者反应的决策;博弈论在决策中的应用(纳什均衡、Stackelberg博弈);社会力模型;不确定性处理(部分可观测马尔可夫决策过程POMDP)。
综合实战项目:基于AI的自动驾驶决策规划算法开发(如高速公路匝道汇入、无保护左转),包含场景定义、行为决策模型(规则/强化学习)、运动规划实现、仿真环境验证与结果分析。