基于双估计强化学习结合前向预测控制的自动驾驶运动控制研究 |
| |
引用本文: | 杜国栋,邹渊,张旭东,孙文景,孙巍.基于双估计强化学习结合前向预测控制的自动驾驶运动控制研究[J].汽车工程,2024(4):564-576. |
| |
作者姓名: | 杜国栋 邹渊 张旭东 孙文景 孙巍 |
| |
作者单位: | 1. 北京理工大学机械与车辆学院;2. 苏黎世联邦理工大学动态系统与控制系 |
| |
基金项目: | 国家重点研发计划项目(2021YFB2500900)资助; |
| |
摘 要: | 运动控制研究是实现自动驾驶目标的重要组成部分,针对传统强化学习算法在求解中因单步决策局限而导致控制序列次优的问题,提出了一种基于双估计强化学习算法及前向预测控制方法结合的运动控制框架(DEQL-FPC)。在该框架中引入双估计器以解决传统强化学习方法动作值过估计问题并提高训练优化的速度,设计前向预测多步决策方法替代传统强化学习的单步决策,以有效提高全局控制策略的性能。通过虚拟驾驶环境仿真,证明了该控制框架应用在自动驾驶汽车的路径跟踪以及安全避障的优越性,保证了运动控制中的精确性、安全性、快速性以及舒适性。
|
关 键 词: | 自动驾驶汽车 运动控制优化 双估计强化学习算法 前向预测控制方法 |
|