改进深度确定性策略梯度的决策算法研究 |
| |
引用本文: | 陈建文,张小俊,张明路.改进深度确定性策略梯度的决策算法研究[J].汽车实用技术,2022,47(1):28-31. |
| |
作者姓名: | 陈建文 张小俊 张明路 |
| |
作者单位: | 河北工业大学 机械工程学院,天津 300400 |
| |
摘 要: | 为解决无人驾驶路径规划过程中的决策控制问题,文章针对深度确定性策略梯度算法在未知环境中随着搜索空间的增大,出现训练效率低、收敛不稳定等缺点,提出了基于奖励指导的改进算法。首先在每回合内采用基于奖励的优先级经验回放,减少深度确定性策略梯度算法随机探索的盲目性,提高智能车学习效率。然后在回合间基于奖励筛选优秀轨迹,便于指导智能车对复杂空间的探索,得到稳定的控制策略。最后,在开源智能驾驶仿真环境进行仿真。实验结果表明改进后的深度确定性策略梯度算法性能优于原来的算法,训练效率和收敛稳定性均得到有效提升。
|
关 键 词: | 路径规划 决策控制 深度确定性策略梯度 奖励指导 优先经验回放 |
Research on Improved Decision Algorithm of Deep Deterministic Policy Gradient |
| |
Authors: | CHEN Jianwen ZHANG Xiaojun ZHANG Minglu |
| |
Institution: | (School of Mechanical Engineering,Hebei University of Technology,Tianjin 300400) |
| |
Abstract: | |
| |
Keywords: | Path planning Decision control Deep deterministic policy gradient Reward guidance Prioritized experience replay |
本文献已被 维普 万方数据 等数据库收录! |
|