改进深度确定性策略梯度的决策算法研究 Research on Improved Decision Algorithm of Deep Deterministic Policy Gradient期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

改进深度确定性策略梯度的决策算法研究

引用本文：	陈建文,张小俊,张明路.改进深度确定性策略梯度的决策算法研究[J].汽车实用技术,2022,47(1):28-31.

作者姓名：	陈建文张小俊张明路

作者单位：	河北工业大学机械工程学院,天津 300400

摘要：	为解决无人驾驶路径规划过程中的决策控制问题,文章针对深度确定性策略梯度算法在未知环境中随着搜索空间的增大,出现训练效率低、收敛不稳定等缺点,提出了基于奖励指导的改进算法。首先在每回合内采用基于奖励的优先级经验回放,减少深度确定性策略梯度算法随机探索的盲目性,提高智能车学习效率。然后在回合间基于奖励筛选优秀轨迹,便于指导智能车对复杂空间的探索,得到稳定的控制策略。最后,在开源智能驾驶仿真环境进行仿真。实验结果表明改进后的深度确定性策略梯度算法性能优于原来的算法,训练效率和收敛稳定性均得到有效提升。
关键词：	路径规划决策控制深度确定性策略梯度奖励指导优先经验回放
Research on Improved Decision Algorithm of Deep Deterministic Policy Gradient

Authors:	CHEN Jianwen ZHANG Xiaojun ZHANG Minglu

Institution:	(School of Mechanical Engineering,Hebei University of Technology,Tianjin 300400)

Abstract:

Keywords:	Path planning Decision control Deep deterministic policy gradient Reward guidance Prioritized experience replay
本文献已被维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏