基于改进DDPG算法的无人船自主避碰决策方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于改进DDPG算法的无人船自主避碰决策方法

引用本文：	关巍, 郝淑慧, 崔哲闻, 等. 基于改进DDPG算法的无人船自主避碰决策方法[J]. 中国舰船研究, 2025, 20(1): 172–180. DOI: 10.19693/j.issn.1673-3185.03929

作者姓名：	关巍郝淑慧崔哲闻王淼淼

作者单位：	大连海事大学航海学院,辽宁大连 116026

基金项目：	国家自然科学基金资助项目（51409033, 52171342）

摘要：	目的针对传统深度确定性策略梯度（DDPG）算法数据利用率低、收敛性差的特点,改进并提出一种新的无人船自主避碰决策方法。方法利用优先经验回放（PER）自适应调节经验优先级,降低样本的相关性,并利用长短期记忆（LSTM）网络提高算法的收敛性。基于船舶领域和《国际海上避碰规则》（COLREGs）,设置会遇情况判定模型和一组新定义的奖励函数,并考虑了紧迫危险以应对他船不遵守规则的情况。为验证所提方法的有效性,在两船和多船会遇局面下进行仿真实验。结果结果表明,改进的DDPG算法相比于传统DDPG算法在收敛速度上提升约28.8%,结论训练好的自主避碰模型可以使无人船在遵守COLREGs的同时实现自主决策和导航,为实现更加安全、高效的海上交通智能化决策提供参考。
关键词：	无人船深度确定性策略梯度算法自主避碰决策优先经验回放国际海上避碰规则避碰
收稿时间：	2024-05-14
修稿时间：	2024-08-11

	点击此处可从《中国舰船研究》浏览原始摘要信息
	点击此处可从《中国舰船研究》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏