基于改进DDPG算法的无人船自主避碰决策方法 |
| |
引用本文: | 关巍, 郝淑慧, 崔哲闻, 等. 基于改进DDPG算法的无人船自主避碰决策方法[J]. 中国舰船研究, 2025, 20(1): 172–180. DOI: 10.19693/j.issn.1673-3185.03929 |
| |
作者姓名: | 关巍 郝淑慧 崔哲闻 王淼淼 |
| |
作者单位: | 大连海事大学 航海学院,辽宁 大连 116026 |
| |
基金项目: | 国家自然科学基金资助项目(51409033, 52171342) |
| |
摘 要: |  目的针对传统深度确定性策略梯度(DDPG)算法数据利用率低、收敛性差的特点,改进并提出一种新的无人船自主避碰决策方法。方法利用优先经验回放(PER)自适应调节经验优先级,降低样本的相关性,并利用长短期记忆(LSTM)网络提高算法的收敛性。基于船舶领域和《国际海上避碰规则》(COLREGs),设置会遇情况判定模型和一组新定义的奖励函数,并考虑了紧迫危险以应对他船不遵守规则的情况。为验证所提方法的有效性,在两船和多船会遇局面下进行仿真实验。结果结果表明,改进的DDPG算法相比于传统DDPG算法在收敛速度上提升约28.8%,结论训练好的自主避碰模型可以使无人船在遵守COLREGs的同时实现自主决策和导航,为实现更加安全、高效的海上交通智能化决策提供参考。
|
关 键 词: | 无人船 深度确定性策略梯度算法 自主避碰决策 优先经验回放 国际海上避碰规则 避碰 |
收稿时间: | 2024-05-14 |
修稿时间: | 2024-08-11 |
|
| 点击此处可从《中国舰船研究》浏览原始摘要信息 |
|
点击此处可从《中国舰船研究》下载免费的PDF全文 |
|