首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进DDPG算法的无人船自主避碰决策方法
引用本文:关巍, 郝淑慧, 崔哲闻, 等. 基于改进DDPG算法的无人船自主避碰决策方法[J]. 中国舰船研究, 2025, 20(1): 172–180. DOI: 10.19693/j.issn.1673-3185.03929
作者姓名:关巍  郝淑慧  崔哲闻  王淼淼
作者单位:大连海事大学 航海学院,辽宁 大连 116026
基金项目:国家自然科学基金资助项目(51409033, 52171342)
摘    要:
目的针对传统深度确定性策略梯度(DDPG)算法数据利用率低、收敛性差的特点,改进并提出一种新的无人船自主避碰决策方法。方法利用优先经验回放(PER)自适应调节经验优先级,降低样本的相关性,并利用长短期记忆(LSTM)网络提高算法的收敛性。基于船舶领域和《国际海上避碰规则》(COLREGs),设置会遇情况判定模型和一组新定义的奖励函数,并考虑了紧迫危险以应对他船不遵守规则的情况。为验证所提方法的有效性,在两船和多船会遇局面下进行仿真实验。结果结果表明,改进的DDPG算法相比于传统DDPG算法在收敛速度上提升约28.8%,结论训练好的自主避碰模型可以使无人船在遵守COLREGs的同时实现自主决策和导航,为实现更加安全、高效的海上交通智能化决策提供参考。

关 键 词:无人船  深度确定性策略梯度算法  自主避碰决策  优先经验回放  国际海上避碰规则  避碰
收稿时间:2024-05-14
修稿时间:2024-08-11
点击此处可从《中国舰船研究》浏览原始摘要信息
点击此处可从《中国舰船研究》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号