首页 | 本学科首页   官方微博 | 高级检索  
     

多任务约束条件下基于强化学习的水面无人艇路径规划算法
作者单位:;1.哈尔滨工程大学水下机器人技术重点实验室
摘    要:
本文提出一种多任务约束条件下基于强化学习的水面无人艇路径规划算法。利用灰色预测进行区域建议,提升神经网络检测连续视频帧中水面目标的速度和准确率,进而提高了路径规划环境建模的准确性。基于Q_learning算法进行在线训练,完成多任务约束条件下的无人艇路径规划。针对Q_learning算法在多任务约束条件下收敛较慢的问题,提出了一种基于任务分解奖赏函数的Q_learning算法。通过仿真试验,验证了在多任务约束条件下,采用强化学习进行路径规划的可行性,并通过实物试验,验证了该算法能够满足实际要求。

关 键 词:水面无人艇  路径规划  强化学习  目标检测

Path planning for USV based on reinforcement learning with multi-task constraints
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号