多任务约束条件下基于强化学习的水面无人艇路径规划算法 Path planning for USV based on reinforcement learning with multi-task constraints期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

多任务约束条件下基于强化学习的水面无人艇路径规划算法

作者单位：	;1.哈尔滨工程大学水下机器人技术重点实验室

摘要：	本文提出一种多任务约束条件下基于强化学习的水面无人艇路径规划算法。利用灰色预测进行区域建议,提升神经网络检测连续视频帧中水面目标的速度和准确率,进而提高了路径规划环境建模的准确性。基于Q_learning算法进行在线训练,完成多任务约束条件下的无人艇路径规划。针对Q_learning算法在多任务约束条件下收敛较慢的问题,提出了一种基于任务分解奖赏函数的Q_learning算法。通过仿真试验,验证了在多任务约束条件下,采用强化学习进行路径规划的可行性,并通过实物试验,验证了该算法能够满足实际要求。
关键词：	水面无人艇路径规划强化学习目标检测
Path planning for USV based on reinforcement learning with multi-task constraints

Abstract:

Keywords:
本文献已被 CNKI 等数据库收录！