摘 要: | 本文提出一种多任务约束条件下基于强化学习的水面无人艇路径规划算法。利用灰色预测进行区域建议,提升神经网络检测连续视频帧中水面目标的速度和准确率,进而提高了路径规划环境建模的准确性。基于Q_learning算法进行在线训练,完成多任务约束条件下的无人艇路径规划。针对Q_learning算法在多任务约束条件下收敛较慢的问题,提出了一种基于任务分解奖赏函数的Q_learning算法。通过仿真试验,验证了在多任务约束条件下,采用强化学习进行路径规划的可行性,并通过实物试验,验证了该算法能够满足实际要求。
|