基于Q-Learning的无人驾驶船舶路径规划 |
| |
引用本文: | 王程博,张新宇,邹志强,王少博.基于Q-Learning的无人驾驶船舶路径规划[J].船海工程,2018(5). |
| |
作者姓名: | 王程博 张新宇 邹志强 王少博 |
| |
作者单位: | 大连海事大学航海动态仿真与控制交通行业重点实验室;大连海事大学交通信息工程实验室 |
| |
摘 要: | 为实现无人驾驶船舶在未知环境中自适应航行,建立一种基于Q-Learning的无人驾驶船舶路径规划模型。应用基于马尔科夫过程的Q学习算法,分别就环境模型、动作空间、激励函数及动作选择策略4大要素建立模型,设计激励函数,规划最优策略,使得无人驾驶船舶路径规划过程中所获奖赏最大;利用python和pygame平台建立仿真环境,仿真结果表明,该方法可有效地在未知环境中规划出较优路径及成功避让多个障碍物。
|
本文献已被 CNKI 等数据库收录! |
|