基于深度强化学习的机器人导航算法研究 |
| |
引用本文: | 熊李艳,舒垚淞,曾辉,黄晓辉.基于深度强化学习的机器人导航算法研究[J].华东交通大学学报,2023(1):67-74. |
| |
作者姓名: | 熊李艳 舒垚淞 曾辉 黄晓辉 |
| |
作者单位: | 华东交通大学信息工程学院 |
| |
基金项目: | 国家自然科学基金项目(62067002,61967006,62062033);;江西省自然科学基金项目(20212BAB202008);;江西省交通厅科技项目(2022X0040); |
| |
摘 要: | 移动机器人穿越动态密集人群时,由于对环境信息理解不充分,导致机器人导航效率低且泛化能力弱。针对这一问题,提出了一种双重注意深度强化学习算法。首先,对稀疏的奖励函数进行优化,引入距离惩罚项和舒适性距离,保证机器人趋近目标的同时兼顾导航的安全性;其次,设计了一种基于双重注意力的状态价值网络处理环境信息,保证机器人导航系统兼具环境理解能力与实时决策能力;最后,在仿真环境中对算法进行验证。实验结果表明,提出的算法不仅提高了机器人导航效率还提升了导航系统的鲁棒性,主要表现为:在500个随机的测试场景中,碰撞次数和超时次数均为0,导航成功率优于对比算法,且平均导航时间比最好的算法缩短了2%;当环境中行人数量、导航距离发生变化时算法依然有效,且导航时间短于对比算法。
|
关 键 词: | 深度强化学习 奖励函数 状态价值网络 双重注意力 |
|
|