首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于深度强化学习的机器人导航算法研究
引用本文:熊李艳,舒垚淞,曾辉,黄晓辉.基于深度强化学习的机器人导航算法研究[J].华东交通大学学报,2023(1):67-74.
作者姓名:熊李艳  舒垚淞  曾辉  黄晓辉
作者单位:华东交通大学信息工程学院
基金项目:国家自然科学基金项目(62067002,61967006,62062033);;江西省自然科学基金项目(20212BAB202008);;江西省交通厅科技项目(2022X0040);
摘    要:移动机器人穿越动态密集人群时,由于对环境信息理解不充分,导致机器人导航效率低且泛化能力弱。针对这一问题,提出了一种双重注意深度强化学习算法。首先,对稀疏的奖励函数进行优化,引入距离惩罚项和舒适性距离,保证机器人趋近目标的同时兼顾导航的安全性;其次,设计了一种基于双重注意力的状态价值网络处理环境信息,保证机器人导航系统兼具环境理解能力与实时决策能力;最后,在仿真环境中对算法进行验证。实验结果表明,提出的算法不仅提高了机器人导航效率还提升了导航系统的鲁棒性,主要表现为:在500个随机的测试场景中,碰撞次数和超时次数均为0,导航成功率优于对比算法,且平均导航时间比最好的算法缩短了2%;当环境中行人数量、导航距离发生变化时算法依然有效,且导航时间短于对比算法。

关 键 词:深度强化学习  奖励函数  状态价值网络  双重注意力
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号