首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于增量Q学习的在线优化控制算法
引用本文:卢国强.基于增量Q学习的在线优化控制算法[J].汽车实用技术,2023(15):165-171.
作者姓名:卢国强
作者单位:汕头大学机械工程系
摘    要:强化学习(RL)在控制器的在线优化中具有很好的应用前景。然而,在实际应用中,却存在严重的安全隐患。为解决这一安全隐患,提出了一种增量Q学习(IQ)算法,将其应用于电机转速同步控制的在线优化。IQ将经典Q学习中的一轮优化过程划分为多个连续地优化过程。由于在每轮优化中,将允许的更改间隔限制得非常小,因此智能体能够安全、稳定地达到全局最优。仿真结果表明,IQ有效地避免了性能衰退和在严苛的停止准则下陷入局部最优的问题,在最优性、安全性方面优于绝对Q学习(AQ)。

关 键 词:强化学习  增量Q学习  同步控制  在线优化
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号