基于增量Q学习的在线优化控制算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于增量Q学习的在线优化控制算法

引用本文：	卢国强.基于增量Q学习的在线优化控制算法[J].汽车实用技术,2023(15):165-171.

作者姓名：	卢国强

作者单位：	汕头大学机械工程系

摘要：	强化学习（RL）在控制器的在线优化中具有很好的应用前景。然而，在实际应用中，却存在严重的安全隐患。为解决这一安全隐患，提出了一种增量Q学习（IQ）算法，将其应用于电机转速同步控制的在线优化。IQ将经典Q学习中的一轮优化过程划分为多个连续地优化过程。由于在每轮优化中，将允许的更改间隔限制得非常小，因此智能体能够安全、稳定地达到全局最优。仿真结果表明，IQ有效地避免了性能衰退和在严苛的停止准则下陷入局部最优的问题，在最优性、安全性方面优于绝对Q学习（AQ）。
关键词：	强化学习增量Q学习同步控制在线优化