基于Q学习的参数自适应S面控制方法 |
| |
引用本文: | 张佩,陆莫凡,陈成,徐昊,苗川.基于Q学习的参数自适应S面控制方法[J].船舶,2022(6):55-62. |
| |
作者姓名: | 张佩 陆莫凡 陈成 徐昊 苗川 |
| |
作者单位: | 1. 中国船舶及海洋工程设计研究院;2. 哈尔滨工程大学船舶工程学院 |
| |
摘 要: | 复杂的动力学特性及多变的海洋环境对无人水下航行器(UUV)控制器的设计提出了巨大挑战,在实际应用中,控制器的参数经人工调试后便固化,在控制过程中无法适应环境的变化。针对上述难题,该文借鉴自适应控制思想,提出一种基于强化学习的参数自适应S面控制方法,采用自适应控制方式实现不同环境下控制器参数的优化和自动整定。该方法采用Q学习算法进行训练,通过Q学习的自学习机制寻找输入状态和输出动作间的最优映射。仿真试验表明,所提方法能对控制器的参数进行实时在线调整,具备良好的控制效果和环境自适应能力。
|
关 键 词: | 无人水下航行器 强化学习 S面控制 参数自适应 |
|
|