排序方式: 共有4条查询结果,搜索用时 15 毫秒
1
1.
2.
基于分布式Q学习的区域交通协调控制的研究 总被引:2,自引:1,他引:2
介绍了强化学习和分布式Q学习的基本思想,并将分布式Q学习应用到区域交通协调控制中,通过对其进行研究和分析,提出一种适合于区域交通协调控制的奖惩函数和权值函数.在微观交通仿真软件Paramics上对控制算法进行仿真实验,实验结果说明基于分布式Q学习的区域交通协调控制算法的效果优于传统的定时控制,从而也验证了奖惩函数以及权值函数的有效性. 相似文献
4.
针对机器人足球比赛的多智能体环境下智能体的训练问题,提出了一种将模糊控制与Q-Learning相结合的学习方法,并在学习过程中自动调节回报函数以获得最优策略,此方法的有效性在中型组的仿真平台上得到了验证,并取得了较好效果,还可将它改进应用于其他多智体环境。 相似文献
1