排序方式: 共有26条查询结果,搜索用时 15 毫秒
1.
基于Q学习的Agent在单路口交通控制中的应用 总被引:3,自引:4,他引:3
将Agent技术与Q学习算法相结合,应用到城市交通控制领域中,对单交叉口的交通流进行了控制研究,介绍了路口Agent的结构模型以及基于Q学习算法的学习机制的实现,提出了一种适用于交通控制的奖惩函数。即当红灯相位的饱和度大于绿灯相位的饱和度时,红灯相位的相对警界度在奖惩函数中占主导地位,此时大部分情况下会对Agent进行惩罚;在以后的决策过程中面对类似的交通状态Agent所选择的控制行为更倾向于将通行权切换给下一个相位,反之,Agent所选择的行为倾向于保持当前相位的通行权到下一决策时刻。并通过微观交通仿真软件Paramics对控制算法进行仿真研究,仿真结果表明该方法的控制效果优于定时控制,同时验证了奖惩函数的有效性。 相似文献
2.
3.
陈亚民 《城市公交规划与管理》2004,(5):12-14
行车安全是公交全部安全工作的重中之重,而行车事故的诱因与成因纷繁复杂,涉及:人、车、路的管理,内部外部、内线外线、主观客观、必然偶然,方方面面、千头万绪。但其中的“人”——驾驶员是诸要素中的核心与关键,抓行车安全首先得抓好“人”。 相似文献
4.
李义年 《武汉理工大学学报(交通科学与工程版)》2010,34(2):366-369
利用马尔可夫分析,求出了驾驶员最终处于奖惩系统各阶上的概率,同时,马尔可夫分析还可以判断出在确定代表驾驶员实际风险的调整保费时奖惩系统的功效,并举例给出了求解奖惩系统的稳态保费及Loimaranta功效具体的计算方法. 相似文献
5.
结合铁路调度指挥系统的特点和现状,提出对其建立经济核算体系和考核奖惩机制的必要性和作用,并对如何建立与实施进行了阐述。 相似文献
6.
为了激发官兵管装爱装的自觉性,促进部队装备管理安全发展,不断提升装备的完好率,77226部队采取3项措施,严格落实装备管理奖惩措施。一是召开装备管理工作总结大会,分析部队年度装备管理工作,总结好的做法和经验。二是严格落实奖励制度,对在装备管理工作中表现突出的单位、个人给予表彰奖励。 相似文献
7.
随着时间的推移,传统粗放型管理中存在的职责不清、要求不精、评价不准、优劣难辨、奖罚不明、执行力不强等问题越来越突出,暴露了很大的弊端。起源于现代企业的精细化管理正为我们有效解决这些问题提供了契机,指明了方向。 相似文献
8.
9.
10.