排序方式: 共有38条查询结果,搜索用时 15 毫秒
31.
在铁路列车运行图调整日趋频繁的背景下,列车时刻表数据集具有数据量大、属性多、不同车次时刻表记录数量差异较大、相同车次时刻表记录属性值相似的特点,列车时刻表数据分析和挖掘面临着数据集不均衡问题。为此,提出基于属性相关分析与聚类的铁路列车时刻表非均衡数据集预处理方法,依据列车时刻表属性与列车运营指标(客座率)的相关分析,可有效合并蕴含冗余信息的相似数据,降低数据集中此类相似数据的占比,可削弱非均衡数据集对后续数据分析的不利影响,并能保留数据所蕴含的主要信息,减少过多相似数据对数据分析模型应用效果的不利影响,提高模型的预测准确度。 相似文献
32.
33.
针对目前客票径路计算中径路信息与实际旅客出行径路之间存在的差异性,从分析径路生成的计算模型出发,结合铁路通票业务背景,提出一种车次约束机制下的径路生成计算方法。算法以选择性集中存储为径路存取方式,实现径路公共信息的全路共享与车站特殊径路的分布式存取,有效压缩径路信息存储空间,提高径路选择效率;以车站-车次邻接表为基本数据结构,将铁路路网图改进为列车约束下的列车可达图,保证车站生成个性化径路的合理性和有效性;算法摒弃原有径路计算只计算本站至全路各个结算站间最短K路径的方法,分车站特殊径路计算和公共径路计算两步实现径路的计算,从根本上保证径路计算的有效性,解决通票径路与列车走行径路不符问题,实现了对现有径路生成算法的优化。 相似文献
34.
35.
对各站客票收入率进行分类并预测各路局收入,对于运输部门制定收入计划、高铁列车开行计划等都具有一定指导意义。本文基于中国铁路总公司下发的客运运行图中直通高铁列车分站信息,首先提出一种Kmeans-CACC方法对客票收入率进行离散化处理,克服了无监督离散化的缺点,利用CACC算法对影响因素数据进行离散化处理;然后,设计一个基于误差区间交集和样本密度的最优收入率选取方法,找出各个分类中满足误差范围的收入率;最后,利用随机森林算法对客票收入率进行分类,并预测各路局收入。实验结果表明,本文提出的离散化算法及分类算法能够对收入率进行精确度较高的分类,提出的收入率选取算法能较好地预测收入。 相似文献
37.
38.