基于簇形均衡评估的高速公路收费数据聚类 |
| |
作者姓名: | 杜瑾 郝珺 樊海玮 |
| |
作者单位: | 1. 长安大学信息工程学院,西安710064;2. 陕西省道路交通智能检测与装备工程研究中心,西安710064; 3. 西安铁路局,西安710054 |
| |
基金项目: | 国家自然科学基金/National Natural Science Foundation of China(51278058);陕西省交通厅科技项目/Shaanxi Provincial Transport Department Science and Technology Program(13-39X);中央高校基本科研业务费专项资金/The Fundamental Research Funds for the Central Universities(CHD2011JC02) |
| |
摘 要: | 高速公路收费数据是一种高维、海量、分布特征未知的数据集,因此难以选择 何种算法和参数最适合此类数据的聚类.针对此问题,提出一种基于簇形均衡的聚类评估 指标IBCS,对各簇的形状、分布、密度和尺寸等多种形态进行均衡综合评估.该指标根据 数据集稀疏程度自适应调整邻域置信区间来度量簇结构的分散度和分离度;度量密度使 得IBCS 具有面向数据集的算法选择能力;度量簇大小避免簇划分过于悬殊的问题.UCI 数据集上多种候选算法评估比较实验验证了该指标灵活有效,能获得准确簇数并合理划 分.最后,基于IBCS 评估的西宝高速公路收费数据聚类结果表明,采用K-means 算法,簇 数为5时聚类模式最佳.
|
关 键 词: | 智能交通 数据挖掘 聚类算法 模式评估指标 高速公路收费数据 |
收稿时间: | 2015-11-03 |
|
| 点击此处可从《交通运输系统工程与信息》浏览原始摘要信息 |
|
点击此处可从《交通运输系统工程与信息》下载全文 |
|