基于GBDT算法的地铁IC卡通勤人群识别 |
| |
作者姓名: | 翁小雄 吕攀龙 |
| |
作者单位: | 华南理工大学 土木与交通学院,广东 广州,510641;华南理工大学 土木与交通学院,广东 广州,510641 |
| |
基金项目: | 国家自然科学基金;广州市交通委员会科技项目;广东省交通厅科技项目 |
| |
摘 要: | 随着公交IC卡的应用和普及,从IC卡数据中挖掘通勤用户,为下阶段采取分流措施缓解早晚高峰压力,优化票价制定等具有重要意义。以广州市地铁数据为依托,选取合适的特征属性,提出了一种基于梯度提升树(gradient boosting decision tree,GBDT)机器学习算法为基础的通勤人群识别方法。首先以周工作日的首末次平均刷卡时间、首末次平均刷卡时长、首末次刷卡时长波动程度、刷卡次数总和等5个特征来制定调查问卷的数据格式。然后利用处理过的带标签(通勤/非通勤)的调查问卷数据去训练GBDT分类器模型,测试样本的通勤识别的准确率高达94.16%。最后利用该模型对广州地铁IC卡数据通勤人群进行识别,结果显示广州地铁刷卡数据中通勤人群数量为131万左右,占总地铁刷卡出行人数32%左右。
|
关 键 词: | 交通工程 城市交通 地铁IC卡数据 GBDT 通勤识别 |
本文献已被 CNKI 万方数据 等数据库收录! |
|