首页 | 本学科首页   官方微博 | 高级检索  
     

基于GBDT算法的地铁IC卡通勤人群识别
作者姓名:翁小雄  吕攀龙
作者单位:华南理工大学 土木与交通学院,广东 广州,510641;华南理工大学 土木与交通学院,广东 广州,510641
基金项目:国家自然科学基金;广州市交通委员会科技项目;广东省交通厅科技项目
摘    要:随着公交IC卡的应用和普及,从IC卡数据中挖掘通勤用户,为下阶段采取分流措施缓解早晚高峰压力,优化票价制定等具有重要意义。以广州市地铁数据为依托,选取合适的特征属性,提出了一种基于梯度提升树(gradient boosting decision tree,GBDT)机器学习算法为基础的通勤人群识别方法。首先以周工作日的首末次平均刷卡时间、首末次平均刷卡时长、首末次刷卡时长波动程度、刷卡次数总和等5个特征来制定调查问卷的数据格式。然后利用处理过的带标签(通勤/非通勤)的调查问卷数据去训练GBDT分类器模型,测试样本的通勤识别的准确率高达94.16%。最后利用该模型对广州地铁IC卡数据通勤人群进行识别,结果显示广州地铁刷卡数据中通勤人群数量为131万左右,占总地铁刷卡出行人数32%左右。

关 键 词:交通工程  城市交通  地铁IC卡数据  GBDT  通勤识别
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号