基于Doc2vec-LightGBM的CBTC车载信号设备故障分类诊断方法 |
| |
引用本文: | 柴琳果,张景会,上官伟,蔡伯根,李小雨.基于Doc2vec-LightGBM的CBTC车载信号设备故障分类诊断方法[J].铁道学报,2024(4):108-118. |
| |
作者姓名: | 柴琳果 张景会 上官伟 蔡伯根 李小雨 |
| |
作者单位: | 1. 北京交通大学电子信息工程学院;2. 北京市轨道交通电磁兼容与卫星导航工程技术研究中心;3. 北京交通大学轨道交通控制与安全国家重点实验室 |
| |
基金项目: | 北京市自然科学基金(L211022); |
| |
摘 要: | 车载信号设备是城市轨道交通信号系统的重要组成部分,其运营过程中会产生海量离散化、片段化的日志文本数据。目前,CBTC车载设备故障记录文本仍存在语义不明确、词语冗余的问题,从而造成故障致因溯源难,针对此,提出一种基于Doc2vec-LightGBM的CBTC车载设备故障自动分类诊断方法。首先对故障文本使用Jieba完成文本分词,依据TF-IDF实现分词文本数据的特征提取,并采用Doc2vec训练文本分词向量;其次针对数据不均衡的问题,采用Borderline-SMOTE算法进行少数类文本向量数据的补全泛化;最后,通过训练轻量梯度提升机LightGBM分类器完成故障文本自动分类。采用某信号厂商所记录的1 133条故障文本数据进行分类实验分析,并与支持向量机(SVM)方法对比。实验结果表明,所提方法在分类精确率、召回率上分别为98.2%、97.5%,证明了该故障文本自动分类方法的有效性和优越性。
|
关 键 词: | CBTC 车载设备 Doc2vec LightGBM 故障分类诊断 |
|
|