基于词项和语义融合的地铁信号设备故障文本预处理 |
| |
引用本文: | 胡小溪,牛儒,唐涛.基于词项和语义融合的地铁信号设备故障文本预处理[J].铁道学报,2021(2):78-85. |
| |
作者姓名: | 胡小溪 牛儒 唐涛 |
| |
摘 要: | 数据预处理是数据驱动故障诊断的前提,为了更好地提取数据特征,针对地铁信号设备的故障记录提出一种基于词项和语义融合的文本自动预处理方法.采用隐式马尔可夫链识别特定线路的信号专有词汇,结合既有词库形成特定线路信号专用词库,解决线路专用信号设备故障词库的生成问题;分别在词项空间和语义空间进行故障记录的聚类、特征词提取与融合,...
|
关 键 词: | 文本预处理 地铁信号 HMM K-means LDA |
|
|