首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 209 毫秒
1.
TF-IDF算法使用词频和逆文档频率来判断文章中词语的重要性,但类别区分效果不是很好。为提高分类效果,提出TFIDF-MP算法。首先对语料库中的文档进行段落标注,利用jieba分词工具分词并标注词性,然后根据特征词在单个文档中出现的次数与该特征词在语料库所有文档中出现的平均次数进行比较,采用改进后的Sigmoid函数调整特征词权值,同时根据相关文档的段落位置重要程度赋予不同的位置权重,根据特征词权重大小排序后用朴素贝叶斯分类器对文档进行分类。实验结果表明,TF-IDF-MP算法应用到新闻分类中,精确率、召回率和F1值等评价指标较TF-IDF及相关改进算法都得到较好的提升。  相似文献   

2.
针对滚动轴承全寿命周期内健康状态的变迁和性能衰退的识别和评估问题,引入隐马尔科夫模型(hidden Markov model,HMM),利用Baum-Welch算法对滚动轴承全寿命周期振动信号数据进行建模,利用Viterbi算法解算和检验模型,最后通过Forward-Backward算法计算测试数据的概率分布;通过校验数据概率分布的隐含序列和观测序列分别表示状态变迁概率和性能衰退评估结果.研究结果表明:该方法能够快速解算滚动轴承状态迁移的概率分布,有效识别性能衰退状态,为预防性维修提供参考.  相似文献   

3.
为了研究车辆速度微小瞬变和不确定性对行驶工况构建模型的影响,将汽车行驶状况看作随时间变化的马尔科夫过程.利用最大似然估计法,按照怠速、加速、减速和匀速将实验数据分类,构成模型事件集,并把具有相似平均速度的模型事件组合在一起,构成6个不同的状态,计算出各个状态之间的转移概率.在此基础上,构造满足状态转移概率分布的随机数,以此扩展行驶工况的长度.分析合肥市行驶工况实验数据表明:典型行驶工况的行驶特征参数与实验数据的平均相对误差为7.81%,比传统方法降低了14.72%.  相似文献   

4.
完成了邮件过滤系统中的预处理工作。实现了信息增益特征选择算法,通过实验对比,得出了PU系列语料库合适的特征维数。使用词频反文档频率公式计算了特征词的权重,通过算法把标准邮件集处理成了支持向量机算法可以直接处理的向量空间模型的形式。  相似文献   

5.
路网实时客流状态是城市轨道交通日常运营组织科学决策的主要依据,而精准地在线估计客流OD是前提条件.本文分析了准实时AFC数据接入条件下客流OD在线动态估计问题及其特点,提出了将机器学习与递归贝叶斯相结合的客流OD动态估计方法;构建了基于LSTM的客流OD状态转移模型,以及LSTM模型嵌入下的客流OD递归贝叶斯估计模型;针对客流OD状态变化的非线性、不确定性特点,提出基于粒子滤波算法求解客流OD递归贝叶斯估计问题.面向LSTM模型嵌入所形成的客流OD状态转移三阶马尔科夫过程,对一般的粒子滤波算法进行高阶扩展,研究了算法的实现.最后用实例对本文提出的方法进行了验证.  相似文献   

6.
为研究驾驶员注意力转移规律,提出驾驶员注意力转换模型.将驾驶注意力分布状态划分为驾驶态、干扰态、内敛态,构建注意力转移状态空间.依据短时连续驾驶过程中注意力分布的齐次性,将马尔科夫过程引入到研究中,构建连续短时片段内驾驶员注意力转移模型.针对长时连续驾驶中注意力在各状态分布的非齐次性,通过时段划分采用短时模型叠加的方法得到长时连续驾驶注意力转移的近似处理模型组.结合实验数据对模型进行了检验,结果分析表明平均误差MAPE均小于5%,具有较高精度,模型可用.  相似文献   

7.
在交通流状态模糊化的过程中,对已有的交通模糊控制研究引入了太多的主观因素.为了解决这个问题,提出了一种基于MFCM算法的分级递减聚类算法,利用MFCM算法寻找类中心,再自适应确定该类中心的隶属度阈值,将聚类进行分级处理,实现未知类别数数据集的聚类.将改进算法应用到交通流状态聚类中,可以更科学地确定交通流状态的聚类数和各类模糊隶属度函数的结构等,最后,通过算例,说明了该算法对于未知聚类数及服从高斯分布的数据集具有聚类效果好、收敛速度快的特点.  相似文献   

8.
为准确高效地追踪识别城市区域交通路况信息,提供合理的交通出行策略,针对原始的隐马尔可夫模型(hidden markov model,HMM)初始状态参数难以选择且训练过程极易陷入局部最优解的问题,提出了一种改进的隐马尔可夫模型的交通拥堵态势识别机制,有效地拟合了城市道路相邻交叉口交通拥堵状况.将粒子群优化(particle swarm optimization,PSO)算法引入到隐马尔可夫模型的训练中,结合Baum-Welch算法分别对该模型的状态数等参数进行优化,最后根据Viterbi算法聚类出城市道路交叉口最佳拥堵状态序列.根据采集的真实交通流和GPS数据、车辆延误时间特征数据进行实验,其结果表明,改进的隐马尔可夫模型在道路交通拥堵识别的准确率和稳定性上有明显提升.  相似文献   

9.
为有效识别任意两篇报道的相似性,提出了一种基于语义相似度的话题关联检测算法.该算法首先通过计算特征词之间的相对熵作为两篇报道中特征词之间的语义相似度;其次,通过计算平均语义相似度获得特征词和报道之间的关联度;最后,结合特征词在语料库中的TF-IF(term frequency-inverse document frequency)权重计算两篇报道之间的关联度,实现报道之间的关联度检测.本文提出的方法与现有的向量空间模型方法和仅依赖于平均点互信息的方法进行了比较,并通过TDT4中文语料进行测评,结果表明,基于语义相似度的关联检测方法能够更好地利用文本的语境信息,提高了现有检测系统的性能,其最小DET(detection error tradeoff)代价降低了3%.   相似文献   

10.
基于引力搜索RBF神经网络的柴油机故障诊断   总被引:1,自引:0,他引:1  
为了解决RBF神经网络的参数选择问题,以便提高柴油机故障诊断的精度,提出了一种基于引力搜索算法和RBF神经网络相结合的智能故障诊断方法.该方法首先采用减聚类算法确定网络隐层单元数,然后提出改进引力搜索算法优化RBF神经网络的参数.利用国际标准样本集对该方法进行分类测试,并将该方法应用于柴油机故障的诊断,仿真实验验证了该方法对柴油机故障的分类和诊断效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号