首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
提出了改进的最小风险贝叶斯邮件过滤算法,将其应用于客户端中文邮件过滤,以适应邮件分类的个性化需求.实验结果表明,将改进算法应用于中文邮件过滤是可行的,且与传统贝叶斯算法相比,使垃圾邮件的误报率明显降低;实验测试了损失因子、特征数量对过滤效果的影响,得出了较优的参数设定,对中文邮件过滤提出了有益的思路.  相似文献   

2.
为了提高舰船辐射噪声信号分类的准确率,即在水下进行舰船目标识别的准确率,采用了小波包提取信号能量谱特征的方法和支持向量机的分类算法.简介了小波包变换及支持向量机的基本原理,然后针对舰船辐射噪声信号进行多层小波包分解,提取各子频段能量谱作为特征量,归一化处理后构建特征向量,最后用支持向量机算法进行分类.仿真实验结果表明,利用对信号的多层小波包分解提取能量谱特征和支持向量机的分类算法能对舰船辐射噪声信号进行有效识别.  相似文献   

3.
短时交通流预测是智能交通系统的重要基础,其精度直接影响到交通控制和诱导的效果.对于交通流预测中的非参数回归方法,其中一个重要的问题是状态向量的选取.本文提出基于 ReliefF和 Delta Test的特征选择算法来对特征向量进行选择.首先使用 ReliefF算法根据特征和类别的相关性对状态向量进行快速初步筛选,加快算法的执行效率.接下来以 Delta Test为性能指标,使用遗传算法对状态分量的权重进行进一步优选.最后通过基于实际数据的算例,对本文方法优选的状态向量与时间序列状态向量,简单时空关联向量进行了对比.结果表明,本文的方法在一般交通状态条件下和突变交通状态下都具有较好的性能.  相似文献   

4.
提出使用最小二乘支持向量机LS—SVM(Least Squares Support Vector Machines)算法进行乐器音乐分类,从而实现乐器的辩识。在对Ls—sVM理论进行深入探讨的基础上,选择乐器音乐clip作为样本,进行特征提取,提取的特征包括频谱特征,短时自相关系数和MFCC等,然后用最小二乘支持向量机算法进行分类。对古琴、古筝、箜篌和琵琶音乐采取样本进行仿真实验,求得分类准确率和运行时间,同时使用逻辑回归(Logistic Regression)算法进行对比试验,其中最小二乘支持向量机和逻辑回归分类的准确率分别为96.5%和92.5%,且LS—SVM的运行时间比Logist的少。实验结果表明最小二乘支持向量机具有更为优越的分类性能和非线性处理能力,可以推广用于解决其它实际分类问题。  相似文献   

5.
研究探讨了传统贝叶斯模型的原理和优缺点,指出朴素贝叶斯算法没有考虑到合法邮件和垃圾邮件被误判带来的不同损失,因而有一定的局限性,而后以朴素贝叶斯为基础,结合最小风险的贝叶斯邮件过滤算法,提出改进的基于垃圾单词的单一表文件垃圾邮件过滤算法,提高了系统的执行效率,减少合法邮件的误判对用户造成的损害,并构建了邮件过滤模型.  相似文献   

6.
为了提高网络入侵检测正确率,利用特征选择和支持向量机(SVM)参数间的相互联系,提出一种特征选择和SVM参数联同步优化的网络入侵检测算法.该算法首先将网络入侵检测正确率作为问题优化的目标函数,网络特征和SVM参数作为约束条件建立数学模型,然后通过遗传算法对数学模型进行求解,找到最优特征子集和SVM参数,最后利用KDD 1999数据集对算法性能进行测试.结果表明,相对于其他入侵检测算法,同步优化算法能够较快选择最优特征与SVM参数,有效提高了网络入侵检测正确率,加快了网络入侵检测速度.  相似文献   

7.
为有效提取非平稳特性的滚动轴承振动信号特征,提高故障诊断效率,提出一种采用集合经验模态分解(empiricalmode?decomposition,EEMD)、Hilbert变换的特征提取方法,并利用烟花算法优化支持向量机(support vector machine,SVM)分类参数的滚动轴承故障诊断方法. 通过EEMD方法将目标信号分解成若干个模态函数,采取Hilbert变换获取模态函数的瞬时频率,并对模态函数及其瞬时频率进行统计特征提取,从而实现特征的有效降维. 结果表明:信号经过EEMD-Hilbert处理后特征能有效提取,将训练集和测试集各600组数据代入烟花算法优化SVM模型得到测试集正确率为99.63%;比传统的遗传算法和粒子群算法优化模型分别提高0.4%和0.2%左右;同时收敛时间更短,验证了该算法模型的可行性与有效性.   相似文献   

8.
对三维体真实图形生成中的隐藏面消除算法和可见面明暗处处理方法进行了比较研究,并介绍了改进的z缓存算法和法向量插值明暗法。  相似文献   

9.
使用向量空间模型表示的文本邮件数据高维而稀疏,不利于邮件过滤分类模型的建立,通常需在分类器训练前进行维数约减。Lasso回归是一种基于l1正则化的多元线性模型,其在模型参数估计的同时实现了变量选择。提出使用Lasso回归进行垃圾邮件过滤,建立Lasso回归邮件分类模型、Lasso回归词条选择结合逻辑回归的分类模型,结合中文文本垃圾邮件数据集TREC06C进行垃圾邮件过滤实验。实验结果表明Lasso回归词条选择结合逻辑回归的邮件分类模型性能更佳。  相似文献   

10.
为了确保奥运期间的邮件安全,广州邮政投递局同城邮件处理中心近日组织各班组对开拆、分拣处理等环节进行了安全培训,内容包括安全知识、反恐知识以及禁限寄规定、验视制度等。通过培训,不仅提高了员工的安全防范意识,同时也增强了员工对易燃、易爆等危险品的识别能力和处理能力。  相似文献   

11.
为有效识别任意两篇报道的相似性,提出了一种基于语义相似度的话题关联检测算法.该算法首先通过计算特征词之间的相对熵作为两篇报道中特征词之间的语义相似度;其次,通过计算平均语义相似度获得特征词和报道之间的关联度;最后,结合特征词在语料库中的TF-IF(term frequency-inverse document frequency)权重计算两篇报道之间的关联度,实现报道之间的关联度检测.本文提出的方法与现有的向量空间模型方法和仅依赖于平均点互信息的方法进行了比较,并通过TDT4中文语料进行测评,结果表明,基于语义相似度的关联检测方法能够更好地利用文本的语境信息,提高了现有检测系统的性能,其最小DET(detection error tradeoff)代价降低了3%.   相似文献   

12.
基于云模糊理论的图像纹理分割   总被引:1,自引:0,他引:1  
为了处理图像纹理的模糊性和随机性,基于云模糊理论提出了纹理特征矢量云模型,并成功地应用于纹理图像分割.该方法在对纹理统计描述符模糊化处理后,逆向生成纹理特征矢量云.矢量云模型的数字特征能够很好地表达纹理的模糊性和随机性,据此通过云距离计算及纹理特征矢量云生长,完成对图像纹理的分割.实验结果表明,该方法较经典的ISODATA算法和K-means簇算法的分割精度高,并且迭代收敛速度快.  相似文献   

13.
为了解决有标签语料获取困难的问题,提出了一种半监督学习的卷积神经网络(convolutional neural networks, CNN)汉语词义消歧方法. 首先,提取歧义词左右各2个词汇单元的词形、词性和语义类作为消歧特征,利用词向量工具将消歧特征向量化;然后,对有标签语料进行预处理,获取初始化聚类中心和阈值,同时,使用有标签语料对卷积神经网络消歧模型进行训练,利用优化后的卷积神经网络对无标签语料进行语义分类,选取满足阈值条件的高置信度语料添加到训练语料之中,不断重复上述过程,直到训练语料不再扩大为止;最后,使用SemEval-2007:Task#5作为有标签语料,使用哈尔滨工业大学无标注语料作为无标签语料进行实验. 实验结果表明:所提出方法使CNN的消歧准确率提高了3.1%.   相似文献   

14.
TF-IDF算法使用词频和逆文档频率来判断文章中词语的重要性,但类别区分效果不是很好。为提高分类效果,提出TFIDF-MP算法。首先对语料库中的文档进行段落标注,利用jieba分词工具分词并标注词性,然后根据特征词在单个文档中出现的次数与该特征词在语料库所有文档中出现的平均次数进行比较,采用改进后的Sigmoid函数调整特征词权值,同时根据相关文档的段落位置重要程度赋予不同的位置权重,根据特征词权重大小排序后用朴素贝叶斯分类器对文档进行分类。实验结果表明,TF-IDF-MP算法应用到新闻分类中,精确率、召回率和F1值等评价指标较TF-IDF及相关改进算法都得到较好的提升。  相似文献   

15.
Web pages contain more abundant contents than pure text ,such as hyperlinks,html tags and metadata et al.So that Web page categorization is different from pure text. According to Internet Chinese news pages, a practical algorithm for extracting subject concepts from web page without thesaurus was proposed, when incorporated these category-subject concepts into knowledge base, Web pages was classified by hybrid algorithm, with experiment corpus extracting from Xinhua net. Experimental result shows that the categorization performance is improved using Web page feature.  相似文献   

16.
在训练集和测试集数据量大的情况下,半监督递归自编码(semi-supervised recursive auto encoder,Semi-Supervised RAE)文本情感分析模型会出现网络训练速度缓慢和模型的测试结果输出速率缓慢等问题. 因此,提出采用并行化处理框架,在大训练集情况下,基于“分而治之”的方法,先将数据集进行分块划分并将各个数据块输入Map节点计算每个数据块的误差,利用缓冲区汇总所有的块误差,Reduce节点从缓冲区读取这些块误差以计算优化目标函数;然后,调用L-BFGS (limited-memory Broyden-Fletcher-Goldfarb-Shanno)算法调整参数,更新后的参数集再次加载到模型中,重复以上训练步骤逐步优化目标函数直至收敛,从而得到最优参数集;在测试集大的情况下,模型的初始化参数为上述步骤得到的参数集,Map节点对各句子进行编码得到其向量表示,然后暂存在缓冲区中;最后,在Reduce节点中分类器利用各语句的向量表示计算各自语句的情感标签. 实例验证表明:在标准语料库MR (movie review)下本文算法精确度为77.0%,与原始算法的精确度(77.3%)几乎相同;在大数据量训练集下,训练时间在一定程度上随着计算节点的增加而大量减少.   相似文献   

17.
基于HSI空间的模糊C均值彩色图像分割方法   总被引:1,自引:0,他引:1  
给出了一种在HSI空间上基于模糊C均值的彩色图像分割方法.首先对每个像素根据H分量和I分量计算出4个隶属度,然后将其中的两个隶属度结合形成一个二雏特征矢量来表征像素的全部颜色特征,最后对二维矢量运用模糊C均值聚类算法得到最终的彩色图像分割结果.  相似文献   

18.
@周志杰@胡光锐@李群IntroductionSpeechproductionisaccomplishedbyvariousacousticalexcitationsofthehumanvocaltract.Voicedspeechisgeneratedb...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号