共查询到18条相似文献,搜索用时 61 毫秒
1.
提出了改进的最小风险贝叶斯邮件过滤算法,将其应用于客户端中文邮件过滤,以适应邮件分类的个性化需求.实验结果表明,将改进算法应用于中文邮件过滤是可行的,且与传统贝叶斯算法相比,使垃圾邮件的误报率明显降低;实验测试了损失因子、特征数量对过滤效果的影响,得出了较优的参数设定,对中文邮件过滤提出了有益的思路. 相似文献
2.
针对传统的支持向量机(SVM)算法在速度方面的缺陷,本文提出将序列最小优化(SMO)算法引人到垃圾邮件过滤系统中,实验结果证明,该模型训练时间快,过滤效果好. 相似文献
3.
研究探讨了传统贝叶斯模型的原理和优缺点,指出朴素贝叶斯算法没有考虑到合法邮件和垃圾邮件被误判带来的不同损失,因而有一定的局限性,而后以朴素贝叶斯为基础,结合最小风险的贝叶斯邮件过滤算法,提出改进的基于垃圾单词的单一表文件垃圾邮件过滤算法,提高了系统的执行效率,减少合法邮件的误判对用户造成的损害,并构建了邮件过滤模型. 相似文献
4.
由于网络数据的复杂性和不规范性制约着SVM分类器的精度,当前被广泛使用的数据预处理方法显得过于单一。因此,提出一种改进的数据预处理方法。首先,利用异构数据集上的奇异距离函数HVDM对数据进行归一化处理;然后,使用最近邻法对数据集修剪得到最后的训练样本,并且通过实验证明该方法可以提高SVM分类器的精度。 相似文献
5.
邮件分拣系统效率的提高主要采取的措施是提高邮码的识别率和分拣过程的并行处理.文中利用PLC内部定时器实现邮件分拣系统的并行处理技术,无需硬件的额外投资即可明显提高邮件分拣效率。 相似文献
6.
提出了基于Frame页面过滤的Web日志预处理方法,将数据挖掘技术应用到Web服务器的日志中,从而发现Web用户的行为模式,数据预处理为日志挖掘提供理想的数据,实验证明了该方法有效地解决了数据预处理中的一些问题. 相似文献
7.
基于Frame页面过滤的Web日志挖掘中的数据预处理方法 总被引:2,自引:0,他引:2
提出了基于Fram e页面过滤的W eb日志预处理方法,将数据挖掘技术应用到W eb服务器的日志中,从而发现W eb用户的行为模式,数据预处理为日志挖掘提供理想的数据,实验证明了该方法有效地解决了数据预处理中的一些问题. 相似文献
8.
使用向量空间模型表示的文本邮件数据高维而稀疏,不利于邮件过滤分类模型的建立,通常需在分类器训练前进行维数约减。Lasso回归是一种基于l1正则化的多元线性模型,其在模型参数估计的同时实现了变量选择。提出使用Lasso回归进行垃圾邮件过滤,建立Lasso回归邮件分类模型、Lasso回归词条选择结合逻辑回归的分类模型,结合中文文本垃圾邮件数据集TREC06C进行垃圾邮件过滤实验。实验结果表明Lasso回归词条选择结合逻辑回归的邮件分类模型性能更佳。 相似文献
9.
对烛状陶瓷过滤元件进行了过滤流动特性试验研究.试验结果表明,烛状陶瓷过滤元件沿轴向的不同位置过滤介质的压降和孔隙流速有较大的差别,开口端和封闭端之间的的差别最大,在高的过滤室压力和流量下此差别有加大的趋势.烛状陶瓷过滤元件沿轴向从封闭端到开口端的各个部位,都应尽量避免压降与流量关系曲线的非线性区,以减小流动损失. 相似文献
10.
对烛状陶瓷过滤元件进行了过滤流动特性试验研究.试验结果表明,烛状陶瓷过滤元件沿轴向的不同位置过滤介质的压降和孔隙流速有较大的差别,开口端和封闭端之间的的差别最大,在高的过滤室压力和流量下此差别有加大的趋势.烛状陶瓷过滤元件沿轴向从封闭端到开口端的各个部位,都应尽量避免压降与流量关系曲线的非线性区,以减小流动损失. 相似文献
11.
随着垃圾邮件的不断增多,它的危害性越来越严重,为了消除这种危害性,垃圾邮件的过滤技术就显得异常重要。由于垃圾邮件数据具有稀疏性、高特征维数和多重相关性等,所以直接对它进行分类的话会造成运算量很大和错误分类的问题。本文针对这些问题,先用非负矩阵分解的方法对实验数据进行特征提取,然后再用分类方法对它进行分类。在实验中,比较之后发现经过分解之后的数据比没有经过分解的数据有更高的分类准确率。 相似文献
12.
提出了可控变异和随机变异方法,改进了动态克隆选择算法,建立并实现一种改进的基于人工免疫系统的邮件过滤算法.并采用SpamAssassin垃圾邮件样本对算法性能进行测试.实验结果表明,引入改进的动态克隆选择算法后,该算法对具有变异特性的垃圾邮件能保持较高的正确识别率,具有较好的自适应性和多样性. 相似文献
13.
网络反垃圾邮件技术探讨 总被引:1,自引:0,他引:1
陈立德 《广州航海高等专科学校学报》2009,17(3):32-34
大量的垃圾邮件的出现对网络的安全造成很大威胁.本文系统分析了垃圾邮件产生的根源、危害和常见的反垃圾邮件技术,并比较了各种反垃圾邮件策略和不同部署方案的各自特点. 相似文献
14.
行程时间异常值处理方法研究 总被引:1,自引:0,他引:1
基于车牌识别数据可以得到较为准确的行程时间数据,但是由于识别系统自身原因、驾驶员路径选择行为、停车行为等因素的影响,行程时间数据中存在不少的异常值,剔除异常值才能将所得数据应用于实际研究和服务.在详细分析了行程时间异常值产生原因的基础上,提出了基于异常值数据表现以及行程时间分布特征的异常值剔除方法,最后以北京市的车牌识别系统数据为例,验证了方法的适用性. 相似文献
15.
张海春 《武汉船舶职业技术学院学报》2006,5(6):32-34
现实应用中经常需要对过程数据采用支持向量机等技术进行分类预测,在分类预测模型的构建过程中,数据的有效性是一个很重要的方面。本文针对目前数据清理的方法,提出了一种结构化的方法,应用到过程数据处理领域,并给出了这种方法应用前后支持向量分类器的预测性能的定量比较。 相似文献
16.
提出了一种人脸图像预处理改进算法:将图片转化为灰度图像后进行去噪滤波,根据灰度投影曲线确定人脸的边界,依据确定的眼、嘴以及脸的左右边界这些参数对图像进行剪裁,根据人脸特征的几何关系确定人脸图像的缩放系数,得到标准化图像.解决了传统方法无法适用于侧脸和双眼闭上的人脸的问题. 相似文献
17.
工业过程模糊控制中建模是关键,而数据预处理直接影响着模型收敛速度、计算量、模型质量.针对所采集的样本数据提出几个新的数据预处理方法.利用三次样条进行空缺数据的插值填充,然后利用K—均值进行输入输出空间划分与数据离散化,为模糊规则的提取做好淮备. 相似文献
18.
基于推广卡尔曼滤波的无源定位系统仿真 总被引:1,自引:0,他引:1
在现代电子战、信息战环境中,由于利用目标辐射电磁信息的无源探测定位系统具有自身隐蔽和探测距离远等优点,因此它具有重要的应用价值,并已成为当今非线性跟踪与估计研究领域的热点问题、针对无源定位中状态空间模型非线性和程度较高所引起的滤波发散问题,分析总结了推广卡尔曼滤波(EKF)次优递推滤波过程,最后给出滤波方程及仿真结果. 相似文献