首页 | 本学科首页   官方微博 | 高级检索  
     检索      

邮件过滤系统中预处理方法的研究与实现
引用本文:杨丽华,李保林.邮件过滤系统中预处理方法的研究与实现[J].湖北汽车工业学院学报,2007,21(3):40-43.
作者姓名:杨丽华  李保林
作者单位:湖北汽车工业学院,信息管理系,湖北,十堰,442002
摘    要:完成了邮件过滤系统中的预处理工作。实现了信息增益特征选择算法,通过实验对比,得出了PU系列语料库合适的特征维数。使用词频反文档频率公式计算了特征词的权重,通过算法把标准邮件集处理成了支持向量机算法可以直接处理的向量空间模型的形式。

关 键 词:邮件过滤  预处理  特征选择
文章编号:1008-5483(2007)03-0040-04
修稿时间:2007年8月21日

Research and Realization on Preprocessing Method for Spam Filtering System
Yang Lihua,Li Baolin.Research and Realization on Preprocessing Method for Spam Filtering System[J].Journal of Hubei Automotive Industries Institute,2007,21(3):40-43.
Authors:Yang Lihua  Li Baolin
Abstract:The preprocessing method for spam filtering system is discussed.Information gain feature selection algorithm is realized.According to experimental results,the appropriate feature dimensions of PU serial corpus are given respectively.The weights of features are calculated by TF-IDF formula,and then the E-mail corpus is presented in vector space model which can be processed directly by the algorithm of support vector machine.
Keywords:spam filtering  preprocessing  feature selection
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号