首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于粗糙集和模糊聚类理论的文本分类系统的研究与实现
引用本文:郑丽英,王海涌,刘丽艳.基于粗糙集和模糊聚类理论的文本分类系统的研究与实现[J].铁道学报,2007,29(1):45-49.
作者姓名:郑丽英  王海涌  刘丽艳
作者单位:兰州交通大学,电子与信息工程学院,甘肃,兰州,730070;兰州交通大学,光电技术与智能控制教育部重点实验室,甘肃,兰州,730070
基金项目:光电技术与智能控制教育部重点实验室(兰州交通大学)开放基金资助项目(K040103);甘肃省自然科学基金项目(3ZS042-B25-038)
摘    要:随着Internet的发展及广泛应用,越来越多的文本信息以待阅读和处理。文本分类成为众所关注但仍未很好解决的热门课题。本文提出一种基于粗糙集和模糊聚类(RS&FC)理论的文本分类新模型,详细讨论和分析了该模型的总体设计思想、主要实现技术和有关的算法及实现方案。该模型在分类规则产生之前,以训练样本直接聚类的结果构造信息表,并对表中的连续属性离散化,再对信息表中的特征词属性进行二次聚类,压缩文本特征子集的向量维数,提取关键字特征属性,建立决策信息表,然后利用粗糙集理论,采用启发式约简算法,对信息表进行约简,产生优化的分类规则,指导文本分类。最后通过实验和性能评价,本文提出的分类方法的分类准确率高于传统的K-最近邻分类(K-NN)法,提高了系统的适应性能和分类能力。

关 键 词:粗糙集  模糊聚类  文本分类  文本聚类  规则约简
文章编号:1000-8360(2007)01-0045-05
修稿时间:2005-05-12

Research and Implementation of Text Classification System Based on Theories of Rough Set & Fuzzy Clustering
ZHENG Li-ying,WANG Hai-yong,LIU Li-yan.Research and Implementation of Text Classification System Based on Theories of Rough Set & Fuzzy Clustering[J].Journal of the China railway Society,2007,29(1):45-49.
Authors:ZHENG Li-ying  WANG Hai-yong  LIU Li-yan
Abstract:
Keywords:rough set  fuzzy clustering  text classification  text clustering  rule reduction
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号