首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文网页的自动分类
引用本文:侯婷,蓝国勇.中文网页的自动分类[J].交通与计算机,2005,23(4):114-117.
作者姓名:侯婷  蓝国勇
作者单位:1. 武汉理工大学,武汉,430063
2. 上汽通用五菱技术中心,柳州,545007
摘    要:提出了一种中文网页自动分类的方法,主要包括中文网页的自动抓取、中文分词、特征选取、贝叶斯机器学习与分类等功能模块。该系统可以很好地实现一个中文网页的自动分类,且系统中的分类器具有较高的分类质量。

关 键 词:文本分类  中文分词  贝叶斯机器学习
收稿时间:04 18 2005 12:00AM
修稿时间:2005年4月18日

Automatic Text Categorization for Chinese Web Pages
HOU Ting,LAN Guoyong.Automatic Text Categorization for Chinese Web Pages[J].Computer and Communications,2005,23(4):114-117.
Authors:HOU Ting  LAN Guoyong
Abstract:This paper presents a method of automatic text categorization for Chinese Web pages, which mainly includes such models as Chinese Web pages acquirement, Chinese word splitter, feature selection and native Bayes machine learning and classification. The system can preferably implement automatic text categorization for Chinese pages, and has a higher quality.
Keywords:text categorization  Chinese text splitter  Naive Bayes machine learning
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号