首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于隐马尔科夫模型的文本分类
引用本文:刘晓飞,邸书灵.基于隐马尔科夫模型的文本分类[J].石家庄铁道学院学报,2013,26(1).
作者姓名:刘晓飞  邸书灵
作者单位:石家庄铁道大学信息科学与技术学院,河北石家庄,050043
摘    要:文本分类经过多年的发展,已经产生了很多成熟高效的算法.将隐马尔科夫模型用于文本分类,对每个文本类构建一个隐马尔科夫模型,x2检验获得类别特征词集,其状态转移表示按照一指定顺序对类别特征词集进行遍历,状态输出符号为特征词的词频,隐马尔科夫模型的状态转移过程隐含的表示了属于该类的文本的形成过程.具有最大概率的HMM分类器就是所属的类别.该算法不仅将特征词考虑进去,而且还将词频信息融入隐马尔科夫模型中,实验结果表明该方法分类效率较高

关 键 词:文本分类  隐马尔科夫模型  信息增益  x2检验  泊松分布

Text Categorization Based on Hidden Markov Model
Liu Xiaofei , Di Shuling.Text Categorization Based on Hidden Markov Model[J].Journal of Shijiazhuang Railway Institute,2013,26(1).
Authors:Liu Xiaofei  Di Shuling
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号