首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于近似网页聚类的Web文本数据挖掘技术
引用本文:杨文忠,章兢,彭曙蓉.基于近似网页聚类的Web文本数据挖掘技术[J].长沙交通学院学报,2006,22(1):72-75.
作者姓名:杨文忠  章兢  彭曙蓉
作者单位:1. 长沙理工大学,电气与信息工程学院,湖南,长沙,410075;湖南大学,电气与信息工程学院,湖南,长沙,410082
2. 湖南大学,电气与信息工程学院,湖南,长沙,410082
基金项目:重庆市应用基础研究基金
摘    要:提出一种针对小文本的基于近似网页聚类算法的Web文本数据挖掘技术,以获得用户感兴趣的近似网页簇系列。试验证明,该算法在保证查全率和查准率的基础上大大提高了搜索效率。由于是针对小文本的数据挖掘,研究的算法时间和空间复杂度都不高,因此,有望成为一种实用、有效的信息检索技术。

关 键 词:信息检索  文本数据挖掘  近似网页聚类
文章编号:1000-9779(2006)01-0072-04
收稿时间:08 31 2005 12:00AM
修稿时间:2005年8月31日

A Web Text Data Mining Technology Based on the Approximate Pages Clustering
YANG Wen-zhong,ZHANG Jing,PENG Shu-rong.A Web Text Data Mining Technology Based on the Approximate Pages Clustering[J].Journal of Changsha Communications University,2006,22(1):72-75.
Authors:YANG Wen-zhong  ZHANG Jing  PENG Shu-rong
Institution:1. College of Electric and Information Engineering, Changsha University of Science and Technology, Changsha 410075, China; 2. College of Electric and Information Engineering, Hunan University, Changsha 410082, China
Abstract:The usual search engines often return too massive and disorder information when users are searching by
Keywords:so that users can hardly get the interesting information  Therefore  a web text data mining technology based on the approximate pages clustering is proposed to make users obtain the cared(approximate) pages clusters  The experiment indicates that this algorithm greatly enhance the searching(efficiency)  Because the data mining technology points to small texts  the complexity of time and space are not high  So it is hopeful to become a useful information searching technology  Key words: information searching  texts data mining  approximate pages clustering
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号