首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于知识网络血缘关系的网页分类方法
引用本文:李华康,孙国梓,胥备,徐向阳,夏春蓉.一种基于知识网络血缘关系的网页分类方法[J].江苏科技大学学报(社会科学版),2014(4).
作者姓名:李华康  孙国梓  胥备  徐向阳  夏春蓉
作者单位:1. 南京邮电大学计算机学院 软件学院,江苏南京,210023
2. 南京大学计算机科学与技术系,江苏南京,210093
摘    要:网页内容分析及分类方法作为用户行为分析、兴趣识别、舆情分析等上层应用的底层核心技术逐渐成为学术界乃至工业界的热点。针对基于标签数据建立机器学习模型的传统网页分类算法已经无法适应移动互联网时代海量数据的迭代更新需求的问题,文中提出一种基于知识网络血缘关系的非监督页面分类方法。该方法以维基中文知识库作为知识网络,标定少量网络上层基础词汇和网络热词的类目体系,利用知识网络的传递性来遍历计算所有节点关键词的类目属性。文章根据中文知识网络特有的文本相似度提出血缘关系算法和相似度提权函数。实验表明这种方法能够有效地提高基于知识网络的中文分类效果。

关 键 词:网页分类  知识网络  血缘关系  提权函数

An approach for webpage classification based on kinship-relationship knowledge network
Li Huakang,Sun Guozi,Xu Bei,Xu Xiangyang,Xia Chunrong.An approach for webpage classification based on kinship-relationship knowledge network[J].Journal of Jiangsu University of Science and Technology:Natural Science Edition,2014(4).
Authors:Li Huakang  Sun Guozi  Xu Bei  Xu Xiangyang  Xia Chunrong
Abstract:
Keywords:webpage classification  knowledge network  kinship relationship  weights smoothing function
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号