排序方式: 共有1条查询结果,搜索用时 0 毫秒
1
1.
网页内容分析及分类方法作为用户行为分析、兴趣识别、舆情分析等上层应用的底层核心技术逐渐成为学术界乃至工业界的热点。针对基于标签数据建立机器学习模型的传统网页分类算法已经无法适应移动互联网时代海量数据的迭代更新需求的问题,文中提出一种基于知识网络血缘关系的非监督页面分类方法。该方法以维基中文知识库作为知识网络,标定少量网络上层基础词汇和网络热词的类目体系,利用知识网络的传递性来遍历计算所有节点关键词的类目属性。文章根据中文知识网络特有的文本相似度提出血缘关系算法和相似度提权函数。实验表明这种方法能够有效地提高基于知识网络的中文分类效果。 相似文献
1