共查询到20条相似文献,搜索用时 796 毫秒
1.
2.
网页内容分析及分类方法作为用户行为分析、兴趣识别、舆情分析等上层应用的底层核心技术逐渐成为学术界乃至工业界的热点。针对基于标签数据建立机器学习模型的传统网页分类算法已经无法适应移动互联网时代海量数据的迭代更新需求的问题,文中提出一种基于知识网络血缘关系的非监督页面分类方法。该方法以维基中文知识库作为知识网络,标定少量网络上层基础词汇和网络热词的类目体系,利用知识网络的传递性来遍历计算所有节点关键词的类目属性。文章根据中文知识网络特有的文本相似度提出血缘关系算法和相似度提权函数。实验表明这种方法能够有效地提高基于知识网络的中文分类效果。 相似文献
3.
黎飞 《上海海运学院学报》2003,24(4):304-307,311
将《1989年的国际救助公约》中几个句子的中文文本与英文文本进行了对比,从汉语惯用法的角度,提出了中文文本的修正意见。 相似文献
4.
5.
6.
7.
8.
9.
10.
第34—08版《国际危规》于2009年1月1日开始全球自愿实施,12个月后强制实施。环境有害物质的分类方法和标准调整之后,如何做好我国对环境有害物质的检测和分类工作,构建合理可行的监管体系,将直接关系到规则强制生效后的履约质量。文中对纯净物和混合物分类方法分别作了介绍。 相似文献
11.
12.
KNN算法是比较适合于文本分类的一种分类算法,但由于其计算复杂度会随着训练集规模的增加而线性增加,从而限制了它的实际应用效果。通过改变对近邻点的搜索策略,提出了一种改进型的KNN算法。该算法在对最近邻的选择过程中,放弃传统算法中遍历所有样本的做法,而是通过逐渐逼近的思想来寻找最近邻点。实验证明,该方法在保持和传统的KNN算法几乎一样的精度性能前提下,可以明显降低算法的计算复杂度,降低时间开销,取得了较满意的结果。 相似文献
13.
本体映射被认为是异构信息集成的关键,研究者们提出了很多本体映射的方法,论文主要从三个方面说明人工智能思想在本体映射中的应用。1)基于元素文本相似度计算的方法,往往会借助于自然语言处理技术,对文本进行相关处理。2)本体映射问题本质上是一个二元分类问题,可以借助于机器学习的方法提高本体映射的质量。3)利用聚类算法将本体分块,从而将大规模本体映射任务划分成若干个子任务,有效地解决了大规模本体映射的挑战。 相似文献
14.
文本介绍了公司第三造船事业部加工车间放样班,通过对车间产品加工过程的调研,不断改革创新,充分利用HD—SHM船体结构放样系统资源,在减少加工环节,缩短加工周期提高生产效率中取得了成功。 相似文献
15.
基于网页去噪Hash的增量式网络爬虫研究 总被引:1,自引:0,他引:1
基于网页Hash值产生的增量式网络爬虫,可以实现网页的增量抓取过程.然而,由于网页噪声的存在,经典Hash算法对文本产生的Hash值过于敏感,导致通过Hash值对比判断网页变化的过程偏离实际情况.研究提出一种去噪后Hash产生方法,通过对网页文本块进行“正文”与“噪声”分类,去除噪声后对网页正文内容产生Hash值并判断网页是否变化,提高网页增量抓取效率.实验结果表明所提出的基于去噪后Hash产生方法的增量式抓取过程,Hash值敏感度降低,有效提高了网络爬虫增量抓取性能. 相似文献
16.
17.
18.
<正>为便于采用《国际海上人命安全公约》(SOLAS)的现行有效文本,IMO相继出版了SOLAS 1986年综合文本、SOLAS 1992年综合文本、SOLAS 1997年综合文本、SOLAS 2001年综合文本、SOLAS 2004年综合文本、SOLAS 2009年综合文本和SOLAS 2014年综合文本。其中SOLAS 2014年综合文本包括了截止2014年7月1日已生效的SOLAS 1974和1988年议定书及其有关修正案。 相似文献
19.
《船舶标准化工程师》2017,(1)
<正>《船舶工程》系中国造船工程学会会刊,中文核心期刊、中文科技核心期刊,船舶行业主流媒体。创办于1979年,月刊,每月20日出版,每期定价20元。全年240元。主要内容:技术研究、市场分析、行业信息、新产品/新技术发布、优秀企业/人物介绍、分类采购指南等。发行对象:国内外修造船企业、船东、船舶配套设备厂、科研设计单位及高等院校的各级领导、管理 相似文献