首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于网页去噪Hash的增量式网络爬虫研究   总被引:1,自引:0,他引:1  
基于网页Hash值产生的增量式网络爬虫,可以实现网页的增量抓取过程.然而,由于网页噪声的存在,经典Hash算法对文本产生的Hash值过于敏感,导致通过Hash值对比判断网页变化的过程偏离实际情况.研究提出一种去噪后Hash产生方法,通过对网页文本块进行“正文”与“噪声”分类,去除噪声后对网页正文内容产生Hash值并判断网页是否变化,提高网页增量抓取效率.实验结果表明所提出的基于去噪后Hash产生方法的增量式抓取过程,Hash值敏感度降低,有效提高了网络爬虫增量抓取性能.  相似文献   

2.
3.
科技     
《珠江水运》2014,(2):27
  相似文献   

4.
前沿     
《珠江水运》2014,(2):32-34
  相似文献   

5.
专家     
《珠江水运》2014,(2):38-39
  相似文献   

6.
政策     
《珠江水运》2014,(2):36-37
  相似文献   

7.
港口     
《珠江水运》2014,(2):26
  相似文献   

8.
产经     
《珠江水运》2014,(2):22-25
  相似文献   

9.
10.
市场|     
《珠江水运》2014,(2):35
  相似文献   

11.
回顾 1.原油1月上旬国际石油市场一直受地缘政治弱化、伊朗和利比亚原油供应可能增加的利空消息左右,原油价格震荡回落。不过,穿越加拿大的Keystone输油管道南线即将开通,库欣地区库存有望进一步下降致使美国经济数据较为强劲,WTI价格在上旬回落后,中旬价格受到支撑。下旬,IMF上调今年全球经济增长预期,  相似文献   

12.
13.
14.
15.
16.
企业.国际     
《珠江水运》2014,(2):30-31
  相似文献   

17.
18.
19.
20.
桴浮于海     
《珠江水运》2014,(3):8-11
  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号