排序方式: 共有3条查询结果,搜索用时 62 毫秒
1
1.
针对W eb页面存在与主题无关的噪音的问题,提出了基于页面结构与页面内容相结合的多策略页面内容提取算法.该算法根据改进的VIPS(基于视觉信息的页面分割算法)生成页面的块结构树,通过定义内聚度阈值和块结构树的最大深度,实现了块结构树中不同区域内不同分块粒度的要求;根据W eb页面提供的结构信息和内容信息提取块结构树叶子节点中的"主题"块和"主题相关"块;最后,对主题块和主题相关块的内容进行合并,提取页面的主要内容.实验表明,对任意下载、不同内容类型的页面,该算法都能有效地提取页面内容. 相似文献
2.
本文简介了一种玻纤薄毡缺陷的实时检测系统。该系统采用数字图象处理方法,检测精度为3mm,已用于现场实时检测。 相似文献
3.
描述了宽带IP城域网上门户网站平台建设的基本构架。在综合运用MVC设计方法、J2EE、LDAP、Agent、数据仓库、Web挖掘等技术的基础上,提出了一个设计实现这一架构的原理和具体方法。 相似文献
1