首页
|
本学科首页
官方微博
|
高级检索
文章检索
按
中文标题
英文标题
中文关键词
英文关键词
中文摘要
英文摘要
作者中文名
作者英文名
单位中文名
单位英文名
基金中文名
基金英文名
杂志中文名
杂志英文名
栏目英文名
栏目英文名
DOI
责任编辑
分类号
杂志ISSN号
检索
检索词:
出版年份:
从
到
被引次数:
从
到
他引次数:
从
到
提示:输入*表示无穷大
全文获取类型
收费全文
1篇
免费
0篇
专业分类
铁路运输
1篇
出版年
2010年
1篇
排序方式:
出版年(降序)
出版年(升序)
被引次数(降序)
被引次数(升序)
更新时间(降序)
更新时间(升序)
杂志中文名(升序)
杂志中文名(降序)
杂志英文名(升序)
杂志英文名(降序)
作者中文名(升序)
作者中文名(降序)
作者英文名(升序)
作者英文名(降序)
相关性
共有1条查询结果,搜索用时 15 毫秒
1
1.
网页信息自动抽取技术的研究
胡少荣
孟嗣仪
刘云
张彦超
丁飞
《铁路计算机应用》
2010,19(9):37-40
在网络舆情分析中,经常要从大量的网页信息中抽取出有用的数据.但一般的网页信息抽取技术都是基于对HTML文档的分析.本文提出网页信息自动抽取的方法,可以滤除网页噪声,快速准确地获取所需要的网页信息.该方法首先将HTML转换为结构化的XML文档,然后结合DOM4J和XPath语言建立网页解析模板库,最后根据模板的抽取规则对网页信息进行抽取.实验证明,该方法具有较高的回召率和查准率.
相似文献
1
设为首页
|
免责声明
|
关于勤云
|
加入收藏
Copyright
©
北京勤云科技发展有限公司
京ICP备09084417号