首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
现有的科技奖励检索都是基于关键词的匹配,忽略了对用户查询的语义理解。针对传统信息检索存在的问题以及结合当前面向实际应用的基于本体的语义检索的特点,提出一种关联多本体的科技奖励检索方法。通过对科技奖励项目的领域本体构建,对概念相似度计算方法的改进及关联多本体概念,使扩展词语更能表达用户检索意图。实验结果表明,该方法对比传统查询检索和单独本体扩展检索获得了更好的召回率和准确率。  相似文献   

2.
随着网络的普及,越来越多的网络用户通过Web数据库提供的查询接口进行数据查询。但是用户往往会遇到发出查询条件而没有返回结果的现象即空查询结果问题。造成这种情况的原因可能是一方面用户查询意图模糊,不能够准确地描述查询要求。另一方面,用户明确查询需求但Web数据库却找不到任何符合查询条件的结果。针对这种情况可以分析发现找到造成查询失败的子查询条件是解决问题的关键。本文的主要研究分两个步骤:首先,将用户发出的查询条件分解为单个的原子查询条件;然后找到造成查询失败的最小失败子查询(Minimal Failing Sbuquery,MFS)集合。  相似文献   

3.
The rapid development of the Internet brings a variety of original information including text information, audio information, etc. However, it is difficult to find the most useful knowledge rapidly and accurately because of its huge number. Automatic text classification technology based on machine learning can classify a large number of natural language documents into the corresponding subject categories according to its correct semantics. It is helpful to grasp the text information directly. By learning from a set of hand-labeled documents, we obtain the traditional supervised classifier for text categorization (TC). However, labeling all data by human is labor intensive and time consuming. To solve this problem, some scholars proposed a semi-supervised learning method to train classifier, but it is unfeasible for various kinds and great number of Web data since it still needs a part of hand-labeled data. In 2012, Li et al. invented a fully automatic categorization approach for text (FACT) based on supervised learning, where no manual labeling efforts are required. But automatically labeling all data can bring noise into experiment and cause the fact that the result cannot meet the accuracy requirement. We put forward a new idea that part of data with high accuracy can be automatically tagged based on the semantic of category name, then a semi-supervised way is taken to train classifier with both labeled and unlabeled data, and ultimately a precise classification of massive text data can be achieved. The empirical experiments show that the method outperforms the supervised support vector machine (SVM) in terms of both F1 performance and classification accuracy in most cases. It proves the effectiveness of the semi-supervised algorithm in automatic TC.  相似文献   

4.
Web pages contain more abundant contents than pure text ,such as hyperlinks,html tags and metadata et al.So that Web page categorization is different from pure text. According to Internet Chinese news pages, a practical algorithm for extracting subject concepts from web page without thesaurus was proposed, when incorporated these category-subject concepts into knowledge base, Web pages was classified by hybrid algorithm, with experiment corpus extracting from Xinhua net. Experimental result shows that the categorization performance is improved using Web page feature.  相似文献   

5.
基于中心性和PageRank的网页综合评分方法   总被引:1,自引:0,他引:1  
为准确、高效地对网页进行评分,提出了一种基于中心性(结点度、居间度和紧密度)和PageRank算法的网页评分方法CentralRank.它采用PageRank算法计算网页分数,借助中心性度量的方法计算页面在Web社会网络中的重要性.为了验证CentralRank的性能优势,设计了一个网页抓取器,可利用该抓取器自动、准确地下载网页信息.该网页抓取器集成了网络信息采集、页面内容分析和页面消重3项技术.基于大量真实数据的实验结果表明:CentralRank在保证网页评分时间性能的前提下,比单纯基于中心性的网页评分算法和PageRank算法更准确、有效,预测准确性分别提高约14.2%和7.5%.  相似文献   

6.
基于Frame页面过滤的Web日志挖掘中的数据预处理方法   总被引:2,自引:0,他引:2  
提出了基于Fram e页面过滤的W eb日志预处理方法,将数据挖掘技术应用到W eb服务器的日志中,从而发现W eb用户的行为模式,数据预处理为日志挖掘提供理想的数据,实验证明了该方法有效地解决了数据预处理中的一些问题.  相似文献   

7.
为了解决差分隐私保护机制中重复攻击会泄露用户隐私的问题,提出了一种基于动态页敏感度调节的skyline查询方法. 首先,提出了依据最优主导页的计算页敏感度方法,提高页敏感度计算的效率;其次,为了合理设置隐私预算值,提出了基于置信率的隐私预算值调节方法;最后,基于隐私预算值动态更新查询次数的上界,实现了基于差分隐私保护的skyline查询方法. 实验结果表明:所提出方法在隐私预算值设定小于0.8时,隐私数据的泄露数由787个降低到423个.   相似文献   

8.
针对Web信息查询缺乏对查询概念的相关语义这一问题,引入一种本体的形式化模型,通过引入本体内聚度等概念建立本体中概念间的语义关联,从而便于对常识知识的处理,并作为语义扩展及缓存的依据,由此建立起查询的上下文关联及联想,给查询带来较好的适应性。  相似文献   

9.
针对有向无环图支持向量机多类分类方法未采用有效的有向无环图生成算法,提出了一种改进的有向无环图生成算法。该方法采用了聚类分析中类距离的思想作为层次分类依据。实验结果表明,该方法与原方法相比具有较高的分类精度。  相似文献   

10.
研究城市公交查询系统的设计与实现。利用动态分段技术,建立了基于MapInfo的动态分段数据结构,充分考虑乘客出行心理,提出了公交出行最优路径算法,设计了城市公交查询系统,实现输入查询信息或直接对地图操作来获得出行最优路线和换乘方案,提高乘客出行的便利性和高效性。  相似文献   

11.
移动客户端可以实现车货匹配模式的及时、高效、逼真体验、高度可视化,提供方便快捷的服务。根据车货对接流程,设计基于Android系统的车货对接模式。系统实现货主发布货源、查询货物报价、报价处理、查询交易记录功能,实现车主注册车辆、查询注册车辆、根据车辆查询匹配货源、报价、查询记录等功能。本系统能够让货主在平台上发布信息,对于车主、货主之间物流运输,快速、准时的达成物流运输协议有实际意义。  相似文献   

12.
为了提高PageRank算法的准确性,从网络用户对已知网页进行评价的角度引入网页等级,从网页链接分析的角度解决权威性需求.结合网页链接分析和页面内容分析提出一种改进的PageRank算法PRP(PageRank based on Page-level).实验证明,算法为扩展PageRank提供了广阔的空间,通过选择合适的参数page-level,可以提高传统PageRank算法的网页排序的准确性,有效防止恶意链接对pagerank排序值(PR值)造成的影响.  相似文献   

13.
IntroductionTraditional solutions for the integrity protec-tion of web pages are based on the File Digest tech-niques, usually called Digital Signatures[1]. Suchmethods generate a signature through Hash func-tions with the to-be-protected information as theinput and then attach it to the end of the originalinformation to form the signed message. When thesigned message arrives at the receiver, the correctsignature can ensure its integrity; in other words,no signature or a false one means that…  相似文献   

14.
网页标准化是近年来提出的一种新型网页开发方法,它实现了网页表现、结构和行为的有效分离,极大提高了网页开发的质量和效率。文中通过对现有的网页制作方法存在的弊端进行分析,提出采用网页标准化开发方法的必要性,同时对网页标准化的含义作了充分的阐述,展现了如何实现网页标准化,最后介绍了网页标准化广阔的应用前景。  相似文献   

15.
针对支持向量机对训练样本内的噪声和孤立点比较敏感,影响了支持向量机分类性能的弱点,利用模糊支持向量机的学习方法,构建了变压器故障诊断模型.采取一种基于二叉树的多分类方法,使用模糊C均值聚类算法求取模糊支持向量机的模糊隶属度,采用径向基核函数,并利用遗传算法对模糊支持向量机的参数进行寻优.实验结果表明,基于二叉数的模糊支持向量机模型相比BP神经网络、支持向量机有更高的诊断准确率,基于二叉树模糊支持向量机的变压器故障诊断方法是可行的.  相似文献   

16.
为了更加准确地检测出高速公路上的偶发性交通事件,采用一种粒子群优化SVM参数的高速公路交通事件检测算法,提升事件检测效果。文中运用高速公路实测数据集(L880),对支持向量机算法进行分类性能测试,并且采用改进的粒子群优化算法对支持向量机的参数进行优化,进而利用测试集数据对该模型进行验证比较,获得满意的检测效果。  相似文献   

17.
针对道路车辆目标检测传统方法需随场景变化提取不同特征, 检测率较低与鲁棒性差的问题, 提出了一种基于Darknet框架下YOLO v2算法的车辆多目标检测方法; 根据目标路段场景与车流量的变化对YOLO-voc网络模型进行改进, 基于ImageNet数据集和微调技术获得分类训练网络模型, 对训练结果和车辆目标特征进行分析后进一步调整改进的算法参数, 最终获得更适合于道路车辆检测的YOLO-vocRV网络模型下车辆多目标检测方法; 为验证检测方法的有效性和完备性, 采用不同车流密度进行了车辆多目标检测试验, 并与经典YOLO-voc、YOLO9000模型进行了对比; 采用改进YOLO-vocRV网络模型, 选取20 000次迭代, 分析了多目标检测结果。试验结果表明: 在阻塞流样本条件下, YOLO9000网络模型检测率为93.71%, YOLO-voc网络模型检测率为94.48%, 改进YOLO-vocRV网络模型检测率达到了96.95%, 因此, 改进网络模型YOLOvocRV检测率较高; YOLO-vocRV模型精确度和召回率均聚集在0.95, 因此, 在获得较好精确度的条件下损失的召回率明显较小, 达到了很好的折中; 采用混合样本训练后, 基于YOLO-vocRV模型的车辆多目标检测方法的检测率在自由流状态下可达99.11%, 同步流状态下可达97.62%, 阻塞流状态下可达到97.14%, 具有较小的误检率和良好的鲁棒性。   相似文献   

18.
为了解决障碍物环境中连续反向最近邻的查询问题,考虑到障碍物的存在,将可视性加到连续反向最近邻查询中,提出了一种新的连续反向最近邻查询的变体——连续可视反向最近邻查询.给出了线段可视性判断方法和相应的剪枝策略,提出了连续可视反向最近邻查询算法.该算法通过过滤步骤得到一个候选集,通过精炼步骤去掉错误的候选,通过分裂步骤找到查询结果.实验结果表明,该算法的执行时间与查询线段的长度呈线性关系增长,查询效率较高.  相似文献   

19.
为了提高突发事件应急救援的效率,应急物资分类的科学性是应急物资调拨与配送的关键环节之一.通过分析既有应急物资分类以及聚类算法存在的问题,提出了基于改进K均值聚类的应急物资分类方法,构建了基于K均值的粒子群优化算法设计.最后,选取了206种最为常用的应急物资为例,采用Matlab软件平台分析计算.结果表明:基于改进K均值聚类POS算法全局寻优能力明显要强于其他聚类算法.为应急决策者提供一定的理论依据.  相似文献   

20.
现有的Web服务缺少明显的形式语义支撑,而Web服务发现又因缺乏对服务质量(QoS)的描述而难以为用户选择最佳服务,为此,本文提出了一种基于QoS的Web服务发现本体模型,采用分类和反馈机制,在服务发现过程中添加服务质量本体信息,并针对票务服务领域进行了实例设计和语义描述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号