首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
研究了利用相关词进行提问扩展的算法.该算法建立在检索词模糊聚类的基础上,聚类以检索词在文献中共同出现为标准.与提问中检索词相关的群集形成提问的上下文.群集中属于上下文的检索词可用于提问的扩展.实验表明该算法提高了检准率.  相似文献   

2.
为了改善聚类分析的质量,提出了一种基于阈值和蚁群算法相结合的聚类方法.按此方法,首先由基于阈值的聚类算法进行聚类,生成聚类中心,聚类个数也随之初步确定;然后将蚁群算法的转移概率引入K-平均算法,对上述聚类结果进行二次优化.实验表明,与尽平均算法等相比,该聚类方法的F-测度值(F-measure)更高.  相似文献   

3.
为估计数据集的聚类数目及获得较好的聚类性能,提出了一种基于灰关联测度的分裂式层次聚类算法.该算法用灰关联测度衡量数据对象之间的相似程度,以基于密度扩展的方式自顶向下分裂成不同层次的数据集划分;然后,根据灰关联测度定义聚类有效性指标;最后将有效性指标曲线极值点对应的聚类划分用于估计最佳聚类数目.实际数据和合成数据集的实验表明,与FCM聚类相比,该算法的聚类正确率平均提高3.7%,并且能够识别任意形状的簇.  相似文献   

4.
为解决模糊C-均值聚类(FCM)算法在医学图像分割中存在计算量大、运行时间过长以及样本集不理想会导致不好的聚类结果的问题,提出了相应的改进算法.利用收敛速度快的K均值聚类法得到的聚类中心作为FCM算法的初始聚类中心,并将样本对于各个聚类的隶属度之和为1这一约束条件,改变为所有样本对各类的隶属度总和等于样本总数.实验表明,该方法用于人脑磁共振图像分割时,运行速度提高了近3倍,分割准确度明显得到提高.  相似文献   

5.
提出了基于自适应谐振理论的Web文档聚类集成方法.该方法先用蚁群算法对Web文档进行聚类,再用ART神经网络对聚类结果集成.实验结果表明,集成后的聚类综合质量高于集成前的聚类综合质量.  相似文献   

6.
针对面向中文自由文本的部分-整体关系抽取问题,提出一种基于无监督学习的方法. 首先提出子模式提取算法,从领域文本集中获取概念对和概念对所在上下文模式,利用概念对和概念对上下文模式建立分布式语义模型;然后采用协同聚类算法将具有相同语义关系的概念对聚合成簇,通过训练L1正则化逻辑回归模型提取簇的特征并得到代表每个簇语义关系的概念对上下文模式;最后根据模式识别表达部分-整体关系的簇,从而获取部分-整体关系概念对. 实验结果表明,该方法取得较好的性能,F度量达到68.97%,优于传统聚类方法(55.77%)和模式匹配方法(61.95%).   相似文献   

7.
Lincoln实验室提出的SAR(synthetic aperture radar)ATR(automatic target recognition)算法由于其经典性而被广泛采用,该算法为三级结构模式,处于其中Prescreener级和Discriminator级之间的聚类算法对于检测算法整体性能有重要的影响,文中介绍了SAR ATR算法采用的常规聚类算法,分析了常规算法在聚类过程中存在的杂波干扰问题,针对问题在聚类前引入形态学操作方法,将待聚类图像中包含的孤立点删除而只保留团状分布的样本,从而消除了杂波点对聚类的干扰,基于实际SAR图像的聚类结果验证了应用形态学方法对提高聚类效果的有效性.  相似文献   

8.
极大熵聚类算法的收敛性定理   总被引:2,自引:0,他引:2  
讨论了极大熵聚类算法的收敛性,构造了极大熵聚类算法的收敛点集,并证明了极大熵聚类算法的收敛性定理.结果表明,极大熵聚类算法不一定收敛到局部极小点,有时收敛到鞍点.同时,也给出了如何判断极大熵聚类算法的收敛点是局部极小点还是鞍点的方法。  相似文献   

9.
考虑船舶行为的时序相关性,提出了一种基于上下文自编码的船舶行为语义表征(SRCAE)模型;提取船舶经度、纬度、航速、航向等行为特征参量,建立了行为特征序列;借助连续词袋模型将行为特征序列划分为中心船舶行为和上下文船舶行为,利用深度自编码网络构建了船舶上下文行为的语义表征模型,将得到的中心船舶行为编码作为表征向量输出,通过聚类算法构建船舶行为词典;选取长江口南槽交汇水域作为研究对象,利用船舶自动识别系统产生的数据对提出的模型和方法进行了验证。分析结果表明:所提出的SRCAE模型能有效表征船舶行为之间的上下文联系,与传统自编码器和长短期记忆网络自编码器等模型相比SRCAE模型具有更低的表征误差;分别采用k均值(k-Means)、高斯混合模型(GMM)与核k均值(Kernel k-Means)3种聚类算法提取船舶行为词典,与原始数据相比SRCAE模型产生的表征向量更易于区分不同船舶行为模式,其中k-Means效果最优,轮廓系数、卡林斯基-哈拉巴斯指数和戴维森堡丁指数指标分别达到了0.384、18.308、0.531,共产生转向加速、转向减速、直行加速、直行减速等30种复合行为,有效提取了不同行为模式下船舶行为词组合关系。   相似文献   

10.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

11.
The k-median problem has attracted a number of researchers. However, few of them have considered both the dynamic environment and the issue of accuracy. In this paper, a new type of query is studied, called continuous median monitoring (CMM) query. It considers the k-median problem under dynamic environment with an accuracy guarantee. A continuous group nearest neighbor based (CGB) algorithm and an average distance medoid (ADM) algorithm are proposed to solve the CMM problem. ADM is a hill climbing schemed algorithm and achieves a rapid converging speed by checking only qualified candidates. Experiments show that ADM is more efficient than CGB and outperforms the classical PAM (partitioning around medoids) and CLARANS (clustering large applications based on randomized search) algorithms with various parameter settings.  相似文献   

12.
一种异构网络中的高效路由P2P覆盖网的设计   总被引:1,自引:0,他引:1  
P2P覆盖网中存在着拓扑不匹配、负载不均衡等问题,会对资源查询效果造成不可忽视的影响。本文提出在节点度数为幂率分布的异构网络中实现高效路由的三层覆盖网设计思想,设计相关的节点分类、成簇和地址分配方法。针对查询路径长度、负载均衡程度、查询成功率等多个性能指标展开分析,并通过仿真实验验证了相比以往的层次化覆盖网,本文提出的方法在多个方面具有明显的优越性。  相似文献   

13.
Ontology-based semantic information integration resolve the schema-level heterogeneity and part of data level heterogeneity between distributed data sources. But it is ubiquitous that schema semantics of information is identical while the interpretation of it varies with different context, and ontology-based semantic information integration can not resolve this context heterogeneity. By introducing context representation and context mediation to ontology based information integration, the attribute-level context heterogeneity can be detected and reconciled automatically, and hence a complete solution for semantic heterogeneity is formed. Through a concrete example, the context representation and the process in which the attribute-level context heterogeneity is reconciled during query processing are presented. This resolution can make up the deficiency of schema mapping based semantic information integration. With the architecture proposed in this paper the semantic heterogeneity solution is adaptive and extensive.  相似文献   

14.
针对Web信息查询缺乏对查询概念的相关语义这一问题,引入一种本体的形式化模型,通过引入本体内聚度等概念建立本体中概念间的语义关联,从而便于对常识知识的处理,并作为语义扩展及缓存的依据,由此建立起查询的上下文关联及联想,给查询带来较好的适应性。  相似文献   

15.
A radio frequency identification (RFID) reader will fail to identify tags if a collision occurs. This paper proposes a bi-slotted binary tree algorithm (BSBTA) with stack for RFID tag anti-collision to improve the performance of binary tree algorithm (BTA). In BSBTA, the reader detects collisions by Manchester code and stores colliding prefixes in a stack. The query is composed of a two-bit prefix and an index value. Following every reader query, there are two timeslots for tags whose pointers and identities (IDs) match the query to respond, one for the tag whose next bit is 0 and the other for the tag with 1 as its next bit. Performance analysis and evaluation are also given. The time complexity and the communication complexity of BTA and BSBTA are derived. The simulation results compare the performance of BSBTA with several related anti-collision algorithms. It is shown that BSBTA outperforms BTA in terms of the average number of responded bits and timeslots for one tag identification.  相似文献   

16.
随着网络的普及,越来越多的网络用户通过Web数据库提供的查询接口进行数据查询。但是用户往往会遇到发出查询条件而没有返回结果的现象即空查询结果问题。造成这种情况的原因可能是一方面用户查询意图模糊,不能够准确地描述查询要求。另一方面,用户明确查询需求但Web数据库却找不到任何符合查询条件的结果。针对这种情况可以分析发现找到造成查询失败的子查询条件是解决问题的关键。本文的主要研究分两个步骤:首先,将用户发出的查询条件分解为单个的原子查询条件;然后找到造成查询失败的最小失败子查询(Minimal Failing Sbuquery,MFS)集合。  相似文献   

17.
针对海量XML数据的查询问题,提出了一种有效的分布式查询处理机制,该机制通过划分和分配XML数据到多个计算节点的方式来进行查询。为平衡CPU负载,每个划分的XML数据被分配到各计算节点。在分布式环境中的每个计算节点处,考虑与查询进程开销密切相关的查询工作量,如果各计算节点负荷不均衡,划分的XML数据应重新分配以实现CPU负载均衡。从实验结果中可以看到,该算法对于海量XML数据的分布式查询性能有明显提升。  相似文献   

18.
为了解决障碍物环境中连续反向最近邻的查询问题,考虑到障碍物的存在,将可视性加到连续反向最近邻查询中,提出了一种新的连续反向最近邻查询的变体——连续可视反向最近邻查询.给出了线段可视性判断方法和相应的剪枝策略,提出了连续可视反向最近邻查询算法.该算法通过过滤步骤得到一个候选集,通过精炼步骤去掉错误的候选,通过分裂步骤找到查询结果.实验结果表明,该算法的执行时间与查询线段的长度呈线性关系增长,查询效率较高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号