首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
针对铁路通信大数据平台中设备厂商信息不规范的问题,提出一种采用聚类分析算法对厂商信息智能分类的方法,介绍聚类分析算法、相似度计算方法和聚类性能度量等理论,通过分词处理、构建词袋模型、权值转换等数据预处理技术,将文本转换为适合分类的权值向量,采用K-均值聚类、层次聚类算法分别对部分样本进行聚类分析,比较测试结果,最终选择层次聚类算法对所有样本进行聚类分析。该算法可以将不规范的厂商信息进行合理的分类,从而为形成厂商信息字典提供数据支持。  相似文献   

2.
本文根据实测京津塘高速公路感应线圈数据,利用模糊聚类的方法对交通流状况的分类进行了研究,将交通状态分为畅通、拥挤、堵塞3类.同时对比了车速、车流量和占有率3种参数对交通状态判别的影响.分析结果表明:用模糊聚类进行交通流状况分类是一种可行的方法;车速对交通流分类的影响最大,其次是占有率和流量.  相似文献   

3.
在轨道交通运营管理过程中,不同车站间客流的时间分布特性及规律直接决定了客流组织方案。明晰 车站间客流分型及特征,对合理配置客流组织方案大有裨益。相对于单车站客流类型,多车站间客流类型的影 响因素多样且复杂,为此,从时间、空间和结构 3 个角度对车站间客流分类特征进行分析,并通过谱聚类方法 压缩搜索空间,从而达到更加精准的类型划分。利用轮廓系数与戴维森堡丁指数对比不同方法的分类结果,证 明所提出的谱聚类方法相对于 k-means 等其他方法具有更好的分类效果。以苏州地铁 2020 年数据为例,通过 提出的方法寻找出 7 种车站间客流分型,该结果可应用于预测模型训练等领域。  相似文献   

4.
一种基于蚁群算法的聚类组合方法   总被引:26,自引:1,他引:25  
蚂蚁等群居类昆虫被看作能解决复杂问题的分布式系统,研究者从它们的协作性能以及自组织、信息素通信、任务划分等机理中获得灵感,已在组合优化、通信网络、机器人等许多应用领域找到解决问题的新方法。聚类作为一种无监督的学习,能根据数据间的相似程度自动地进行分类。基于蚁群算法的聚类方法已经在当前数据挖掘研究中得到应用。本文提出的基于蚁群算法的聚类组合新方法,模仿多蚁群的协作性能,将运动速度类型各异的多个蚁群,独立而并行地进行聚类分析,然后组合其聚类结果为超图,再用蚁群算法对超图进行2次划分。实验结果表明,该方法能自动决定聚类的数目,聚类组合方法能明显改善聚类质量。  相似文献   

5.
系统聚类法中常用的是最小距离法、最大距离法、重心距离法和类平均距离法等,这些方法都是定义一种类与类之间的距离来进行聚类的,但在有些情况下其聚类结果不唯一.利用模糊关系矩阵,给出一种新的基于模糊聚类的方法,并将这些技术应用到处理地质图型数据的数据挖掘工作中,得到可行性验证.  相似文献   

6.
为解决换乘车站分类标准缺失或不精准的问题,从用地、区位、客流 3 个维度,分析换乘站分类的影响 因素并提出分类指标计算方法,结合 k-means 聚类算法,构建基于多因素聚类的换乘站分类方法,应用南京地铁 换乘站开展实例分析。结果表明:与单因素(仅用地、仅区位、仅客流)聚类方法相比,多因素聚类方法在分类均 匀度、实际分类效果等方面具有明显优势。结合分类结果,提出南京地铁换乘站宜按综合枢纽型、公共中心Ⅰ型、 公共中心Ⅱ型、居住生活型及外围接驳型 5 类划分,并分析换乘站在不同要素上的阈值特性及取值建议,为未来 地铁换乘站规划及设计提供借鉴。  相似文献   

7.
在铁路科研管理信息系统中加入资源搜索功能,有利于科研工作者快速准确获取相关信息.本文在开源搜索引擎框架Compass基础上,结合其已有的SSH架构,实现了铁路科研信息系统站内搜索引擎.  相似文献   

8.
基于粗糙集和模糊聚类理论的文本分类系统的研究与实现   总被引:5,自引:0,他引:5  
随着Internet的发展及广泛应用,越来越多的文本信息以待阅读和处理。文本分类成为众所关注但仍未很好解决的热门课题。本文提出一种基于粗糙集和模糊聚类(RS&FC)理论的文本分类新模型,详细讨论和分析了该模型的总体设计思想、主要实现技术和有关的算法及实现方案。该模型在分类规则产生之前,以训练样本直接聚类的结果构造信息表,并对表中的连续属性离散化,再对信息表中的特征词属性进行二次聚类,压缩文本特征子集的向量维数,提取关键字特征属性,建立决策信息表,然后利用粗糙集理论,采用启发式约简算法,对信息表进行约简,产生优化的分类规则,指导文本分类。最后通过实验和性能评价,本文提出的分类方法的分类准确率高于传统的K-最近邻分类(K-NN)法,提高了系统的适应性能和分类能力。  相似文献   

9.
用户时于智能化,专业化搜索引擘的需求大力推动了语义搜索的发展.本文在这个需求的环境下提出一种基于领域本体的垂直搜索引擎模型,该模型更加智能化,并且耦合性较低,能满足不同领域的定制和开发.  相似文献   

10.
搜索引擎是一项崭新而且流行的技术,而检索排序技术是信息检索系统处理结果的核心技术.排序算法的好坏,直接决定搜索引擘效率的高低.文中详细分析了目前流行的3种排序算法:PageRank算法,HillTop算法,竞价算法.介绍各自原理,优缺点以及改进措施,并以PageRank方法为例,详细描述PR值的求解过程.  相似文献   

11.
随着搜索引擎的广泛使用,以针对搜索引擎的原理和特点,设计对它友好的网页,以提升被检索的机会为研究内容,产生一种新兴的SEO技术.搜索引擎优化(SEO)技术是通过丰富的内容、一定数量的优质的反向链接、合理的网站结构、准确的关键字选择和部署,使得网站的网页在搜索引擎检索结果中获得较好的排名,从而实现提高自己网站的访问量的目的.本文结合经济学中的长尾理论以及Google的PageRank原理,通过实际的操作案例,详细讨论搜索引擎优化的流程.  相似文献   

12.
在对搜索引擎核心技术进行研究的基础上,设计并实现一种采用主动扫描探测方法进行有害信息监控的系统.基于bot包设计网络蜘蛛模块,实现对html、asp、php和jsp等网页的自动抓取;采用反向最大匹配和二级哈希散列算法,实现中文分词;开发信息索引模块,实现对网页的批量和增量索引;开发有害信息检索模块,实现有害信息监控及预警功能.最后通过集成各模块,实现有害信息监控系统.  相似文献   

13.
目前应用于铁路现场的各种计算机联锁系统所采用的进路搜索方法经实践发现其搜索效率低、占用资源大,针对此问题,结合进路搜索的实际要求,采用带启发信息的A*算法进行进路搜索。使用Visual C++搭建计算机联锁软件的实验平台,对A*进路搜索算法进行性能测试。结果表明,A*进路搜索算法能够快速准确的搜出所需基本进路,动态生成进路表,并且搜索时间短、占用空间小,相较其他算法具有更良好的性能。  相似文献   

14.
基于深度优先搜索的铁路站场遍历算法研究   总被引:1,自引:0,他引:1  
在列车运行控制系统中,及时准确地了解列车所在位置是非常重要的。卫星定位技术GNSS(GlobalNavigation Satellite System)已经逐渐应用到列车定位技术中,在对列车进行定位时需要对定位数据的可靠性进行验证。车站的定位数据可靠性验证工作建立在对车站站场进行多次遍历获得定位数据的基础上。利用计算机仿真技术模拟列车在站场内遍历能够对现场很难实现的遍历情况进行重复测试。本文对铁路站场与有向图的相似性进行研究,建立基于铁路站场结构的拓扑模型,在此基础上结合站场实际遍历的情况与图的深度优先遍历算法思路,提出一种基于链表数据结构的连续遍历站场的算法。结合实际站场图进行遍历算法仿真,较好地实现了连续遍历并获取较高的遍历效率。  相似文献   

15.
基于Web的数据仓库数据集成问题的探讨   总被引:1,自引:1,他引:0  
基于Web的数据仓库数据集成就是将Web技术与数据仓库技术有机结合.它将涉及到数据仓库技术,Internet技术,数据挖掘技术和搜索引擎技术等.从丰富数据仓库数据源的技术角度出发,分析了基于Web的数据仓库体系结构,并对数据仓库中基于Web的数据集成方法、实施数据集成中存在的问题以及目前可利用的解决方案进行了探讨.  相似文献   

16.
介绍可支持热点查询的双索引技术,搜索引擎的构成,描述索引的结构及其采取的双索引机制,并介绍索引性能的优化及词语过滤机制,热点查询技术.  相似文献   

17.
提出了随机子空间的概念,并应用于随机深度搜索算法.该算法可以解决大型交通网络最优路径的搜索问题.并运用于约4000个车站,520多条线路的交通网络并取得了成效.随机深度搜索算法可以2 000ms快速的找到一个优秀解.  相似文献   

18.
二叉树在自动进路搜索中的应用   总被引:4,自引:0,他引:4  
通过研究站场形状与二叉树形状的相似性,将站场结构进行约束限定,以二叉树的方法建模,提出了一种高效,方便的自动进路搜索算法.  相似文献   

19.
采用Web服务组合技术可以将越来越多的Web服务组合成更新更强大的服务.随着Web服务组合技术的发展和电子商务的崛起,出现多种用于描述和规范Web服务组合过程的面向Web服务的基于工作流的建模语言,BPEL4WS就是其中比较完备和成熟的一种.介绍Web服务组合的概念、语言、过程以及BPEL4WS的相关规范,讲述如何使用BPEL4WS在多个服务提供者之间进行商业过程的业务流程设计.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号