首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
随着我国高速公路道路拥堵和车流时空分布不均等现象的发生,面对多元化的高速公路使用者,以高速公路差异化收费为主要方式的高速公路供给侧改革是缓解目前高速公路道路拥堵等现象的重要措施.基于客户细分理论提出RFMS模型将高速公路使用者划分为异质性客户群,并分析其商业价值.考虑高速公路收费数据的结构特点,对传统k-means算法在初始类簇中心选取和大数据聚类下出现的小聚类现象进行改进,构建Adaboost与k-means++相结合的混合算法,并对聚类效果进行对比分析.研究结果表明:Adaboost-k-means++混合算法有利于提升聚类效果;基于RFMS的高速公路客户商业价值挖掘方法能有效划分异质性客户群并评估客户价值,可为高速公路差异化收费和高速公路运营管理部门提供可靠的理论支持.  相似文献   

2.
为准确掌握终端区航空器飞行模式,有效评估、优化飞行程序,首先,针对飞行轨迹点的时空特性,提出基于时间比的自上向下算法压缩轨迹;其次,结合轨迹点的速度和航向特征,建立基于多维属性特征的轨迹相似性模型;最后,应用禁忌粒子群(TSPSO)算法改进和优化模糊C-均值聚类(FCM)算法,并结合终端区的真实飞行轨迹数据对改进聚类算法进行验证.结果表明:轨迹压缩技术极大地降低了计算开销;与传统的FCM算法相比,改进后的聚类算法可以得到更优的满意解,提高飞行轨迹聚类效果.  相似文献   

3.
基于粗糙集和混合聚类法的决策表约简算法   总被引:3,自引:0,他引:3  
在分析粗糙集理论、分层聚类算法和k-means聚类算法的基础上,提出一种基于粗糙集和混合聚类法的决策表约简算法,该算法首先是使用基于分层聚类的k-means混合聚类法离散化决策表中的连续属性,然后利用粗糙集理论对离散后的决策表进行属性约简,得到决策规则集,并通过在铁路客运量预测系统中的应用验证了算法的可行性和有效性.  相似文献   

4.
针对协同过滤算法在大数据环境下存在的可扩展性差的问题,提出一种Hadoop环境下基于改进聚类的个性化推荐算法.在Hadoop分布式计算平台上,首先在离线状态下使用基于Canopy聚类改进的模糊C均值算法构建项目聚类模型,再根据目标项目和聚类模型间相似度建立候选项目空间,最后在候选项目空间上采用基于项目的协同推荐算法在线完成推荐.实验表明,该算法在分布式集群上具有较好的可扩展性和推荐效率,且推荐精度也有所提高.  相似文献   

5.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

6.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

7.
中国铁路货物运输由于诸多因素的影响,在客户和货源数量上受到了冲击,需要在客户关系管理及营销等方面不断完善,其中客户细分是精确营销的重要手段.本文提出了基于RFM模型的,新的客户分类KFAV模型,并对货运客户价值进行了计算.之后引入了局部密度值ρ和斥类值δ,对传统K均值(K-means)聚类方法在初始聚类中心选取方面进行了优化.通过搭建hadoop集群环境,采用spark计算框架,对选取的大量货票数据进行仿真.仿真结果显示,基于KFAV模型的铁路货运客户细分方法更加具有针对性,并且改进的K均值聚类方法提升了算法的效率,同时基于大数据分析的spark+hadoop平台极大地降低了客户细分的运行时间.  相似文献   

8.
k-means算法的改进和在保险业CRM中的应用   总被引:2,自引:0,他引:2  
针对k-means算法存在的不足,提出了一种改进算法.针对目前保险业CRM系统的特点提出了用聚类分析方法进行客户群细分模型设计,通过实验验证了本文提出的k-means改进算法的高效性;实验结果证明聚类分析算法在CRM中实施类分析方法的客户群细分过程模型是行之有效的.  相似文献   

9.
交通事故特征受地域分布影响显著,本文对交通事故特征进行优化聚类研究.基于 2019年无锡市交通事故数据,调用开放地图接口地理编码解算事故地点经纬度,使用密度聚类算法对事故地点与事故原因进行密度聚类.传统的密度聚类算法依赖距离阈值和样本数阈值的准确输入,为解决这一局限,建立一种自适应搜索距离阈值和样本数阈值的密度聚类模型,并与原始聚类模型进行对比.结果表明,优化算法在参数确定上更加智能,对簇的划分更加准确,对噪声点的识别更加合理.通过机器学习中轮廓系数计算方法计算模型得分,证明了该算法在城市道路交通事故地理位置聚类中的适用性.  相似文献   

10.
交通事故特征受地域分布影响显著,本文对交通事故特征进行优化聚类研究.基于 2019年无锡市交通事故数据,调用开放地图接口地理编码解算事故地点经纬度,使用密度聚类算法对事故地点与事故原因进行密度聚类.传统的密度聚类算法依赖距离阈值和样本数阈值的准确输入,为解决这一局限,建立一种自适应搜索距离阈值和样本数阈值的密度聚类模型,并与原始聚类模型进行对比.结果表明,优化算法在参数确定上更加智能,对簇的划分更加准确,对噪声点的识别更加合理.通过机器学习中轮廓系数计算方法计算模型得分,证明了该算法在城市道路交通事故地理位置聚类中的适用性.  相似文献   

11.
基于ArcGIS的CAD到GIS数据转换   总被引:4,自引:0,他引:4  
由于AutoCAD强大的绘图功能和处理矢量图形的能力,因此在数字地形图的生产中,大部分成果为AutoCAD的格式。从CAD数据与GIS数据的特点出发,以CAD数据与ArcGIS数据之间的转换为例,阐述CAD数据与GIS数据之间具体的转换方法,并以一幅地形图为例,实现CAD数据与ArcGIS数据之间的转换。  相似文献   

12.
以教师工作量计算为例,采用数据保护技术、业务中间件技术、数据描述可扩展技术以及灵活的数据交换技术,实现了基于数据再利用思想的教师工作量管理系统.实际效果表明,本系统充分利用原始数据,推进了高校办公信息化和智能化.  相似文献   

13.
随着交通信息化应用的不断深入,数据交换和数据共享的需求越来越强烈,信息资源整合已成为交通信息化建设的核心内容之一。本文以北京市为例,分析了交通行业信息化存在的主要问题,并根据交通行业管理特点,提出了数据中心建设的总体框架。数据中心是一项复杂的系统工程,它涉及到网络、系统集成、信息安全、数据库、数据挖掘、标准规范等信息工程领域的各个方面,本文选取中心局域网、共享交换平台和中心数据库这三个核心系统,分别给出了中心局域网和共享交换平台的架构设计思路,探讨了在不同条件下数据交换和数据整合的几种方法。  相似文献   

14.
以GIS为基础平台,数据为主线,研究了公路地理信息系统开发中数据处理与数据的集成方法.采集并组织了矢量数据、属性数据和栅格数据,实现了数据的浏览、检索,解决了数据集成中的2个重要问题:空间对象及其属性信息、图像数据的一体化;矢量数据与栅格数据的无缝集成.系统通过提供乡镇、河流、路网等的分布情况,已建公路及拟建公路沿线的相关信息,为路网规划、管理以及拟建公路的选线提供决策支持.  相似文献   

15.
激光线扫描测量数据点的处理方法研究   总被引:2,自引:0,他引:2  
在分析激光数字化测量数据点的基础上,提出利用圆心距偏差判别法对测量数据进行平滑处理,修正个别测量异常点位置,再利用基于弦高的自适应数据采样法,对数据点列进行精简,消除冗余数据,使数据点的分布自适应于曲线曲率,达到优化数据点的分布及减少描述曲线数据量的目的.实验结果表明该方法能够对测量数据进行较好的精简优化.  相似文献   

16.
阐述了数据抽样技术在ITS数据管理中的意义和作用,通过VB编程语言和ORACLE数据库技术实现了ITS数据抽样算法,并对北京三环路上和美国德克萨斯州圣安东尼奥的实时ITS数据进行了测试,测试结果表明,最佳抽样日对权重的变化不敏感,最佳抽样日数据与总体平均值匹配得较好,也包含了最多的原始数据的信息。  相似文献   

17.
基于粗分格网的空间对象范围索引   总被引:2,自引:0,他引:2  
在充分分析格网索引和空间对象范围索引的基础上,提出一种基于粗分格网的空间对象范围索引结构.对该索引结构的基本原理、数据组织方式、索引结构的实现和该索引结构在空间查询中的应用等都作了详细的论述,证明了该索引结构的有效性和可行性,该索引结构能有效减少索引数据存储量,降低查询所需的时间,并能显著提高空间查询的效率和查询定位精度.  相似文献   

18.
从数据处理技术的角度介绍了大数据的概念和特点,分析了大数据面临的挑战和研究现状,给出迎接大数据的几点思考。最后,结合湖北汽车工业学院的实情,提出了大数据研究的建议。  相似文献   

19.
随着交通大数据研究及应用日益广泛,其中存在的问题也越来越明显。很多分析结论存在概念模糊、数据质量不确定、分析方法不清晰等问题,导致分析结果经不起推敲,也缺乏可比性。究其主要原因是未能形成科学的大数据分析方法和统一的分析标准。提出基于CRISP-DM的交通大数据分析方法,包括目标要求、数据理解、数据准备、数据建模、模型验证、工程化应用(部署)6个阶段。结合重庆市交通大数据平台建设实践,以手机信令数据和车辆RFID数据为例,详细阐述数据理解、数据建模和模型验证三个重要步骤的具体做法,探索如何实现交通大数据分析的标准化、指标化和透明化。  相似文献   

20.
对面向ATMS共用信息平台的数据预处理技术进行了探讨.介绍了面向ATMS的共用信息平台的含义以及作用,探讨了面向ATMS共用信息平台的数据预处理技术,从故障识别,故障修复来对动态交通数据预处理方法进行了研究.该研究对于面向ATMS共用信息平台数据预处理提供了依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号