首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 171 毫秒
1.
基于粗糙集和混合聚类法的决策表约简算法   总被引:3,自引:0,他引:3  
在分析粗糙集理论、分层聚类算法和k-means聚类算法的基础上,提出一种基于粗糙集和混合聚类法的决策表约简算法,该算法首先是使用基于分层聚类的k-means混合聚类法离散化决策表中的连续属性,然后利用粗糙集理论对离散后的决策表进行属性约简,得到决策规则集,并通过在铁路客运量预测系统中的应用验证了算法的可行性和有效性.  相似文献   

2.
针对粗糙集中连续属性的离散化问题,提出了一种基于断点选择的离散化方法.首先对条件属性进行重要性排序,选用有效的启发式规则作为获取近似最优断点的依据;然后以信息熵和决策表的相容度作为约束条件,生成离散化数据.最后采用UCI数据对此算法的性能进行了检验,并与其他算法做了对比实验.实验结果表明此算法是有效的,而且当属性值的出现频率和样本数较多时仍有很高的计算效率.  相似文献   

3.
高速公路收费数据是一种高维、海量、分布特征未知的数据集,因此难以选择 何种算法和参数最适合此类数据的聚类.针对此问题,提出一种基于簇形均衡的聚类评估 指标IBCS,对各簇的形状、分布、密度和尺寸等多种形态进行均衡综合评估.该指标根据 数据集稀疏程度自适应调整邻域置信区间来度量簇结构的分散度和分离度;度量密度使 得IBCS 具有面向数据集的算法选择能力;度量簇大小避免簇划分过于悬殊的问题.UCI 数据集上多种候选算法评估比较实验验证了该指标灵活有效,能获得准确簇数并合理划 分.最后,基于IBCS 评估的西宝高速公路收费数据聚类结果表明,采用K-means 算法,簇 数为5时聚类模式最佳.  相似文献   

4.
为估计数据集的聚类数目及获得较好的聚类性能,提出了一种基于灰关联测度的分裂式层次聚类算法.该算法用灰关联测度衡量数据对象之间的相似程度,以基于密度扩展的方式自顶向下分裂成不同层次的数据集划分;然后,根据灰关联测度定义聚类有效性指标;最后将有效性指标曲线极值点对应的聚类划分用于估计最佳聚类数目.实际数据和合成数据集的实验表明,与FCM聚类相比,该算法的聚类正确率平均提高3.7%,并且能够识别任意形状的簇.  相似文献   

5.
对铁路通道内客运市场的细分,是研究铁路通道客流分担、客运产品设计的基础. 根据宝鸡-兰州铁路通道旅客出行方式选择调查数据,结合粗糙集理论,首先,构建了铁路通道旅客出行方式选择决策表,对条件属性进行属性约简,并计算各属性的权重;其次,考虑到避免传统聚类算法的“维数陷阱”,提出了基于粗糙属性重要度的K-means聚类算法,并在UCI数据集上进行仿真实验;最后,运用该算法对调查数据样本进行聚类.结果表明:将铁路通道客运市场细分为6类时,具有最好的聚类效果;经统计分析发现,不同子市场的旅客出行行为有明显的偏好.  相似文献   

6.
基于粗约简的数据流增量聚类算法   总被引:1,自引:1,他引:0  
针对数据流聚类算法CluStream需预先指定微聚类数目无法准确描述数据流的变化,进而影响最终聚类结果的缺陷,提出了基于粗约简的数据流增量聚类算法RICStream(rough incremental clustering stream).该算法在保证聚类精度的前提下,对参与聚类的数据流属性进行动态调整,有效地减少了聚类时间和计算量.提出了一种可增量调整的网格结构以存储数据流,保证了聚类结果能有效反映数据流的变化情况.基于真实数据集和仿真数据集的实验结果表明,RICStream算法具有较高的效率和聚类精度.  相似文献   

7.
属性序下的增量式Pawlak约简算法   总被引:3,自引:0,他引:3  
为了对动态变化的决策表进行属性约简处理,在给定的属性序下,提出了一种基于分辨矩阵元素集的增量式Pawlak约简算法.该算法根据新增对象的不同情况快速更新分辨矩阵元素集,并依据其元素的变化,在给定属性序下快速更新Pawlak约简.实例和仿真实验结果表明,该算法是有效、可行的,与非增量式算法相比,效率平均提高91.4%.  相似文献   

8.
两阶段混合粒子群优化聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
为解决数据集样本维数较高时已有粒子群优化K均值算法计算速度较慢且聚类结果不稳定的问题,利用第1阶段聚类层次凝聚聚类获得准确率较高的子簇集合,作为粒子群优化K均值聚类算法初始聚类中心的搜索空间,进行第2阶段聚类.提出了一种简化的粒子编码方法,以减小样本维数对计算复杂度的影响;引入混沌的思想,以保持粒子种群的多样性,从而避免粒子群优化算法可能出现的早熟现象.通过两阶段聚类,有效地融合了粒子群优化、层次聚类与划分聚类算法的优点.在多个UCI数据集上的聚类结果表明,与几种对比算法聚类结果的最优值相比,其纯度分别提高了1%~8%,且耗时减少50%以上.   相似文献   

9.
针对激光雷达动态障碍物检测与跟踪过程中聚类适应性差、实时性低和跟踪准确度不高等问题,提出一种自适应的密度聚类算法和多特征数据关联方法,分别用于检测和跟踪. 首先,对激光雷达采集的点云进行路沿检测、感兴趣区域提取和地面分割等预处理,去除无关点云;然后,基于自适应的密度聚类算法对非地面的点云进行聚类,完成障碍物点云检测;最后,利用加权多特征数据关联算法结合卡尔曼滤波器实现对动态障碍物跟踪. 通过实验表明:本算法能够根据10 Hz的激光雷达数据实现对障碍物准确、稳定的检测和跟踪,且聚类时间缩短32%.   相似文献   

10.
针对模糊C均值算法随机选择初始聚类中心导致聚类结果对噪声样本点敏感性的不足, 采用局部密度加权的方法, 将初始聚类中心的选择范围限制在局部密度较高样本点区域, 优化初始聚类中心的选择方法; 利用样本点的局部密度改进目标函数, 提高局部密度较高的样本点在目标函数迭代过程中的影响力, 从而提升模糊C均值算法的聚类性能, 并采用人造数据集和鸢尾花真实数据集验证优化的局部密度模糊C均值算法的聚类效果; 通过计算锚泊船位置数据的局部密度, 分析了船舶锚泊偏好。试验结果表明: 对比模糊C均值算法, 优化的局部密度模糊C均值算法聚类精准率提高了2.9%, 召回率提高了3.8%, F度量值提高了3.9%, 说明优化的局部密度模糊C均值算法的性能优于模糊C均值算法; 在锚泊船位置数据上的聚类结果正确反映了天津港锚泊船的聚集特点和锚泊偏好, 其结果与船舶的常规做法一致, 说明优化的局部密度模糊C均值聚类算法是一种分析锚泊船聚集特性和锚泊偏好的有效方法。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号