共查询到18条相似文献,搜索用时 46 毫秒
1.
入侵检测是维护网络安全的重要技术手段之一.本文提出一种聚类算法:k-cubes,用于网络异常检测.算法采用基于网格的方法对网络连接数据进行预处理,然后以网格为数据处理单位进行聚类,在聚类过程中通过动态合并与分裂自动决定聚类的数目.在此基础上给出了半监督k-cubes聚类算法,并根据聚类的结果生成检测规则.k-cubes聚类算法适合处理高维并且含有多值字符属性的大数据量数据,同时具有输入参数少等特点.在KDD99入侵检测数据集上的实验结果显示,算法获得95.82%的检测率和1.25%的误报率,并且在识别新入侵的能力上,算法检测到17种新入侵中的15种. 相似文献
2.
基于粗糙集和模糊聚类理论的文本分类系统的研究与实现 总被引:5,自引:0,他引:5
随着Internet的发展及广泛应用,越来越多的文本信息以待阅读和处理。文本分类成为众所关注但仍未很好解决的热门课题。本文提出一种基于粗糙集和模糊聚类(RS&FC)理论的文本分类新模型,详细讨论和分析了该模型的总体设计思想、主要实现技术和有关的算法及实现方案。该模型在分类规则产生之前,以训练样本直接聚类的结果构造信息表,并对表中的连续属性离散化,再对信息表中的特征词属性进行二次聚类,压缩文本特征子集的向量维数,提取关键字特征属性,建立决策信息表,然后利用粗糙集理论,采用启发式约简算法,对信息表进行约简,产生优化的分类规则,指导文本分类。最后通过实验和性能评价,本文提出的分类方法的分类准确率高于传统的K-最近邻分类(K-NN)法,提高了系统的适应性能和分类能力。 相似文献
3.
在铁路列车运行图调整日趋频繁的背景下,列车时刻表数据集具有数据量大、属性多、不同车次时刻表记录数量差异较大、相同车次时刻表记录属性值相似的特点,列车时刻表数据分析和挖掘面临着数据集不均衡问题。为此,提出基于属性相关分析与聚类的铁路列车时刻表非均衡数据集预处理方法,依据列车时刻表属性与列车运营指标(客座率)的相关分析,可有效合并蕴含冗余信息的相似数据,降低数据集中此类相似数据的占比,可削弱非均衡数据集对后续数据分析的不利影响,并能保留数据所蕴含的主要信息,减少过多相似数据对数据分析模型应用效果的不利影响,提高模型的预测准确度。 相似文献
4.
一种基于蚁群算法的聚类组合方法 总被引:26,自引:1,他引:25
蚂蚁等群居类昆虫被看作能解决复杂问题的分布式系统,研究者从它们的协作性能以及自组织、信息素通信、任务划分等机理中获得灵感,已在组合优化、通信网络、机器人等许多应用领域找到解决问题的新方法。聚类作为一种无监督的学习,能根据数据间的相似程度自动地进行分类。基于蚁群算法的聚类方法已经在当前数据挖掘研究中得到应用。本文提出的基于蚁群算法的聚类组合新方法,模仿多蚁群的协作性能,将运动速度类型各异的多个蚁群,独立而并行地进行聚类分析,然后组合其聚类结果为超图,再用蚁群算法对超图进行2次划分。实验结果表明,该方法能自动决定聚类的数目,聚类组合方法能明显改善聚类质量。 相似文献
5.
针对道岔转换设备在使用寿命内的功率信号特征提取与退化状态识别问题,提出基于自适应白噪声完备经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)与核模糊C均值聚类(Kernel-based Fuzzy C-Means clustering,KFCM)相结合的转辙机退化状态识别方法。首先,对S700K转辙机采集的功率曲线数据进行模态分解,得到多个固有模态函数(Intrinsic Mode Functions,IMFs),通过IMFs的能量幅值获得表征数据退化过程的特征向量;然后,由KFCM算法对特征向量进行转辙机退化状态识别,并进行状态划分;最后,通过计算分类系数和平均模糊熵对该方法的分类性能进行综合评估,并与模糊C均值聚类(Fuzzy C-Means clustering,FCM)和GK (Gustafson Keseel)聚类算法进行比较。结果表明:该方法聚类效果准确率达95.6%,优于FCM和GK聚类算法,能对转辙机的退化状态进行科学划分,为铁路现场道岔设备健康状态监测提供... 相似文献
6.
对异构数据库相似语义属性聚类过程及其关键技术进行研究,在词频-逆文件频率的基础上,提出数值类型属性信息的槽频率-逆文件频率处理方法,分别应用于文本信息和数值信息的相似语义属性聚类过程。研究结果表明:使用词频-逆文件频率和槽频率-逆文件频率方法相结合是异构数据库相似语义属性聚类实现的一种有效方法。 相似文献
7.
8.
为解决钢轨波磨人工检测费时费力及惯性法检测精度较低的问题,综合利用三维结构光技术、弦测法和密度聚类算法进行波磨检测。首先获取钢轨点云,通过纵向平面遍历轨头点云得到钢轨的纵向截面簇,其次利用弦测法计算相应纵向截面的谷深和波长。最后利用钢轨发生波磨时产生的接触斑,对遍历计算的谷深和波长分别进行密度聚类,将相同或相似接触斑的波磨信息聚类成簇,对聚类后各簇的结果进行统计分析得到相应钢轨的波磨信息。本方法结合三维结构光数据量大、弦测法计算直接明确的优点,通过密度聚类将不同深度、大小的波磨接触斑进行区别,有效地将钢轨波磨不同谷深及波长成分进行分类计算。实验室样件试验及现场试验表明,本方法能够实现对钢轨波磨的精确检测。 相似文献
9.
为合理划分轨道交通运营时段并指导其开行方案,提出一种基于有序样本聚类技术的运营时段划分方法。根据统计时段内客流数据,引入单向OD(origin-destination)概率矩阵,并给出单向OD概率矩阵的时序模型和提取方法;利用有序样本聚类方法,以最优分割法量化站间客流转移规律,求解聚类方案。最后以某一轨道交通线路为例,提取时间间隔为20 min的上行OD概率矩阵时间序列,以最优分割法进行聚类,将站间客流转移规律相近的统计时段归为一类,提出目标线路运营时段划分方案。 相似文献
10.
对于频率受限的铁路数字移动通信系统GSM-R(Global System for Mobile-Railway),频率规划问题至关重要。以往的频率规划方法普遍存在精确度低、复杂度高的问题,这将不能满足对精度和时延有较高要求的铁路数字移动通信系统。本文基于铁路数字移动通信系统特性,引入粗糙集理论和灰色聚类理论,综合多种电波传播模型,确定影响频率规划的属性,衡量每个属性的权重及其门限值,并对各种可行的频率规划方案进行灰聚类评估,进而给出最优的频率规划方案。最后结合实际工程建设情况和仿真平台,对多种频率规划方法进行对比。理论推导和仿真证明,这种频率规划方法可以提高电平和干扰矩阵估计的精确度。 相似文献
11.
基于设施属性的城市轨道交通融资模式 总被引:1,自引:0,他引:1
以项目区分理论为理论基础,从轨道交通的基本属性入手,按照可经营性和可拆分性对轨道交通基本设施进行分类,对不同属性的设施进行组合.按照所有权和经营权是否转移,将各种适用于轨道交通的融资方式进行分类;并将两者进行匹配,提出了符合轨道交通客观发展规律、可供轨道交通建设发展采用的多元化融资模式及其评价方法. 相似文献
12.
13.
GSM-R作为铁路通信调度数据的承载网络,其网络的稳定和畅通对于保证铁路运输安全、高效运行至关重要。由于铁路沿线的桥梁、隧道、边坡、路堑等各种复杂传输环境,使得GSM-R网络中的基站等网元易遭受自然灾害的影响。针对GSM-R基站设施毁坏或终端处于信号覆盖盲区的情形,在GSM-R系统中引入多跳组网方式,并提出一种适用于GSM-R应急多跳网络的分簇算法。性能分析和仿真结果表明:在终端数目较多以及终端移动性较高的情形下,文中的分簇算法具有优良的簇维护开销和网络稳定度性能,适用于铁路应急通信需求。 相似文献
14.
通过对轨道交通经济属性的系统阐述,来探讨作为共产品的轨道交通的供给模式。深入分析了WTO背景下政府职能转变及其与轨道交通系统体制创新的关系。对政府是否一定要成为轨道交通的投资主体,轨道交通投资主体是否要计划折旧等问题提出了见解。 相似文献
15.
基于二次误差测度的带属性三角网格简化算法 总被引:4,自引:0,他引:4
给出一种基于边折叠和二次误差测度的快速简便的算法来简化带属性的网格模型。该算法通过分别建立几何和颜色属性二次误差测度来计算几何和颜色属性误差,用几何与颜色属性误差的总和来控制网格简化的顺序和精度。边折叠是根据某种误差测度将候选的边按照折叠代价排序,每次取代价最小的边进行折叠操作,直至满足给定的终止条件。二次误差测度采用点到平面距离的平方作为误差测度。应用实例表明,该算法既能保证简化模型同初始模型在几何上尽可能相似,又能较好地保留初始模型的颜色、纹理等属性信息。 相似文献
16.
17.
18.
城市轨道交通涉及的机电设备系统种类繁多,依据系统间的相互关系所具备的专业性、重要性、先进性、成熟性、关联性、复杂性、专属性、系统性等外在属性论述这些机电设备.从线网规划、建设规划、可行性研究到设计、设备采购、设备安装、系统调试、试运行等阶段,机电设备各系统表现出不同的外在属性,应按照不同阶段、不同目标区别对待,抓住各阶段的关键问题,从而顺利完成城市轨道交通工程建设. 相似文献