排序方式: 共有151条查询结果,搜索用时 15 毫秒
31.
基于粗糙集和模糊聚类理论的文本分类系统的研究与实现 总被引:5,自引:0,他引:5
随着Internet的发展及广泛应用,越来越多的文本信息以待阅读和处理。文本分类成为众所关注但仍未很好解决的热门课题。本文提出一种基于粗糙集和模糊聚类(RS&FC)理论的文本分类新模型,详细讨论和分析了该模型的总体设计思想、主要实现技术和有关的算法及实现方案。该模型在分类规则产生之前,以训练样本直接聚类的结果构造信息表,并对表中的连续属性离散化,再对信息表中的特征词属性进行二次聚类,压缩文本特征子集的向量维数,提取关键字特征属性,建立决策信息表,然后利用粗糙集理论,采用启发式约简算法,对信息表进行约简,产生优化的分类规则,指导文本分类。最后通过实验和性能评价,本文提出的分类方法的分类准确率高于传统的K-最近邻分类(K-NN)法,提高了系统的适应性能和分类能力。 相似文献
32.
针对传统的基于区分矩阵属性约简算法在构建区分矩阵时生成很多冗余元素,空间和时间性能上不够理想的缺点,利用动态数组及新的约简过程进一步改进,最后把新的属性约简算法应用到决策树的构建上,实验证明,该算法能够提高决策树分类性能. 相似文献
33.
复杂交通区域的交通状况难以利用具体模型直接描述,而粗糙集理论能够在分析大量经验数据的基础上找到用于决策的规则。以交大东路上的行人和机动车为研究对象,提出一种基于粗糙集的信号配时算法,对交大东路上的两个相邻交叉口的信号灯进行控制,提出控制规则,对该复杂交通区域进行优化和疏导,是对多交叉口交通管理与控制的一次有益尝试。 相似文献
34.
数据挖掘技术在高校学生成绩分析中的应用 总被引:1,自引:0,他引:1
数据挖掘是数据仓库技术中的重要技术之一,也是计算机行业中发展最快的领域之一,它使数据库技术进入了一个更高级的阶段,并迅速扩大成为一个独立的领域。在讨论目前高校教学中存在问题的基础上,简单介绍粗糙集理论及数据挖掘技术。以高校学生成绩为例,提出基于粗糙集理论的数据挖掘技术在高校学生成绩分析中应用的解决方案。 相似文献
35.
为了解决交通检测器检测到的数据存在丢失的问题,提出了一种基于粗集理论的丢失数据补齐方法。利用检测到的交通流数据构造信息系统,通过计算扩充可辨识矩阵,并对其进行多次完整化分析,实施丢失数据的补齐,并采用英国南安普敦市的实际检测数据对算法进行了验证。研究结果表明:同一时间段,当仅有一个属性数据丢失时,粗集理论的补齐精度较高,绝对相对误差较小,基本保持在0~5%之间;当不同属性的数据同时丢失时,补齐精度较低,绝对相对误差甚至高达20%;当所有属性数据全部丢失时,补齐精度非常低,可视为无法实现补齐。可见,粗集理论是一种补齐少量丢失数据的有效方法。 相似文献
36.
针对可辨识矩阵求核方法无法兼顾正确性与高效性的问题,首先从理论上证明了可辨识矩阵中单个元素与核的关系,在此基础上,设计了一种Skowron可辨识矩阵的改进方法以及基于这种改进的Skowron可辨识矩阵的属性核求解方法,该方法不仅适用于任何决策表信息系统,而且有效降低了计算代价. 相似文献
37.
This paper presents a generalized method for updating approximations of a concept incrementally, which can be used as an effective tool to deal with dynamic attribute generalization. By combining this method and the LERS inductive learning algorithm, it also introduces a generalized quasi-incremental algorithm for learning classification rules from data bases. 相似文献
38.
驼峰超速连挂事故受多种因素影响,运用粗集相关理论分析线路、调速设备和车流等事故因素,引入遗传算法进行属性约简,得到包括驼峰设计和运营线路纵断面变化、调速设备合理配置和新型重载车辆等几个关键影响因素。通过对影响因素分析能够在决策时给出科学依据,以此降低或避免事故发生的可能性。 相似文献
39.
基于评价指数的属性约简算法 总被引:1,自引:0,他引:1
从粗糙集理论出发,提出可分辨关系和对象差异矩阵的概念,并以此为基础构造出基于评价指数的属性约简算法.算法采用自底向上的方法,利用属性的评价指数作为启发式信息,求得属性集合的约简.在多个UC I数据集上进行试验,理论分析和实验数据表明,文中提出的属性约简算法是有效、可行的,具有较高的效率. 相似文献
40.