首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对Internet上日益泛滥的色情信息,提出了一种语义链技术和向量空间模型相结合的方法,利用语义链技术找出待分类文本的语义链,由该语义链的各密度向量分量与色情(性文化)文本语义进行比较,来确定其与待分类文本的相似程度,从而将待分类文本分到对应的类中,最后可以使用先前的分类结果对色情信息实施过滤,通过实验表明,该方法能较好的识别色情网页并加以过滤.  相似文献   

2.
基于中心性和PageRank的网页综合评分方法   总被引:1,自引:0,他引:1  
为准确、高效地对网页进行评分,提出了一种基于中心性(结点度、居间度和紧密度)和PageRank算法的网页评分方法CentralRank.它采用PageRank算法计算网页分数,借助中心性度量的方法计算页面在Web社会网络中的重要性.为了验证CentralRank的性能优势,设计了一个网页抓取器,可利用该抓取器自动、准确地下载网页信息.该网页抓取器集成了网络信息采集、页面内容分析和页面消重3项技术.基于大量真实数据的实验结果表明:CentralRank在保证网页评分时间性能的前提下,比单纯基于中心性的网页评分算法和PageRank算法更准确、有效,预测准确性分别提高约14.2%和7.5%.  相似文献   

3.
在基于数据挖掘的质量控制方法的基础上,针对数据挖掘需要领域专家参与的局限性以及新的制造模式的出现,引入了本体的理论及其方法,提出了一种新的质量控制方法--基于本体协助的数据挖掘质量控制方法,在数据挖掘的各个环节提出了具体的方法和算法,将本体的协助用于数据挖掘的全过程,并在此基础上针对生产过程进行质量控制建模,最后在浪潮超越数控实验室中用车削螺纹的质量数据对模型进行了仿真试验.  相似文献   

4.
为了提高PageRank算法的准确性,从网络用户对已知网页进行评价的角度引入网页等级,从网页链接分析的角度解决权威性需求.结合网页链接分析和页面内容分析提出一种改进的PageRank算法PRP(PageRank based on Page-level).实验证明,算法为扩展PageRank提供了广阔的空间,通过选择合适的参数page-level,可以提高传统PageRank算法的网页排序的准确性,有效防止恶意链接对pagerank排序值(PR值)造成的影响.  相似文献   

5.
针对互联网中信息内容的安全问题,提出了一种基于双层规则的内容安全过滤方法,即通过基于逻辑规则提取的EOCAT分类算法和针对非法文本的特殊词规则构造文本分类器,实现对非法文本的识别.最后进一步讨论了针对各层规则的相关反馈的实现.实验结果表明,该分类方法对于非法文本具有较好的识别效果.  相似文献   

6.
基于双层规则的内容安全过滤方法   总被引:1,自引:0,他引:1  
针对互联网中信息内容的安全问题,提出了一种基于双层规则的内容安全过滤方法,即通过基于逻辑规则提取的EOCAT分类算法和针对非法文本的特殊词规则构造文本分类器,实现对非法文本的识别.最后进一步讨论了针对各层规则的相关反馈的实现.实验结果表明,该分类方法对于非法文本具有较好的识别效果.  相似文献   

7.
离群数据发现与分析是数据挖掘的重要组成部分,现有离群数据挖掘算法主要针对如何检测离群对象,缺乏对挖掘出的离群数据集进行解释与分析的有效方法.通过对离群数据来源及特性进行分析,定义了离群贡献度的概念,提出了一种基于特征赋权的离群数据再聚类算法.实验表明,该算法可以有效地揭示离群数据产生来源,有助于对整体数据集的更全面了解.  相似文献   

8.
为了提高PageRank算法的准确性,从网络用户对已知网页进行评价的角度引入网页等级,从网页链接分析的角度解决权威性需求.结合网页链接分析和页面内容分析提出一种改进的PageRank算法PRP(PageRank based on Page-level).实验证明,算法为扩展PageRank提供了广阔的空间,通过选择合适的参数page-level,可以提高传统PageRank算法的网页排序的准确性,有效防止恶意链接对pagerank排序值(PR值)造成的影响.  相似文献   

9.
为了实现文本代表性语义词汇的抽取,提出一种基于词组主题建模的文本语义压缩算法SCPTM(semantic compression based on phrase topic modeling).该算法首先将代表性语义词汇抽取问题转化为最大化优化模型,并通过贪心搜索策略实现该模型的近似求解.然后,利用词组挖掘模型LDACOL实现词组主题建模,得到SCPTM算法的输入参数;同时,针对该模型中词组的主题分配不稳定的问题进行改进,使得取得的代表性语义词汇更加符合人们对语义的认知习惯.最后,将改进LDACOL模型与LDA模型、LDACOL模型以及TNG模型的主题挖掘性能进行实验比较,并利用SCPTM算法针对不同语料库进行语义压缩,根据聚类结果评价其有效性.实验结果表明,在多数情况下,改进LDACOL模型的主题抽取效果优于其他3种模型;通过SCPTM算法抽取代表性语义词汇能达到70%~100%的精度,相比PCA、MDS、ISOMAP等传统降维算法能获得更高的聚类效果.   相似文献   

10.
分析了基于关联规则的增量数据挖掘算法,指出其效率低下的原因,针对传统数据挖掘算法多次迭代扫描,每次迭代产生数目更大的频繁项集的不足,提出链表增量数据挖掘算法LIUA,并将该算法应用于区域性车辆自动识别管理系统中,有效地挖掘出系统中的关联规则,对挖掘出的关联规则进行了分析.通过测试结果表明该算法是合理有效的.  相似文献   

11.
近年来高校的快速发展促使学校内部收集了大量的数据,并且迫切需要将这些数据转换成有用的信息和资料,为资产的管理提供有效的保障,本文就数据挖掘技术中决策树学习算法运用于资产的优化分配问题进行了探讨。  相似文献   

12.
为了有效支持轨道交通突发事件的应急管理,构建面向轨道交通应急管理的信息集成及应用平台,集成各种分布的异构数据,并根据不同决策需求进行分析以快速响应决策者的需要.首先讨论城轨交通应急管理流程及信息流;再对平台的三个主要模块的结构和功能进行分析:一是基于XML的分布式异构数据集成模块;二是基于应急事件分级以选择不同挖掘算法的数据挖掘模块;三是基于城轨交通应急决策模型组合链构建的决策支持模块;融合这三个模块得到的信息处理平台,可以在实现各种分布异构应急数据集成的基础上,满足轨道交通应急决策实时性要求及解决应急管理各阶段决策模型契合度差等问题.最后利用一个实例详细说明平台信息集成及应用过程.  相似文献   

13.
机车是铁路运输生产的重要牵引设备,通过整合利用机车各类数据,构建基于设备画像的机车标签体系,有利于客观、全面地掌握机车质量状态,实现机车的精准画像、差异化运维和精细化管理。本文通过总结机车设备画像的概念和标签技术的相关理论知识,提出满足机车质量分析、运维优化及安全决策等多个应用场景的机车设备画像3级标签体系技术架构,全面分析所包含的数据采集层、标签库层和标签应用层,详细阐释机车各级标签的内容及其生成、管理、优化和分析流程,形成机车设备画像研究方法。针对聚类这一标签的产生方式,通过改进K-means聚类算法的初始质心选取方法,提高标签获取的精度和稳定性。并在某铁路局开展机车设备画像实地应用研究,形成完整可行的机车标签体系。  相似文献   

14.
在车联网应用发展的背景下,许多城市的私家车和出租车上安装了配备GPS 设备的智能终端, 产生着大量的时空轨迹数据.为挖掘这些数据蕴含的驾驶员出行特征, 本文以北京市出租车时空轨迹数据为例,基于时空GIS 的视角提出并实现了驾驶员居住 地挖掘方法和作息规律性分析方法. 样本实验结果一方面展示了驾驶员居住地空间分 布,另一方面表明作息规律性总相似度在0.6–1之间的驾驶员数量较多,占到了总数的 73.75%.通过本文方法挖掘的信息可为出租车的管理提供辅助决策,方法同样适用私家 车时空轨迹数据的挖掘,对私家车出行规律的研究和掌握更有意义.  相似文献   

15.
部署在铁路路基监测区域内的无线传感器网络(WSN),由于节点能量和带宽等资源的限制,要求数据的采集、处理、传输满足低能耗、高效率和高可靠性. 本文提出面向智能监测的无线传感器网络分簇部署策略,在感兴趣的区域内部署尽量多的节点,并根据数量类型、环境特征等因素将网络以簇为单位进行划分. 以簇为单位,采用自适应加权数据融合处理技术,将采集的地温数据按照精度分别乘以权重值再进行平均值处理,有利于降低数据冗余度,提高数据准确度和采集效率. 仿真性能分析表明,该方法可以显著提高数据传输效率,降低网络能耗,延长网络生命周期.  相似文献   

16.
部署在铁路路基监测区域内的无线传感器网络(WSN),由于节点能量和带宽等资源的限制,要求数据的采集、处理、传输满足低能耗、高效率和高可靠性. 本文提出面向智能监测的无线传感器网络分簇部署策略,在感兴趣的区域内部署尽量多的节点,并根据数量类型、环境特征等因素将网络以簇为单位进行划分. 以簇为单位,采用自适应加权数据融合处理技术,将采集的地温数据按照精度分别乘以权重值再进行平均值处理,有利于降低数据冗余度,提高数据准确度和采集效率. 仿真性能分析表明,该方法可以显著提高数据传输效率,降低网络能耗,延长网络生命周期.  相似文献   

17.
1.Institute of Transportation Engineering, Tsinghua University, Beijing 100084,China; 2.Bureau of Lanzhou Urban Planning and Management, Lanzhou 730030,China  相似文献   

18.
提出一种基于语义模型关联规则的局域网数据检索方法.首先基于概念树描述语义模型并建立FP-树频集算法,通过概念映射将数据源与语义模型进行语义关联,在此基础上,进行噪声过滤并列出主题关键词,从而提高局域网的数据检索速度和一次查询效率.  相似文献   

19.
Itiswellknownbyneurosurgistsandorthopediststhatbulbar-cervicaldorsalcompressionlesionscanberesectedviaposteriorapproaches,butitisdifficulttoresecttheventralcompressionlesions.Withtheimprovementofimage,microsurgicaltechniqueandinstruments,theresection…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号