首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 903 毫秒
1.
针对互联网中信息内容的安全问题,提出了一种基于双层规则的内容安全过滤方法,即通过基于逻辑规则提取的EOCAT分类算法和针对非法文本的特殊词规则构造文本分类器,实现对非法文本的识别.最后进一步讨论了针对各层规则的相关反馈的实现.实验结果表明,该分类方法对于非法文本具有较好的识别效果.  相似文献   

2.
基于双层规则的内容安全过滤方法   总被引:1,自引:0,他引:1  
针对互联网中信息内容的安全问题,提出了一种基于双层规则的内容安全过滤方法,即通过基于逻辑规则提取的EOCAT分类算法和针对非法文本的特殊词规则构造文本分类器,实现对非法文本的识别.最后进一步讨论了针对各层规则的相关反馈的实现.实验结果表明,该分类方法对于非法文本具有较好的识别效果.  相似文献   

3.
弹性网格和方向线素特征已广泛应用于许多手写汉字识别系统中,并认为是目前较成熟和有效的手写体汉字特征.本文将传统弹性网格特征和方向线素特征相结合然后运用BP神经网络对其进行识别.实验证明,本文特征提取方法在识别率上优于传统的弹性网格方法.  相似文献   

4.
With the rapid increase of educational resources, how to search for necessary educational resource quickly is one of most important issues. Educational resources have the characters of distribution and heterogeneity, which are the same as the characters of Grid resources. Therefore, the technology of Grid resources search was adopted to implement the educational resources search. Motivated by the insufficiency of currently resources search methods based on metadata, a method of extracting semantic relations between words constituting metadata is proposed. We mainly focus on acquiring synonymy, hyponymy, hypernymy and parataxis relations. In our schema, we extract texts related to metadata that will be expanded from text spatial through text extraction templates. Next, metadata will be obtained through metadata extraction templates. Finally, we compute semantic similarity to eliminate false relations and construct a semantic expansion knowledge base. The proposed method in this paper has been applied on the education grid.  相似文献   

5.
为有效识别任意两篇报道的相似性,提出了一种基于语义相似度的话题关联检测算法.该算法首先通过计算特征词之间的相对熵作为两篇报道中特征词之间的语义相似度;其次,通过计算平均语义相似度获得特征词和报道之间的关联度;最后,结合特征词在语料库中的TF-IF(term frequency-inverse document frequency)权重计算两篇报道之间的关联度,实现报道之间的关联度检测.本文提出的方法与现有的向量空间模型方法和仅依赖于平均点互信息的方法进行了比较,并通过TDT4中文语料进行测评,结果表明,基于语义相似度的关联检测方法能够更好地利用文本的语境信息,提高了现有检测系统的性能,其最小DET(detection error tradeoff)代价降低了3%.   相似文献   

6.
With the purpose of improving the accuracy of text categorization and reducing the dimension of the feature space,this paper proposes a two-stage feature selection method based on a novel category correlation degree(CCD)method and latent semantic indexing(LSI).In the first stage,a novel CCD method is proposed to select the most effective features for text classification,which is more effective than the traditional feature selection method.In the second stage,document representation requires a high dimensionality of the feature space and does not take into account the semantic relation between features,which leads to a poor categorization accuracy.So LSI method is proposed to solve these problems by using statistically derived conceptual indices to replace the individual terms which can discover the important correlative relationship between features and reduce the feature space dimension.Firstly,each feature in our algorithm is ranked depending on their importance of classification using CCD method.Secondly,we construct a new semantic space based on LSI method among features.The experimental results have proved that our method can reduce effectively the dimension of text vector and improve the performance of text categorization.  相似文献   

7.
联机连续文本识别是字符识别技术领域中新的研究方向.基于分层构筑法(Level-Building, LB)和动态时间规整算法(Dynamic Time Warping, DTW)建立了面向连续手写文本识别的手写部件识别器。将部件看作笔段和连续文本的中间模式,根据手写文本的特点建立了由484个手写部件构成的部件集.提取笔段的长度、角度等特征用于LB中每一层的DTW网格匹配中.测试样本包括6763个汉字和303个连续手写文本.实验结果表明手写体部件集能够有效地支撑笔段和连续文本之间的联系,串识别率达到86.47%。  相似文献   

8.
为提高电机故障诊断的准确率和有效性,提出了一种故障特征提取与强化的新方法.即在对所采集的交流电机振动加速度信号进行数据预处理之后,用盲源分离方法进行独立振动源的分离,然后采用小波包分析方法进行特征提取,并进行特征频带的简化及特征强化处理,特征强化后的数据作为交流电机故障诊断模型的输入.该方法通过对振动加速度信号进行分离,能够分离出混合信号中的独立振动源,提高了故障特征提取的正确率和准确度;通过对特征频带化简,减少了故障诊断模型的输入,进而简化了模型的结构;特征强化使模型能够更有效地识别故障状态.  相似文献   

9.
Web pages contain more abundant contents than pure text ,such as hyperlinks,html tags and metadata et al.So that Web page categorization is different from pure text. According to Internet Chinese news pages, a practical algorithm for extracting subject concepts from web page without thesaurus was proposed, when incorporated these category-subject concepts into knowledge base, Web pages was classified by hybrid algorithm, with experiment corpus extracting from Xinhua net. Experimental result shows that the categorization performance is improved using Web page feature.  相似文献   

10.
针对倾斜摄影测量三维重建得到的三维模型在地物拐角棱线处结构粗糙、噪声较大、规则性缺失,难以快速准确提取出理想特征线的难题,提出一种基于多目标加权最短路径的特征线提取方法.首先对模型进行预处理,使模型具有完整、连续的拓扑结构,并将模型以有向图结构进行组织;其次顾及距离、方向和三角网变化趋势计算权重,约束迪杰斯特拉算法获取...  相似文献   

11.
针对单独的纹理特征只能提取图像的纹理信息而不能得到图像轮廓边缘信息的问题,在人脸识别的特征提取研究中提出了分层CS-LBP和分层HOG特征的融合方法.对图像分别进行多次CS-LBP和HOG特征的提取,得到分层CS-LBP特征提取图像和分层HOG特征提取图像,对分层的特征提取图像再次提取分层CS-LBP和分层HOG特征,并将两种分层特征进行融合,得到更有效的人脸的纹理及边缘轮廓特征.在ORL和GT人脸库上的实验结果验证了所提出的分层特征融合方法的有效性.  相似文献   

12.
水中目标水压场信号特征提取与检测研究   总被引:4,自引:1,他引:4  
利用目标信号功率主要集中在低频部分的特点,用功率谱估计方法提取低频信号的能量作为特征,提出了所谓的浮动阈值方法,对信号滑动地进行目标检测.通过对实验船模水压场信号进行检测验证。讨论了在各种不同情况下,目标信号的特征提取及目标检测方法的效果,验证了该方法的有效性.  相似文献   

13.
基于文本挖掘的道路运输安全风险源辨识模型   总被引:1,自引:0,他引:1       下载免费PDF全文
为了解决当前道路运输安全风险源辨识工作中数据短缺和人员工作量较大的问题,从文本挖掘的角度出发,提出一种能够自动辨识道路运输过程中安全风险源的模型.该模型首先对道路运输文本进行因果句提取,并对因果句进行分词操作,实现安全风险源特征的增强;其次,进行适应卷积神经网络(convolutional neural network...  相似文献   

14.
传统数据驱动剩余寿命的预测方法是通过信号处理从监测数据中手动提取特征并构建健康指标,而在大数据背景下,手动提取特征需要特定专家知识并耗费大量人力,为解决该问题,提出了一种基于特征学习的机械设备剩余寿命预测方法——自适应特征学习寿命预测方法(AFLRULP). 该方法构建移动窗口数据矩阵解决单次采样中的数据波动问题,并建立了多层一维卷积神经网络将数据矩阵映射为机械设备的健康状态;根据失效阈值可以计算出机械设备的剩余寿命;采样轴承全寿命周期数据集合对提出的AFLRULP进行验证,并且与传统基于手动提取特征的方法进行寿命预测准确性的对比. 研究结果表明:AFLRULP不需要人工提取特征,可从原始监测数据映射为机械设备的性能状态与剩余寿命,相对于现有的基于手动提取特征的寿命预测方法,提出的方法在轴承寿命预测累积相对准确率上平均提高了0.20.   相似文献   

15.
针对面向中文自由文本的部分-整体关系抽取问题,提出一种基于无监督学习的方法. 首先提出子模式提取算法,从领域文本集中获取概念对和概念对所在上下文模式,利用概念对和概念对上下文模式建立分布式语义模型;然后采用协同聚类算法将具有相同语义关系的概念对聚合成簇,通过训练L1正则化逻辑回归模型提取簇的特征并得到代表每个簇语义关系的概念对上下文模式;最后根据模式识别表达部分-整体关系的簇,从而获取部分-整体关系概念对. 实验结果表明,该方法取得较好的性能,F度量达到68.97%,优于传统聚类方法(55.77%)和模式匹配方法(61.95%).   相似文献   

16.
This paper proposed a new method of semi-automatic extraction for semantic structures from unlabelled corpora in specific domains. The approach is statistical in nature. The extracted structures can be used for shallow parsing and semantic labeling. By iteratively extracting new words and clustering words, we get an inital semantic lexicon that groups words of the same semantic meaning together as a class. After that, a bootstrapping algorithm is adopted to extract semantic structures. Then the semantic structures are used to extract new key words and augment the semantic lexicon. The resultant semantic structures are interpreted by persons and are amenable to handediting for refinement. In this experiment, the semi-automatically extracted structures SSA provide recall rate of 84.5%.  相似文献   

17.
Aiming at the existing problems of discrete cosine transform (DCT) de-noising method, we introduce the idea of wavelet neighboring coefficients (WNC) de-noising method, and propose the cosine neighboring coefficients (CNC) de-noising method. Based on DCT, a novel method for the fault feature extraction of hydraulic pump is analyzed. The vibration signal of pump is de-noised with CNC de-noising method, and the fault feature is extracted by performing Hilbert-Huang transform (HHT) to the output signal. The analysis results of the simulation signal and the actual one demonstrate that the proposed CNC de-noising method and the fault feature extraction method have more superior ability than the traditional ones.  相似文献   

18.
提出了利用角点信息提取嘴唇特征的方法.在可变形模板的框架下,利用以前方法中没有用到的角点信息,提出了基于角点信息的能量函数.该能量函数能够更为精确地反映嘴角点和牙齿区域的特征,跟踪嘴唇的变形.实验结果表明,该方法能更鲁棒地提取嘴唇轮廓特征.  相似文献   

19.
在交通标志识别问题上,提出了一种基于融合式的空间塔式算子和直方图交叉核支持向量机(HIK-SVM)的分类方法.在该方法中,通过提取图像的灰度塔式词袋直方图(Gray-PHOW)特征、颜色塔式词袋直方图(Color-PHOW)特征和塔式边缘方向梯度直方图(PHOG)特征来对交通标志的外观、颜色和轮廓信息进行描述.通过提取空间塔式直方图特征,能很好地对图像各种特征的空间分布状况进行描述.提取到图像的外观、颜色、轮廓和特征的空间分布信息后,对其进行融合,最后得到的融合式的空间塔式特征具有很强的鲁棒性.将该融合式特征送入HIK-SVM进行训练和分类,取得了极其高的识别效果.  相似文献   

20.
提出了一种应用复值小波变换进行湖底回波特征提取的方法:采用线性相位的复db小波,对复解析信号进行多尺度的复值小波变换,然后提取合适尺度上的幅度信息作为目标识别的特征矢量.结合实测数据的分析表明,利用复值小波变换提取的幅度特征是一种有效、稳健的特征,能获得较高的正确识别率.复值小波变换也可以采用Mallat快速算法,因此这种方法得到特征矢量维数少,使用时实时性能好,便于工程实现.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号