排序方式: 共有3条查询结果,搜索用时 0 毫秒
1
1.
以文字序列为研究对象,探索构建结构模式的方法,提出一种基于编辑距离的结构模式发现方法。该方法引入编辑距离对序列予以分类,认为在类中心附近的序列可以通过子结构规约到类中心,特征结构蕴藏在编辑序列中。然后对获得的上下文无关编辑操作引入伪上下文相关,再根据文法特征分裂和根据距离特征合并,在大量数据的基础上提取出结构模式。 相似文献
2.
一种基于最大熵原理的汉语实体提取方法 总被引:1,自引:0,他引:1
采用最大熵原理实现汉语实体提取。在信息处理中信息提取具有越有越重要的作用,其中实体提取是一个重要研究方向,文中首先介绍了实体的基本概念,实体提取的一般方法以及性能评价指标。然后基于最大熵原理对汉语实体提娶阙随机过程模型。实验结果表明,最大熵方法提取汉语实体具有较大的性能。 相似文献
3.
自然语言处理系统中自动分词的研究 总被引:4,自引:0,他引:4
首先分析了自然分词方法的基本假设和实现途径以及现有的方法的不足之处,然后介绍汉语自然语言整体处理信息框架和在自然语言整体处理框架中自动分词方法,最后给出实验结果。 相似文献
1