融入多特征的汉-老双语对齐方法 |
| |
摘 要: | 随着东盟与中国的经贸日益增加,语言作为两个国家交流的重要渠道,通过人工智能来解决双语问题,也正成为一门重要的研究。双语平行语料库的构建,是人工智能中自然语言处理的核心任务之一。双语语料库构建的核心之一是对齐,而句子对齐又是构建对齐语料库的基本任务。本文主要参考其他较为成熟的句子对齐方法,重点的针对老挝语与中文的句子上下文信息,从句子所含动词、名词、形容词等词序进行句子对齐方法的研究。实验中所采用的方法主要应用了Bi-LSTM算法,使用这个算法来处理序列模型相关的问题。该算法在对齐的篇章级语料中的提取对齐句子有较好的表现。
|
本文献已被 CNKI 等数据库收录! |
|