基于关联度和词对齐的双语组块获取研究
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 计算机 >> 计算机应用 >> 正文
基于关联度和词对齐的双语组块获取研究
作者:刘建基 Publish: 2006-12-6 Hits:-
【中文题名】 基于关联度和词对齐的双语组块获取研究
【英文题名】 
【学科专业】 计算机应用技术
【论文级别】 硕士论文
【投稿时间】 2006-12-6
【中关键词】 机器翻译,关联度,词对齐,双语组块,语料库,
【英关键词】 machine translation,association value,word alignment,bilingual chunk,corpus,
【分类导航】 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>文字信息处理
【论文摘要】 长期以来,机器翻译系统都是以词为语言翻译的基本单位。人类自然语言中词的使用非常灵活,在机器翻译处理中有很大的歧义性,这是导致机器翻译译文难以提高的关键因素之一。这就需要引入比词语粒度稍大的单位来进行翻译。 本文工作主要内容如下: 首先,引入了面向机器翻译的双语组块的概念,它是一种粒度介于句子和词语之间的双语语段,具有语义自足性、结构合法性和翻译转换的充分性等特点。本文阐述了基于双语组块的句法分析和类比翻译的思想及其在IHSMTS系统中的初步应用思想,并围绕着双语组块的获取展开工作。 其次,在单语语料库的基础上进行了单语组块获取的研究。其中,对常见的关联度函数进行了对比分析,提出了三种获取单语组块的方案,并基于动态增长机制实现了对单语组块的获取,最后对组块语法属性的继承和传递进行了探讨。 第三,在双语语料库的基础上进行了双语组块获取的研究。在单语组块获取工作的基础上,提出了基于统计和基于词对齐的两种双语组块获取模型。设计并实现了基于关联度和词对齐的双语组块获取原型系统,取得了较好的实验效果。
【论文题纲】
摘要 3-4
Abstract 4-5
目录 5-7
1 引言 7-14
1.1 研究背景及意义 7-11
1.2 国内外相关研究 11-12
1.3 论文的提出及研究内容 12-13
1.4 论文的安排 13-14
2 组块和双语组块 14-26
2.1 传统单语组块 14-18
2.1.1 浅层句法分析 14-16
2.1.2 英语组块分析体系 16-17
2.1.3 汉语组块分析体系 17
2.1.4 组块识别方法 17-18
2.2 面向机器翻译的双语组块 18-22
2.2.1 词语搭配的界定 18-19
2.2.2 本文双语组块的定义 19-20
2.2.3 双语组块研究中的语料库资源 20-22
2.3 双语组块在机器翻译中的应用 22-25
2.3.1 基于双语组块的句法分析 22
2.3.2 基于双语组块的类比翻译 22-23
2.3.3 双语组块在IHSMTS系统中的应用 23-25
2.4 本章小结 25-26
3 基于关联度的单语组块获取 26-40
3.1 单语组块获取模型 26-28
3.1.1 统计和规则模型间的比较 26-27
3.1.2 建立单语组块自动获取模型 27
3.1.3 获取系统的模块设计 27-28
3.2 单语组块获取关键技术研究与实现 28-37
3.2.1 常用关联度函数分析与比较 29-31
3.2.2 改进后的互信息关联度 31-32
3.2.3 候选单语组块获取方案 32-33
3.2.4 候选单语组块获取系统 33-35
3.2.5 实验结果及分析 35-37
3.3 组块语法属性的继承和传递 37-39
3.4 本章小结 39-40
4 基于词对齐的双语组块获取 40-54
4.1 现有的双语知识获取方法 40-41
4.2 基于统计的双语组块获取模型 41-43
4.2.1 获取模型 41-43
4.2.2 关键问题分析 43
4.3 双语词对齐 43-46
4.3.1 词对齐概述 43-44
4.3.2 基于锚点词对的双语词对齐算法 44-46
4.4 基于关联度和词对齐的双语组块获取系统 46-50
4.4.1 双语约束举例 46-47
4.4.2 系统设计 47-48
4.4.3 系统实现 48-50
4.5 实验结果及分析 50-52
4.6 相关工作对比讨论 52-53
4.7 本章小结 53-54
5 结束语 54-56
5.1 总结 54-55
5.2 展望 55-56
附录 56-57
致谢 57-58
参考文献 58-61
【DOI】 LunWen.ID:2.2008.365501
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:机器翻译 论文 关联度 词对齐 双语组块 语料库
计算机应用最新论文
计算机应用热门论文