| 【中文题名】 | 智能机译系统的知识辅助获取 |
| 【英文题名】 | |
| 【学科专业】 | 计算机应用 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-12-29 |
| 【中关键词】 | 机器翻译,知识获取,构词法,语料库,反馈信息, |
| 【英关键词】 | Machine Translation,Knowledge Acquisition,Natural Language Processing,Morphemics,Corpus,Feedback Knowledge, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>翻译机 |
| 【论文摘要】 | 机器翻译需要一个庞大的知识库以及利用这些知识进行翻译的翻译机制和软件环境。知识库的建立与维护工作量大、难度高,因此采用多种途径辅助获取机译知识是机器翻译研究的重点和难点问题之一。
本文在智能机器翻译理论的基础上,提出了基于构词法、基于语料库和基于译后反馈信息的知识辅助获取方法,在智能机译系统IMTE/C上设计并实现了包括这三种方法在内的集成型知识辅助获取环境。基于构词法的知识获取解决了派生词的信息获取问题,同时有助于保持词典信息的一致性;基于语料库的动词信息获取实现了对50%的句子的自动分析,获取的动词信息粒度小、一致性好、真实客观,提高了IMT E/C中最复杂的动词词条的总结效率;基于反馈信息的知识获取方法不仅可以提示词条错误,而且能够定位规则错误,并对规则的修改提供建议,实验证明这种方法使系统具有自我完善和错误自检能力,大幅度地提高了调试效率。另外,这一集成环境中还包括基于图形界面的词典编辑工具,使词条的输入更加直观、方便。
这种集成型辅助获取机制利用了当前机译知识获取的研究成果和IMT E/C原有知识获取方法的经验,直接针对系统当前的要求和原有方法的不足,有助于提高开发效... |
| 【论文题纲】 |
|
摘要 |
7-8 |
|
Abstract |
8-10 |
|
第一章 引言 |
10-13 |
|
第二章 机器翻译及其辅助知识获取研究现状 |
13-29 |
|
§2.1 机器翻译研究现状 |
13-16 |
|
§2.2 机译知识辅助获取研究现状 |
16-19 |
|
§2.3 预先辅助获取知识 |
19-26 |
|
§2.3.1 辅助建立词典库 |
20-24 |
|
§2.3.1.1 从语料库中提取词典信息 |
20-22 |
|
§2.3.1.2 从MRD中提取词典信息 |
22 |
|
§2.3.1.3 MRD与语料库相结合获取词典信息 |
22-24 |
|
§2.3.2 获取规则信息 |
24-26 |
|
§2.4 获取在线信息 |
26-29 |
|
第三章 IMT E/C中的知识辅助获取 |
29-35 |
|
§3.1 IMT E/C的知识表示和翻译处理过程 |
29-31 |
|
§3.2 研究背景 |
31-35 |
|
第四章 利用构词法辅助获取知识 |
35-43 |
|
§4.1 英语词汇的构词特点 |
35-36 |
|
§4.2 一些设定 |
36-37 |
|
§4.3 后缀、前缀分析 |
37 |
|
§4.4 算法 |
37-41 |
|
§4.4.1 准备工作 |
39-40 |
|
§4.4.2 分离后缀算法 |
40 |
|
§4.4.3 分离前缀算法 |
40-41 |
|
§4.4.4 后缀、前缀分离结果生成 |
41 |
|
§4.5 用构词法提取信息的优点与局限性 |
41-42 |
|
§4.6 进一步的讨论 |
42-43 |
|
第五章 基于语料库的知识辅助获取 |
43-53 |
|
§5.1 动词在句子中的核心作用 |
43 |
|
§5.2 动词在机译系统中的表示 |
43-44 |
|
§5.3 从语料库中辅助获取动词信息的必要性 |
44-45 |
|
§5.4 VIAAS的设计考虑和预备工作 |
45-49 |
|
§5.5 VIAAS的实现算法 |
49-53 |
|
§5.5.1 VIAAS算法过程 |
49-50 |
|
§5.5.2 深层价信息的提取 |
50-51 |
|
§5.5.3 一般格信息的提取 |
51 |
|
§5.5.4 信息的归纳与总结 |
51-53 |
|
第六章 基于反馈信息的知识辅助获取 |
53-66 |
|
§6.1 设计原理 |
53-55 |
|
§6.1.1 翻译错误类型 |
53-54 |
|
§6.1.2 翻译错误产生的原因 |
54 |
|
§6.1.3 设计考虑 |
54-55 |
|
§6.2 辅助获取机制 |
55-59 |
|
§6.3 近似译文情况下的知识辅助获取 |
59 |
|
§6.4 基于启发式信息的知识辅助获取 |
59-66 |
|
§6.4.1 源、译文信息的获取 |
60-61 |
|
§6.4.2 定位错误规则,产生启发式信息 |
61-62 |
|
§6.4.3 获取启发式规则 |
62-63 |
|
§6.4.4 完善规则库 |
63-64 |
|
§6.4.5 验证修改,完善知识库 |
64-66 |
|
第七章 实验结果及分析 |
66-72 |
|
§7.1 由构词法获取信息的实验结果及分析 |
66-67 |
|
§7.2 VIAAS试验结果及评价 |
67-69 |
|
§7.3 HIKAS实验结果及评价 |
69-72 |
|
第七章 结束语 |
72-73 |
|
参考文献 |
73-77 |
|
附录1-3 |
77-80 |
|
作者简介 |
80 |
|
| 【DOI】 | LunWen.ID:2.2008.365846 |