| 【中文题名】 | 汉语语法语料库系统的基础设计 |
| 【英文题名】 | |
| 【学科专业】 | 计算机应用 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-12-14 |
| 【中关键词】 | 自然语言处理,汉语语法,语义,语料库,特征提取,自动分词 |
| 【英关键词】 | NLP,Chinese Syntax,Semantic,Corpus,Character Extract,Automatic Words Segmentation, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>文字信息处理 |
| 【论文摘要】 | 汉语作为自然语言处理内容的研究工作在国内已经开展数十年。根据汉语研究中所体现出的特点,有关语义分析研究也越来越多地应用到自然语言处理的研究过程中。但是由于语义分析的结果不易转化成形式化的表达方式,从而不易被计算机所识别并予以处理。因此,在研究过程中需要利用一种行之有效的方法来辅助表述语义分析过程。
语法分析是在语义分析层次之上的,它用有限的知识描述语言学中的各种语言现象,而且语法分析相对容易归纳,也容易转化成形式化的语言被计算机处理。同时,鉴于汉语研究需要在一定语言环境中进行这一特点,引入了语料库这一研究方法,并且结合汉语语法分析,实现对汉语语言研究的计算机处理。
本文总结了自然语言处理的发展情况及国内研究的重要成果。根据汉语研究的特点,结合前人的研究成果,总结出自然语言处理研究的基本过程。
本文结合自然语言处理研究的特点和汉语语法理论知识,从有利于计算机处理的角度,对汉语语法研究的元素作了重新分类,阐述了各元素间的联系,提出了特征提取的概念并且介绍了特征提取的内容和作用。
本文根据汉语语法内容以及自然语言处理过程的需要,引入了语料库的有关研究方... |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
ABSTRACT |
5-6 |
|
目录 |
6-8 |
|
第一章 引言 |
8-15 |
|
1.1 自然语言处理概述 |
8 |
|
1.2 国内主要成果 |
8-9 |
|
1.3 自然语言处理的基本过程 |
9-10 |
|
1.4 自然语言处理的层次 |
10-11 |
|
1.5 语义分析和语法分析 |
11-12 |
|
1.6 自然语言处理中存在的困难 |
12-13 |
|
1.7 课题背景 |
13-14 |
|
1.8 本章小结 |
14-15 |
|
第二章 汉语言语法理论知识 |
15-32 |
|
2.1 汉语的特点 |
15-17 |
|
2.2 语法概述 |
17-19 |
|
2.2.1 语法概念 |
17 |
|
2.2.2 语法体系 |
17 |
|
2.2.3 结构层次 |
17-18 |
|
2.2.4 语法性质 |
18 |
|
2.2.5 语法与逻辑的关系 |
18 |
|
2.2.6 汉语语法结构 |
18-19 |
|
2.3 词法 |
19-23 |
|
2.3.1 词类划分的原则 |
19-20 |
|
2.3.2 词类划分的依据 |
20-21 |
|
2.3.3 词类划分及语法功能 |
21-23 |
|
2.4 句法 |
23-27 |
|
2.4.1 短语 |
24-25 |
|
2.4.2 句子成分 |
25 |
|
2.4.3 单句类型 |
25-26 |
|
2.4.4 复句类型 |
26-27 |
|
2.5 词、短语、句子之间的关系 |
27-28 |
|
2.5.1 词与短语的关系 |
27 |
|
2.5.2 词、短语与句子成分的关系 |
27 |
|
2.5.3 词、短语与句型的关系 |
27 |
|
2.5.4 词、短语与复句的关系 |
27-28 |
|
2.6 语法特征提取 |
28-30 |
|
2.7 语法知识在语义分析中的应用 |
30-31 |
|
2.8 本章小结 |
31-32 |
|
第三章 汉语语法语料库的结构设计及相关技术 |
32-53 |
|
3.1 语料库历史 |
32-33 |
|
3.2 语料的采集 |
33 |
|
3.3 语料库的结构 |
33-34 |
|
3.4 规则库的建立 |
34-35 |
|
3.5 语料库中的数据表 |
35-45 |
|
3.5.1 数据表的分类及关系 |
35-36 |
|
3.5.2 部分数据表的内容形式 |
36-40 |
|
3.5.3 各个数据表之间的访问方法 |
40-42 |
|
3.5.4 数据表访问方法举例 |
42-45 |
|
3.6 自动分词技术 |
45-52 |
|
3.6.1 自动分词技术概述 |
45-46 |
|
3.6.2 自动分词技术种类 |
46 |
|
3.6.3 堆栈-最大匹配自动分词模型 |
46-48 |
|
3.6.4 堆栈-最大匹配自动分词算法 |
48-51 |
|
3.6.5 自动分词举例 |
51-52 |
|
3.7 本章小结 |
52-53 |
|
第四章 汉语语法语料库系统的实现 |
53-61 |
|
4.1 用户应用程序 |
53-58 |
|
4.2 语料库管理系统 |
58-60 |
|
4.3 本章小结 |
60-61 |
|
第五章 总结全文及今后工作的展望 |
61-62 |
|
5.1 总结全文 |
61 |
|
5.2 对今后工作的展望 |
61-62 |
|
参考文献 |
62-64 |
|
附录 1:实词表及其标记 |
64-66 |
|
附录 2:虚词表及其标记 |
66-67 |
|
附录 3:短语表 I(按短语结构分类) |
67-70 |
|
附录 4:短语表II(按短语功能分类) |
70-71 |
|
附录 5:句子成分列表 |
71-73 |
|
附录 6:句型列表 |
73-74 |
|
附录 7:复句类型列表 |
74-77 |
|
致谢 |
77 |
|
| 【DOI】 | LunWen.ID:2.2008.365640 |