| 【中文题名】 | 应用于词性标注的隐马尔可夫模型参数评估 |
| 【英文题名】 | Hidden Markov Model Parameters Estimation for Part-of-Speech Tagging |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-1-17 |
| 【中关键词】 | 词性标注,隐马尔可夫模型,参数评估,感知器算法,, |
| 【英关键词】 | Part-of-Speech Tagging,Hidden Markov Model,Parameters Estimation,Perceptron Algorithm, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>> |
| 【论文摘要】 | 在自然语言处理中,词性标注是最基础的课题。由于基于统计的方法具有不需要人工总结语言学规则、识别正确率高等优点,已逐渐成为研究的热点。在基于统计的方法中,隐马尔可夫模型(Hidden Markov Model简称HMM)是最主要的算法模型之一。
参数是隐马尔可夫模型的重要组成部分,参数评估也成为构建隐马尔可夫模型的必要前提。在分析前人工作及研究现状的基础上,本文对有指导的隐马尔可夫模型参数评估方法做出两个方面的改进:一是评估词的出现概率时,增加了前词词性;二是利用感知器算法对隐马尔可夫模型参数进行修正。
传统的隐马尔可夫模型的输出独立性假设为:词的出现概率只与它的词性有关,与前词或后词的词性无关。本文在评估词的出现概率时,增加了前词词性,即:词的出现概率不仅与它的词性有关,而且与前词词性有关。使隐马尔可夫模型在词性标注中,能够利用更多的语言学信息。
感知器算法是一种能根据输出与所期望的输出间的差别来调整模型参数的算法。本文利用感知器算法对隐马尔可夫模型参数进行修正:首先用Viterbi算法对输入句子进行自动分词及词性标注,然后将输出结果与正确的词性序列比较,若不相... |
| 【论文题纲】 |
|
独创性说明 |
3-4 |
|
摘要 |
4-6 |
|
Abstract |
6-10 |
|
1 绪论 |
10-18 |
|
1.1 词性标注方法简介 |
10-12 |
|
1.2 参数评估的研究意义 |
12-13 |
|
1.3 国内外研究现状 |
13-15 |
|
1.3.1 无指导的参数评估 |
13-14 |
|
1.3.2 有指导的参数评估 |
14-15 |
|
1.4 参数评估的研究难点 |
15-16 |
|
1.4.1 无指导的参数评估与有指导的参数评估 |
15-16 |
|
1.4.2 语言学信息的获取 |
16 |
|
1.5 本文的工作 |
16-18 |
|
2 隐马尔可夫模型 |
18-32 |
|
2.1 马尔可夫链 |
18-20 |
|
2.2 隐马尔可夫模型 |
20-23 |
|
2.3 隐马尔可夫模型的三个基本问题 |
23-32 |
|
2.3.1 前向-后向算法 |
23-26 |
|
2.3.2 Viterbi算法 |
26-28 |
|
2.3.3 Baum-Welch算法 |
28-32 |
|
3 有指导的隐马尔可夫模型参数评估 |
32-49 |
|
3.1 传统的有指导的隐马尔可夫模型参数评估 |
32-37 |
|
3.2 改进后的有指导的隐马尔可夫模型参数评估 |
37-43 |
|
3.3 利用感知器算法对隐马尔可夫模型参数进行修正 |
43-49 |
|
3.3.1 感知器模型及其学习算法 |
43-46 |
|
3.3.2 对隐马尔可夫模型参数进行修正的感知器算法 |
46-49 |
|
4 系统实现 |
49-53 |
|
4.1 系统概述 |
49 |
|
4.2 隐马尔可夫模型参数评估子系统 |
49-51 |
|
4.3 隐马尔可夫模型参数修正子系统 |
51-53 |
|
5 实验结果及错误分析 |
53-62 |
|
5.1 实验结果 |
53-60 |
|
5.1.1 有指导参数评估的实验结果 |
53-55 |
|
5.1.2 训练语料规模对参数评估的影响 |
55-60 |
|
5.2 错误分析 |
60-62 |
|
结论 |
62-63 |
|
参考文献 |
63-66 |
|
附录A 北京大学2003版标注集 |
66-70 |
|
攻读硕士学位期间发表学术论文情况 |
70-71 |
|
致谢 |
71-72 |
|
大连理工大学学位论文版权使用授权书 |
72 |
|
| 【DOI】 | LunWen.ID:2.2008.388301 |