| 【中文题名】 | 基于ASR的儿童语言教育系统的研究与实现 |
| 【英文题名】 | Reserch and Implementation of Chrildren Speech-Triaining System Based on ASR |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-3-2 |
| 【中关键词】 | ASR,Speech,API,COM,儿童语言教育,自适应技术 |
| 【英关键词】 | ASR,Speech API,COM,Chrildren speech-training,adaptive, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机软件>程序设计、软件工程>软件工程 |
| 【论文摘要】 |
随着现代计算机技术的普及和发展,计算机的使用越来越深入到人们的日常生活中。人类与计算机进行交流时,最直接和方便的方式就是语言交流,所以语音识别和语音合成技术已成了现代科技发展的一个标志,语音识别和语音合成也因此成为现代计算机技术研究和发展的重要领域之一。语音识别技术与多种学科的研究领域都有联系,这些领域的科研成果也成为推动语音识别技术发展的重要因素。语音识别技术已经取得了一些成就。但是,大多数语音识别系统仍局限于实验室中试用,远远没有达到实用化的要求。
本文研究了语音自适应技术中两种常用的说话人自适应方法:最大后验概率(MAP)方法和最大似然线性回归(MLLR)方法。在此基础上,本文提出一种适合于语音识别的复合渐进自适应方法。这种新方法成功地结合了MAP和MLLR两种方法的优点。新方法使用了一个全局转移矩阵来简化MLLR模块,用来解决环境和说话人生理引起的差异,提供了更加精确的MAP模块初始模型。另外,渐进的MAP模块用来精细的刻画基于音素层次的差异,同时也确保了整个方法的渐进性。本文应用复合渐进方法对微软语音识别引擎进行了改进,在随后的验证性实验中,这种复合方法取得了较好的效果。实验证明,... |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
Abstract |
5-8 |
|
第一章 绪论 |
8-11 |
|
1.1 引言 |
8 |
|
1.2 论文研究背景 |
8 |
|
1.3 当前国内外研究状况 |
8-10 |
|
1.3.1 ASR 理论研究 |
8-9 |
|
1.3.2 儿童语言教育系统的实践研究 |
9 |
|
1.3.3 小结 |
9-10 |
|
1.4 研究目标及内容 |
10 |
|
1.4.1 研究目标 |
10 |
|
1.4.2 研究内容 |
10 |
|
1.5 论文的组织结构 |
10-11 |
|
第二章 ASR 概述 |
11-22 |
|
2.1 ASR 概述 |
11-12 |
|
2.1.1 引言 |
11-12 |
|
2.1.2 语音识别系统的组成 |
12 |
|
2.2 语音识别系统的预处理 |
12-13 |
|
2.3 模板训练方法 |
13-14 |
|
2.4 模板匹配方法 |
14-17 |
|
2.5 微软语音技术及COM |
17-21 |
|
2.5.1 微软Speech API |
17-18 |
|
2.5.2 COM |
18-19 |
|
2.5.3 COM 接口与COM 组件 |
19-21 |
|
2.6 本章小结 |
21-22 |
|
第三章 复合渐进的语音识别自适应方法 |
22-50 |
|
3.1 说话人之间与内部的差异(SPEAKER DIFFERENCES) |
22-23 |
|
3.1.1 说话人与说话人的差异 |
22 |
|
3.1.2 说话人内部的差异 |
22-23 |
|
3.2 语音识别自适应技术 |
23-28 |
|
3.2.1 自适应技术的分类 |
23-24 |
|
3.2.2 自适应技术实现的主要方法 |
24-28 |
|
3.3 最大后验概率(MAP)方法 |
28-36 |
|
3.3.1 MAP 方法和 ML 方法 |
28-29 |
|
3.3.2 MAP 重估技术 |
29-31 |
|
3.3.3 先验知识 |
31-33 |
|
3.3.4 VFS 技术 |
33-34 |
|
3.3.5 MAP 算法实现 |
34-36 |
|
3.4 最大似然线性回归(MLLR) |
36-41 |
|
3.4.1 MLLR 方法概述 |
36-37 |
|
3.4.2 回归类与转移矩阵 |
37 |
|
3.4.3 重估转移矩阵 |
37-40 |
|
3.4.4 MLLR 方法的算法实现 |
40-41 |
|
3.5 复合渐进自适应 |
41-46 |
|
3.5.1 环境差异的自适应 |
41 |
|
3.5.2 两种自适应技术优缺点的比较 |
41-43 |
|
3.5.3 复合渐进方法的系统框架 |
43 |
|
3.5.4 MAP 模块与 MLLR 模块 |
43-44 |
|
3.5.5 渐进的策略 |
44-45 |
|
3.5.6 复合渐进方法的算法实现 |
45-46 |
|
3.6 复合渐进方法的验证性实验 |
46-49 |
|
3.6.1 MAP 与 MLLR 方法的自适应实验 |
47-49 |
|
3.6.2 复合渐进自适应方法 |
49 |
|
3.7 本章小结 |
49-50 |
|
第四章 儿童语言教育特点分析 |
50-56 |
|
4.1 声学基本理论 |
50 |
|
4.2 儿童语言学习的特点 |
50-54 |
|
4.3 利用现代教育技术手段进行语言教育的方法 |
54-55 |
|
4.4 本章小结 |
55-56 |
|
第五章 儿童语言教育软件的设计与实现 |
56-64 |
|
5.1 系统设计 |
56-57 |
|
5.1.1 系统功能结构图 |
56 |
|
5.1.2 系统的基本功能及要求 |
56-57 |
|
5.2 软件设计实现过程 |
57-63 |
|
5.2.1 设计分析 |
57-59 |
|
5.2.2 实现中文语音识别功能 |
59-60 |
|
5.2.3 VC++、Flash 和微软语音识别引擎之间的通讯 |
60-61 |
|
5.2.4 中文/拼音/英文语音识别功能 |
61-62 |
|
5.2.5 实现发音正误判断动画功能 |
62-63 |
|
5.2.6 TTS 功能的实现 |
63 |
|
5.3 本章小结 |
63-64 |
|
第六章 总结与展望 |
64-65 |
|
6.1 论文总结 |
64 |
|
6.2 工作展望 |
64-65 |
|
致谢 |
65-66 |
|
参考文献 |
66-69 |
|
在职学习期间发表的论文 |
69 |
|
| 【DOI】 | LunWen.ID:2.2008.356835 |