| 【中文题名】 | 基于遗传算法和BP神经网络的汉语语音识别研究 |
| 【英文题名】 | A Research of the Chinese Speech Recognition Based on the GA-BP Model |
| 【学科专业】 | 控制理论与控制工程 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-9-14 |
| 【中关键词】 | 语音识别,BP神经网络,遗传算法,特征提取,, |
| 【英关键词】 | Speech Recognition,BP Neural Networks,Genetic Algorithm,Feature Extraction, |
| 【分类导航】 | 工业技术>无线电电子学、电信技术>通信>电声技术和语音信号处理>语音信号处理>语音识别与设备 |
| 【论文摘要】 |
语音识别是一个复杂的非线性过程,基于线性系统理论的语音识别方法如隐马尔可夫模型(HMM)等技术的局限性逐渐凸现。随着人工神经网络的非线性理论研究和应用的逐渐深入,基于ANN的语音识别方法,逐渐成为研究的焦点。
本文主要就前馈神经网络(BP神经网络)的原理及其在语音识别中的应用进行如下研究:
1、如何有效的提取语音信号特征
关于该问题首先从如何有效的检测语音信号的起止点进行研究,分析讨论了传统端点检测方法的优缺点,并对其进行了改进;然后,本文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上,研究了LPCC和MFCC参数提取的算法原理及提取算法,并推导了一阶差分倒谱特征参数的提取算法。
2、关于BP神经网络在语音识别中的应用
主要研究了BP神经网络的原理,分析讨论了标准BP算法的优缺点及改进方法,并对传统的变学习率方法进行了改进。
3、关于遗传算法在神经网络中的应用
主要探讨了用遗传算法来优化神经网络的拓扑结构及权值的问题。该部分介绍了遗传算法的原理以及用它来优化神经网络拓扑结构、权值的步骤,同时还分析了遗传算法的主要参数对优化性能的影响。... |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
ABSTRACT |
5-11 |
|
第一章 绪论 |
11-18 |
|
1.1 前言 |
11 |
|
1.2 语音识别发展史及现状 |
11-13 |
|
1.2.1 国外研究历史及现状 |
11-12 |
|
1.2.2 国内研究历史及现状 |
12-13 |
|
1.3 语音识别系统 |
13-16 |
|
1.3.1 语音识别基本原理 |
13-14 |
|
1.3.2 语音识别的分类 |
14-15 |
|
1.3.3 神经网络在语音识别中的应用 |
15-16 |
|
1.4 本文的主要工作和内容安排 |
16-17 |
|
1.5 小结 |
17-18 |
|
第二章 语音信号的声学基础及产生模型 |
18-26 |
|
2.1 汉语语音学基础 |
18-19 |
|
2.1.1 音素和音节 |
18 |
|
2.1.2 元音和辅音 |
18-19 |
|
2.1.3 声母和韵母 |
19 |
|
2.1.4 汉语语音的主要特点 |
19 |
|
2.2 语音信号的产生 |
19-23 |
|
2.2.1 语音的发音器官 |
20-21 |
|
2.2.2 语音信号的产生模型 |
21-23 |
|
2.3 语音信号的听觉特性和语音感知 |
23-25 |
|
2.3.1 听阈与听域 |
23-24 |
|
2.3.2 音调 |
24 |
|
2.3.3 掩蔽效应 |
24-25 |
|
2.4 小结 |
25-26 |
|
第三章 语音信号预处理与特征提取 |
26-45 |
|
3.1 语音文件的读取 |
26-30 |
|
3.1.1 WAVE 文件的存储结构 |
26-27 |
|
3.1.2 WAVE 文件的数据存储结构 |
27-28 |
|
3.1.3 WAVE 样本点和样本框架 |
28-29 |
|
3.1.4 用 C++ 语言实现对 WAVE 文件的读取 |
29-30 |
|
3.2 预加重 |
30-31 |
|
3.3 端点检测 |
31-38 |
|
3.3.1 短时能量 |
31-32 |
|
3.3.2 短时平均过零率 |
32 |
|
3.3.3 Lawrence Rabiner 提出的端点检测方法 |
32-34 |
|
3.3.4 本文所用的端点检测方法 |
34-37 |
|
3.3.5 端点检测实验及结论 |
37-38 |
|
3.3 分帧和加窗 |
38-39 |
|
3.4 特征参数计算 |
39-44 |
|
3.4.1 LPCC 的提取过程 |
39-41 |
|
3.4.2 MFCC 的提取过程 |
41-43 |
|
3.4.3 对特征参数进行倒谱提升 |
43 |
|
3.4.4 动态差分参数的提取 |
43-44 |
|
3.5 小结 |
44-45 |
|
第四章 BP 神经网络 |
45-54 |
|
4.1 人工神经网络概述 |
45-49 |
|
4.1.1 人工神经元模型 |
45-47 |
|
4.1.2 人工神经网络模型 |
47 |
|
4.1.3 神经网络的学习方法 |
47-49 |
|
4.2 BP 神经网络 |
49-53 |
|
4.2.1 BP 算法 |
50-52 |
|
4.2.2 BP 算法的改进 |
52-53 |
|
4.3 小结 |
53-54 |
|
第五章 遗传算法在神经网络中的应用 |
54-62 |
|
5.1 前言 |
54 |
|
5.2 遗传算法的基本思想和实现步骤 |
54-55 |
|
5.2.1 遗传算法的基本思想 |
54 |
|
5.2.2 遗传算法的实现步骤 |
54-55 |
|
5.3 用遗传算法优化神经网络 |
55-62 |
|
5.3.1 编码方案 |
55-56 |
|
5.3.2 适应度函数的确定 |
56-57 |
|
5.3.3 遗传操作 |
57-59 |
|
5.3.4 控制参数的设定 |
59-62 |
|
第六章 实验与分析 |
62-79 |
|
6.1 语音样本库的建立 |
62 |
|
6.2 语音特征矢量库的建立 |
62-67 |
|
6.2.1 语音信号的预处理 |
62 |
|
6.2.2 语音特征参数的提取 |
62-65 |
|
6.2.3 特征参数的归一化 |
65-66 |
|
6.2.4 特征矢量序列的聚类合并 |
66 |
|
6.2.5 语音特征资料库的程序实现 |
66-67 |
|
6.3 基于 GA-BP 的汉语语音识别仿真及性能分析 |
67-77 |
|
6.3.1 神经网络模型的建立 |
67-68 |
|
6.3.2 隐含层神经元个数对网络性能的影响 |
68-70 |
|
6.3.3 动量因子及学习率对网络性能的影响 |
70-72 |
|
6.3.4 误差极限对网络性能的影响 |
72-73 |
|
6.3.5 训练样本数目对识别性能的影响 |
73-74 |
|
6.3.6 特征参数性能对比 |
74-75 |
|
6.3.7 网络的初始权值对网络性能的影响 |
75-77 |
|
6.4 小结 |
77-79 |
|
第七章 总结与展望 |
79-81 |
|
7.1 总结 |
79-80 |
|
7.2 将来的工作 |
80-81 |
|
参考文献 |
81-84 |
|
致谢 |
84-85 |
|
攻读学位期间发表论文情况 |
85 |
|
| 【DOI】 | LunWen.ID:2.2008.388940 |