| 【中文题名】 | 一种基于RBF神经网络的命令集语音识别系统研究 |
| 【英文题名】 | A Research of the Commands Set Speech Recognition System Based on the Radial Basis Function Neural Networks |
| 【学科专业】 | 控制理论与控制工程 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-9-14 |
| 【中关键词】 | 径向基函数神经网络,命令集,语音识别,时间规整,, |
| 【英关键词】 | Radial Basis Fuction Neural Networks,Commands Set,Speech Recognition,Time alignment, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>人工神经网络与计算> |
| 【论文摘要】 |
本文主要研究了人工神经网络在语音识别中的应用,径向基函数神经网络(RBFNN)的原理及在语音识别中的应用,重点在于研究基于径向基神经网络的命令集语音识别系统,研究构造了相应的语音识别模型与算法。并完成了基于MATLAB7.0.1的程序设计和实验。
本文对语音信号前端处理的方法进行的研究和比较。分析讨论了基于径向基函数神经网络的语音识别系统,不同的神经网络隐层结构设计方法和不同的学习方法对神经网络性能的影响。采用一种改进的训练方法,有效地改进了径向基函数神经网络的语音识别性能。分析了采用有序聚类网络进行时间规整对神经网络性能的影响。 |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
Abstract |
5-8 |
|
第一章 绪论 |
8-13 |
|
1.1 前言 |
8 |
|
1.2 语音识别的发展状况 |
8-11 |
|
1.2.1 语音识别技术发展状况 |
8-9 |
|
1.2.2 语音识别系统现有成果 |
9-10 |
|
1.2.3 国内研究现状 |
10-11 |
|
1.3 语音识别系统组成 |
11-12 |
|
1.4 论文主要工作及论文组织 |
12-13 |
|
第二章 语音信号前端处理 |
13-22 |
|
2.1 语音信号预处理和端点检测 |
14-17 |
|
2.1.1 预加重 |
14 |
|
2.1.2 分帧和加窗 |
14-15 |
|
2.1.3 端点检测 |
15-17 |
|
2.2 语音信号特征参数提取 |
17-20 |
|
2.2.1 线性预测参数LPC |
17-18 |
|
2.2.2 线性预测倒谱参数LPCC |
18-19 |
|
2.2.3 Mel频率倒谱参数MFCC |
19-20 |
|
2.3 时间归整 |
20-22 |
|
第三章 语音识别算法 |
22-31 |
|
3.1 DTW |
22-23 |
|
3.2 HMM |
23-24 |
|
3.3 ANN |
24-31 |
|
3.3.1 人工神经网络 |
24-27 |
|
3.3.2 对神经网络在语音识别中的正确认识 |
27-29 |
|
3.3.3 人工神经网络在语音识别中优势 |
29-31 |
|
第四章 RBFNN模型 |
31-41 |
|
4.1 RBFNN介绍 |
31-33 |
|
4.2 RBFNN结构建立方法 |
33-37 |
|
4.2.1 K均值聚类算法 |
33-34 |
|
4.2.2 样本信息聚类算法 |
34-36 |
|
4.2.3 自适应聚类算法 |
36-37 |
|
4.3 RBFNN训练方法 |
37-41 |
|
4.3.1 LMS |
37-38 |
|
4.3.2 改进的训练方法 |
38-41 |
|
第五章 实验分析 |
41-55 |
|
5.1 实验原理 |
41 |
|
5.2 语音资料库 |
41-42 |
|
5.3 端点检测 |
42-44 |
|
5.4 语音信号特征参数 |
44-46 |
|
5.5 RBFNN隐层设计方法 |
46-49 |
|
5.6 RBFNN训练算法的改进 |
49-52 |
|
5.7 时间归整 |
52-54 |
|
5.8 本章小结 |
54-55 |
|
第六章 总结与展望 |
55-56 |
|
参考文献 |
56-58 |
|
致谢 |
58-59 |
|
攻读硕士期间发表的论文 |
59 |
|
| 【DOI】 | LunWen.ID:2.2008.388941 |