| 【中文题名】 | 基于CDHMM/SOFM神经网络的语音识别研究 |
| 【英文题名】 | Research of Speech Recognition Based on CDHMM/SOFM Neural Network |
| 【学科专业】 | 检测技术与自动化装置 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-7-30 |
| 【中关键词】 | 语音识别,隐马尔可夫模型,自组织特征映射神经网络,特征提取,, |
| 【英关键词】 | Speech recognition,HMM,SOFM neutral net,Extraction of characteristic, |
| 【分类导航】 | 工业技术>无线电电子学、电信技术>通信>电声技术和语音信号处理>语音信号处理>语音识别与设备 |
| 【论文摘要】 |
语音识别,作为一门综合学科,涉及到诸多领域,而其在工业、军事、交通、医学、民用诸方面,特别是计算机、信息处理、通信与电力系统、自动控制等领域中有着广泛的应用。近年来,语音识别技术已成为研究领域的一大热点。本文针对语音识别系统在低信噪比环境下识别率和鲁棒性不高的问题,做了深入研究。
本文首先分析了语音信号的时域、频域特性;研究了语音信号预处理阶段的预加重、分帧加窗和端点检测;系统地分析和研究了反映语音倒谱特征的线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)的提取方法。
然后研究了用于语音识别的两种方法:隐马尔可夫模型(HMM)和人工神经网络(ANN)。HMM具有较强的时序建模能力,是一种基于时序累积概率的动态信息处理方法。但它存在需要语音信号的先验知识,分类决策能力弱等缺点。而人工神经网络以其自适应、并行性、非线性、鲁棒性和学习特性被广泛应用于语音识别领域。
最后,本文将HMM和ANN相结合,充分利用HMM强时序建模能力和ANN分类决策能力,提出了一种将连续概率密度隐马尔可夫模型(CDHMM)与自组织特征映射神经网络(SOFMNN)相结合而构成的新型CDHMM/SO... |
| 【论文题纲】 |
|
摘要 |
5-6 |
|
Abstract |
6-11 |
|
第1章 绪论 |
11-20 |
|
1.1 语音识别概述 |
11-13 |
|
1.1.1 语音识别系统简介 |
11-12 |
|
1.1.2 语音识别的指标 |
12-13 |
|
1.2 语音识别技术 |
13-18 |
|
1.2.1 语音识别技术的发展和现状 |
13-15 |
|
1.2.2 语音识别的一般方法 |
15-16 |
|
1.2.3 基于神经网络的语音识别方法 |
16-18 |
|
1.3 语音识别面临的问题和困难 |
18-19 |
|
1.4 本文的研究内容及意义 |
19-20 |
|
第2章 语音信号的分析与处理 |
20-34 |
|
2.1 引言 |
20 |
|
2.2 语音信号时域分析 |
20-25 |
|
2.2.1 短时能量 |
21-23 |
|
2.2.2 短时平均过零率 |
23-25 |
|
2.2.3 短时自相关函数 |
25 |
|
2.3 语音信号的频域分析 |
25-27 |
|
2.3.1 短时傅里叶变换 |
25-26 |
|
2.3.2 语谱图 |
26-27 |
|
2.4 语音信号的采集、预处理及端点检测 |
27-33 |
|
2.4.1 语音信号的采集 |
28 |
|
2.4.2 语音信号的预处理 |
28-31 |
|
2.4.3 端点检测 |
31-33 |
|
2.5 本章小结 |
33-34 |
|
第3章 语音信号特征参数提取 |
34-44 |
|
3.1 引言 |
34-35 |
|
3.2 LPCC 的求解 |
35-40 |
|
3.2.1 LPC 参数计算 |
36-38 |
|
3.2.2 LPCC 参数计算 |
38-40 |
|
3.3 MFCC 参数的快速提取算法 |
40-43 |
|
3.3.1 MFCC 参数分析 |
40-41 |
|
3.3.2 MFCC 参数的计算过程 |
41-43 |
|
3.4 本章小结 |
43-44 |
|
第4章 基于CDHMM/SOFM 神经网络的混合模型语音识别 |
44-59 |
|
4.1 引言 |
44-45 |
|
4.2 隐马尔可夫模型(HMM) |
45-48 |
|
4.2.1 HMM 的基本思想 |
45-46 |
|
4.2.2 HMM 定义 |
46-47 |
|
4.2.3 连续概率密度隐马尔可夫模型(CDHMM) |
47-48 |
|
4.3 HMM 在语音识别中的基本问题 |
48-53 |
|
4.4 自组织特征映射神经网络(SOFMNN) |
53-56 |
|
4.4.1 SOFM 模型的结构 |
53-54 |
|
4.4.2 SOFM 模型算法和学习规则 |
54-56 |
|
4.5 CDHMM 与SOFMNN 的混合模型 |
56-58 |
|
4.5.1 CDHMM/SOFMNN 模型结构 |
56-57 |
|
4.5.2 CDHMM/SOFMNN 模型训练过程 |
57-58 |
|
4.6 本章小结 |
58-59 |
|
第5章 仿真实验及分析 |
59-69 |
|
5.1 仿真环境 |
59-60 |
|
5.1.1 硬件环境 |
59 |
|
5.1.2 软件环境 |
59 |
|
5.1.3 语音数据库 |
59-60 |
|
5.2 语音信号预处理 |
60-62 |
|
5.2.1 预加重 |
60-61 |
|
5.2.2 分帧 |
61-62 |
|
5.3 端点检测 |
62-63 |
|
5.4 特征提取 |
63-65 |
|
5.5 识别实验结果及分析 |
65-67 |
|
5.6 本章小结 |
67-69 |
|
结论 |
69-71 |
|
参考文献 |
71-75 |
|
攻读硕士学位期间承担的科研任务与主要成果 |
75-76 |
|
致谢 |
76-77 |
|
作者简介 |
77 |
|
| 【DOI】 | LunWen.ID:2.2008.388638 |