| 【中文题名】 | 神经网络集成识别手写体数字研究 |
| 【英文题名】 | Handwriting Digit Recognition with Neural Network Ensemble |
| 【学科专业】 | 信号与信息处理 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-10-9 |
| 【中关键词】 | 神经网络集成,BP算法,AdaBoost算法,手写数字识别,特征提取, |
| 【英关键词】 | Netural network ensemble,BP algorithm,AdaBoost algorithm,Handwritten digit recognition,Feature extraction, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>模式识别与装置 |
| 【论文摘要】 |
脱机手写数字识别在邮政编码、统计报表、财务报表、银行票据等方面有着极其重要的应用,这些涉及到财会金融等领域的数字识别对识别正确率有着极高的要求,同时要求有极低的误识率;此外,大批量数据处理对系统速度又有相当的要求,这就对识别系统提出了更高的要求,许多理论上完美但速度过低的方法是行不通的。因此,研究高性能的手写数字识别算法是一个有相当的挑战性的任务。
神经网络应用于手写数字识别的研究也从单一的神经网向集成的方向发展,由于神经网络集成能显著的提高系统的泛化能力,因此将集成神经网应用于手写数字已成为研究的热点。
本文提出了一种基于集成学习算法AdaBoost的手写数字识别系统。AdaBoost算法可以在仅比随机预测略好的弱分类器基础上构建高精度的强分类器。本文对AdaBoost算法进行了深入研究,重点讨论了该算法应用于手写数字识别上的实现方案。具体而言,本论文主要完成了以下几项工作:
(1)实现了宏观,微观,局部,整体三个层次九个方面的特征提取,分别应用于九个神经网络分类器。
(2)对BP神经网络作了深入研究,并针对BP的局限做了一些改进,来提高网络的收敛速度和避免网络假饱... |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
ABSTRACT |
5-8 |
|
第一章 概述 |
8-12 |
|
1.1 问题的提出 |
8 |
|
1.2 手写体数字识别的研究背景 |
8-9 |
|
1.3 手写体数字识别的理论意义 |
9-10 |
|
1.4 本论文的主要工作 |
10 |
|
1.4.1 特征提取 |
10 |
|
1.4.2 单个 BP神经分类器的实现 |
10 |
|
1.4.3 神经网络集成算法 Boost和 AdaBoost介绍和改进 |
10 |
|
1.4.4 实验系统的设计 |
10 |
|
1.5 本文的内容安排 |
10-11 |
|
1.6 参考文献 |
11-12 |
|
第二章 手写体数字的特征提取 |
12-22 |
|
2.1 特征提取简介 |
12-13 |
|
2.2 手写体数字特征提取的方法 |
13-14 |
|
2.3 本课题使用的特征提取方法 |
14-21 |
|
2.3.1 首个黑点位置特征 |
14 |
|
2.3.2 方向特征 |
14 |
|
2.3.3 黑白点变化特征 |
14-15 |
|
2.3.4 重心及重心矩特征 |
15 |
|
2.3.5 投影特征 |
15-16 |
|
2.3.6 轮廓特征 |
16-18 |
|
2.3.7 Fourier变换特征 |
18-19 |
|
2.3.8 Kirsch算子特征 |
19-21 |
|
2.4 参考文献 |
21-22 |
|
第三章 基于 BP算法的神经网络分类器设计 |
22-34 |
|
3.1 概述 |
22 |
|
3.2 神经网络分类器 |
22-25 |
|
3.2.1 人工神经网简介 |
22-23 |
|
3.2.2 人工神经元的数学基础 |
23-24 |
|
3.2.3 人工神经元网络模型 |
24-25 |
|
3.3 BP神经网络分类器 |
25-33 |
|
3.3.1 BP模型简介 |
25-26 |
|
3.3.2 BP算法的学习过程 |
26 |
|
3.3.3 BP算法的推导 |
26-28 |
|
3.3.4 BP算法的实现 |
28-29 |
|
3.3.5 BP算法学习中需要注意的问题 |
29 |
|
3.3.6 BP算法的局限性 |
29 |
|
3.3.7 BP算法的改进 |
29-33 |
|
3.4 参考文献 |
33-34 |
|
第四章 基于 ADABOOST集成的手写数字识别研究 |
34-45 |
|
4.1 神经网络集成概述 |
34-36 |
|
4.1.1 结论生成方法 |
34-35 |
|
4.1.2 个体生成方法 |
35-36 |
|
4.2 BOOSTING和 ADABOOST理论基础 |
36-40 |
|
4.2.1 Boosting和AdaBoost概述 |
36-37 |
|
4.2.2 AdaBoost算法描述 |
37-38 |
|
4.2.3 Boosting算法的理论分析 |
38-40 |
|
4.3 多分类器集成原理 |
40-41 |
|
4.4 神经网络集成中多分类器组合的方法 |
41-42 |
|
4.5 传统的ADABOOST的缺陷及其改进方案 |
42-43 |
|
4.6 参考文献 |
43-45 |
|
第五章 基于 ADABOOST集成算法的手写体数字识别系统设计和算法实现 |
45-55 |
|
5.1 系统设计 |
45-49 |
|
5.1.1 字符识别的基本流程 |
45 |
|
5.1.2 设计思路 |
45-47 |
|
5.1.3 特征的提取 |
47 |
|
5.1.4 分类器的构造 |
47-48 |
|
5.1.5 集成的AdaBoost方式的实现 |
48-49 |
|
5.2 实验步骤 |
49-50 |
|
5.3 实验结果及分析 |
50-53 |
|
5.4 系统不足和尚需改进的地方 |
53-54 |
|
5.4.1 特征的选取 |
53 |
|
5.4.2 BP网中隐藏层的选择 |
53 |
|
5.4.3 Boosting算法的进一步研究 |
53-54 |
|
5.5 参考文献 |
54-55 |
|
第六章 总结和展望 |
55-56 |
|
6.1 总结 |
55 |
|
6.2 展望 |
55-56 |
|
附录I 标准 BP算法流程 |
56-57 |
|
附录II ADABOOST 伪码描述 |
57-58 |
|
附录III USPS样本库文件结构 |
58-59 |
|
附录IV CBPNET类实现 |
59-64 |
|
致谢 |
64 |
|
| 【DOI】 | LunWen.ID:2.2008.389008 |