| 【中文题名】 | 基于机器学习的数字信息处理技术研究与实现 |
| 【英文题名】 | Research and Realization of Digitial Information Processing Technology Based on Machine Learning |
| 【学科专业】 | 测试计量技术及仪器 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-9-5 |
| 【中关键词】 | 数字信息处理,机器学习,向量空间模型,特征选择,遗传算法,人工神经网络 |
| 【英关键词】 | digital information,machine learning,vector space model,feature selection,genetic algorithms,artificial neural network, |
| 【分类导航】 | 工业技术>无线电电子学、电信技术>通信>通信理论>信号处理> |
| 【论文摘要】 |
在过去几十年时间里,数字信号处理(DSP)已经在诸多领域得到了广泛应用。但是随着计算机和信息技术的发展,DSP技术也存在很多局限性,比如面对种类丰富的数字信息的处理显得力不从心,因此需要对DSP技术进行延伸和扩展以满足新的要求。机器学习作为一种成熟的DSP技术,将其延伸到数字信息处理中来具有重要的研究价值。
本文以电子邮件这种常见的数字信息媒介为研究对象,通过基于机器学习的邮件数字信息处理技术研究,实现对邮件数字信息的智能处理,提高邮件数字信息分类识别的准确性,以满足邮件网关对垃圾邮件准确过滤的要求。
本文首先对数字信息处理技术和机器学习在数字信息处理中的应用进行了分析,在此基础上研究了如何将机器学习技术应用于邮件数字信息处理。接着研究设计了对邮件数字信息的特征选择算法和分类算法。邮件数字信息特征空间维数巨大,为了降低特征维数,使机器学习算法可行,运用了基于特征选择度量函数的特征选择算法,在此基础上提出了基于遗传算法和特征选择度量函数相结合的特征选择算法。同时为了实现对邮件数字信息的智能处理,提高分类识别效果,设计了BP神经网络分类器,并采用遗传算法对BP网络进行了优化改进,实现了G... |
| 【论文题纲】 |
|
第一章 绪论 |
13-18 |
|
1.1 问题的提出 |
13-14 |
|
1.2 研究背景 |
14-15 |
|
1.3 本课题的研究内容,意义和关键技术 |
15-17 |
|
1.4 论文的组织结构 |
17-18 |
|
第二章 数字信息处理与机器学习技术 |
18-28 |
|
2.1 数字信息处理技术 |
18-21 |
|
2.1.1 数字信号处理技术 |
18-19 |
|
2.1.2 数字信息处理技术 |
19-21 |
|
2.1.3 数字信号处理技术与数字信息处理技术的关系 |
21 |
|
2.2 机器学习 |
21-26 |
|
2.2.1 机器学习的基本概念 |
22-24 |
|
2.2.2 机器学习的发展状况 |
24-25 |
|
2.2.3 机器学习的方法 |
25-26 |
|
2.3 机器学习技术在数字信息处理中的应用 |
26-27 |
|
2.4 本章小结 |
27-28 |
|
第三章 邮件数字信息预处理和特征选取研究与实现 |
28-50 |
|
3.1 向量空间模型 |
28-31 |
|
3.1.1 邮件数字信息的表示 |
28-29 |
|
3.1.2 向量空间模型定义 |
29-31 |
|
3.2 邮件数字信息分词系统 |
31 |
|
3.3 特征项权重算法 |
31-33 |
|
3.4 邮件数字信息特征选择方法研究与实现 |
33-40 |
|
3.4.1 特征选择基本概念 |
34-35 |
|
3.4.2 邮件数字信息特征选择算法及实现 |
35-40 |
|
3.5 基于遗传算法和特征选择度量相结合的特征选择方法设计与实现 |
40-49 |
|
3.5.1 遗传算法基本概述 |
40-43 |
|
3.5.2 遗传算法和特征选择度量相结合的特征选择设计与实现 |
43-49 |
|
3.6 本章小结 |
49-50 |
|
第四章 基于机器学习的邮件信息处理分类器的设计与实现 |
50-66 |
|
4.1 人工神经网络 |
50-52 |
|
4.1.1 人工神经网络理论 |
50 |
|
4.1.2 人工神经网络的基本结构 |
50-52 |
|
4.2 BP 神经网络结构与原理 |
52-54 |
|
4.2.1 BP 网络结构 |
53 |
|
4.2.2 BP 网络的信号流动 |
53 |
|
4.2.3 误差反向传播算法过程 |
53-54 |
|
4.3 邮件数字信息BP 神经网络分类器的设计与实现 |
54-59 |
|
4.3.1 邮件数字信息BP 神经网络分类器学习算法 |
54-56 |
|
4.3.2 邮件数字信息BP 神经网络分类器结构设计 |
56-58 |
|
4.3.3 BP 神经网络实现邮件数字信息分类处理 |
58-59 |
|
4.4 BP 算法的缺点 |
59-60 |
|
4.5 遗传算法优化BP 神经网络邮件数字信息分类器设计 |
60-65 |
|
4.5.1 遗传神经网络 |
60-61 |
|
4.5.2 遗传算法优化BP 网络权值设计与实现 |
61-65 |
|
4.6 本章小结 |
65-66 |
|
第五章 基于机器学习的邮件数字信息处理系统实现 |
66-83 |
|
5.1 基于机器学习的邮件数字信息处理系统设计 |
66-69 |
|
5.1.1 基于机器学习的邮件数字信息处理系统模型 |
66 |
|
5.1.2 基于机器学习的邮件数字信息处理系统工作过程 |
66-67 |
|
5.1.3 邮件数字信息处理系统功能模块 |
67-69 |
|
5.2 邮件数字信息训练和测试样本集 |
69 |
|
5.3 邮件数字信息处理系统实现 |
69-73 |
|
5.3.1 系统软硬件环境 |
69-70 |
|
5.3.2 邮件数字信息处理系统 |
70-73 |
|
5.4 基于机器学习的邮件数字信息处理系统实验及结果分析 |
73-82 |
|
5.4.1 邮件数字信息处理系统性能评价体系 |
73-74 |
|
5.4.2 邮件数字信息处理系统处理及结果分析 |
74-82 |
|
5.5 本章小结 |
82-83 |
|
第六章 总结与展望 |
83-85 |
|
6.1 总结 |
83-84 |
|
6.2 下一步工作的展望 |
84-85 |
|
参考文献 |
85-89 |
|
致谢 |
89-90 |
|
攻读硕士学位期间发表的学术论文 |
90 |
|
| 【DOI】 | LunWen.ID:2.2008.387904 |