| 【中文题名】 | 基于神经网络的邮件分类识别研究 |
| 【英文题名】 | |
| 【学科专业】 | 交通信息工程及控制 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-11-6 |
| 【中关键词】 | 垃圾邮件,特征,神经网络,训练,, |
| 【英关键词】 | spam,character,neural network,train, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>计算机网络>一般性问题 |
| 【论文摘要】 | 随着电子邮件的广泛应用,垃圾邮件作为商业广告、恶意程序或敏感内容的载体,也越来越对系统的安全和人们的生活造成了严重威胁,反垃圾邮件问题已经成为全球性的具有重要现实意义的课题。
但是垃圾邮件快速增长的同时,反垃圾邮件的技术发展缓慢。目前绝大部分邮件过滤技术缺乏智能性和自学习性,不能对己有垃圾邮件的学习来获取识别新垃圾邮件的知识。只有少部分邮件过滤技术具有学习能力(比如贝叶斯过滤技术),但该技术仅局限于针对邮件的正文内容进行学习,因此,对于结构化文本信息的电子邮件来说,这种技术也有其自身的不足。
本文在贝叶斯过滤技术的启发下,通过分析传统邮件过滤技术的不足之处,在对大量垃圾邮件进行统计分析的基础上,提出了一个基于服务器端的神经网络邮件分类识别模型。该模型综合分析了垃圾邮件和合法邮件的特征,对邮件结构字段信息和邮件正文信息加以离散和特征化处理,并通过编程提取出7个特征属性来表示成向量代表电子邮件。BP算法具有智能性和自学习性的特点,因此,本文提出采用BP神经网络来构造邮件分类识别器。本文比较分析了常用BP改进算法,同时根据收敛速度和精度采用了LM改进算法提高了系统性能。论文最后通过编... |
| 【论文题纲】 |
|
摘要 |
3-4 |
|
ABSTRACT |
4-8 |
|
第一章 绪论 |
8-12 |
|
1.1 论文的背景 |
8-9 |
|
1.2 国内外研究现状 |
9-11 |
|
1.3 本课题的研究内容 |
11-12 |
|
第二章 邮件基本理论 |
12-30 |
|
2.1 Email发展历史 |
12 |
|
2.2 邮件传输原理 |
12-21 |
|
2.2.1 邮件的格式 |
12-13 |
|
2.2.2 邮件头的基本格式和结构 |
13-16 |
|
2.2.3 MIME邮件头字段扩充 |
16-20 |
|
2.2.4 邮件传送过程 |
20-21 |
|
2.3 邮件协议分析 |
21-26 |
|
2.3.1 SMTP |
21-23 |
|
2.3.2 POP/IMAP |
23-26 |
|
2.4 垃圾邮件特征 |
26-29 |
|
2.4.1 垃圾邮件定义 |
26 |
|
2.4.2 分析垃圾邮件特征 |
26-29 |
|
2.5 与神经网络的结合 |
29-30 |
|
第三章 基于神经网络的邮件分类识别模型 |
30-45 |
|
3.1 人工神经网络 |
30-34 |
|
3.1.1 简介 |
30-31 |
|
3.1.2 神经网络的基本属性 |
31 |
|
3.1.3 神经网络模型的分类 |
31-32 |
|
3.1.4 神经网络的学习机理和机构 |
32-34 |
|
3.1.5 神经网络学习的梯度算法 |
34 |
|
3.2 误差反向传播的前馈网络(BP网络) |
34-40 |
|
3.2.1 BP网络的数学模型 |
35-37 |
|
3.2.2 常用激活函数 |
37-39 |
|
3.2.3 BP网络的基本学习步骤 |
39-40 |
|
3.3 BP算法的改进 |
40 |
|
3.4 模型的设计 |
40-45 |
|
3.3.1 邮件的向量表示 |
40-41 |
|
3.3.2 邮件的特征属性 |
41-43 |
|
3.3.3 邮件的特征提取 |
43 |
|
3.3.4 基于BP神经网络的邮件分类识别模型 |
43-45 |
|
第四章 模型的搭建及实验结果 |
45-68 |
|
4.1 模型的设计目标 |
45 |
|
4.2 模型流程图 |
45-46 |
|
4.3 模型的实现 |
46-68 |
|
4.3.1 邮件样本数据收集的实现 |
46 |
|
4.3.2 特征提取的具体实现 |
46-50 |
|
4.3.3 构造邮件分类识别神经网络 |
50-59 |
|
4.3.4 网络的训练及测试结果 |
59-68 |
|
第五章 论文的总结与展望 |
68-70 |
|
5.1 论文的总结 |
68 |
|
5.2 后继研究工作展望 |
68-70 |
|
致谢 |
70-71 |
|
参考文献 |
71-74 |
|
攻读硕士学位期间公开发表论文 |
74 |
|
| 【DOI】 | LunWen.ID:2.2008.388135 |