基于内容的垃圾邮件过滤技术研究
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 计算机 >> 互联网技术 >> 正文
基于内容的垃圾邮件过滤技术研究
作者:尹志喜 Publish: 2007-10-15 Hits:-
【中文题名】 基于内容的垃圾邮件过滤技术研究
【英文题名】 Research on Content-Based Spam Filtering
【学科专业】 计算机应用技术
【论文级别】 硕士论文
【投稿时间】 2007-10-15
【中关键词】 垃圾邮件,过滤,贝叶斯算法,文本分类,特征提取,
【英关键词】 spam email,filtering techniques,Na(?)ve Bayes,text categorization,feature extraction,
【分类导航】 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>计算机网络>一般性问题
【论文摘要】  伴随着Internet的普及,电子邮件以其快捷、方便、低成本的特点已成为互联网上最重要、最普及的应用。但是随之而来的垃圾邮件也越来越泛滥,侵占了有限的存储、计算和网络资源,耗费了用户大量的处理时间,影响和干扰了用户的正常工作,生活和学习。如何有效地治理垃圾邮件问题是全世界共同面临的一道难题,也是互联网上目前亟待解决的问题。 目前经常采用的垃圾邮件过滤技术一般包括白名单与黑名单技术、规则过滤以及基于关键词匹配的内容扫描等。另外还有一种就是从电子邮件的文本内容入手,使用文本分类算法,对邮件进行分类。垃圾邮件过滤中常用的文本分类方法有简单贝叶斯、k—近邻、决策树等。基于概率的朴素贝叶斯算法具有方法简单、运算速度快、分类精确度高等优点,在文本分类中得到了广泛的应用。由于在邮件过滤过程中,合法邮件被误判为垃圾邮件将可能给用户带来据大的损失,因此在邮件过滤中就要采取适当的措施以减小损失。在目前的各种反垃圾邮件技术中,一种基于概率统计的贝叶斯过滤技术以其较好的智能性、适应性和有效性而越来越多的被深入研究和广泛采用。 本文从技术角度出发,在全面系统学习和总结国内外反垃圾邮件领域的最新成果的基础上,深...
【论文题纲】
摘要 4-5
Abstract 5-10
第一章 绪论 10-13
1.1 垃圾邮件的定义 10
1.2 垃圾邮件的现状 10-11
1.3 垃圾邮件的危害 11
1.4 垃圾邮件的解决 11-12
1.5 论文的研究内容 12-13
第二章 垃圾邮件过滤研究现状 13-19
2.1 服务器端和客户端的邮件过滤 13-15
2.2 白名单和黑名单 15
2.3 设定过滤规则 15-16
2.3.1 信头分析 15
2.3.2 群发过滤 15-16
2.3.3 关键词精确匹配 16
2.3.4 邮件内容中的其他特征 16
2.4 基于内容的垃圾邮件过滤技术 16-18
2.4.1 垃圾邮件过滤与文本分类 16-17
2.4.2 垃圾邮件过滤与信息过滤 17-18
2.5 总结 18-19
第三章 电子邮件系统工作原理 19-27
3.1 电子邮件系统的组成与工作模式 19-20
3.2 电子邮件系统相关协议 20-27
3.2.1 SMTP协议 20-22
3.2.2 POP3 协议 22-24
3.2.3 IMAP协议 24-25
3.2.4 MIME协议 25-27
第四章 垃圾邮件内容过滤技术 27-41
4.1 文本分类概况 27-28
4.2 特征选择方法 28-30
4.2.1 文档频次 28
4.2.2 互信息 28-29
4.2.3 信息增益 29
4.2.4 X~2 统计量 29-30
4.2.5 相对熵 30
4.2.6 优势率 30
4.3 文本分类方法在垃圾邮件内容过滤中的应用 30-35
4.3.1 贝叶斯分类算法 30-31
4.3.2 Memory-Based 方法 31-32
4.3.3 决策树 32
4.3.4 Boosting方法 32-34
4.3.5 支持向量机 34-35
4.4 垃圾邮件内容过滤中的常用语料库 35-38
4.4.1 Ling-Spam语料 36-37
4.4.2 PU1 语料 37-38
4.4.3 Spam Assassin语料 38
4.4.4 Spambase语料 38
4.5 垃圾邮件过滤的评价体系 38-41
第五章 贝叶斯过滤算法 41-48
5.1 贝叶斯定理 41
5.2 算法的主要思想 41-42
5.3 算法的具体步骤 42-44
5.4 算法的参数选取 44
5.5 实例应用 44-48
第六章 客户端垃圾邮件过滤系统设计 48-63
6.1 整体模型设计 48-49
6.2 贝叶斯过滤器设计 49-57
6.2.1 模型设计 49-51
6.2.2 算法实现 51-56
6.2.3 贝叶斯算法中的反馈学习技术 56
6.2.4 一些建议 56-57
6.3 贝叶斯算法用于垃圾邮件过滤的试验 57-63
6.3.1 实验结果 58-59
6.3.2 实验结果分析 59-63
第七章 总结与展望 63-65
7.1 总结 63
7.2 展望 63-65
参考文献 65-69
攻读硕士期间发表的论文 69
攻读硕士期间参加的项目 69-70
致谢 70
【DOI】 LunWen.ID:2.2008.375994
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:垃圾邮件 论文 过滤 贝叶斯算法 文本分类 特征提取
互联网技术最新论文
互联网技术热门论文