一种复合的双引擎智能垃圾邮件过滤方法
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 计算机 >> 互联网技术 >> 正文
一种复合的双引擎智能垃圾邮件过滤方法
作者:周永 Publish: 2007-10-25 Hits:-
【中文题名】 一种复合的双引擎智能垃圾邮件过滤方法
【英文题名】 An Intelligent and Integrated Method of Spam Filtering with Double Engines
【学科专业】 计算机软件与理论
【论文级别】 硕士论文
【投稿时间】 2007-10-25
【中关键词】 垃圾邮件,正常邮件,黑白名单,规则,贝叶斯过滤算法,
【英关键词】 spam-mail,ham mail,white and black lists,rules,Bayesian filtering,
【分类导航】 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>计算机网络>一般性问题
【论文摘要】  最近几年,互联网进入了飞速发展的时期,尤其是电子邮件的广泛使用极大的方便了人们的通讯交往,降低了人们的通讯成本,与此同时,也产生了新的问题——大量垃圾邮件的涌现,这也导致花大量的时间和精力来处理来垃圾邮件。如何更加准确地将垃圾邮件从正常邮件中区分出来并过滤掉,已经成为一个世界性的课题,即反垃圾邮件问题。 为了解决这个让人棘手的问题,一定要采取一个系统化的方案,包括立法、社会组织、技术方法。从技术的角度出发,传播垃圾邮件和过滤垃圾邮件是此消彼长的长期斗争过程,就像反病毒一样。为此,本文就反垃圾邮件的应用技术,贝叶斯分类模型,中心距向量空间模型,多分类模型组合等相关理论和知识进行了研究。 基于概率统计原理的贝叶斯分类算法是一种经典的文本分类方法,它本身具有理论发展成熟,分类准确度高的特点;中心距向量空间模型是一种新颖的文本分类算法,由于其很好的准确性,良好的多分类性能,目前也被广泛应用到各类文本分类应用中。 在分析了这几种方法和技术在邮件过滤应用中各自的优缺点后,根据这几种算法的优缺点,对它们进行改良、相互结合、并增加了通过查看发出的邮件内容进行自动学习的机制。另外,该算法针对中...
【论文题纲】
摘要 3-4
ABSTRACT 4-9
1 概述 9-23
1.1 垃圾邮件的文化与历史 12-16
1.1.1 垃圾邮件的概念与定义 12-13
1.1.2 垃圾邮件泛滥的原因 13-15
1.1.3 垃圾邮件泛滥的危害 15-16
1.2 国内外反垃圾邮件研究现状 16-22
1.2.1 服务器端和客户端的邮件过滤 17-19
1.2.2 白名单,黑名单 19
1.2.3 安全认证方法 19
1.2.4 规则匹配 19-20
1.2.5 基于内容分类的垃圾邮件过滤技术 20-22
1.3 论文的主要内容和章节安排 22-23
2 反垃圾邮件中常用智能算法研究 23-33
2.1 构建文本自动分类模型 23-24
2.2 文本分类的研究基础 24-25
2.3 特征的选择方法 25-27
2.3.1 文档频次 26
2.3.2 互信息 26
2.3.3 信息增益 26-27
2.3.4 X~2 统计量 27
2.3.5 相对熵 27
2.3.6 优势率 27
2.4 垃圾邮件内容过滤中应用的文本分类方法 27-32
2.4.1 中心距向量分类法 28
2.4.2 KNN (K 最近邻居)算法 28-29
2.4.3 支持向量机 29
2.4.4 贝叶斯过滤算法 29-32
2.5 本章小结 32-33
3 一种复合的双引擎智能垃圾邮件过滤方法理论研究 33-38
3.1 邮件过滤的功能 33-34
3.2 邮件配置功能 34-35
3.3 智能学习功能 35-36
3.4 词库特征项的选择 36
3.5 分词技术 36
3.6 复合智能算法的性能评估 36-37
3.7 本章小结 37-38
4 垃圾邮件过滤方法的应用技术研究及关键技术实现 38-53
4.1 基于 WINDOWS平台规则过滤应用技术研究 38-49
4.1.1 网络过滤应用技术的研究 38-49
4.2 基于贝叶斯和中心距智能的垃圾邮件过滤应用技术研究 49-52
4.2.1 特征向量的获取算法 49-50
4.2.2 学习流程 50-51
4.2.3 关键词的优化 51
4.2.4 分词技术模块 51-52
4.3 本章小结 52-53
5 结论和建议 53-54
致谢 54-55
参考文献 55-57
附录 57
作者攻读硕士学位期间发表及收录的学术论文 57
【DOI】 LunWen.ID:2.2008.376394
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:垃圾邮件 论文 正常邮件 黑白名单 规则 贝叶斯过滤算法
互联网技术最新论文
互联网技术热门论文