| 【中文题名】 | 搜索引擎网页快照的安全性研究 |
| 【英文题名】 | The Security Research of Search Engine Website Snapshot System |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-9-24 |
| 【中关键词】 | 搜索引擎,网页快照,机器学习,脚本语言安全,知识库, |
| 【英关键词】 | search engine,website snapshot,machine learning,scripting languages security,repository, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>计算机网络>一般性问题 |
| 【论文摘要】 |
本文首先介绍了搜索引擎的发展现状,探讨了末来的发展趋势。在对搜索引擎相关技术进行了阐述之后,对搜索引擎中网页快照技术进行了研究。目前保存于搜索引擎服务器海量缓存中的网页快照在提供给用户更快捷和更方便的访问方式的同时,也将网页中可能的不安全代码一并保存并在用户搜索时一起返回给用户,使计算机在不知不觉中感染病毒。因此,本文对网页快照在实现的同时,进行了安全方面的研究。
要实现网页快照的安全性判断,本文尝试采用了人工智能的先进方法——机器学习。利用机器学习中应用较为广泛的示例学习和机械学习相结合,通过建立学习解释器,对网页中的Javascript等脚本语言进行判断,去除不安全代码或者可疑代码。
现在网页上的恶意代码越来越多,随之而来的,网页快照上存在不安全代码的可能性也大大增加。为了识别恶意代码,将几种含有常见的恶意代码的程序段的特征关键字作为机器学习的知识库中的示例知识,把网页中Javascript部分的代码分离出来,并将其与知识库中的关键字进行比较判断。
本系统的机器学刊通过执行单元将网页的Javascript程序段与知识库进行比较,如果相同或相似则认为是恶意代码,于是就将相似... |
| 【论文题纲】 |
|
摘要 |
4-6 |
|
ABSTRACT |
6-14 |
|
第一章 绪论 |
14-16 |
|
1.1 课题来源 |
14 |
|
1.2 课题的目的和意义 |
14-15 |
|
1.3 课题的主要研究内容 |
15-16 |
|
第二章 搜索引擎的概述 |
16-28 |
|
2.1 搜索引擎的概念 |
16 |
|
2.2 搜索引擎的发展史 |
16-17 |
|
2.3 我国搜索引擎发展现状 |
17-18 |
|
2.4 搜索引擎的分类 |
18-20 |
|
2.4.1 目录式搜索引擎 |
18-19 |
|
2.4.2 机器人搜索引擎 |
19-20 |
|
2.4.3 元搜索引擎 |
20 |
|
2.5 未来发展趋势 |
20-22 |
|
2.5.1 搜索引擎的多元化 |
21 |
|
2.5.2 搜索引擎的专业化 |
21-22 |
|
2.5.3 搜索引擎的智能化 |
22 |
|
2.5.4 搜索引擎的多媒体化 |
22 |
|
2.6 搜索引擎的工作原理 |
22-23 |
|
2.7 搜索引擎相关技术 |
23-26 |
|
2.7.1 搜索器 |
24 |
|
2.7.2 索引器 |
24-25 |
|
2.7.3 检索器 |
25 |
|
2.7.4 用户接口 |
25-26 |
|
2.8 网页快照技术 |
26-28 |
|
第三章 网页快照安全性的相关技术 |
28-42 |
|
3.1 人工智能 |
28-34 |
|
3.1.1 人工智能研究领域 |
28-30 |
|
3.1.2 机器学习 |
30-31 |
|
3.1.3 机器学习的分类 |
31-32 |
|
3.1.4 知识的表示 |
32-33 |
|
3.1.5 常用的知识表示方法 |
33-34 |
|
3.2 网页脚本语言的安全 |
34-37 |
|
3.2.1 JavaApplet |
36 |
|
3.2.2 Javascript |
36 |
|
3.2.3 ActiveX |
36-37 |
|
3.3 恶意代码关键技术剖析 |
37-40 |
|
3.3.1 Html解释器漏洞恶意代码 |
38 |
|
3.3.2 脚本解释器漏洞恶意代码 |
38 |
|
3.3.3 应用程序漏洞恶意代码 |
38-39 |
|
3.3.4 利用恶意控件实施攻击 |
39-40 |
|
3.4 网页病毒的种类 |
40-42 |
|
第四章 网页快照及其安全性的设计与实现 |
42-66 |
|
4.1 系统设计 |
42-48 |
|
4.1.1 搜索引擎系统总体设计 |
42-44 |
|
4.1.2 目前网页快照的不足 |
44-45 |
|
4.1.3 网页快照的改进思路 |
45-48 |
|
4.2 网页快照及其安全性的实现 |
48-66 |
|
4.2.1 Html网页代码转换器的实现 |
48-49 |
|
4.2.2 知识库的实现 |
49-52 |
|
4.2.3 脚本语言学习解释器的实现 |
52-56 |
|
4.2.4 Html代码网页转换器的实现 |
56-58 |
|
4.2.5 网页快照与索引数据库的关联映射 |
58-59 |
|
4.2.6 网页快照关键字的渲染 |
59-60 |
|
4.2.7 实验结果 |
60-66 |
|
第五章 总结 |
66-68 |
|
5.1 已经完成的工作 |
66-67 |
|
5.2 未来研究方向 |
67-68 |
|
参考文献 |
68-72 |
|
致谢 |
72-74 |
|
研究成果及发表的学术论文 |
74-76 |
|
作者和导师简介 |
76-77 |
|
硕士研究生学位论文答辩委员会决议书 |
77-78 |
|
| 【DOI】 | LunWen.ID:2.2008.376159 |