人工智能在搜索引擎资源获取中的应用
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 自动化 >> 自动化基础 >> 正文
人工智能在搜索引擎资源获取中的应用
Form: 论文之家 作者:车志军 Publish: 2006-3-23 Hits:-
【中文题名】 人工智能在搜索引擎资源获取中的应用
【英文题名】 The Application of Artificial Intelligence in the Information Collection by Search Engine
【学科专业】 软件工程
【论文级别】 硕士论文
【投稿时间】 2006-3-23
【中关键词】 搜索引擎,网络爬虫,启发式搜索,智能代理,文本向量,
【英关键词】 search engine,WebCrawler,heuristic search,Intelligent Agent,text vector,
【分类导航】 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>检索机
【论文摘要】 随着网络技术的不断发展,网上的信息资源成几何规律增加。越来越多的信息给人们带来方便的同时也增加了信息查找的难度。搜索引擎也随之应运而生。依靠搜索引擎,用户能够方便地查找需要的信息。搜索引擎一个重要部分是网络爬虫程序,依靠网络爬虫,搜索引擎可以获取用来检索的原材料信息。 传统的搜索引擎资源获取部分使用的是盲目式的遍历算法,即对所获得的链接进行遍历,抽取相关信息保存数据库中供搜索引擎检索调用。这种方法存在不少问题。使用这种方法,会导致垃圾数据的大量积累,对于某些获取的数据,可能从来不被检索访问。除此之外,由于遍历了大量无关的链接,会导致系统负担的增加,效率的低下。 在本文中,提出使用人工智能中的启发式搜索来获取特定的信息,这样可以极大地减少遍历的链接数量,使被访问到的链接尽量地指向有用的信息。减少了无关链接的访问数量,就能极大地提高相对回报率,从而提高了系统的效率。 另外,在页面类型的判断中,本文引入了一个智能代理系统,完成网页类型的自动分类判断。该部分通过抽取网页的特征项,形成文本向量,然后与中心向量进行相似度计算后,根据相似度的结果来对网页进行自动分类。
【论文题纲】
1 绪论 7-19
1.1 引言 7
1.2 搜索引擎简介 7-11
1.2.1 搜索引擎的分类 7-8
1.2.2 搜索引擎的工作原理 8-10
1.2.3 主要的搜索引擎介绍 10-11
1.3 人工智能简介 11-19
1.3.1 人工智能理论 11-13
1.3.2 人工智能研究领域 13-14
1.3.3 智能代理技术 14-19
1.4 启发式算法应用搜索引擎的可能性 19
2 启发式搜索算法 19-24
2.1 启发式搜索 19-20
2.2 问题求解 20-21
2.3 启发式搜索过程 21-22
2.4 估价函数和启发信息 22-23
2.5 启发式搜索的代价和复杂性 23-24
3 理论工具-A*算法 24-37
3.1 基于深度优先和广度优先的搜索算法 24-26
3.1.1 深度优先搜索 24-25
3.1.2 宽度优先搜索 25-26
3.2 A*算法概述 26-27
3.3 A*算法流程 27-28
3.4 A*算法中的启发函数 28-29
3.S A*算法的程序编写 29-37
4 人工智能与搜索引擎资源获取的结合 37-59
4.1 问题的提出 37-41
4.1.1 现有搜索引擎资源获取的方式 37-39
4.1.2 现有搜索引擎资源获取方式的缺陷 39-40
4.1.3 将人工智能应用于搜索引擎资源获取 40-41
4.2 估值函数的设计 41-44
4.2.1 web页面的特点 41-42
4.2.2 web页面中链接的特点 42-43
4.2.3 估价函数的内部流程与代码 43-44
4.3 页面判断中使用的智能代理技术 44-50
4.3.1 文本表示方法 45
4.3.2 特征项的抽取 45-46
4.3.3 分类判断 46-49
4.3.4 阀值的确定 49
4.3.5 页面判断部分总的结构和流程 49-50
4.4 A*算法应用在搜索中 50-54
4.5 算法的应用和结果分析 54-59
4.5.1 实验结果分析 54-56
4.5.2 算法效率和程序执行代价分析 56-59
5 结论和建议 59-61
5.1 结论 59
5.2 建议 59-61
参考文献 61-65
致谢 65
【DOI】 LunWen.ID:2.2008.387660
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:搜索引擎 论文 网络爬虫 启发式搜索 智能代理 文本向量
自动化基础最新论文
自动化基础热门论文