|
| 【中文题名】 | 基于链接结构的中文网页排序算法研究 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 【英文题名】 | Research on Link Structure Based Chinese Page Ranking Algorithm | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 【学科专业】 | 计算机科学与技术 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 【论文级别】 | 硕士论文 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 【投稿时间】 | 2007-11-19 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 【中关键词】 | 搜索引擎,PageRank,链接分析,锚文本,, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 【英关键词】 | search engine,PageRank,link analyze,anchor, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>一般性问题>理论、方法>算法理论 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 【论文摘要】 | 目前,互联网上存在着各种各样的资源,而且信息量仍在快速增长着。在庞大的互联网中搜索自己所需要的信息,已经成为大部分用户经常性的操作。搜索引擎的出现,使用户搜索信息的过程变得更为方便快捷,它已成为用户在互联网中收集信息不可缺少的工具。 但是由于网络上的资源缺乏统一的规范,大量网页的结构性、组织性比较差,并且包含的内容涉及到广泛的领域,搜索引擎返回给用户的结果往往不能很好地满足用户的需要。当搜索引擎最终以一定的顺序将搜索结果返回给用户时,用户希望能方便快速地查找到自己需要的网页。 本课题研究的目的就在于把符合用户检索需求的网页更好的排在搜索结果的前面,得到较高的查准率,使其符合用户的浏览习惯。 本课题对中文网页的特点进行了分析,并在分析传统的信息检索排序方法和现在常用的基于网页链接结构排序算法优缺点的基础上,引入了锚文本和网页的相关度改进PageRank算法。本文的主要研究内容如下: (1)分析原始网页内容,提取出网页中所有链接和链接文本,建立网页地址索引库。 (2)分析网页编码方式,净化网页内容,利用VSM模型计算锚文本和网页的相关度。 (3)通过建立链... | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 【论文题纲】 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 【DOI】 | LunWen.ID:2.2008.362374 |
| 付费论文:有参考文献 300元 | |
| 1、注册会员 2、购买本文 3、下载文章 | |
| 注:此文为收费论文,需付费购买。每页大约1000字。 |
|