| 【论文摘要】 |
随着Internet/Intranet相关技术的迅猛发展,网上信息量迅速增长,为了有效利用网络信息资源,如何对网络信息资源的质量与价值评价研究越来越成为一个迫切的课题。目前,许多国内外学者,给出了网络信息资源评价对象、评价指标及评价方法等。另外,针对具体网络对象评价研究也取得了一些成果,主要针对学术网站进行人工评价、网页重要性基于链接关系的评价给出了经典的PageRank、HITS等算法,同时,采用机器学习方法对网页中分块信息的重要程度的评价研究等。然而,通常门户网站都按照主题分类对网页进行组织,网站主题目录网站的一个重要组成,而每个主题目录重要性程度不同,因此,本文给出了网站主题目录重要性的评价研究。
本文采用定量的方法,从每个主题目录所包含的网页数量、网页每月更新率及包含所有网页的重要性均值等评价指标出发进行网站主题目录的评价。将上述指标量化,主题目录对应指标量化结果值越大越重要。
本文首先提出了网站主题目录自动抽取算法,并进行网站主题目录的归并,然后根据不同评价指标进行网站主题目录的重要性评价。门户网站首页导航链接包含大量主题目录信息,但主题目录存在包含关系,而且导航链接中同时... |