| 【论文摘要】 |
随着以通讯、互联网为主的科学技术的发展,信息的获取和利用越来越方便和快捷,使得信息技术正在静悄悄改变我们的生活,改变我们的世界。但是,海量信息的出现也使得人们越来越迷失方向。人们渴望找到一种能方便获取信息的方式。搜索引擎的出现,在一定程序上解决了这个问题。现在,搜索引擎已经是人们使用得最多的互联网服务之一。
但是,在集中式的搜索引擎实现方案中,系统在健壮性和扩展性都存在不足,这会导致系统服务经常停止,并带来了很高的系统运行维护成本。而且,随着互联网发展到以“个性化”和“互动性”为特征web2.0时代,搜索引擎也显露出了自身的不足。
针对以上的不足,本文提出了一种基于搜索引擎技术的分布式信息采集与检索服务体系模型。首先,这是一种基于搜索引擎技术的系统,它能够实时监控指定信息源,在第一时间采集到最新的信息,对信息进行处理,供用户检索;其次,本系统是分布式的,通过多个后台结点间的相互合作,使得系统具有良好的健壮性和扩展性;再次,在系统设计中还融入了自治思想,把系统在正常运行后对维护人员的依赖降到了最低,大大降低了系统运行维护成本;最后,系统不仅能够支持常规的网页查询服务方式,也能支持信息主... |