| 【论文摘要】 | 随着Internet的发展,远程教育无论是在公司培训还是学校教学,应用都很普遍了。远程教育的迅速发展导致远程教育资源来源很广、数量很大、种类繁多、结构各种各样。要在诸多的资源中迅速而准确的找到所需的资源,就需要有高效的针对这些资源的处理系统。
信息提取系统是从一段文本中抽取指定的一类信息并将其形成结构化的数据供用户使用的过程。目前信息提取系统研究的主要对象是自由文本和半结构化文本。对于自由文本的信息提取,有浅层自然语言处理(shallow NLP)、一阶谓词逻辑和ILP(Induction Logic Programming)技术等。信息检索是系统根据用户的请求从大量的文档中找到相关的信息,并将信息返回给用户的过程。对于结构化数据的检索,也就是对于数据库数据的检索,技术已经发展的比较完备,但是对于Web上的信息检索中,仍需要增强检索的准确度。目前,基于XML的查询语言主要是XML-QL。
本文提出了一个远程教育中信息处理的框架,在框架中,将信息提取和信息检索结合起来,提高其上的信息查询速度和准确度。这个信息处理框架以语义Web为基础,用于远程教育中相关信息的查询。基于这个框架,本文主要... |