| 【中文题名】 | 基于贝叶斯网络的结构化文档检索 |
| 【英文题名】 | Structured Document Retrieval Based on Bayesian Network |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-11-14 |
| 【中关键词】 | 结构化文档,贝叶斯网络,共现分析,信息检索,, |
| 【英关键词】 | structured document,Bayesian network,co-occurrence analysis,information retrieval, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>检索机 |
| 【论文摘要】 | 传统的基于关键词匹配的信息检索方法采用单一、表面化的模型,仅用单一的术语来对信息资源进行检索,返回的结果在查全率和查准率上都往往无法满足检索者的需求。同时大量研究结果表明,在检索过程中引入术语之间的关系可以提高检索性能。
贝叶斯网络是一种不确定性知识表达与推理模型,是现阶段处理不确定信息技术的主流,而且以其良好的知识表现形式和处理不确定性问题的能力在信息检索领域已经有了比较广泛的应用。特别是它能够精细的表示文档的结构,因此适合于应用到信息检索新的研究分支——结构化文档检索中。
本文利用共现分析方法挖掘文档集合中术语之间的相关关系,并将其引入到了结构化文档检索中,提出了一个基于贝叶斯网络的结构化文档检索模型,给出了该模型的拓扑结构,各层结点的概率估计方法以及完整的推理过程。共现分析方法是传统信息检索中建立概念空间方法的核心部分,为了使其适用于结构化文档检索,本文对该方法中一些公式进行了相应修改。最后经过实例分析表明,本文提出的模型能够有效地提高检索性能。 |
| 【论文题纲】 |
|
第1章 引言 |
8-12 |
|
1.1 研究背景 |
8 |
|
1.2 国内外研究现状 |
8-10 |
|
1.3 本文工作和论文组织 |
10-12 |
|
第2章 信息检索概述 |
12-25 |
|
2.1 信息检索定义及基本过程 |
12-13 |
|
2.1.1 信息检索 |
12 |
|
2.1.2 信息检索基本过程 |
12-13 |
|
2.2 信息检索经典模型 |
13-20 |
|
2.2.1 基础知识 |
13-14 |
|
2.2.2 布尔(Boolean)模型 |
14-15 |
|
2.2.3 向量(Vector)模型 |
15-18 |
|
2.2.4 概率模型 |
18-20 |
|
2.3 结构化文档检索 |
20-22 |
|
2.4 语义检索 |
22-25 |
|
第3章 贝叶斯网络理论与用于信息检索的贝叶斯网络 |
25-38 |
|
3.1 贝叶斯网络理论 |
25-30 |
|
3.1.1 贝叶斯网络的发展历史 |
25-26 |
|
3.1.2 贝叶斯概率的相关概念 |
26 |
|
3.1.3 贝叶斯网络定义及特性 |
26-28 |
|
3.1.4 贝叶斯网络的构建方法 |
28-29 |
|
3.1.5 贝叶斯网络的研究现状 |
29-30 |
|
3.2 用于信息检索的贝叶斯网络 |
30-38 |
|
3.2.1 推理网络模型 |
31-32 |
|
3.2.2 信念网络模型 |
32-33 |
|
3.2.3 贝叶斯网络检索模型 |
33-38 |
|
第4章 基于贝叶斯网络的结构化文档检索模型 |
38-50 |
|
4.1 结构化文档的表示方法 |
38-39 |
|
4.2 共现分析方法简介 |
39-41 |
|
4.3 模型的网络拓扑结构描述 |
41-42 |
|
4.4 结构化文档检索模型中术语权重值的计算 |
42-45 |
|
4.5 共现分析方法挖掘术语之间的关系 |
45-46 |
|
4.6 网络中节点条件概率估计 |
46-48 |
|
4.7 检索过程:网络推理 |
48-50 |
|
第5章 模型性能分析 |
50-56 |
|
5.1 数据收集 |
50 |
|
5.2 数据处理 |
50-51 |
|
5.3 索引过程 |
51-52 |
|
5.4 推理过程 |
52-53 |
|
5.5 结果修正 |
53-54 |
|
5.6 测试结果及分析 |
54-56 |
|
第6章 总结与展望 |
56-58 |
|
参考文献 |
58-60 |
|
攻读硕士学位期间发表论文情况 |
60-61 |
|
致谢 |
61 |
|
| 【DOI】 | LunWen.ID:2.2008.388025 |