| 【中文题名】 | 基于贝叶斯网络的信息检索研究 |
| 【英文题名】 | Researched Information Retrieval Based on Bayesian Network |
| 【学科专业】 | 计算机软件与理论 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-10-25 |
| 【中关键词】 | 贝叶斯网络,信息检索模型,关联规则挖掘,向量空间模型,查全率,查准率 |
| 【英关键词】 | Bayesian Network,Information Retrieval Model,Mining Association Rules,Vector Space Model,Recall rate,Precision rate, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>检索机 |
| 【论文摘要】 |
贝叶斯网络是以统计学为基础,是数据挖掘技术的一种方法。本质上贝叶斯网络是一个有向无循环的图表模型,直观地表述了多个变量之间的依赖关系。它通过一个有向无循环图来描述各个节点之间的因果关系,通过一个条件概率分布表来描述各个节点之间的关系密切程度。并且,贝叶斯网络可以有效地把先验知识和现有数据结合起来,使得网络的推理结果更加的合理。特别是在当前数据较少或者较难获得的情况下,贝叶斯网络的这一优点更加明显。
现在随着因特网技术的迅速发展,因特网上的信息成几何级数增长,传统的信息检索服务已不能满足用户的检索需求,因此智能信息检索成为重要的研究课题。影响一个检索系统的性能有很多因素,最关键的还是信息检索的模型。信息检索的模型的效率决定了整个信息检索效果。
本文从介绍了信息检索的三类数学模型——集合模型、代数模型和概率模型着手,对这三类信息检索模型的检索效果进行了分析。并分析了利用贝叶斯网络来进行信息检索的几个优势:贝叶斯网络方法有坚实的理论基础;贝叶斯网络有成熟的概率推理算法和开发软件;贝叶斯网络更适合于信息检索模型;贝叶斯网络具有很强的学习能力。同时结合信息检索本身的特点,本文在推理网络模型的基... |
| 【论文题纲】 |
|
摘要 |
3-4 |
|
ABSTRACT |
4-9 |
|
1 绪论 |
9-14 |
|
1.1 课题的提出背景 |
9 |
|
1.2 国内外研究的现状与发展 |
9-11 |
|
1.2.1 智能化信息检索 |
9-10 |
|
1.2.2 贝叶斯网络的应用 |
10-11 |
|
1.3 本文研究的意义、目标与主要内容 |
11-13 |
|
1.4 论文的框架与组织 |
13-14 |
|
2 现有信息检索模型综述 |
14-24 |
|
2.1 集合模型 |
14-18 |
|
2.1.1 布尔模型 |
14-15 |
|
2.1.2 扩展布尔模型 |
15-17 |
|
2.1.3 总结 |
17-18 |
|
2.2 代数模型 |
18-20 |
|
2.3 概率模型 |
20-21 |
|
2.4 三种模型的比较 |
21-23 |
|
2.4.1 概率模型与向量空间模型的关系 |
21-22 |
|
2.4.2 三种模型的综合比较 |
22-23 |
|
2.5 本章小结 |
23-24 |
|
3 贝叶斯网络的概述 |
24-29 |
|
3.1 贝叶斯网络基本概念 |
24-26 |
|
3.1.1 贝叶斯网的产生 |
24-25 |
|
3.1.2 贝叶斯网的表示方法 |
25-26 |
|
3.2 贝叶斯网络与神经网络的关系 |
26-27 |
|
3.3 应用贝叶斯网络进行信息检索的优势 |
27-28 |
|
3.4 本章小结 |
28-29 |
|
4 基于贝叶斯网络的信息检索模型 |
29-37 |
|
4.1 符号约定 |
29 |
|
4.2 检索模型的结构框架 |
29-30 |
|
4.3 推理网络模型 |
30-33 |
|
4.4 贝叶斯网络模型 |
33-35 |
|
4.5 贝叶斯网络模型的简化计算 |
35-36 |
|
4.6 本章小结 |
36-37 |
|
5 基于贝叶斯网络对检索项进行扩展 |
37-44 |
|
5.1 扩展检索项的贝叶斯网络 |
37-38 |
|
5.2 关联规则挖掘的基本概念和问题描述 |
38-39 |
|
5.3 关联规则挖掘算法——APRIORI 算法 |
39-40 |
|
5.4 利用频繁项目集对用户检索项进行扩展计算 |
40-42 |
|
5.5 本章小结 |
42-44 |
|
6 模型的性能评估 |
44-51 |
|
6.1 总述 |
44 |
|
6.2 实验介绍 |
44-46 |
|
6.2.1 数据的采集 |
44 |
|
6.2.2 关键词的扩展与权重的计算 |
44-45 |
|
6.2.3 计算查询项与文档之间的相似度 |
45-46 |
|
6.3 评价模型的两个指标 |
46-48 |
|
6.4 影响模型性能的因素 |
48-49 |
|
6.4.1 数据采集 |
48 |
|
6.4.2 贝叶斯概率推理 |
48 |
|
6.4.3 适应性 |
48-49 |
|
6.5 未来工作的展望 |
49-50 |
|
6.5.1 信息检索模型的发展 |
49 |
|
6.5.2 增量挖掘技术 |
49-50 |
|
6.6 本章小结 |
50-51 |
|
7 结束语 |
51-52 |
|
致谢 |
52-53 |
|
参考文献 |
53-58 |
|
附录 |
58 |
|
| 【DOI】 | LunWen.ID:2.2008.389062 |