| 【中文题名】 | 信息检索中的相关反馈技术研究 |
| 【英文题名】 | Study on Feed Back in Information Retrieval |
| 【学科专业】 | 计算机软件与理论 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-10-25 |
| 【中关键词】 | 信息检索,相关反馈,标签影响因子,辐射场,类标题生成,查询词扩展 |
| 【英关键词】 | information retrieval,relevant feedback,tag’s influence weight,radiation field,kind title generating,query words expanding, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>检索机 |
| 【论文摘要】 |
信息检索时,需求的模糊导致查询结果不尽人意。为使检索更有效,需采用各种相关反馈途径对检索策略进行修改,以发现用户的信息需求。近年来,研究者提出了基于各种检索模型下的反馈方法,比较突出的有向量空间模型和概率模型。在本文中首先系统地介绍了信息检索以及各种检索模型下的相关反馈技术。在对反馈技术进行仔细分析的前提下,本文提出了如下创新:
首先分析了向量空间模型及其中的相关反馈。研究发现,向量空间模型检索精度及其中相关反馈的查准率,都在一定程度上受到原始矩阵中数据准确度的影响。传统的权值构造方法是词频-逆文档频率法及其扩展方法。这些方法在处理Web文档的时候,没有考虑到不同Web标签中同一词汇的影响程度有所不同这一特点,故不能准确地反映文档集特点。本文提出了Web标签影响因子算法,通过对大量的训练文档进行分析,从而获得比较准确的标签因子,用其对原始矩阵数据进行了一定程度的精化。通过实验,发现对改善系统查准率有一定帮助。
文中重点分析了概率潜在语义模型中的相关反馈技术。首先对PAM算法进行了初始k点选择优化,优化技术为辐射场,并对辐射场技术中每个参数的选择提出了具体的解决办法。在概率潜在语义模型... |
| 【论文题纲】 |
|
摘要 |
3-4 |
|
ABSTRACT |
4-8 |
|
1 绪论 |
8-12 |
|
1.1 问题的提出、研究意义及现状 |
8-9 |
|
1.2 本研究的目的和研究内容 |
9-10 |
|
1.3 论文的章节安排 |
10-12 |
|
2 信息检索与相关反馈 |
12-21 |
|
2.1 信息检索 |
12-16 |
|
2.2 相关反馈技术基本原理 |
16-21 |
|
3 布尔模型和向量空间模型中的相关反馈 |
21-34 |
|
3.1 布尔模型中的相关反馈 |
21-23 |
|
3.2 向量空间中的相关反馈 |
23-29 |
|
3.3 Web 文档前处理在VSM 中相关反馈里的应用 |
29-34 |
|
4 概率模型中的相关反馈 |
34-40 |
|
4.1 概率检索模型中的文献输出理论 |
34 |
|
4.2 经典概率检索模型中的相关反馈方法 |
34-37 |
|
4.3 经典概率检索模型相关反馈方法的特点 |
37 |
|
4.4 概率检索模型的扩展 |
37-40 |
|
5 基于辐射场的 PAM 聚类算法 |
40-56 |
|
5.1 聚类方法综述 |
40-46 |
|
5.2 主要聚类方法 |
46-48 |
|
5.3 划分方法 |
48-56 |
|
6 概率潜在语义模型中的相关反馈技术 |
56-66 |
|
6.1 概率潜在语义模型 |
56-58 |
|
6.2 文档集的语义空间 |
58-60 |
|
6.3 潜在语义空间中的相关反馈技术 |
60-64 |
|
6.4 实验数据证明 |
64-66 |
|
7 结论 |
66-68 |
|
致谢 |
68-69 |
|
参考文献 |
69-72 |
|
附录:研究生期间主要的工作 |
72 |
|
| 【DOI】 | LunWen.ID:2.2008.370105 |