| 【中文题名】 | 一种基于相关反馈和用户建模的网络搜索个性化服务 |
| 【英文题名】 | A Personal Service for Web Searching Based on Relevant Feedback and User's Interest Modeling |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-3-14 |
| 【中关键词】 | 搜索引擎,相关反馈,特征提取,兴趣模型,遗传,算法 |
| 【英关键词】 | search engine,relevant feedback,feature extraction,interest model,genetic algorithm, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>计算机网络>一般性问题 |
| 【论文摘要】 | 人类社会进入信息时代,信息量的与日俱增为人们带来了信息共享的快乐,同时也带来了“信息迷航”和“知识匮乏”等问题。人们希望快速地得到自己需要的并具有个性的信息。对搜索引擎的检索结果进行个性化研究是解决该问题的有效途径之一。
本文提出利用相关反馈技术进行用户兴趣获取,然后根据用户兴趣对搜索结果进行个性化过滤与重排。即通过提取用户感兴趣的Web文本特征词及用户对初始检索结果的反馈获取用户的兴趣,并以此建立动态的用户兴趣模型,从而使搜索结果呈现个性化特征。
本文研究和分析了实现这些功能的一些关键技术,如特征提取、自动分词、遗传算法等。主要包括Web 文本预处理、文本特征提取、网页特征与用户兴趣相似度计算等功能。Web 文本预处理模块将Web 文本进行清洗,去除内容无关项;文本特征提取将提取网页特征,形成网页向量空间模型;网页特征与用户兴趣相似度计算是分析网页与用户需求相关度的最重要的手段。
本文详细介绍了系统的设计与实现过程,讨论了提供网络搜索个性服务的途径和技术,并将之与流行的几大搜索引擎的搜索结果进行了实验比较,得出本系统在个性化方面的优势。 |
| 【论文题纲】 |
|
第一章 绪论 |
7-13 |
|
1.1 课题背景 |
7-11 |
|
1.2 课题难点及创新 |
11-12 |
|
1.3 本文的组织 |
12-13 |
|
第二章 相关反馈技术 |
13-19 |
|
2.1 相关反馈技术的起源与发展 |
13-15 |
|
2.2 相关反馈技术在本系统中的应用 |
15-16 |
|
2.3 信息查询与信息需求 |
16-18 |
|
2.4 小结 |
18-19 |
|
第三章 用户兴趣建模 |
19-37 |
|
3.1 用户兴趣的形成和获取 |
19-21 |
|
3.2 用户兴趣模型的组成 |
21-24 |
|
3.3 用户兴趣向量适应更新 |
24-25 |
|
3.4 用户建模 |
25-28 |
|
3.4.1 用户建模方法 |
25-26 |
|
3.4.2 用户模型的结构 |
26 |
|
3.4.3 建立和维护用户模型的总体过程 |
26-28 |
|
3.5 用户兴趣获取技术 |
28-34 |
|
3.5.1 文本特征提取 |
28-31 |
|
3.5.2 Web 网页的特征提取 |
31-33 |
|
3.5.3 基于语义的主题特征提取 |
33-34 |
|
3.5.4 自动分词技术 |
34 |
|
3.6 运用遗传算法学习用户兴趣知识 |
34-36 |
|
3.7 小结 |
36-37 |
|
第四章 搜索引擎个性代理PASE 的具体实现 |
37-50 |
|
4.1 个性化的特征 |
37-38 |
|
4.2 开发平台 |
38 |
|
4.3 详细设计 |
38-49 |
|
4.3.1 设计思想与依据 |
38-40 |
|
4.3.2 基于相关反馈的搜索引擎个性代理PASE 的结构 |
40-43 |
|
4.3.3 系统流程与模块设计 |
43-48 |
|
4.3.4 系统功能完善 |
48-49 |
|
4.4 小结 |
49-50 |
|
第五章 实验及工作总结 |
50-61 |
|
5.1 实验及结果比较分析 |
50-58 |
|
5.1.1 评价标准 |
50-51 |
|
5.1.2 实验方法及结果 |
51-58 |
|
5.2 工作特色与总结 |
58 |
|
5.3 进一步工作及展望 |
58-61 |
|
参考文献 |
61-63 |
|
符号说明表 |
63-64 |
|
攻读硕士学位期间已公开发表的论文 |
64-65 |
|
致谢 |
65-66 |
|
详细摘要 |
66-93 |
|
| 【DOI】 | LunWen.ID:2.2008.372014 |