| 【中文题名】 | 基于Web日志挖掘的个性化推荐研究 |
| 【英文题名】 | Research on Personalized Recommendation Based on Web Log Mining |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-10-25 |
| 【中关键词】 | Web日志挖掘,个性化推荐,数据预处理,兴趣度,兴趣聚类, |
| 【英关键词】 | Web log mining,personalized recommendation,data preprocessing,interest intensity,interest clustering, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机软件>程序设计、软件工程>程序设计 |
| 【论文摘要】 |
随着Internet应用的迅速发展,网上信息迅速增长,信息种类也越来越多,人们面对太多的信息无法选择和消化,此种现象称为信息过载。Internet上信息资源分布的广泛性又给用户寻找感兴趣的信息增加了困难,也就是所谓的信息迷失。当前主要采用搜索引擎来检索Web上的信息,大多数搜索引擎缺乏主动性,未考虑个体用户的兴趣偏好,因而未能有效地解决信息过载和信息迷失的问题。为了有效地解决信息过载和信息迷失给人们带来的种种困扰。最近研究者们提出了一种被认为能有效解决这些问题的技术-Web个性化服务技术。
Web日志挖掘是将数据挖掘技术作用于Web服务器日志文件等获得有关用户访问行为的知识。这些知识可以服务于Web站点的服务提供方和访问者,进而改进Web站点设计以方便用户使用,提高Web服务器的性能,增加个性化服务等。基于Web日志挖掘的个性化服务是目前Web个性化服务中应用和研究的关键技术,主要是利用Web日志挖掘的相关技术为不同的用户采取不同的服务策略,提供不同的服务内容,开展个性化服务。
本论文在较为系统地分析Web日志挖掘中数据处理方法的基础上,针对用户访问兴趣度表示的不足,提出一种基于用户... |
| 【论文题纲】 |
|
中文摘要 |
3-5 |
|
英文摘要 |
5-11 |
|
1 绪论 |
11-18 |
|
1.1 研究目的及意义 |
11-12 |
|
1.1.1 研究目的 |
11-12 |
|
1.1.2 研究意义 |
12 |
|
1.2 Web 日志的研究现状 |
12-13 |
|
1.3 个性化推荐系统的研究现状 |
13-15 |
|
1.4 个性化推荐系统面临的挑战 |
15-16 |
|
1.5 本文研究的主要内容 |
16-17 |
|
1.6 本文的组织结构 |
17-18 |
|
2 知识背景 |
18-29 |
|
2.1 数据挖掘概论 |
18-19 |
|
2.1.1 什么是数据挖掘 |
18 |
|
2.1.2 数据挖掘的一般过程 |
18 |
|
2.1.3 数据挖掘的一般算法模型 |
18-19 |
|
2.2 Web 日志挖掘 |
19-23 |
|
2.2.1 什么是Web 挖掘 |
19-20 |
|
2.2.2 Web 挖掘的分类 |
20-21 |
|
2.2.3 Web 日志挖掘 |
21-23 |
|
2.3 个性化推荐系统及相关技术介绍 |
23-28 |
|
2.3.1 个性化推荐系统 |
23-24 |
|
2.3.2 个性化推荐系统的推荐过程 |
24-25 |
|
2.3.3 个性化推荐技术 |
25-27 |
|
2.3.4 个性化服务模型结构 |
27-28 |
|
2.4 本章小结 |
28-29 |
|
3 Web 日志挖掘的预处理研究 |
29-39 |
|
3.1 Web 日志介绍 |
29-31 |
|
3.1.1 Web 服务器日志 |
29-31 |
|
3.1.2 代理服务器端日志 |
31 |
|
3.1.3 单个客户端日志 |
31 |
|
3.2 Web 日志挖掘的预处理流程 |
31-37 |
|
3.2.1 数据清洗 |
32-33 |
|
3.2.2 用户识别 |
33-34 |
|
3.2.3 会话识别 |
34-36 |
|
3.2.4 路径填充 |
36 |
|
3.2.5 事务识别 |
36-37 |
|
3.3 实验分析 |
37-38 |
|
3.3.1 会话结果评价 |
37 |
|
3.3.2 预处理结果 |
37-38 |
|
3.4 本章小结 |
38-39 |
|
4 用户浏览兴趣度 |
39-46 |
|
4.1 用户浏览兴趣的度量方法 |
39-41 |
|
4.2 基于访问时间和访问关键字的兴趣度量方法 |
41-44 |
|
4.2.1 用户访问时间 |
41-43 |
|
4.2.2 用户访问关键字 |
43 |
|
4.2.3 用户访问兴趣度 |
43-44 |
|
4.3 本章小结 |
44-46 |
|
5 基于兴趣聚类的个性化网页推荐算法 |
46-58 |
|
5.1 现状简介 |
46-47 |
|
5.2 聚类算法 |
47-52 |
|
5.2.1 路径相似度 |
47-48 |
|
5.2.2 竞争凝聚 |
48-50 |
|
5.2.3 问题求解 |
50-51 |
|
5.2.4 实验分析 |
51-52 |
|
5.3 生成推荐集 |
52-57 |
|
5.3.1 基本概念 |
52 |
|
5.3.2 以往算法的不足 |
52-53 |
|
5.3.3 改进推荐算法 |
53-55 |
|
5.3.4 推荐集合并 |
55 |
|
5.3.5 实验分析 |
55-57 |
|
5.4 本章小结 |
57-58 |
|
6 基于Web 日志挖掘的个性化推荐模型 |
58-61 |
|
6.1 模型概述 |
58-59 |
|
6.2 模型设计 |
59-60 |
|
6.3 模型特点 |
60 |
|
6.4 本章小结 |
60-61 |
|
7 总结与展望 |
61-63 |
|
致谢 |
63-64 |
|
参考文献 |
64-68 |
|
附录 |
68 |
|
| 【DOI】 | LunWen.ID:2.2008.376398 |