| 【中文题名】 | 基于Web日志挖掘的个性化推荐系统的研究和实现 |
| 【英文题名】 | Research and Implementation of Personalized Recommendation System Based on Web Log Mining |
| 【学科专业】 | 计算机技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-11-6 |
| 【中关键词】 | Web日志挖掘,聚类,CLOPE算法,个性化推荐,浙江在线, |
| 【英关键词】 | WebLog mining,clustering,CLOPE algorithm,personalized recommendation,Zhejiang online web, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机软件>程序设计、软件工程>软件工程 |
| 【论文摘要】 |
随着Internet的不断发展,信息过载和资源迷向己经成为制约人们高效使用Internet信息的瓶颈。人们希望网页的内容能够尽可能地根据用户的浏览兴趣自动调整,从而使每个用户感觉好像自己是网站的唯一用户,实现这一目标的关键在于Web网站如何发现的用户喜好、动态地为用户定制观看的内容或者提供浏览建议。这就是所谓的Web个性化推荐技术,是Web技术研究和应用的热点之一。
针对浙江在线门户网站个性化推荐的具体应用需求,本文对Web日志挖掘中的聚类算法进行了深入的研究,针对Web日志维数高、数据量大的特殊性,选用CLOPE(Cluster with sLOPE)聚类算法并对其做了改进,使用改进后的CLOPE算法对浙江在线教育频道的日志文件进行用户浏览模式的挖掘。实验表明,改进后的算法对于大型网站进行Web挖掘较为有效,尤其是针对Web日志大型、稀疏性的特征,该改进算法具有聚类速度快,可扩展性好的特点。
本文设计并部分实现了一个基于Web日志挖掘的个性化推荐系统PRSWLM(Personalized Recommendation Systems based on Web Log Mining)... |
| 【论文题纲】 |
|
摘要 |
5-6 |
|
ABSTRACT |
6-10 |
|
第一章 绪论 |
10-24 |
|
1.1 研究背景 |
10-11 |
|
1.1.1 问题的提出 |
10-11 |
|
1.1.2 项目来源 |
11 |
|
1.2 项目的现实意义 |
11-13 |
|
1.2.1 浙江在线网站目前的信息推荐方式 |
11-12 |
|
1.2.2 浙江在线网站教育频道个性化推荐系统建立的必要性 |
12-13 |
|
1.3 Web 个性化信息服务技术 |
13-14 |
|
1.3.1 Web 个性化技术概述 |
13 |
|
1.3.2 Web 个性化信息服务的三种方式 |
13-14 |
|
1.4 个性化推荐系统 |
14-17 |
|
1.4.1 个性化推荐的含义 |
14-15 |
|
1.4.2 个性化推荐的步骤 |
15 |
|
1.4.3 常见的推荐形式 |
15-16 |
|
1.4.4 实现个性化推荐的常用的技术 |
16-17 |
|
1.5 个性化推荐的研究现状与存在的问题 |
17-21 |
|
1.5.1 基于 Web 挖掘的个性化推荐技术的研究现状 |
17-20 |
|
1.5.2 现有个性化推荐系统存在的问题 |
20-21 |
|
1.6 本文的研究目标和主要工作 |
21-22 |
|
1.6.1 本文研究目标 |
21-22 |
|
1.6.2 本文主要工作 |
22 |
|
1.7 本文组织结构 |
22-24 |
|
第二章 相关技术研究 |
24-34 |
|
2.1 Web 日志 |
24-27 |
|
2.1.1 Web 日志分布 |
24 |
|
2.1.2 Web 日志的记录方式 |
24-25 |
|
2.1.3 Web 日志的复杂性 |
25-26 |
|
2.1.4 浙江在线网站教育频道服务器端日志分析 |
26-27 |
|
2.2 Web 挖掘(Web Mining) |
27-29 |
|
2.2.1 Web 挖掘概念 |
27 |
|
2.2.2 Web 挖掘的步骤 |
27-28 |
|
2.2.3 Web 挖掘的分类 |
28-29 |
|
2.3 Web 日志挖掘 |
29-33 |
|
2.3.1 Web 日志挖掘的处理过程 |
29-30 |
|
2.3.2 Web 日志挖掘中的预处理技术概述 |
30 |
|
2.3.3 数据预处理的过程 |
30-33 |
|
2.4 小结 |
33-34 |
|
第三章 CLOPE 聚类算法及其改进 |
34-48 |
|
3.1 聚类分析 |
34-38 |
|
3.1.1 聚类分析概述 |
34-35 |
|
3.1.2 聚类分析的主要方法 |
35-36 |
|
3.1.3 聚类分析处理的数据对象 |
36-37 |
|
3.1.4 Web 日志上的聚类 |
37-38 |
|
3.2 CLOPE 算法 |
38-43 |
|
3.2.1 目前事务聚类算法的相关研究和不足 |
38-39 |
|
3.2.2 聚类直方图概念 |
39-40 |
|
3.2.3 CLOPE 聚类算法思想 |
40-42 |
|
3.2.4 CLOPE 算法实现 |
42-43 |
|
3.3 CLOPE 算法的改进 |
43-47 |
|
3.3.1 CLOPE 算法的改进 |
44 |
|
3.3.2 CLOPE 算法与改进的 CLOPE 算法的有效性比较 |
44-46 |
|
3.3.3 改进的 CLOPE 算法在 Web 日志挖掘中的应用实验 |
46-47 |
|
3.4 小结 |
47-48 |
|
第四章 基于 Web 日志挖掘的个性化推荐系统 PRSWLM 的设计 |
48-55 |
|
4.1 浙江在线网站对系统设计的要求 |
48 |
|
4.2 PRSWLM 系统推荐机制 |
48-49 |
|
4.3 系统功能模块设计 |
49-53 |
|
4.3.1 预处理模块设计 |
49-52 |
|
4.3.2 模式挖掘模块算法设计 |
52 |
|
4.3.3 实时推荐模块的设计 |
52-53 |
|
4.4 系统数据库结构 |
53-54 |
|
4.5 小结 |
54-55 |
|
第五章 基于 Web 日志挖掘的个性化推荐系统 PRSWLM 的实现 |
55-66 |
|
5.1 实验环境和开发工具 |
55 |
|
5.2 预处理模块的实现 |
55-58 |
|
5.3 模式挖掘模块的实现 |
58-61 |
|
5.3.1 模式挖掘过程 |
58-60 |
|
5.3.2 挖掘结果分析 |
60-61 |
|
5.3.3 挖掘结果对网站结构的建议 |
61 |
|
5.4 实时推荐模块的实现 |
61-64 |
|
5.4.1 Apache 服务器介绍 |
61-62 |
|
5.4.2 实时推荐模块的接口 |
62-63 |
|
5.4.3 实时推荐的实现 |
63-64 |
|
5.4.4 推荐形式 |
64 |
|
5.5 系统的用户界面 |
64-65 |
|
5.6 系统运行效果说明 |
65 |
|
5.7 小结 |
65-66 |
|
第六章 总结与展望 |
66-67 |
|
6.1 本文的工作总结 |
66 |
|
6.2 进一步的工作 |
66-67 |
|
参考文献 |
67-71 |
|
致谢 |
71-72 |
|
攻读学位期间发表的学术论文目录 |
72 |
|
| 【DOI】 | LunWen.ID:2.2008.362636 |