聚类数据挖掘在商场中的应用及K-means聚类算法改进研究
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 自动化 >> 自动化基础 >> 正文
聚类数据挖掘在商场中的应用及K-means聚类算法改进研究
作者:罗妤 Publish: 2005-11-7 Hits:-
【中文题名】 聚类数据挖掘在商场中的应用及K-means聚类算法改进研究
【英文题名】 Clustering Data Mining Applications in Department Store and K-means Clustering Algorithm Improvement
【学科专业】 系统工程
【论文级别】 硕士论文
【投稿时间】 2005-11-7
【中关键词】 数据挖掘,聚类分析,K-means,算法,,
【英关键词】 data mining,clustering,K-means algorithm,
【分类导航】 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>>
【论文摘要】 聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。聚类的应用是非常广泛的,无论是在商务领域,还是在生物学、Web 文档分类、图像处理等其它领域,都得到了有效的应用。目前聚类算法大体上分为基于划分的方法、基于层次的方法、基于密度的方法、基于网格的方法、基于模型的方法以及模糊聚类。 微软Analysis Services 分析服务软件提供了一种基于密度算法的聚类分析实用数据挖掘工具。本文使用该工具,基于重庆两百公司商场的OLTP 数据,创建了该商场销售分析用数据仓库。在此基础上建立了顾客特征聚类数据挖掘模型,对商场的客户群特征进行了聚类分析;接着,又将客户特征与所购商品类别进行了联合聚类,分析了顾客特征与购买商品类别之间的联系。本文给出了从分析目标确定,数据仓库建模,数据迁移,挖掘模型确定,挖掘处理到挖掘结果分析的全过程。目前,许多商场都使用了顾客卡,可以获得一定的顾客特征信息,这为顾客分析奠定了基础,本文的应用实例为这类应用提供了有益的参考。 K-means 算法是聚类算法中主要算法之一。它是一种基于划分的聚类算法。该算法随机选取K(K 为聚类数)个点作为初始聚类中心,通...
【论文题纲】
中文摘要 4-5
英文摘要 5-9
1 绪论 9-14
1.1 引言 9
1.2 数据挖掘技术产生的背景 9-10
1.3 数据挖掘技术中的聚类分析 10-11
1.3.1 聚类分析的研究意义 10-11
1.3.2 主要算法分类介绍 11
1.4 论文的研究范围及研究目的 11-13
1.5 论文的内容安排 13-14
2 数据挖掘 14-24
2.1 数据挖掘技术的发展历程 14
2.2 数据挖掘定义和任务 14-17
2.2.1 定义 14-15
2.2.2 主要任务 15-17
2.3 数据挖掘的特点 17-18
2.4 数据挖掘的功能和分类 18-20
2.4.1 功能 18-19
2.4.2 分类 19-20
2.5 数据挖掘的过程 20-22
2.6 数据挖掘结果评估 22
2.7 小结 22-24
3 聚类分析 24-37
3.1 聚类的定义 24
3.2 聚类分析的应用 24-25
3.3 聚类算法的要求 25-26
3.4 聚类分析中的数据类型 26-27
3.5 聚类分析中的相似度度量方法 27-29
3.6 聚类分析中的聚类准则函数 29-32
3.7 主要聚类算法的分类 32-36
3.7.1 划分方法 32-33
3.7.2 层次方法 33-34
3.7.3 基于密度的方法 34-35
3.7.4 基于网格的方法 35
3.7.5 基于模型的方法 35-36
3.7.6 模糊聚类方法 36
3.8 小结 36-37
4 聚类算法在商场顾客分析中的应用 37-44
4.1 应用工具 37
4.2 数据仓库的建立 37-40
4.2.1 数据仓库的数据来源 38-39
4.2.2 数据仓库的维表和事实表 39-40
4.2.3 数据提取与整理 40
4.3 数据挖掘模型与聚类结果分析 40-43
4.3.1 顾客特征聚类分析 40-42
4.3.2 顾客特征与商品类别聚类分析 42-43
4.4 小结 43-44
5 K-means 算法改进研究 44-58
5.1 K-means 算法的改进 44-48
5.1.1 算法解释 44-45
5.1.2 算法描述 45-46
5.1.3 算法步骤 46
5.1.4 算法的特点 46-47
5.1.5 算法面临的主要问题 47-48
5.1.5 算法中聚类结果对初始聚类中心的依赖 48
5.2 层次凝聚算法 48-49
5.2.1 层次凝聚算法解释 48
5.2.2 层次凝聚算法基本思想 48-49
5.3 K-means 算法的改进 49-52
5.3.1 已有的初始中心选取方法 49-50
5.3.2 算法分析 50-51
5.3.3 新的初始聚类中心点选取法 51-52
5.3.4 改进的K-means 算法执行步骤 52
5.4 算法实验及其结果 52-56
5.4.1 数据处理及其标准化 52-54
5.4.2 实验结果 54-56
5.5 小结 56-58
6 结论 58-60
6.1 论文的主要工作 58
6.2 进一步努力的方向 58-60
致谢 60-61
参考文献 61-65
附: 1 作者在攻读硕士学位期间发表的论文目录 65-66
独创性声明 66
学位论文版权使用授权书 66
【DOI】 LunWen.ID:2.2008.387507
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:数据挖掘 论文 聚类分析 K-means 算法
自动化基础最新论文
自动化基础热门论文