基于相关性的数据流聚类及其应用研究
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 自动化 >> 自动化基础 >> 正文
基于相关性的数据流聚类及其应用研究
作者:史金成 Publish: 2007-8-3 Hits:-
【中文题名】 基于相关性的数据流聚类及其应用研究
【英文题名】 Research on Data Stream Clustering and Its Applications Based on Correlations
【学科专业】 计算机应用技术
【论文级别】 硕士论文
【投稿时间】 2007-8-3
【中关键词】 数据流,数据流挖掘,相关性,聚类,,
【英关键词】 data stream,data stream mining,correlation,clustering,
【分类导航】 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>专家系统、知识工程>
【论文摘要】  上世纪末,为适应网络监控、入侵检测、情报分析、商业交易管理和分析等应用的要求,数据流技术应运而生。数据流是以连续的、有序的“流”的形式输入数据,有时效性、实时性、无限性和瞬时性等特点。典型的数据流有网络点击流、实时监控数据流、股票数据流、超市的销售数据流等。对数据流的分析主要包括分类、聚类和频繁模式挖掘三个方面,其中都用到了一些新的技术和方法,如滑动窗口、一次性扫描算法等。本文在介绍数据流及数据流挖掘关键算法的基础上,针对超市的销售数据流进行分析,提出了一种度量商品之间相关性的算法,进而提出了一种基于相关性的数据流聚类算法,对商品进行聚类分析。 本文的研究主要集中在以下几个方面: (1)概述了数据挖掘及数据流的概念、数据流挖掘的关键技术及典型算法,重点分析了数据流分类算法VFDT和CVFDT、数据流聚类算法STREAM和CluStream、数据流频繁模式挖掘算法FP-Stream等。 (2)针对超市中商品之间的相关性问题,提出一种基于数据流的相关性度量算法,以计算出商品间相关性的大小,利用数据流的一些方法,在有限的时间和空间里动态计算出基于持续到来的销售数据流的商品之间的相关...
【论文题纲】
摘要 5-6
Abstract 6-12
第一章 绪论 12-20
1.1 问题提出 12
1.2 研究背景 12-17
1.2.1 数据挖掘 12-14
1.2.2 数据流简介 14-15
1.2.3 数据流挖掘 15-16
1.2.4 超市销售数据流挖掘 16-17
1.3 国内外研究现状 17-18
1.3.1 数据挖掘 17
1.3.2 数据流 17-18
1.3.3 数据流挖掘 18
1.3.4 数据挖掘在超市中的应用 18
1.4 本文的研究内容和结构 18-19
1.5 本章小结 19-20
第二章 数据流挖掘算法 20-31
2.1 聚类(clustering)算法 20-24
2.1.1 概述 20-21
2.1.2 传统的聚类算法 21-22
2.1.3 数据流聚类算法 22-24
2.2 分类(classification)算法 24-26
2.2.1 概述 24
2.2.2 VFDT算法 24-25
2.2.3 CVFDT算法 25-26
2.3 频繁模式(frequent pattern)挖掘算法 26-30
2.3.1 概述 26
2.3.2 Apriori算法 26-28
2.3.3 FP-Stream算法 28-30
2.4 本章小结 30-31
第三章 数据流相关性分析与计算 31-43
3.1 数据流相关性分析 31-38
3.1.1 数据流中数据的类型 31-32
3.1.2 数据对象之间的相关性度量 32-35
3.1.3 二元数据的相似性度量 35-36
3.1.4 超市中商品的相关性分析 36-38
3.2 商品相关性算法 38-40
3.3 实验 40-42
3.4 本章小结 42-43
第四章 基于相关性的数据流聚类 43-51
4.1 引言 43-44
4.2 传统聚类算法的分类 44
4.3 问题描述 44-45
4.4 聚类算法 45-49
4.4.1 聚类质量评价标准 45-46
4.4.2 相异度矩阵 46
4.4.3 初始聚类算法 46-47
4.4.4 增量更新聚类算法 47-49
4.5 实验 49-50
4.6 本章小结 50-51
第五章 总结与展望 51-53
5.1 工作总结 51
5.2 进一步的工作 51-53
参考文献 53-57
攻读硕士学位期间发表论文、科研情况 57
【DOI】 LunWen.ID:2.2008.388771
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:数据流 论文 数据流挖掘 相关性 聚类
自动化基础最新论文
自动化基础热门论文