基于半结构化数据的关联规则挖掘研究
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 自动化 >> 自动化基础 >> 正文
基于半结构化数据的关联规则挖掘研究
作者:曾舸 Publish: 2007-10-19 Hits:-
【中文题名】 基于半结构化数据的关联规则挖掘研究
【英文题名】 Research of the Association Rules Data Mining Based on Semi-structured Data
【学科专业】 计算机应用技术
【论文级别】 硕士论文
【投稿时间】 2007-10-19
【中关键词】 数据挖掘,半结构化数据,关联规则,频繁项目集,,
【英关键词】 Data Mining,Semi-structured data,Association rules,Frequent itemset,
【分类导航】 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机软件>程序设计、软件工程>程序设计
【论文摘要】  由于在大型数据库中存储的数据往往非常庞大,因此分析处理数据的工作越加困难。为了有效的从数据库中找出有用的资料,数据挖掘(Data Mining)技术应运而生。 随着数据交换需求的与日俱增,半结构化数据(Semi-structured)XML文件蓬勃生长,原生型XML数据库中存放大量XML文件。如何挖掘出隐藏在原生型XML数据库里的知识或规则是本研究的一个重点。针对关联规则挖掘应用所面临的困难,分析了XML语言的技术特点,提出一种基于半结构化数据的关联规则挖掘模式。该模式充分利用半结构化数据源的自描述性、开放性和可扩展行方面的优势。 近年来许多研究人员在从事数据挖掘相关技术的研究,其中被广泛讨论的议题就是在事务数据库中挖掘出关联规则。在对关联规则挖掘中基于Apriori算法的改进算法的深入分析和研究后,本文根据Apriori算法的不足,提出了一种改进策略,从而得到一种优化的Apriori算法。最后通过仿真实验表明该改进算法有效地提高了Apriori算法的挖掘速度。
【论文题纲】
中文摘要 3-4
英文摘要 4-9
第一章 绪论 9-17
1.1 研究背景与研究意义 9-11
1.2 国内外的研究状况和进展 11-15
1.3 本文的主要工作 15
1.4 论文的结构 15-17
第二章 数据挖掘与半结构化数据 17-37
2.1 数据挖掘概述 17-22
2.1.1 数据挖掘发展简介 18-19
2.1.2 数据挖掘常用技术 19-20
2.1.3 数据挖掘的功能 20-22
2.2 半结构化数据简介与XML的特点 22-26
2.2.1 半结构化数据 22-24
2.2.2 XML的主要特点 24-26
2.3 WEB上的数据挖掘 26-29
2.3.1 异构数据库环境 28-29
2.3.2 半结构化的数据结构 29
2.3.3 解决半结构化的数据源问题 29
2.4 XML的相关技术规范 29-36
2.4.1 文档结构标准(XML DTD与Schema) 29-31
2.4.2 文档格式标准(CSS与XSL) 31-32
2.4.3 文档查询标准(Xquery与Xpath) 32-34
2.4.4 文档链接标准(Xlink与Xpointer) 34
2.4.5 文档解析标准(DOM与 SAX) 34-36
2.5 本章小结 36-37
第三章 XML挖掘方法的框架模型 37-49
3.1 XML中的数据挖掘 37-41
3.2 现有关联规则挖掘应用模式的特点及 XML的优势 41-43
3.3 基于XML的半结构化数据关联规则挖掘模式 43-44
3.4 关联规则挖掘模式应用示例 44-48
3.5 本章小结 48-49
第四章 关联规则挖掘中Apriori算法及其改进 49-67
4.1 关联规则的概念 50-51
4.2 关联规则的种类及其挖掘 51-54
4.2.1 关联规则的种类 51-52
4.2.2 关联规则挖掘的算法 52-54
4.3 Apriori算法及其改进 54-65
4.3.1 Apriori算法的思想 54-56
4.3.2 Apriori算法发现频繁项集的示例 56-61
4.3.3 由频繁项集产生关联规则 61-62
4.3.4 Apriori算法的改进及其思想 62-65
4.4 实验及结果分析 65-66
4.5 本章小结 66-67
结束语 67-69
参考文献 69-73
致谢 73-75
附录 75-76
【DOI】 LunWen.ID:2.2008.389109
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:数据挖掘 论文 半结构化数据 关联规则 频繁项目集
自动化基础最新论文
自动化基础热门论文