| 【中文题名】 | 基于半结构化数据的关联规则挖掘研究 |
| 【英文题名】 | Research of the Association Rules Data Mining Based on Semi-structured Data |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-10-19 |
| 【中关键词】 | 数据挖掘,半结构化数据,关联规则,频繁项目集,, |
| 【英关键词】 | Data Mining,Semi-structured data,Association rules,Frequent itemset, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机软件>程序设计、软件工程>程序设计 |
| 【论文摘要】 |
由于在大型数据库中存储的数据往往非常庞大,因此分析处理数据的工作越加困难。为了有效的从数据库中找出有用的资料,数据挖掘(Data Mining)技术应运而生。
随着数据交换需求的与日俱增,半结构化数据(Semi-structured)XML文件蓬勃生长,原生型XML数据库中存放大量XML文件。如何挖掘出隐藏在原生型XML数据库里的知识或规则是本研究的一个重点。针对关联规则挖掘应用所面临的困难,分析了XML语言的技术特点,提出一种基于半结构化数据的关联规则挖掘模式。该模式充分利用半结构化数据源的自描述性、开放性和可扩展行方面的优势。
近年来许多研究人员在从事数据挖掘相关技术的研究,其中被广泛讨论的议题就是在事务数据库中挖掘出关联规则。在对关联规则挖掘中基于Apriori算法的改进算法的深入分析和研究后,本文根据Apriori算法的不足,提出了一种改进策略,从而得到一种优化的Apriori算法。最后通过仿真实验表明该改进算法有效地提高了Apriori算法的挖掘速度。 |
| 【论文题纲】 |
|
中文摘要 |
3-4 |
|
英文摘要 |
4-9 |
|
第一章 绪论 |
9-17 |
|
1.1 研究背景与研究意义 |
9-11 |
|
1.2 国内外的研究状况和进展 |
11-15 |
|
1.3 本文的主要工作 |
15 |
|
1.4 论文的结构 |
15-17 |
|
第二章 数据挖掘与半结构化数据 |
17-37 |
|
2.1 数据挖掘概述 |
17-22 |
|
2.1.1 数据挖掘发展简介 |
18-19 |
|
2.1.2 数据挖掘常用技术 |
19-20 |
|
2.1.3 数据挖掘的功能 |
20-22 |
|
2.2 半结构化数据简介与XML的特点 |
22-26 |
|
2.2.1 半结构化数据 |
22-24 |
|
2.2.2 XML的主要特点 |
24-26 |
|
2.3 WEB上的数据挖掘 |
26-29 |
|
2.3.1 异构数据库环境 |
28-29 |
|
2.3.2 半结构化的数据结构 |
29 |
|
2.3.3 解决半结构化的数据源问题 |
29 |
|
2.4 XML的相关技术规范 |
29-36 |
|
2.4.1 文档结构标准(XML DTD与Schema) |
29-31 |
|
2.4.2 文档格式标准(CSS与XSL) |
31-32 |
|
2.4.3 文档查询标准(Xquery与Xpath) |
32-34 |
|
2.4.4 文档链接标准(Xlink与Xpointer) |
34 |
|
2.4.5 文档解析标准(DOM与 SAX) |
34-36 |
|
2.5 本章小结 |
36-37 |
|
第三章 XML挖掘方法的框架模型 |
37-49 |
|
3.1 XML中的数据挖掘 |
37-41 |
|
3.2 现有关联规则挖掘应用模式的特点及 XML的优势 |
41-43 |
|
3.3 基于XML的半结构化数据关联规则挖掘模式 |
43-44 |
|
3.4 关联规则挖掘模式应用示例 |
44-48 |
|
3.5 本章小结 |
48-49 |
|
第四章 关联规则挖掘中Apriori算法及其改进 |
49-67 |
|
4.1 关联规则的概念 |
50-51 |
|
4.2 关联规则的种类及其挖掘 |
51-54 |
|
4.2.1 关联规则的种类 |
51-52 |
|
4.2.2 关联规则挖掘的算法 |
52-54 |
|
4.3 Apriori算法及其改进 |
54-65 |
|
4.3.1 Apriori算法的思想 |
54-56 |
|
4.3.2 Apriori算法发现频繁项集的示例 |
56-61 |
|
4.3.3 由频繁项集产生关联规则 |
61-62 |
|
4.3.4 Apriori算法的改进及其思想 |
62-65 |
|
4.4 实验及结果分析 |
65-66 |
|
4.5 本章小结 |
66-67 |
|
结束语 |
67-69 |
|
参考文献 |
69-73 |
|
致谢 |
73-75 |
|
附录 |
75-76 |
|
| 【DOI】 | LunWen.ID:2.2008.389109 |