| 【论文摘要】 |
随着计算机和自动化数据采集的广泛应用,在各种应用领域里的数据库中存贮了大量的数据,这使得人们对这些数据进行分析并转化为有用知识的需求变的越来越迫切。于是,数据库中的知识发现(Knowledge Discovery in Databases, KDD)自然成为近年来人们从大型数据库中获取信息的一个重要研究领域。关联规则分析是其中的一个重要分支,它用于发现存在于数据库中的项或属性间的有趣联系,这些联系是事先未知且隐藏的,即不能通过传统的数据库逻辑操作或统计的方法得出。
关联规则挖掘就是利用特定方法发掘数据库中潜藏的关联规则的过程。目前,面向传统关联规则即正关联规则的挖掘已经有了很多成熟的、经典的算法,其中最为重要、最为经典也是最有影响力的两种算法为Apriori算法和FP_growth算法。这两种算法在开采频繁项目集集合时一个使用的是广度优先的搜索策略,一个使用的是深度优先的搜索策略,二者各有优缺,后来产生的种种算法大多是在这两个算法的基础上作的改进。
2002年,XinDong Wu在传统关联规则的基础上进行了扩展,提出了负关联规则,即形如A ? ? B, ? A ? B, ? A ?... |