| 【论文摘要】 |
在基因微序列分析等应用中,传统以距离为相似度计算依据的方式并不适用,因为有时对象与对象之间不具有相近的物理距离,但却存在有相似的一致性模式。因此,基于模式的聚类方法(Pattern-Based Clustering)简称为“模式聚类”,被提出来解决此类问题。判断两个对象是否同属一pCluster,取决于他们属性中的子集是否具有一致性的模式。当前模式聚类算法的研究只是停留在一般化描述,并没有上升到系统理论层次,缺乏严格的形式化定义。另外,现阶段算法都是基于特定的等差或等比模式,而对于其他模式却不能够很好的适用。
本文对模式聚类各种算法模型进行深入探讨与分析,总结其共性及特性。在理论研究方面,首先从模式的多样化角度进行了分析,对模式出现的类别及特征进行了概括总结,并提出了单模式模型及多模式模型的概念。从模式的多样性和共性出发,总结了模式的通用定义和形式化表示方法。引入了一个具有普遍意义的模式算子来表示模式,并从算子的角度归纳总结各个模式聚类模型的一致性规则表示并进行分类。引入了同型算子和基于算子的模式的概念,以算子的特性研究为基础,研究模式聚类各类运算的性质和特征。在算法研究方面,本文提出了一种... |