| 【论文摘要】 |
20世纪90年代以来,生命科学研究取得了突破性的进展,随着人类基因组计划的开展与现代生物技术的发展,人类积累的大量的生物信息数据为揭开生命奥秘提供了数据基础。而怎样从海量的生物数据中提炼出有用的生物学知识,弄清楚他们所蕴涵的结构和功能信息,是目前生物信息学领域中的一个重要的研究方向。模式发现技术正是揭示生物序列数据中所蕴涵的生物学意义的基本方法之一,它通过寻找不同序列间的相似片段来归结出这些序列片段中所蕴涵的特征模式。近年来,在模式发现的算法研究方面,人们已经探索出了一些有效的算法,这些算法在解决较小规模的生物序列模式发现问题时都表现出了良好的性能。但是,随着数据规模的不断扩大,很多算法都已无法适应问题的需要。所以,积极探索更加有效的模式发现算法已成为目前生物序列模式发现研究领域中的重大课题,并受到越来越广泛的关注。
本文首先对在模式发现算法中所常用的模式模型进行了分析,并且对基于不同模式模型的模式发现算法进行了研究和分析;然后在分析已有的序列模式发现算法的基础上,又提出了一种基于图的模式发现算法,该算法首先通过一些约束条件将生物序列数据集转化为一系列的子图,假如数据集中存在某一个模式,那么... |