| 【中文题名】 | 非编码RNA基因识别模型的设计与实现 |
| 【英文题名】 | The Design and Implementation of ncRNA Gene Finding Model |
| 【学科专业】 | 计算机科学与技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-10-18 |
| 【中关键词】 | 生物信息学,非编码RNA,基因识别,隐马氏模型,, |
| 【英关键词】 | Bioinformatics,non-coding RNA,gene finding,HMM, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>一般性问题>理论、方法> |
| 【论文摘要】 |
生物信息学是计算机科学与生命科学相结合形成的一个研究领域。它通过用计算机科学的理论和相关算法对生命科学领域内的数据进行加工、存储、检索和分析。随着生物序列数据的快速增长,如何运用高效的算法来处理这些数据已经得到了越来越多的关注。基因识别正是其中一个焦点。它是指在DNA序列中识别出所有编码蛋白质的区域和所有与基因表达调控有关的不编码蛋白质的区域。
本文主要研究非编码核糖核酸(non-coding ribonucleic acid, ncRNA)的基因识别问题。研究的方法采用上下文敏感隐马尔可夫模型(context-sensitive hidden markov model,csHMM)的技术,结合物种进化关系,尝试找出一种能够从基因组中识别非编码RNA基因的新方法。
本文的重点是利用上下文敏感隐马尔可夫模型和物种进化关系构建非编码RNA的二级结构模型,并实现了非编码RNA基因的理论预测。首先,利用csHMM构建基本的非编码RNA二级结构模型。其次,从代表物种进化关系的氨基酸置换矩阵推导出上下文敏感隐马尔可夫模型的生成概率,从而构建新的非编码RNA识别模型框架pair-csHMM。再次,... |
| 【论文题纲】 |
|
摘要 |
8-9 |
|
ABSTRACT |
9-10 |
|
第一章 绪论 |
10-25 |
|
1.1 课题背景 |
11-13 |
|
1.2 国内外研究现状 |
13-23 |
|
1.2.1 编码基因识别研究现状 |
14-19 |
|
1.2.2 非编码RNA基因识别研究现状 |
19-23 |
|
1.3 主要研究内容 |
23-24 |
|
1.4 论文结构 |
24-25 |
|
第二章 非编码RNA相关知识 |
25-35 |
|
2.1 生物信息学基本概念 |
25-28 |
|
2.2 非编码RNA基本概念 |
28-30 |
|
2.3 非编码RNA序列特征 |
30-31 |
|
2.4 非编码RNA序列数据库 |
31-35 |
|
第三章 基于比较序列分析的非编码RNA二级结构模型设计 |
35-60 |
|
3.1 非编码RNA二级结构模型 |
35-46 |
|
3.1.1 隐马氏模型的基本原理 |
36-37 |
|
3.1.2 上下文敏感的隐马氏模型 |
37-41 |
|
3.1.3 模型基本算法 |
41-46 |
|
3.2 比较基因组中的物种进化关系 |
46-51 |
|
3.2.1 进化分析简介 |
47-48 |
|
3.2.2 氨基酸置换矩阵 |
48-51 |
|
3.3 非编码RNA基因识别模型的构建 |
51-60 |
|
3.3.1 非编码RNA二级结构模型的构建 |
51-58 |
|
3.3.2 运用pair-csHMM模型的实例 |
58-60 |
|
第四章 非编码RNA基因识别原型系统的实现 |
60-72 |
|
4.1 非编码RNA基因识别模型的框架 |
60-61 |
|
4.2 非编码RNA基因识别系统的实现技术 |
61-66 |
|
4.3 识别模型的训练 |
66-69 |
|
4.4 测试与讨论 |
69-72 |
|
第五章 结论与展望 |
72-75 |
|
5.1 结论 |
72-73 |
|
5.2 展望 |
73-75 |
|
致谢 |
75-76 |
|
参考文献 |
76-80 |
|
攻读硕士期间发表的论文 |
80 |
|
| 【DOI】 | LunWen.ID:2.2008.361123 |