| 【中文题名】 | 拟南芥poly(A)位点的特征提取和识别算法 |
| 【英文题名】 | Feature Extraction and Identification Algorithm on Arabidopsis Poly(A) Sites |
| 【学科专业】 | 系统工程 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-5-25 |
| 【中关键词】 | poly(A)位点识别,熵,支持向量机,马尔可夫模型,, |
| 【英关键词】 | Poly(A) site identification,Entropy,SVM,Markov Model, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>模式识别与装置 |
| 【论文摘要】 |
真核生物mRNA的3'-UTR对基因表达具有十分重要的调控作用,其主要特征是在转录后的mRNA前体3’末端分裂处(poly(A)位点)加入一串腺嘌呤尾巴,这是mRNA成熟过程中的一个关键步骤,称为多聚腺苷化(polyadenylation,简称poly(A))。Poly(A)对mRNA的稳定性、可翻译性及从核到细胞质的运输性都有决定性作用,并且是基因表达调控的一个枢纽。在基因组分析中,对poly(A)位点的正确识别有助于确定基因编码的终止位置,对分析基因的转录过程及探索基因表达的调控机制都起着十分重要的作用。
哺乳动物poly(A)位点信号比较保守,AAUAAA所占比例达约55%左右。而植物poly(A)的顺式元件保守性差,最佳特征序列AAUAAA也仅占总数的10% ,同时普遍存在多位点现象。因此目前辨识植物poly(A)位点的机制完全依赖于对带有poly(A)尾巴的表达序列标签的识别。然而,由于表达方式的不同及EST数据的不完整性,许多poly(A)位点无法被明确地识别出来,甚至在许多情况下被错误标识。至今为止,国内外相关文献绝大多数都是针对动物poly(A)位点进行研究,而对于植物pol... |
| 【论文题纲】 |
|
摘要 |
4-6 |
|
ABSTRACT |
6-12 |
|
第一章 绪论 |
12-22 |
|
1.1 前言 |
12-13 |
|
1.2 分子生物学基础 |
13-16 |
|
1.2.1 遗传物质 |
13-14 |
|
1.2.2 基因的结构及表达 |
14-16 |
|
1.3 机器学习方法 |
16-18 |
|
1.4 Poly(A)位点识别研究的意义 |
18-19 |
|
1.5 植物poly(A)位点识别的现状及存在的问题 |
19-20 |
|
1.6 本文主要工作 |
20-21 |
|
1.7 本文的结构 |
21-22 |
|
第二章 拟南芥ploy(A)位点特征提取 |
22-33 |
|
2.1 训练及测试的数据库 |
22 |
|
2.2 核苷分布特征 |
22-23 |
|
2.3 统计特征分析 |
23-24 |
|
2.4 特征提取 |
24-29 |
|
2.4.1 基于熵的算法 |
26-29 |
|
2.4.2 熵值分析法 |
29 |
|
2.5 SVM 的位点分类研究 |
29-33 |
|
第三章 拟南芥ploy(A)位点识别算法 |
33-45 |
|
3.1 基于GHMM 的植物poly(A)位点识别模型 |
33-37 |
|
3.1.1 广义隐马尔可夫模型 |
33-34 |
|
3.1.2 植物poly(A)位点识别模型 |
34-35 |
|
3.1.3 模型参数设置 |
35-37 |
|
3.2 一阶异构马尔可夫子模型 |
37-39 |
|
3.3 Poly(A)位点识别范围扩展 |
39 |
|
3.4 GHMM 标定算法 |
39-41 |
|
3.5 EST 数据集多位点判别和整合方法 |
41-45 |
|
第四章 拟南芥poly(A)位点计算机识别系统 |
45-54 |
|
4.1 用户界面 |
46-47 |
|
4.2 程序功能模块 |
47-49 |
|
4.2.1 输入模块 |
47-48 |
|
4.2.2 输出及图形处理模块 |
48-49 |
|
4.2.3 位点识别计算模块 |
49 |
|
4.3 数据结构 |
49-51 |
|
4.4 内存管理及程序优化 |
51-52 |
|
4.5 位点识别程序流程 |
52-54 |
|
第五章 位点识别实验与结果分析 |
54-62 |
|
5.1 PAS 的敏感度和特异度分析 |
54-56 |
|
5.2 多位点序列位点识别效果分析 |
56-59 |
|
5.3 选择性位点序列位点识别效果分析 |
59 |
|
5.4 突变序列位点识别效果分析 |
59-62 |
|
第六章 结论与建议 |
62-65 |
|
6.1 全文总结 |
62-63 |
|
6.2 不足与改进建议 |
63-65 |
|
参考文献 |
65-67 |
|
致谢 |
67 |
|
| 【DOI】 | LunWen.ID:2.2008.366962 |