




已阅读5页,还剩130页未读, 继续免费阅读
(控制科学与工程专业论文)非编码rna相关计算问题研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独创性声明 删f 舢 y 1 | 7 4 ) 1 1 9 l ! d l lp 1 6 a l l l0 i i i i f 8 i i j i i。0pl l u l 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的 研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它教 育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示谢意。 学位论文题目:韭缉婴必扫差i 簋阅墅纽壅 学位论文作者签名:盘蔓。立 日期:沙扩年弓月,7 日 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权 国防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文 档,允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密学位论文在解密后适用本授权书。) j¥ 学位论文作者签名:童垒当盐日期:州护年- 3 月,7 日 作者指导教师签名:至垄 叁日期:b i 年3 月f7 日 作者指导教师签名:t 也 蛋日期:b i 年;月f 日 国防科学技术大学研究生院博 目录 摘要 a b s t r a c t 。 第一章绪论 1 1 研究背景 1 1 1r n a 的角色 1 1 2n c r n a 的分类及功能 1 1 3n c r n a 的现实应用4 1 2n c r n a 相关计算问题及进展7 1 2 1n c r n a 序列比对7 1 2 2n c r n a 二级结构预测一9 1 2 3n c r n a 基冈预测10 1 3 本文的主要工作和创新点1 1 1 3 1 主要研究内容l l 1 3 2 主要创新性工作1 2 1 4 本文的结构13 第二章非编码r n a 计算分析基础15 2 1r n a 生物学基础15 2 1 1r n a 的化学组成1 5 2 1 2r n a 的结构1 6 2 2r n a 计算的数学基础1 9 2 2 1r n a 各级结构的数学描述1 9 2 2 2r n a 二级结构的图形表示2 0 2 3r n a 二级结构的自由能权重图拓扑特征2 2 2 3 1r n a 二级结构的权重茎环拓扑图表示2 2 2 3 2 自由能权重的计算2 4 2 3 - 3 基于自由能权重茎环连接图的r n a 分子拓扑指数2 6 2 4 本章小结2 7 第三章非编码r n a 序列- 结构比对方法研究2 9 3 1 序列比对基础。2 9 3 1 1 序列比对的定义2 9 3 1 2 序列比对算法3 2 3 2 基于量子遗传算法的非编码r n a 序列结构比对。3 5 第1 页 国防科学技术大学研究生院博十学位论文 3 2 1 遗传算法( g e n e t i ca l g o r i t h m s ,g a ) 3 5 3 2 2 量子计算( q u a n t u mc o m p u t i n g ) 。3 6 3 2 3 量子遗传算法( q u a n t u mg e n e t i ca l g o r i t h m s ,q g a ) 3 8 3 2 4 序列比对的量子编码4 0 3 2 5 非编码r n a 序列结构比对的适应度函数4 0 3 2 6 量子比特的更新策略4 3 3 2 7 算法流程4 5 3 3 测试数据及结果4 6 3 3 1 测试数据集4 6 3 3 2 评价标准4 7 3 3 3 参数设置4 8 3 3 4 结果及讨论4 8 3 4 本章小结5 0 第四章非编码r n a 二级结构预测方法研究5 3 4 1 特征选择简介。5 3 4 2 支持向量机分类算法5 5 4 2 1 最优分类面5 6 4 2 2 广义最优分类面5 8 4 2 3 核函数5 9 4 3n c r n a 二级结构预测中的计算数值特征6 0 4 3 1 热力学特征6 0 4 3 2 进化特征6 l 4 3 3 组合特征一6 4 4 4 数据及结果分析一6 6 4 4 1 训练数据6 6 4 4 2 测试数据6 7 4 4 3 二级结构预测中的茎组合规则6 7 4 4 4 评价标准6 8 4 4 5 结果与讨论6 8 4 5 本章小结。7 5 第五章m i c r o r n a 基因前体识别研究7 7 5 1m i c r o r n a 简介7 8 5 2m i c r o r n a 前体识别方法及识别特征8 0 5 2 1m i c r o r n a 前体识别方法。8 0 第页 国防科学技术大学研究生院博士学位论文 5 2 2m i c r o r n a 前体识别特征8 l 5 3 基于新的局部序列结构特征的p r e m i r n a 识别方法8 3 5 3 1 拉伸局部序列结构特征8 3 5 3 2 测试数据集8 4 5 3 3 评价标准8 5 5 3 4 结果及讨论8 5 5 4 自由能权重结构拓扑指数在m i r n a 前体识别中的应用8 7 5 4 1 测试数据集的构建8 7 5 4 2 自由能权重拓扑指数的统计分析8 8 5 4 3 自由能权重拓扑指数用于p r e m i r n a 的识别9 0 5 5p r e m i r n a 识别特征选择9 1 5 5 1 特征选择准则函数9 l 5 5 2 特征向量选择算法9 2 5 5 3p r e m i r n a 识别特征选择结果9 4 5 5 4 类不平衡问题的处理9 8 5 6 本章小结9 9 第六章结束语1 0 1 6 1 工作总结1 0 1 6 2 工作展望1 0 2 致谢1 0 5 参考文献10 7 作者在学期间取得的学术成果11 9 第1 i i 页 国防科学技术大学研究生院博士学位论文 第1 v 页 国防科学技术大学研究生院博士学位论文 表1 1 表1 2 表1 3 表2 1 表3 1 表3 2 表3 3 表4 1 表4 2 表4 3 表4 4 表5 1 表5 2 表5 3 表5 4 表5 5 表5 6 表5 7 表5 8 表5 9 表5 1 0 表目录 2 0 世纪以来与r n a 研究相关的诺贝尔获奖项目2 一些基冈组中蛋白质编码与非编码部分所占比例3 非编码r n a 类型和功能5 核酸标准编码表17 旋转角的确定。4 4 各程序在b r a l i b a s e 数据上运行结果的统计。4 8 s a g a 和q e a m r n a 进化代数和计算时间的比较4 9 各计算特征分类、计算方法及相关参考文献6 5 各计算特征的f i s h e r 判别率6 9 各特征子集在4 9 组测试集上分类结果7l 各种方法在测试数据集上的表现比较7 2 现有程序用到的各类特征8 2 图5 3 中各碱基对的统计结果8 4 采用2 4 个局部序列结构特征、不同核函数的s v m 分类表现8 6 我们的方法与x u e 的方法在交叉物种测试集上的详细预测结果8 6 拓扑指数特征测试数据集统计特征。8 8 四种权重拓扑指数间的相关系数矩阵9 0 各种特征分类结果比较一9 1 对5 2 个特征进行选择的详细结果9 6 特征选择结果比较9 7 不平衡数据处理结果比较9 9 第v 页 国防科学技术大学研究生院博士学位论文 第页 图2 2 组成r n a 分子的四种含氮碱基1 6 图2 3核糖核酸链片段1 6 图2 4 酵母苯基丙氨酸t r n a 分子的各级结构1 8 图2 5i a 二级结构组件1 9 图2 6r n a 二级结构的图形表示方法2 1 图2 7 三类典型r n a 二级结构及相应自由能权重茎环连接图2 3 图2 8 所有可能和c g 对相邻碱基对的自由能列表2 4 图2 9由c g 和a u 对包同的各尺寸未配对碱基的内环自由能列表2 5 图2 1 0 和c g 对相连的、所有可能的单链碱基的自由能2 6 图3 1比对中出现的不同情况3 0 图3 2已对齐交互。3 2 图3 3 遗传算法的一般流程3 6 图3 4 量子遗传算法流程图一3 9 图3 5量子旋转门旋转角的选择。4 4 图3 6 交叉算子示意图一4 5 图3 7 基于量子遗传算法的r n a 多序列一结构比对程序流程一4 6 图3 8各程序在不同平均双序列一致性下运行结果的比较4 9 图3 9 平均双序列一致性和迭代时间和进化代数间的关系。5 0 图4 1基于分类算法的r n a 二级结构预测流程5 3 图4 2 特征选择的基本框架。5 4 图4 3特征选择的方法。5 5 图4 4 最优分类面一5 6 图4 5 支持向量机的结构一6 0 图4 6 1 6 4 组p u b l i s h e d 结构中,配对位置空位比例统计图6 6 图4 7 训练数据集统计特性6 7 图4 8 测试数据集统计特性6 7 图4 9 所选特征在训练数据集上的分布7 0 图4 1 01 0 0 次重复测试得出的3 特征子集中各特征所占比例7 1 第i 页 国防科学技术大学研究生院博士学位论文 图4 1 l各特征子集在4 9 组测试数据上的分类结果7 2 图4 1 2 预测结果各项指标和比对序列相似性、长度和数量的关系7 4 图4 1 3i u 0 0 3 7 3 的预测结果比较7 5 图5 1p u b m e d 中和m i c r o r n a 相关文献数量统计7 8 图5 2m i r n a 基因产生和作用机制7 9 图5 3拉伸主干区示意图8 3 图5 42 4 个新的局部序列结构特征在训练集上的出现频率统计8 5 图5 5两类四种权重拓扑指数在测试数据集各子集上的分布。8 9 图5 6四种权重拓扑指数主成分分析结果。9 0 图5 7 采用s b s 算法和散度准则函数对5 2 个特征进行选择的结果9 5 图5 8 采用s b s 算法和j m 距离准则函数对5 2 个特征进行选择的结果9 5 第v i i i 页 国防科学技术大学研究生院博士学位论文 摘要 非编码r n a ( n o n c o d i n gr n a s ,n c r n a ) 是指不编码蛋白质的那部分转录 产物,在各种生命过程中发挥着重要作用,包括基冈调控、染色体重塑、基因定 位、基因修饰和d n a 印记等。对n c r n a 的研究不仅具有重要的理论和应用价值, 而且将对人们探索生命本质问题提供不可或缺的工具。由于采用实验方法研究 n c r n a 的各类问题,通常代价高、耗时长,且盲目性强。而随着各种生物基因组 测序的先后完成,以及相应各类数据库的建立和不断丰富完善,使得计算方法在 n c r n a 各类研究中的应用成为可能和必要。本文选择了和n c r n a 相关的序列一结 构比对、二级结构预测和n c r n a 基因识别等经典计算问题为研究课题,采用模式 分类中的各种方法展开了深入研究,论文的主要研究内容和创新点包括以下几个 方面: 1 、n c r n a 序列一结构比对研究。序列比对是计算分子生物学的经典课题,而 n c r n a 因为其结构保守性比序列保守性更强,使得用传统的序列比对程序得到的 结果不能满足各种n c r n a 相关分析的需要。为此,要在序列比对的同时更多的考 虑n c r n a 的结构信息,这成倍的增加了算法复杂度。本文将量子遗传算法引入 n c r n a 序列结构比对中,充分利用量子编码的叠加性、种群的多样性和量子旋转 门进化的并行性,结合传统遗传算法的突变和交叉操作,提出了一种兼顾了结构 和序列信息的全干扰配对保守交叉算子,并定义了充分考虑结构和序列信息的优 化目标函数,使得进化速度和对局部最优沦陷的控制达到了较理想的结果,和传 统遗传算法相比,缩短了优化过程的时间,提高了比对质量。 2 、n c r n a 二级结构预测研究。遵循“结构决定功能”的n c r n a 基因,二级 结构在其各种相关研究中起着重要作用。传统的n c r n a 二级结构预测方法都是基 于优化算法,计算复杂度较高,时效性差。本文将n c r n a 二级结构预测问题视为 分类问题,重点研究了给定序列比对的情况下,根据序列比对提供的各种信息, 判断比对的任- n 对是否能够形成碱基对。在总结了现有结构预测算法中采用的 各种数值计算量后,运用特征选择技术的不同方法对各种数值计算量进行了定量 分析( 以往预测方法都只进行了定性分析) ,并选出了适于分类算法进行结构预 测的特征子集,此最优特征子集结合了热力学信息( 平均碱基对配对矩阵) 、共 变信息( 包含碱基对堆积的共变分值) 和进化信息( a k m a e v 采用的整合序列问进 化关系的r 统计量) 。采用s v m 分类器及所选特征,结合茎组合规则,给出了基 于分类算法的n c r n a 二级结构预测方法,为结构预测提供了新的思路。 3 、m i c r o r n a 基冈前体识别。各类n c r n a 基因由于不具备传统基因的识别特 第i 页 国防科学技术大学研究生院博士学位论文 征,且在基凶组中分布广泛、类别多样、长短不一,使得通用n c r n a 基凶识别方 法效果不佳。m i c r o r n a 作为一类重要的调控r n a ,在许多生命过程中发挥着重 要的作用,而m i c r o r n a 前体( p r e m i r n a ) 识别则是进行相关分析的前提步骤。 虽然发卡二级结构是p r e m i r n a 的一个显著特征,但基冈组中存在大量能折叠成 发卡结构的非p r e m i r n a 序列。本文同绕p r e m i r n a 发卡二级结构特征,研究了 如何从具有相似结构特征的序列中识别出p r e m i r n a 的问题。首先,通过将r n a 二级结构“拉伸”,我们提出了一种新的局部序列结构特征,新特征不仅包含了 发卡结构中茎结构序列信息,还考虑了凸环和内环的信息。测试显示,这些新的 局部序列结构特征的分类表现要优于同类的3 s v m 特征。然后,为详细刻画 p r e m i r n a 发卡二级结构信息,我们将图论和计算化学中的拓扑指数相结合,构 造了新的自由能权重图拓扑指数特征。通过对这些拓扑指数的统计分析,以及和 其他现有p r e m i r n a 识别特征的综合比较,显示了新的拓扑指数特征,不仅能够 很好的刻画出p r e m i r n a 发卡结构中各元件的拓扑关系,而且通过自由能权重体 现了结构中碱基组成及其相对位置。最后,通过特征选择技术,我们从包括了4 种拓扑指数特征的5 2 个候选特征中,选出了适合于p r e m i r n a 识别的2 3 个全局 特征子集,并通过对类不平衡数据的有效处理,得到了一个性能较好的p r e m i r n a 识别模型。 关键词:n c r n a 序列结构比对,量子进化算法,n c r n a 二级结构预测,特 征选择,支持向量机,m i c r o r n a 前体识别,自由能权重拓扑特征 第i i 页 1 t h er e s e a r c ho nn c r n a ss e q u e n c e s t r u c t u r ea l i g n m e n t s e q u e n c e sa l i g n m e n ti s o n eo ft h ec l a s s i cp r o b l e m si nc o m p u t a t i o n a lm o l e c u l eb i o l o g y n c r n a sm o l e c u l e sa r e h i 曲l yc o n s e r v e di ns e c o n d a r ys t r u c t u r eb u ts h a r el i r l es e q u e n c es i m i l a r i t y ,t h e r e f o r e t h et r a d i t i o n a lm e t h o d so fm u l t i p l ea l i g n m e n t sf a i lt om e e tt h en e e d so fa n a l y s i s i n v o l v e dw i t hn c r n a s t h i si nt u r nm e a n st h a tt h ec o m p u t a t i o no fr e l i a b l en c r n a s a l i g n m e n t sm u s tt a k es t r u c t u r a li n f o r m a t i o ni n t oa c c o u n t , w h i c hr e s u l t s i nv i s i b l y i n c r e a s ei nc o m p u t a t i o n a lc o m p l e x i t y t od e a lw i t ht h i sp r o b l e m ,w ee m p l o yt h e q u a n t u mg e n e t i ca l g o r i t h m ( q g a ) w h i c hi s b a s e do nt h ec o n c e p ta n dp r i n c i p l e so f q u a n t u mc o m p u t i n gs u c ha saq u a n t u mb i ta n ds u p e r p o s i t i o no fs t a t e s m o r e o v e r ,w e d e s i g nan e wf u l li n t e r f e r e n c ep a i rc r o s s o v e ro p e r a t o ra n dc o n s t r u c taf i t n e s sf u n c t i o n , w h i c hc o n s i d e ri n f o r m a t i o no fs e q u e n c e sa n ds t r u c t u r e ss i m u l t a n e o u s l y e x p e r i m e n t so n b r a l i b a s es h o wt h a tq g ap e r f o r m sw e l lw i t h o u tp r e m a t u r ec o n v e r g e n c e ,a n dh a v e s h o r t e ro p t i m i z a t i o nt i m ea n dh i g h e rs o l u t i o nq u a l i t yc o m p a r e dt ot h ec o n v e n t i o n a l g e n e t i ca l g o r i t h m 2 t h er e s e a r c ho nn c r n a ss e c o n d a r ys t r u c t u r ep r e d i c t i o n t h es e c o n d a r y s t r u c t u r e so fn c r n a s ,w h i c hd e t e r m i n et h e i rf u n c t i o n ,a r ec r u c i a lt or e l a t e dr e s e a r c h e s m o s to ft h et r a d i t i o n a lm e t h o d sf o rn c r n a ss e c o n d a r ys t r u c t u r ep r e d i c t i o nu s e o p t i m i z a t i o na l g o r i t h m ,w h i c hs u f f e r sf r o mh i 曲s p a c ea n dt i m ec o m p l e x i t y g i v e n a l i g n e d n c r n as e q u e n c e s ,w ec o n s i d e r s e c o n d a r y s t r u c t u r ep r e d i c t i o na sa c l a s s i f i c a t i o np r o b l e m :t oj u d g ew h e t h e ra n yt w oc o l u m n si nt h ea l i g n m e n tc o r r e s p o n d t oab a s ep a i ru s i n gp r o v i d e di n f o r m a t i o nb ya l i g n m e n t a f t e ra n a l y z i n gv a r i o u s 第i i i 页 国防科学技术大学研究生院博士学位论文 c o m p u t a t i o n a lm e a s u r e su s e di nt h ee x i s t i n gp r e d i c t i o nm e t h o d s ,t h e c l a s s i f i c a t i o n c a p a b i l i t y o ft h o s em e a s u r e sw a sc o m p a r e dq u a n t i t a t i v e l yu s i n gf i l t e ra n dw r a p p e r a p p r o a c hw i t hc o m b i n a t i o no fs u p p o r tv e c t o rm a c h i n e ( s v m ) c l a s s i f i e r a sar e s u l t ,a n o p t i m u ms u b s e to fc o m p u t a t i o n a lm e a s u r e s ,i n c l u d i n gt h e r m o d y n a m i c ,c o v a r i a t i o na n d p h y l o g e n e t i ci n f o r m a t i o n ,w a ss e l e c t e df o rp r e d i c t i n gr n as e c o n d a r ys t r u c t u r eb y c l a s s i f i c a t i o n o u rm e t h o du s e ds v mc l a s s i f i e rw i t hs e l e c t e dm e a s u r e sa n dt h er u l e so f s t e mc o m b i n a t i o nt o p r e d i c tn c r n as e c o n d a r ys t r u c t u r e ,w h i c hr e p r e s e n tan e w m e t h o d o l o g yf o rf u t u r en c r n as e c o n d a r ys t r u c t u r ep r e d i c t i o na p p r o a c h e s 3 t h er e s e a r c ho nt h e p r e c u r s o r s o fm i c r o r n ag e n e s t h eu n i v e r s a l c o m p u t a t i o n a lm e t h o d st oi d e n t i f yn c r n ag e n e sa r ef a rf r o ms a t i s f a c t o r yb e c a u s e n c r n ag e n e sh a v el e s ss i g n a l si nc o m p a r i s o nw i t hp r o t e i nc o d i n gg e n e s ,a n dm o r e o v e r , t h e ya r ew i d e l yd i s t i l b u t e di ng e n o m ea n dh a v ev a r i o u sv a r i e t i e si nk i n da n dl e n g t h a s o n eo fi m p o r t a n tr e g u l a t o r yn c r n a s ,m i c r o r n ap l a y sc r u c i a lr o l e si n l o t so fl i f e p r o c e s s e s i d e n t i f y i n gm i c r o r n ap r e c u r s o r s ( p r e m i r n a s ) i sap r i m a r ys t e p f o r a n a l y s i sp r o b l e m si n v o l v e d w i t hm i c r o r n ag e n e s w h i l et h eh a i r p i ns e c o n d a r y s t r u c t u r ei sad i s t i n g u i s h i n gf e a t u r eo fp r e m i r n a s ,t h e r ea r eal a r g en u m b e ro f s e q u e n c e sf o l d i n gi n t ot h e m ,w h i c ha r en o tp r e - m i r n a s f o c u s e d o nh a i r p i ns e c o n d a r y s t r u c t u r e ,w er e s e a r c hp r e d i c t i o nm e t h o d st od i s t i n g u i s hp r e - m i r n ah a i r p i n s f r o m p r e m i r n a 1 i k ep s e u d oh a i r p i n s f i r s t l y ,2 5n o v e ll o c a lf e a t u r e sf o ri d e n t i f y i n gh a i r p i n s t r u c t u r e so fp r e m i r n a sw e r ep r o p o s e db yp u l l i n gh a i r p i no fr n a ,w h i c hc a p t u r e s c h a r a c t e r i s t i c so nn o to n l yt h es t e mb u ta l s ob u l g ea n di n t e i l o rl o o pi ns t r u c t u r e t h e t e s t ss h o wt h a tt h ec l a s s i f i e rw i t hn e wf e a t u r e so u t p e r f o r m e dt h e3 s v m s e c o n d l y ,t o c h a r a c t e r i z ed e t a i l e di n f o r m a t i o no fp r e - m i r n ah a i r p i n ,f o u rt o p o l o g i c a li n d i c e s w e i g h t e db yf r e ee n e r g ya r ed e f i n e d e x p l o r a t i o no nt h e s ei n d i c e ss h o w s t h a tt h e yc o u l d n o to n l yc h a r a c t e r i z et o p o l o g i c a lc o n n e c t i o no fe l e m e n t s ,b u ta l s od e p i c tc o m p o s i t i o n a n dr e l a t i v ep o s i t i o no fb a s e si ns t r u c t u r e f i n a l l y ,w es e l e c t2 3f e a t u r e sf r o m5 2 c a n d i d a t e s ,w h i c hi n c l u d e4n e wt o p o l o g i c a li n d i c e s ,a sf e a t u r es e t t o i d e n t i f y p r e m i r n a a n dm o r e o v e r ,t h r o u g hh a n d l i n go fc l a s si m b a l a n c ep r o b l e mi n t h e d a t a s e t s a ne f f e c t i v ec l a s s i f i e rm o d e lf o rp r e m i r n ai sd e v e l o p e d k e yw o r d s :n c r n as e q u e n c e s t r u c t u r ea l i g n m e n t ,q u a n t u m g e n e t i c a l g o r i t h m s ,n c r n as e c o n d a r ys t r u c t u r ep r e d i c t i o n s ,f e a t u r e ss e l e c t i o n ,s u p p o r t v e c t o rm a c h i n e ,p r e c u r s o rm i c r o r n ai d e n t i f i c a t i o n ,t o p o l o g i c a lf e a t u r ew e i g h t e d b yf r e ee n e r g y 第i v 页 国防科学技术大学研究牛院博士学位论文 第一章绪论 本章简要介绍了课题的研究背景、意义和基本概念,引出了非编码r n a 相关 计算问题,最后介绍了论文的研究内容、主要创新点和组织结构。 1 1 1r n a 的角色 1 1 研究背景 有关生命起源、进化和工作机理的探寻始终是人们亘古不变、孜孜以求的命 题。蛋白质( p r o t e i n ) 、脱氧核糖核酸( d e o x y r i b o n u c l e i ca c i d ,d n a ) 和核糖核 酸( r i b o n u c l e i ca c i d ,r n a ) 三种生物高分子化合物,共同组成了生命科学的分 子学基础。但作为三大“支柱”之一,r n a 的重要性通常都“淹没”在蛋白质和 d n a 的光环之下:几乎所有生物体的遗传信息都是由d n a 携带( 除少数病毒由 r n a 携带遗传信息外) ;蛋白质作为生命体中重要的功能分子,几乎无所不能一 一它催化了生物体内绝大多数生化反应、运送小分子和各种离子通过细胞膜、控 制细胞的生长和分化,而且在免疫防护中起着重要作用。而对于r n a ,根据传统 分子生物学的“中心法则”( c e n t r a ld o g m a ) ,它只是被当作从d n a 到蛋白质的 “中介”、将遗传信息从“蓝图”传到“工人”手中的“信使”。但随着研究的 不断深入,越来越多的事实显示了r n a 的不平凡。 从1 8 9 3 年k o s s e l 首次发现r n a 开始,由于受传统观念和技术条件的限制, 其命运可谓跌宕起伏,特别是在1 9 5 8 年,c r i c k 提出分子生物学的“中心法则”【l j 后,r n a 被定位成“二传手”的角色并深入人心。但“是金子总要发光”,不甘 寂寞的r n a 总是给人们带来惊喜,扮演着挑战权威的“异教徒”:首先是c e c h l 2 3 】和a l t m a n 2 】分别发现了具有催化功能的r n a ,即核酶( r i b o z y m e ) ,这一发现打 破了蛋白质在生物催化领域“一手遮天 的格局,引发了有关生命起源的新一轮 争论:生命起始阶段,可能不是最先出现只能存贮遗传信息、而不具催化能力的 d n a ,也不是功能多样、无处不在的蛋白质,而是既可以携带遗传信息、又具有 催化能力、可以完成自我复制的r n a 。这就是生命起源的“r n a 世界”( t i l er n a w o r l d ) 假说【3 】。其次是s h a r p 4 j 和r o b e r t i s 发现了断裂基因( s p l i tg e n e s ) 和r n a 剪接( r n as p l i c i n g ) 。“中心法则”认为,基因就是连续的d n a 序列,d n a 是 r n a 的模板,信使r n a ( m e s s e n g e rr n a ,m r n a ) 是蛋白质生物合成的模板。 而断裂基因的发现,说明在真核生物中,一些基因不是连续的d n a 序列,而是由 两个或多个d n a 片段拼接而成。这个拼接过程是在r n a 水平进行的。从d n a 到蛋白质的过程,比以前想象的要复杂得多,r n a 在其中所起的作用,远超过人 第1 页 国防科学技术大学研究生院博士学位论文 们以前对r n a 的想象 6 1 。最后是r n a 干扰和小分子调控r n a 的发现,使得r n a 的作用又触及到生物发育调控、细胞分化、细胞凋亡、基因印记、应激反应等生 命过程。r n a 的功能不再局限于仅是将遗传信息从d n a 传递到蛋白质的过程, 随着研究的不断深入,其“多才多艺的新形象逐渐展示于世人面前。表1 1 列出 了自2 0 世纪以来和r n a 有关的诺贝尔奖,从另侧面说明了r n a 研究的重要性。 表1 12 0 世纪以来与r n a 研究相关的诺贝尔获奖项卧6 1 科学家( 国籍)年份获奖种类获奖原因 a k o s s e l ( 德) 1 9 1 0 生理与医学奖核的生物化学 s o c h o a ( 美) 1 9 5 9 生理与医学奖酶促合成多核糖核酸 r w h o l l y ( 美) 酵母t r n a 一级结构测定 h g k h o r a n a ( 美)1 9 6 8 生理与医学奖合成遗传密码 m w n i r e n b e r g ( 美) 发现遗传密码 l f l e l o i r ( 阿根廷)1 9 7 0 化学奖发现核糖核酸在碳水化合物合成中的作用 e w s u t h e r l a n d ( 美) 1 9 7 1生理与医学奖 发现3 ,5 c a m p 和激素作用机制 暑兰勰( 彗 1 9 7 5 生理与医学奖反转录酶 t s a c e l t c m h a n ( 美( ) ) 1 9 8 9 化学奖 发现核酶催化作用 釜器羔尹 1 9 9 3 生理与医学奖发现断裂基因
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 劳动节广播稿15篇
- 养成良好行为习惯主题演讲稿
- 卖火柴的小女孩读书笔记
- 2025年山东工程技师学院公开招聘人员(9名)考前自测高频考点模拟试题及答案详解(名校卷)
- 2025年马鞍山和县安徽和州城市建设集团有限公司二季度招聘5人考前自测高频考点模拟试题及答案详解1套
- 2025年上海新上铁实业发展集团有限公司合肥分公司招聘1人模拟试卷及答案详解(必刷)
- 2025年浙能武威能源有限公司招聘模拟试卷及一套参考答案详解
- 2025年尾矿处理技术突破生态修复与资源循环利用报告
- 2025年智能建筑系统集成节能降耗中的建筑能耗管理平台构建报告001
- 2025年教育行业数字化营销与招生策略的跨平台推广研究报告
- 杭州师范大学2013年841无机化学考研真题
- 绿植租摆服务投标方案(完整技术标)
- 矿山安全培训课件-地下矿山开采安全技术
- 汪小兰版有机化学答案全
- DB32∕T 3751-2020 公共建筑能源审计标准
- DB51T 2975-2022气凝胶复合保温隔热材料及系统通用技术条件
- 高中音乐《学会聆听音乐》第三课时《联想与想象》 课件
- 实验,双子叶植物根类药材的鉴定课件
- 高中音乐鉴赏 第一单元 学会聆听 第一节《音乐要素及音乐语言》
- GB/T 40302-2021塑料立式软薄试样与小火焰源接触的燃烧性能测定
- 20以内加减法口算题3500道直接打印
评论
0/150
提交评论