(细胞生物学专业论文)人类组织特异性基因的进化研究.pdf_第1页
(细胞生物学专业论文)人类组织特异性基因的进化研究.pdf_第2页
(细胞生物学专业论文)人类组织特异性基因的进化研究.pdf_第3页
(细胞生物学专业论文)人类组织特异性基因的进化研究.pdf_第4页
(细胞生物学专业论文)人类组织特异性基因的进化研究.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(细胞生物学专业论文)人类组织特异性基因的进化研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人类组织特异性基因的进化研究 中文摘要 本文基于公共数据库资源,以人类组织特异性基因为对象,利用生物信息学 的理论和方法,对处于调控通路不同阶段的人类组织特异性基因的进化特征进行 比较研究,揭示人类组织特异性基因和非组织特异性基因在特定进化特征上的差 异,以及处于信号通路不同阶段的人类组织特异性基因之间存在的进化特征异 同,进而对相应的潜在机制进行探索。另外,本文从共进化的角度揭示了导致编 码区进化速率差异的可能原因,为深入研究此类基因的进化机制提供新的思路。 主要研究结果如下: ( 1 ) 通过系统分析人类组织特异性基因及其在小鼠中的同源基因,计算多种进 化选择压力( 如同义替代率( k s ) 、非同义替代率( k o ) 和进化速率) 。结果 显示调控通路中不同阶段的组织特异性基因具有不同的进化速率。和其他组织特 异性基因相比,组织特异性的转录因子( 包括h o x 基因,n o n h o xh o m e o b o x 基因,h l h 基因以及z i n g e rf i n g e r 基因) 具有相对较低的进化速率,而细胞外信 号、膜结合的信号受体以及神经递质基因具有明显高的进化速率。 ( 2 ) 对不同种类组织特异性基因的非同义替代率进行比较分析,发现突变率 的不同并不是造成进化速率不同的真正原因,而组织特异性转录因子处于较强选 择压力以及功能和表达方式的差异才可能是潜在原因。 ( 3 ) 通过与非组织特异性基因比较发现并非所有的人类组织特异性基因均进 化较快;和细胞信号及细胞分化相关的非组织特异基因相比,除神经递质和膜 结合的细胞信号受体基因以外,其他所有的组织特异性基因的进化速率均显著较 低。 ( 4 ) 进一步识别并分析了不同基因内含子区的可转移元件,发现编码区具有 较低进化速率的基因在其相应内含子区便具有较低的可转移元件密度,表明编码 区和其相应的内含子区之间可能存在协调进化。 通过对上述研究结果的综合分析,初步揭示了人类组织特异性基因的特定进化 特性,即:相对于非组织特异性基因,并非所有的人类组织特异性基因均进化较 快,而且不同种类的人类组织特异性基因具有不同的进化速率,而不同编码区和 其相应的内含子区之间存在的协调进化可能是此现象的潜在驱动因素。本文的研 究结果为更深入探索此类基因的进化机制提供了相应基础和启示。 关键词:生物信息学,组织特异性基因,进化速率,同义替代,非同义替代,可 转移元件,共进化 a b s t r a c t b a s e do nt h ep u b l i cd a t a b a s e s ,w ei n v e s t i g a t e s y s t e m a t i c a l l yt h ee v 0 1 u t i o nf e a t u r e s o ft h eh u m a nt i s s u e - s p e c i f i cg e n e sw h i c ha r ei n v o l v e di nd i f 琵r e n t p l a c e s0 nt h e r e g u l a t o r yp a t h w a y ,u t i l i z i n gt h e o r i e sa n dm e t h o d so fb i o i n f o r m a t i c sa i l de v o l u t i o n a r v g e n o m i c s t h ew o r ki n d i c a t e st h a tt h e r ee x i s tt h ed i s t i n c te v o l u t i o nc 量l a r a c t e r i s t i c s b e 撕e e nt h et i s s u e s p e c i f i cg e n e sa n dt h e c o n t r 0 1 f u r t h e r , w ee x p l o r et h eu n d e r l y i n g f a c t o r sw h i c hm a yb et h e p o t e n t i a ld y n a m i c so ft h ed i v e r g e n c ei ne v o l u t i o nr a t e s t h e p r e s e n t e dw o r kp r o v i d e si n s i g h tt ot h ee v o l u t i o ns e l e c t i o no fh u m a n t i s s u e s p e c i f i c g e n e s 弱w e ua sn e ws c e n a r i of o re l u c i d a t i n gt h ep o t e n t i a le v o l u t i o n a r ym e c h 锄j s m o fc o r r e s p o n d i n g g e n e s t h em a i nr e s u l t sa r ed e m o n s t r a t e da sf o l l o w i n g : 1 ) w ee x a m i n e dd i f f e r e n tt y p e so fs e l e c t i o np r e s s u r e s 【e g a g a i n s ta m i n oa c i d m u t a t i o n s ( g a g s ) ,a g a i n s tm u t a t i o n sa ts y n o n y m o u ss i t e s ( k s ) ,a g a i n s tm u t a t i o n sa t n o n s y n o n y m o u ss i t e s ( k a ) 】b ys y s t e m i ca n a l y s e so fh u m a n t i s s u e s p e c i f i cg e n e sa n d t h e n o t o o l o g o u sg e n e si nm o u s e t h er e s u l t si n d i c a t et h a td i f f e r e n tc l a s s e so fh u m 趾 t l s s u e p e c i f i cg e n e si n v o l v e di nt h er e g u l a t o r yp a t h w a yh a v ed i v e r g e n te v o l u t i o n a r y r a t e s s 1 m i l a rt oo t h e rt i s s u e 。s p e c i f i c g e n e s ,i n c l u d i n gs i g n a lt r a n s d u c e r s n u c l e a r 撇p t o r s锄d n e u r o r e c e p t o r s ,t i s s u e - s p e c i f i ct r a n s c r i p t i o n f a c t o r s ( h o xg e n e s n o n 。h o xh o m e o b o xg e n e s ,h l hg e n e s ,z i n g e rf i n g e r g e n e s ) h a v eo n a v e r a g el o w e r v a l u eo fk a k s h o w e v e r , t h eg e n e s ,i n c l u d i n ge x t r a c e l l u l a rs i g n a l s ,s 咖a lr c c e p t 吣 ( m e m b r a n e - b o u n d ) ,n e u r o t r a n s m i t t e r sa n do t h e re f f e c t o r s ,h a v et h eh i g h e rv a l u eo f k a k s 2 ) b yc a l c u l a t i n ga n dc o m p a r i n gt h ev a l u e so fk sa m o n ga l lt h ec l a s s e so fh u m a n t i s s u e s p e c i f i cg e n e s ,w ef i n dt h a tt h ea v e r a g es y n o n y m o u sr a t ed o e sn o te x h i b i tt h e s a m em a g u i t u d eo ft h ea v e r a g e n o n s y n o n y m o u ss u b s t i t u t i o nr a t e ,i l l u m i n a t i n gt h a tt h e m u t a t i o nr a t ed i f f e r e n c e sa r en o tt h em a i nc a u s ef o rt h e d i f f e r c n c eo fs e l e c t i v e c o n s t r a i n t s t h ep o t e n t i a lc a u s e s m a yu n d e r l i e i nt h e d i v e r g e n tf u n c t i o na n d e x p r e s s i o n 3 ) c o m p a r e dt ot h ec e l l 。s i g n a l i n ga n dc e l l - d i v i s i o nr e l a t e dg e n e s ,n o ta 1 1t y p e so f n u m a nt l s s u e 。s p e c i f i cg e n e se v o l v e q u i c k l y a p a r tf r o mt h en e u r o t r a l l s m i t t e r s 觚d s l g n a lr e c e p t o r s ( m e m b r a n e - b o u n d ) g e n e s ,a l lt h eo t h e rt i s s u e s p e c i f i c g e n e sh a v e s t a t i s t i c a l l yl o w e rv a l u eo fk a k s 4 ) w ef u r t h e ri d e n t i f i e da n da n a l y z e dt h et r a n s p o s a b l ee l e m e n t si n t h ei l l t r i d n i c r e g i o n so fd i f f e r e n tg e n e s t h er e s u l t sp r e s e n t e dt h a tt h eg e n e sw i t h1 0 w e re v o l u t i o n 2 人类组织特异性基因的进化研究 r a t e si nc o d i n gr e g i o n sh a v ef e w e r d e n s i t yo ft r a n s p o s a b l ee l e m e n t si ni n t r o n i cr e g i o n s i ts e e m st oi m p l yt h a tt h e r ee x i s tp o t e n t i a lc o r r e l a t i o nb e t w e e nt h ee v o l u t i o no fc o d i n g r e g i o n sa n dc o r r e s p o n d i n gi n t r o n i cr e g i o n s i nc o n c l u s i o n ,i nt h ep a p e r , t h ed i v e r g e n tf e a t u r e sa n dp o t e n t i a ld y n a m i c si n e v o l u t i o no fh u m a nt i s s u e - s p e c i f i cg e n ea r ed e t e c t e da n da n a l y z e d t h es t u d y p r o v i d e sab a s ec l u ea n dn o v e lo r i e n t a t i o nf o rm o r ep r o f o u n di n v e s t i g a t i o n so n e v o l u t i o na n dd i v e r g e n c eo ft i s s u e s p e c i f i cg e n e s k e y w o r d s :b i o i n f o r m a t i c s ,t i s s u e - s p e c i f i cg e n e ,e v o l u t i o nr a t i o ,s y n o n y m o u s s u b s t i t u t i o n , n o n s y n o n y m o u ss u b s t i t u t i o n ,r e p e a td e m e n t , c o e v o l u t i o n 3 人类组织特异性基因的进化研究 学位论文独创性声明 本人承诺:所呈交的学位论文是本人在导师指导下所取得的研究成果。 论文中除特别加以标注和致谢的地方外,不包含他人和其他机构已经撰写或 发表过的研究成果,其他同志的研究成果对本人的启示和所提供的帮助,均 已在论文中做了明确的声明并表示谢意。 学位论文作者签名: 日 期:) 矽孑- j 学位论文版权的使用授权书 本学位论文作者完全了解辽宁师范大学有关保留、使用学位论文的规 定,及学校有权保留并向国家有关部门或机构送交复印件或磁盘,允许论文 被查阅和借阅。本文授权辽宁师范大学,可以将学位论文的全部或部分内容 编入有关数据库并进行检索,可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文。保密的学位论文在解密后使用本授权书。 学位论文作者签名:杰困l 指导教师签名: 日期: 当¥ 如g 人类组织特异性基因的进化研究 第一章生物信息学概述 1 1 生物信息学定义 生物信息学( b i o i n f o r m a t i c s ) 是生物学与计算机科学以及应用数学等学科 相互交叉而形成的- - f l 新兴学科。它通过对生物学实验数据的获取、加工、存 储、检索与分析,进而达到揭示数据所蕴含的生物学意义的目的。由于当前生 物信息学发展的主要推动力来自分子生物学,生物信息学的研究主要集中于核 苷酸和氨基酸序列的存储、分类、检索和分析等方面,所以目前生物信息学可 以狭义地定义为:将计算机科学和数学应用于生物大分子信息的获取、加工、 存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交 叉学科。现代分子生物学的发展,特别是人基因组计划的实施,使生物学家所 面对的数据不再是实验记录本上或文献上的几行简单数字,而是公共数据库中 数以千兆计的记录【1 5 】。 1 2 生物信息学的产生与发展 1 2 1 生物信息学的产生 生物信息学的产生最早可上溯至2 0 世纪5 0 年代未期,将计算机应用于生物学 的工作中。早期研究主要是利用数学模型、统计学方法和计算机处理宏观生物 学数据。例如,数量分类学( n u m e r i c a lt a x o n o m y ) 和数学生态学( m a t h e m a t i c a l e c o l o g y ) 就是在那一时期产生的,并在7 0 年代后逐渐成熟【6 , 7 1 。随后,计算机开 始应用于分子生物学研究其中包括建立分子生物学数据库以及蛋白质结构的 计算机辅助分析与预测等。在上述学科领域中,人们已经逐步建立了理论基础 和一批方法、模型与软件。直到今天,这些工作仍在继续发展之中。 1 2 2 生物信息学发展阶段 生物信息学产生和发展的推动因素主要有以下三方面:一是人类基因组 计划( h u m a ng c n o m cp r o j c c t ,h g p ) ;二是信息技术的大规模应用;三是生 物医药的迅速发展及其经济的需求。 几十年来,生物信息学的发展大致经历了三个阶段:前基因组时代、基因 组时代后和基因组时代【8 ,9 1 。这三个阶段并无严格的界限,但从一个侧面反映出 生物信息学研究的显著特点:生命科学的进步不断对生物信息学提出新的挑战, 也为该学科的发展提供新的机会。迎接挑战,就必然会产生新的研究方向,同 人类组织特异性基因的进化研究 时发展出新的方法与工具。 1 2 2 1 前基因组时代 前基因组时代又称测序基因组时代,其标志性工作包括生物数据库的建立、 检索工具的开发以及d n a 和蛋白质序列分析。例如,2 0 世纪8 0 年代即开始建立 g e n b a n k ,但数据量增长较慢;n e e d l e m a n 和w u n s c h 【1 0 】以及s m i t h 和w a t e r m a n 1 1 】 分别提出了全局和局部的序列对位排列( s e q u e n c ea l i g n m e n t ) 算法等。 1 2 2 2 基因组时代 基因组时代标志性工作包括基因寻找和识别、网络数据库系统的建立和交 互界面的开发等。例如,建立与发展表达序列标签( e x p r e s s e ds e q u e n c et a g ,e s t ) 数据库以及电子克隆( v i r t u a lc l o n i n g ) 技术等。 1 2 2 3 后基因组时代 后基因组时代又称功能基因组时代,其标志是大规模基因组分析、蛋白质组 分析以及各种数据的比较和整合。例如,蛋白质组学( p r o t e o m i c s ) 的产生以及 分析人类基因组草图等。 1 9 9 0 年1 0 月1 日,美国国会正式批准的人类基因组计划( h u m a ng e n o m e p r o j e c t ,h g p ) ,标志着人类历史上规模最大的科研工程的正式启动1 1 2 , 1 3 】。至今 世界上好多国家都已相继成立了一大批具影响力的生物信息学中心,其中美国 国家生物技术信息中心( n a t i o n a lc e n t e ro fb i o l o g i c a li n f o r m a t i o n ,n c b i ) 、欧洲 生物信息学研究所( e u r o p e a nb i o i n f o r m a t i c si n s t i t u t e ,e b i ) 和日本信息生物学 中心( c e n t e rf o ri n f o r m a t i o nb i o l o g y , c i b ) 被称为世界三大生物信息学中心,每 大交换数据,同步更新。2 0 0 1 年2 月人类基因组序列图谱公开发表,这意味着 后基因时代的到来。人类后基因组计划是由序列( 结构) 基因组学向功能基因 组学的转移,其目的是要对基因组生物学功能进行研究和应用。后基因组时代 中,生命科学的中心任务是阐明基因组所表达的真正执行生命活动的全部蛋白 质的表达规律和生物功能,生命科学的研究重心将从基因组学( g e n o m i c s ) 转 移到蛋白质组学( p r o t e o m i c s ) 。在国际竞争日益激烈的生物信息学领域,中国面 临的形势严峻,急需一大批跨专业的优秀人才。 1 3 生物信息学研究的方向与趋势 1 3 1 生物信息学研究的方向 生物信息学最终是一门研究生物系统中信息现象的学科,它的主要研究内 2 人类组织特异性基因的进化研究 容包括:大规模基因组测序中的信息分析;遗传密码的起源与生物进化分 析:完整基因组的比较研究;大规模基因功能表达谱的分析;生物大 分子的结构模拟与药物设计;生物信息学分析方法学的研究;建立生物 医学数据库与服务系统;生物信息学的发展与应用研究【体1 踟。 1 3 2 生物信息学研究的趋势 综合分析生物信息学的发展方向,其研究主要呈现以下趋势: 1 、由以序列分析为代表的组成分析转向功能分析 随着人类基因组计划完成,人们的注意力己从基因组测序转向对基因组表达 的分析、对蛋白质组结构与功能的预测。生物信息学发展初期的主要工作是对测 序所获得的d n a 序列数据及蛋白质序列数据进行序列结构分析、比对、模式发现 等工作,而近年来重点转向对基因功能的研究,主要是对基于芯片技术获得的基 因表达谱数据进行深入研究,获取生物大分子功能的差异以及生物大分子在时 间、环境等条件下的变化。 2 、由对单个生物分子的研究转向基因调控网络等动态信息的研究 生物系统的复杂性,不仅表现在各组成成分之间的相互作用中,更体现在 它们所展示出的复杂的动态性上【1 9 1 。揭示生命奥秘,需要进一步了解各种生物 大分子的代谢途径、基因调控的过程等动态特征【驯,而不是仅对单个的生物大 分子的研究。代谢网络和基因调控网络的研究是人类保健、疾病治疗的基础。 3 、完整基因组数据分析 随着测序获得的完整的物种基因组数据的增加,在完整基因组水平上的数 据分析被提到议事日程,这也是获得较高级别生物知识的方法。 4 、综合分析 任何生物数据都是生物体在生命过程中的体现,要全面了解生命过程,就 必须全面理解这些数据。数据之间本质上相互关联、相互作用的网络特性,决 定了生物信息分析必然是各种生物数据的综合分析,这样才能够获得对生命过 程整体性的知识。另一方面,多种分析技术的综合应用才能够满足高通量的数 据特性以及不断深化的分析需求。例如基因表达数据分析与序列数据分析结合, 提高分析的等级,获得更接近生物意义的结果;基因表达数据与g e n eo n t o l o g y 的综合分析等1 2 1 l 。 5 、成为生物学研究的常规方法 生物信息学在过去的十几年中得到了飞速发展,迅速渗透到生物学中的各 3 人类组织特异性基因的进化研究 个领域,极大地推动了现代生物学发展,给生物学研究方法以革命性的改变, 将生物学由实验科学转变为信息科学。生物信息学将成为生物学研究的常规方 法。 1 4 生物信息学面临的挑战 随着人类基因组研究的不断深入,生物信息技术面临着巨大挑战,同时也 为促进生物医学研究的发展提供了机遇。结合重大科学问题的研究,发挥我国 在理论生物学和信息科学领域的研究特色,发展生物信息学的新理论、新方法、 新技术和新软件。目前,生物信息学研究所面临的主要挑战有: ( 1 ) 需要建立可互操作的生物信息系统及相关数据挖掘技术。在世界范围 内,已开发出大量异构的生物数据库,如何在它们之间实现数据集成与共享是 有效利用生物信息资源的关键技术问题。在信息集成和数据挖掘过程中首先 必须考虑生物在不同水平( 层次) 上信息之间的复杂联系。 ( 2 ) 需要能够揭示大规模数据集合中不同组分之间关系的统计分析方法及 优化算法。例如,不同物种中可能包含了同源的或非同源的基因,面不同基因 可能在d n a 或蛋白质序列上具有较高的异质性。因而,在基因组水平上比较不 同物种或不同基因之间的相似性,有助于揭示整个基因组进化与物种进化的规 律。 ( 3 ) 需要开发各种类型的数据转换工具,建立预测模型。最基本的工作是根 据核苷酸和氨基酸序列来确定蛋白质功能域并预测蛋白质结构。现存生物数据 库之间数据的自动转换是信息集成的必备条件。 ( 4 ) 需要开发适用于微阵列和基因芯片等新技术的数据分析工具。微点阵杂 交中涉及上万个寡核苦酸,并依杂交信号强弱、探针位置和序列确定靶d n a 的 表达及多态性等。目前,迫切需要提高检测的自动化程度和数据的并行处理能 力。 当今生物信息学已经广泛渗透到生物学及相关的各个领域,生物学的迅速 发展还会为生物信息学不断提出新的任务和挑战。当基因组测序计划持续开展, 研究重点己逐步从数据的积累转向数据的解释。用于序列分类、相似性搜索、 d n a 序列编码区识别、分子结构与功能预测、进化过程的构建等方面的计算工具 已成为研究工作的重要组成部分。生物信息学已成为介于生物学和计算机科学 学科前沿的重要学科,在许多方面影响着医学、生物技术和人类社会。 4 人类组织特异性基因的进化研究 第二章比较基因组学概述 2 1 比较基因组学产生的背景及定义 2 1 1 比较基因组学产生的背景 基因组( g e n o m e ) 是生物体内遗传信息的集合,是某个特定物种细胞内全 部d n a 分子的总和。在1 9 8 0 年前后,几项关键技术的发展和成功运用使得全 基因组序列测定成为可能,比如s a n g e r 的双脱氧测序、脉冲凝胶电泳分离大片 段d n a , d n a 的体外重组和p c r 技术等,基因组学( g e n o m i c s ) 应运而生。 基因组学研究内容包括基因组作图、测序与分析【2 2 1 。2 0 0 1 年6 月,随着人类基因 组计划的完成,基因组研究进入了一个崭新的时代后基因组时代。基因组 学也发生了翻天覆地的变化,己发展成了一门研究生命科学的前沿和热点学科。 现在的基因组学可以分为结构基因组学和功能基因组学两大类。结构基因组学 研究的目标是建立高密度的遗传图、高分辨率的物理图和转录图,最终完成全 基因组序列的测定和注解;而功能基因组学则是利用结构基因组学研究提供的 信息和材料,发展和应用特定的实验方法,从基因组的整体水平上来理解基因 的功能与进化。随着基因组研究的深入,相关信息出现了爆炸性增长,迫切需 要对大量基因组数据进行处理,比较基因组学作为- i - j 重要的工具学科孕育而 生。 2 1 2 比较基因组学定义 比较基因组学( c o m p a r a t i v eg e n o m i s ) 是在基因组图谱和测序的基础上, 比较物种基因组间的相似性和差异性,进而阐述其内在分子机制,以了解基因 的功能、表达机制和物种进化的- - l - j 新兴学科i 矧,亦可利用某个基因组研究获 得的信息通过比较的反式推测其他原核生物、真核生物类群中的基因数目、位 置、功能、表达机制和物种进化。该学科的发展及所取得的成果与序列的积累 相同步,尤其是人类全基因组序列的分析与比较使比较基因组学成为整个生物 学领域最新、最重要、进展最快和影响最大的学科之一。 2 2 比较基因组学研究技术 2 2 1 比较基因组杂交技术 比较基因组杂交( c o m p a r a t i v eg e n o m i ch y b r i d i z a t i o n ,c g h ) 是自1 9 9 2 年后 发展起来的一种分子细胞遗传学技术,通过单一的一次杂交可对某一肿瘤整个 5 人类组织特异性基因的进化研究 基因组的染色体拷贝数量的变化进行检查【2 4 1 。其基本原理是用不同的荧光染料 通过缺口平移法分别标记肿瘤组织和正常细胞或组织的d n a 制成探针,并与正 常人的间期染色体进行共杂交,以在染色体上显示的肿瘤与正常对照的荧光强 度的不同来反映整个肿瘤基因组d n a 表达状况的变化,再借助于图像分析技术 可对染色体拷贝数量的变化进行定量研究。 比较基因组杂交技术的优点是实验所需d n a 样本量较少,做单一的一次杂 交即可检查整个基因组的染色体拷贝数量的变化。缺陷是分辨率不高,大约是 5 - 2 0 m b ,而且需要高水平的细胞遗传学专家进行操作。 2 2 2 寡核苷酸阵列比较基因组杂交技术 微阵列一比较基因组杂交( m i c r o a r r a y c g h ,又称a r r a yc g h ) 技术是将基 因芯片技术和传统比较基因组杂交技术集为一体的新技术【2 5 1 。它通过在一个微 小的基片表面固定大量的基因探针,用标记后的待检测样本与已固定的核苷酸 序列杂交,然后检测信号,确定样本中该基因或核苷酸序列的含量。a r r a yc g h 的原理与细胞分裂中期染色体比较基因组杂交的原理相同,区别在于将基因组 d n a 转移到芯片( 微阵列) 上以代替中期染色体。由于利用了d n a 微阵列, 其操作方法与目前在基础研究中广泛应用的基因表达谱分析类似,只不过荧光 标记的待测核酸不是靶组织或细胞中的r n a 、c r n a 或逆转录生成的e d n a , 而是基因组d n a 2 6 。正常人群中基因组拷贝数多态性( c o p yn u m b e r p o l y m o r p h i s m ,c n p ) 普遍存在,还有一些拷贝数变化则与疾病发生相关。能在 全基因组水平高分辨率地检测c n p 的快速、准确的分析方法,对我们理解人群 变异以及疾病发生的机理都十分重要【2 7 1 。寡核苷酸阵列比较基因组杂交 ( o l i g o n u c l e o t i d ea r r a yc g h ,o a c g h ) 正是近几年发展起来的分子遗传学新技术 之一。 2 2 3 原位杂交技术 原位杂交( i ns i t uh y b r i d i z a t i o n ,i s h ) 是一项利用标记的d 卜a 或r n a 探针直 接在染色体、细胞或组织水平定位特定靶核酸序列的分子细胞遗传学技术【2 8 , 2 9 1 。 该技术广泛应用于构建d n a 物理图谱、转基因的细胞学鉴定、检测外源染色体片 段和探讨其渗入特点;研究基因组的结构、变异以及空间分布规律,研究物种 间的亲缘关系。在构建染色体物理图谱方面,i s h 具有其他方法无可替代的优点, 它能把探针直观地定位到具体染色体臂上,能检测出相应探针在基因组中不具 任何表型的同源序列;能印证基因的遗传图谱,可以比较物理图谱与遗传图谱 6 人类组织特异性基因的进化研究 之间的差别;同时还可了解基因位置与功能之间的相互关系,探讨基因在染色 体上的分布规律。 2 2 4 染色体涂染技术 染色体涂染( c h r o m o s o m ep a i n t i n g ) 技术是用染色体特异性或染色体区特异 性d n a 文库作为探针池,与中期分裂相染色体( 或间期核) 进行荧光原位杂交( f l u o r e s c e n c ei ns i t uh y b r i d i z a t i o n ,f i s h ) 和染色体原位抑制( c h r o m o s o m ei ns i t us u p p r e s s i o n ,c i s s ) 杂交,从而使特定的染色体物质从p t e r - - - q t e r 或某个特定区域上显 示出均匀恒定的荧光信号。它能够在分子水平上检测染色体数目和结构畸变, 如相互易位特别是细胞遗传学水平难以确定的微小易位和复杂易位,鉴别标记 染色体的来源等【3 0 ,3 1 1 。该技术所揭示的同源片段是建立在d n a 序列同源的基础上, 可以从整体水平比较基因组中所有的染色体片段,因而比传统显带和基因定位 技术具有更准确、可靠、快速等优点,正日益成为目前比较基因组和染色体进化 研究的主要手段【3 2 】。 2 3 比较基因组学应用 2 3 1 确定进化关系 比较基因组学能在基因组水平阐释生物学功能和生命现象,或依据基因组数 据研究基因组自身的进化过程和规律。它让人们能在更大程度上探究功能基础 上的进化限制因素。复杂进化过程同时也是自然选择的过程和大量基因差异表 达的结果。基因的差异表达不仅表现在转录水平上,也表现在翻译水平上,最 终则表现为特异的生物功能的差异。因而在不同的水平上,对基因在不同组织 器官、不同发育阶段和不同环境条件下表达模式的研究可为基因的生物学功能 提供证据。大多数序列比较研究发现序列一致性的基因,其拥有一个共同的序列 祖先,其序列的同源性反映了他们的分化时间。在研究物种间的进化关系时,传 统的分子进化研究方法一般选取一个大分子的序列为标准,研究其在各个物种 同源序列之间的差异,并以此构建进化树。但是一个物种的基因组编码了成千上 万个序列,以其中一个序列的差异来代表整个生物体的差异是不全面的。因此, 从全基因组的水平来研究生物的进化应该更为合理。利用比较基因组学的方法 在基因组水平上构建的进化树将会更加合理的阐述物种之间的进化关系【3 4 1 。 2 3 2 非编码功能元件探索 对人类基因组来说,迄今为止,人们真正掌握规律的只有d n a 上编码蛋白质 7 人类组织特异性基因的进化研究 的区域,很多资料表明这部分序列只占基因组的3 5 ,即基因组中多达 9 5 9 7 是非编码区。如何深入了解这些非编码区序列的功能是当前科学家们 面临的一个真正挑战。通过不同物种间的序列比较可以鉴定编码和非编码的序 列,这是基于进化过程中功能序列的进化速率相对于非功能区域要慢一些,进化 距离决定了非编码序列的同源性。亲缘关系较远的物种其内含子序列的一致性 较外显子要低一些,外显子序列更为保守一些。鉴于外显子在进化过程中保守性 较强,可以通过选择亲缘关系较远的物种序列比较,获得候选的外显子区域。通 过比较不同进化距离物种的基因组还可以发现非编码的功能序列区域【3 5 , 3 6 】。而功 能元件的发现,特别是和基因转录表达相关的远程元件的发现仍然是一个挑战, 如上有调控位点的识别等( 图2 1 ) 。 图2 1 潜在的转录调控位点不意图 f i 9 2 1t h et r a n s c r i p t i o nr e g u l a t o r ys i t e sc r f b s s ) 、t r a n s c r i p t i o nf a c t o r sa n dt h e i rb i n d i n gs i t e s 2 3 3 功能性s n p 识别及人类疾病机制探索 单核苷酸多态性( s n p s ) 即基因上的细小差异导致了每个人的与众不同,基 因组的差别仅为0 1 。如果能够找出人类遗传物质中的每个“单核苷酸多态性”, 那么就能确定所有的基因变异。传统的s n p 寻找方法效率很低,在庞大的基因组 中找到功能性的s n p 非常困难。通过比较基因组学的方法,比较感兴趣的性状、 有差异的个体和物种之间的基因组序列,将是高通量寻找功能性s n p s 的方法 1 3 7 。 8 人类组织特异性基因的进化研究 疾病基因的同源体或家族成员在模式生物中被功能定性时,使我们能更多 地了解这些疾病基因。在此情况下,当那些在人类疾病状态下发生突变基因的同 源体或家族成员在其它物种中被克隆时,各种模式生物实验上的优越性就将被 用于对同源基因产物进行定性,并阐明人类疾病过程的分子机制。比较基因学作 图将是阐明人类基因功能的强有力手段,在功能基因组学、模式生物研究中有其 重要的意义【3 8 1 。 2 3 4 新基因的发现 发现新基因是当前国际上基因组研究的热点,使用比较基因组学的方法是 发现新基因的重要手段。人类基因的全长大约有3 2 亿个碱基对,其中早期的预 测基因数目大约在3 4 万个,最近通过比较分析已减少到2 5 万个左右,迄今为止 人们也只是认识了其中的一小部分,通过比较基因组学发现新的基因被认为是 有效的方法;而h m m 模型便是新基因预测中的重要工具,图2 2 是k u l p ,d 博 士改进的新基因预测模型示意图。 j “= 竺c一l ,了 一。一二二;。,羹。芝二二一一 。 一。 。r r 一。 、铲5 蜘旱a 翱 一e - 一0 图2 2 用于基因预测的优化h m m 模型 f i 9 2 2am o r er e a l i s t i ca n dc o m p l e xh m mm o d e lf o rg e n ep r e d i c t i o n 随着后基因时代的到来,对全基因组序列功能元件的鉴定将是生物学家面 临的巨大挑战,而运用比较基因组学的方法将是鉴定基因组中的重要序列元件 的强有力的工具。在生物的进化过程中,基因组是一个动态的结构,不断地被 9 人类组织特异性基因的进化研究 修饰、演化。以基因组为研究对象的比较基因组学是常规的以基因为研究对象 的分子生物学的一次飞跃。对进化研究,也从基因水平上的比较,上升到对不 同进化水平的生物在全基因组水平上的比较研究。这样的研究将更有效地阐述 进化的历程,揭示基因在生命系统中的地位和作用,解释整个生命系统的组成 和作用方式【3 9 j 。由完整基因组研究所导致的比较基因组学必将为诠释生命体的 遗传机制、揭示生命的本质规律开辟新的领域。 1 0 人类组织特异性基因的进化研究 第三章目标基因进化研究中的若干概念简介 3 1 碱基突变与替代 3 1 1 碱基突变 碱基突变是指由于d n a 碱基对的替代、增添或缺失而引起的基因结构的变 化,亦称点突变。在自然条件下发生的突变叫自发突变,由人工利用物理因素 或化学药剂诱发的突变叫诱发突变。基因突变是生物变异的主要原因,是生物 进化的主要因素。在生产上人工诱变是产生生物新品种的重要方法。根据基因 结构的改变方式,基因突变可分为碱基替代和移码两种类型。 碱基替代是指由一个错误的碱基对替代一个正确的碱基对的突变。碱基替 代过程只改变被替代碱基的那个密码子,也就是说每一次碱基替换只改变一个 密码子,不会涉及到其他的密码子。可能引起碱基替代的原因和途径有两个。 一是碱基类似物的掺入,例如在大肠杆菌培养基中加入5 溴尿嘧院( b u ) 后, 会使d n a 的一部分胸腺嘧啶被b u 所取代,从而导致a t 碱基对变成g c 碱基 对,或者g c 碱基对变成a t 碱基对。二是某些化学物质如亚硝酸、亚硝基胍、 硫酸二乙酯和氮芥等,以及紫外线照射,也f i 邑弓l 起碱基替代突变。移码是指基 因中插入或者缺失一个或几个碱基对,会使d n a 的阅读框架( 读码框) 发生改 变,导致插入或缺失部位之后的所有密码子都跟着发生变化,结果产生一种异 常的多肽链。移码突变诱发的原因是一些像吖啶类染料分子能插入d n a 分子, 使d n a 复制时发生差错,导致移码突变。 在长期的进化过程中,碱基突变有几种显著特点:( 1 ) 基因突变在生物界中 是普遍存在的。( 2 ) 基因突变是随机发生的。( 3 ) 在自然状态下,对一种生物 来说,基因突变的频率是很低的。( 4 ) 大多数基因突变对生物体是有害的,由 于任何一种生物都是长期进化过程的产物,它们与环境条件已经取得了高度的 协调。( 5 ) 基因突变是不定向的。 3 1 2 同义替代与非同义替代 同义替代是指d n a 的一个碱基对的改变并不会影响它所编码的蛋白质的氨 基酸序列,这是因为改变后的密码子和改变前的密码子是简并密码子,它们编 码同一种氨基酸,这种替代方式称为同义替代。而非同义突变则是指由于一对 或几对碱基对的改变而使决定某一氨基酸的密码子变为决定另一种氨基酸的密 码子的替代方式。这种替代方式有可能使它所编码的蛋白质部分或完全失活, 人类组织特异性基因的进化研究 例如人血红蛋白b 链的基因如果将决定第6 位氨基酸( 谷氨酸) 的密码子由c t r 变为c a t ,就会使它合成出的b 链多肽的第6 位氨基酸由谷氨酸变为缬氨酸, 从而引起镰刀形细胞贫血病。由于不同生物体本身特性、所面临的环境、以及 基因的功能类别不同,都有可能导致替代的速率不同,因而可以据此进行比较 分析特定基因的进化特征。 3 2 进化速率与进化选择 由于同义替代不引起氨基酸变化,中性选择理论认为它们不受自然选择影 响,因此理解为中性替代速率;非同义替代引起氨基酸变化,它们常常受到纯化 选择( p u r i f y i n gs e l e c t i o n ) 的压力,其替代速率常常比同义替代速率低得多由 于基因功能的巨大差别,以及各个基因在染色体上的位置不同,基因之间各种复 杂的关系不同,不同基因的核苷酸替代速率有时相差很大【加j 。理论上非同义替 代速率在基因间的差异比同义替代速率的差异大。当一个基因没有受到任何外 界选择压力时,它的非同义替代速率应该与同义替代速率相等,这种情况叫中 性选择;大多数基因受到纯化选择压力,其非同义替代速率比同义替代速率低 很多;也有少数基因的非同义替代速率比同义替代速率高,这是因为该基因的 功能正在发生或者已经发生了大的变化之故。这种情况称作达尔文正选择。所 以,基因非同义替代速率与同义替代速率的比较是分子进化研究的重要内容【4 l 】。 生物体内发生的非同义突变大多数属于有害突变,只有少数是中性突变或 有利突变。由于同义突变不改变氨基酸,几乎都是中性突变。对于有害的非同 义突变来说,纯化选择将把它们逐渐筛选,所以其核苷酸替代率k a 将会是一个 比l ( s 低的值,蛐 1 ;如 果发生的非同义突变属于中性突变,其核苷酸替代率k a 将会与融相近,k a k s 。 1 。当然,仅仅通过比较k a 和风还不能确定是否就一定受到选择何种作用,更 为完善的估算方法还有待开发1 4 2 】。 1 2 人类组织特异性基因的进化研究 第四章人类组织特异性基因的选择压力及进化机制探索 组织特异性基因,因其所具有的时空表达特异性而备受关注。通过系统分析 人类组织特异性基因及其在小鼠中的同源基因,计算多种进化选择压力( 如同 义替代率( 融) 、非同义替代率( 勋) 和进化速率) 。结果显示调控通路中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论