基因组学课件5基因组序列的诠释.ppt_第1页
基因组学课件5基因组序列的诠释.ppt_第2页
基因组学课件5基因组序列的诠释.ppt_第3页
基因组学课件5基因组序列的诠释.ppt_第4页
基因组学课件5基因组序列的诠释.ppt_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,5基因组序列的诠释,2,3,问题,基因组序列所包含的全部遗传信息是什么?基因组作为一个整体如何行使其功能?用什么方法寻找基因,研究基因的功能呢?,4,基因组序列的诠释,研究基因组的最终目的不是为了仅仅得到基因组的全部序列,而是诠释基因组所包含的信息和基因组功能。在这一部分中,我们主要探讨利用什么方法来搜寻基因和研究基因组的功能1.在基因组中搜寻基因根据顺序分析搜寻基因实验分析确认基因2.基因功能的测定,5,A起始密码子ATGB信号肽分析C终止密码子D3端的确认E非编码序列、内含子F密码子偏爱性G外显子内含子边界H上游调控序列I软件预测,5.1在基因组中搜寻基因根据序列分析搜寻基因,6,5.1在基因组中搜寻基因,在获得基因组或DNA序列后,可以采用人工或计算机序列筛选的方法来获得基因。目前,使用比较多的方法是ORF(openingreadingframes)扫描ORF:每个编码蛋白的基因都含有ORF,它是由一系列密码子组成,通常以ATG开始,TAA、TGA、TAG结束。通过寻找起始密码子和终止密码子的ORF序列是寻找基因的一种重要的方法寻找ORF的成功的关键在于终止子在DNA序列中出现的频率,7,5.1在基因组中搜寻基因,终止子出现的频率与CG含量之间的关系,8,5.1在基因组中搜寻基因,高等真核生物DNA的ORF的阅读障碍:基因间存在大量非编码序列(人类基因组占70%)很多基因含有内含子由于多数外显子长度50%终止密码子每100200bp出现一次由于多数基因ORF均多于50个密码子,因此最可能的选择应该是ORF不少于100个密码子,13,D3端的确认3端的确认主要根据Poly(A)尾序列,若测试DNA片段不含Poly(A)序列,则根据加尾信号序列“AATAAA”和BLAST同源性比较结果共同判断,14,E非编码序列、内含子高等真核生物多数外显子长度少于100个密码子,有的不到50个密码子甚至更少,15,F密码子偏爱性编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同不同种属间使用同义密码的频率有很大差异,如人类基因中,丙氨酸(Ale)密码子多为GCA,GCC或GCT,而GCG很少使用,16,G外显子内含子边界外显子和内含子的边界有一些明显的特征如:内含子的5端或称供体位(donorsite)常见的顺序为5-AGGTTAAGT-33端又称受体位(acceptorsite),多为5PyPyPyPyPyPyCAG-3(Py:嘧啶核苷酸,T或C),17,H上游调控序列几乎所有基因(或操纵子)上游都有调控序列,它们与DNA结合蛋白作用,控制基因表达通过同源性比较来预测mRNA的5端,最常用的与转录起始位点相关的数据库是真核启动子数据库(TheTRADATProject,EukaryoticPromoterDatabase,EPD.http:/www.epd.unil.ch/)另外个别生物基因组的特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有CpG岛,18,I软件预测采用NCBI的ORF预测软件(ORFfinder:/gorf/orfig.cgi)判断ORF的可能范围,19,5.1在基因组中搜寻基因,适用于高等真核生物基因组的ORF扫描方法:上游调控序列(upstreamcontrolsequence):上游调控序列和外显子-内含子边界一样具有显著特征,这些特征是参与基因表达的DNA结合蛋白的识别信号。但真核的变化也较大同源查询(homologysearch):利用已存入数据库中的基因序列与待查基因组序列进行比较,从中查找可与之匹配的碱基顺序及其比例用于界定基因的方法孤独基因(orphangene):指在基因分类时缺少同源顺序的ORF,20,5.1在基因组中搜寻基因,实验分析确认基因分子杂交可确定DNA片段是否含有表达顺序Northernblot:指将待测DNA样品标记后与RNA杂交,以判断RNA中是否含有DNA的转录产物。但在操作中存在一些问题Zooblot:一些亲缘关系相近的物种,其基因的编码区相似性较高,而非编码区的同源性很低。则可以某一物种的DNA序列与来自另一亲缘种的DNA片段杂交,如产生阳性信号,则该区段可能含有1或多个基因,21,22,5.1在基因组中搜寻基因,DNA顺序中基因位置的确定Northernblot和Zooblot可以判断DNA片段中是否含有基因,但是不能给出基因定位信息。获得基因定位信息的最容易的方法是cDNA测序cDNA测序受两个方面的影响:一是相关cDNA在cDNA文库中出现的频率;二是cDNA的完整性,23,5.1在基因组中搜寻基因,如何获取基因全长cDNA序列?确定其在基因组中的位置?AcDNA文库构建BRACE技术C通过对全长cDNA序列的测序、对比,以及与基因组DNA的比较,确定基因所在的区域;通过物种已建立遗传图和物理图来确定基因的位置;,24,cDNA文库构建(CLONTECH),25,cDNA文库构建,26,5RACE(CLONTECH),27,3RACE(CLONTECH),28,一.利用计算机分析基因功能二.实验分析确定基因功能三.其他的基因功能研究方法四.主要技术及原理方法,5.2基因功能的测定,29,一.利用计算机分析基因功能1.同源性确定基因功能2.同源性分析在酵母基因组计划中的应用,5.2基因功能的测定,30,1.同源性确定基因功能,同源基因都拥有一个共同的祖先基因,它们之间有许多相似的序列。同源基因可以分为2类:种间同源基因或直系基因(orthologousgene):指不同物种之间的同源基因,它们来自物种分化以前的共同祖先种内同源基因或平行基因(paralogousgene)同一物种内的同源基因,它们常常是多基因家族的不同成员,其共同祖先可能存在于物种形成以后,也可能存在于物种形成之前,31,同源基因一般不会有完全一致的核苷酸序列,因为不同的基因或不同的生物都会独立地发生随机突变,但它们有相似的序列,大部分未突变的核苷酸位置是相同的当一个新基因的序列被确认后,根据同源性可以从数据库中查找已知序列的同源基因。根据进化的相关性,可以根据已知的同源基因推测新基因的功能同源性分析可以给出整个基因或其中某一区段功能的有关信息,32,2.同源性分析在酵母基因组计划中的应用,酵母基因组大约含有6000个基因,30是通过传统遗传学分析得到的,另外70是用同源性分析获得,33,二.实验分析确定基因功能1.基因失活在基因功能分析的作用2.基因的超表达用于功能检测,5.2基因功能的测定,34,基因的功能是一个过程,是从基因到表型的一系列生理生化反应过程。现在的基因功能研究与传统的遗传分析正好相反,传统的遗传分析是从表型出发最终到达基因(正向遗传学),而在基因组计划中研究基因功能则是从基因出发,最终到达表型(反向遗传学)。因此必须寻找一系列的实验方法来鉴别与目标基因相关的表型基因失活是基因功能分析的主要手段,1.基因失活在基因功能分析的作用,35,基因失活基因剔除(knock-out)反义RNA技术转座子插入突变,36,5.2基因功能的测定,基因剔除(knock-out)最简单的基因失活方法,将一段无关的DNA片段用来取代目标基因。主要原理:用一段无关的核苷酸序列取代目标基因的中间序列,并将其导入生物体内或目的细胞内,如果该基因所控制的表型变化了,就从反面验证了目标基因的功能。,37,反义RNA技术反义RNA由基因的负链(模板链的互补链)编码,可以与由功能基因转录而成的正义RNA形成双链结构,干扰mRNA的翻译,从而干扰基因的表达将基因的编码序列反向插入表达载体,转化目标生物,获得转基因个体或品系后,进一步分析表达的反义RNA在生理生化或形态发生中所起的作用,由此判别目标基因的功能转座子插入突变将转座子随机插入功能基因内,使其失活,也可以用于基因功能研究。,38,2.基因的超表达用于功能检测,在正常情况下,基因产物的数量是有限制的,必须与其它基因的产物平衡,某一基因产物的过量和不足都会破坏这种平衡,造成生长和发育的异常有两种技术可以使细胞中某一基因过量表达:增加基因的拷贝数;采用强启动子,39,5.2基因功能的测定,许多蛋白质必须与其他蛋白质互作,才能表现其功能,当鉴定了这类蛋白质的某些成员,则可采用某些方法分离与之互作的其他蛋白质噬菌体展示(phagedisplay)酵母双杂交(yeasttwo-hybridization),三.其他的基因功能研究方法,40,5.2基因功能的测定,噬菌体展示检测的基因与噬菌体外壳蛋白基因融合,表达后可产生融合外壳蛋白,当噬菌体遇到可与融合外壳蛋白互作的蛋白质时会发生聚合,41,5.2基因功能的测定,酵母菌双杂交系统真核生物中,转录因子与基因上游的特定DNA序列结合,然后激活RNA聚合酶,起始RNA的合成。转录因子有2个重要的功能区域,一个与启动子区域的DNA序列结合,另一个与RNA聚合酶的激活有关。有些转录因子中的这2个片段即使分割开来,仍然可以在同一个细胞内相互作用,装配成一个完整的、有功能的转录因子。,42,酵母菌双杂交系统中,将编码这2个功能域的DNA分别构建在2个独立的表达载体上。在一个表达载体中,DNA结合功能域的基因片段与待测蛋白质的基因连接成融合基因。在另一个载体中,RNA聚合酶激活功能域的基因片段与未知的DNA序列连接成融合蛋白基因。将这2个表达载体同时转化一个细胞,并在细胞内表达,如果DNA结合功能域蛋白与同RNA聚合酶激活功能域蛋白之间能够互作,就会启动报告基因的表达。,43,四主要技术及原理方法,4.1基因剔除(knock-out)最简便的基因失活的方法.主要原理:在一段无关DNA片段的两侧连接与代换基因两侧相同的顺序,将这一构建导入目的细胞,由于同源片段之间的重组,可使无关片段取代靶基因,整合到染色体中.为了便于筛选,用于取代的外源DNA中含有报告基因.,44,tk胸苷激酶标记基因gangcyclovirneor新霉素抗性基因G418,45,46,4.2基因超表达通过增加基因的拷贝数和采用强启动子促使基因超表达,致使受体表现出生长与发育的异常,来研究基因的功能.,47,4.3反义RNA,反义RNA是由基因的负链编码,可与正义RNA(senseRNA)或DNA编码顺序结合,干扰mRNA的转录,加工和转运,调控基因的表达.,48,构建反义RNA表达载体:将全目的基因或部分目的基因反向插入表达载体转化目标生物获得转基因个体或品系分析转基因植株在生理、生化、形态等方面的变异判别目的基因的功能,49,正义表达载体,反义表达载体,50,反义RNA作用机理:A干扰翻译的起始与延伸,可与翻译起始顺序及编码序列结合形成双链RNA,随之被细胞降解。B与mRNA的引导顺序结合,阻止核糖体的附着,使翻译无法启动。C反义RNA与mRNA形成双链分子后,使RNA多聚酶脱离模板,转录终止。,51,4.4RNAi干扰,RNAi干扰是通过双链RNA的介导,特异性地降解相应序列的mRNA,从而阻断相应基因表达的转录后水平的基因沉默机制.,52,RNAi作用机理,AdsRNA核酸内切酶Dicer被激活,它把dsRNA加工成21-25个核苷酸长的RNA链;B这些小片段RNA(siRNA)作为另一个核糖核酸复合体RISC(RNA-inducesilencingcomplex,RNA诱导沉默复合体)的指引物,结合到RISC上,使之识别并降解mRNA,从而导致与双链RNA同源的基因沉默;,53,54,RNAi设计方法及应用AFraser合成与开放读码框相对应的双链RNA或利用细菌克隆表达这些双链RNA微量注射/喂食干扰同源基因的表达BChuang等设计出嵌合体结构连接强启动子大量表达双链mRNA干扰同源基因的表达,55,HbF基因的RNAi载体构建,56,RNAi技术的优缺点,RNAi最根本的特点是特异性RNAi具有特殊的穿越能力,如将双链RNA注射在线虫性腺里,它也会干扰到体细胞里的基因表达,而且干扰作用会传给后代;对一些低水平表达的基因,RNAi现象并不明显RNAi能同时作用于几个有相同或相似序列的基因,57,4.5酵母双杂交(yeasttwo-hybridization),原理:其原理涉及转录因子与启动子之间的互作。转录因子(包括两个功能区域)结合功能域同基因上游的区段结合激活功能域激活RNA多聚酶将基因转录为mRNA,58,酵母杂交系统中:融合表达载体1融合表达载体2,DNA结合功能域+目的片段,激活功能域+多种未知cDNA,融合表达载体1同一细胞融合表达载体2,形成聚合物,启动报告基因的表达,表达载体共转化,59,60,5.3从基因组到细胞,转录本组transcriptomeDNA芯片分析SAGE蛋白质组proteome,61,DNA芯片分析芯片表面原位直接合成寡聚核苷酸,一百万个寡聚核苷酸/cm2荧光标记样品cDNA,杂交,扫描,根据杂交位置确定序列一次实验可同时检测成千上万个基因的表达谱,可提供大量有关基因相互作用的信息,62,SAG

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论