微生物研究进展chapter2-3 微生物基因组学研究进展.ppt_第1页
微生物研究进展chapter2-3 微生物基因组学研究进展.ppt_第2页
微生物研究进展chapter2-3 微生物基因组学研究进展.ppt_第3页
微生物研究进展chapter2-3 微生物基因组学研究进展.ppt_第4页
微生物研究进展chapter2-3 微生物基因组学研究进展.ppt_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章微生物基因组学研究进展,第一节微生物基因组与生物信息学第二节微生物基因信息的分析第三节芯片技术在微生物学领域的应用,农学系生物技术专业课程微生物学研究进展,第二节微生物基因信息的分析,一、微生物基因组信息的获得二、基因组序列诠释,一、微生物基因组信息的获得,1、基因组测序及数据处理,DNA测序的一般方法序列的组装,2、从网络数据库获得基因组信息,DNA测序的一般方法链终止法测序化学降解法测序自动化测序非常规DNA测序,链终止法测序(thechainterminationmethod)基本原理:通过合成与单链DNA互补的多核苷酸链,由于合成的互补链可在不同位置随机终止反应,产生只差一个核苷酸的DNA分子,从而来读取待测DNA分子的顺序。,技术路线与要求,制备单链模板将单链模板与一小段引物退火加入DNA多聚酶4种脱氧核苷酸分别加入少量4种双脱氧核苷酸将4种反应产物分别在4条泳道电泳根据4个碱基在4条泳道的终止位置读出基因序列,A克隆于质粒中DNA用碱或热变性BM13克隆单链DNAC噬粒克隆DNADPCR产生单链DNA,A高酶活性B无53外切酶活性C无35外切酶活性,ddATP/ddCTP/ddGTP/ddTTP的3碳原子连接的是氢原子,不是羟基,化学降解法测序基本原理:在选定的核苷酸碱基中引入化学集团,再用化合物处理,使DNA分子在被修饰的位置降解.,技术路线,将双链DNA样品变为单链每个单链的同一方向末端都用放射性同位素标记,以便显示DNA条带分别用不同方法处理,获得只差一个核苷酸的降解DNA群体电泳,读取DNA的核苷酸顺序,自动化测序,基本原理与链终止法测序原理相同,只是用不同的荧光色彩标记ddNTP,如ddATP标记红色荧光,ddCTP标记蓝色荧光,ddGTP标记黄色荧光,ddTTP标记绿色荧光.由于每种ddNTP带有各自特定的荧光颜色,而简化为由1个泳道同时判读4种碱基.,非常规测序毛细管电泳用毛细管电泳取代聚丙烯凝胶平板电泳,节省时间,加快测序进程,其他程序同链终止法或化学测序法.光点测序脱氧三磷酸核苷酸连接到DNA3-末端时会释放1个焦磷酸(PPi),焦磷酸在磷酸化酶的作用下转化为化学能,并发出光亮.由此,往反应液中每次只加入1种核苷酸,当加入的核苷酸结合时,反应液发出亮点,并记录核苷酸种类;当核苷酸未结合时,反应液中的核苷酸酶迅速分解此核苷酸,由此来测定DNA序列.,DNA测序胶图,支持毛细管阵列电泳、DNA芯片等的测序技术的发展;,DNA芯片测序基本原理将各种排列顺序的寡核苷酸点播在芯片上,每个点播的寡核苷酸在排列的方阵中都有指定的位置.待检测的DNA分子与芯片温浴,凡是能杂交的寡核苷酸都会在确定位置发出信号,然后根据获取的信息将寡核苷酸的顺序进行对比组装,拼接成完全的DNA顺序.,利用基因芯片进行杂交测序的原理,序列的组装,随机测序与序列组装随机测序也称”鸟枪法”.序列组装原理:直接从已测序的小片段中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸.优点:不需预先了解任何基因组的情况.,A,B,C,A,B,C,A,B,C,A,B,C,小片段测序,计算机拼装,A,B,C,小片段测序,计算机拼装,鸟枪法(Shotgun)测序的问题,CAATGCATTAGCAGCCAATGC,GAP,错装,Shotgun法序列拼接,SequenceGap,实例:流感嗜血杆菌基因组的测序及顺序组装,超声波打断纯化的基因组DNA琼脂糖电泳收集1.62.0Kb的区段、纯化构建到质粒载体中随机挑选19687个克隆,进行28643次测序,得到可读顺序为11631485bp组装成140个覆盖全基因组范围的独立的顺序重叠群,各重叠群间仍有间隙顺序间隙物理间隙,载体或宿主菌选用不当而被丢失的顺序,测序时遗漏的测序,解决办法:通过相邻已知顺序作为探针筛选已有的基因组文库,解决办法:利用其它宿主菌与载体重新构建文库,限制测序,限制测序:是指将一段染色体区段的DNA顺序进行组装.一些已绘制了遗传图与物理图的微生物基因组测序中也采用这一方法.如高等植物拟南芥基因组的测序完全依据克隆重叠群,先进行各个BAC克隆的随机测序,再进行序列组装;水稻基因组测序计划采取得策略与此相同.,2000年6月公共领域测序计划工作框架图,指导测序与序列组装,建立在基因组图谱基础上的”鸟枪法”,即所谓”指导鸟枪法”或”指导测序”。,先将染色体打成比较大的片段(几十-几百Kb),利用分子标记将这些大片段排成重叠的克隆群(Contig),分别测序后拼装.这种策略叫基于克隆群(contig-based)的策略.,A,B,C,A,B,C,大片段contig,小片段测序拼装,两种策略的比较,鸟枪法策略指导测序策略不需背景信息构建克隆群(遗传、物理图谱)时间短需要几年的时间需要大型计算机得到的是草图(Draft)得到精细图谱,其他测序路线,重要区域优先测序人们对感兴趣的基因或与疾病相关的基因优先测序.如:人类主要组织相容性复合区位于第6号染色体,与人类免疫系统有关,因而优先测序.,EST(Expressedsequencetag)测序EST是一种重要的基因组图分子标记,以EST为探针很容易从cDNA文库中筛选全基因,又可从BAC克隆中找到其基因组的基因序列.优点:AmRNA可直接反转录成cDNA,而且cDNA文库也比较容易构建;B对cDNA文库大量测序,即可获得大量EST的序列;CEST为基因的编码区,不包括内含子和基因间区域,一次测序的结果足以鉴定所代表的基因;,序列的组装,大规模测序的每一个环节都与数据分析紧密相关过程复杂、工作量大有效的数据分析算法与软件,大规模测序中的数据分析,大规模测序及数据分析过程,LocusLink基因和蛋白质信息的概括性资源【NCBI】RefSeq最稳定、最被承认的基因和蛋白质的序列【NCBI】UniGene给出基因序列、以及图谱信息、同源基因、表达信息【NCBI】Entrez用于提取序列信息,很好的查询、提取和显示系统【NCBI】Ensemble与Entrez同样功能的系统【EBI】ExPASy用于获取蛋白质及其相关数据【SIB】(SwissInstituteofBioinformatics)EveryroadleadstoRome!,2、从网络数据库获得基因组信息,例子:E.coliK-12基因组,以使用Entrez进行查询为例,查询EscherichiacoliK12基因组的信息:,DNApolymeraseII,二、基因组序列诠释,第二节微生物基因信息的分析,1.寻找基因2.获取基因全长cDNA序列3.实验确认基因功能4.微生物基因组信息的分析,是遗传信息的物理和功能单位,包含产生一条多肽链或功能RNA所必需的全部核苷酸序列。基因分类:编码RNA的基因,如rRNA基因,snRNA基因等;编码蛋白质的基因,基因,基因的不连续性,Intron和Exon:大多数真核生物蛋白质基因的编码顺序(Exon)都被或长或短的非编码顺序(Intron)隔开,重叠基因:同一段DNA能携带两种不同蛋白的信息.,重迭基因有以下几种情况:*一个基因完全在另一个基因内部*部分重叠*两个基因共用少数碱基对,*一个基因完全在另一个基因内部如:B和A,E和D其读码结构互不相同,*部分重叠如:K和C*两个基因共用少数碱基对如:D和J,-TAATG-,D终止密码子,J起始密码子,问题,基因组序列所包含的全部遗传信息是什么?基因组作为一个整体如何行使其功能?用什么方法寻找基因,研究基因的功能?,主要内容:,寻找基因获取基因的全长cDNA序列确定DNA顺序中基因的位置研究基因的功能基因表达蛋白质组学,1.寻找基因,根据开放读码框预测基因起始密码子ATG第一个ATG的确定则依据Kozak规则;Kozak规则是基于已知数据的统计结果,所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律。,若将第一个ATG中的碱基A,T,G分别标为1,2,3位,则Kozak规则可描述如下:第4位的偏好碱基为G;ATG的5端约15bp范围的侧翼序列内不含碱基T;在-3,-6和-9位置,G是偏好碱基;除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基。,信号肽分析信号肽分析软件(SignalPhttp:/www.cbs.dtu.dk/services/SignalP/)把预测过程中证实含完整mRNA5端的Contig翻译为蛋白序列;然后用SignalP软件对前50个氨基酸序列(从第一个ATG对应的甲硫氨酸Met开始)进行评估,如果SignalP分析给出正面结果,则测试序列有可能为信号肽;假如在该测试序列的第一个Met5端存在终止密码子,该序列为信号肽的可能性更大。,终止密码子终止密码子:TAA,TAG,TGAGC%=50%终止密码子每64bp出现一次;GC%50%终止密码子每100200bp出现一次,3端的确认3端的确认主要根据Poly(A)尾序列,若测试Contig不含Poly(A)序列,则根据加尾信号序列“AATAAA”和BLAST同源性比较结果共同判断。,非编码序列、内含子高等真核生物多数外显子长度不少于100个密码子,有的不到50个密码子甚至更少。,密码子偏爱性编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同。不同种属间使用同义密码的频率有很大差异,如人类基因中,丙氨酸(Ale)密码子多为GCA,GCC或GCT,而GCG很少使用。,外显子内含子边界外显子和内含子的边界有一些明显的特征,如:内含子的5端或称供体位(donorsite)常见的顺序为5AGGTTAAGT-3;3端又称受体位(acceptorsite),多为5PyPyPyPyPyPyCAG-3(“Py”嘧啶核苷酸,T或C);,上游控制顺序几乎所有基因(或操纵子)上游都有调控序列,它们可与DNA结合蛋白作用,控制基因表达。另外个别生物的基因组特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有CpG岛。,软件预测采用NCBI的ORF预测软件(ORFfinder:/gorf/orfig.cgi)判断ORF的可能范围。,mRNA的5端即转录起始位点区通过同源性比较来预测mRNA的5端,最常用的与转录起始位点相关的数据库是真核启动子数据库(TheTRADATProject,EukaryoticPromoterDatabase,EPD.http:/www.epd.unil.ch/)。,同源查询途径通过已存入数据库中的基因顺序与待查的基因组序列进行比较,从中查找可与之匹配的碱基顺序及其比例,用于界定基因的方法称为同源查询。,同源有如下几种情况:ADNA序列某些片段完全相同;B开放读码框(ORF)排列类似,如有长外显子;C开放读码框翻译成氨基酸序列的相似性;D模拟多肽高级结构相似,试验分析Northern杂交确定DNA片段是表达序列:注意事项:a当某一基因的转录产物进行可变剪接时,由于连接的外显子不同,会产生好几条长度不一的杂交带,如果该基因是某一基因家族的成员也会出现多个信息;b考虑组织专一性和发育阶段的问题。,C基因表达产物丰度的问题如果风度较低,用拟Northern杂交和动物杂交(Zoo-blotting)分析。拟Northern杂交根据已知的DNA顺序设计引物,从mRNA群体中扩增基因产物,再以DNA为探针与之杂交。,动物园杂交根据亲缘关系相似的物种,其基因的编码区相似性较高,而非编码区的同源性很低的原理。如果某一物种的DNA顺序与来自另一亲缘物种的DNA片段杂交产生阳性信号,该区段可能含有1个或多个基因,这种方法又称为动物园杂交。,2.获取基因全长cDNA序列,A构建cDNA文库,用目的基因DNA片段筛选文库。B根据已知片段设计引物,RACE技术得到基因的全长cDNA序列。,cDNA文库构建,cDNA文库构建,5RACE,3RACE,3.实验确认基因功能,基因敲除(knock-out)最简便的基因失活的方法.主要原理:在一段无关DNA片段的两侧连接与替换基因两侧相同的顺序,将这一构建导入目的细胞,由于同源片段之间的重组,可使无关片段取代靶基因,整合到染色体中。为了便于筛选,用于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论