生物化学及分子生物学(人卫第九版)-11真核基因与基因组课件_第1页
生物化学及分子生物学(人卫第九版)-11真核基因与基因组课件_第2页
生物化学及分子生物学(人卫第九版)-11真核基因与基因组课件_第3页
生物化学及分子生物学(人卫第九版)-11真核基因与基因组课件_第4页
生物化学及分子生物学(人卫第九版)-11真核基因与基因组课件_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,作者:汤立军,单位:中南大学湘雅医学院,第十一章,真核基因与基因组,第一节真核基因的结构与功能,第二节真核基因组的结构与功能,重点难点,1.基因、基因组的概念2.真核基因的基本结构、真核基因组的结构特点3.顺式作用元件的类型及特点,1.人基因组中重复序列的类型及特点2.多基因家族与假基因的概念,1.线粒体DNA结构2.人基因在染色体上的分布特征,真核基因的结构与功能StructureandFunctionofEukaryoticGenes,第一节,1.真核基因包含编码蛋白质或RNA的编码序列及其与之相关的非编码序列。2.真核基因结构最突出的特点是其不连续性。3.高等真核生物绝大部分编码蛋白质的基因都有内含子,但组蛋白编码基因例外。编码rRNA和一些tRNA的基因也都有内含子。4.外显子与内含子接头处有一段高度保守的序列,即内含子5末端大多数以GT开始,3末端大多数以AG结束,这一共有序列是真核基因中RNA剪接的识别信号。5.人们约定将一个基因的5端称为上游,3端称为下游;将基因序列中开始RNA链合成的第一个核苷酸所对应的碱基记为+1,向5端依次为-1、-2等,向3端依次为+2、+3等。,一、真核基因的基本结构,真核生物断裂基因及两侧序列,基因结构,1.基因编码区中的DNA碱基序列决定一个特定的成熟RNA分子的序列。2.有的基因仅编码一些有特定功能的RNA,如rRNA、tRNA及其他小分子RNA等;大多数基因通过mRNA进一步编码蛋白质多肽链。3.编码序列中一个碱基的改变或突变,可能使基因丧失原有功能或获得新功能。4.有些相同的DNA序列由于其起始位点的变化或mRNA不同的剪接产物可以编码不同的蛋白质多肽链。,二、基因编码区编码多肽链和特定的RNA分子,位于基因转录区前后并与其紧邻的DNA序列通常是基因的调控区,又称为旁侧序列(flankingsequence)。这些调控序列又被称为顺式作用元件(cis-actingelement),包括启动子、上游调控元件、增强子、绝缘子、加尾信号和一些细胞信号反应元件等。,三、调控序列参与真核基因表达调控,真核基因及调控序列的一般结构,1.启动子提供转录起始信号启动子是DNA分子上能够介导RNA聚合酶结合并形成转录起始复合体的序列。大部分真核细胞基因的启动子位于基因转录起点的上游,启动子本身通常不被转录;但有一些启动子(如编码tRNA基因的启动子)位于转录起始点的下游,这些DNA序列可以被转录。真核生物主要有3类启动子,(1)类启动子富含GC碱基对:具有类启动子的基因主要是编码rRNA的基因。类启动子包括核心启动子(corepromoter)和上游启动子元件(upstreampromoterelement,UPE)两部分。(2)类启动子具有TATA盒特征结构:具有类启动子的基因主要是能转录出mRNA且编码蛋白质的基因和一些snRNA基因。类启动子通常是由TATA盒、上游调控元件组成。有的类启动子在TATA盒的上游还可存在CAAT盒、GC盒等特征序列。(3)类启动子包括A盒、B盒和C盒:具有类启动子的基因包括5SrRNA、tRNA、U6snRNA等RNA分子的编码基因。,真核基因三类启动子,2.增强子增强邻近基因的转录增强子是可以增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列。(1)其能够在相对于启动子的任何方向和任何位置(上游或者下游)上发挥增强作用。(2)增强子序列距离所调控基因距离近者几十个碱基对,远的可达几千个碱基对。(3)通常数个增强子序列形成一簇,(4)有时增强子序列也可位于内含子之中。(5)不同的增强子序列结合不同的调节蛋白。,3.沉默子是负调节元件沉默子(silencer)是可抑制基因转录的特定DNA序列,当其结合一些反式作用因子时对基因的转录起阻遏作用,使基因沉默。4.绝缘子阻碍增强子的作用绝缘子(insulator)是基因组上对转录调控起重要作用的一种元件,可以阻碍增强子对启动子的作用,或者保护基因不受附近染色质环境(如异染色质)的影响。绝缘子阻碍增强子对启动子的作用可能通过影响染色质的三维结构如DNA发生弯曲或形成环状结构。,真核基因组的结构与功能StructureandFunctionofEukaryoticGenome,第二节,细胞或生物体的一套完整单倍体遗传物质的总和称为基因组。病毒、原核生物以及真核生物所贮存的遗传信息量有着巨大的差别,其基因组的结构与组织形式上也各有特点,包括基因组中基因的组织排列方式以及基因的种类、数目和分布等。人类基因组包含了细胞核染色体DNA(常染色体和性染色体)及线粒体DNA所携带的所有遗传物质。,人的基因组构成,1.真核基因组中基因的编码序列所占比例远小于非编码序列。2.高等真核生物基因组含有大量的重复序列。3.真核基因组中存在多基因家族和假基因。4.大多基因转录后发生可变剪接,80%的可变剪接会使蛋白质的序列发生改变。5.真核基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞的基因组为二倍体(diploid)。,一、真核基因组具有独特的结构,不同生物体基因组的比较,*指单倍体细胞内的染色体数目,人染色体上基因分布的特征基因在染色体上并不是均匀分布。基因密度最大的是第19号染色体,密度最小的是第13号和Y染色体。染色体上存在着无基因的“沙漠区”,即在500kb区域内,没有任何基因的编码序列。,人的染色体大小示意图,真核细胞基因组存在着大量重复序列。人基因组中,重复序列占基因组长度的50以上。重复序列的长度不等,短的仅含两个碱基,长的多达数百、乃至上千个碱基。重复序列的重复频率也不尽相同。1.高度重复序列(highlyrepetitivesequence)2.中度重复序列(moderatelyrepetitivesequence)3.单拷贝序列(singlecopysequence)或(低度重复序列),二、真核基因组中存在大量重复序列,1.高度重复序列,高度重复序列是真核基因组中存在的、重复频率可达106次以上的短核苷酸重复序列,不编码蛋白质或RNA。(1)高度重复序列按其结构特点分为2类。反向重复序列(invertedrepeatsequence):由两个相同顺序的互补拷贝在同一DNA链上反向排列而成,反向重复的单位长度约为300bp或略短,其总长度约占人基因组的5,多数是散在,而非群集于基因组中。卫星DNA(satelliteDNA):卫星DNA的重复单位一般由210bp组成,成串排列,主要存在于染色体的着丝粒区域,在人基因组中约占5%6%。,1.高度重复序列,(2)主要功能参与复制水平的调节。反向重复序列常存在于DNA复制起点区的附近,是一些蛋白质(包括酶)的结合位点。参与基因表达的调控。高度重复序列可以转录到核内不均一RNA分子中,而有些反向重复序列可以形成发夹结构,有助于稳定RNA分子;参与染色体配对。如卫星DNA成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关。,2.中度重复序列中度重复序列指在真核基因组中重复数十至数千次的核苷酸序列,通常占整个单倍体基因组的1%30%。少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。,依据重复序列的长度,中度重复序列分为两种类型。(1)短分散重复片段(shortinterspersedrepeatsegment,SINES):平均长度约为300500bp,与平均长度约为1000bp的单拷贝序列间隔排列。拷贝数可达数十万。如Alu家族,Kpn家族和Hinf家族等属于这种类型的中度重复序列。(2)长分散重复片段(longinterspersedrepeatsegment,LINES):平均长度为3500bp5000bp,与平均长度为13000bp(个别可达到数万个碱基)的单拷贝序列间隔排列。,Alu家族哺乳类动物包括人基因组中含量最丰富的一种短分散片段,平均每6kbDNA有一个Alu序列在单倍体人基因组中重复达3050万次,约占人基因组的3%6%每个单位长度中有一个限制性内切酶Alu的切点(AGCT),将其切成长130bp和170bp的两段Kpn家族中度重复序列中仅次于Alu家族的第二大家族重复序列中含有限制性内切酶Kpn的位点呈散在分布,拷贝数约为30004800个Hinf家族以319bp长度的串联重复存在于人基因组中重复序列中含有限制性内切酶Hinf的位点,真核生物基因组中的rRNA基因也属于中度重复序列各重复单位中的rRNA基因都是相同的rRNA基因通常集中成簇存在,而不是分散于基因组中,这样的区域称为rDNA区人类的rRNA基因位于13、14、15、21和22号染色体的核仁组织区,每个核仁组织区平均含有50个rRNA基因的重复单位5SrRNA基因似乎全部位于1号染色体,每个单倍体基因组约有1000个5SrRNA基因。,3.单拷贝序列(低度重复序列),单拷贝序列在单倍体基因组中只出现一次或数次,大多数编码蛋白质的基因属于这一类。在基因组中,单拷贝序列的两侧往往为散在分布的重复序列。单拷贝序列编码的蛋白质在很大程度上体现了生物的各种功能。,1.多基因家族(multigenefamily)指由某一祖先基因经过重复和变异所产生的一组在结构上相似、功能相关的基因。(1)基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内。(2)一个基因家族的不同成员成簇地分布于不同染色体上,编码一组功能上紧密相关的蛋白质,如人类珠蛋白基因家族分为珠蛋白和珠蛋白两个基因簇,分别位于第16号和第11号染色体。,三、真核基因组中存在大量的多基因家族和假基因,基因超家族(superfamilygene)一些DNA序列相似,但功能不一定相关的若干个单拷贝基因或若干组基因家族总称,例如免疫球蛋白基因超家族、ras基因超家族。亚家族(subfamily)一个多基因家族中可有多个基因,根据结构与功能的不同又可以分为亚家族。例如G蛋白中属ras超家族约有50多个成员,根据其序列同源性程度又可进一步分为Ras、Rho和Rab三个主要的亚家族。,4.假基因(pseudogene)基因组中存在的一段与正常基因非常相似但一般不能表达的DNA序列,以来表示。假基因根据其来源分为经过加工的假基因和未经过加工的假基因2种类型(1)经过加工的假基因:这类基因可能曾经有过功能,但在进化中获得一个或几个突变,造成了序列上的细微改变阻碍了正常的转录和翻译功能,使它们不能再编码RNA和蛋白质产物;经过加工的假基因通常缺少正常基因表达所需的调节序列、没有内含子、可能有poly(A)尾。(2)未经过加工的假基因:来源于多拷贝或单拷贝基因的突变或者基因的不完全复制。人基因组中大约有2万个假基因,其中约2000个为核糖体蛋白的假基因。近些年发现,假基因也表达有功能的ncRNAs。,1.线粒体DNA(mitochondrialDNA,mtDNA)是细胞内的一种重要细胞器,是生物氧化的场所,一个细胞可拥有数百至上千个线粒体。2.可以独立编码线粒体中的一些蛋白质,是核外遗传物质。3.mtDNA的结构与原核生物的DNA类似,是环状分子。人的线粒体基因组全长16569bp,共编码37个基因,包括13个编码构成呼吸链多酶体系的一些多肽的基因、22个编码mt-tRNA的基因、2个编码mt-rRNA(16S和12S)的基因。,四、线粒体DNA的结构,人的线粒体基因组,通过基因组测序,人们对数种生物的基因组大小和所含有的基因数量有所了解。1.总体上来讲,在进化过程中随着生物个体复杂性的增加,基因组的总趋势是由小变大、基因数也是由少变多。2.决定生物复杂性的因素:基因组大小、基因数、基因密度(genedensity)等。人的基因组最大,复杂程度也最高,但所含的基因数量并不是最多。人的基因数目为2万个左右,仅比果蝇基因数量的1.5倍稍多,与线虫基因数量大致相当;人具有而鼠没有的基因只有300个。人类基因组基因密度较低,因为基因组中转座子、内含子和调控序列较多,这些序列在进化过程对遗传多样性的产生至关重要。,五、人基因组约有两万个蛋白质编码基因,1.基因是能够编码蛋白质或RNA等具有特定功能产物的、负载遗传信息的基本单位,除了某些以RNA为基因组的RNA病毒外,通常是指染色体或基因组的一段DNA序列。2.基因的基本结构包含编码蛋白质或RNA的编码序列及其与之相关的非编码序列。3.基因组是指一个生物体内所有遗传信息的总和。真核基因组具有基因编码序列在基因组中所占比例小于非编码序列、高等真核生物基因组含有大量的重复序列、存在多基因家族和假基因、具有可变剪接,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论