版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基因与基因组的结构第三章第一节基因的概念
基因(gene)是原核、真核生物以及病毒的DNA和RNA分子中具有遗传效应的核苷酸序列,是遗传的基本单位。包括编码蛋白质和tRNA、rRNA的结构基因,以及具有调节控制作用的调控基因。
基因从结构上定义,是指DNA分子中的特定区段,其中的核苷酸排列顺序决定了基因的功能。结构基因:具有编码功能的DNA序列。在原核生物中结构基因占整个基因组DNA的大部分,而在真核生物中可能只占一小部分。调节基因:在结构基因之间还含有大量没有编码功能的间隔区,其中包括与复制、转录、翻译过程有关的,能被调控分子识别的序列。乳糖操纵子(lacoperon)的结构调控区CAP结合位点启动序列操纵序列结构基因Z:β-半乳糖苷酶Y:透酶A:乙酰基转移酶ZYAOPDNA基因主要位于染色体上,除了染色体DNA外,细菌的质粒、真核生物的叶绿体、线粒体等细胞器都含有一定的DNA序列,其上大部分是具有遗传功能的基因,这些染色体外的DNA称为染色体外遗传物质。
基因是DNA分子上的结构单位,在染色体或DNA分子上,基因成串排列。一个顺反子就是一段核苷酸序列,能编码一条完整的多肽链。顺反子是DNA分子的功能单位。现代分子生物学文献中,顺反子和基因这两个术语互相通用。一般而言,一个顺反子就是一个基因。基因的主要编码产物是多肽链,另外还包括许多编码RNA的基因,例如rRNA、tRNA以及其他小分子RNA等都是基因编码的产物。
3.对于质粒和其他染色体外成分,如果是自然产生的质粒,用三个正体字母表示,第一个字母大写,例如:PstI;但如果是重组质粒,则在两个大写字母之前加一个p,大写字母表示构建该质粒的研究者或单位。例如:pSC101,(SC代表StanleyCohen),及pMT555(MT代表ManchesterTechnology)。
4.对于酵母,一般用三个大写斜体字母表示基因的功能,后面的数字表示不同的基因座。例如,啤酒酵母基因GAL4,CDC28;其表达的蛋白质则是:GAL4,CDC28。
5.脊椎动物一般用描述基因功能的1~4个小写字母和数字表示其基因功能。例如,基因sey,myc,蛋白Sey,Myc。
6.人类基因的命名方法与脊椎动物相似,但需大写。例如基因是MYC、ENO1,蛋白质则为MYC、ENO1。
第三节真核生物的断裂基因
1977年Berget等首先发现,在真核生物基因组中,基因是不连续的,在基因的编码区域内部含有大量的不编码序列,从而隔断了对应于蛋白质的氨基酸序列。这一发现大大地改变了以往人们对基因结构的认识。这种不连续的基因又称断裂基因或割裂基因(splitgene)。指基因的编码序列在DNA分子上不连续排列,而被不编码的序列所隔开。真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质,这些基因称为断裂基因。1.断裂基因(splitegene)CABD编码区A、B、C、D非编码区2.外显子(exon)和内含子(intron)外显子在断裂基因及其初级转录产物上出现,并表达为成熟mRNA的核酸序列。内含子隔断基因的线性表达而在剪接过程中被除去的核酸序列。鸡卵清蛋白基因hnRNA首、尾修饰hnRNA剪接成熟的mRNA鸡卵清蛋白基因及其转录、转录后修饰目录DNA和相应信使RNA结构上的差异在真核生物中普遍存在,某些低等真核生物的线粒体以及叶绿体基因中也发现有断裂基因,但也有一些真核生物的结构基因不含内含子,如在酵母基因组中大部分的基因是不中断的。断裂基因在细菌中较为少见。断裂基因的内含子无论在数量和大小上都有很大差异,但大多数断裂基因都有共同的性质:外显子在基因中的排列顺序与它在成熟mRNA产物中的排列顺序相同;每种断裂基因在所有组织中都具有相同的内含子成分;核基因的内含子通常在所有的可读框中都含有无义密码子(nonsensecodon),因此一般没有编码功能;在内含子上发生的突变不影响蛋白质的结构,所以其突变往往对生物体没有影响。
第四节基因及基因组的大小
与C值矛盾
外显子的大小与基因的大小并没有必然的联系。基因大小取决于它所包含的内含子的长度。基因大小还与它所包含内含子的数目有关。从低等真核生物到高等真核生物的mRNA和其基因的平均大小略有增加,平均外显子数目的明显增加是真核生物基因的一种标志。真核生物基因组的C值(C-value):指一种生物的单倍体基因组中的DNA总量,以pg表示。不同物种的C值差异很大,最小的支原体只有106bp,而最大的如某些显花植物和两栖动物可达1011bp。
随着生物的进化,生物体的结构和功能越来越复杂,其C值就越大,例如真菌和高等植物同属于真核生物,但后者的C值却大得多。高等生物一般C值高于低等生物,但有例外。即C值反常现象。两栖类比哺乳类高。真核生物含有大量的重复DNA是原因。
C值矛盾(Cvalueparadox)是指真核生物中DNA含量的反常现象。主要表现为:①C值不随生物的进化程度和复杂性而增加;②亲缘关系密切的生物C值相差甚大;③高等真核生物具有比用于遗传高得多的C值。第五节重叠基因一、原核生物的重叠基因
这些重叠在一起的基因表达时使用了不同的阅读框,因此,虽然DNA序列相同,但表达的蛋白质不同。
重叠基因及基因内基因的现象反映了原核生物利用有限的遗传资源表达更多生物功能的能力。
二、真核生物的重叠基因
通常情况下真核生物基因组中很少有重基因。
在一些基因中,选择性的基因表达模式引起了外显子连接途径的转变。所以一个特定的外显子可选择性地与不同的外显子连接形成信使RNA,在一段区域以一种途径表达时作为外显子,而以另一种途径表达时作为内含子。说明一段DNA序列通常可以多种方式发挥作用。在这种选择性产生的两种蛋白质当中,一部分序列相同而其他部分可能不同。
第六节基因组
基因组是指细胞或生物体中,一套完整单体的遗传物质的总和。一、原核生物的染色体基因组
是指其环状或线状的双链DNA分子所含有的全部基因。
E.coli染色体基因组是指存在于E.coli染色体上的全部基因。其双链环状的DNA分子约含4.2×106bp,含4000个基因。
1.细菌的染色体基因组通常仅由一条环状双链DNA分子组成。细菌的染色体相对聚集在一起,形成一个较为致密的区域,称为类核(nucleoid)。类核无核膜与胞浆分开,类核的中央部分由RNA和支架蛋白组成,外围是双链闭环的DNA超螺旋。染色体DNA通常与细胞膜相连,在DNA链上与DNA复制、转录有关的信号区域与细胞膜优先结合,如大肠杆菌染色体DNA的复制起点(OriC)、复制终点(TerC)等。细胞膜在这里的作用可能是对染色体起固定作用,另外,在细胞分裂时将复制后的染色体均匀地分配到两个子代细菌中去。有关类核结构的详细情况目前尚不清楚。
细菌染色体基因组结构的一般特点E.Coli基因图目录
2.具有操纵子结构,其中的结构基因为多顺反子,即数个功能相关的结构基因串联在一起,受同一个调节区的调节。数个操纵子还可以由一个共同的调节基因(regulatorygene)即调节子(regulon)所调控。
3.在大多数情况下,结构基因在细菌染色体基因组中都是单拷贝。但是编码rRNA的基因往往是多拷贝的,这样可能有利于核糖体的快速组装,便于在急需蛋白质合成时细胞可以在短时间内有大量核糖体生成。
4.不编码的DNA部份所占比例比真核细胞基因组少得多。
5.细菌基因组编码顺序一般不会重叠,和病毒基因组不同的。乳糖操纵子(lacoperon)的结构调控区CAP结合位点启动序列操纵序列结构基因Z:β-半乳糖苷酶Y:透酶A:乙酰基转移酶ZYAOPDNA二、真核生物基因组指真核生物基因组,包括染色体基因组和核内染色体外基因,以及细胞质的线粒体、叶绿体基因组等。1.真核生物染色体基因组真核生物单倍体染色体所含有的一整套基因。由于进化程度的不同,不同种类的真核基因组的大小及复杂程度相差很大。存在于细胞核中的染色体DNA为线状双链,分子量较高,并表现C值矛盾。在组成上有单一序列和不同程度的重复序列,不编码基因之间的间隔序列以及基因内的内含子。
真核生物基因组可形成单拷贝、寡拷贝、多拷贝以及断裂基因,有的还具有转座基因。其基因复制在细胞核中以多复制子形式进行,基因表达可在核、质中分别进行,调控机制比原核细胞复杂,功能相关的基因不构成操纵子。真核基因组结构特点(1)真核基因组结构庞大哺乳类动物基因组DNA约3×109碱基对编码基因约有40000个,占总长的6%(2)基因组中不编码区域远远多于编码区域(3)单顺反子单顺反子(monocistron)
即一个编码基因转录生成一个mRNA分子,经翻译生成一条多肽链。(4)重复序列单拷贝序列(一次或数次)高度重复序列(106次)中度重复序列(103~104次)多拷贝序列(5)基因不连续性
真核生物基因组与原核生物基因组区别
真核生物基因组原核生物基因组基因组大小大小不编码区域多少细胞核有无编码区域不连续连续重复序列存在少复制子多单转录产物单顺反子多顺反子2.质粒基因组指某些细菌的染色体外基因组,细菌的质粒DNA呈环状或线状的双链结构,有几十种。质粒基因可通过复制、转录、翻译,从而赋予寄主细胞某种性状。3.线粒体基因组(mtDNA)是双链环状分子。不同生物体中,线粒体DNA的大小,遗传密码有所不同。4.叶绿体基因组叶绿体也属于半自主性的细胞器,其自身的基因产物不能完全满足功能上的需要,必须有核基因产物的协同作用(核质互作)。第七节真核生物DNA序列组织真核生物DNA序列分为4类:单拷贝序列又称非重复序列,在一个基因组中只有一个拷贝。真核生物的大多数基因都是单拷贝的。在复性动力学中对应于慢复性组分。轻度重复序列2~10个拷贝。在复性动力学中也对应于慢复性组分。中度重复序列10~几百个拷贝,一般是不编码序列。中度重复序列可能在基因表达调控中起重要作用。对应于中间复性组分。高度重复序列几百~几百万个拷贝。高度重复序列对应于快复性组分。不同生物中非重复基因占基因组的比例差别很大。原核生物含有完全不重复的DNA,低等真核生物的大部分DNA是非重复的,重复组分不超过20%,且基本是中等重复组分。在动物细胞中,接近一半的基因组DNA是中等或高度重复的组分。植物和两栖动物中的非重复DNA只占基因组的很小一部分,中等和高度重复的组分高达80%。
有研究表明,大约80%的mRNA是与非重复的DNA组分结合的。这也说明大多数结构基因都位于非重复的DNA序列上,换句话说,基因组中的非重复序列决定基因组的复杂性。
第八节基因家族一、基因家族和基因簇基因家族:真核生物基因组中来源相同,结构相似,功能相关的一组基因。在染色体上分布的形式:一些成员在特殊的染色体区域上成簇存在,而另一些则广泛分布在整个染色体上,甚至在不同的染色体上。
基因家族分类:(1)家族中各成员的全序列或至少编码序列具有高度的序列同源性。(2)基因家族是各成员在编码产物上有大段高度保守的氨基酸序列。但家族成员间总的序列相似性较低。超基因家族:其各基因序列间没有同源性,但其表达产物的功能却相似,它们在整体上有相同的结构特征,如免疫球蛋白家族。基因簇:指基因家族中的各成员紧密成簇排列成大段的串联重复单位,定位于染色体的特殊区域。二、基因外的DNA重复序列卫星DNA:有些高度重复DNA序列的碱基组成和浮力密度与主体DNA不同,在氯化绝密度梯度离心时,可形成相对独立于主DNA带的卫星带。卫星DNA由此得名。根据重复单位的大小,分为三类:卫星DNA(satelliteDNA)小卫星DNA(minisatelliteDNA)微卫星DNA(microsatelliteDNA)
卫星DNA由长串联的重复序列组成,一般对应于染色体上的异染色区域。小卫星DNA由中等大小的串联重复序列组成,位于靠近染色体末端的区域,也有分散存在于核基因组的多个位置上的,一般没有转录活性,还有些高变的小卫星DNA,其重复单位之间序列差异很大,但基本核心序列为:GGGCAGGAXG,大多数靠近端粒。另一类小卫星DNA是端粒DNA,主要成分为六核苷酸的串联重复单位TTAGGG,作为一种缓冲成分,在真核生物染色体末端的复制中起重要作用。微卫星DNA是由更简单的重复单位组成的小序列,分散于基因组中,大多数重复单位是二核苷酸,也有少量三或四核苷酸的重复单位。
第九节
分子杂交与印迹技术
MolecularHybridization&
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年医疗废物分类处理考试试题及答案
- 无人机航测企业管理规范岗前培训试题及答案
- 成本控制责任制制度
- 手术室医生安全责任制度
- 扶贫责任制度
- 抓网逃责任制度
- 护理基本护理社会学
- 招标责任制度
- 掘进工岗位责任制度范本
- 搅拌机安全责任制度
- 2025年水轮发电机组项目市场调查、数据监测研究报告
- CAAC无人机理论考试题库(附答案)
- 校长竞聘试题(附答案)
- 勘察设计后续服务保证措施
- 植物向日葵养护知识培训课件
- 2025年汽车驾驶员(技师)考试题库附答案
- 幼儿园课件:《体能大循环的有效开展策略》
- 《人工智能语言与伦理》章节测试题及答案
- (正式版)DB15∕T 4138-2025 《餐饮场所使用醇基燃料消防安全管理规范》
- 中职口腔生理基础教学课件
- 农村应急供水保障技术导则(T-JSGS 010-2023)
评论
0/150
提交评论