基因、基因组和基因组学-.ppt_第1页
基因、基因组和基因组学-.ppt_第2页
基因、基因组和基因组学-.ppt_第3页
基因、基因组和基因组学-.ppt_第4页
基因、基因组和基因组学-.ppt_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,2.1 基因的结构与功能,基因的概念是不断发展和更新的,在遗传学发展的不同阶段,基因有着不同的定义和内涵,基因概念的每次更新和丰富均是遗传学和生物学的一次革命和飞跃。,1865年,遗传学奠基人 Mendel 遗传因子,认为遗传因子是一个遗传单位,可以决定从亲代遗传给子代的性状; 1909年,丹麦遗传学家Johanson 用基因取代了Mendel的遗传因子,认为遗传因子就是基因;,1,2,1910年,Morgan 果蝇杂交实验 果蝇眼睛颜色(白色)与性别(雄性)相互连锁-认识到基因在染色体上,是位于染色体上的实体物质;基因是一个遗传、交换和突变的单位; 1941年,Beadle和Tatum提出“一个基因一个酶”学说,认为基因在染色体上并决定蛋白质; 1944年Avery转化,1952年Hershey和Chase实验证明DNA是遗传信息的携带者,是遗传物质。 1953年Watson和Crick DNA双螺旋结构模型全面揭示了DNA的化学性质,并解决了当时困扰生物学家的基因复制和遗传的难题。,2,3,现代分子遗传学关于基因的概念,(1)现代基因概念 DNA分子中含有特定遗传信息的核苷酸序列,是合成有功能蛋白质或RNA所必需的全部DNA序列(除部分病毒RNA),即一个基因不仅包括编码蛋白质或RNA的核苷酸序列,还包括为保证转录所必需的调控序列。,3,4,(1)具有转录和翻译功能,编码蛋白质的基因。包括结构基因和调节基因;,结构基因可被转录形成 mRNA,并转译成多肽链,构成各种结构蛋白质,催化各种生化反应的酶和激素等。 调节基因某些可调节控制结构基因表达的基因。其突变可影响一个或多个结构基因的功能,或导致一个或多个蛋白质(或酶)量的改变。,2.1.1 基因的分类,4,5,5,(2)只有转录功能而没有翻译功能的基因,包括tRNA基因和rRNA基因。 (3)不转录的基因,它对基因表达起调节控制作用,包括启动基因和操纵基因。,6,开放阅读框架 (open reading frame,ORF):在DNA链上,由蛋白质合成的起始密码开始,到终止密码为止的一个连续编码序列。 (1)编码区 能够编码产生蛋白质的序列,包括外显子与内含子; (2)前导区 位于编码区上游,相当于mRNA5端非编码区; (3)调节区 包括启动子和增强子等基因编码区的两侧;,2.1.2 基因的结构,6,7,基因的几种特殊形式,跳跃基因(jumping gene) 指可在DNA分子间进行转移的DNA片段。也称为转座遗传因子,转座元件或转座基因。 重复基因:指在同一个基因组中存在2个或者2个以上拷贝的基因,一般来源于基因组内的不等交换、反转录插入及大规模的染色体片段重复等。,:,7,8,断裂基因(splite gene),指基因的编码序列在DNA分子上是不连续排列的,而是被不编码的序列所隔开; 编码序列称外显子(exon),非编码序列称内含子(intron);,因发现断裂基因,1993年获诺贝尔奖,8,9,所谓重叠基因(overlapping gene)是指两个或两个以上的基因共有一段DNA序列;也即同一DNA序列可以得到不同的mRNA,从而编码多种具有部分重叠序列的蛋白质的基因。 某些原核生物、病毒或噬菌体 1977年,Sanger 在研究X174时发现,重叠基因,9,10,基因重叠的方式,(1)一个基因完全在另一个基因里面。 (2)几个基因部分重叠。 (3)两个基因之间只有一个碱基重叠。,噬菌体X174的重叠基因,10,11,重叠基因的DNA序列可能大部分相同,但由于翻译时的读码框架不同、或起始部位不同而产生不同的蛋白质。 有些真核病毒的部分序列,对某一个基因来说是内含子,而对另一个基因而言却是外显子。,11,12,假基因(pseudogene)具有与功能基因相似的序列,但由于有许多突变以致失去了原有的功能,不能转录或转录后生成无功能的蛋白质的基因,常用表示。,假基因,12,13,2.1.3 基因的功能,传递遗传信息,控制个体性状表现。,13,14,基因组(genome):一个细胞内的全部遗传信息,包括所有基因和基因间的区域,原核生物(prokaryote)和真核生物(eukaryote)的基因组都是DNA 病毒基因组有的是DNA,有的是RNA,基因组(原核生物和真核生物),2.2 基因组的结构和功能,染色体基因组(chromosomal genome) 染色体外基因组(extrachromosomal genome) 如:细菌的质粒(plasmid)DNA 真核生物的线粒体(mitochondria)DNA 叶绿体(chloroplast)DNA,15,基因组大小(DNA含量)用C值表示; C值 (C-value):一种生物体单倍体基因组DNA的总量,用以衡量基因组的大小。,通常,进化程度越高的生物其基因组越大,但从总体上说,生物基因组的大小同生物在进化上所处地位的高低无关。 存在 C-value paradox (C值悖论)。 生物复杂性越高,其基因的密度越低。,15,16,基因组大小与C值矛盾,C值矛盾:生物体的进化程度与基因组大小之间不完全成比例的现象(又称:C值悖论,C value paradox ),17,C-value paradox,equal genome size,toad Xenopus and human being have genomes of essentially the same size. But we assume that human is more complex in terms of genetic development!,17,18,表2-1 不同生物体基因组中基因的比较,18,19,2.2.1 病毒基因组的结构与功能,19,20,病毒基因组的多样性,20,21,病毒基因组的大小,与细菌或真核细胞相比,病毒的基因组很小。 不同的病毒之间基因组大小相差很大。 乙肝病毒DNA:3kb,编码4种蛋白质; 痘病毒的基因组:300kb,编码几百种蛋白质。,病毒基因组的大小通常与其对宿主的依赖程度有关,基因组越大,依赖性越小。,21,22,RNA 病毒基因组编码序列具有节段性,有些病毒的基因组 RNA由不连续的几条核酸链组成(如流感病毒,轮状病毒等)。 分段基因组的病毒一般感染效率较低 ; 分段基因组容易发生重组,故病毒容易变异 。 目前未发现DNA病毒有此状况。,22,23,病毒基因存在基因重叠,基因重叠:同一段DNA片段能够参与编码两种甚至两种以上的蛋白质分子。 这种现象在其它的生物细胞中仅见于线粒体和质粒DNA。此结构意义在于使较小的基因组能够携带较多的遗传信息。,23,24,病毒基因组的大部分序列具有编码功能,病毒基因组的大部分是用来编码蛋白质的,只有非常小的一部分没有编码翻译功能。 X174基因组中不编码的序列只占217/5375 乳头瘤病毒基因组约8.0Kb,其中不编码的部分约为1.0kb。 少数真核生物病毒的基因组也存在内含子结构。,24,25,病毒基因组的转录单元是多顺反子,多顺反子 mRNA (polycistronie mRNA) :病毒基因组DNA序列中功能上相关的蛋白质的基因或 rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录成含有多个 mRNA 的分子。,25,26,噬菌体X174,X174 基因组中的 D-E-J-F-G-H 基因转录在同一个mRNA中,然后再翻译成各种蛋白质, 其中、F、G及H 编码外壳蛋白,D 蛋白与病毒的装配有关,E 蛋白负责细菌的裂解, 它们在功能上是相关的。,26,27,病毒基因组都是单倍体,除了逆转录病毒以外,一切病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。 逆转录病毒带有逆转录酶,能使RNA反向转录生成DNA,因此其基因组可拥有两个拷贝。,27,28,噬菌体基因具有连续性,噬菌体的基因是连续的,而真核细胞病毒的基因是不连续的,具有内含子。,28,29,2.2.2 原核生物基因组的结构与功能,原核生物基因组通常比较简单,其基因组大小在106bp107bp之间,所包含的基因数目几百个到数千个之间。 原核生物基因组通常由一条环状的双链DNA分子组成,在细胞中与蛋白质结合成染色体的形式,在细胞内形成一个致密的区域,称为 类核(nucleoid).,29,30,大肠杆菌的类核结构模型,30,31,31,32,大肠杆菌染色体基因组的结构和功能,大肠杆菌基因组序列中的基因密度非常高,编码区所占的比例较大。大肠杆菌中总共有4288个基因,平均编码长度为 950bp,基因之间的间隔区长度为 118bp,而且这些结构基因没有内含子。 大肠杆菌DNA分子中的重复序列很少,但在大肠杆菌基因组中不同部位可以有称为 转座子 的50kb的重复片段。,32,33,转座因子,原核生物转座因子主要有二类: 插入序列 (insertion sequence,IS) 复合型转座子 ( composite transposon, Tn),33,34,只有当 IS 转座到某一基因中使该基因失活或插入位点旁边的染色体发生畸变等效应时才会被发现。,IS:2000bp以内,两端都有正向重复序列(direct repeats,DR)和反向重复序列(inverted repeats,IR),中间1kb左右的编码序列,仅编码和转座有关的转座酶。,34,35,Tn :200020000bp之间,两端由一对 IS 元件组成,带有与转座作用有关的基因以及其他基因。,35,36,根据转座的的机制和结果,可将转座分为: 复制型转座(replicative transposition) 保守型转座(conservative transposition),复制型,保守型,36,37,大肠杆菌染色体外基因组的结构和功能,质粒(plasmid):一类染色体外具有自主复制能力的环状双链DNA分子,属染色体外基因组。 大肠杆菌质粒是双链环状结构的 DNA 分子。 可以有共价闭合环状 DNA(covalently closed circular DNA,cccDNA)、缺口的环状 DNA、线性DNA 三种结构状态。,37,38,质粒对宿主细胞的生存一般不是必需的,但质粒带有某些特殊的不同于宿主细胞的遗传信息,其存在赋予宿主细胞一些遗传性状。,38,39,39,40,表2-2 细菌质粒所控制的一些性状,40,41,质粒能自主复制,是能独立复制的复制子(autonomous replicon)。 严紧控制(stringent control)型质粒:其复制常与宿主的繁殖偶联,拷贝数较少,每个细胞中只有1个到十几个拷贝。 松弛控制(relaxed control)型质粒:其复制与宿主不偶联,每个细胞中有几十到几百个拷贝。,41,42,质粒的稳定性与不相容性,质粒的不相容性(incompatibility):两种不同质粒因利用同一复制和维持机制,在复制和随后向子代细胞分配的过程中会发生竞争,从而不能在同一宿主细胞内稳定存在,其中一种质粒将被丢失。 携带不同复制和维持机制的质粒属于不同的不相容群,它们可以共存于同一细胞中。,42,43,影响质粒稳定性的因素: 宿主细胞分裂时质粒能否均衡地分配到子代细胞。 质粒分子自身结构的稳定性。,43,44,2.2.3 真核生物基因组的结构与功能,真核生物的遗传物质绝大部分存在于细胞核染色体,少部分存在于线粒体或叶绿体中-细胞核基因组和细胞器基因组。,44,45,真核生物染色体基因组特点,人类基因组中仅含有2500030000个基因,远低于预期。在人类基因组中只有很少一部份(约2-3)DNA序列用以编码蛋白质和结构RNA。 人类基因组中存在大量基因间隔区序列,主要由重复DNA构成。 在基因内部含大量内含子。,45,46,单拷贝序列:占 40%-80%,结构基因基本上属于单拷贝序列。 中度重复序列:重复次数10105,占 10-40%。如rRNA、tRNA、组蛋白以及免疫球蛋白的基因等,另有部分可能与基因的调控有关。 高度重复序列:拷贝数大于106 ,占 10-60%。如反向重复序列 (inverted repeats) 和卫星DNA (satellite DNA)。,46,(1)真核基因组存在大量的重复序列,47,重复序列的多态性,DNA多态性:DNA 序列发生变异从而导致的个体间核苷酸序列的差异。 主要包括 单核苷酸多态性(single nucleotide polymorphism,SNP)和 串联重复序列多态性(tandem repeats polymorphism)。,47,48,SNP-由基因组DNA上的单个碱基的变异引起的DNA序列多态性。 据估计,人类基因组中每1kp就存在一个SNP位点,共有约300万个之多,是人群中个体差异最具代表性的DNA多态性。 相当一部分SNP还直接或间接与个体的表型差异、对疾病的易感性或抵抗能力、对药物的反应性等相关。 大多数SNP位点十分稳定,人类85%的SNP是共有的。,48,49,高度重复序列中的无间隔反向重复序列很容易形成限制性内切酶识别位点,也很容易因为突变产生或是失去一个酶切位点,可以造成 限制性片段长度多态性 (restriction fragment length polymorphism, RFLP).,49,50,Restriciton map,50,51,(2)真核基因组存在多基因家族与假基因,多基因家族 (multi gene family):由某一祖先基因经过重复和变异所产生的一组基因。 假基因 (pseudo gene):与某些有功能的基因结构相似,但不能表达有功能的基因产物的某些基因。,51,52,多基因家族大致可分为两类: 一个基因家族的不同成员成簇地分布在不同染色体上,但核酸序列高度同源,编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。 基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内,这种分布方式与DNA复制时需要大量的组蛋白有关。,52,53,假基因的产生有两种方式: 由突变引起的基因序列变化而失去功能,这样产生的假基因带有内含子,称为常规假基因(conventional pseudogene)。 mRNA经过反转录为cDNA,再插入基因组,由于插入位点不合适或序列发生变化而导致失去功能。这种类型的假基因不含内含子,称为已加工的假基因(processed pseudogenes)。,53,54,真核生物细胞器基因组,真核生物有两类细胞器能携带遗传物质:线粒体和叶绿体。这些遗传物质独立于细胞核基因组外,能够自行复制和表达,又称为染色体外基因组。 线粒体基因组编码其自身蛋白质合成体系的某些成员,如rRNA和tRNA等,以及呼吸链中的某些成员,如ATP酶、NADH还原酶、细胞色素氧化酶复合体中的某些组分。其它成员由细胞核基因组编码。,54,55,人类线粒体(mitochondrion)基因组,16569 bp 37个基因 22 tRNA 2 rRNA 13 蛋白质,56,高等动物线粒体基因组具有独特的特点: 母系遗传。子代线粒体基因组来自母亲,父系的线粒体基因组在精卵结合时一般不能进入卵细胞。 线粒体DNA损伤后不易修复,突变率较高,可能与衰老及某些疾病有关。 遗传密码与通用遗传密码存在差别,如UGA(终止密码子)编码Trp,AGA/AGG(Arg)为终止密码子等。,56,57,2.3 基因组学,基因组学(Genomics):对生命有机体全基因组进行序列分析和功能研究的学科。 结构基因组学:以全基因组测序为目标 功能基因组学:根据结构基因组学提供的信息,以高通量、大规模的实验方法,借助计算机分析,系统地对基因功能进行诠释。,58,基因组学的意义,改变生物学研究的模式,59,基因组学的意义,对疾病的诊断、治疗、预防、预测、保健等产生巨大的影响 环境基因组学(Enviromental Genomics) 专门鉴定机体暴露在特定环境下的那些显示易感或抵抗性基因的DNA多态性 对环境比较敏感的基因有:DNA修复基因、细胞周期相关基因、激素代谢基因、受体基因、参与免疫和感染反应的基因、信号转导基因、等等 药物基因组学(Phamarcogenomics) 不同个体的药物反应差异(主要指药效与毒性)与DNA多态性的关系 通过DNA序列差异的分析,从基因水平上深入认识疾病及药物作用的个体差异的机理,指导和优化临床用药,并有可能在此基础上发展个体化医疗,60,Responders,Genotype can direct Right drug Right dose Right patient,基因组学的意义,PHARMACOGENOMICS,61,(一)什么

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论