分子生物学电子教案第三章_第1页
分子生物学电子教案第三章_第2页
分子生物学电子教案第三章_第3页
分子生物学电子教案第三章_第4页
分子生物学电子教案第三章_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章基因的构造和功能

第3章基因及基因组的构造

1.主要内容

1)断裂基因构成性质

2)重叠基因种类

3)C值冲突

4)原核生物及真核生物基因组的区分

5)真核生物染色体的构造

6)真核生物DNA序列的4种类型

7)基因家族、基因簇、卫星DNA、分散重复DNA序列

8)人类基因组方案

2.教学要求

1)驾驭基因,断裂基因,顺反子,C值冲突,重叠基因,基因家族,重复序列,卫星DNA等根本概

念;

2)熟识原核生物和真核生物基因组构造特点及功能:

3)理解人类基因组的重复依次、人类基因组方案。

第1节基因的概念

第2节基因命名简介

第3节真核生物的断裂基因

第4节基因及基因组的大小及C值冲突

第5节重叠基因

第6节基因组

第7节真核生物DNA序列组织

第8节基因家族

第9节人类基因组探讨进展

第1节基因的概念

基因:带有特定遗传信息的核酸分子片段。包括入

构造基因:编码蛋白质tRNArRNA

调控基因:

基因探讨的开展染色体分子九反向生物学

基因位于染色体和细胞器的DNA分子上人

・基因和顺反子

•1955,Benzer用以表述T4具溶菌功能的区的2个亚区:rI【ArllB

•现代分子生物学文献中,顺反子和基因这两个术语互相通用。

第2节基因命名简介

•表示基因3个小写斜体字母,lac

•表示基因座3个小写斜体字母+1个大写斜体字母。lacZ

•表示质粒

自然质粒3个正体字母,首字母大写

重组质粒在2个大写字母前面加小写p

•基因为斜体,蛋白质为正体

•人类基因为大写斜体

第3节真核生物的断裂基因

•一、割裂基因的发觉

•1977,通过成熟mRNA(或cDNA)及编码某因的DNA杂交试睑而发觉

•真核生物的基因是不连续的,大大变更了原来对基因构造的看法,如今知道大多数真核生物的基因

都是不连续基因或割裂基因(splitgene)0

・割裂基因的概念一是编码序列在DNA分子上不连续排列而被不编码的序列所隔开的基因。

•割裂基因的构成

•构成割裂基因的DNA序列被分为两类:

•基因中编码的序列称为外显子(exon),外显子是基因中对应于信使RNA序列的区域;

•不编码的间隔序列称为内含子(intron),内含子是从信使RNA中消逝的区域。

・割裂基来由一系列交替存在的外显子和内含子构成,基因两端起始和完毕于外显子,对应于其转录

产物RNA的5,和3,端“假如一个基因有n个内含子,则相应地含有n+1个外显子。

割裂基因的性质入

•SplittingGene的普遍性

•外显子和内含子各有特点

,Splittinggene概念的相对性

SplittingGene的普遍性大

a)真核生物(Eukaryots)中

・绝大部分构造基因

•tDNA,rDNA

•mtDNA,cpDNA

b)原核生物(Prokaryots)中

,SV40大T抗原gene

•小t抗原gene

・Splittinggene并非真核生物所特有

外显子和内含子各有特点入

•割裂基因的外显子在基因中的排列依次和它在成熟mRNA产物中的排列依次是一样的;

・某种割裂基因在全部组织中都具有一样的内含子成分;

・核基因的内含子通常在全部的可读框中都含有无义密码子(ronsensecodon),因此一般没有编码功

能。

•内含子上发生的突变不能影响蛋白质的构造,所以其突变往往对生物体是没有影响的;

・但也有例外,例如一些发生在内含子.上的突变可通过抑制外显子的互相剪接阻挡信使RNA的产生。

•利用构造基因的特别DNA限制片段作为探针,我们可以检测基因组中及之有亲缘关系的序列,结

果说明一个基因的外显子常及其他基因的外显子有亲缘关系。

・两个相关基因内含子之间的亲缘关系远远不如其外显子之间的亲缘关系严密。

•这是因为在进化过程中,相关基因的内含子比外显子变更得更快。

Splittinggene概念的相对性入

a)lntron并非“含而不露”

Yeast细胞色素b基因IntronII编码成熟酶

b)Exon并非“表里如一"

人类尿激前原基因ExonI不编码氨基酸序列

c)并非真核生物全部的构造基因均为splittinggene

Histonegenefamily

干扰素

Yeast中多数基因(ADH..J

第4节某因及某因组的大小及C值冲突

•由于割裂基因的存在,人们相识到基因比实际编码蛋白质的序列要大得多。

・外显子的大小及基因的大小没有必定的联络。

・不同种类的生物体中外显子的大小并没有明显的不同,基因可能是由一些小的、编码较小的独立蛋

白质分区的单位在进化过程中加合起来的。

基因的大小取决于它所包含的内含子的长度九

•内含子之间有很大不同,它们的大小从200个碱基对左右到上万个碱基对。在一些极端的例子里,

甚至有50-60kb的内含子。

•由于基因的大小取决于内含子的长度和数目,导致酵母和高等真核生物的基因大小有很大的不同。

・大多数醉母基因小于2kb,很少有超过5kb的。

•及此相反,在高等的真核生物中,开始出现长的基因,蝇类和哺乳动物基因很少小于2kb,大多数

长度在5~100kb之间。

“旦当基因的长度大到肯定程度后,DNA的困难性及生物体的困难性之间开始失去必定的联络。

・例如虽然属于同一个门,果蛆细胞的DNA总量较小而家蝇细胞的DNA总量却是它的6倍。

基因组入

・狭义:单倍体细胞中的全套染色体(人:22条常染色体+X,Y+线粒体DNA)。

・广义:一物种的全部遗传物质及其携带的遗传信息。

基因组大小及C值冲突九

・一个单倍体基因组的全部DNA含量总是恒定的。这是物种的一个特征,通常称为该物种的C值。

•不同物种的C值差异很大,最小的枝原体只有直106bp,而最大的如某些显花植物和两柄动物可达

Q11bp。

Rangeofgenomesizeindifferentphyla门

•由图表可见,随着生物的进化,生物体的构造和功能越来越困难,其C值就越大,例如真菌和高等

值物同属于真核生物,而后者的C值就大得多。这一点是不难理解的,因为构造和功能越困难,须要

为基因产物的种类越多,也就是说须要的基因越多,因此C值越大。

•然而另一方面,随着进一步的进化,生物体困难性和DNA含量之间的关系变模糊了,出现了很多令

人不解的现象。一些生物类群基因组大小的变更范围很窄,而另一些类群的变更范围则很宽。

•突出的例子是两栖动物,C值小的可以低至109bp以下,C值大的可以高达1011bp0而哺乳动物

的C值均为109bp的数量级。人们很难信任不同的两栖动物,所需基因的数量会有100倍的差异,

而且两栖动物的构造和功能会比哺乳动物更困难。

•由于人们无法用功能来说明基因组的DNA含量,所以产生了C值冲突(Cvalueparadox,又称C值

悖理)。

・它表如今两个方面:一个方面是,及预期的编码蛋白质的基因的数量相比,基因组DNA的含量过多。

另一个方面是一些物种之间的困难性变更范围并不大,但是C值却有很大的变更范围。这耍问题的解

决有待于进一步的探讨。

第5节重叠基因

莲人在绿杨津入

采一

玉漱声歌新阙

采莲人在绿杨津,在绿杨津一阙新;九

一阙新歌声漱玉,歌声漱玉兴莲人。

一、原核生物的重叠基因(overlappinggene)

•在细胞基因中,一般一段DNA序列只以三种蛋白质可读框的一种被阅读,但是在一些病毒或线粒体

基因中,两个邻近的基因以一种奇妙的方式发生重叠,并以不同的可读框被阅读并表达,因此一段一

样的DNA序列可以编码两个非同源蛋白质。

(pXI74的DNA序列组织上有直叠基因(overlap-pinggene)和基因内基因

重叠基因有以下几种状况:

①一个基因完全在另一个基因内部

如:B和A*E和D

其读码构造互不一样

重叠基因

基因内基因部分重叠基因一个碱基重叠

二、真核生物的重叠基因

•通常割裂基因的每个外显子编码一段单一的氨基酸序列,对应于整个蛋白质上的相应部分,而内含

子不在最终的蛋白质产物中表达,二者的作用是迥然不同的。但是有些基因中内含子和外显子的定义

是相对的,及它表达的途径有关。

•在这些基因中,选择性的基因表达形式引起了外显子连接途径的转变。

・一个特定的外显子可能选择性地及不同的外显子连接形成信使RNA。

•这种选择性形式产生的两种蛋白质中,一部分一样而其他部分不同。一段区域以一种途径表达时作

为外显子,而以另一种途径表达时作为内含子。

•因为此时一段DNA序列通常以多种方式起作用,所以不能被简洁地称为外显子或内含子,

第6节基因组

一、原核生物的染色体基因组

二、真核生物基因组

一、原核生物的染色体基因组

(-)细菌染色体基因组构造的一般特点

1.细菌的染色体基因组通常仅由一条环状双链DNA分子组成,细菌的染色体相对聚集在一起,形成

一个较为致密的区域,称为类核[nucleoid)。类核无核膜及胞浆分开,类核的中央部分由RNA和支

架蛋白组成,外围是双链闭环的DNA超螺旋。染色体DNA通常及细胞膜相连,连接点的数最随细菌

生长状况和不同的生活周期而异。

Fig.Typicalbacterialcell

E.coligenomeisasingledouble-strandedDNAmoleculeof1A6mm.

minlengthpButE.coliisonly~2人

DNAis000largerthanXthesizeofthecell!

Thisisachievedbysuper-coilingtheDNA.X

DNA九gyrase旋转酶introducesnegative-superhelicaltwistsintotheDNA.Thedegreeof

supercoilingofthechromosomeisstrictlyregulated.

Fig.ThestructureofE.colinucleoid(图大肠杆菌拟核的构造)

2.具有操纵子(tmascriptionaloperon)构造,其中的构造基因为多顺反子(polycistron),即数个功能

相关的构造基因串联在一起,受同一个调整区的调整。数个操纵子还可以由一个共同的调整基因

(regulatorygene)即调整子(regulon)所调控。

X174(|)D-E-J-F-G-HmRNA外壳蛋白J、F、G、H

组装蛋白D裂解蛋白E

E.coli色氨酸操纵子9个顺反子9个酶

真核很少,如18s5.8s及28srRNA基因

3.在大多数状况下,构造基因在细菌染色体基因组中都是单拷贝。

4.不编码的DNA部份所占比例比真核细胞基因组少得多。

5.具有编码同工前的同源基因(isogene)例如,在大肠杆菌基因组中有两个编吗分支酸

(chorismicacid)变位酶的基因,两个编码乙酰乳酸(acetclactate)合成酶的基因。

6.细菌基因组编码依次一般不会重叠,和病毒基因组不同的。

7.在DNA分子中具有各种功能的识别区域如复制起始区OrC,复制终止区TerC,转录启动区和终止

区等。这些区域往往具有特别的依次,并且含有反向重复依次。

8.在基因或操纵子的终末往往具有特别的终止依次,它可使转录终止和RNA聚合酶从DNA链上脱落。

例如大肠杆菌色氨酸操纵子后尾含有40bp的GC丰富区,其后紧跟AT丰富区,这就是转录终止子

的构造。

图ProkaryoticChromosomes

・Haploid仅一对染色体

・DNAiscompacted紧凑的

-E.g.E.colipacks1.5mmchromosomeintoacellthatisonly1uminlength

・Nohistonesornucleosomes无组蛋白和核小体

-SmallbasicproteinsMAYserveasimilarfunction

•Genesusuallydonotcontainintrons

•Singleoriginofreplication单一复制起点

(二)质粒基因组

•指细菌的染色体外基因组,大约几十种。

・质粒DNA呈线状或环状双链构造

・大小约1x103~300x103bp,相对分子质量1x106—200x106。

・质粒基因可通过星制、转录、翻译而给予寄主细胞某种性状。

质粒基因组

二、真核生物基因组

(一)真核染色体

(二)真核染色体基因组

(三)线粒体基因组

(四〕叶绿体基因组

(一)真核染色体(Eukaryoticchromosome)

1.概述

2.组蛋白(Histone)

3.核小体(Nuclearsome)

4.染色体构造的形成

5.卷丝粒(centromere或中心粒)和端粒(telomere)

1.概述:

Chromatinstructureenablesthechromosomestoaltertheircompactnessasthecellprogressthe

cellcycle.

2.组蛋白(Histone)

3.核小体(Nuclearsome)

Mononucleosomestypicallyhave-200bpDNA.End-trimmingreducesthelengthofDNAfirstto

~165bp,andthengeneratescoreparticleswith146bp.

The10nmfiberisacontinuousstringofnucleosomes.

4.染色体构造的形成

(1)首先假设干个核小体形成念珠状构造

(2)30nm纤丝的构成——

染色质构造的第二层次

5.着丝粒[centromere或中心粒)和端粒(telomere)

有丝分裂中期的染色体

(二)真核染色体基因组(Eukaryoticchromosomegenome)

・为真核生物单倍体染色体所含有的一整套基因。

1.真核生物基因组构造及功能的特点

1)含两份同源的基因组

2)构造困难,基因数浩大,具有很多更制起点,每个复制子大小不一。

3)真核基来由一个构造基因及相关的调控区组成,转录产物为单顺反子。

4)含有大量重复序列。

5)非编码序列(non-codingsequenceNCS)占90%以上。

6)断裂基因(splitgene)o基因及基因间的非编码序列为间隔DNA(spacerDNA).

7)功能相关的基因构成各种基因家族,可串联在一起,也可相距很远。

8)可挪动因素(mobilegeneticelement),又称为自私基因(selfishDNA).

2.真核生物基因组的构造

•构造基因

-编码蛋白质tRNArRNA

•顺式作用元件(cis-actingelement)

指及构造基因表达调控相关、可以被基因调控蛋白特异性识别和结合的DNA序列。并非都位于转

录起始点上游,包括启动子、增加子、上游启动子元件、反响元件、加尾信号等。

•反式作用因子(trans-actingelements):可通过结合顺式作用元件而调整基因转录活性的蛋白质因

子。

3.真核生物及原核生物基因组特点的异同

1)真核生物基因分布在多个染色体上,而原核生物只一个染色体;

2)真核生物基因组远大于原核生物基因组;

3)真核生物细胞中DNA及组蛋白和大量非组蛋白结合,并有核膜将其及细胞质隔离,结果真核细胞

的转录和翻译在时间上和空间上都是别离的,而原核细胞的基因转录和翻译是同步的;

4)真核生物的基因是不连续的,中间存在不被翻译的内含子序列,而原核生物几乎每一个基因都是

完好的连续的DNA片段;

5)基因组中非编码序列远多于编码序列;

6)存在着重复序列,重复次数从几次到几百万次不等;

7)真核生物基因组的复制起点多,缺少明显的操纵子构造,而原核生物的基因组一般是一个复制子;

8)真核生物基因组及原核一样,存在转座因子。

(三)线粒体基因组(mitochondrialgenome,mtDNA)

・双链环状分子

•相对分子质量约1x103~2x105,动物V植物,大小为15.4—16.3kb;

•含有编码2个核糖体RNA(12SrRNA,16SrRNAJ,22个tRNA、1个细胞色素b、3个细胞色素

氧化酶(COI、COU、COin)、6个NADH降解酶(ND1〜6)和2个ATP酶(6和8)的基因(Rook,

1995)。

・线粒体是半自主性的细胞器,只能编码部分所需产物,需及核基因互作编码一曲重要物质。

・遗传密码及核DNA的不完仝一样.

图1-1线粒体DNA构造示意图

(ffl)叶绿体基因组

・也是半自主性的细胞器,需及核基因互作编码一些重要物展。

・叶绿体基因组较大,在高等植物中通常为140kb。

第7节真核生物DNA序列组织

1-单拷贝序列:大多数编码蛋白质的构造基因属这一类。

2、轻度重及序列:2~10个拷贝。如组蛋白基因,酵母tRNA基因。

3、中度重复序列:重复次数为101505。不编码,在基因表达调控起重要作用。

4、高度重复序列:重复次数>105的DNA序列,如卫星DNA,反向重复序列,rRNA,某些tRNA

第8节基因家族(genefamily)

一、基因家族和基因簇

•基因家族指核甘酸序列或编码产物的构造具有肯定程度同源性的一组基因。

•假基因(pseudogene):在多基因家族中有的成员并不能表达出有功能的产物,用中表示。

基因家族的特点

1、核酸序列一样:即为多拷贝基因如rRNA基因家族,tRNA基因家族,组蛋白基因家族。

2、核酸序列高度同源:如人类生长激素基因家族包括三种激素的基因,人生长激素、人胎盘促乳素

和催乳素,它们之间高度同源。

3、编码产物有同源功能:基因序列的相像性可能较低,但基因编码的产物具有高度保守的功能区。

如src癌基因家族

4、编码产物具有小段保守基序:有些基因家族中各成员的D7A序列可能不明显相关,而所编码的产

物却有共同的功能特征,存在小段保守的氨基酸基序。

•基因超家族(genesuperfamily)指一组由多基因家族及单基因组成的更大的基因家族,它们的构造

有不同的同源性,但功能并不肯定一样。如免疫球蛋白基因超家族。

基因簇(gene九cluster)是指基因家族中的各成员严密成簇排列成大段的串联重复单位,定位于染色体

的特别区域。它们属于同一个祖先的基因扩增产物。

二、基因外的DNA重复序列

・除了基因家族外,染色体上还有大量无转录活性的重复DNA序列家族。

・及在基因家族中的组织形式类似,它们也有两种组织形式:

-串联重复DNA(卫星DNA),成簇存在于染色体的特定区域。

-分散重复的DNA,重复单位并不成簇存在,而是分散干染鱼体的各个位点上。

1.卫星DNA

门)概念:卫星DNA有些高度重复DNA序列的碱基组成和浮力密度同主体DNA有区分,在浮力密

度梯度离心时,可形成不同于主DNA带的卫星带。卫星DNA的名称由此而来。

0卫星DNA的分类

-卫星DNA(satelliteDNA)

-d、卫星DNA(minisatelliteDNA)

-微卫星DNA(microsatelliteDNA)

•大干星DNA(macrosatelliteDNA)又称为经典DNA,总长度100计~几个Mb。依据浮力密度的不

同分为I、II、【II、IV和。、0卫星DNA。各类型都由不同的重复依次家族组成。

・小卫星DNA(minisatelliteDNA)由中等大小的串联重亚序列构成,总长约0.1~20kb,分布在全部

染色体,往往近于端粒处。高度可变的卫星DNA、端粒DNA:串联的短片段重复序列(TTAGGGG)n)

・微卫星DNA(microsatelhteDNA):重复单位为1~5bp,重复次数为10~60次,总长度小于150bp,

常见以(AC)n和(TG)n二聚核背酸为重复单位,由Miesfeld1981年发觉。

2.分散重复的DNA序列

•在高度分散的重复DNA家族中含有少量转库元件,依据其大小不同,可分为

-短散在核元件(shortinterspersednuclearelements,SINEs),

-长散在核元件(longinterspersednuclearelements,LINEs)。

1)短散在核元件(shortinterspersednuclearelements*SINEs),主要是Alu重复序列家族。序列

中有限制酶Alu的酶切位点(AGCT)而得名。重复次数3050万,散在分布于基因组中,及基因表

达调控有关。

2)长散在核元件(longinterspersednuclearelements,LINEs):KpnI重复依次。

第9节人类基因组探讨进展

一、人类基因组的根本特点

二、重复序列

三、人类基因组方案(HGP)

一、人类基因组的根本特点

•断裂基因;

・主要由大量的非编码序列和少量的编码序列构成:

•存在多基因家族;

・含有多种类型的重复序列。

人类基因组概况

基因组大小2.91Gbp

A+G含量54%

G+C含量38%

重复序列(不含异染色质)35%

编码序列数目26588

功能未知基因比例42%

外显子最多的基因Titin(234)

SNP数量300万个

SNP密度1/1250bp

最长的染色体2(240Mbp)

最短的染色体丫(19Mbp)

基因最多的染色体1(2453)

基因最少的染色体丫(104)

基因密度最大的染色体19(23/Mb)

基因密度最小的染色体13,Y(5/Mb)

重复序列含量最高的染色体19(57%)

重熨序列含量最低的染色体2,8,10,13,18(36%)

二、重复序列

•基因组中有多个拷贝,但不编码蛋白质的序列,是人类基因中的主要成分;

・分为串联和分布重复序列

・卫星DNA—高度重复的串联重复序列;

・重复序列是一种重要的分子标记。

国人类基因组中的分布重复序列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论