




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章、人类基因组
1、基因座:一条染色体的特定位置。2、等位基因:在同源染色体的特定基因座上的不同形式的基因,它们影响同一类表型,但产生不同的表型效应。3.复等位基因:在群体中当一个基因座上的等位基因数目有三个或三个以上。基因的基本概念一、基本概念4.纯合子/体:如果在同一个位点上两个等位基因是相同的,称为纯合子(Homozygous),这样的个体称为纯合体(Homozygotes)5.杂合子/体:如果在同一个位点上两个等位基因是不同的,称为杂合子(Heterozygous),这样的个体称为杂合体(Heterozygote)6.基因型(Genotype):是个体的遗传结构或组成。也认为是在个体特异性的遗传位点上的等位基因7.表现型(Phonotype):是基因型和环境因素相互作用所观察到的结果,尤其是一个或几个特殊基因可见的表达。8、显性:一个等位基因在杂合状况下可以决定性状,则由这一等位基因所决定的、在杂合子中表现出的形状为显性。(大写英文字母代表显性基因)9、隐性:一个等位基因在杂合状况下不可以决定性状,则由这一等位基因所决定的形状为隐性。(小写英文字母代表隐性基因)二.基因的概念基因是遗传的基本单位
(重组单位,突变单位,功能单位)是负载特定遗传信息的DNA片段在一定条件下可以表达,从而控制或调节生物体的性状
“Humans,likecells,couldreadthemessagesofgenes”
J.WatsonHumanGenomeProject
“人类能象细胞那样阅读基因的信息”Lifesciencesre-beginbysequencing
“Allbiologyinthefuturewillstartwiththeknowledgeofgenomesandproceedhopefully.”
J.D.Watson,2003“未来所有生物学只有以基因组知识(重新)开始才有希望发展”Nosequence,noknowledge!
“Theprecisesequenceofthebasesisthecodewhichcarriesthegeneticinformation.”
Watson&Crick,May30,1953“GENETICIMPLICATIONSOFTHESTRU-CTUREOFDEOXYRIBONUCLEICACIDS”“Lifeissequence-based”“碱基的排列顺序就是携带遗传信息的密码”“theinstructionsformakingalifefromonegenerationtothenextisdigital,NOT
analogue…”JohnSulston,2003“生命指令是数据的,而不是模拟的”10101010101010010101010100110101010101010010101010100101001110000111000001110000011000101010101010010101010101010100101010101001010011100001110000011100000110001001010101001010101010101010010101010100101001110000111000001110000011000101010101010010101010101010100101010101001010011100001110000011101001110000111000001110000011000101010101010010101010101010100101010101001010011100001110000011100000110001001010101001010101010101010010101010100101001110000111000001110000011000101010101010010101010101010100101010101001010011100001110000011100000110001010101010100101010101010101001010101010010100111000011100000111000001100010101010101001010101010101010010101010100101001110000111000001110000110001010110000111000001110000011000101010101010010101010101010100010101010101001010101010100010101010101001010101010101010010101010100101001110000111000001110000110001010110000111000001110000011000101010101010010101010101010111001011001010101010101010101010100010111010100000000001011100000010001000001010101001010100110010101010010010100100101001010100100101001000010101001010101010101010101010010000001010100100101001010010100100101001001010000010101010Alanguageforinformation!
基因具有自我复制(self-replication)的重要特性。复制发生在细胞分裂周期的S期,DNA双螺旋结构解旋为两条单股的多核苷酸链,以DNA分子自身的每一股单链为模板进行自我复制合成新的DNA分子。复制的起点由特定的碱基序列组成。真核生物的复制从多个位点同时开始进行。
基因表达(geneexpression):是把基因所储存的遗传信息转变为由特定的氨基酸种类和序列构成的多肽链,再由多肽链构成蛋白质或酶分子,从而决定生物各种性状(表型)的过程。基因表达包括两个步骤:①以DNA为模板转录合成mRNA;②将遗传信息翻译成多肽链中相应的氨基酸种类和序列基因的化学本质
在整个生物界中,绝大部分生物(包括人类)基因的化学本质是DNA;在某些仅含有RNA和蛋白质的病毒中,基因的化学本质是RNA。
DNA分子的基本单位是脱氧核苷酸,依各自所携碱基的不同,可以分成A、G、C、T
4种。将它们按一定顺序排列连接后即构成DNA单链。它们的排列顺序是DNA遗传的核心。
结构基因---决定某种蛋白质或酶分子结构的基因调控基因---调控结构基因表达的基因只转录而不翻译的基因---指专门转录tRNA,mRNA,rRNA的基因,它们并不翻译,参与蛋白质的生物合成基因的种类基因的结构真核生物基因的编码序列往往被非编码序列所分割,呈现断裂状的结构,故而也称断裂基因(splitgene)。编码序列称为外显子(exon),间隔的非编码序列称为内含子(intron)。内含子在转录后的加工中会被切除。断裂基因的结构
编码顺序(外显子)非编码顺序(内含子)侧翼顺序启动子(TATA框CAAT框GC框)增强子终止子
转录及其加工过程
基因的生物学特性
DNA分子中碱基对的排列顺序蕴藏着遗传信息,决定了基因的基本功能和特性。基因复制与表达构成了基因的主要功能。
真核生物基因组
结构与功能的特点1、含两份同源的基因组2、结构复杂,基因数庞大,具有许多复制起点,每个复制子大小不一。3、真核基因由一个结构基因与相关的调控区组成,转录产物为单顺反子。4、含有大量重复序列。5、非编码序列(non-codingsequenceNCS)占90%以上。6、断裂基因(splitgene)。基因与基因间的非编码序列为间隔DNA(spacerDNA).7、功能相关的基因构成各种基因家族,可串联在一起,也可相距很远。ProkaryocyteGenome(kb)ORFOryzasativaL.ssp.Indica420,00050,000Arabidopsisthaliana115,42825,498Caenorhabditiselegans97,00019,099Drosophilamelanogaster137,00014,100Homosapiens3,000,00030,000真核生物基因组的大小“Jungle-Desert”Or“Big–Small”?ManySmallGenesTwoBigGenesIntronicIntronicIntergenicIntergenicIntergenicIntergenicIntergenicGeneSpace~50%GeneSpace~90%TheGene“JungleTheGene“Desert”Plantandanimalgenomesareverydifferentwithrespecttothefractionthatistranscribed.GeneSizeTranscribedO.sativa4.5Kb55%A.thaliana2.6Kb54%D.melanogaster9.5Kb97%C.elegans5.0Kb90%真核生物基因组的结构结构基因顺式作用元件(cis-actingelement)基因家族(genefamily)重复序列(repeatsequence)端粒(telomere)顺式作用元件(cis-actingelement)指与结构基因表达调控相关、能够被基因调控蛋白特异性识别和结合的DNA序列。并非都位于转录起始点上游,包括启动子、增强子、上游启动子元件、反应元件、加尾信号等。反式作用因子(trans-actingelements):可通过结合顺式作用元件而调节基因转录活性的蛋白质因子。启动子(promoter)是RNA聚合酶特异性识别和结合的DNA序列,位于结构基因转录起始点的上游-25bp处,本身不被转录。启动子必须与转录因子结合才能被RNA聚合酶识别与结合。TATA盒:TATA盒子启动子是一段特定的直接与RNA聚合酶及其转录因子相结合决定基因转录起始与否的DNA序列.不同的启动子对RNA聚合酶的亲和力不同所结合的反式作用因子(trans-actingfactors)也不同因此基因转录活性也很不相同.
上游启动子元件(upstreampromoterelements)TATA盒上游的一些特定的DNA序列,反式作用因子能与这些元件结合调控基因的转录效率。上游启动子元件包括CAAT盒、CACA盒及GC盒。CAAT盒:5`GCNCAATCT3`GC盒:5`CCGCC3`CACA盒:GCCACACCC反应元件(responseelement)一些信息分子的受体被细胞外信息分子激活后,能与特异的DNA序列结合,调控基因的表达。由于能介导基因对细胞外的某种信号产生反应,称为反应元件。具有较短的保守序列。糖皮质激素反应元件(GRE)序列为:GGTACANNTGTTCT。增强子(enhancer)是一段DNA序列,其中含有多个能被反式作用因子识别与结合的顺式作用元件,能调控(常为增强)邻近基因的转录。一般位于转录起始点上游-100~-300bp处,但在基因外或某些内含子中也有增强子序列。负增强子(negativeenhancer)又称沉默子(silencer):负调控序列。加尾信号结构基因的最后一个外显子中有一个保守序列AATAAA与下游一段GT丰富区或T丰富区共同构成polyA加尾信号。与RNA聚合酶结合的延长因子能识别这种结构并与之结合,然后在AAUAAA下游10~30个碱基的部位切断RNA并加上polyA尾巴。重复序列(repeatsequence)1、高度重复序列:重复次数>105的DNA序列如卫星DNA和反向重复序列。2、中度重复序列:重复次数为101~105。3、单拷贝序列:大多数编码蛋白质的结构基因属这一类。人类基因组的重复序列1、反向重复序列(invertedrepeats):5%2、串联重复序列(tandemrepeats):具有一个固定的重复单位,头尾相连。10%
(1)编码区串联重复顺序(2)非编码区串联重复顺序
3、散在重复顺序(interspersedrepeats)反向重复序列(invertedrepeats)
指两个顺序相同的互补拷贝在DNA链上呈反向排列。一种形式为两个反向排列的拷贝之间隔着一段间隔顺序如:5`AAACCACCGCTGGTAGCGGTGGTTT3`3`TTTGGTGGCGACCATCGCCACCAAA5`另一种是两个拷贝反向串联在一起,也称为回文结构(palindrome).串联重复序列(tandemrepeats):
1、编码区串联重复顺序:如组蛋白基因。编码五种组蛋白的基因密集在一个基本的7.0kb的重复单位上,各重复单位之间有高度的序列一致性。2、非编码区串联重复顺序:常存在于间隔DNA和内含子内。是组成卫星DNA(satelliteDNA)的基础。卫星DNA(satelliteDNA)如果DNA分子之间存在浮力密度的差异,在氯化铯密度梯度离心将会沉降于不同的位置。DNA的浮力密度(ρ)与其G-C含量存在关系:ρ=1.660+0.00098(G-C%)。因此经过密度梯度离心,高度重复序列DNA可以在基因组DNA的主带旁形成一条或多条小带,这取决于其G-C含量及重复程度,故又称为卫星DNA或随机DNA。根据核心顺序的长短分为大卫星DNA、小卫星DNA、微卫星DNA。大卫星DNA(macrosatelliteDNA)又称为经典DNA。总长度100kb~几个Mb。根据浮力密度的不同分为Ⅰ、Ⅱ、Ⅲ、Ⅳ和α、β卫星DNA。各类型都由不同的重复顺序家族组成。小卫星DNA(minisatelliteDNA)由中等大小的串联重复序列构成,总长约0.1~20kb,分布在所有染色体,往往近于端粒处。高度可变的卫星DNA、端粒DNA(串联的短片段重复序列(TTAGGGG)n微卫星DNA(microsatelliteDNA):重复单位为1~5bp,重复次数为10~60次,总长度小于150bp,常见以(AC)n和(TG)n二聚核苷酸为重复单位,由Miesfeld1981年发现。散在重复顺序(interspersedrepeats)1、短散在核元件(shortinterspersednuclearelementsSINEs),主要是Alu重复序列家族。序列中有限制酶Alu的酶切位点(AGCT)而得名。重复次数30~50万,散在分布于基因组中,与基因表达调控有关。2、长散在核元件(longinterspersednuclearelements,LINEs):它们是“反转位子”。这些流动的遗传元素首先被转录成RNA,然后再被由该反转位子本身产生的一种逆向转录酶重新转变成DNA。该DNA版本可在任何位置结合进基因组中。
3kb人类基因组DNA的多态性DNA位点多态性(DNAsitepolymorphism)限制性片段长度多态性(restrictionfragmentlengthpolymorphismRFLP)
串联重复顺序多态性(tandemrepeatspolymorphism)单核苷酸多态性(SingleNucleotidePolymorphism,SNP)DNA位点多态性(DNAsitepolymorphism)
由于等位基因间在特定位点上DNA序列存在差异造成的。ABO血型组是发现的第一个人类多态性。人类白细胞抗原(HLA)是最复杂最具多态性的体系,位于6号染色体。仅其中的DR抗原编码位点有60多个等位基因。限制性片段长度多态性(RFLP)用同一种限制酶消化不同个体的DNA时,会得到长度各不相同的限制性片段类型。当碱基组成的变化改变了限制性内切酶识别位点时,就会得到不同的限制性片段类型,这样的位点称为多态性位点。通过限制酶酶切片段的长度多态性来揭示DNA碱基组成不同的技术称为限制性片段长度多态性技术(RFLP技术)。PFLP的基础是高度重复序列和点突变。RFLP分析技术路线小分子DNA,如细胞器基因,将纯化的DNA样品用限制性内切酶消化成长度不等的片段进行琼脂糖凝胶电泳分离,经溴化乙锭染色后在紫外光下直接观察其多态性;大分子核DNA需要借助分子杂交手段,用某一标记DNA片段的探针与被转移到硝酸纤维薄膜上的DNA片段进行杂交,只有与探针有高度同源性的片段被检测出来.
RFLP的优点
呈孟德尔遗传;不受环境影响,是一种共显性标记,共显性(codominance):在杂合子状态下,两个基因的作用都表现出来。结果稳定可靠,重复性好.缺点RFLP需要大量的DNA,样品要求高多态性频率较低,判读有一定困难实验室之间结果比较有一定困难制备放射性探针进行Southern杂交,因而比较费时,对人体健康有影响,对环境有污染RFLP应用RFLP标记适用于构建表达图谱,在分析群体内和群体间遗传变异度、群体间基因流评价和亲缘关系时是强有利的评价,也可用于人类遗传疾病的诊断.如cDNA探针进行血红蛋白病产前诊断RFLP检测NOG基因rs4794665位点的PCR产物的酶切图谱.泳道1-5为不同产物的酶切图:泳道1不被酶切,呈一条带(433bp)为野生型纯合子A/A型;泳道2,3被完全酶切,呈两条带(288bp,144bp)为突变型纯合子G/G型;泳道3:不完全酶切呈三条带(443p,288bp,144bp)为杂合子A/G型。泳道M为DNA分子量标记:所用DNA对照标准品为DL2000。串联重复顺序多态性重复单位很小,但重复次数有较大的变化,主要发生在小卫星DNA和微卫星DNA中,也称为可变数目的串联重复序列(variablenumberoftandemrepeatsVNTRS)。小卫星DNA多态性:由于重复单位的数目不同引起。微卫星DNA多态性:由于重复单位的重复次数不同而具有高度的遗传多态性。STR优点STR为共显性遗传有丰富的多态性,绝大多数不受选择压力的影响较均匀地分布人类全基因组可经PCR扩增STR应用用于构建遗传图谱.用于疾病诊断.用于法医鉴定用于分子进化分析VNTR检测VNTRD1S80应用实例IL-1RNgenotypesinthestudiedpopulation.IL-1RN*1/*2genotype(lanes1-2),IL-1RN*1/*4(lanes3-4),IL-1RN*1/*1(lanes5-6),IL-1RN*1/*3(lane7)andIL-1RN*2/*2(lane8).DNAMarker:GeneRulerTM100bpDNALadder(lane9).VNTRD1S80应用实例STR检测复合扩增电泳分型结果照片1.TH01、TPOX和CSF1PO基因座在汉、藏、回、东乡各民族群体中的分型的分型STR应用实例照片2.D16S539、D7S820和D13S317基因座复合扩增在汉、藏、回、东乡各民族群体中的分型STR应用实例
照片3F13A01、FESFPS和vWA基因座复合扩增在汉、藏、回、东乡各民族群体的分型STR应用实例Mantel检验结果表:2基于11个STR数据的两两遗传距离Rst值(下三角)(显著性水平=0.05)和两两地理距离(上三角)
结果表明了两两遗传距离(Rst矩阵)和两两地理距离呈显著的正相关(r=0.646,P=0.003),地理上临近的人群表现出遗传上的亲近性。这暗示骊靬人和邻近的人群遗传关系较近。人群蒙古族汉族(宁夏)汉族(辽宁)汉族(河南)骊靬裕固族汉族(闽南)蒙古族1622.7866.21681.11869.21939.22704.2汉族(宁夏)0.0351506.1769.4374.7580.71886.4汉族(辽宁)0.0350.0001152.61860.12034.51930.1汉族(河南)0.0860.0090.0081114.71329.51192.1骊靬0.0700.0070.0020.005214.92155.2裕固族0.0790.0240.0160.0340.0072358.2汉族(闽南)0.1710.0490.0430.0180.0410.079MDS分析结果图4欧亚人群两两Rst遗传距离的多维尺度分析图。系统进化分析结果图5基于邻接法构建的系统进化树。枝内侧的数字是模拟1000次后所得的支持率(%)。突尼斯人被设为外群。单核苷酸多态性(SingleNucleotidePolymorphism,SNP)
SNP是指基因组内DNA中某一特定核苷酸在位置上存在置换、插入、缺失等变化,而且其中最少有一种等位基因在群体中突变频率不小于1%.SNP一般以替换为主,颠换与转换之比为1:2.转换(transition):嘌呤代替嘌呤,或嘧啶代替嘧啶颠换(transversion):嘌呤被嘧啶所替代或嘧啶被嘌呤所替代。
优点SNP用作遗传标记具有以下优点:(1)SNP在人群中是二等位基因性的,在任何人群中其等位基因频率都可估计出来。(2)它在基因组中的分布较微卫星标记广泛得多。(3)与串联重复的微卫星位点相比,SNP是高度稳定的,尤其是处于编码区的SNP(cSNP),而前者的高突变率容易引起对人群的遗传分析出现困难。优点(4)部分位于基因内部的SNP可能会直接影响产物蛋白质的结构或基因表达水平,因此,它们本身可能就是疾病遗传机制的候选改变位点。(5)易于进行自动化、规模化分析,缩短了研究时间。由于SNP的二态性,非此即彼,在基因组筛选中SNPs往往只需+/-的分析,而不用分析片段的长度,这就利于发展自动化技术筛选或检测SNPs。SNP应用用于构建遗传图谱.用于疾病诊断.用于分子进化分析SNP检测rs10181656DHPLC法检测SNPrs10181656CCGGCGGG+GGCC+CCCC+GG测序法检测SNP端粒(telomere)以线性染色体形式存在的真核基因组DNA的末端的一种特殊结构,是一段DNA序列和蛋白质形成的一种复合体。保守序列:TTAGGG重复序列.基因家族(genefamily)
指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因。假基因(pseudogene):在多基因家族中有的成员并不能表达出有功能的产物。球蛋白基因特征1、核酸序列相同:即为多拷贝基因如rRNA基因家族,tRNA基因家族,组蛋白基因家族。2、核酸序列高度同源:如人类生长激素基因家族包括三种激素的基因,人生长激素、人胎盘促乳素和催乳素,它们之间高度同源。3、编码产物有同源功能:基因序列的相似性可能较低,但基因编码的产物具有高度保守的功能区。如src癌基因家族特征4、编码产物具有小段保守基序:有些基因家族中各成员的DNA序列可能不明显相关,而所编码的产物却有共同的功能特征,存在小段保守的氨基酸基序。基因超家族(genesuperfamily)指一组由多基因家族及单基因组成的更大的基因家族,它们的结构有不同的同源性,功能并不一定相同。如免疫球蛋白基因超家族。转位因子(transposableelement)可移动的基因成分,指能在一个DNA分子内部或两个DNA分子之间移动的片段。在细菌中可指在质粒和染色体之间或在质粒和质粒之间移动的片段。主要类型插入序列(insertionsequence,IS)转座子(transposon,Tn)逆转录转座子(retroposonsorretrotransposon)转座的噬菌体(transposablephage)插入序列Insertionsequence一类简单转位因子,长度约700~2000bp,由一个转位酶基因及两侧的反向重复序列(invertedrepeatsequence,IR)组成,不带任何其它基因。转位时复制宿主靶位点一小段DNA(4~15bp)形成两端的正向重复序列。转座子(transposon,Tn)
一类较大的可移动成分。除有关转座的基因外,至少带有一个与转座作用无关并决定宿主菌遗传性状的基因。转座子中的转位酶常称为转座酶,其功能是介导转座子插入到DNA的其它部位。逆转录转座子
retroposons
orretrotransposon
逆转录转座子又称“反转位子”。这些流动的遗传元素首先被转录成RNA,然后再被由该反转位子本身产生的一种逆向转录酶重新转变成DNA。该DNA版本可在任何位置结合进基因组中。LTR逆转录转座子在结构、转录特性和转座机制上十分类似于逆转录病毒的原病毒,在其两端具有长的同相重复序列(LTRs)有与逆转录转座子类似的序列结构,但两端缺少长的同相重复序列。典型的是长散布元件(longinterspersedelement,LINE)转座的噬菌体
(transposablephage)
具有转座功能的溶源性噬菌体与基因表达的关系插入编码区插入5’侧向序列可在不同个体中起作用1984年McClintock就提出转座子在植物基因组的重建中起着很重要的作用。转座子在调节和编码区域的插入和切除都能改变基因的编码功能和表达模式,但在抗病基因分子生物学的研究中,尚未有证据直接证明抗病基因座中新的专化性抗性基因的产生是由转座子的插入或切除所致。不过已有试验表明,由转座子诱发的基因改变能引起抗病基因的失活和多样化。例如,玉米抗圆斑病基因Hml的突变等位基因中发现有一个315bp(dHBr)的插入,在一玉米近交系中正是一个256bp的转座子的插入改变了Hml的抗性,导致1938年叶斑和穗腐病的发生。亚麻中,也发现2个L6突变体由于小片段(300bp)因子的插入导致该抗性基因失活。转座子通常会造成
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- VB调试技巧试题及答案解析
- 气象电力服务合作协议
- 灯饰照明行业新年个人工作计划
- 提升员工忠诚度的策略计划
- 【通辽】2025年内蒙古通辽市扎鲁特旗教体系统事业单位招聘工作人员30人笔试历年典型考题及考点剖析附带答案详解
- 2025市区办公室租赁合同范本
- 网络管理员基础知识试题及答案资源
- 企业管理中的风险评估实践与应用试题及答案
- 2025年软件设计师行业发展趋势试题及答案
- 行政法学重要实例分析试题及答案
- 2024年铁路线路工(技师)技能鉴定理论考试题库(含答案)
- 《无人机艺术摄影》课件-项目7 全景影像航拍
- 变电站新建工程三通一平场地平整施工方案
- 牛羊肉采购合同范本
- DLT 5434-2021 电力建设工程监理规范表格
- 拓展低空经济应用场景实施方案
- 托育机构消防安全培训
- 《现代库存管理:模型、算法与Python实现》 课件全套 杨超林 第1-17章 现代库存管理概述-某家电企业H的制造网络库存优化实战
- (正式版)QBT 5998-2024 宠物尿垫(裤)
- (正式版)HGT 6276-2024 双酚F型环氧树脂
- 补习班辅导班学员合同协议书范本
评论
0/150
提交评论