医学分子遗传学第3章 人类基因组计划_第1页
医学分子遗传学第3章 人类基因组计划_第2页
医学分子遗传学第3章 人类基因组计划_第3页
医学分子遗传学第3章 人类基因组计划_第4页
医学分子遗传学第3章 人类基因组计划_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章人类基因组计划

与蛋白组计划医学遗传学研究室人类基因组:指人的所有遗传信息的总和。人类基因组包括两个相对独立而相互关联的基因组:核基因组与线粒体基因组。如果不特别注明,人类基因组通常是指核基因组。第一节人类基因组和基因组学从经典遗传学:人类基因组是指所有决定人体遗传性状的2万~2.5万个基因的总和。从信息学的角度来说,人类基因组是指单倍体细胞所代表的遗传信息。从细胞遗传学:人类基因组是指人体细胞中的24条不同的染色体,即1~22号常染色体,X与Y染色体的总和;从分子遗传学:是指组成这些染色体的24条DNA分子(以及线粒体DNA分子)的总和,即人类基因组所含的3×109核苷酸。基因组学(genomics)是研究基因组的科学。它与遗传学的共同之处是研究基因。区别之处:研究的对象与范围:遗传学的一般对象只是决定表型的基因的结构、功能与调控;而基因组学则包括所有的基因与非基因序列;研究的策略:遗传学只是研究个别的基因,尽管包括基因之间的关系,而基因组学的最重要的特点是在整个基因组的层次上,总体研究某一物种的所有基因的结构与功能,以及所有物种细胞的基因组在结构与功能上的异同与关系,而不是仅仅着眼于某一个或几个具体的基因。在使用“基因组”这一词时,通常注意一些特殊场合。如在任一组织(除了单倍体的配子外)与细胞中提取的DNA,或以这些DNA制备的文库,都称为“基因组DNA”或基因组文库。这里实际上是指二倍体细胞的DNA。“基因组克隆或片段”则是指来源于基因组文库的DNA克隆或片段。因为除了外显子序列外,还含有这一基因的全部或一部分外显子、内含子或其他部分的克隆或片段。第二节人类基因组计划

HumanGenomeProject(HGP)HGP是20世纪90年代初开始的全球范围的全面研究人类基因组的重大科学项目。

HGP是美国科学家1985年率先提出、1990年实施的、旨在阐明人类基因组DNA3.2x109bp序列,发现所有人类基因并阐明其在染色体上的位置,破译人类全部遗传信息,使得人类第一次在分子水平上全面的认识自我的一项宏伟的科学工程。HGP的基本任务:是建立人类基因组的结构图谱,即遗传图、物理图与序列图,并在“制图—测序”的基础上鉴定人类的基因,绘出人类的基因图。遗传图和物理图的构建经历了由简单到复杂、粗放到精细的过程,均取得了长足进展,为下一步人体基因的定位克隆、基因鉴定及其全基因组测序奠定了基础。2000年6月6日10时,美国总统克林顿宣布了有我国科学家参加的DNA片段覆盖97%的人类基因组、85%的基因组序列已经组装起来的“工作草图”已经完成并公布。这是人类科学史上又一里程碑式的创举。国际人类基因组中国部分,即1%序列“工作框架图”已于日前完成,我国科学家与国际同行同步进入第二阶段,即全面完成一张完整的“人类基因组DNA序列图”,这一阶段的工作包括填补现有的序列之间的空隙,将人类基因组整体序列的准确率提高到99.99%。新华网北京6月28日电:当时的中共中央总书记、国家主席江泽民这一天在中央思想政治工作会议上说,人类基因组计划是人类科学史上的伟大科学工程,它对于人类认识自身,推动生命科学、医学以及制药产业等的发展,具有极其重大的意义。经过全球科学界的共同努力,人类基因组序列的“工作框架图”已经绘就,这是该计划实施进程中的一个重要里程碑。人类基因组序列是全人类的共同财富,应该用来为全人类造福。……。希望我国科学家再接再厉,为人类基因组最终序列图的完成,为我国在功能基因组学中的创新研究,作出更大的贡献。2001年2月12日,上述6国科学家公布人类基因组图谱及初步分析结果。这次公布的人类基因组图谱是在原“工作框架图”的基础上,经过整理、分类和排列后得到的,它更加准确、清晰、完整。对它的初步分析表明:人类基因组:31.647(≈32)亿个碱基对共有2.6383(≈3)万~3.9114(≈4)万个基因,比蚯蚓仅多1万个,比果蝇多2万个,远小于原先10万个基因的估计。2004年,确定人类基因数量:20000~25000个。科学家还发现与蛋白质合成有关的基因只占整个基因组的2%。据新华社2001年8月27日报道,HGP中国项目联络人杨焕明教授今天表示,随着人类基因组”中国卷”的绘制完成,这一区域的基因数目也终于水落石出,我国科学家识别出122个基因,其中36个为首次发现的新基因。随着HGP的迅速推进,结构基因组学的研究已接近尾声,大量基因的发现和大规模序列数据库的建立促使了功能基因组学研究计划启动,如人类基因组多样性计划、环境基因组计划、疾病基因组学和药物基因组学等.一个以蛋白质组(proteome)为研究重点的后基因组时代已经拉开序幕。后基因组计划将诠解和开发基因组,以使人类更好地认识和利用基因组。如据1999年10月报道,由美、英、日三国科学家组成的研究小组破译了人体中最小的第22号染色体的密码,发现了这号染色体上所有碱基对的准确位置,共计有6000万个bp。据认为在这号染色体上有与神经纤维肉瘤等遗传病相关的基因,破译其遗传密码,将有助于发现一些遗传病治疗的方法。随着高分辨率遗传图、物理图谱和基因组序列图的人类结构基因组学的基本完成,目前在染色体上定位并明确其功能的基因大约有3700个,被鉴定基因已达7484个,约10000条人类基因的序列被克隆。其中单基因遗传病的基因定位和克隆进展迅速,有1000多种疾病基因被定位,100多种疾病基因被克隆。据1999年10月报道,意大利科学家发现并分离了遗传性耳聋基因。2001年8月28日发表的<<美国国家科学院报>>刊登了一篇震惊世人的最新研究报告,报告显示遗传物质是控制人类寿命的最主要因素,而控制寿命的长寿基因位于第四号染色体。多基因病的易感基因的定位也已成为可能,如哮喘、Alzheimer病和精神分裂症等的基因定位和克隆。目前遗传病致病基因的定位和克隆的焦点正由单基因病向多基因病转移。多基因病,诸如哮喘、糖尿病、Alzheimer病、精神分裂症、高血压、动脉硬化等,发病率高,主要影响成人,危害大,其研究意义远比单基因病大得多。在一些发达国家,在一定程度上掌握了单基因病的研究方法之后,已转向多基因病的研究,分离有关多基因病的主基因(majorgene)。有人估计已经识别了90%以上的人类基因,第一张人类转录图(基因图)已经问世。“人类基因组计划”的最终目的是对生命进行系统地和科学地解码,以达到了解和认识生命的起源、种间和个体间存在差异的起因、解释疾病产生的机制以及生长、衰老等生命现象,从而研究和寻找治疗的手段和方法。

从基因组学的范畴来说,预计从1990~2005年,重点在于研究人类基因组的结构,属于基因组学的最基础的部分——结构基因组学的研究。人类基因组计划在科学上的意义,是奠定阐明人类所有基因的功能,即功能基因组学的基础,以及阐明地球上的所有物种的基因组结构、功能的异同与关系,即比较基因组学的基础。

一、结构基因组学我们现阶段对于人类结构基因组学(humanstructuralgenomics)的认识,就是“人类基因组计划”取得的重要技术成果。这一成果,遗传集中反映在遗传图、物理图、转录图、序列图,以及在此基础上的“基因图”的建立。㈠遗传图

遗传图(geneticmap)又称“连锁图。是以具有遗传多态性的遗传标记作为“位标”,以遗传学距离为“图距”的基因组图。遗传标记:指在基因组中有一定位置,并能用于检测涉及该座位的遗传重组的标记。遗传多态性:指在一个遗传座位上具有一个以上的等位基因,且各个等位基因在群体中的出现频率皆高于1%。具遗传多态性的座位,即称多态性座位,可以作为遗传图的“位标”。重组体在群体出现的机率(重组率),在经典遗传学中用来反映两个座位的距离。严格地说,重组率只在表示同一个染色体上两个座位之间的关系时,才等于遗传学距离(1%的重组率为1cM)。同一染色体上座位之间的遗传学距离是可以积加的,人类基因组的遗传距离大小为3600cM。一般来说,人类基因组“遗传图”的建立,所用的遗传标记越多(且出现频率越高越好),各个标记的多态性越高越好。作为遗传标记,还要求确定其在基因组中的位置,该座位上所有的等位基因就检测手段而言呈共显性,外显率都达100%。经典的遗传标记是当时以电泳或免疫技术可以检出的蛋白质标记(在此前连锁分析曾使用的表型也可理解为遗传标记),如我们所熟知的红细胞ABO血型座位标记,白细胞HLA座位标记等。DNA技术的建立提供了新一代的遗传标记,使经典的遗传学在人类研究方面得到了新生,并且突破了人类遗传分析的上述“瓶颈”,使人类有了先于其他任何生物,包括经典的遗传分析实验材料(豌豆与果蝇)等详细的遗传图。随“人类基因组计划”的研究和认识的深入,作为DNA的遗传标记也经历了从粗到细的转变过程,即从第一代标记到第三代标记的发展。1.第1代标记70年代中后期建立起来的限制性片段长度多态性(RFLP)方法被认为是第2代标记或第1代的DNA标记,所以仍习惯上统称为第1代标记。这类标记在整个基因组中确定的位点数目可达105以上。

RFLP作为遗传标记是Botstein等于1980年提出来的,而其用于定位疾病基因的最著名的例子便是1983年Gusella等对Huntington病(HD)基因的定位。1987年Dinis-Keller等人建立了人类第一张以RFLP为遗传标记的“遗传图”。RFLP遍布于整个基因组,但有其局限性,即由于酶切只能产生2到3个片段,所以可提供的信息量有限。有时还需用放射性同位素标记的DNA片段为探针检测RFLP,因而又存在着工作环境和费用等的问题。2.第2代标记人类基因组中的重要特点之一是存在很多重复序列,分布于基因组的很多个部位。在不同的个体或不同的染色体中,还存在有一种高度可变的串联重复顺序多态称可变的串联重复序列数目(variablenumberoftandemrepeat,VNTR)。1989年一类称作微卫星标记系统被发现和建立,它们的重复单位长度为2~6个核苷酸,有时又称作“短串联重复(shorttandemrepeat,STR)”。STR的最突出的优点是:高度多态性。由于CA等简短重复不受进化上的选择,以致于在同一位点中数目变化很大,在群体中可形成多达几十种的等位片段(多态性);用PCR技术,使操作实现自动化。由于它们在基因组中分布较广,数目多,且符合孟德尔遗传规律,因而可以为连锁分析提供足够多的遗传信息。它们是目前大规模基因组扫描方法的基础。STR的遗传学图距是以形成精子或卵子的减数分裂过程中,两个位点之间进行交换、重组百分率的结果,以cM(厘摩尔根)为单位的,反映基因遗传效应的基因组图。STR作为遗传标记使人类基因组的遗传制图与连锁分析发生了革命性的变化。法国Genethon实验室与美国国家卫生研究院几个中心合作,于1996年初已建立了有6000多个以STR为主体的遗传标记,两个标记之间的平均距离为0.7cM,即两个位点之间有0.7%的机率进行遗传重组。3.第3代标记1996年,美国MIT的Lander又提出了称之为“第三代DNA遗传标记”的单个核苷酸多态性(singlenucleotidepolymorphism,SNP)。SNP与RFLP和STR等DNA标记的主要不同,是不再以“长度”的差异作为检测手段,而直接以序列的变异作为标记。所有“遗传多态性”的分子基础都是核苷酸的差异。在理论上,SNP有可能在核苷酸水平上,把“序列图”、“物理图”与“遗传图”最终有机地整合、统一起来。㈡物理图(physicalmap)作为人类基因组计划技术内容之一的物理图,是以一段已知核苷酸序列的DNA片段,称为序列标记部位(sequencetaggedsite,STS)为“位标”,以Mb或Kb作为图距的基因组图。物理图的基本原理是把庞大的无从下手的人类基因组先“敲碎”,再拼接,以便既能随意研究又能清楚地知道研究内容所处的染色体位置。物理图以Mb、kb、bp作为图距,以DNA探针的STS序列为路标。至今已测定了40000个以上的STS,平均图距(即分辨率)可达100kb。因此,人类这个庞大的基因组已被分成具有界标的至少40000个小区域。对STS的要求,只要:①在基因组中有明确的位置;②一段已知的序列。因此,STR一旦被确定了位置就可以作为STS使用,也可以被称为STS。1996年10月已建立了有22000个STS(包括一些STR)的物理图。X染色体物理图的平均分辨率已达75kb。

构建物理图的一个主要内容是把含有STS对应序列的DNA的克隆片段连接成相互重叠的“片段重叠群(contig)”。“片段克隆群”的实验标准就是这些片段都被证明含有一STS的序列,用PCR即可以证明某个STS在这些片段都呈阳性,这也就确定了这些片段在基因组中的位置。

㈢序列图人类基因组的核苷酸序列图(sequencemap)也就是分子水平的最高层次的、最详尽的物理图。测定的总长度约为一米,由30亿核苷酸组成的序列图是人类基因组计划中最为明确、最为艰巨的定量、定质(准确性)、定时(2005年前完成)的任务。2000年6月已完成了人类基因组全部测序的工作草图,不仅覆盖97%的基因组,而且85%的基因序列已经组装起来,其准确率达到96%。㈣转录图(基因图)转录图最终将成为基因图,就是在人类基因组中鉴别出占据2%~5%长度的全部基因的位置、结构与功能。现已确定,人类有2万~2.5万个蛋白编码基因。所有生物的性状,包括疾病,都是由蛋白质决定的。而已知的所有蛋白质都是由RNA聚合酶Ⅱ指导的、带有多聚A“尾巴”的mRNA依照“遗传密码”编码的。在整个人类基因组中,只有1%~5%的DNA序列为编码序列。在人体特别是成年个体的每一特定组织中,细胞内一般只有10%的基因是表达的。一张人类基因的转录图亦称cDNA图(包括基因的cDNA片段,即表达序列标记,expressedsequencetag,EST)或“表达序列”图,就是人类的“基因图”的雏形。基因图谱的意义在于它能有效地反映在正常或受控条件中表达的全基因的时空图。有了“正常”的基因图谱,就奠定了构建特定生理条件下与“异常”病理情况下cDNA差异图的基础,以此将为21世纪的基因医学绘制出指导性蓝图。人类历史上的第一张人体解剖图,曾解开人类机体之谜,奠定了近代医学的基础。人类基因组计划所提供的这四张“图”,组成了不同层次的、最终为分子水平的人类的“第二张解剖图”。它揭开了决定人类生、老、病、死的所有遗传信息——基因组之谜,将成为人类认识自我的用之不竭的知识源泉,并奠定二十一世纪生物学、医学的进一步发展与新的飞跃的基础。二、功能基因组学结构是功能的基础。“人类基因组计划”的成果所提供的对人类基因组结构的认识,为进一步了解人类基因组的功能奠定了基础。

功能基因组学:就是在基因组的层次上,研究所有基因的表达、调控与功能。人类基因图的雏形——“转录图”,是最初步的人类基因组功能图。基因的功能首先反映于基因的转录、表达。转录图除了提供基因序列的结构信息外,还提供了该基因表达的组织、发育阶段、生理状况的信息。人类的疾病,包括对疾病及病原微生物的易感性,都涉及到基因的结构与表达的改变,而根据“基因表达图”上某一基因表达的改变,又反过来助于鉴定基因的功能,阐明基因与疾病或病理学的关系。

可以设想,在不久的将来,我们每一个人,都将有自己的“序列图”的光盘,以检查基因结构引起的健康问题,又可以比较不同组织的“转录图”来检查基因的表达改变所引起的健康问题,这将意味着人类进入名副其实的基因医学的阶段。

“人类基因组计划”的启动,导致了比较基因组学(comparativegenomics)、工业基因组学(industrialgenomics)、药物基因组学、疾病基因组学的产生和发展。㈠比较基因组学

比较基因组学:指在基因组的层次上,比较不同基因组之间的异同。致病基因的鉴定、肿瘤“表达图”的构建,及不同组织、不同时间的“基因图”的构建,都已属于比较基因组的范畴。“人类基因组计划”中的“模式动物”基因组研究,更是比较基因组学的重要内容。比较基因组学有两个内容:一是不同物种基因组的比较:基因组学在人类基因组研究中的成功,使它很快进入了所有其他生物基因组的研究。“人类基因组计划”的四大模式生物——酵母、线虫、果蝇、小鼠,在人类基因组研究与人类基因鉴定中已发挥了重要的作用。水稻、油菜、拟南芥等具经济或研究意义的植物,牛、猪、羊等经济动物的基因组研究几乎都开始。上述生物的基因组图建立后,都因生物进化的连续性而成为比较基因组学的研究内容,而与人类疾病相关的病原微生物的基因组全序列分析,因其医学和经济意义已成为热点。1995年7月,第一个能独立生存的致病菌嗜血流感病毒全序列(1.8Mb)完成。以下也接近完成:支原体(Mycoplasmagenitalium)幽门螺旋菌(Helicobacterpylori)金黄葡萄球菌(Staphylococcusaureus)结核杆菌(Mycobacteriumtuberculosis)肺炎链球菌(Streptococcuspnenmoniae)二是人类不同基因组的比较:不同的人种、不同的族群、不同的群体以及不同的个体在其遗传性状

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论