后基因组计划.doc_第1页
后基因组计划.doc_第2页
后基因组计划.doc_第3页
后基因组计划.doc_第4页
后基因组计划.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

后基因组计划post genome project定义:基因组全序列测定完成后,对基因组的结构、表达、修复、功能等进行研究的计划。包括功能基因组和蛋白质组等研究的国际合作计划。人类基因组计划的提出与实施1986 年, 美国著名生物学家, 诺贝尔奖获得者索尔克研究所的雷纳多一杜尔贝卡(Renato Dulbecco) 在科学杂志上发表文章提出应从整体上研究人类的整个基因组, 认识人类所有的基因, 这是任何一个实验室难以承担的, 应成为国家级乃至世界级的计划, 并呼吁合作进行人类基因组测序。1988 年2 月美国国家研究委员会( NRC ) 签署了人类基因组计划(HGP) , 呼吁分阶段完成的方法, 投资相应增加到一年2 亿美元。10 月, NIH( 国立卫生研究院) 和DOE( 美国能源部) 宣布, 10 月1 日为GHP 的官方起始时间。拟在15 年内至少投资30 亿美元分析人类基因组,不久该计划成为由多国政府支持的国际项目, 先后有美、日、英、德、法、中国6 个国家参加, 16 个实验室及1100 多名生物学家、计算机专家、技术人员参与。人类基因组计划的主要科学目标搞清人类基因组序列和结构, 确定人类基因组携带的全部遗传信息, 建立人类遗传物质的一整套信息数据库, 是人类基因组计划的主要科学目标。具体体现在遗传图、单核苷酸多态性图(SNP) , 物理图、序列图和转录图5 张图谱上人类基因组图谱和初步分析结果遗传连锁图: ( gene lingage map) 遗传图是指基因或DNA 标志在染色体上的相对位置与遗传距离。是基因位点的位置图, 用交换机率来表示。通过遗传图的研究我们可以了解各个基因或DNA 片段之间的相对距离和方向, 而相对距离则是通过遗传连续分析获得的, 目前已有7000 多个信息丰富的遗传标记, 分辨率己达0. 7cm, 己能满足单基因性状的定点克隆要求, 也为多基因定位奠定了基础; 用DNA 标记将人的基因组分成数千个区域进行研究, 通过连锁分析将某一基因定位于标记所想提示的己知区域。最初进行连锁分析是利用限制性片段长度多态性( RFLP) 作为标记, 后来用可变数目的的串联重点( var iable number of tandom repeats, VNTR ) 短串联重复( short tandom repeats, STR) 等标记系统。2. 3. 2单核苷酸多态性图(SNP) 虽然人类基因组99. 9%序列相同, 但仅有不足0. 1 包括与疾病有关的差异, 将这些差异称为单核苷酸多态性( single nucleotide polymor phism , SNP) 每个人都有微小的单核苷酸差异。目前, SNP 以有儿十万种, 无须用电泳分析, 因此, 用SNP 作为遗传图谱有良好的优越性和实用性。2. 3. 3物理图谱物理图是用生物学方法定位的基因DNA 序列上两点之间的实际距离。是基因之间物理长的距离, 用bp 长序表示。物理图有两个方面, 一是由一段己知序列为标记的STS 作为基因组的物理路标, 现分辨率已达200kb; 二是以DNA 克隆片段相互连接的“重叠群”作为基因组研究的操作材料, 现已完成90%以上。2. 3. 4序列图谱就是对已经排列的DNA 片段重叠逐个测序使测序长度不断延伸。序列图也是人类基因组计划中最实质的内容。序列图为分子水平的物理图。2. 3. 5基因图谱( 转录图) 基因图谱是基因图的雏形, 获得详细的核苷酸序列图后, 便可在人类基因组序列中确定基因的位置、结构与功能。而功能图谱称后基因组计划或功能基因组学, 如蛋白质组学、生殖基因组学。人类将研究基因的多样性、遗传性疾病的发展机制和基因的表达调控等问题。目前, 研究结果表明人类基因组由31. 647 亿个碱基对组成, 共有3 万至3. 5 万个基因比线虫多1 万个, 比果蝇多2 万个, 也比原来估计的6 万一10 万个基因小的多。并发现人类种族在基因上的差异不明显, 人类基因突破都在Y 染色体上。人类后基因组研究人类后基因研究涉及的主要内容包括人类基因的识别与鉴定、基因功能的研究、蛋白质组学的研究、基因组与生命形成和生物形态进化的关系研究等内容, 目前基因功能的研究和蛋白质组学的研究是弄清基因功能与实际应用的重中之重。 4. 1基因功能的研究人类后基因组研究的关键是基因功能的研究, 是开发利用基因功能的基础, 内容包括基因功能信息的提取与鉴定, 利用生物技术如原位杂交、PCR, 为点阵技术绘制基因表达图谱。4. 2蛋自质组学的研究蛋白质组学的研究即蛋白质谱的建立与基因相互关系的研究, 包括识别蛋白质片段; 构建基因组相互作用图; 对晶体蛋白质、水溶性蛋白质进行空间构型分析; 建立蛋白结构数据库; 对蛋白质的结构与功能及其与基因的作用进行阐释。一、基因组学( Genom ics) 1986年由美国科学家Thomas Roderick提出, 指对所有基因进行基因组作图、核苷酸序列分析、基因定位和基因功能分析的一门科学。基因组研究主要包括两方面的内容: 以全基因组测序为目标的结构基因组学( Structura lGenom ics)和以基因功能鉴定为目标的功能基因组学( FunctionalGenom ics) , 后者又往往被称为后基因组学。功能基因组学是利用结构基因组学提供的信息和产物, 通过在基因组或系统水平上全面分析基因的功能, 使得生物学研究从对单一基因或蛋白质的研究转向对多个基因或蛋白质同时进行系统的研究。功能基因组学核心问题一般包括:1、 基因组多样性、2、 遗传疾病产生的起因、3、 基因表达调控的协调作用以及蛋白质产物的功能等。4、 模式生物体在研究功能基因组学中也起到了重要的工具作用。5、 此外, 生物信息学是对功能基因组学数据进行储存、分析和发掘的基本手段, 主要体现在数据库对数据的储存能力上和分析工具的开发上。功能基因组研究进展到以下几个方面: 全长cDNA 克隆与测序; 获得DNA 芯片等基因转录图谱; 突变体库的构建; 高通量的遗传转化鉴定系统; 生物信息技术平台与相应数据库的构建; 以研究基因组表达的全部蛋白质及其相互作用为主要内容的蛋白质组学( Proteom lcs)。1. 基因组多样性的研究人类是一个具有多态性的群体。不同群体和个体在生物学性状以及在对疾病的易感性上的差别, 反映了进化过程中基因组与内、外环境相互作用的结果。开展人类基因组多样性的系统研究, 无论对了解人类的起源、进化和迁徙, 还是对生物医学, 均会产生重大的影响。已知人类基因组DNA 序列中最常见的变异形式是SNP。当SNP 位于基因的编码序列中即称为cSNP。cSNP引起蛋白质重要部位氨基酸的变异, 可导致其功能改变; 位于基因调控序列中的SNP 则可能影响基因表达的剂量。故这两种SNP 的生物学意义更为显著, 是基因组中决定人类表型多样性的核心信息。另一方面, SNP因连锁不平衡( LD )所形成的单倍型, 也可用于关联研究来确定与之连锁的生物学性状相关序列。目前, 已发展了多种自动化和批量化检测SNP 的技术, 其应用范围十分广泛, 包括连锁分析与基因定位; 疾病的关联研究; 多基因疾病的基因定位; 个体识别和亲子鉴定, 发病机理的研究; 以及研究生物进化, 生物间相互关系等。2.疾病的基因组学绝大多数人类疾病是基因组信息与环境因子相互作用的结果。1997年, 美国提出了环境基因组学计划( EGP) , 其目的是了解环境对人类疾病的影响和意义。过去的30多年里, 科学家们已经在人类基因组的2. 3万个基因中发现了350多个与癌症有关的基因。2008年, 人们在乳腺癌和结直肠癌、胰腺癌、白血病以及胶质瘤的全基因组序列分析上取得重要的进展。2008年9月份, 约翰霍普金斯大学K mi mel肿瘤研究中心在科学杂志上首次发表了胶质瘤肿瘤患者的全基因组序列分析图谱, 发现在胶质瘤中有很多在该研究领域从未报道过的基因发生改变, 如IDH1 基因。随后, 自然杂志发表了第一例急性髓性白血病肿瘤病人的全基因组DNA分析结果, 研究小组在患者发生突变的10个基因中发现, 仅有2个是以前报道过敏与肿瘤发生发展相关的基因, 而其他8个均是功能未知的基因。 3. 基因组的表达调控及功能蛋白质组学在基因转录表达及其调控的研究方面, 已知一个细胞的转录表达水平能够精确而特异地反映其类型、发育阶段以及反应状态, 是功能基因组学的主要研究内容之一。为了能够全面而不是孤立地评价全部基因的表达, 需要建立全新的工具系统, 其定量敏感度应达到1个拷贝/细胞, 定性敏感度应能够区分剪接方式, 还须达到检测单个细胞的能力。近年来发展的DNA 芯片以及微量RNA 探针制备技术已基本达到了这些目标。目前, 应用DNA芯片检测基因组表达谱的主要瓶颈, 已经是如何设计新的软件和算法, 对生物芯片所产生的大量信息在生化通路和调控网络的水平进行分析和整合。蛋白质组( proteom e )是由澳大利亚学者Wasinger 等于1995年提出的, 是指由基因组编码的全部蛋白质。蛋白质组学( proteom ics) 就是指研究细胞内所有蛋白质及其动态变化规律的科学。蛋白质组分析主要涉及两个步骤: 蛋白质的分离和蛋白质的鉴定。用于蛋白质分离的技术主要有双向凝胶电泳( Dmi ens ional Gel E lectrophores is, DGE)。用于蛋白质鉴定的技术有Edman降解法测N 端序列、质谱技术(M ass Spectrom etry, MS)和氨基酸组成分析等。4.模式生物体研究模式生物体是功能基因组学的研究工具。模式生物包括: 酵母( yeast)、大肠杆菌( Escherichia coli)、果蝇( Drosophila m elanogaster )、线虫( Caenorhabdit is elegans)、小鼠(M us m usculus )、拟南芥、水稻、玉米等等。人类基因组计划在进行人类基因组测序的同时, 亦对多种模型生物的基因组进行了测序。在美国能源部及国立卫生研究院( NIH ) 的资助下, 多种重要病原及资源微生物的基因组已完成测序, 多种人和动物的重要寄生虫的基因组测序亦正在进行之中。1998 年12月发表的秀丽新杆线虫( Caenorhabditis elegans) 的基因组全序列是第1个被阐明全部基因组序列的真核多细胞生物, 为阐明人类基因的功能提供了很有价值的模型。到2000年3月17日为止, 已产生的小鼠基因剔除或其他突变模型已达到2, 282种。近年来发展的条件化基因剔除术, 已可达到对任何基因在不同发育阶段和不同器官、组织的选择性剔除。除了用同源重组技术制造基因剔除生物, 也可用化学诱变剂或插入突变方法随机诱导模式生物体的基因突变, 对产生表型变化者利用快速基因定位法识别致病基因。例如德国科学家率先应用突变诱导剂ENU 对斑马鱼和小鼠胚胎干细胞( ES细胞)进行大规模随机致突变和表型筛查, 取得了很大成功。此外, 近年来, 有人利用组合化学方法尝试针对蛋白质的化学剔除试剂, 用来激活或失活各种蛋白质。7. 生物信息学和数据库生物信息学是以计算机为工具, 用数理及信息科学的理论和方法研究生命现象, 对生物信息进行储存、检索和分析的一门学科。在后基因组时代, 如果在已完成基因组测序的物种之间进行整体的比较、分析, 希望在整个基因组的规模上了解基因组和蛋白质组的功能意义, 包括基因组的表达与调控、基因组的多样化和进化规律以及基因及其产物在生物体生长、发育、分化、行为、老化和治病过程中的作用机制都必须发展新的算法以充分利用超级计算机的超级计算能力。生物信息学将生物遗传密码与电脑信息相结合, 通过电脑的各种程序软件将已知的大量的核酸、蛋白质等生物大分子的核苷酸序列进行分析、计算, 揭示遗传信息; 通过对生物信息的查询、搜索、比较、分析, 从中获取基因编码、基因调控、核酸和蛋白质结构功能及其相互关系等理性知识, 推断已知序列的功能; 在大量信息和知识的基础上, 探索生命起源、生物进化以及细胞、器官和个体的发生、发育、病变、衰亡等生命科学中重大问题, 在研究清楚它们的基本规律和时空联系的基础上, 建立生物学“元素周期表”。生物信息学在医学领域已广泛应用并取得了巨大成就, 体现在以下方面: 海量生物信息数据的管理, 基因组序列分析和解释、药物设计、基因多态性分析、基因表达调控、疾病相关基因鉴定、基因产物结构与功能预报、基因进化、基于遗传的流行病学等。同时, 还要加强生物信息学分析方法研究, 以解决其自身发展过程中所出现的新的挑战。二、蛋白质组研究的现状和前景蛋白质组研究仍需用经典的蛋白质研究方法,但准确度、灵敏度、可重复性已有数量级的提高;同时也采用了崭新的质谱技术,这些技术为蛋白质组研究提供了现实的可行性,但是仍然存在许多关键性的困难需要克服,更有待建立和发展新的技术才能满足蛋白质组研究的需要。蛋白质组的研究虽然也是研究蛋白质,但已经不是常规的蛋白质研究,而是要研究一个细胞的由基因组的表达决定的全部蛋白质或蛋白质的总体。可以把在蛋白组水平上对基因调控的研究分成四个方面:分子解剖学 (细胞和组织的蛋白质组的总体组成);分子生理学 (在不同生理条件下,由于细胞所处宏观或微观环境变化所引起的蛋白质组的变化);分子病理学 (用蛋白质表达和修饰的变化分析疾病);分子药理学.毒理学 (药物或异体物质对蛋白质表达和修饰的作用)。但是蛋白质组研究最核心的问题无疑还是细胞所有蛋白质结构的测定,人蛋白质组中数以百万计的蛋白质的鉴定,可以从低等生物蛋白组的研究中得到重要的线索,大肠杆菌和酵母的蛋白质组研究得相对较多。以大肠杆菌为例,通过生物信息学可以把基因组数据与从二维电泳得到的蛋白质组的信息联系起来。现在已经有 6个基因-蛋白数据库。最近发表的一个数据库收集了 1 550个蛋白点,鉴定了其中的 387个蛋白。酵母有 6 430可译框架 (O R F) ,但是仍有 40%的基因未被鉴定或与其他已被鉴定的基因没有明显类似性,必须经蛋白质组研究才能完全了解基因的功能。酵母蛋白数据库 (YD P )第六版,含有 6021个蛋白的预测序列和氨基酸组成,实际上已经代表了酵母的蛋白质组。在二维电泳上可以分出约 600个蛋白点,其中 169个得到鉴定,占酵母含量丰富蛋白中的 80%。不同有机体的蛋白质组对那些对生命基本活动至关重要的看家蛋白,必然在进化上有其保守性,因此低等生物蛋白组的研究会非常有助于人基因组相应蛋白的鉴定。2蛋白质组研究的主要手段相对于基因组研究的进展速度 ,蛋白质组的研究显得相对滞后 ,主要原因是研究手段中众多技术问题尚未很好解决。分析全部十万个基因的功能 ,最直接的是蛋白质组研究。而从这几年中对基因组全序列分析已经完成的一些低等生物蛋白质组的研究看来,目前最现实、最有效的技术是双向凝胶电泳分离纯化蛋白质,结合计算机定量分析电泳图谱,并进一步用质谱对分离到的蛋白质进行鉴定,并运用现代生物信息学的知识和技术对其得到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论