基因组学与蛋白质组_第1页
基因组学与蛋白质组_第2页
基因组学与蛋白质组_第3页
基因组学与蛋白质组_第4页
基因组学与蛋白质组_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因组学与蛋白质组学GenomicsandProteome1基因组(Genomics)指一个生物体、细胞或病毒的全部遗传物质2几个代表物种的基因组大小3一、人类基因组计划的启动

1986年诺贝尔奖获得者R.Dulbecco(杜尔贝科)提出人类基因组计划——测出人类全套基因组的DNA碱基序列(3X109bp)41975年,获诺贝尔生理医学奖 56

美国政府决定于1990年正式启动HGP,预计用15年时间,投入30亿美元,完成HGP。

由国立卫生研究院和能源部共同组成“人类基因组研究所”

逐渐地,HGP扩展为多国协作计划。参与者包括:英、日、法、德和中国(1993年)7

二、人类基因组计划的进展状况

(1)截至1998年10月,完成1.8X108bp,占计划的6%。

(2)完成一系列模式生物全基因组测定。

这些模式生物全基因组测定的完成有重大理论与现实意义。8

(3)DNA测序技术飞速提高

1998.5.9

J.C.Venter等宣布,组建商

业公司,投入3亿美元,3年内完成。

接着又有若干家公司成立,共投入资金约几十亿美元,形成“公”“私”并进

格局92000.6

完成并公布人类基因组工作框架图(90%)。

10二000年六月二十六日克林顿宣布人类基因组草图绘制完成11美国国家人类基因组研究所所长弗朗西斯·柯林斯在介绍情况。

12人类基因组草图基本信息由31.65亿bp组成含3~3.5万基因与蛋白质合成有关的基因占2%人类基因组人类蛋白质61%与果蝇同源43%与线虫同源46%与酵母同源132000年6月公共领域测序计划工作框架图14

2000年12月美、英等国科学家宣布绘出拟南芥基因组的完整图谱,这是人类首次全部破译出一种植物的基因序列。152001年2月16日

人类基因组“精细图”完成,(99%),16同时发表论文

美国Science,Vol.291,No.5507

英国Nature,Vol.409,p.860

17DAN测序胶图182003年4月14日,人类基因组序列图亦称“完成图”(99.99%),提前绘制成功。19第一节基因组学Genomics20一、基因组学基因组学(Genomics)阐明基因组的结构、探讨结构与功能的关系以及基因与基因之间相互作用的科学。

包括:结构基因组学(structuralgenomics)功能基因组学(functionalgenomics)比较基因组学(comparativegenomics)21基因组学包括3个不同的亚领域结构基因组学(structuralgenomics)功能基因组学(functionalgenomics)比较基因组学(comparativegenomics)基因组学概念22二、结构基因组学结构基因组(structuregenomics)以生物体全基因组的结构为研究对象,对其进行分区和标记,使之成为比较容易操作的小的结构区域,确定染色体基因组全部DNA序列、各基因所在的位置以及结构与功能的关系,为阐明基因功能奠定基础。23(一)结构基因组主要内容

通过基因作图、序列分析及基因鉴定,建立具有高分辨率的生物遗传图谱、物理图谱、转录图谱和序列图谱。241、遗传图谱(geneticmap)

指基因或DNA标记在染色体上的相对位置与遗传距离。

cM(基因或DAN片段在染色体交换过程中分离的频率)

25多态性:人的DNA序列上平均每几百个碱基会出现一些变异(variation),并按照孟德尔遗传规律由亲代传给子代,从而在不同个体间表现出不同,因而被称为多态性(Polymorphism)。26第一代多态性标记是RFLP(restrictionfragmentlengthpolymorphism,限制性片段长度多态性)2728

第二代多态性标记是短的串联重复序列(shorttandemrepeats,STR)包括小卫星DNA和微卫星DNA(microsatellitesequence,MS),其多态性主要来自重复序列拷贝数的变化29小卫星DNA—由15-65bp的基本单位串联重复而成,长度一般不超过20kb。重复次数(小卫星DNA区的长度)在人群中是高度变异的;按照孟德尔的规律遗传微卫星DNA/简短串联重复(STR、STRP或SSLP)重复单元2-8bp,通常重复10-60次CTAGCTTATATATATATATATATATATATAAGCTTGC30第三代多态性标记是单核苷酸的多态性(singlenucleotidepolymorphism,SNP)31

人类99.9%的基因密码是相同的,而差异不到0.1%,不同人群仅有140万个核苷酸差异。这些差异是由“单一核苷酸多样性”(SNP)产生的,它构成了不同个体的遗传基础。在整个基因组序列中,人与人之间的变异仅为万分之一,从而说明人类不同“种属”之间并没有本质上的区别。

32遗传图谱的缺陷

分别率有限人类只能研究少数减数分裂事件,不能获得大量子代个体测序要求每个标记的间隔小于100kb

实际是599kb33遗传图谱的缺陷精确性不够经典遗传学认为,交换是随机发生的基因组中有些区域是重组热点倒位、重复等染色体结构变异会限制交换重组342、物理图以已知核苷酸序列的DNA片段(序列标签位点,sequence-taggedsite,STS)为“路标”,以碱基对作为基本测量单位(图距)的基因组图。35酵母遗传图与物理图比较A遗传图B物理图363、转录图谱(transcriptionmap)以EST(expressedsequencetag,表达序列标签)为标记,根据转录顺序的位置和距离绘制的图谱。EST:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分cDNA的5'或3'端序列称为表达序列标签(EST),一般长300-500bp左右。

374、序列图(分子水平的物理图)(sequencemap)序列图是指整个人类基因组的核苷酸序列图,也是最详尽的物理图。1m

既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和。38脉冲场琼脂糖凝胶电泳;毛细管电泳;基因芯片技术;全基因组随即测序。(二)结构基因组研究常用的方法39CREDIT:JOESUTLIFFScience,Vol291:1221.FishinginaMoreEffectiveWay!40基因组测序策略有了高密度的基因组图谱,就可以开始全基因组测序了测序的技术飞速发展,现在可以全自动化测序的策略有两个:鸟枪法克隆重叠群法41鸟枪法(shotgunsequencing)42鸟枪法的优缺点优点:不需要高密度的图谱速度快、简单、成本低缺点:拼接组装困难,尤其在重复序列多的区域主要用于重复序列少、相对简单的原核生物基因组43克隆重叠群法(clonecontig)

将基因组DNA切割长度为0.1Mb-1Mb的大片段,克隆到YAC或BAC载体上然后再进行亚克隆,分别测定单个亚克隆的序列再装配、连接成连续的DNA分子。这是一种自上而下(uptodown)的测序策略

clone-by-clonemethod44两种基因组测序策略45

三、功能基因组学

完成基因组测序,仅仅是基因组计划的第一步,更重要的工作在于弄清楚:①基因组序列中所包含的全部遗传信息是什么;②基因组作为一个整体如何行使功能。就是对基因组序列进行诠释的过程,也就是功能基因组学的研究内容。46功能基因组学(functionalgenomics)根据结构基因组学的研究结果,所提供的基因结构相关信息,采用分子生物学、生物化学和生物信息学的理论和技术,全面、系统地研究基因组中所以基因功能的学科。47根据序列分析搜寻基因

查找开放阅读框(openreadingframe,ORF)开放阅读框都有一个起始密码子,ATG,还要有终止密码子。从ATG开始,然后向下游寻找终止密码子。起始密码子和终止密码子之间的碱基数目要能够被3整除每一条链都有3种可能的阅读框,2条连共计有6种可能的阅读框.

计算机可以很快给出结果。48同源查询

利用已经存入数据库的基因序列与待查的基因组序列比对,从中查找可以与之匹配的碱基序列及其比例,用于界定基因。同源查询可以部分弥补ORF扫描的不足。49同源查询的依据

有亲缘关系的物种,基因组可能存在某种程度的相似性:存在某些完全相同的序列;

ORF的排列相似,如等长的外显子;

ORF指令的氨基酸序列相似;模拟的多肽链的高级结构相似,等。50基因功能研究

1、计算机预测基因功能

依据仍然是同源性比较。同源基因拥有一个共同的祖先基因,它们之间有许多相似的序列。种间同源基因种内同源基因

51基因功能研究2、实验确认基因功能

基因克隆基因敲除(knock-out)基因的超表达反义RNA技术

RNAi

转座子插入突变

52什么是比较基因组学?

利用生物在进化上的亲缘关系,来比较它们与人类之间的相似与相异,即比较基因组学。

5354物种完成年份总长度/Mp已完成总长的百分数/%占常染色质百分数/Mb基因数/Mb酵母19961293100483线虫19989699100197果蝇20001166497117拟南芥200011592100221人类第21染色体200034751007人类第22染色体199934709716人类全基因组(PublicSequence)20012693849012人类全基因组(CeleraSequence)200126548399-9315基本完成DNA序列分析的真核生物基因组比较55反义RNA(antisenseRNA)技术56小结转录组蛋白质组575859第二节蛋白质组学Genomics60*蛋白组(Proteome)蛋白质组是指一种生物体产生的全部蛋白质。*蛋白组学(Proteomics)以蛋白质组委研究对象、研究细胞内各种蛋白质的组成、表达及其规律的学科。611.蛋白质分离和鉴定:

2.翻译后修饰:翻译后修饰是蛋白质调节功能的重要方式,因此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作用。

3.蛋白质功能确定:如分析酶活性和确定酶底物,细胞因子的生物分析/配基-受体结合分析。可以利用基因敲除和反义技术分析基因表达产物-蛋白质的功能。另外对蛋白质表达出来后在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解。

4.对人类而言,蛋白质组学的研究最终要服务于人类的健康,主要指促进分子医学的发展。如寻找药物的靶分子。很多药物本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可以干预蛋白质-蛋白质相互作用。蛋白质组学的研究内容62蛋白质组研究更为复杂和困难:蛋白质数目大大超过基因数目。

蛋白质随时间和空间而变化。63

发展高通量、高灵敏度、高准确性的研究技术平台是现在乃至相当一段时间内蛋白质组学研究中的主要任务。

当前主要任务64二、蛋白质组的研究方法65研究蛋白质组的组成成分支撑技术主要有双向凝胶电泳、以质谱为代表的蛋白质鉴定技术及生物信息学分析。

蛋白质组表达模式(expressionprofile):66(一)蛋白质组研究中的样品制备

通常可采用细胞或组织中的全蛋白质组分进行蛋白质组分析。也可以进行样品预分级,即将细胞或组织中的全体蛋白质分成不同部分,分别进行研究。67样品预分级的主要方法蛋白质溶解性:可溶性蛋白、非溶性蛋白等蛋白质定位:膜蛋白、核蛋白等蛋白质细胞器定位:线粒体、高尔基体、叶绿体等

68

样品预分级主要作用在于提高低丰度蛋白质的上样量和检测灵敏度。69组织水平上的蛋白质组样品制备

临床样本都是各种细胞或组织混杂,而且状态不一,如肿瘤中癌变的上皮类细胞总是与血管、基质细胞等混杂。70激光捕获显微切割(lasercapturemicrodissection,LCM)

可直接在显微镜下从组织切片中精确分离特定的细胞或细胞群。

71(二)蛋白质组研究中的样品分离双向凝胶电泳two-dimensionalelectrophoresis,2-DE):利用蛋白质的等电点和分子量,结合凝胶化学特性,分离各种蛋白质的方法。72原理

第一向在高压电场下对蛋白质进行等电聚焦(IEF),再在第一向垂直方向上进行第二向SDS-聚丙烯酰胺凝胶电泳(SDS)。

1975年首先由O’Farrell等创立。73特点可分离10~100kD分子量的蛋白质高灵敏度和高分辨率便于计算机进行图像分析处理与质谱分析匹配74第一向IEF电泳

传统O’Farrell系统双向电泳的缺陷。Bjellgvist等发展并完善了固相pH梯度等电聚焦技术,GÖrg等成功地将之应用于双向电泳。

优点

75固相pH梯度等电聚焦的优点克服了载体两性电解质阴极漂移等缺点。稳定的可以随意精确设定的pH梯度。

尤其可在较窄的pH范围内进行第二轮分析,大大提高了分辨率及重复性。

76第二向SDS电泳

垂直板电泳水平超薄胶电泳772-DE技术的缺点

极酸、极碱性蛋白质,疏水性蛋白质,极大蛋白质、极小蛋白质以及低丰度蛋白质用此种技术难于有效分离。

胶内酶解过程费时、费力,难于与质谱联用实现自动化。78新型非凝胶技术

液相色谱法liquidchromatography,LC毛细管电泳capillaryelectrophoresis,CE79液质联用技术(LC-MS/MS)

蛋白质混合物直接通过液相色谱分离以代替2-DE的分离,然后进入MS系统获得肽段分子量,再通过串联MS技术,得到部分序列信息,最后通过计算机联网查询、鉴定蛋白质。

80

根据蛋白质带电性及疏水性不同,用MS分离多肽复合物。

多维色谱技术(LC/LC-MS/MS)

多维蛋白质鉴定技术(multidimensionalproteinidentificationtechnology)

81(三)蛋白质组研究中的样品分析鉴定传统方法:蛋白质微量测序氨基酸组成分析82新型蛋白质鉴定技术

——

质谱(MS)法基本原理:样品分子离子化后,根据离子间质荷比(m/z)的差异来分离并确定样品的分子量。

83“软电离”的特点分子电离时保留整个分子的完整性,不会形成碎片离子。灵敏度高、快速、能同时提供样品的精确分子量和结构信息、既可定性又可定量、并能有效地与各种色谱联用来分析复杂体系。84基质辅助激光解吸/电离飞行时间质谱(matrix-assistedlaserdesorption/ionizationtimeofflightmassspectrometry,MALDI-TOFMS)电喷雾质谱(electrosprayionizationmassspectrometry,ESI-MS)主要质谱类型85鉴定和注释蛋白质的路线通过肽质谱指纹图(peptidemassfingerprinting,PMF)和数据库搜寻匹配

通过测出样品中部分肽段二级质谱信息或氨基酸序列标签和数据库搜寻匹配

86目录87

仪器MALDI-TOF质谱仪:灵敏度高(可达fmol),分析速度快,谱图简单易于解析以及受缓冲液、盐份的干扰小88

肽质谱指纹图在数据库中匹配

不成功的可能原因

样品量太少,PMF图信噪比太低,输入库中搜寻的数据质量不好。2-DE胶上所取的一个蛋白质点并非单一蛋白质,所获PMF图实际上是两个以上蛋白质的混合图。89

操作中角蛋白或其他蛋白质的污染蛋白质发生了较多的转译后修饰,数据库中未有记载所用胰蛋白酶质量不够好,蛋白酶自酶解片段多未知的新蛋白质

数据库规模太小续:90组织切片或印片原位质谱分析技术

两级飞行时间串联质谱(MALDI-TOF/TOF)傅里叶转换回旋共振质谱(FTMS)

表面增强激光解吸/电离飞行时间质谱(SELDI-TOF-MS)

联合技术精确鉴定蛋白质

91(1)原理:将编码某一蛋白X的DNA序列与DNA结合域BD的编码序列融合形成一个杂交体,将编码另一蛋白Y的DNA序列与DNA激活域AD的编码序列融合形成另一个杂交体,当两个杂交体共转化酵母细胞(此酵母细胞上游有DNA结合位点的报告基因),若X和Y没有相互作用,则单独不能激活报告基因的转录;若X和Y可相互作用,则使BD和AD靠近形成一个有效的转录激活子,激活报告基因的转录。因此可通过检测报告基因的转录来研究蛋白质X和Y的相互作用。

3酵母双杂交系统

92双杂交系统的原理LacZGal4激活域Gal4结合域Gal4结合域LacZLacZGal4激活域LacZGal4激活域Gal4结合域XYXY93一、酵母双杂交系统

酵母激活因子

GAL4:N端:147个氨基酸组成的DNA结合域(DNAbindingdomain,BD),C端:113个氨基酸组成的转录激活域(transcriptionactivationdomain,AD)。GAL4分子的DNA结合域可以和上游激活序列(upstreamactivatingsequence,UAS)结合,而转录激活域则能激活UAS下游的基因进行转录。

组成部分:(1)与BD融合的蛋白表达载体,被表达的蛋白称诱饵蛋白(bait);(2)与AD融合的蛋白表达载体,被其表达的蛋白称靶蛋白(prey);(3)带由一个或多个报告基因的宿主菌株。

94YeastTwoHybrid原理BDXCOOHADcDNANH2

COOH共转化+BDX?ADGal4Gal4PromoterReporterTrp-Leu-cDNAlibraryNH2Gal4Gal495酵母双杂交系统的优点采用高拷贝和强启动子的表达载体使杂合蛋白过量表达,并且避免蛋白质纯化过程检测在活细胞内进行,体现真核细胞内真实情况可检测存在于蛋白质之间的微弱的或暂时的相互作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论