第4章 基因组、转录组和蛋白组_第1页
第4章 基因组、转录组和蛋白组_第2页
第4章 基因组、转录组和蛋白组_第3页
第4章 基因组、转录组和蛋白组_第4页
第4章 基因组、转录组和蛋白组_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,基因组、转录组和蛋白质组Genomes,TranscriptomesandProteomes结构基因组学、功能基因组学、比较基因组学,概念,基因组是指一个单倍体细胞中遗传物质得总量。染色体或基因,转录组一个细胞全部的mRNA含量,是一个细胞在某一阶段必须的生物信息,这些RNA分子会指导合成基因组表达的最终产物,蛋白质组。,蛋白质组一个细胞合成的功能蛋白质的总和。,蛋白质组学是人类基因组计划研究发展的基础上形成的交叉学科,主要是从整体水平研究细胞内蛋白质的组成,结构及其自身特有的活动规律,蛋白质组研究的意义,基因虽是遗传信息的源头,而功能性蛋白是基因功能的执行体,蛋白质本身的存在形式和活动规律

2、,如翻译后修饰、蛋白质间相互作用以及蛋白质结构等问题,必须要依赖于对蛋白质组学的研究来解决。,任何一种疾病在表现出可察觉的症状之前,就已经有一些蛋白质发生了变化。因此寻找各种疾病的关键蛋白和标志蛋白,对于疾病的诊断、病理的研究和药物的筛选都具有重要意义。,肿瘤组织与正常组织之间蛋白质谱差异,找到肿瘤特异性的蛋白分子,可能会对揭示肿瘤发生的机制有帮助,目前已应用于肝癌、膀胱癌、前列腺癌等研究中。开发新蛋白质、获得新基因,Figure3.1.Thegenome,transcriptomeandproteome.,基因组的表达不仅仅是一个遗传信息由DNA-RNA-蛋白质的一个过程,这个法则忽略了信息

3、流由基因组到蛋白质组传递过程是被调控的,这个过程每一步都是受到调控,从而使得转录组和蛋白组的成分能够做出迅速和准确的改变,并能使细胞调整自己的生化状态能对外界的刺激做出反应,,转录组Transcriptomes,转录组是特定细胞在某一功能状态下所能转录出来的所有RNA的总和,包括和非编码。,蛋白质是行使细胞功能的主要承担者,蛋白质组是细胞功能和状态的最直接描述,而由于目前蛋白质实验技术的限制,转录组成为研究基因表达的主要手段。转录组是连接基因组遗传信息与生物功能的蛋白质组的必然纽带,转录水平的调控是目前研究最多的,也是生物体最重要的调控方式。,编码和非编码RNA,细胞的RNA含量可以分为两类编

4、码RNA非编码RNA,编码和非编码RNA,编码RNAmRNA4%寿命短细菌的mRNA半衰期几分钟,真核细胞大部分mRNA的半衰期也只有几小时转录组的成分不是固定的,可以通过快速的改变mRNA的合成来改变,编码和非编码RNA,非编码RNArRNAtRNA真核生物特有的RNA小核RNA(SmallnuclearRNA)(snRNA;也叫U-RNA)参与前体mRNA的剪接小核仁RNA(SmallnucleolarRNA)(snoRNA),参与rRNA前体的加工以及核糖体亚基的装配。小胞质RNA(scRNA),包括几种,有些功能已知,有些功能还未知,小核RNA(snRNA,核内小RNA),存在于真核细

5、胞的细胞核内,为小分子核糖核酸,长度为106-189个核苷酸。作用:参与hnRNA的剪接和转运。hnRNA:核内不均一RNA,是成熟mRNA的前体。,Figure3.3.TheRNAcontentofacell.ThisschemeshowsthetypesofRNApresentinallorganisms(eukaryotes,bacteriaandarchaea)andthosecategoriesfoundonlyineukaryoticorbacterialcells.Thenon-codingRNAsofarchaeahavenotyetbeenfullycharacterized

6、anditisnotclearwhichtypesarepresentinadditiontorRNAandtRNA.Forabbreviations,seethetext.,1.无参考基因组的大规模功能基因的发掘(denovotranscriptomeanalysis);2.非编码区域功能研究:Non-codingRNA研究、microRNA前体研究等3.转录本结构研究,包括UTR(UntranslatedRegions即非翻译区)鉴定、Intron边界鉴定、可变剪切研究,融合基因鉴定等4.基因转录水平研究5.全新转录区域研究,转录组研究的应用领域,转录组检测的方法,(一)构建cDNA文库并

7、测序(二)基因表达序列分析技术Serialanalysisofgeneexpression(SAGE)(三)利用DNAchip可以比较不同的转录组(四)大规模平行信号测序系统MPSS(massivelyparallelsignaturesequencing,MPSS)。,(一)cDNA文库(cDNAlibrary)的构建,cDNA:以RNA为模板,在反转录酶的作用下合成的DNAcDNA基因文库:从一定生长阶段或条件的某种细胞分离到的全部mRNA经反转录成cDNA后再重组和增殖形成的基因文库。,cDNA文库的特点1.细胞特异性来自结构基因,仅代表正在表达的基因的遗传信息:15%mRNA,8085

8、%rRNA,1015%tRNA2.组织、器官特异性不同器官或组织的功能不一样,4.可了解基因的表达丰度在同一个cDNA文库中,不同类型的cDNA分子的数目是大不相同的,尽管它们都是由单拷贝基因转录而来的。这与基因组文库中的单拷贝基因均具有相同的克隆数相较,这是两种文库的另一差别。,3.代谢或发育特异性处于不同代谢阶段(或发育阶段)的结构基因表达亦不相同,cDNA文库的优点,cDNA不存在间隔序列,cDNA文库的缺点,要测序所有的cDNA克隆,费时费力,每一个cDNA克隆都只含有一种mRNA序列,cDNA基因文库是分离基因的重要手段,(二)基因表达序列分析技术Serialanalysisofge

9、neexpression(SAGE),表达的基因和表达丰度,Sage技术的主要理论依据一个短得寡核苷酸序列(12bp)含有鉴定一个转录物特异性的足够信息,可以作为区别转录物的标签(tag)4这些标签串联在一起,形成大量多联体(concatemer),对每个克隆到的多联体进行测序并应用SAGE软件分析,可确定表达的基因的种类和丰度,12,Figure7.22.SAGE.Seethetextfordetails.Inthisexample,thefirstrestrictionenzymetobeusedisAluI,whichrecognizesthe4-bptargetsite5-AGCT-3

10、(seeTable4.3).TheoligonucleotidethatisligatedtothecDNAcontainstherecognitionsequenceforBsmFI,whichcuts1014nucleotidesdownstream,andsocleavesoffafragmentofthecDNA.FragmentsofdifferentcDNAsareligatedtoproducetheconcatamerthatissequenced.Usingthismethod,theconcatamerthatisformedismadeuppartlyofsequence

11、sderivedfromtheBsmFIoligonucleotides.Toavoidthis,andsoobtainaconcatamermadeupentirelyofcDNAfragments,theoligonucleotidecanbedesignedsothattheendthatligatestothecDNAcontainstherecognitionsequenceforathirdrestrictionenzyme.TreatmentwiththisenzymecleavestheoligonucleotidefromthecDNAfragment.,用生物素酰化的oli

12、go(dT)引导合成cDNA第一链,再合成双链cDNA,用专门识别4bp碱基的锚定酶(anchoringenzyme),如NlaIII(识别位点为CATG)消化合成的双链cDNA,释放5序列,而生物素酰化的3端仍被吸附在链霉亲和素蛋白磁珠(streptavidincoatedbeads)上分离与磁珠结合的具3端poly(A)尾巴的cDNA片断,与含有IIS类限制酶位点的接头连接,酶切位点一般位于识别位点后20bp处,再用标签酶(taggingenzyme),如BsmFI等IIS类限制酶处理样品,释放带有接头的SAGE标签带有接头的SAGE标签经DNA聚合酶(Klenow)补平后,由连接酶产生带

13、有两个接头的双标签(ditag),对双标签PCR扩增后,再用锚定酶消化,得到尾尾相连的SAGE双标签,双标签的两端分布着锚定酶的酶切位点去除接头的SAGE双标签彼此连接形成长短不一的多联体,电泳分离后收集大小适中的片段克隆到高拷贝的质粒载体,由此形成SAGE库随机挑选SAGE库中的克隆测序,用专门设计的SAGE软件分析得到的标签序列,通过与GenBank、dbEST或SAGEmap等数据库进行比较,获取所需的资料。,SAGE的应用确定不同组织或细胞的表达谱,并能确定基因的表达丰度1995年Velculescu等首次从人类胰腺中得到了1000个标签,其中351个(41.6)只出现一次,77个标签

14、出现多次,10个丰度最高的标签中有9个至少与GenBank序列匹配一致。这个结果与cDNA文库结果一致鉴定新的基因利用13bp寡核苷酸(9bp标签加上4bp锚定酶位点)做为探针,筛选胰腺cDNA文库分离了4个未确定标签所对应的克隆,结果有3个标签对应的克隆代表了两个已知的基因,其中一个可能代表新的基因,(三)生物芯片技术,生物芯片技术是20世纪90年代生命科学领域中迅速发展起来的一项新技术,是综合运用生物、微电子、微加工和计算机等知识制作的高科技杰作。其本质是固定在玻片等载体上的微型生物化学分析系统,芯片上每平方厘米可密集排列成千上万个生物分子,能快速准确地检测细胞、蛋白质、DNA及其他生物组

15、分,并获得样品的有关信息,其效率是传统方法的成百上千倍,被美国科学促进会评为1998年的世界十大科技突破成果之一。,生物芯片技术:高通量的杂交技术。,生物芯片分类根据芯片上的固定的探针不同,基因芯片、蛋白质芯片、细胞芯片、组织芯片,根据原理元件型微阵列芯片、通道型微阵列芯片、生物传感芯片等新型生物芯片,基因芯片(genechip),/degree.html,基因芯片(Genechip)DNA微阵列(DNAMicroarray),原理基本原理与传统的核酸印迹杂交(Southernblot,Northernblot)相似,是基于核酸探针互补杂交技术原理而研

16、制的。所谓核酸探针只是一段人工合成的碱基序列,在探针上连接上一些可检测的物质,根据碱基互补的原理,利用基因探针到基因混合物中识别特定基因,当探针与芯片上的靶基因杂交后,经严格的洗涤,除去未杂交或部分配对的探针DNA分子(正常配对的双链热力学稳定性比错配双链高),用荧光检测仪定量分析杂交信号强度,由于探针与靶基因完全配对时产生的荧光信号强度比含一个或两个错配碱基的杂合分子高数十倍,因而精确测定荧光信号即可实现检测的特异性。同时通过检测每个靶基因分子的杂交信号强度,就可获得样品分子的数量和序列信息。分类cDNA芯片有寡核苷酸芯片Genomic芯片,优点:大规模、高通量、高效率、并行性、自动化,Fi

17、gure7.23.Transcriptomeanalysis.(A)TranscriptomeanalysiswithaDNAchipcarryingoligonucleotidesrepresentingallthegenesinasmallgenome.AfteraddinglabeledcDNA,thepositionsofthehybridizationsignalsonthechipindicatewhichgeneshavecontributedtothetranscriptomeunderstudy.(B)Withalargergenome,cDNAclonespreparedf

18、romthetranscriptomeofonetissueareimmobilizedasamicroarrayandprobedwithcDNAsrepresentingthesameoradifferenttranscriptome.Bycomparingthehybridizationpatterns,genesthatareexpresseddifferentlyinthetissuesfromwhichthetranscriptomesareobtainedcanbeidentified.,基因芯片的应用,根据应用领域的不同可将基因芯片分为表达谱芯片、测序芯片和诊断芯片三大类。表达

19、谱基因芯片:基因的功能分析、疾病发生机理探讨、发育模式调控机理探讨、药物研究和筛选等众多方面;测序芯片:主要用于测定DNA序列;诊断芯片:检测基因变异和诊断疾病。,分析基因的表达与功能例1:拟南芥Schena等采用拟南芥基因组内共45个基因的cDNA微阵列(其中14个为完全序列,31个为EST)检测该植物的根、叶组织内这些基因的表达水平,用不同颜色的荧光素标记逆转录产物后分别与该微阵列杂交根和叶组织中存在26个基因的表达差异,而参与叶绿素合成的CAB1基因在叶组织较根组织表达高500倍,检测基因变异与诊断疾病正常人的基因组中分离出DNA与DNA芯片杂交就可以得出标准图谱。从病人的基因组中分离出

20、DNA与DNA芯片杂交就可以得出病变图谱。通过比较、分析这两种图谱,就可以得出病变的DNA信息Affymetrix公司,把P53基因全长序列和已知突变的探针集成在芯片上,制成P53基因芯片,将在癌症早期诊断中发挥作用Heller等构建了96个基因的cDNA微阵,用于检测分析风湿性关节炎(RA)相关的基因现在,肝炎病毒检测诊断芯片、结核杆菌耐药性检测芯片、多种恶性肿瘤相关病毒基因芯片等一系列诊断芯片逐步开始进入市场。,筛选药物即可以利用基因芯片分析用药前后机体的不同组织、器官基因表达的差异,但是芯片无法同时大量地分析组织或细胞内基因组表达的状况,而且由于芯片技术需要准备基因探针,所以可能漏掉那些

21、未知的、表达丰度不高的、可能是很重要的调节基因,(四)大规模平行信号测序系统MPSS(massivelyparallelsignaturesequencing,MPSS),2002年诺贝尔生理学或医学奖获得者SydneyBrenner发明是微阵列的替代方法:可以在一个sample中计数所有的mRNA是设计用来捕获完整的转录组对低丰度转录子高度敏感一般可以分析100万个转录子数字资料容易构建大的相关数据库Digitaldatathatisamenabletodevelopinglargerelationaldatabases可以被应用于任何生物,大规模平行测序技术(massivelyparall

22、elsignaturesequencing,MPSS)是Brenner等于2000年建立,由美国Lynex公司将其商品化的一种基因克隆新技术.是基于序列分析技术的高通量、高特异性和高敏感性的基因分析技术.本文就最新建立的大规模平行测序技术做简要介绍,并比较该技术与其他几种常用技术的优缺点.,布伦纳在学术上极富开拓创新精神。他参与开创和独立开拓的科学领域一个接着一个,并且在每个领域中他的原创性研究成果都绚丽夺目。布伦纳是参与分子生物学创建的主要功臣之一1956年底,布伦纳成为克里克最亲密的合作者在基因如何指导蛋白质合成的研究中,用实验证明遗传密码的“非重叠”、“无逗号”和“三联体”等性质方面作出

23、了重大贡献。1961年布伦纳同雅各布(F.Jacob)和梅塞尔森(M.Meselson)合作,用实验证明了mRNA的存在。使得用实验方法破译遗传密码的研究才有可能开始,这些重要发现使得当时的分子生物学家都把布伦纳视作生命科学革命的领军人物之一,期待着他何时能获诺贝尔奖,因为,他在破译遗传密码和证明mRNA的存在这两项工作中的贡献,任何一项都可获诺贝尔奖;而此时的布伦纳却在想别的事。,经过多年探索,布伦纳证明了用乙基甲磺酸能诱导秀丽新小杆线虫(Caenorhabditiselegans)基因组特定的基因突变,完成了秀虫的遗传学分析,并在1974年的遗传学杂志上发表了“秀丽线虫的遗传学”一文。在这

24、篇具有里程碑意义的论文中,他把遗传学分析方法和显微镜观察方法结合起来,即首先制备秀虫的各种突变体,然后分析某个特定的基因突变对发育的影响。这项工作成为其后大量出现的发育生物学研究的重要基础之一;秀丽线虫作为一种新的模式生物也迅速走红。,秀丽线虫,秀虫的确是很合适的实验材料。它与人蛔虫、人蛲虫等营寄生生活的线虫不同,是营自由生活的线虫。它身长1mm透明的表皮使每个细胞清晰可见。它在20时的生命周期是3天半,非常适合做遗传学研究。最可贵的是细胞数目少且固定,在发育过程中总是产生1090个细胞,其中有131个细胞注定要凋亡。,1976年,与布伦纳合作研究的苏尔斯顿(J.E.Sulston)首次为秀虫

25、发育中的神经系统描绘了细胞谱系图,后来,又描绘出完整的细胞谱系图,使秀虫成为唯一一种从单细胞受精卵开始直到成熟成体的全部细胞分裂过程被阐明的多细胞生物。1986年,曾与布伦纳合作研究的霍维茨(H.R.Horvitz)首次用遗传学方法鉴定了2个与秀虫细胞凋亡有关的基因ced-3和ced-4。后来,又鉴定出14个基因与秀虫细胞凋亡有关。,布伦纳、苏尔斯顿和霍维茨因在器官发育和程序性细胞死亡(细胞凋亡)过程的基因调节方面的发现而获2002年诺贝尔生理学或医学奖。有人认为,“有的人需要诺贝尔奖为自己增辉,而有的人的获奖却是让诺贝尔奖增辉。布伦纳的获奖无疑是属于后者。”世人对布伦纳的评价是:“他用强烈的

26、好奇心、想像力、智慧和决断力这样4根丝线编织了丰富多彩的具有特定结构的科学画面。他在许多探索领域留下的研究成果必将延伸到未来。”,生物:侦测基因表现的最新有力工具:MPSS时间:2007-09-1300:00来源:作者:点击:240次生物:侦测基因表现的最新有力工具:MPSS编辑YPChang报导随着人类基因计画的进行,我们对于基因的序列有更多的掌握。对生物科技界来说,下一个挑战,便在于正确侦测基因的表现程度。怎样在速度和正确性之中得到一个平衡?在六月的NatureBiotechnology中,SydneyBrenner的研究团队发表了一个名之为MPSS的新工具,或许正是提供解答的生物新技术。

27、研究人员一直在寻找一个测量基因表现的最好方法,然而,一直以来他们面对着研究方法的两难。DNA晶片是快速而方便的一个技术,却被它有限的敏感度所限,而使用PCR来侦测基因表现相对来说较可信赖,却因需要跑大量的电泳而需花费较多的金钱、时间和人力。最近SydneyBrenner和他的同事将这两种方式合并在一起,发明了被取名为微球状阵列(MicrobeadArray)的新技术,使我们能够在复制数以千计的基因碎片之同时,亦进行被称之为多重性平行定序(Multipleparallelsignaturesequencing,简称MPSS)的快速分析。MPSS可被分为两个步骤。首先,一个基因复本的DNA被黏至十

28、分微小的微球体上,然后,在第二个步骤里,我们利用基因库的资料,比对辨认这些黏在微球体上的DNA。由此,藉由微球体的数目,我们便可以轻易地找出该基因被表现的程度。问题是,我们应该怎样辨认特定的基因呢?Brenner团队利用了萤光和限制酵素的知识,成功地发展出一套辨认基因末端16对碱基对的方法。这16对碱基对的辨认便使我们有能力决定酵母菌的基因体中所有的基因。MPSS这个最新的技术,不但和目前广被使用的技术有同等的正确性,在人类白血球上的实验更说明它的错误率极小。此外,MPSS可以侦测到极为罕见的基因表现,并同时对基因体中所有基因的表现程度,提供一个统计上的数字指标。有了这样的工具,我们就能够对细

29、胞中因应不同外在环境而有所不同基因表现,有更深一步的认识和了解,它不但为生物晶片技术开启了一扇新的门窗,亦为分子生物学及人类基因计画的研究提供了有力的工具。,MASS与Microarray比较,MPSS确实能在一个样品中检测到所有的mRNAs,microarrays对检测的基因成分有限制(因为需要已知基因的序列做探针)。MPSS即使是一般的检测都对低丰度基因具有很高的敏感性,而microarray的敏感性受许多因素的影响而且很难进行严格的控制MPSS的结果是以数字资料的形式输出,使得这些结果很容易整合进复杂的相关数据库而microarray的输出的数据时根据荧光的强度算出的比率很难准确反应表达

30、水平相MPSS可以用于基因表达的定量分析,可以用于任何生物,即使对那些基因组未被测序或进行过详细研究的生物。Microarrays的优点是高通量,可以分析大量的样本。,MPSS和Sage比较,SAGE的特征序列是14个核苷酸,而MPSS是17个基因组作图时会少了歧义很容易把MPSS的标签与已知的基因对应起来典型的SAGE的数据集是20,000-60,000个标签,而MPSS有约百万个特征序列MSPP很容易实现高通量,因为其克隆和测序用的是不同的技术SAGE是利用的传统的克隆和测序技术,昂贵、耗时、劳动强度大更大的MPSS数据集可以增强分析的深度,MPSS和Sage比较,Signatureseq

31、uenceofSAGEis14nucleotidescomparedwith17nucleotideswithMPSS:LessambiguitywithMPSSwhenmappingtothemammaliangenomeEasiertoconnectMPSStagswithknowngenesTypicalSAGEdatasetis20,000-60,000tagscomparedtooveramillionsignaturessequencesforMPSSLynxcloningandMPSSsequencingdoneonaminiaturizedplatformthatisamena

32、bletohigh-throughSAGEconductedwithstandardcloningandsequencingthatareexpensive,timeconsumingandlaborintensiveLargerMPSSdatasetsprovideenhanceddepthofanalysis,MASS与Microarray比较,MPSSdetectsvirtuallyallmRNAsinasample,whilemicroarraysarelimitedtogeneelementsonthearrayMPSShasgreatersensitivityforroutined

33、etectionoflowlevelexpressedtranscripts;microarraysensitivityinfluencedbymanyfactorsthatcanbedifficulttorigorouslycontrol“Digital”dataoutputofMPSSmakesitpossibletoreadilyimportdataintocomplexrelationaldatabases;microarraydataprovidesaratiobetweenanexperimentalandcontrolfluorescencethatisdifficulttoco

34、nvertintovaluesforquantitativeexpressionlevelsMPSScanbeusedtoconductquantitativeandin-depthexpressionanalysisonanyorganism,includingthosewithagenomethathasnotbeensequencedorstudiedingreatdetailMicroarrayshavetheadvantageofbeingahigh-throughputtechnologyforanalyzinglargenumbersofsamples,MPSS是对SAGE的改进

35、,它能在短时间内检测细胞或组织内全部基因的表达情况,是功能基因组研究的有效工具。因其需要配套的软硬件较为昂贵,目前国内外的相关应用报道不多。MPSS技术对于致病基因的识别、揭示基因在疾病中的作用、分析药物的药效等都非常有价值,该技术的发展将在基因组功能方面及其相关领域研究中发挥巨大的作用。,MPSS的特点是:a1不必事先知道基因的序列,适用于任何生物体及任何性状;b1基因组覆盖面高,能测量出样品中几乎所有表达了的基因;c1基因表达水平的测量是通过直接计算样品中cDNA的拷贝数目,属于非连续变量,所以只要有病理和正常个体(或组织)两个样品即可以进行严格的统计检验,能有效地检测差异性中等或较小的基

36、因;d1实验效率高,只要两个星期即可获得几十万个克隆的16至20个碱基序列.,深度测序技术,测序深度是测序量除以基因组长度,例如测序深度10*就相当于测了10次的全基因组,Naturemethods:高通量深度测序法探测RNA结构在2010的(NatureMethods)(Nature)杂志两篇最新的论文中Underwood和Kertesz两个研究小组利用高通量测序技术确定了所有RNA转录物的二级结构。,最近的研究证实RNAs在调控基因表达和基因组稳定性中发挥了多重功能(RNAi),这一课题日益引起了研究界的广泛关注。在这些调控过程中,RNA的结构是一个关键的影响因素决定了是直接监控外部或内部

37、信号,或是为反式作用因子提供特异的结合位点。RNA转录物是一种单链分子,当其发生自身折叠并形成碱基对,可形成各种长度和不同复杂性的发夹结构。发夹结构是RNA中最普通的二级结构形式,其进一步组装则形成了复杂的三维结构。了解RNA二级结构是研究人员揭示RNA活性,发现伴侣蛋白结合印迹及突变影响关键性的第一步。,高通量测序技术-深度测序-deepsequencing,高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deepsequencing)。,Roche(罗氏公司)推出了45

38、4FLX焦磷酸测序平台(454FLXpyrosequencingplatform)2006年美国Illumina公司推出的Solexa基因组分析平台(GenomeAnalyzerplatform)2007年ABI公司推出了SOLiD测序仪。这三个测序平台即为目前高通量测序平台的代表。,高通量测序的应用,可以帮助研究者跨过文库构建这一实验步骤,可以非常轻松完成基因组重测序(re-sequence)。但是也应该看到,由于高通量测序读取长度的限制,使其在对未知基因组进行从头测序(novosequencing)的应用受到限制,这部分工作仍然需要传统测序(读取长度达到850碱基)的协助。但是这并不影响高

39、通量测序技术在全基因组mRNA表达谱,microRNA表达谱,ChIP-chip以及DNA甲基化等方面的应用。2008年Mortazavi等人对小鼠的大脑、肝脏和骨骼肌进行了RNA深度测序,这项工作展示了深度测序在转录组研究上的两大进展,表达计数和序列分析。,高通量测序另一个被广泛应用的领域是小分子RNA或非编码RNA(ncRNA)研究。测序方法能轻易的解决芯片技术在检测小分子时遇到的技术难题(短序列,高度同源),而且小分子RNA的短序列正好配合了高通量测序的长度,使得数据“不浪费”,同时测序方法还能在实验中发现新的小分子RNA。在DNA蛋白质相互作用的研究上,染色质免疫沉淀深度测序(ChIP

40、-seq)实验也展示了其非常大的潜力。染色质免疫沉淀以后的DNA直接进行测序,对比refseq可以直接获得蛋白与DNA结合的位点信息,相比ChIP-chip,ChIP-seq可以检测更小的结合区段、未知的结合位点、结合位点内的突变情况和蛋白亲合力较低的区段。,高通量测序的应用,深度测序带来人类转录组“空前”全貌,德国马普分子遗传学研究所和Genomatix测序软件公司的科学家通过胚肾和B细胞系的转录子(本)进行测序,揭示出人类转录组前所未有的复杂性和可变性。他们发现,50%的转录子对应于特定的基因组域,其中有80%吻合已知的基因。多聚腺苷酸化的转录组(polyadenylatedtranscr

41、iptome)的66%对应于已知基因,其余的34%则为新的基因。此外,研究人员还进行了一项关于信使RNA剪接(mRNAsplicing)的全局研究。他们共确定出94241个剪接位点,其中有4096个是全新的。领导该项研究的马普分子遗传学研究所Marie-LaureYaspo博士说,“深度测序(deepsequencing)让我们首次直接探索人类转录组的复杂性和动力学成为可能。而此次的细胞内和细胞间选择性剪接的对比研究,以及对基因表达的同步分析是此前从未进行过的。新的研究结果将导致远超出现有程度的全新哺乳动物基因组注释图。此外,一个越来越明显的情况就是,目前可用的方法只能带来哺乳动物细胞的部分表

42、达图谱,尤其是当考虑到基因调控分析时。”,2008science,一个典型的哺乳动物细胞,例肝细胞,大约包含1000020000个不同的蛋白,大约810个分子。占细胞总重量的1820,蛋白质组theproteome,某一特殊时期细胞中所有蛋白的总和,9,高丰度蛋白:每个细胞中,一个蛋白分子超过50000个copy的时候,属于高丰度蛋白。哺乳动物细胞中有2000个蛋白属于高丰度蛋白,高丰度的蛋白含量变化小,说明这些是看家基因的蛋白,在细胞中执行基本的生理功能,通常与细胞的特异性无关。,Figure3.12.Thecentralroleoftheproteome.,蛋白质的结构,蛋白质的四级结构一

43、级结构:氨基酸顺序二级结构:线性多肽形成的不同构型主要有a-helix和b-sheet多肽的氨基酸之间由氢键连接形成多数多肽可形成一系列的二级结构。,三级结构:由二级结构折叠形成的三维构型氢键、疏水作用力、二硫键(两个半胱氨酸之间)四级结构:多个形成三级结构的多肽相互作用形成的多亚基蛋白并不是所有的蛋白都形成四级结构,它是许多具有复杂功能蛋白的特点二硫键、氢键和疏水作用力,Figure3.13.Thegeneralstructureofanaminoacid.Allaminoacidshavethesamegeneralstructure,comprisingacentrala-carbona

44、ttachedtoahydrogenatom,acarboxylgroup,anaminogroupandanRgroup.TheRgroupisdifferentforeachaminoacid(seeFigure3.17).,Figure3.14.Inpolypeptides,aminoacidsarelinkedbypeptidebonds.Thedrawingshowsthechemicalreactionthatresultsintwoaminoacidsbecominglinkedtogetherbyapeptidebond.Thereactioniscalledacondensa

45、tionbecauseitresultsineliminationofwater.,一级结构,Figure3.15.Thetwomainsecondarystructuralunitsfoundinproteins:(A)thea-helix,and(B)theb-sheet.Thepolypeptidechainsareshowninoutlinewiththepositionsofthea-carbonsindicatedbysmalldots.TheRgroupshavebeenomittedforclarity.Eachstructureisstabilizedbyhydrogenbo

46、ndsbetweentheC=OandN-Hgroupsofdifferentpeptidebonds.Theb-sheetconformationthatisshownisanti-parallel,thetwochainsrunninginoppositedirections.Parallelb-sheetsalsooccur.,二级结构,Figure3.16.Thetertiarystructureofaprotein.Thisimaginaryproteinstructurecomprisesthreea-helices,shownascoils,andafour-strandedb-

47、sheet,indicatedbythearrows.RedrawnfromTurneretal.(1997).,三级结构,蛋白的功能不同是因为他们的氨基酸序列不同,不同的氨基酸序列形成不同的空间结构,这不仅反映在蛋白的整体结构也反映在蛋白的活性基团在蛋白表面的位置,合成的蛋白质会经过一系列的修饰,包括乙酰化、磷酸化、糖基化等,不同的二级结构有氨基酸的偏爱,氨基酸序列决定蛋白的功能,不同的二级结构有氨基酸偏爱,可根据不同的氨基酸的序列来推测它的结构(?),多数蛋白的三级结构都有几个结构域,它们之间具有相互作用,这些结构域都是独立折叠而成。,经尿素变性的蛋白在复性的过程中仍然能自发的折叠成正确的

48、高级结构。,细胞中有种蛋白称为分子伴侣(molecularchaperones)可以协助其他的蛋白形成正确的高级结构,不是所有的蛋白质都能正确的形成高级结构,尤其是大的蛋白质分子,蛋白质在复性的过程中可能采用了其他的折叠方式,这样后续的过程就不能形成正确的折叠,Figure3.17.AminoacidRgroups.These20aminoacidsaretheonesthatareconventionallylookeduponasbeingspecifiedbythegeneticcode(Section3.3.2).Theclassificationintonon-polar,polar

49、etc.isasdescribedinLehninger(1970).,Figure3.22.Formationofasecondarystructureinapolypeptide.Ana-helixisshownnucleatingatapositioncontainingaminoacidsthatfavorhelixformation,andextendingineitherdirectionuntilgroupsofaminoacidsthatblockhelixformationarereached.,蛋白质组和细胞活性之间的联系,基因组蛋白质组细胞的生化能力的?蛋白质的结构直接把

50、它的氨基酸序列跟它的化学特性联系在一起蛋白化学特性的多样性可以使得它能够完成复杂的生物功能,蛋白质组学研究,研究目标是对机体或细胞的所有蛋白质进行鉴定和结构功能分析,两个最主要的技术蛋白电泳(proteinelectrophoresis)质谱分析(massspectrometry),步骤,2维聚丙烯酰氨凝胶电泳(2D),取蛋白点进行质谱分析,样品制备:破碎、沉淀蛋白和去除杂质,第一维:等电聚焦:Ph,第二维:SDS-PAGE:分子量和电荷,2D蛋白电泳,每一个点代表一个蛋白,但不是所有的蛋白都能显示,跟染色的方法有关对照两个电泳图谱可以比较蛋白表达的差异和表达量的差异,样品制备:应使所有待分析

51、的蛋白样品全部处于溶解状态(包括多数疏水性蛋白),且制备方法应具有可重现性。防止样品在聚焦时发生蛋白的聚集和沉淀。防止在样品制备过程中发生样品的抽提后化学修饰(如酶性或化学性降解等)。完全去除样品中的核酸和某些干扰蛋白。尽量去除起干扰作用的高丰度或无关蛋白,从而保证待研究蛋白的可检测性。,十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE),主要用于测定蛋白质亚基分子量,SDS是一种阴离子去污剂,作为变性剂和助溶剂,它能段裂分子内和分子间的氢键,使分子去折叠,破坏蛋白质分子的二级和三级结构。强还原剂则能使半光氨酸残基之间的二硫键段裂。在样品和凝胶中加入SDS和还原剂后,分子被解聚成它们的多肽

52、链。解聚后的氨基酸侧链与SDS充分结合形成带负电荷的蛋白质-SDS复合物,所带的负电荷大大超过了蛋白质分子原有的电荷量,这就消除了不同分子之间原有电荷的差异。因此这种复合物在SDS-聚丙烯酰胺凝胶系统中的电泳迁移率不再受蛋白质原有电荷的影响,而主要取决于蛋白质或亚基分子量的大小。当蛋白质的分子量在15KD到200KD之间时,电泳迁移率与分子量的对数呈线性关系。,蛋白之间相互作用的研究,蛋白质-蛋白质的相互作用是细胞生命活动的基础和特征。发现新的蛋白并了解其功能方法噬菌体表面展示技术(phagedisplay)酵母双杂交系统(theyeasttwo-hybridsystem)串联亲和纯化质谱分析

53、蛋白质芯片基于生物信息学的分析方法,噬菌体表面展示技术(phagedisplay),原理:通过蛋白和蛋白之间空间结构的吻合,用已知的蛋白筛选未知蛋白的过程它将外源多肽或蛋白与噬菌体的一种衣壳蛋白融合表达,融合蛋白将展示在病毒颗粒的表面,而编码这个融合子的DNA则位于该病毒粒子内。,应用,1、噬菌体展示技术使大量多肽与其DNA编码序列之间建立了直接联系2、使得各种靶分子(抗体、酶、细胞表面受体等)通过一种被称为淘选(panning)的体外选择程序得以快速鉴定。3、迅速鉴定未知的基因功能,最简单的淘选程序,是将噬菌体展示肽库与包被有目的靶分子的平板(或磁珠)共温育,先洗去未结合噬菌体,然后洗脱特异

54、性结合的噬菌体(见图1)。被洗脱的噬菌体进行扩增,然后再进行下一轮的结合/扩增循环,以富集那些可结合序列。经3-4轮淘选后,通过DNA测序对每个可结合克隆进行定性。,酵母双杂交系统(yeasttwo-hybridsystem),酵母双杂交系统:是在酵母体内分析蛋白质-蛋白质相互作用的系统,也是一个基于转录因子模块结构的遗传学方法。,转录因子:DNA结合结构域(DNAbindingdomain,简称为DB)转录激活结构域(activationdomain,简称为AD)它们是转录激活因子发挥功能所必需的。单独的DB虽然能和启动子结合,但是不能激活转录。而不同转录激活因子的DB和AD形成的杂合蛋白仍

55、然具有正常的激活转录的功能如酵母细胞的Gal4蛋白的DB与大肠杆菌的一个酸性激活结构域B42融合得到的杂合蛋白仍然可结合到Gal4结合位点并激活转录,酵母双杂交系统的建立Gal4是酵母的转录因子,具有DB和ADSUC2基因受Snf1和Snf2两个蛋白调控Snf1与DB融合(诱饵:bait)Snf2与AD结合(猎物或靶蛋白:preyortarget)如果在Snf1和Snf2之间存在相互作用,那么分别位于这两个融合蛋白上的DB和AD就能重新形成有活性的转录激活因子,从而激活相应基因的转录与表达这个被激活的、能显示“诱饵”和“猎物”相互作用的基因称之为报告基因(reportergene)通过对报道基

56、因表达产物的检测,反过来可判别作为“诱饵”和“猎物”的两个蛋白质之间是否存在相互作用-半乳糖苷酶的LacZ作为报道基因,调控区引入受Gal4蛋白调控的GAL1序列改造过的LacZ基因被整合到酵母染色体上,而酵母的GAL4基因和GAL80基因(Gal80是Gal4的负调控因子)被缺失,从而排除了细胞内源调控因子的影响已经知道在Snf1和Snf2之间存在相互作用。结果发现只有同时转化了Snf1和Snf2融合表达载体的酵母细胞才有-半乳糖苷酶活性,单独转化其中任何一个载体都不能检测出-半乳糖苷酶活性,改进的双杂交系统报道基因、“诱饵”表达载体以及“猎物”表达载体等做了一些改进引入了其他的报告基因如HIS3经过改造带有HIS3报道基因的酵母细胞,只有当HIS3被启动表达才能在缺乏组氨酸的选择性培养基上生长大多数双杂交系统往往同时使用两个甚至三个报道基因,其中之一是LacZ这些改造后的基因在启动子区有相同的转录激活因子结合位点,因此可以被相同的转录激活因子(如上述的Gal4蛋白)激活。通过这种双重或多重选择既提高了检测灵敏度又减少了假阳性现象,在双杂交鉴定过程中要经过两次转化,这个工作量是相当大的,特别是寻找新的作用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论