系统生物学转录组学与研究_第1页
系统生物学转录组学与研究_第2页
系统生物学转录组学与研究_第3页
系统生物学转录组学与研究_第4页
系统生物学转录组学与研究_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

优选系统生物学转录组学与研究第一页,共四十九页。蛋白质编码基因数量人:30,000果蝇和线虫:12,000-14,000酿酒酵母:6,200假单孢菌:5,500人和鼠的蛋白质编码基因99%是共同的。人个体间单倍体基因组的碱基差异300万个,其中1万个(0.3%)出现在蛋白质编码基因中。98%转录产物是非编码蛋白RNA。2倍2倍第二页,共四十九页。RNA的分类细胞核和胞液线粒体功能核蛋白体RNArRNAmtrRNA核蛋白体组成成分信使RNAmRNAmtmRNA蛋白质合成模板转运RNAtRNAmttRNA转运氨基酸不均一核RNAhnRNA成熟mRNA的前体小核RNAsnRNA参与hnRNA的剪接、转运小胞浆RNAscRNA/7SL-RNA蛋白质内质网定位合成的信号识别体的组成成分第三页,共四十九页。新定义Thecompletecollectionoftranscribedelementsofthegenome.(Affymetrix,2004)mRNArRNA,tRNAsnmRNAs(smallnon-messengerRNAs)microRNAsandsiRNAs(smallinterferringRNAs)snoRNAs(smallnucleolarRNAs)核仁小分子RNAsnRNAs(smallnuclearRNAs)Othernon-codingRNAsLongnon-codingRNA(lncRNA)第四页,共四十九页。有些小RNA分子能直接调控某些基因的开关从而控制细胞的生长发育并决定细胞分化的组织类型小RNA分子本身又包含了若干类RNA,根据小RNA的生成、结构和功能大约可分为以下三类:miRNA(microRNA)siRNA(smallinterferingRNA)其他小RNA第五页,共四十九页。

MicroRNA简介★

(1)长度为21nt左右核苷酸的内源性单链小分子RNA;(2)存在65nt左右的发夹结构前体;(3)基因座位于蛋白质基因间隔区;(4)其DNA序列在近源物种间高度保守。★

miRNA具有十分重要的调控功能,它们主要参与基因转录后水平的调控。能够通过与靶mRNA特异性的碱基配对引起靶mRNA的降解(植物中较为常见)或者抑制其翻译(动物中较为常见),从而影响了靶mRNA的表达。第六页,共四十九页。microRNA(miRNA)是广泛存在于真核生物中的一组短小的、不编码蛋白质的RNA家族,它们是由19-23个核苷酸组成的单链RNA(3‘端可有1~2个碱基长度的变化)表达具有组织特异性和阶段特异性。即:在不同组织中表达有不同类型的miRNA;在生物发育的不同阶段里有不同的miRNA表达与靶mRNA3’-UTR结合,序列特异性的在转录后水平调控基因的翻译表达,在生物发育、脂肪代谢、细胞的分化、增殖和凋亡等过程中发挥着重要作用第七页,共四十九页。miRNA具有高度保守性,即各种miRNA都能在其他种系中找到同源体;miRNA独有的特征:其5’端第一个碱基对U有强烈的倾向性,而对G却有抗性,但第二到第四个碱基缺乏U,一般来讲,除第四个碱基外,其他位置碱基通常都缺乏CmiRNA执行一定的生物学功能:对与其互补的mRNA表达水平具有调节作用;一些偏大的miRNA(27nt)可能参与了基因组的重组装参与生物的发育与多种生理、病理过程第八页,共四十九页。199320002001200220032004200520062007microRNA的研究历史Dr.VictorAmbros第九页,共四十九页。2002年入选《science》年度十大科学发现之首第十页,共四十九页。miRNAandCancerThefirstdemonstrationofalinkbetweenmiRNAgenesandcancer.第十一页,共四十九页。ThefirstpapertoshowthatthederegulationofasinglemiRNAgenecanleadtocancer.AnelegantstudythatshowsapathogeneticlinkbetweenmiRNAsandtargetoncogenes.第十二页,共四十九页。第十三页,共四十九页。miRNAcontrolssomeplantphenotype第十四页,共四十九页。据体内外实验研究表明miRNA的生成需要两个步骤:1)由长的内源性转录本(pri-miRNA)经Drosha酶作用生成70nt左右的miRNA前体(pre-miRNA),该过程发生在细胞核2)将pre-miRNA经Dicer酶作用加工为成熟miRNA,该过程发生在细胞质中。microRNA的加工成熟第十五页,共四十九页。通过生物信息的手段分析了microRNA在蛋白相互作用网络和转录因子-microRNA相互调控网络中的作用第十六页,共四十九页。据体内外实验研究表明miRNA的生成需要两个步骤:1)由长的内源性转录本(pri-miRNA)经Drosha酶作用生成70nt左右的miRNA前体(pre-miRNA),该过程发生在细胞核2)将pre-miRNA经Dicer酶作用加工为成熟miRNA,该过程发生在细胞质中。microRNA的加工成熟第十七页,共四十九页。首先由基因组转录形成长链RNA分子——pri-miRNA第十八页,共四十九页。约60%的microRNA为独立转录表达;约15%miRNA为成簇存在而共同转录;其余还有约25%的miRNA定位于功能基因内含子,随基因转录表达。第十九页,共四十九页。Pri-miRNA经双链RNA核酸酶Drosha酶作用,加工形成70-100nt长度的pre-miRNA第二十页,共四十九页。Pre-miRNA在Exportin5介导作用下转运出胞核至胞质中进行下一步加工第二十一页,共四十九页。Pre-miRNA在胞质中经双链RNA核酸酶Dicer酶作用加工形成单链成熟miRNA分子第二十二页,共四十九页。miRNA发挥作用过程19-23nt的成熟miRNA形成后与其他蛋白共同组成RNA介导的沉默复合体(RISC)参与RNA干扰途径第二十三页,共四十九页。miRNA形成RISC复合体后可与特定的靶mRNA结合,这种结合不要求严格的互补配对。结合后导致靶mRNA翻译的抑制翻译抑制第二十四页,共四十九页。5’endofthesmallRNA,2–8,knownasthe“seedregion”donothaveacomplex

secondarystructureandarelocatedinaccessibleregionsofthe

RNAmicroRNA识别靶位点第二十五页,共四十九页。microRNA作用机制第二十六页,共四十九页。第二十七页,共四十九页。21-ntdsRNAstargetingselectedpromoterregionsofhumangenescausedlong-lasting

andsequence-specificinductionoftargetedgenes第二十八页,共四十九页。miRNA与siRNA的联系:均为Dicer的产物长度均为22nt左右,5’端是磷酸基,3’端是羟基均需Argonaute家族蛋白的存在同为RISC的组分二者进化关系上可能的两种推论:siRNA是miRNA的补充miRNA在进化过程中替代了siRNA沉默机制有重叠第二十九页,共四十九页。miRNA的加工成熟过程与RNAi技术中常用的siRNA有许多相似之处——均经过Dicer酶对双链RNA的识别加工而形成单链RNA分子。第三十页,共四十九页。miRNAsiRNA产生细胞内RNA的固有组分之一(正常)RNAi的活性形式,病毒感染和人工插入dsRNA之后诱导而产生(异常)来源内源转录本转基因或病毒RNA(外源)直接来源发夹状pre-miRNA长dsRNA结构单链双链,3‘端有2个非配对碱基,通常为UU互补性不完全互补,存在错配现象完全互补对靶RNA特异性相对较低,一个突变不影响miRNA的效应较高,一个突变即引起RNAi沉默效应的改变途径miRNA途径RNAi途径对RNA的影响在RNA代谢的各个层面进行调控降解靶mRNA功能调节内源基因的表达,在蛋白质合成水平发挥作用,与mRNA的稳定性无关抑制转座子活性和病毒感染,在转录后水平发挥作用,影响mRNA的稳定性miRNA与siRNA的区别第三十一页,共四十九页。microRNA研究的兴起与发展miRNA发展中遇到的问题:在各种生物中寻找miRNA发现miRNA的靶基因揭示miRNA的功能miRNA?目前靶基因检测工作成为miRNA功能研究的瓶颈第三十二页,共四十九页。miRNA的获取miRNA分子的序列短小1)在基因组中存在较多的互补序列2)在不同生物体内与靶基因结合的方式也不尽相同3)通常与多种蛋白相互作用

这使得建立一个有效而且普遍适用的研究方法异常困难。#到目前为止,miRBase上公布的miRNA总数将近3000种。#现在已知靶基因的miRNA多是通过基因克隆和生物信息学筛选的方法发现的。第三十三页,共四十九页。miRNA的获取——系统生物学筛选随着生物全基因组测序的完成,利用计算机对基因组序列进行搜索可以大大提高miRNA的鉴定效率。所以,人们根据目前已知的miRNA基因序列总结它们的特征和规律,编写了一些计算机程序,通过对生物基因组数据库进行搜索,可以找到那些可能为miRNA的基因序列,然后通过Northernblotting来筛选真正的miRNA基因。

生物信息学方法是依据在不同的物种中,其成熟的miRNA具有较大的序列同源性以及前体的茎环结构具有相当大的保守性这一特征在基因组数据库中搜索新的miRNA基因。该方法根据比较基因组学原理并结合生物信息软件在已测序基因组中进行搜索比对,根据同源性的高低再进行RNA二级结构预测,将符合条件的候选miRNA与已经通过实验鉴定的miRNA分子进行比较分析,最终确定该物种miRNA的分布及数量。近年来随着miRNA预测方法的不断发展,人们发现的miRNA数量呈几何级数增长。这些预测方法从简单的序列比对搜索发展到现在的机器学习算法,程序设计越来越智能化,复杂化。第三十四页,共四十九页。miRNA的获取——系统生物学筛选系统生物学手段可以说是一种更高通量的方法。通常有以下几种方法:①miRscan是一种基于二级结构的预测程序,通过扫描两种系之间是否存在同源的茎环结构,应用于检测脊椎动物和线虫的候选基因。第三十五页,共四十九页。miRNA的获取——生物信息学筛选②Mirseeker是一种检查RNA序列茎环结构的预测程序,应用于筛选昆虫的候选基因。它是根据3个标准来预测的:一是具有长度为70~100nt茎环结构的Pre-miRNA;二是不同种系生物中Pre-miRNA的保守性;三是miRNA的核苷酸差异性。③ERPIN是一种类似于BLAST的校对程序,用于搜寻动物基因组中与miRNA序列类似的序列。④MiPred可以通过randomforest预测模型和miRNA特征的结合,区分miRNA的真正前体和假冒前体。第三十六页,共四十九页。第三十七页,共四十九页。miRBase序列数据库

miRBase序列数据库是一个提供包括miRNA序列数据、注释、预测基因靶标等信息的全方位数据库,是存储miRNA信息最主要的公共数据库之一。miRBase提供便捷的网上查询服务,允许用户使用关键词或序列在线搜索已知的miRNA和靶标信息,详情请()。2012年8月1日正式发布。相比于以往版本的数据库(SangermicroRNA序列数据库),19.0版数据库进行了巨大的数据更新:miRNA发夹前体序列已升至21264条,新增3171条;成熟miRNA升至25141条,新增3625条;已发布的miRNA序列共涵盖193个物种,相比于18.0版新增25个物种。新版数据库对miRNA序列注释和命名进行了系统的修正,miR*命名已经终止使用,取而代之的是-5p和-3p的命名法。第三十八页,共四十九页。miRNA的确认判断标准:

①能够通过与特定大小的总RNA样品杂交得到22个碱基对(~22nt)的产物(即需要Northern杂交或引物延伸反应验证表达)。②所得的序列是从特定大小的(~22nt)的小分子RNA库中克隆到的,并且必需与克隆的来源物种的基因组序列完全匹配。③经过前体的二级结构预测,有发夹状的二级结构,并且成熟的miRNA序列在发夹的一条臂上。④成熟的miRNA序列与预测的二级结构在不同物种间有保守性。⑤在Dicer突变的系统中,前体的积累增多。要确认基因克隆获得的或生物信息学分析预测的基因是否为真正的miRNA,就应该采用上面5个原则来检验。第三十九页,共四十九页。miRNA的靶基因miRNA的靶基因预测miRNA的靶基因检测miRNA的生物学功能第四十页,共四十九页。

miRNA的靶基因预测

以前,研究miRNA的靶基因依赖于正向遗传学方法,包括突变体的产物、变形筛选、定位克隆和miRNA及其靶基因的确认,如lin24和let27及它们的靶基因的发现。在果蝇中,miRNAbantam及其靶基因hid的发现就是正向遗传学研究miRNA的经典过程。

反向遗传学联合生物信息学的方法比正向遗传学更优越。它主要是由软件来预测miRNA的靶基因并为分子实验提供指标,其基本原理是基于miRNA与其靶基因的自然配对。已知miRNA及其靶基因之间的对比和相关性,lin24、let27和bantam基因的确认等都为计算机程序发展提供了更多的信息。计算机程序预测方法在植物种属中运用的很成功,而在动物中则不是很成功,这可能是因为植物中的miRNA与其靶基因几乎完全配对结合。而在动物中,miRNA与靶基因mRNA通常以不精确的碱基互补配对结合。第四十一页,共四十九页。

miRNA的靶基因预测

——miRNA的研究意义之重大是毋庸置疑的。然而,与新的miRNA的频频发现相比,miRNA的功能研究相对缓慢。——到目前为止,在发现的4449多个miRNA中,确定功能的miRNA仅有几十个。——导致miRNA功能研究进展缓慢的非常重要的原因是miRNA的作用靶标难以确定。——通过实验方法确定miRNA的作用靶标非常耗时,目前尚无高通量的靶标鉴定方法。

因此,通过理论方法预测miRNA的作用靶标成为当前识别miRNA作用靶标的较为理想的途径。以下重点介绍几种经典预测软件的算法分析:第四十二页,共四十九页。miRNA几种常见的预测方法下面概括介绍几种常见的预测方法:(ⅰ)miRanda.miRanda是最早的一个利用生物信息学对miRNA靶基因进行预测的软件,由Enright等人于2003年设计开发.其对3′UTR的筛选依据主要是从序列匹配、miRNA与mRNA双链的热稳定性以及靶位点的保守性三个方面进行分析.miRanda软件首先选取了黑腹果蝇(Drosophilamelanogaster)中已知的73条miRNA作为探针,采用类似于Smith-Waterman的算法对9805个3′UTR进行碱基互补分析.——首先,互补参数被设定为:G︰C,A︰U为+5,G︰U为+2,其他配对方式为−3,同时起始空位(gap-opening)罚分为−8,延伸空位(gap-extension)罚分为−2;*序列比对就是通过一定的算法对两个或多个序列进行比较,找出序列间最大的相似性匹配。*Smith&Waterman算法是一种经典的序列比对算法,在双序列比较的情况下具有比较好的速度和结果,但是在进行序列数据库搜索时则显得处理速度不足。第四十三页,共四十九页。miRanda——其次,为体现与靶基因作用过程中miRNA5′端和3′端的不对称性,5′端的前11个碱基的互补分值(complementarityscores)将乘以一个scale参数;——最后,miRNA与靶mRNA的互补还要遵循以下4个规则:miRNA第2~4位碱基和靶基因精确匹配;第3~12位碱基和靶基因错配不得多于5个;9~L-5(L为miRNA总长)位碱基最少一个错配;最后5个碱基错配不得多于2个.第四十四页,共四十九页。miRanda在热稳定性方面,miRanda采用Vienna软件包计算miRNA与3′UTR作用的自由能(ΔG).在物种间保守性方面,要求靶位点在多物种3′UTR比对中相同位置处碱基相同.综合以上3条原则,miRanda选取每条miRNA相对的3′UTR中排名前10位的基因,作为miRNA的候选靶基因,对于多个miRNA对应于同一靶位点的情况,miRanda则使用贪心算法(GreedyAlgorithm)选取其中得分最高且自由能最低的那一对.第四十五页,共四十九页。第四十六页,共四十九页。TargetScan(ⅱ)TargetScan和TargetScanS.TargetScan是Lewis等人在2003年开发的一款用于预测哺乳动物miRNA靶基因的软件,该软件将RNA间相互作用的热力学模型与序列比对分析相结合,预测不同物种间保守的miRNA结合位点.与miRanda不同,在TargetScan的算法中,要求miRNA5′端第2~8位碱基与mRNA的3′UTR完全互补,这7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论