系统生物学-转录组学与microRNA研究.ppt_第1页
系统生物学-转录组学与microRNA研究.ppt_第2页
系统生物学-转录组学与microRNA研究.ppt_第3页
系统生物学-转录组学与microRNA研究.ppt_第4页
系统生物学-转录组学与microRNA研究.ppt_第5页
免费预览已结束,剩余49页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、microRNA Small molecular, Big world,基因组学,RNA组学,蛋白质组学,蛋白质编码基因数量,人: 30,000 果蝇和线虫:12,000-14,000 酿酒酵母: 6,200 假单孢菌: 5,500 人和鼠的蛋白质编码基因99%是共同的。 人个体间单倍体基因组的碱基差异300万个,其中1万个(0.3%)出现在蛋白质编码基因中。 98%转录产物是非编码蛋白RNA。,RNA的分类,细胞核和胞液 线粒体 功能,核蛋白体RNA rRNA mt rRNA 核蛋白体组成成分 信使RNA mRNA mt mRNA 蛋白质合成模板 转运RNA tRNA mt tRNA 转运氨

2、基酸 不均一核RNA hnRNA 成熟mRNA的前体 小核RNA snRNA 参与hnRNA的剪接、转运 小胞浆RNA scRNA/7SL-RNA 蛋白质内质网定位合成的 信号识别体的组成成分,新定义,The complete collection of transcribed elements of the genome. (Affymetrix, 2004) mRNA rRNA, tRNA snmRNAs (small non-messenger RNAs) microRNAs and siRNAs (small interferring RNAs) snoRNAs (small nucl

3、eolar RNAs) 核仁小分子RNA snRNAs (small nuclear RNAs) Other non-coding RNAs Long non-coding RNA (lncRNA),有些小RNA分子能直接调控某些基因的开关从而控制细胞的生长发育并决定细胞分化的组织类型 小RNA分子本身又包含了若干类RNA,根据小RNA 的生成、结构和功能大约可分为以下三类:,miRNA (microRNA) siRNA (small interfering RNA) 其他小RNA,MicroRNA 简介, (1)长度为21nt左右核苷酸的内源性单链小分子RNA;(2)存在65nt左右的发夹结

4、构前体;(3)基因座位于蛋白质基因间隔区;(4)其DNA序列在近源物种间高度保守。 miRNA具有十分重要的调控功能,它们主要参与基因转录后水平的调控 。能够通过与靶mRNA特异性的碱基配对引起靶mRNA的降解(植物中较为常见)或者抑制其翻译(动物中较为常见),从而影响了靶mRNA的表达。,microRNA(miRNA),是广泛存在于真核生物中的一组短小的、不编码蛋白质的RNA家族,它们是由19-23个核苷酸组成的单链RNA(3端可有12个碱基长度的变化) 表达具有组织特异性和阶段特异性。即:在不同组织中表达有不同类型的miRNA;在生物发育的不同阶段里有不同的miRNA表达 与靶mRNA 3

5、-UTR结合,序列特异性的在转录后水平调控基因的翻译表达 ,在生物发育、脂肪代谢、细胞的分化、增殖和凋亡等过程中发挥着重要作用,miRNA具有高度保守性,即各种miRNA都能在其他种系中找到同源体; miRNA独有的特征:其5端第一个碱基对U有强烈的倾向性,而对G却有抗性,但第二到第四个碱基缺乏U,一般来讲,除第四个碱基外,其他位置碱基通常都缺乏C miRNA执行一定的生物学功能:,对与其互补的mRNA表达水平具有调节作用; 一些偏大的miRNA (27nt)可能参与了基因组的重组装 参与生物的发育与多种生理、病理过程,1993,2000,2001,2002,2003,2004,2005,20

6、06,2007,microRNA的研究历史,Dr. Victor Ambros,2002年 入选science年度十大科学发现之首,miRNA and Cancer,The first demonstration of a link between miRNA genes and cancer.,The first paper to show that the deregulation of a single miRNA gene can lead to cancer.,An elegant study that shows a pathogenetic link between miRNAs

7、 and target oncogenes.,miRNA controls some plant phenotype,据体内外实验研究表明miRNA的生成需要两个步骤:,1)由长的内源性转录本(pri-miRNA)经Drosha酶作用生成70nt左右的miRNA前体(pre-miRNA),该过程发生在细胞核 2)将pre-miRNA经Dicer酶作用加工为成熟miRNA,该过程发生在细胞质中。,microRNA的加工成熟,通过生物信息的手段分析了microRNA在蛋白相互作用网络和转录因子-microRNA相互调控网络中的作用,据体内外实验研究表明miRNA的生成需要两个步骤:,1)由长的内源

8、性转录本(pri-miRNA)经Drosha酶作用生成70nt左右的miRNA前体(pre-miRNA),该过程发生在细胞核 2)将pre-miRNA经Dicer酶作用加工为成熟miRNA,该过程发生在细胞质中。,microRNA的加工成熟,首先由基因组转录形成长链RNA分子pri-miRNA,约60%的microRNA为独立转录表达;约15%miRNA为成簇存在而共同转录;其余还有约25%的miRNA定位于功能基因内含子,随基因转录表达。,Pri-miRNA经双链RNA核酸酶Drosha酶作用,加工形成70-100nt长度的pre-miRNA,Pre-miRNA在Exportin5介导作用下

9、转运出胞核至胞质中进行下一步加工,Pre-miRNA在胞质中经双链RNA核酸酶Dicer酶作用加工形成单链成熟miRNA分子,miRNA发挥作用过程,19-23nt的成熟miRNA形成后与其他蛋白共同组成RNA介导的沉默复合体(RISC)参与RNA干扰途径,miRNA形成RISC复合体后可与特定的靶mRNA结合,这种结合不要求严格的互补配对。结合后导致靶mRNA翻译的抑制,翻译抑制,5end of the small RNA,28, known as the “seed region” do not have a complex secondary structure and are loca

10、ted in accessible regions of the RNA,microRNA识别靶位点,microRNA作用机制,21-nt dsRNAs targeting selected promoter regions of human genes caused long-lastingand sequence-specific induction of targeted genes,miRNA与siRNA的联系:,均为Dicer的产物 长度均为22nt左右,5端是磷酸基,3端是羟基 均需Argonaute家族蛋白的存在 同为RISC的组分 二者进化关系上可能的两种推论:,siRNA是m

11、iRNA的补充 miRNA在进化过程中替代了siRNA,沉默机制有重叠,miRNA的加工成熟过程与RNAi技术中常用的siRNA有许多相似之处均经过Dicer酶对双链RNA的识别加工而形成单链RNA分子。,miRNA与siRNA的区别,microRNA研究的兴起与发展,miRNA发展中 遇到的问题: 在各种生物中寻找 miRNA 发现miRNA的靶基因 揭示miRNA的功能 miRNA?,目前靶基因检测 工作成为miRNA 功能研究的瓶颈,miRNA的获取,miRNA 分子的序列短小 1)在基因组中存在较多的互补序列 2)在不同生物体内与靶基因结合的方式也不尽相同 3)通常与多种蛋白相互作用

12、这使得建立一个有效而且普遍适用的研究方法异常困难。 #到目前为止,miRBase上公布的miRNA总数将近3 000种。 #现在已知靶基因的miRNA多是通过基因克隆和生物信息学筛选的方法发现的。,miRNA的获取系统生物学筛选,随着生物全基因组测序的完成,利用计算机对基因组序列进行搜索可以大大提高miRNA的鉴定效率。所以,人们根据目前已知的miRNA基因序列总结它们的特征和规律,编写了一些计算机程序,通过对生物基因组数据库进行搜索,可以找到那些可能为miRNA的基因序列,然后通过Northern blotting来筛选真正的miRNA 基因。 生物信息学方法是依据在不同的物种中,其成熟的m

13、iRNA 具有较大的序列同源性以及前体的茎环结构具有相当大的保守性这一特征在基因组数据库中搜索新的miRNA 基因。该方法根据比较基因组学原理并结合生物信息软件在已测序基因组中进行搜索比对,根据同源性的高低再进行RNA二级结构预测,将符合条件的候选miRNA与已经通过实验鉴定的miRNA分子进行比较分析,最终确定该物种miRNA的分布及数量。近年来随着miRNA预测方法的不断发展,人们发现的miRNA数量呈几何级数增长。这些预测方法从简单的序列比对搜索发展到现在的机器学习算法,程序设计越来越智能化,复杂化。,miRNA的获取系统生物学筛选,系统生物学手段可以说是一种更高通量的方法。通常有以下几

14、种方法: miRscan是一种基于二级结构的预测程序,通过扫描两种系之间是否存在同源的茎环结构, 应用于检测脊椎动物和线虫的候选基因。,miRNA的获取生物信息学筛选,Mirseeker是一种检查RNA序列茎环结构的预测程序,应用于筛选昆虫的候选基因。 它是根据3个标准来预测的:一是具有长度为70100 nt茎环结构的Pre-miRNA;二是不同种系生物中Pre-miRNA的保守性;三是miRNA的核苷酸差异性。 ERP IN是一种类似于BLAST的校对程序,用于搜寻动物基因组中与miRNA 序列类似的序列。 MiPred可以通过random forest预测模型和miRNA特征的结合,区分m

15、iRNA 的真正前体和假冒前体。,miRBase序列数据库,miRBase序列数据库是一个提供包括miRNA序列数据、注释、预测基因靶标等信息的全方位数据库,是存储miRNA信息最主要的公共数据库之一。miRBase提供便捷的网上查询服务,允许用户使用关键词或序列在线搜索已知的miRNA和靶标信息,详情请(/)。 2012年8月1日正式发布。相比于以往版本的数据库(Sanger microRNA序列数据库),19.0版数据库进行了巨大的数据更新:miRNA发夹前体序列已升至21264条,新增3171条;成熟miRNA升至25141条,新增3625条;已

16、发布的miRNA序列共涵盖193个物种,相比于18.0版新增25个物种。新版数据库对miRNA序列注释和命名进行了系统的修正,miR*命名已经终止使用,取而代之的是-5p和-3p的命名法。,miRNA的确认,判断标准: 能够通过与特定大小的总RNA样品杂交得到22个碱基对( 22nt)的产物(即需要Northern杂交或引物延伸反应验证表达) 。 所得的序列是从特定大小的( 22nt)的小分子RNA库中克隆到的, 并且必需与克隆的来源物种的基因组序列完全匹配。 经过前体的二级结构预测,有发夹状的二级结构,并且成熟的miRNA序列在发夹的一条臂上。 成熟的miRNA序列与预测的二级结构在不同物种

17、间有保守性。 在Dicer突变的系统中,前体的积累增多。 要确认基因克隆获得的或生物信息学分析预测的基因是否为真正的miRNA,就应该采用上面5个原则来检验。,miRNA的靶基因,miRNA的靶基因预测 miRNA的靶基因检测 miRNA的生物学功能,miRNA的靶基因预测,以前,研究miRNA的靶基因依赖于正向遗传学方法,包括突变体的产物、变形筛选、定位克隆和miRNA及其靶基因的确认,如lin24和let27及它们的靶基因的发现。在果蝇中,miRNA bantam及其靶基因hid的发现就是正向遗传学研究miRNA的经典过程。 反向遗传学联合生物信息学的方法比正向遗传学更优越。它主要是由软件

18、来预测miRNA的靶基因并为分子实验提供指标,其基本原理是基于miRNA与其靶基因的自然配对。已知miRNA及其靶基因之间的对比和相关性, lin24、let27和bantam基因的确认等都为计算机程序发展提供了更多的信息。 计算机程序预测方法在植物种属中运用的很成功,而在动物中则不是很成功,这可能是因为植物中的miRNA 与其靶基因几乎完全配对结合。而在动物中,miRNA与靶基因mRNA通常以不精确的碱基互补配对结合。,miRNA的靶基因预测,miRNA的研究意义之重大是毋庸置疑的。然而,与新的miRNA的频频发现相比,miRNA的功能研究相对缓慢。 到目前为止,在发现的4449多个miRN

19、A中,确定功能的miRNA仅有几十个。 导致miRNA功能研究进展缓慢的非常重要的原因是miRNA的作用靶标难以确定。 通过实验方法确定miRNA的作用靶标非常耗时,目前尚无高通量的靶标鉴定方法。 因此,通过理论方法预测miRNA的作用靶标成为当前识别miRNA作用靶标的较为理想的途径。以下重点介绍几种经典预测软件的算法分析:,miRNA几种常见的预测方法,下面概括介绍几种常见的预测方法: () miRanda. miRanda 是最早的一个利用生物信息学对miRNA 靶基因进行预测的软件, 由Enright等人于2003 年设计开发. 其对3UTR 的筛选依据主要是从序列匹配、miRNA 与

20、mRNA 双链的热稳定性以及靶位点的保守性三个方面进行分析. miRanda 软件首先选取了黑腹果蝇(Drosophila melanogaster)中已知的73 条miRNA 作为探针, 采用类似于Smith-Waterman 的算法对9805 个3UTR 进行碱基互补分析. 首先, 互补参数被设定为: GC, AU 为+5, GU 为+2, 其他配对方式为3, 同时起始空位(gap-opening)罚分为8, 延伸空位(gap-extension)罚分为2; *序列比对就是通过一定的算法对两个或多个序列进行比较,找出序列间最大的相似性匹配。*Smith 最后, miRNA 与靶mRNA 的

21、互补还要遵循以下4 个规则: miRNA 第24 位碱基和靶基因精确匹配; 第312 位碱基和靶基因错配不得多于5 个; 9L-5(L 为miRNA 总长)位碱基最少一个错配; 最后5 个碱基错配不得多于2 个.,miRanda,在热稳定性方面, miRanda 采用Vienna 软件包计算miRNA 与3UTR 作用的自由能(G). 在物种间保守性方面, 要求靶位点在多物种3UTR 比对中相同位置处碱基相同. 综合以上3 条原则, miRanda 选取每条miRNA相对的3UTR 中排名前10 位的基因, 作为miRNA的候选靶基因, 对于多个miRNA 对应于同一靶位点的情况, miRan

22、da 则使用贪心算法(Greedy Algorithm)选取其中得分最高且自由能最低的那一对.,TargetScan,() TargetScan 和TargetScanS. TargetScan 是Lewis 等人在2003 年开发的一款用于预测哺乳动物miRNA靶基因的软件, 该软件将RNA 间相互作用的热力学模型与序列比对分析相结合, 预测不同物种间保守的miRNA 结合位点. 与miRanda 不同, 在TargetScan 的算法中, 要求miRNA5端第28 位碱基与mRNA 的3UTR 完全互补, 这7 个核苷酸被称作“miRNA 种子区/关键区”(seed region). 种子

23、区向两侧延伸直到出现碱基错配为止, 这期间允许GU配对, 同时利用RNAFold 计算结合位点的自由能. TargetScan 中引入了信号噪声比来评估预测结果的准确度, 所谓信号噪声比即用已知(信号组)和随机生成的miRNA(噪声组)分别对mRNA 的3UTR 进行预测, 所得靶基因数目的比值. 当仅针对人(Homo sapiens)和小鼠(Mus musculus)的3UTR 对miRNA 靶位点进行预测时, 信号噪声比为21 针对人、小鼠、大鼠(Rattus norvegicus)的3UTR 进行预测时信号噪声比为3.21 研究范围扩大到人、小鼠、大鼠和河豚(Takifugu rubri

24、pes)时, 信号噪声比为4.61. 随着物种数目的增多, 预测得到的靶基因减少, 但准确性得到了相应的提高.,TargetScanS,后来, Lewis 等人又对TargetScan 进行了优化,即TargetScanS. TargetScanS 在人、小鼠、大鼠的基础上增加了狗(Canis familiaris)和鸡(Gallus gallus)的基因组数据, 同时在算法上做了改动, 将种子区由先前的7 个核苷酸调整为5端第27 位碱基共6 个核苷酸,要求在种子区完全互补的情况下, miRNA 第8 位碱基与靶基因互补或者miRNA第1 位碱基是腺嘌呤. 2007年, Andrew 等人又将TargetScanS 的算法中加入了新的条件 1)即有效的miRNA 结合位

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论