第十二章 非编码RNA与复杂疾病课件_第1页
第十二章 非编码RNA与复杂疾病课件_第2页
第十二章 非编码RNA与复杂疾病课件_第3页
第十二章 非编码RNA与复杂疾病课件_第4页
第十二章 非编码RNA与复杂疾病课件_第5页
已阅读5页,还剩185页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十二章

非编码RNA与复杂疾病生物信息学人类基因组的蛋白质编码区的总和占总基因组长度为1%~2%,那么其他98%的基因组有什么功能呢(junkdna)?(1)42%的基因组是插入编码序列的内含子序列;人类基因平均每个基因有7个内含子。但这么冗长的内含子序列有什么生物学功能呢?(2)其他55%的基因组的功能是什么?【注:90%以上的基因组都是转录的!】人类基因组草图带给科学家们的困惑第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病人类基因组绝大部分都被转录成RNA,细胞内非编码RNA的数量是编码RNA的上百倍。这促使许多科学家认为生物体复杂性被隐藏在它们所输出的非编码RNA内,而非编码序列内。第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病non-codingRNA,ncRNA不能翻译成蛋白的功能性RNA分子Housekeepingnon-codingRNAtRNAs、rRNAs、snRNAsetc.Regulatorynon-codingRNAsmallnon-codingRNAsiRNA、miRNA、piRNA

etc.Longnon-codingRNA(lncRNA,>200nt)第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病第一节引言

Section1Introduction第十二章非编码RNA与复杂疾病随着ncRNA在复杂疾病中的研究深入,研究者发现其在疾病的发生发展过程中起着巨大的作用,其功能异常能够导致各种人类复杂疾病的发生。这将使ncRNA可能成为疾病诊断、预后的新的生物学标记(biomark),并为更进一步理解复杂疾病的发病机理提供了新的手段。第十二章非编码RNA与复杂疾病第二节

非编码RNA与其靶基因

Section2Non-codingRNAsandTargets第十二章非编码RNA与复杂疾病(一)miRNA的发现一、miRNA概述

miRNAwasfirstdiscoveredin1993byVictorAmbrosatHarvard(lin-4)ThesecondmiRNALet-7wasdiscoveredin2000byFrankSlackasapostdocatHarvard

(GaryRuvkunlab)第十二章非编码RNA与复杂疾病ThediscoveryofmiRNAsVictorAmbrosGaryRuvkun第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病microRNAshadbeenneglectedforsomanyyearsbecauseoftheirsmallsize.Theunderlyingreasonis:peopleneverdreamthatsmallRNAswillhaveimportantbiologicalroles.第十二章非编码RNA与复杂疾病ThenumberoftheidentifiedmiRNAsisgrowingrapidlyinrecentyears.Release21(July2014)ofthemiRBasedatabasehaveadded4196newhairpinsequencesand5441newmatureproductsRelease20contains24521entriesrepresentinghairpinprecursormiRNAs,expressing30424maturemiRNAproducts,in206species.第十二章非编码RNA与复杂疾病ThesemiRNAsarefromprimates,rodents啮齿类,birds,fish,worms,flies,plantsandviruses.Thedataarefreelyavailabletoallthroughthewebinterfaceat.第十二章非编码RNA与复杂疾病Sincearound2007,theoverwhelmingmajorityofmicroRNAsdepositedinmiRBasehavebeenpredictedfromsmallRNAdeepsequencingexperiments.第十二章非编码RNA与复杂疾病miRNA的生物合成过程maturemiRNAPrecursormiRNAPrimarymiRNAmiRNAgene转录剪切剪切miRNA(二)miRNA的生物合成第十二章非编码RNA与复杂疾病RNApolyII/IIIDroshaDicer几百~几千碱基约70~90碱基约22碱基第十二章非编码RNA与复杂疾病miRNA例子第十二章非编码RNA与复杂疾病ThemiRNAgenesandStructureofpri-miRNAsPri-miRNAsbearthe5’capand3’poly(A)tails第十二章非编码RNA与复杂疾病(三)miRNA的特点、作用机制及分类microRNA命名规则hsa-miR-181a-2*hsa人,mus小鼠,rat大鼠let,lin,mir,miR,181:编号,按注册顺序a:与已注册的miRNA序列高度同源第十二章非编码RNA与复杂疾病2:由不同染色体上的DNA序列转录加工而成的具有相同成熟体序列的miRNA,则在后面加上阿拉伯数字以区分*:如果一个前体的2个臂分别产生miRNA,则根据克隆实验,在表达水平较低的miRNA后加“*”;或进行如下命名hsa-miR-188-5p(或hsa-miR-188-3p)5p:表示从5‘端的臂加工而来;3p:表示从3‘端的臂加工而来第十二章非编码RNA与复杂疾病hsa-mir-188二级结构hsa-miR-188-5phsa-miR-188-3p5’3’第十二章非编码RNA与复杂疾病miRNA/miRNA-starVS-5p/-3pthedominantstrandcouldchangeindifferentbiologicalsettingsleadingtodifferentnamesdescribingthesamemolecule第十二章非编码RNA与复杂疾病5parm(placenta)tothe3parm(heart,liver,andkidney)第十二章非编码RNA与复杂疾病物理位置特点miRNA基因以单拷贝、多拷贝和基因簇等多种形式存在于基因组中。miRNA簇(miRNAclusters)是指在染色体上彼此紧密相邻的两个或者多个miRNA构成的miRNA群miRNA倾向于成簇出现在染色体上;通常定义50kb的距离为一簇同一簇中的miRNA倾向是共表达的miRNA一般特点—miRNA家族/簇第十二章非编码RNA与复杂疾病序列(特别是种子序列)高度同源的miRNA被归为一个miRNA家族同一家族中的miRNA并不一定是成簇的。第十二章非编码RNA与复杂疾病seed第十二章非编码RNA与复杂疾病miRNA的一般特点序列特点非编码性成熟的miRNA5′端为单一磷酸基团,3′端为羟基,这一特点使它与大多数寡核苷酸和功能RNA的降解片段区别开来;第十二章非编码RNA与复杂疾病表达特点miRNA具有时序性以及组织特异性在特定的时间,组织中才会表达保守性特点在物种间高度保守第十二章非编码RNA与复杂疾病miRNA的作用机制通过和靶基因3′UTR(3′非翻译区)结合导致RNA诱导的沉默复合体(RNA-inducedsilencingcomplex,简称RISC)降解其靶mRNA或阻碍其靶的翻译。第十二章非编码RNA与复杂疾病RISC转录后层面调控基因表达第十二章非编码RNA与复杂疾病二、基于序列的miRNA靶基因预测方法miRNA靶基因预测遵循的基本原则miRandaTargetScan第十二章非编码RNA与复杂疾病ThreeClassesofmiRNATargetSites(Brenneckeetal.PlosBiology2005)第十二章非编码RNA与复杂疾病(一)miRNA靶基因预测遵循的原则和基本步骤miRNA的“种子区”与mRNA的3′UTR序列碱基互补靶点在多物种间的序列保守性miRNA与mRNA形成双链结构的热力学稳定性靶基因二级结构和靶点外的序列对靶基因预测的影响遵循的原则第十二章非编码RNA与复杂疾病miRNA靶位点预测的难点:miRNA与靶位点的不完全互不配对第十二章非编码RNA与复杂疾病基本步骤在3′UTR上探寻和miRNA“种子区”完全互补的序列;计算miRNA和这些序列结合产生的自由能下降值,对靶点进行筛选;对靶点进行物种间序列比对,利用物种保守性进一步筛选。

第十二章非编码RNA与复杂疾病(三)TargetScanTargetScan主要考虑物种间保守的miRNA靶基因,并且在TargetScan中首次提出了“种子匹配”(seedmatch)的概念。第十二章非编码RNA与复杂疾病TargetScan算法的基本步骤在TargetScan算法中,“种子匹配”被定义为miRNA5′端的第2~8位碱基与mRNA3′UTR上的一段7nt(nucleotide)序列完全互补,miRNA上的这7个核苷酸被称为miRNA“种子区”。从种子区开始向miRNA两侧寻找互补碱基,允许G-U配对,直到出现碱基错配为止。在物种保守方面,TargetScan算法发现随着物种数目的增多,预测的靶基因数目逐渐减少,但预测结果的准确率得到提高。第十二章非编码RNA与复杂疾病三、基于表达信息预测miRNA靶基因Huang等人利用在88个组织中同时检测了miRNA和mRNA表达的数据,并结合贝叶斯方法开发了靶基因预测算法GenMiR++,得到了104个人类miRNA的高精度靶基因,并通过实验证实了预测的let-7b靶基因,结果表明,与基于序列的方法相比,利用相同样本中同时检测miRNA和mRNA的表达谱可以更准确的预测miRNA靶基因。(Huang,UsingexpressionprofilingdatatoidentifyhumanmicroRNAtargets.Nat.Methods.)第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病四、基于高通量测序结果预测miRNA靶基因ArgonauteCLIP-SeqRIP-CLIPpSILACDegradome-Seq第十二章非编码RNA与复杂疾病

Agobindsinaternary三元的complextobothmiRNAandmRNA,withsufficientlyclosecontactstoallowUV-crosslinkingtoeitherRNA;mRNAtagswillbeintheimmediatevicinityofmiRNAbindingsites.第十二章非编码RNA与复杂疾病ArgonauteCLIP-Seq第十二章非编码RNA与复杂疾病ArgonauteCLIP-SeqArgonauteCLIP-Seq,又称为HITS-CLIP(ultravioletcross-linkingandimmune-precipitationandandhigh-throughputsequencing),即紫外交联免疫共沉淀与高通量测序偶联技术。CLIP技术是研究RNA结合蛋白(或者RNA)体内结合靶标的新技术。通过紫外交联将RNA结合蛋白与体内结合的RNA分子进行固定,用Ago蛋白的抗体免疫共沉淀之后酶解未受蛋白保护的RNA,可以获得Ago蛋白直接结合的RNA序列。第十二章非编码RNA与复杂疾病针对AGO蛋白的CLIP-seq技术能够在全基因组范围内鉴定与AGO蛋白结合的小RNA及其mRNA靶标。Chi,SW,Zang,JB,Mele,A,Darnell,RB.2009.ArgonauteHITS-CLIPdecodesmicroRNA-mRNAinteractionmaps.Nature.460:479-86。第十二章非编码RNA与复杂疾病FurthermoreHITS-CLIPreadsdonotpreciselypinpointthepositionofcrosslinkingbetweentheRNAandprotein,andthuscanonlyidentifyatargetedregion(~100-nt)asopposedtoaspecifictargetsite.第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病2010年,GeneW.Yeo采用AGO-CLIPseq技术在线虫中鉴定了Argonaute的结合位点,发现其不仅结合mRNA的3’UTR区域,也会结合编码外显子区域,还发现Argonaute大量结合的区域对于miRNA的功能非常重要,揭示了其新的自我调控的功能。要想获得检测区域被哪个miRNA调控,还需结合预测算法第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病五、整合已有知识预测miRNA靶基因

在当前的miRNA靶基因预测研究中,研究人员逐渐意识到单一依靠序列信息或表达信息已不能继续提高miRNA靶基因预测效能。整合功能信息、蛋白质互作信息、表达信息、序列信息以及当前实验证实的miRNA靶基因等已有资源预测miRNA靶基因十分必要。第十二章非编码RNA与复杂疾病miRNA靶点优化算法第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病六、lncRNA概述及靶基因识别lncRNA定义lncRNA特点lncRNA作用机制第十二章非编码RNA与复杂疾病DefinitionoflncRNALongnon-codingRNAs(longncRNAs,lncRNAs)arenon-proteincodingtranscriptslongerthan200nucleotides(Perkel2013).lncRNAsaretranscriptsthatare>200nucleotidesinlengthanddonothavethepotentialtoencodeforproteinsexceedinglengthsof≥30aminoacids(MercerTR.Nat.Rev.Genet.2009,LiXMed.Res.Rev.2012

).

第十二章非编码RNA与复杂疾病ThissomewhatarbitrarylimitdistinguisheslongncRNAsfromsmallregulatoryRNAssuchasmiRNAs,siRNAs,piRNAs,snoRNAs,andothershortRNAs.第十二章非编码RNA与复杂疾病LargescaleRNA-seq

indicatethatlncRNAnumberintheorderoftensofthousandsinmammals.9277manuallyannotatedgenesproducing14880transcripts(GENCODEv7).Thenumberofproteincodinggenesinourgenomehasbeenreviseddownwardmultipletimeswhereasthenumberofknownnonproteincodingtranscriptshasincreasedexponentiallyoverthepastdecade.第十二章非编码RNA与复杂疾病FeaturesoflncRNAs第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病FeaturesoflncRNAslncRNAsaregeneratedbythesametranscriptionalmachineryasareothermRNAslncRNAsarewithsimilarhistone-modificationprofiles,splicingsignals.H3K4me3,H3K36me3lncRNAsarepredominantlylocalizedinthechromatinandnucleus,andafractionappeartobepreferentiallyprocessedintosmallRNAs.第十二章非编码RNA与复杂疾病lncRNAexpressionTissue-specificlncRNAsexpressedinthebrain.第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病conservationManysmallRNAs,suchasmiRNAsorsnoRNAs,exhibitstrongconservationacrossdiversespecies(Bentwich2005).Incontrast,ingenerallncRNAslackstrongconservation,whichisoftencitedasevidenceofnon-functionality(Brosius2005;Struhl2007).DespitelowconservationoflongncRNAsingeneral,itshouldbenotedthatmanylongncRNAsstillcontainstronglyconservedelements第十二章非编码RNA与复杂疾病生化鉴定和功能研究尚处于起步阶段,目前仅有大约100多种已知功能的lncRNAs。AsofDecember2012,~127LncRNAshavebeenfunctionallyannotatedin

LncRNAdb

(adatabaseofliteraturedescribedLncRNAs)(Amral2011).lncRNA通过表观遗传学调控、转录调控、转录后调控、蛋白活性调控等多种方式调控相关基因的作用第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病LncRNAasScaffoldforTranscriptionRepression第十二章非编码RNA与复杂疾病HOTAIRandPRC2第十二章非编码RNA与复杂疾病lncRNAasmiRNADecoyPolisenoetal,Nat2011第十二章非编码RNA与复杂疾病lncRNA研究存在的问题lncRNA的定义>200nt,过于武断lncRNA的命名原则:目前根据功能、结构、作用方式等命名lncRNA相关数据库的内容不够全,注释内容不够丰富第十二章非编码RNA与复杂疾病lncRNA生物学功能的阐明lncRNA功能预测的工具不多区分功能性和非功能性非编码转录本种类和功能复杂,使不同的lncRNA研究结果之间的借鉴意义并不高第十二章非编码RNA与复杂疾病七、ncRNA数据资源ncRNA常用数据库第十二章非编码RNA与复杂疾病miRBase是一个集miRNA序列、注释信息以及预测的靶基因数据为一体的数据库,是目前存储miRNA信息最主要的公共数据库之一网址:(一)miRBase数据库第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病

TarBase是一个目前使用广泛的存储实验检测的miRNA与靶基因间关系的数据库,涵盖多种实验方法检测的超过65000个miRNA与靶基因关系对。其网址为:(二)TarBase数据库第十二章非编码RNA与复杂疾病TarBase数据库界面介绍第十二章非编码RNA与复杂疾病(三)数据库数据库包含miRNA靶基因以及表达谱数据网址:miRNA靶基因数据主要是利用miRanda算法预测得来miRNA表达谱数据来自一个针对人类主要器官和细胞系的小RNA库测序计划第十二章非编码RNA与复杂疾病(四)lncRNA相关数据库因为lncRNA是一个非常新的研究领域,lncRNA在疾病中的作用的研究还是起步阶段,数据量还不够大,因此,相关的数据库也是处于起步阶段,相关数据库还不多,也不够丰富。第十二章非编码RNA与复杂疾病第三节

非编码RNA多态和复杂疾病

Section3Non-codingRNAPolymorphismsandComplexDisease第十二章非编码RNA与复杂疾病miRNA多态(miRNApolymorphisms)是影响miRNA功能的多态,可能发生在miRNA形成和行使功能的任一个过程,以插入、删除、扩增或染色体异位的形式出现,最终导致miRNA绑定位点或者功能的缺失(获得),是人类基因组一类新的功能多态。不仅会影响miRNA的产生和表达,而且会影响miRNA与靶基因的结合从而影响靶基因的表达。介绍第十二章非编码RNA与复杂疾病影响蛋白质参与miRNA合成与成熟,导致新的miRNA生成和靶基因的调控。第十二章非编码RNA与复杂疾病一、位于miRNA基因内部影响miRNA生物学形成的多态在染色体基因组水平上单个核苷酸变异引起的miRNA序列多态性对miRNA的转录、形成、输出和调控具有重要影响。第十二章非编码RNA与复杂疾病Saunders,M.A.等对人类474个miRNAs的SNPs进行系统的分析发现单核苷酸多态在miRNA序列内的密度低于其周围的侧翼序列。第十二章非编码RNA与复杂疾病49个pre-miRNA内存在65个SNPs位点,其中3个miRNAs的种子序列存在SNPs。第十二章非编码RNA与复杂疾病(一)位于pri/pre-miRNA基因序列内部Saunders,M.A.和Duan等人利用生物信息学的方法研究发现在pri/pre-miRNA内部存在单核苷酸多态。位于pri/pre-miRNA内部的多态会影响miRNA的表达,产生新的miRNA以及影响miRNA与靶基因的结合,甚至与疾病的风险相关。第十二章非编码RNA与复杂疾病1.影响miRNA的表达Duan等人在研究miR-125时发现,该基因位点存在SNP,含有miR-125a-G/U两种等位,其中miR-125a-U能够显著影响DGCR8与pri-miRNA-125a的结合与剪接,使成熟的miR-125a生成减少,使miR-125a对靶基因Lin-128的翻译抑制作用减弱。第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病2.产生新的miRNAmiR-146a前体会产生miR-146a(正链)和miR-146a*(负链)两种miRNA。在miR-146a前体的茎环上存在的SNP(rs2910164)不仅会影响miR-146a的表达,而且会导致miR-146a*C和miR-146a*G两种miRNA的产生。第十二章非编码RNA与复杂疾病(二)位于成熟的miRNA序列内部成熟的miRNA与mRNA的3′UTR区域结合对mRNA进行转录后调控。miRNA与mRNA结合的区域包括两部分:种子区域,这一部分区域要求与mRNA严格匹配;种子区域附近的3′端方向,允许一定的程度的错配位于成熟miRNA序列的这些多态会影响对靶基因的调控,消除、弱化、增强或者产生新的结合靶点。第十二章非编码RNA与复杂疾病目前的研究发现,位于miRNA种子区域的多态不仅会影响靶结合位点,还影响miRNA的表达。例如位于miR-125a种子区域的多态显著的抑制了pri/pre-miRNA过程,导致miRNA表达的减少。第十二章非编码RNA与复杂疾病二、miRNA靶点的多态miRNA靶点的多态性靶基因上影响miRNA与靶基结合的序列多态性。这些多态性位点可以影响miRNA对靶基因表达的调控。越来越多研究发现与多种疾病的发病风险有关。第十二章非编码RNA与复杂疾病miRNA靶点多态可分为:miRNA结合位点上的多态性miRNA结合位点上下游的多态性第十二章非编码RNA与复杂疾病miRNA结合位点上(或上下游)的多态性与疾病与疾病相关的miRNA结合位点上的多态性举例位于整联蛋白基因-4(IGBT-4)miRNA结合位点的SNP(rs743553)与乳腺癌发病密切相关(Brendle等)。位于GEMIN3基因miRNA结合位点的SNP(rs197414)与膀胱癌发病密切相关(Yang等)。第十二章非编码RNA与复杂疾病位于靶点附近的多态位点可能会改变mRNA的二级结构从而影响miRNA与靶基因的结合;或影响miRNA与3′UTR上其他调控元件的协同作用(间接影响)例如,HLA-G基因3’UTR区的SNP影响miR-148a,miR-148b和miR-152与HLA-G结合,从而与哮喘的发病风险相关(Zheng等)。第十二章非编码RNA与复杂疾病五、lncRNA多态与复杂疾病近些年,高通量技术(如GWAS,全基因组关联分析)已经确定大量和疾病相关的SNP。因此,如果该SNP是位于一个lncRNA上的话,很可能是该SNP影响了该lncRNA的功能,从而和疾病有关。第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病乳头状甲状腺癌(papillarythyroidcarcinoma,PTC)相关的风险SNP(rs944289)位于一个lncRNA(PTCSC3)的上游3.2kb处,这个风险SNP可以影响该lncRNA的表达,并阐明了这个SNP通过影响lncRNA功能导致乳头状甲状腺癌发生的致病机制。例子第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病数据资源miRNASNPmiRNA-relatedSNPstheirpotentialtargetlossandgaininformationdbSMR数据库一个分析基因3′UTR上的SNP对miRNA与靶点结合关系影响的数据库。第十二章非编码RNA与复杂疾病PolymiRTS数据库

整合了序列多态性位点数据、表型数据和基因表达谱数据,来挖掘潜在的可以用于解释表达数量性状位点和表型数量性状位点效应的miRNA靶基因的结合区域上的多态性位点,并把这些多态称作PolymiRTS。第十二章非编码RNA与复杂疾病lincSNP数据库简介

LincSNP是一个整合的数据库,为了识别和注释人类lncRNA上疾病相关的SNP而构建的全面的综合数据库。目前该数据库中包括大约140,000疾病相关的SNP,这些SNP位于大约5000个人类的lncRNA周围。这个数据库也包含了注释的,实验证实的SNP-lncRNA-疾病的关联数据以及疾病相关的lncRNA数据,并提供了友好的界面和有效的工具获得疾病相关的SNP以及lncRNA。第十二章非编码RNA与复杂疾病LincSNP数据库()Ning,etal,BMCbioinformatics,2014第十二章非编码RNA与复杂疾病第四节

非编码RNA表达谱与复杂疾病

Section4Non-codingRNAExpressionProComplexDisease第十二章非编码RNA与复杂疾病癌症的本质归结为各种原因引起的基因结构和功能的异常一、ncRNA表达谱识别癌症相关ncRNA致癌基因的高表达抑癌基因的低表达miRNA和lncRNA作为两类重要的基因调控子,其表达变化将会对靶基因的活动产生深远的影响复杂疾病的诊断和治疗研究中必定会引入miRNA及lncRNA第十二章非编码RNA与复杂疾病(一)miRNA表达谱1.ncRNA的特征低丰度、组织特异性、发育阶段特异性、疾病状态特异性2.ncRNA表达检测技术Northern印迹、克隆(cloning)、定量PCR扩增、SAGE技术、磁珠技术和寡核苷酸芯片技术、新一代测序技术第十二章非编码RNA与复杂疾病miRNA表达谱microRNA芯片制作和分析流程制作芯片差异表达miRNA数据分析miRNA表达谱预处理第十二章非编码RNA与复杂疾病1.ncRNA表达数据来源GeneExpressionOmnibus(GEO)数据库、ArrayExpress数据库、SequenceReadArchive(SRA)2.miRNA表达谱数据标准化中值处理mRNA表达谱数据标准化方法并不能简单地应用于miRNA表达谱数据,目前仍没有统一有效的标准化方法可用于miRNA表达谱第十二章非编码RNA与复杂疾病smallRNAseqlibrarypreparation(Directional)第十二章非编码RNA与复杂疾病ApipelineforsmallRNAannotation(seeinGEDGalaxy)Sequencereads(fastaformat)Bowtiepre-miRNA(miRBase)UnmatchedreadsUnmatchedreadsTransposonsUnmatchedreadsGenesUnmatchedreadsUnmatchedreadsRemainingunmatchedsequencesBowtieBowtieNoncodingRNAsBowtieBowtieBowtieIntergenicregionsViruses,transgenes,etc…hierarchicalannotationofsequencedatasetsMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCount丰度数据(count)预处理数据过滤-去除低质量的或噪声数据点,去除序列标签匹配性差的表达值重复数据合并–加和,代表同一个基因的标签的tag(或完全相同读段)的表达数目相加缺失数据的处理–一般不补缺失值,因为0是有意义的,可以发现某种条件下不表达的基因数据标准化–RPM(ReadsPerMillionreads)第十二章非编码RNA与复杂疾病miRNA表达谱M个miRNAN1个疾病样本、N2个正常样本第十二章非编码RNA与复杂疾病利用表达谱寻找复杂疾病相关miRNA差异表达分析——寻找异常表达miRNAFoldchange、T-test、ANOVA、SAM等低通量实验证实生物学证实TargetgenesmiRNA功能1功能n功能2功能注释/功能富集表型miRNA功能预测和病理假设miRNA表达的失调和许多复杂疾病相关,比如心血管类疾病和癌症等miRNA与癌症miRNA表达谱的基因组范围研究指出原发癌中存在miRNA的表达变化特异的miRNA表达谱与特定类型的癌症有关,提示其有用于诊断的潜能第十二章非编码RNA与复杂疾病癌症的本质归结为各种原因引起的基因结构和功能的异常致癌基因的高表达抑癌基因的低表达某些miRNA作用靶基因是重要的癌通路组成部分,参与了癌基因网络调控miRNA第十二章非编码RNA与复杂疾病miRNA表达的变化认为是发生癌症的共同特征oncogenicmiRNAs(oncomiRs)第十二章非编码RNA与复杂疾病Proliferation

Invasionmetastasis

AngiogenesisApoptosisOncogenicmiRNAsTumorSuppressormiRNAsCancer表达降低表达升高第十二章非编码RNA与复杂疾病mir-17-92cluster—asoncogenicmiRNAsc-MYCmir-17Promote‘stemcell’properties第十二章非编码RNA与复杂疾病mir-17-92clusterislocatedataamplifiedregionDNAinB-celllymphomas.Here,wehaveshownthatonemiRNApolycistronisnotonlythesubjectoftumour-specificamplification,butthatitisalsooverexpressedintumoursandtumourcelllines,andcanactasanoncogeneinvivo.Adetailed,mechanisticunderstandingofhowthisnon-codingRNAclusteractsasanoncogeneisatpresenthamperedbythelackofavalidatedbiochemicalstrategyforidentifyingmiRNAtargets.第十二章非编码RNA与复杂疾病mir-17-92cluster—astumoursuppressorc-MYC17-5p,20aE2F1mir-17ProliferationGrowth第十二章非编码RNA与复杂疾病Loss-of-heterozygosityofthechromosomalregionencompassingthemir-17cluster(13q31)hasbeenobservedinhumanmalignancies.NegativeregulationofE2F1translationbymiR-17-5pandmiR-20aprovidesamechanismtodampenthisreciprocalactivation,promotingtightlycontrolledexpressionofc-MycandE2F1geneproducts.Itsuggeststhatthemir-17cluster,bydecreasingE2F1expression,tightlyregulatesc-Myc-mediatedcellularproliferation.

第十二章非编码RNA与复杂疾病ItisthuslikelythatthesemiRNAsinfluencecellproliferationandtumorigenesisinacell-typespecificmanner,dependingonthemilieuoftargetmRNAsthatareexpressed.第十二章非编码RNA与复杂疾病与癌症相关的miRNA第十二章非编码RNA与复杂疾病JournalofThoracicOncology:December2011-Volume6第十二章非编码RNA与复杂疾病癌症中的ncRNA表达ncRNA表达谱可作为特定癌症的表型标签癌症中的ncRNA表达变化是因还是果,需要对ncRNA功能的进一步研究第十二章非编码RNA与复杂疾病二、ncRNA表达谱分类人类癌症许多研究已经表明编码蛋白的转录本(mRNA)可以有效地区分各种癌症。这些与癌症相关的转录本作为一种可靠的生物学标记(biomark)已被广泛应用于各种癌症的分型研究。我们将采用Lu等人发表于2005年nature期刊miRNA表达谱数据来探索基于miRNA表达水平的癌症分类。第十二章非编码RNA与复杂疾病首先GEO数据库GSE2564获取所有相关数据,其中包括334个样本的原始miRNA表达数据,预处理后的miRNA表达数据,探针信息,样本信息等。该表达谱数据包含用两个芯片平台检测的334个样本的miRNA表达谱。所采用的预处理过程包括基于控制探针的标准化,修正表达强度偏低的探针,删除所有控制探针,以及对表达值进行以2为底的对数转换。第十二章非编码RNA与复杂疾病采用层次聚类方法平均链路算法,皮尔森相关系数可以明显看出具有共同组织发育起源的样本被聚到一起。第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病

除了上述所用到218个样本,该数据还包括了检测自73个急性淋巴细胞白血病患者骨髓样本的miRNA表达水平。第十二章非编码RNA与复杂疾病利用t检验方法对正常组织与肿瘤组织的miRNA表达水平进行比较,并使用随机扰动的方法为每个miRNA产生一个p值,最后对p值进行bonferroni校正。第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病2012年8月28日《GenomeBiology》,斯坦福大学医学院研究人员进行首个大型的癌症lncRNA表达谱分析。对64个肿瘤样品高通量RNA-seq测序,在各种肿瘤类型之间找出差异表达的1065个lncRNA(图12-13)。因此lncRNA可以成为生物标志物。第十二章非编码RNA与复杂疾病图12-13lncRNA表达谱分类人类癌症第十二章非编码RNA与复杂疾病GliomageneexpressiondatausedinthisstudywereobtainedfromthepubliclyavailableGEO.AffymetrixHG-U133Plus2.0platform2448lncRNAtranscriptswithcorrespondingAffymetrixprobeIDsSignificanceAnalysisofMicroarrayswasusedtodeterminethedifferentiallyexpressedlncRNAs≥2-fold,FDR<10%第十二章非编码RNA与复杂疾病DifferentiallyexpressedlncRNAprobesetsbetweennormalbrainsandgliomasAtotalof129lncRNAprobesets(correspondingto102lncRNAs)identifiedassignificantlydifferentbetweennormalbraintissuesandgliomasbySAM.第十二章非编码RNA与复杂疾病Blue---normalbraintissues;yellow---gliomasamples.第十二章非编码RNA与复杂疾病三、ncRNA表达谱与mRNA表达谱的整合分析随着检测技术的不断发展,生物学资源的大量涌现,生物信息学研究者已经不仅仅局限于使用一种数据资源第十二章非编码RNA与复杂疾病表型数据

互作网络表达数据

SNP整合整合多种类型的生物数据(如各种表达谱数据、互作网络、调控网络、SNP数据、表型数据等)来解决特定复杂的生物医学问题第十二章非编码RNA与复杂疾病剖析重大疾病相关miRNA的调控机制和功能生物学证实TargetgenesmiRNA功能1功能n功能2表型背景信息???HITS-CLIP第十二章非编码RNA与复杂疾病ItisclearthatmiRNAshavemanydifferenttargets—dozensinsomecases,hundredsinothers—butdependingonthecellsinvolved,itseemslikelythatonlyasmallnumberofthemhaveacrucialroleincancerpathogenesis.

naturereviewsgenetics(2009)第十二章非编码RNA与复杂疾病预测疾病背景下miRNA调控的靶基因数据mRNA表达谱第十二章非编码RNA与复杂疾病miRNA表达谱第十二章非编码RNA与复杂疾病miRNA-mRNA靶向关系第十二章非编码RNA与复杂疾病皮尔森相关系数第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病AhubmiRNAsignaturepredictssurvivalinglioma第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病第十二章非编码RNA与复杂疾病前提假设miRNAsimplicatedinaspecifictumorphenotypewillshowaberrantregulationoftheirtargetgenesAkeydifferencefromothermethodsisthatweidentifieddysregulatednetworkedges(regulations)insteadofdysregulatednodes(miRNAs)toassembledisease-relatedsignatures.第十二章非编码RNA与复杂疾病miRNA

family的协同失调作用第十二章非编码RNA与复杂疾病包含三个miRNA家族mir-125,mir-181和mir-145家族最小的后验概率为77.4%,表明这些miRNA和前列腺癌相关这些基因富集的功能有‘pathwaysinprostatecancer’,‘celladhesion’and‘apoptosis’等第十二章非编码RNA与复杂疾病第五节

复杂疾病非编码RNA的计算识别

Section5ComputationalIdentificationofComplexDiseasesAssociatedNon-codingRNAs第十二章非编码RNA与复杂疾病一、概述二、复杂疾病相关miRNA的计算识别三、复杂疾病相关lncRNA的计算识别四、复杂疾病相关非编码RNA数据资源第十二章非编码RNA与复杂疾病一、概述系统地识别疾病相关的ncRNA是在分子水平上理解ncRNA诱导疾病的发病机制的前体,是为疾病诊断,治疗和预防设计有关特定分子工具的关键。通过实验方法通常只局限于单一或者少量的ncRNA,难以从系统的角度研究疾病相关的ncRNA。计算生物学的方法成为解决这一问题的关键,为未来实验设计提供优先的对象。第十二章非编码RNA与复杂疾病基于miRNA-靶基因预测基于miRNA调控网络预测miRNA协同与复杂疾病二、复杂疾病相关miRNA的计算识别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论