中医药mrna mirna大鼠23samples测序项目结题报告_第1页
中医药mrna mirna大鼠23samples测序项目结题报告_第2页
中医药mrna mirna大鼠23samples测序项目结题报告_第3页
中医药mrna mirna大鼠23samples测序项目结题报告_第4页
中医药mrna mirna大鼠23samples测序项目结题报告_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目目 已知miRNA表达谱构 新miRNA预 靶预 靶GO功能分 靶KEGGpathway功能分 附录1结果文件存放信 附录2分析软件说 miRNA深度数据需要处理3端的接头,5‘接头的污染等问题,质量控制主要包括:去除低质量的read,高质量read的3接头,5接头,ployA片段等。此处用到FastQC和Cutadapt1.trim3trimGC4trimGC5trimreads 在相关实验不存在污染且所使用参考组与物种一致的情况下,cleanreads在参考序列上的定位百分比(map比率)会高于60%,下面是部分样本的对比结果。Total TooTotal TooShortReadsmaptowith>=5xs-97379667s-113862145s-115663239s-10873s-90098943s-112192744s-104422927s-107802722s-91119058s-91609106s-11563s-87938622%s-96419580s-99539903s-96329575s-85398491s-93669307s-11s-114972214s-10257%s-88468794s-10331s-109202053s-10s-793778261159s-75187461s-108533281s-106373405s-2106s-80147951s-104122885s-94269305表头说明:Readswithadapters:含有接头的序列TooShortAfterTrimming(<17bpsTrimReadssenttoAligner:trimcleanreadsmapratio:mapPrecursormiRNAReadsmiRNAMaturemiRNAReadsmiRNAKnownmiRNAwith>=5xcoverage:已知miRNA覆盖度大于5x的序列数 已知miRNA统计miRNA表达丰度的方法,是根据read在组上的map位置来来统计,对map到物种已知miRNA的发卡序列区域的readreadmiRNA成熟序miRDeep22miRNA(s-11-s-18Mature20022100以Sample-s-11为例,miRNA二级结构以及 新miRNA

图7.miRNA二级结构以及 readmiRNAmiRDeep2As-s-te181-80121-1-111-01111-11111-3-297 00 1表头说明:Chr:Start:miRNA序列在 Stop:miRNA序列在 s-11_ReadCountreads根据miRBase数据库的分类标准对已知的miRNA进行注释,根据序列对新miRNA进行分析,若新miRNA与miRBase中的已知miRNA有相同的区域,那么该miRNA和miRNA中已知miRNA属于同一个。表4.已知miRNA的miRNA分析结果(样本sample-s-11的部分结果FamilyFamilymir-2mir-mir-mir-mir-0mir-0mir-0mir-mir-mir--FamilyName:根据miRBase数据库的分类标准得到的的名Familyread_count:在这个中miRNA的readsprovisional miRNAwiththeFamily表provisional miRNAwiththeFamily provisionalidmiRNAexamplemiRbasemiRNAwiththesameseed:与新miRNA具有相同区域的已miRNAFamily start:新miRNA end:新miRNA 表6.新miRNA的miRNA分析结果(为主provisionalmir- mir-0 mir- mir- count_num/SR-1:样本SR-1中在中miRNA的readsprovisionalid:新miRNA的名称新miRNAstart:新miRNA在 end:新miRNA在 结果路径: S\2-miRNA的区域的碱基变化,能够很大程度上改变miRNA的靶,由于前面的步骤要求在miRNA的mismatch,所以进行miRNAread进行重新匹配。该流程采取的方式是对该物种的发卡序列建立bowtieindex,把所有的read匹配到发卡序列上,从匹配结果中筛选在已知miRNA的成熟序列所在区域的所有SNP。注:表格均为部分结果展示,完整的表格请参看结果文件。表1展示的是样本SR-1的部分结果s-11s-11s-111AT0441TA0111TC0/1TA0/1TCrno-mir-3556b-10331CTrno-mir-3556b-10291ATrno-mir-3556b-10211GArno-mir-3556b-10191ATrno-mir-3556b-1010GArno-mir-3556b-10002Alt:编辑后的碱基Precursor_miRNA:发卡miRNA名称:该变异位点属于的成熟SeedRegion:该变异位点是否位于成熟miRNA的区域,0表示不在区域内,1:样本 上的表达值,本流程中选取最大值作为该miRNA的表达值丰度。结果文件描述如下:S*XvsS*X.txt:组间两两比较的文件;图8.两组样本火山图(S1XvsS2X为例)。红色点为P-value0.05miRNA。 miRNA靶预测分为两个部分,已知miRNA靶以及新miRNA靶预测。已知miRNA的靶预测。本流程采取的方式是从思个数据库分别是miRanda、miRDB、Targetscan和miRTarBase靶数据,进行靶预测。5-TargetGene_predition/predict.xls和5-TargetGene_predition/miRNA:miRNA的名称target_gene:预测的target名表9.已知miRNA被验证的靶结miRTarBaseWestern nblotWesternWesternCNextMTIWesternWestern nFunctional nFunctionalWesternmiRTarBaseID:miRTarBaseIDmiRNA:miRNA的名称targetgene:预测的target名SupportType:支持的类型References:文献的ID 靶GO功能分GO功能分析是针对全/转录本和差异/转录本进行功能注释和归类,如果从全基因/转录本筛选到差异/转录本列表,可以对差异/转录本列表进行GO功能富积分析,GO功能富积分析的方法:将全部/转录本作为背景列表,差异/转录本列表作为从背景列表中筛选出来的候选列表,利用FisherGO/转录本列表中是否显著富积的PPBenjamini&Hochberg多重检验纠正。表10.GO功能富积分析结果文件(biological_process分类)GOIDGeneOntologyDescriptionGeneOntologyBgRation:所有(bg)中与该Term相关的数与所有(bg)的比值pvalue:富集分析统计学显著水平,一般情况下,P-value<0.05该功能为富集项p.adjust矫正后的P-Valueqvaluepq 中与该Term相关 图9.显著富集GO树状图,每个GO分类下显示显著富积程度前10个颜色越深富集程度越高,每个节点中显示GO名称及的p-value靶KEGGpathway功能分KEGGpathway功能分析是针对全/转录本和差异/转录本进行KEGG数据库PathwayKEGGpathwayGOIDKEGGDescriptionGeneOntologyGeneRatio:差异中与该ID相关的数与整个该Term的总 BgRation:所有(bg)中与该ID相关的数与所有(bg) pvalue:富集分析统计学显著水平,一般情况下,P-value<0.05该功能为富集项p.adjust矫正后的P-Valueqvaluepq10.显著富集KEGGpathway横坐标代表Richfactor(差异表达miRNA靶属于这个KEGGpathway的总数与所有属于这个KEGGpathway的总数的比值),Richfactor越大,表示富集的程度越大,纵坐标代表-log10(Pvalue。根据Richfactor的排序信息,显示最前面20条KEGG 11-qc││:│││──fastqc_posttrimsample_name:trim││:│││──other_rna:*_gencode_counts.txt2-mirdeep2microRNAmicroRNA :新 │──mature_miRNA_expression.xlsmicroRNA │──mature_family.xls:已知miRNA的miRNA分析结 │──novel_family.xls:新miRNA的miRNA分析结 :样本 :包含 │──result*.bedmiRNAsbed │──pdf*:样本miRNA二级结构以及map示意 文件 │──predict.xls:已知miRNA靶预测结 │──validated.xls:已知miRNA被验证的靶结 ponent分类 │──KEGG_enrient_significant.xls:KEGGpathway功能分析结果文 │──GO_tree_BP.pdfGObiological_process │──GO_tree_CC.pdf:显著富集GO树状图 │──GO_tree_MF.pdf:显著富集GOMolecular_Function │──GO_tree_BP.png:显著富集GObiological_process │──GO_tree_CC.png:显著富集GO树状图 │──GO_tree_MF.png:显著富集GOMolecular_Function │──KEGG_enrich.pdf:显著富集KEGGpathway │──KEGG_enrich.png:显著富集KEGGpathway2Command

及microRNA的定量 BAMbasecall1FastQC:无意义的序列的软件。Cutadapt通过一种容错的方式找到接头或引物序列,也可以以各种M.Martin,“adapremovesadaptersequencesfromhighthroughputsequencingad”EMBnet.J.,vol.17,no.1,pp.10-12,2011.Cutadapt:miRDeep2是一个通过分析数据识microRNA的工具,它可以以高准确已知的和新的microRNA。既可以定量样本的microRNA表达谱数据,也可以对Illumina的Friedländer,M.R.,Chen,W.,Adamidi,C.,Maaskola,J.,Einspanier,R.,Knespel,S.,N.'DiscoveringmicroRNAsfromdeepsequencingdatausingmiRDeep',NatureBiotechnology,26,407-415(2008)miRDeep2:352.5组上去。它最长能1024个碱基的片段。详细信息请参考以下文献:LangmeadB,TrapnellC,PopM,SalzbergSL.Ultrafasta

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论