表达谱数据分析_第1页
表达谱数据分析_第2页
表达谱数据分析_第3页
表达谱数据分析_第4页
表达谱数据分析_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、分析类型实验,对照两分类分析时间序列数据分析实验,对照两分类分析筛选两分类的差异聚类图PCA图差异差异的GO,pathway的分析的gene net差异表达GeneRelNet (品种B)GeneRelNet (品种A)GO-ysisPathway-ysis品种B品种A差异的GO分析GO_ID表示Gene Ontology数据库中对应的GO索引序列号;GO_Name表示Gene Ontology数据库中对应的 GO条目名称;Total_Count表示某一GO中含有的总数目Diff_Count表示差异在某一GO中的数目P value代表功能的显著性水平,以p0.05为显著性水平, P值越低,GO

2、越显著。FDR(False Discovery Rate):FDR代表误判率, FDR越小,说明对GO的显著性判断误差越小。差异的PATHWAY分析Path_ID表示KEGG数据库中该 pathway的索引序列号;Path_Name表示KEGG数据库中该pathway的条目名称; Diff_Count表示KEGG数据库中该pathway包含的差异数量;Total_Count表示KEGG数据库中该pathway包含的所有数量;P value代表该Pathway(按照KEGG分类标准)显著性水平,P值越低,代表Pathway越显著, p值小于 0.05为显著性Pathway。FDR代表误判率,FD

3、R越小,说明对Pathway的显著性判断误差越小。PATH-NET基于图论的方法,以pathway为研究单元,将显著性pathway基于KEGG数据库中的相互作用关系而构建pathway间相互作用网络 Path-Net。从网络中可以全局性系统地分析样本差异的关系。参与的所有显著性pathway间图中圆圈代表pathway,直线代表pathway间的相互关系,红色代表上调pathway;蓝色代表下调pathway;黄色代表同时具有上调和下调性质的pathway。Gene_Net基于KEGG数据库,利用KEGG数据库中的基因与间的作用关系,通过数据库搜索得到实验组与对照组比较后得到的每一个差异建与

4、其他的作用关系,而后构间的相互作用网络。nness Centrality表示每个的中介能力,也可以理解为:所传递的对其他Bet信号要到达网络中的所有其他,对该的依赖性的大小,或是或与网络中的其它进行相互作用的控制能力。间相互作用网络。图中圆圈代表,间的用线段表示相互的作用,其中箭头代表激活(a),平头代表抑制,直线代表结合,虚线代表间接作用;a代表激活,inh代表抑制,p代表磷酸化,dp代表去磷酸化,ex代表表间接作用。的表达,b代表结合,ind代取GO差异ysis分析得到的具有显著性功能的,根据在实验与对照两组间各自的表达情况,计算间的表达相关控关系,基间的表达相的共表达网络。性系数,得到间

5、的相于实验组、对照组各自的关性,构建每个状态下基于实验组的表达相关性,构建得到的调控网络图中点代表色代表下调系,直线代表,红色代表上调,蓝;线代表间的调控关间的表达呈正相关,虚线代表间的表达呈负相关。基于对照组的建得到的表达相关性,构的调控网络:结论:对照组内的网络构架比实验组要致密许多,揭示实验组的间关系经受了较大的破坏,且对照组内致密网络主要由下调的差异,而实验组内的致密网络部分基本均由上调差异本相对于对照样本不仅其,揭示实验样间的关系变得松散,且的表达量也有较大变化。疾病演进的整个过程的表达谱组分析疾病演进四个时期内的差异疾病演进四个时期内的差异分析筛选表达趋势显著性表达趋势共表达分析的

6、功能显著性显著性趋势所属的Pathway分析显著性趋势所属pathway间的网络关系图构建随疾病病程变化的调控网络疾病演进四个时期内的差异选筛利用多重比较检验当中的F检验对四个疾病时期内的表达谱进行差异筛选,按照P value0.05筛选疾病演进的整个过程的表达谱组分析取上一步中分析得到的随着疾病病程升级导致的差异表达,对这些进行表达趋势的显著性分析,筛选得到显著性的表达趋势按照p0.05/80为标准判断(其中80为所有表达趋势的数量),共有显著性差异趋势11种表达gene assigned代表该趋势中实际的差异数量;gene expected代表按照随机分布情况下该趋势的理论数量;p-Val

7、ue代表实际的数量与随机分布的理论数量相比的显著性水平,p值越小,表达趋势受疾病病程变化的影响越显著;significant代表显著性的表达趋势,若通过多重比较检验校正后的p- value小于0.05/80,则标为significant。随着疾病病程的升级,随着疾病病程的升级,表达出现先上调,表达保持平稳显著性表达趋势共表达显著性分析的功能根据不同病程的表型变化得到目标的表达趋势,基于Gene Ontology数据库,对上一步分析中得到的显著性的目标表达趋势所属进行功能显著性分析,得到的显著性功能,显著性的功能筛选标准:pvalue0.05。显著性趋势所属的Pathway分析基于KEGG数据库

8、,取20种显著性目标趋势所属,利用Fisher精确检验和卡方检验,把目标趋势的所属参与的Pathway进行显著性分析,按照P valueaffx(e-in controls) polyA RNAe- ins, hybee- ins, as on U133plus arraycontrol-bgp-antigenomic contains antigenomic background probescontrol-bgp-genomiccontains genomic background probes这些用于背景校正的,BGP (background probe file) lists whic

9、h probes to use for background correction. Currently this file is used with the PM-GCBG pm adjustment method implemented in apt-probeset-summarizecontrol-chip functions normgene-exona chip controlernal control probesets used fridding and otherernalfrom an exonic region of anormalization control gene

10、normgene-ronfrom anronic region of anormalization control geneles are normalized using RMA.(this is for wacky housekeSng gene calculations)probe sets against exon regions of a set of housekeng genesng genes sensitivityprobe sets againstron regions of a set of housekeNorm generon/exon probes for spec

11、ificity andysiswhich did not align to therescue-FLmRNA-unmapped:probesets against mRNA sequen genome差异筛选ANOVA 方法筛选差异Limma方法筛选差异的差异分析LncRNA差异lncRNA,mRNA筛选lncRNA的共表达网络分析共表达的mRNA的GO,pathway的分析lncRNA网络分析每组三个或三个样本以上lncRNA-lncRNA,lncRNA-mRNA,mRNA-mRNALncRNA-mRNA-NetworklncRNA和mRNA的表达值图中点代表差异(红色-上调,绿色-下调),

12、点的大小代表degree的大小;线代表间的调控关系,直线代表间的表达呈正相关,虚线代表相关。间的表达呈负共表达的mRNA的GO将筛选出的连通性差异的Ontology数据库对这些基于Gene进行GO注释,得到参与的所有的GO,而后利用Fisher精确检验和卡方检验计算每个GO的显著性水平和误判率,从而筛选出差异所体现的显著性GO,显著性筛选的标准:Pvalue0.05且FDR0.05。共表达的mRNA的pathway基于KEGG数据库,对差异确检验和卡方检验,把目标利用Fisher精参与的Pathway进行显著性分析,按照P value0.05进行筛选,得到显著性的Pathway差异lncRNA

13、,mRNAlncRNA的靶筛选lncRNA的靶GO,pathway分析lncRNA的靶Cis作用及Trans作用对于Cis作用,利用组注释的lncRNA及编码因。的位置关联鉴定lncRNA的可能的靶基对于Trans作用,根据lncRNA的序列与靶基因3-UTR序列上的相关性鉴定lncRNA的可能的靶。数据库为human hg19 采用BlastRNAplexblast的参数为:evalue 1e-20identity 95%RNAplex的参数为:-e -30-c 30cis说明:Probe_name:探针的IDProbe_chr: 探针位于的 Probe_strand:探针位于的 Probe

14、_start: 探针位于的 Probe_end: 探针位于的名正负链起始位置终止位置_chr:cis靶_start:cis靶_end: cis靶_name:cis靶位于的位于的位于的的名起始位置终止位置Cis_Cis_ Cis_ Cis_ Cis_ Cis_ Cis_名:cis靶的位于的_ac_strand:cis靶正负链_relationship:cis靶与lncRNA之间的关系trans说明Probe_name:探针的ID Seqname:探针对应的序列:trans靶的Trans_Trans_ Trans_ Trans_Ac_chr:trans靶_start:trans靶_end: trans靶位于的位于的位于的名起始位置终止位置Trans_Evalue:trans靶时的evalueted Gene Name:trans靶的名AssoDescription:trans靶EntrezGene ID:trans靶的具体描述的IDlncRNA的转录因子通过搜索lncRNA的上游2000bp根据TRANSFAC 8.3运用HMM的算法转录因子的数据库是TRANSFAC 8.3数据库lncRNA的探针ID转录因子的名称以及ID号与lncRNA启动子区域结合的起始位置

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论