实习3-芯片数据的基本处理和分析.ppt_第1页
实习3-芯片数据的基本处理和分析.ppt_第2页
实习3-芯片数据的基本处理和分析.ppt_第3页
实习3-芯片数据的基本处理和分析.ppt_第4页
实习3-芯片数据的基本处理和分析.ppt_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实习三:芯片数据的基本处理和分析,王 斌 陈 欢 阮 陟 王 丹,浙江加州国际纳米技术研究院(ZCNI),课程内容,基因组学,转录物组学,蛋白质组学,系统生物学,芯片数据分析的一般流程:,芯片杂交实验 ,芯片数据采集(读取扫描图) 数据基本处理 数据提交公共数据库 数据生物信息学分析,3,浙江加州国际纳米技术研究院分子诊断平台 zcni_,实习内容:,TIGR TM4 软件的介绍和使用 GenMAPP软件的介绍和使用 GEO数据库的介绍,4,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Cy3,Cy5,Cy5-cDNA,Cy3-cDNA,RT,RT,cDNA array,样本 mRNA,

2、对照 mRNA,TIF 扫描图,常见的双通道(dual channel)实验流程:,对照基因(reference gene):绿色荧光标记(G) 样本基因(sample gene):红色荧光标记(R),5,浙江加州国际纳米技术研究院分子诊断平台 zcni_,6,浙江加州国际纳米技术研究院分子诊断平台 zcni_,区块(block),非饱和区域,饱和区域,信号杂交的一些概念,背景,探针区域,7,浙江加州国际纳米技术研究院分子诊断平台 zcni_,A package of Open Source software programs for Microarray analysis,芯片数据采集(读取

3、扫描图),数据基本处理,存储整理芯片数据(数据库),芯片数据分析结果的图形显示,( / ),TIGR TM4:,8,浙江加州国际纳米技术研究院分子诊断平台 zcni_,GenePix格式(.gpr),9,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Agilent 格式 (.txt):,10,浙江加州国际纳米技术研究院分子诊断平台 zcni_,MEV文件:MEV格式的芯片数据,11,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Express Converter: 芯片数据的格式转换,下载地址:/programs/

4、ExprConvt2_0.zip; 下载后,解压安装即可。 “开始” “所有程序”处打开。 需要先安装Java,Java下载地址:;,12,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Express Converter主界面:,13,浙江加州国际纳米技术研究院分子诊断平台 zcni_,ExpressConverter使用方法:,选择“Input FormatGenPix”,指定输入的文件格式; 选择“FileSelect input files”,选定一个或多个需要转换的文件; 选择“FileStart converting”,格式开始转换。,待状态栏显示“Converting is

5、successful”后, 格式转换完成。此时在原genepix存放的文件夹中会出现文件名相同但扩展名不同的.mev和.ann的文件。,14,浙江加州国际纳米技术研究院分子诊断平台 zcni_,input,output,15,浙江加州国际纳米技术研究院分子诊断平台 zcni_,程序运行前,程序运行结果,16,浙江加州国际纳米技术研究院分子诊断平台 zcni_,MEV文件:MEV格式的芯片数据,17,浙江加州国际纳米技术研究院分子诊断平台 zcni_,MEV注释文件(后缀名为.ann),18,浙江加州国际纳米技术研究院分子诊断平台 zcni_,课堂练习,使用ExpressConverter将te

6、stdata.gpr转换成testdata.mev和testdata.ann。 用记事本查看testdata.gpr,testdata.mev和testdata.ann。,ExpressConverter快捷方式: “开始”“所有程序” testdata.gpr:C:Program FilesExpressConvertersamples,19,浙江加州国际纳米技术研究院分子诊断平台 zcni_,MIDAS: 数据基本处理,下载地址是:/midas.html。 此程序不用安装下载后解压就可以使用。(需要先安装Java) 进入文件夹,双击打开Midas.bat文

7、件,会出现后台运行窗口和图形界面窗口。,20,浙江加州国际纳米技术研究院分子诊断平台 zcni_,低质量数据过滤,根据Flag过滤 根据信号和背景值过滤,21,浙江加州国际纳米技术研究院分子诊断平台 zcni_,MEV文件:MEV格式的芯片数据,22,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Flags in Mev file:,A 0 non-saturated pixels in the spot B 0-50 non-saturated pixels in the spot C 50 or more non-saturated pixels in the spot X spot

8、 is rejected, due to spot shape and intensity relative to background Y background is higher than spot intensity Z spot not detected by Spotfinder,good,23,浙江加州国际纳米技术研究院分子诊断平台 zcni_,由于样本差异、荧光标记效率和检出率的不平衡等因素,需对cy3和cy5的原始提取信号进行均衡和修正才能进一步分析实验数据,Normalization正是基于此种目的。,芯片内的数据标准化 (Normalization),24,浙江加州国际纳米

9、技术研究院分子诊断平台 zcni_,MIDAS 可选的数据处理方法,标准化处理方法,Total Intensity normalization,低质量数据过滤方法,Invalid-intensity checking,LOWESS (Locfit) normalization,Iterative linear regression normalization,Iterative log mean centering normalization,Ratio Statistics normalization,Low intensity filter,Standard deviation regul

10、arization,Slice analysis (non-statistical),In-slide replicates analysis,Flip-dye consistency checking,Ratio Statistics confidence interval checking,Signal/Noise checking,Cross-file-trim,Spot QC flag checking,MA-ANOVA,Cross-slide replicates t-test (statistical),Cross-slide one-class SAM (statistical)

11、,差异表达基因识别方法,25,浙江加州国际纳米技术研究院分子诊断平台 zcni_,芯片内的数据标准化(Normalization),A,A,MA plot,In many microarray gene expression experiments, the general assumption is that most of the genes would not see any change in their expression. Therefore the majority of the points on the y axis (M) would be located at 0, s

12、ince log(1) is 0.,26,浙江加州国际纳米技术研究院分子诊断平台 zcni_,M=log2(R/G),A=log2R*G,区块间均一化处理,27,浙江加州国际纳米技术研究院分子诊断平台 zcni_,用MIDAS处理单张双色芯片的基本流程,芯片数据的读入; 低质量数据的过滤; 标准化(包括区块间的均一化); 结果文件的输出。,28,浙江加州国际纳米技术研究院分子诊断平台 zcni_,MIDAS程序界面,29,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Step 1:芯片数据的读入,30,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Step 2:低质量数据的过滤,3

13、1,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Step 3:标准化(包括区块间的均一化),32,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Step 4:结果文件的输出,33,浙江加州国际纳米技术研究院分子诊断平台 zcni_,34,浙江加州国际纳米技术研究院分子诊断平台 zcni_,MIDAS统计作图(MIDAS Investigation窗口查看),log-ratios histogram(.his),Box plot (.box),Intensity plot (.ity),R-I (.prc),Intensity plot (.lty),35,浙江加州国际纳米技术研究

14、院分子诊断平台 zcni_,课堂练习,使用MIDAS处理testdata.mev,并查看结果文件; MIDAS程序位置:C:zcnishiyan3MIDAS2_19,双击Midas.bat打开程序; 输入文件testdata.mev由ExpressConverter产生,在C:Program FilesExpressConverterSamples。,36,浙江加州国际纳米技术研究院分子诊断平台 zcni_,芯片数据聚类分析和差异表达基因筛选,基因表达研究中通常假设表达水平相似的基因可能参与相同或相似的生物学过程,因而它们具有相似的基因表达谱。 例: 在临床或诊断学等领域中,为研究某些疾病的发

15、生机制,通常对正常组织和肿瘤组织细胞间的基因表达情况作比较分析,从中筛选出具有显著差异的表达基因。,37,浙江加州国际纳米技术研究院分子诊断平台 zcni_,下载地址:/mev.html 。 此程序不用安装下载后解压就可以使用(需要先安装Java) 进入软件所在的文件夹(免安装),双击打开TMEV.bat文件,会出现后台运行窗口和图形界面窗口。,38,浙江加州国际纳米技术研究院分子诊断平台 zcni_,MeV 4.3支持的文件格式,MIDAS MEV, TAV 格式 表格格式 GEO格式 Affymetrix格式 GPR格式 Agilent格式,39,浙江加州

16、国际纳米技术研究院分子诊断平台 zcni_,MeV 4.3程序主界面,常用工具栏,导航栏,结果界面,40,浙江加州国际纳米技术研究院分子诊断平台 zcni_,芯片数据聚类分析和差异表达基因筛选,1 表格格式数据的读入与转化 2 系统聚类法对基因和样本聚类 3 使用SAM(significance analysis for microarrays)查找差异表达基因,41,浙江加州国际纳米技术研究院分子诊断平台 zcni_,1 表格格式数据的读入与转化,1 选择“FileLoad Data”弹出导入数据对话框,42,浙江加州国际纳米技术研究院分子诊断平台 zcni_,43,浙江加州国际纳米技术研究

17、院分子诊断平台 zcni_,44,浙江加州国际纳米技术研究院分子诊断平台 zcni_,数据起始位置,45,浙江加州国际纳米技术研究院分子诊断平台 zcni_,不同颜色表示相对表达量,样本名,基因名,Heatmap View,46,浙江加州国际纳米技术研究院分子诊断平台 zcni_,2 系统聚类法对基因和样本聚类,47,浙江加州国际纳米技术研究院分子诊断平台 zcni_,聚类分析结果图:,48,浙江加州国际纳米技术研究院分子诊断平台 zcni_,存储和注释感兴趣的分类:,单击鼠标左键选中目标分类使其高亮化; 右键选择菜单中的Store Cluster,并设置注释的名称和颜色等信息。,49,浙江加

18、州国际纳米技术研究院分子诊断平台 zcni_,50,浙江加州国际纳米技术研究院分子诊断平台 zcni_,3 使用SAM查找差异表达基因,51,浙江加州国际纳米技术研究院分子诊断平台 zcni_,不同实验类型,样本分组,52,浙江加州国际纳米技术研究院分子诊断平台 zcni_,53,浙江加州国际纳米技术研究院分子诊断平台 zcni_,SAM结果:Expression Images,54,浙江加州国际纳米技术研究院分子诊断平台 zcni_,SAM结果:Centroid Graphs,55,浙江加州国际纳米技术研究院分子诊断平台 zcni_,SAM结果:Expression Graphs,56,浙江

19、加州国际纳米技术研究院分子诊断平台 zcni_,SAM结果:Table Views,57,浙江加州国际纳米技术研究院分子诊断平台 zcni_,课堂练习,使用MeV处理TDMS_format_sample.txt ,并查看结果文件; MEV程序位置:C:zcnishiyan3MeV_4_3,双击TMEV.bat打开程序; 输入文件TDMS_format_sample.txt位于:C:zcnishiyan3MeV_4_3data。,58,浙江加州国际纳米技术研究院分子诊断平台 zcni_,GenMAPP一款将芯片数据和代谢途径结合起来的图形化显示工具,59,浙江加州国际纳米技术研究院分子诊断平台

20、zcni_,Why Pathway Analysis?,Intuitive to Biologists Provide a biological context for results More efficient than searching databases gene-by-gene Intuitive data display for sharing data Computation on Pathway Content Analyze over-representation of changed genes on pathways and ontologies Generate an

21、d compare pathway signatures between models,60,浙江加州国际纳米技术研究院分子诊断平台 zcni_,下载地址: /download.asp; 双击安装文件安装GenMAPP; 打开GenMAPP程序,从菜单“DataDownload Data from GenMAPP.org”下载自己感兴趣物种的MAPP文件和Gene Database。,GenMAPP安装和更新,61,浙江加州国际纳米技术研究院分子诊断平台 zcni_,GenMAPP基本概念,MAPP:描述了模式生物的代谢途径图。 目前MAPP数据库中包

22、含了人(H.sapiens)、小鼠 (M.musculus)、大鼠 (R.norvegicus)、酵母 (S.cerevisiae)、 线虫 (C.elegans)、狗 (C.familiaris)、鸡 (G.gallus)、牛 (B.taurus)、果蝇 (D.melanogaster)和斑马鱼 (D.rerio)等模式生物。,62,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Supported Species,Fruit fly Human Mouse Rat Worm Yeast Zebrafish Chicken Dog Cow Mosquito By request: Any

23、 Ensembl species Databases by other groups: Fission yeast E. coli Soon: Arabidopsis,63,浙江加州国际纳米技术研究院分子诊断平台 zcni_,心肌炎患者数据-脂肪酸降解途径,64,浙江加州国际纳米技术研究院分子诊断平台 zcni_,GenMAPP基本概念,Gene database:包含了上述物种所含基因的注释及其基因标识号(ID)。 对于每个基因,Gene Database会建立它在各个gene ID system中的对应关系。比如,Trp53基因在MGI(小鼠基因组数据库)中的标识号为MGI:98834,而

24、在UniGene数据库中标识号为Mm.222,在Ensembl数据库中标识号为ENSMUSG00000059552。,65,浙江加州国际纳米技术研究院分子诊断平台 zcni_,66,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Step 1:打开“GenMAPP 2”程序。选择菜单“DataChoose Gene Database”按照实验物种选择合适的基因库。,67,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Step 2:从菜单“FileOpen”打开相应的MAPP文件。,68,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Step 3:从菜单“Data Choose

25、Expression Dataset”打开表达量文件(.gex)并选择相应的颜色集。,69,浙江加州国际纳米技术研究院分子诊断平台 zcni_,Step 4: 点击感兴趣的基因查看注释,70,浙江加州国际纳米技术研究院分子诊断平台 zcni_,如何制作.gex表达量文件?,将芯片数据用Excel按一定格式整理,71,浙江加州国际纳米技术研究院分子诊断平台 zcni_,2. 将Excel另存为文本文件(txt后缀名或csv后缀名),可在Data菜单“Expression DatasetsNew dataset”导入该文本文件。此时,程序会向用户提问文件中的数据是数值型还是文本型,对文本文件要在图

26、示框中选勾,点击“OK”即可,一般Control Average、Treated Average、Fold Change和p-value为数值型,其他为文本型。,72,浙江加州国际纳米技术研究院分子诊断平台 zcni_,如何制作颜色集(color set)?,在菜单“DataExpression Dataset Manager ”界面下从菜单“Color setsnew”新定义一个颜色集。,73,浙江加州国际纳米技术研究院分子诊断平台 zcni_,课堂练习,在“开始”“所有程序”处打开GenMAPP 2程序; Gene Database文件位置: C:GenMAPP 2 DataGene Da

27、tabases; MAPP文件位置:C:GenMAPP 2 DataMAPPs; 芯片表达量文件位置: C:GenMAPP 2 DataExpression Datasets;,74,浙江加州国际纳米技术研究院分子诊断平台 zcni_,芯片数据库介绍,75,浙江加州国际纳米技术研究院分子诊断平台 zcni_,常用的芯片数据库,NCBI GEO: /geo/ EBI ArrayExpress: http:/www.ebi.ac.uk/microarray-as/aer/?#ae-main0 Stanford Microarray Database: / UCSC M

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论