版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实习三芯片的根本数据处理和分析 冯 晔 楼小燕 牟晓洲 孔建明 阮 陟 实习一基因组数据注释和功能分析实习二核苷酸序列分析实习三芯片的基本数据处理和分析实习四蛋白质结构与功能分析实习五蛋白质组学数据分析实习六系统生物学软件实习课程内容基因组学转录物组学蛋白质组学系统生物学实习内容:TIGR TM4 软件的介绍和使用GenMAPP软件的介绍和使用GEO数据库的介绍芯片数据分析的一般流程:芯片杂交实验 ,芯片数据采集读取扫描图数据根本处理数据提交公共数据库数据生物信息学分析 A package of Open Source software programs for Microarray anal
2、ysis 芯片数据采集读取扫描图数据根本处理存储整理芯片数据数据库芯片数据分析结果的图形显示 :/TIGR TM4:Cy3Cy5Cy3-cDNACy3-cDNARTRTcDNAarray样本 mRNA对照 mRNATIF 扫描图常见的双通道dual channel实验流程:MEV文件:MEV格式的芯片数据UID:Unique identifier for this spot.IA:Integrated intensity for channel 1 (Cy3).IB:Integrated intensity for channel 2 (Cy5).R:Row (slide_row).C:Col
3、umn (slide column).MR:Meta-row (block row).MC:Meta-column (block column).SR:Sub-row (row in block).SC: Sub-column (column in block).FlagA:TIGR SpotFinder flag value for channel 1.FlagB:TIGR SpotFinder flag value for channel 2.BkgA:Background intensity for channel 1.BkgB:Background intensity for chan
4、nel 2.SAA:Spot area for channel 1.SAB:Spot area for channel 2.MedA:Median Intensity for channel 1 (Cy3).MedB:Median Intensity for channel 2 (Cy5).位置信号值什么是区块block?非饱和区域饱和区域信号杂交的一些概念背景探针区域Flags in Mev file:A 0 non-saturated pixels in the spotB 0-50 non-saturated pixels in the spotC 50 or more non-satu
5、rated pixels in the spotX spot is rejected, due to spot shape and intensity relative to backgroundY background is higher than spot intensityZ spot not detected by Spotfinder.goodMEV注释文件后缀名为.annGenePix格式.gprAgilent 格式 .txt:Express Converter: 芯片数据的格式转换下载地址:;下载后,解压安装即可。 “开始 “所有程序处翻开。需要先安装Java,Java下载地址:
6、 :/;ExpressConverter的界面:ExpressConverter使用方法:指定输入和输出的文件格式。 在“FileSelect input files选定一个或多个需要转换的文件。选择“FileStart converting,格式就开始转化。 界面左下方显示“Converting is successful后, 格式转换完成。此时在原genepix存放的文件夹中会出现文件名相同但后缀名不同的.mev和.ann的文件。 inputoutput课堂练习使用ExpressConverter将testdata.gpr转换成testdata.mev和testdata.ann。用记事本查
7、看testdata.gpr,testdata.mev和testdata.ann。ExpressConverter: “开始 “所有程序Testdata.gpr: C:Program FilesExpressConverterexampleMIDAS: 数据根本处理下载地址是:。此程序不用安装下载后解压就可以使用。需要先安装Java进入文件夹,双击翻开Midas.dat文件,会出现后台运行窗口和图形界面窗口。 低质量数据过滤根据flag过滤根据信号和背景值过滤标准化normalizatonMAplot。Y轴为Mlogratio;X轴为信号强度A=1/2log2RG。区块间均一化处理MIDAS程序
8、界面MIDAS 可选的数据处理方法 标准化处理方法Total Intensity normalization 低质量数据过滤方法Invalid-intensity checkingLOWESS (Locfit) normalizationIterative linear regression normalizationIterative log mean centering normalizationRatio Statistics normalizationLow intensity filterStandard deviation regularizationSlice analysis
9、(non-statistical)In-slide replicates analysisFlip-dye consistency checkingRatio Statistics confidence interval checkingSignal/Noise checkingCross-file-trimSpot QC flag checkingMA-ANOVACross-slide replicates t-test (statistical)Cross-slide one-class SAM (statistical) 差异表达基因识别方法用MIDAS处理单张双色芯片的根本流程:芯片数
10、据的读入;低质量数据的过滤;标准化包括区块间的均一化;结果文件的输出。Step 1:芯片数据的读入Step 2:低质量数据的过滤Step 3:标准化包括区块间的均一化;Step 4:结果文件的输出结果文件夹:*_MDS.mevRawLow_intensity_filterLowessSd_regMIDAS统计作图MIDAS Investigation窗口查看R-I plot (.prc)Box plot (.box)FlipDye Diagnostic plot (.rrc)Intensity plot (.ity, .lty)Z-score Distribution plot (.his)S
11、AM plot (.sam)课堂练习使用MIDAS处理testdata.mev,并查看结果文件;MIDAS程序位置:C:zcnishiyan3MIDAS2_19;双击Midas.bat翻开程序;输入文件testdata.mev由ExpressConverter产生,在C:Program FilesExpressConverterexample;多样本芯片实验实验适用范围:例如,分型,不同发育阶段的表达,不同剂量药物下的表达,等等;使用共同的对照:采用标准对照,或将所有样品混合作为共同对照;多样本实验的两种常用分析聚类差异表达基因的筛选下载地址是: 。此程序不用安装下载后解压就可以使用。需要先安
12、装Java进入文件夹,双击翻开TMEV.dat文件,会出现后台运行窗口和图形界面窗口。MEV程序运行界面工具栏导航栏结果页面MEV可以读取的文件格式:MIDAS MEV, TAV 格式;表格格式;GEO格式;Affymetrix格式;GPR格式;Agilent格式;等等;从“File-Load Data导入数据:选择格式以表格文件为例:“select-Tab Delimited, Multiple Sample Files (TDMS) (*.*)数据起始位置不同颜色表示相对表达量样本名基因名用等级聚类法(Hierarchical Clustering)对基因和样本聚类聚类结果:使用sam查找
13、差异表达基因不同实验类型样本分组Sam结果:Expression imagesSam结果:Centroid graphsSam结果:Expression graphsSam结果:Table views课堂练习使用MEV处理TDMS_format_sample.txt ,并查看结果文件;MEV程序位置:C:zcnishiyan3MEV_4_0;双击TMEV.bat翻开程序;输入文件TDMS_format_sample.txt在C:zcnishiyan3MEV_4_0data中;GenMAPP:一款将芯片数据和代谢途径结合起来的图形化显示工具下载地址: :/ ;双击安装文件安装GenMAPP;翻开
14、GenMAPP程序,从菜单“DataDownload Data from GenMAPP.org下载自己感兴趣物种的MAPP文件和Gene Database。 GenMAPP安装和更新GenMAPP根本概念的介绍MAPP:描述了模式生物的代谢途径图; 目前MAPP数据库中包含了人 (H.sapiens)、小鼠 (M.musculus)、 大鼠 (R.norvegicus)、 酵母 (S.cerevisiae)、 线虫 (C.elegans)、 狗 (C.familiaris)、 鸡 (G.gallus)、 牛 (B.taurus)、 果蝇 (D.melanogaster)和斑马鱼 (D.rer
15、io)等模式生物。 Gene database:包含了上述物种所含基因的注释及其基因标识号ID。 对于每个基因,Gene Database会建立它在各个gene ID system中的对应关系。比方,Trp53基因在MGI小鼠基因组数据库中的标识号为MGI:98834,而在UniGene数据库中标识号为Mm.222,在Ensembl数据库中标识号为ENSMUSG00000059552。ID System (Species)System CodeAffymetrix Probe Set IDXPDBPdEMBLEmPfamPfEnsemblEnRefSeqQ Entrez GeneLRGD (R
16、. norvegicus)RFlyBase (D. melanogaster)FSGD (S.cerevisiae)DGene OntologyTUniProt/TrEMBLSHUGOHUniGeneUInterProIWormBase (C. elegans)WMGI (M. musculus)MZFIN (D. rerio)ZOMIMOmOtherOStep 1:从“开始翻开“GenMAPP 2程序。然后下拉菜单“DataChoose Gene Database按照实验物种选择适宜的基因库。Step 2:从菜单“FileOpen翻开自己感兴趣的MAPP文件。 Step 3:从菜单“File
17、Data Choose Expression Dataset翻开表达数据文件.gex和颜色集Step 4: 点击感兴趣的基因查看注释如何制作.gex表达量文件?将芯片数据用EXCEL中按一定格式整理 2: 将EXCEL另存为文本文件txt后缀名或csv后缀名,可在Data菜单“Expression DatasetsNew dataset导入该文本文件。这时程序会向用户提问文件中的数据是数值型还是文本型,对文本文件要在图示框中选勾,点击OK即可,一般Control Average、Treated Average、Fold Change和p-value为数值型,其他为文本型。 如何制作颜色集col
18、or set?在菜单“Data Expression Dataset Manager 界面下从菜单“Color sets new新定义一个颜色集。 课堂练习在“开始 “所有程序处翻开GenMAPP 2程序;Gene Database文件位置:C:GenMAPP 2 DataGene Databases;MAPP文件位置:C:GenMAPP 2 DataMAPPs;芯片表达量文件位置:C:GenMAPP 2 DataExpression Datasets;芯片数据的检索和提交MIAMEMinimum Information About a Microarray Experiment :/原始探针
19、杂交数据经标准化处理后的数据样本mRNA来源及其实验步骤芯片实验设计,包括实验中各张芯片间的关系芯片每个探针的详细信息芯片杂交和数据处理的步骤常用的芯片数据库NCBI GEO: EBI ArrayExpress: :/ ebi.ac.uk/microarray-as/aer/?#ae-main0 Stanford Microarray Database: UCSC Microarray Database: GEO (Gene Expression Omnibus) 主页也可这样检索:NCBI主页Search “GEO Datasets以检索人类癌症相关的芯片实验为例,输入“human AND
20、cancer: 每条记录包含的信息:Platform:芯片信息Sample: 样本信息Series:综合信息Platform信息 SOFT格式:Platform_title:芯片名称;Platform_technology:点制芯片探针的方法,例如ORF或cDNA的PCR产物spotted DNA/cDNA、原位杂交的寡核苷酸 in situ oligonucleotide和直接点样的寡核苷酸spotted oligonucleotide等;Platform_distribution:注明是否属于商品芯片non-commercial, commercial, custom-commercial
21、;Platform_organism:芯片适用的物种;Platform_manufacturer:芯片制作单位;Platform_manufacture_protocol:芯片制作的实验过程,例如探针合成方式和点样方式等;platform_table:芯片中每一个点的探针的内容。Sample信息SOFT格式:Sample_title:样本名称;Sample_supplementary_file:样本附件的名称。附件指的是芯片杂交后扫描的TIFF格式的图像等文件。Sample_source_name_ch1:channel 1样本DNA/RNA材料的来源来源于哪个组织,细胞等等;Sample_o
22、rganism_ch1:channel 1样本DNA/RNA材料来源于哪个物种;Sample_characteristics_ch1:channel 1样本DNA/RNA材料的特点;Sample_molecule_ch1:channel 1样本分子的特性total RNA, polyA RNA, cytoplasmic RNA, nuclear RNA, genomic DNA, 等等;Sample_extract_protocol_ch1:channel 1样本提取的步骤;Sample_label_ch1:channel 1样本标记的染料Cy3 or Cy5;Sample_label_protocol_ch1:channel 1样本标记染料的步骤;Sample_source_name_ch2,Sample_organism_ch2,Sample_characteristics_ch2,Sample_growth_protocol_ch2,Sample_molecule_ch2,Sample_extract_protocol_ch2,Sample_label_ch2和Sample
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 47278-2026工业产品数据字典测控装备
- GB/T 32963-2026锌铝合金镀层钢丝缆索
- 2024-2025学年北京市101中学八年级(下)期中数学试卷及答案解析
- 文化交流活动免责协议书
- 2024年中学生学习总结(9篇)
- 2024年北京高考数学文试题及答案
- 《印刷术》 教案 四年级下册科学青岛版(五四制)
- 821抽屉原理题库教师版
- S电器应收账款管理分析
- 凝结芽孢杆菌研究进展
- 湖南《超高性能混凝土集成模块建筑技术标准》
- 辽宁省盘锦市兴隆台区盘锦市第一完全中学2024-2025学年八年级上学期11月期中数学试题
- DL∕T 1475-2015 电力安全工器具配置与存放技术要求
- 幼儿园安全教育课件:《过马路》
- 智能无人机机巢系统施工方案
- 钢制汽车零件感应淬火金相检验
- 医院药品目录(很好的)
- 装修工程监理方案投标方案技术标
- 局部解剖学:盆部、会阴局部解剖
- 阴道镜基础临床运用培训(飞利浦)
- 人教版小学语文六年级下册综合复习狱中联欢
评论
0/150
提交评论