




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基因芯片分析的实际与方法ericexist163. com:7049971基因芯片概论基因芯片分析的概念n基因芯片(Gene chip)技术是指经过微阵列(Microarray)技术将高密度DNA片段阵列经过高速机器人或原位合成方式以一定的顺序或陈列方式使其附着在如玻璃片等固相外表,以荧光标志的DNA探针,借助碱基互补杂交原理,进展大量的基因表达及监测等方面研讨的技术。基因芯片分析的优点n快速n高通量(104 - 106)n自动化n运用的试剂少n低本钱基因芯片分析的运用范围nAcademic research of genetic diseasesnCancernPrenatal geneti
2、cs产前遗传学研讨nGeneral genetic diseasesnInfectious diseasesnDrug discoverynAnimal farming/veterinary nIndustrial (fermentation)nEnvironmental开展的方向:从多角度研讨提示生命景象nStages: developmental,transformation, time fter treatment, etc.nTreatments (stimuli, drugs, nutrients, etc.) nPhysiological states (stressed, fas
3、ting, etc.)nTissue distributionn(position, 3D)基因芯片的开展是推进系统生物学开展的动力利用基因芯片研讨生命景象的测略nFactors involved = ComponentsnOrder of events = PathwaysnInteractions = Circuit KEGGGO基因芯片的分类E xp ressio n C h ip sG en o m ic C h ip sS eq u en cin g C h ip sD N A C h ip s基因芯片的分类nOligonucleotide arrayn Synthesized on
4、 a chip Affymetrixn Spot on a solid matrix CompugenncDNA array Incyte 一些开展中的基因芯片技术平台n利用生物分子的电物理特性进展基因表达监测:监测速度很快,适用于基因表大,蛋白质组及基因型的研讨n利用电场原理进展高密度芯片消费:基于适宜用于生物学的集成电路,集成电路包含可以独立寻址的微电极阵列,结合特殊的液体流动系统,可以使大部分生物分子按照来自于计算机的数字指令运动。n喷墨点样技术:以高度定位的方式把合成好的寡核苷酸分子喷点倒玻璃外表。n寡核苷酸包被的微珠芯片n平行信号测序技术:对基因表达进展定量分析基因芯片分析实验方法基
5、因芯片分析的主要步骤cDNA基因芯片分析的主要步骤cDNA芯片分析的主要步骤nSpot by Array spottercDNA芯片分析的主要步骤Hybridizing by Automatic hybridization processorcDNA芯片分析的主要步骤nLaser scannerOligonucleotide array GeneChip总总RNA的制备的制备反转录反转录体外体外转录转录生物素标志的生物素标志的cRNAcRNA片段化处置片段化处置带标志的带标志的cRNA片断片断35-200 bases0.5-2 ug/ul起始用量起始用量5-10ug5-10ugIVT操作流程以
6、真核生物为例操作流程以真核生物为例标志的标志的cRNA片断片断杂交混合液的制备杂交混合液的制备EukaryoticHyb.ControlControlOligo B2 杂交杂交16hour 数据分析数据分析 扫扫 描描 洗脱洗脱染色染色Oligonucleotide array 的特点1 个平方厘米的面积至少可陈个平方厘米的面积至少可陈列四十多万个探针合成区列四十多万个探针合成区“点点基因基因2 2基因基因1cDNA1cDNA基因基因2cDNA2cDNA用于用于cDNAcDNA芯片的探针芯片的探针Oligo probeOligo probe基因基因1 1多个检测结果可以参考多个检测结果可以参考
7、Oligonucleotide array 的优越性 序列准确性高 原位合成 PCR扩增,点样 起始Total RNA 110ug 50ug 均一的退火温度 25mer 300bp3Kb 特异性更高 多段探针 单个探针 非特异性杂交 2 30cDNA 芯片芯片Affy 芯片芯片优优 势势芯片分析数据的规范化nQuantitation ndata-quality assessmentsn背景处置:图像上各点的吸光度值包含了样品和背景信号,在提取数据前必需将背景扣除n杂交点质量:由于点样或膜变形等缘由目前较多的软件对杂交点的识别定位仍需求人为的调整n数据的规范化:其目的是防止基因芯片实验中因系统差
8、别呵斥芯片间数据比较的困难。最常用的是“看家基因法,它预先选择一组表达程度不变的看家基因,计算出这组基因平均ratio 值为1 时的规范化系数,然后将其运用于全部的数据以到达规范化的目的Scatter plots for a Cy5-liver/Cy3-liver control hubridization A Cy5-ovarian tumor/Cy3-normal ovary hubridization The value of Cy3 and Cy5 hydridization signals from each clone were plotted directly onto the
9、plot 卵巢癌Data Analysis - Reveal the Difference基因芯片数据分析和信息发掘方法一. 聚类分析聚类分析n聚类分析是方式识别中一种非常有吸引力聚类分析是方式识别中一种非常有吸引力的方法,特别适用于方式分类数不知道的的方法,特别适用于方式分类数不知道的情况。情况。n从机器学习的角度来看,有两种根本的聚从机器学习的角度来看,有两种根本的聚类分析:类分析:n有教师聚类有教师聚类n无教师聚类无教师聚类n基因表达数据聚类分析普通包括以下几个基因表达数据聚类分析普通包括以下几个步骤:步骤:n确定基因表达的数据确定基因表达的数据n计算类似性矩阵,各个矩阵元素代计算类似性
10、矩阵,各个矩阵元素代表两个基因的表达能否类似表两个基因的表达能否类似n选择算法进展聚类分析选择算法进展聚类分析n显示分析结果。显示分析结果。n对数据进展聚类分析之前,必需将包含在基因表对数据进展聚类分析之前,必需将包含在基因表达矩阵中的数据进展类似程度分析,并且对分析达矩阵中的数据进展类似程度分析,并且对分析结果进展量化。结果进展量化。 n通常情况下,类似往往被赋于一个较大的量化的通常情况下,类似往往被赋于一个较大的量化的值,而不类似那么由一个较小的量化的值来表示。值,而不类似那么由一个较小的量化的值来表示。n在实践计算中,往往以间隔替代类似的概念,类在实践计算中,往往以间隔替代类似的概念,类
11、似性度量被转化为两个基因表达方式之间的间隔。似性度量被转化为两个基因表达方式之间的间隔。间隔越小,表达方式越相近,反之,那么表达方间隔越小,表达方式越相近,反之,那么表达方式差别大。式差别大。两个表达方式之间的关系(a) 类似(b) 变化趋势一致(c) 两个基因的调控结果不一样或甚至相反聚类分析的目的n可诱导基因是共表达的 n许多构成性表达的基因不受调理n根据表达类似形陈列基因n功能类似的基因被聚为不同的类n可以提示细胞的生理形状n可以协助研讨未知基因的功能聚类结果显示聚类结果显示: Cluster, Cluster viewer二二. 基因调控网络分析基因调控网络分析2.1 基 本 理 论定
12、义n一个基因网络一个基因网络(pathway)由一组生物分子如基由一组生物分子如基因、蛋白质以及它们之间的相互作用构成,这因、蛋白质以及它们之间的相互作用构成,这些生物分子共同完成一些特定的细胞功能义务些生物分子共同完成一些特定的细胞功能义务n在实践分析过程中,往往以图这种数据构造表示在实践分析过程中,往往以图这种数据构造表示基因网络,图中的节点代表基因或者蛋白质,而基因网络,图中的节点代表基因或者蛋白质,而节点之间的连线代表基因、蛋白质之间的相互作节点之间的连线代表基因、蛋白质之间的相互作用。基因网络描画了特定细胞或组织中的功能途用。基因网络描画了特定细胞或组织中的功能途径,如代谢、基因调控
13、,信号传导等。径,如代谢、基因调控,信号传导等。原理n基因表达实践上是细胞、组织、器官受遗传和环基因表达实践上是细胞、组织、器官受遗传和环境影响的结果。境影响的结果。n一个基因的转录和表达由细胞的生化形状所决议,一个基因的转录和表达由细胞的生化形状所决议,在一个基因的转录过程中,一组转录因子作用于在一个基因的转录过程中,一组转录因子作用于该基因的启动子区域,控制该基因转录,而这些该基因的启动子区域,控制该基因转录,而这些转录因子本身又是其它基因的产物。转录因子本身又是其它基因的产物。n当一个基因经过转录、翻译形胜利能基因产物后,当一个基因经过转录、翻译形胜利能基因产物后,它将改动细胞的生化形状
14、,从而直接或间接地影它将改动细胞的生化形状,从而直接或间接地影响其它基因的表达,甚至影响本身的表达。多个响其它基因的表达,甚至影响本身的表达。多个基因的表达不断变化,使得细胞的生化形状不断基因的表达不断变化,使得细胞的生化形状不断地变化。地变化。n一个基因的表达受其它基因的影响,而这一个基因的表达受其它基因的影响,而这个基因又会影响其它基因的表达,这种相个基因又会影响其它基因的表达,这种相互影响、相互制约关系构成了复杂的基因互影响、相互制约关系构成了复杂的基因表达调控网络。表达调控网络。 n基因表达数据之中隐含基因之间的相互作基因表达数据之中隐含基因之间的相互作用关系,因此可以经过分析基因表达
15、数据,用关系,因此可以经过分析基因表达数据,构建基因调控网络构建基因调控网络运用nBetter understand the physiology of the organismnPredict the effect of a drug Predict the weaknesses or side effects of a drugnPredict good or bad drug combinationsnUnderstand disease processesnGene function assignmentnMake a “perfect simulation of cellularnf
16、unction to use as an experimental modelnMany tools “feed into this understanding including microarrays2.2 pathway 数据库引见Pathway 数据库nGOnKEGGnGENMAPPnBIACARTAnGeneNetn细胞因子网络数据库n自在基信号数据库关于GOnGO(gene ontology)是基因本体论结合会(Gene Ontology Consortium)所建立的数据库,旨在建立一个适用于各种物种的,对基因和蛋白功能进展限定和描画的,并随着研讨的不断深化而更新的言语词汇规范。
17、GO是多种生物学本体论言语中的一种,提供了三层构造的系统定义方式,用于描画基因产物的功能。nGO可以被用来在小鼠基因组中查询和信号转导相关的基因产物nGO开展了具有三级构造的规范言语ontologies。根据基因产物的相关分子功能,生物学途径,细胞学组件而给予定义,无物种相关性。关于KEGGnKEGG (Kyoto Encyclopedia of Genes and Genomes) 京都大学基因和基因组百科全书数据库京都大学基因和基因组百科全书数据库nKEGG 是系统分析基因功能的数据库,将基因组的信息是系统分析基因功能的数据库,将基因组的信息与基因功能联络起来,旨在提示生命景象的遗传与化学
18、蓝与基因功能联络起来,旨在提示生命景象的遗传与化学蓝图图数据库KEGG PATHWAY DatabaseKEGG GENES DatabaseKEGG LIGAND Database用途搜索pathway, 产生能够的反响途径搜索类似的基因序列搜索类似的基因组序列搜索类似的复合物构造,类似的多糖构造及类似的反响类别通路信息基因组信息化学信息KEGG中的通路分为五大类:1 新陈代谢通路2 遗传信息处置通路3 环境信息处置通路4 细胞内通路5 人类病症相关通路PATHWAY提供所选定通路的参考资料、涉及的反响和在其他生物中的通路情况。由GIF等平板文件类型图示,方框显示为涉及的酶EC称号,圆滑框为
19、反响类型,以实线和箭头衔接反响物和方向,虚线指向预测的反响类型。关于GenMappnGemapp (GenMAPP.org) nGenMAPP 是一个以学术研讨为根底的科学团体,提供100个以上的通路图. Silicon Genetics公司曾经和 GenMAPP组织达成了协议 ,把这些通路整合到了 GeneSpring的通路库. 利用 GeneSpring分析的基因芯片数据可以用 GenMAPP的通路可视化,使研讨者研讨某些基因在通路中的作用.关于BioCartanBioCarta:“Carta中文意思是地图,BioCarta 即用图形来描画生物相关知识,构成生物学家所熟习的生化调控通路(b
20、iochemical pathways)。nBioCarta 公司为客户免费提供通路绘制软件,让他们根据本人的研讨领域发表通路,建成数据库,通路中的蛋白都是按照HUGO的规范建立的.nBioCarta已搜集各物种共大約120,000基因及個调控通路,数据库载不断添加,其信号传导通路(signal transduction pathways)是当前最全的.GeneNetn真核生物生理过程的调控网络(GeneNet)nGeneNet展现了协调方式下基因的整体功能,良好的调控功能和对外界刺激的反响。该基因网具有以下根本功能:n(a) 描画执行特定生物功能时所涉及到的整体基因交互作用n(b) 描画基因
21、的蛋白质编码n(c) 描画基因对外界刺激的传感途径n(d) 经过一组反响自动地稳定网络参数或者使网络转换到新的功能形状n(e) 利用外部信号、激素和代谢产物作为生理学参数激发基因网纠正其作用n该基因网描画了四类实体:n (a) 细胞(组织,器官)n (b) 蛋白质n (c) 基因n (d) 物质n该基因网还描画了实体间两种关系:n(a) 反响reaction, 即经过交互作用产生新的实体或过程n(b) 调控regulatory事件, 特定反响对实体的作用。 2.3 功能富集分析功能富集分析定义n功能富集分析(Functional Enrichment Analysis)又称功能聚类分析,借助于
22、各种生物学信息数据库如GO , KEGG, GENMAPP, BIACARTA, TRANSFAC, OMIM和分析工具如MAPPFinder, ArrayXPath进展统计分析,发掘同差别表达或共表达这组感兴趣基因具有显 著差别的功能类别。n功能富集分析的统计原理是用超几何分布型来检验一组基 因共表达或差别表达中某个功能类的显著性,并结合 多重假设检验判别思想选择同这组基因显著相关功能类别MAPPFindernMAPPFinder is a tool that creates a global gene-expression profile across all areas of biolo
23、gy by integrating the annotations of the Gene Ontology (GO) Project with the free software package nGenMAPP GenMAPP.org. 可以整合GO定义,产生整体的基因表达谱. 输出可以搜索的阅读器,协助用户快速识别代表性的差别表达基因在GO的定义。任务方式Z值得计算GOminernGominer:最初Version在算法上虽亚于GenMAPP, 在再建立可视关系上(tree-like structure 和directed acyclic graph)有其独特之处.n今年对Origina
24、l Version进展较大改良,不仅可以富集significant GO categories, 还可以同时对多套芯片实验数据批量分析,控制假发现率FDR, 还整合转录因子结合位点信息.综合而言, 尤其适宜TIME-COURSE功能富集分析n需求建立当地Mysql数据库,建立JDB数据源 Pathway ExplorernPathwayExplorer:provides comprehensive and easily accessible representations of expression profiles onto major regulatory, metabolic and c
25、ellular pathways. The integrated pathway resources include KEGG, BioCarta and GenMAPP.nLocusLink was again used as root identifier. The LocusLinks are linked with the user-defined gene identifier groups (UniGene, GeneOntology, GenBank and/or RefSeq), which are used then to align the mapped gene IDs.
26、nhttpspathwayexplorer.genome.tugraz.atArrayXPathna web-based service for mapping and visualizing microarray gene-expression data for integrated biological pathway resources nWhen one inputs gene-expression clusters, ArrayXPath produces a list of the best matching pathways for each cluster napplied Fishers exact
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 礼仪用品行业品牌法律风险防控考核试卷
- 种子批发商品牌形象塑造与传播考核试卷
- 广播影视设备网络营销咨询批发考核试卷
- 渔业机械制造企业的服务化转型考核试卷
- 【部编版】四年级语文下册第五单元《交流平台 初试身手》精美课件
- 会展现场应急管理与救援考核试卷
- 罐头食品生产流程优化考核试卷
- 食道癌护理小讲课
- 奖牌创意美术课件
- 新中国成立后幼儿教育的发展历程
- 数独题目高级50题(后附答案)
- 内蒙古鄂尔多斯市2020年中考英语试题(解析版)
- Vue.js前端开发实战(第2版) 课件 第2章 Vue.js开发基础
- 异面直线 高一下学期数学湘教版(2019)必修第二册
- 笔墨时空-解读中国书法文化基因智慧树知到期末考试答案2024年
- GLB-2防孤岛保护装置试验报告
- 的沟通技巧评估表
- 职场人健康状况调查报告
- 卵巢囊肿诊治中国专家共识解读
- 两癌筛查的知识讲座
- 仪器共享平台方案
评论
0/150
提交评论