版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、GEO (Gene Expression Omnibus)数据库简介,报告者:simgn 2014 . 3 . 8,近年来分子生物学技术的发展使微阵列芯片技术成为生物学研究中最重要的实验之一。尤其是基因芯片的广泛应用产生了大量的数据,为基因研究提供了大量的高吞吐量数据。基因芯片开发过程、(DNARNA印迹混合法)、(dot blocking法)、基因芯片概述、基因芯片(DNA芯片)通过微阵列技术,根据核酸杂交原理将大量探针分子固定在支持物中,然后与标记样品杂交,检测混合信号的强度和分布,进行分析。基因芯片技术流程,基因芯片技术流程,基因芯片检查结果,GEO数据库是什么,随着微阵列芯片技术,尤其
2、是基因芯片的广泛使用,生成大量数据,为基因研究提供了大量高吞吐量数据。迫切需要统一管理开放数据库。Geo(通用公共卫生组织)属于美国国家卫生研究院NCBI。GEO是当今最大、最全面的公共基因表达数据资源。网站:/geo/,geo数据库配置,1 .用户提交的原始数据,2 .GEO数据库整理的数据、平台、平台是关于物理试剂的信息,用于以特定实验中检测到或定量分析的一系列元素的单个提交者、与许多样品相关的、高吞吐量的方式检查样品。核苷酸探针组,cDNA,SAGE标签,抗体等。平台、平台数据由阵列或序列以及阵列平台的简要说明组成,每个平台都分配有唯一的搜索编号G
3、PL*。例如,平台GPL 341:http:/www . NCBI . NLM . NIH . gov/geo/query/ACC . CGI?Acc=GPL341,Sample,表示基于单个平台描述杂交实验或实验条件所有特性的广泛测量信息,即检验的mRNA样本、实验条件和实验生成的基因表达测量数据信息。每个样本只有一个,之前需要确认的一个亲代平台,同一提交者,一个平台与多个系列相关。示例、示例数据描述了每个示例的操作环境、处理方法和各个组件的存在量测量。每个抽样都分配了唯一的搜索编号GSM*。例如,示例GSM 81022http:/www . NCBI . NLM . NIH . gov/g
4、eo/query/ACC . CGI?Acc=GSM81022,Series,Series系列可以将构成实验的相关样本集中到生物学数据集上,然后收集发送者表示的一些重要基因或分析结果架构,即样本如何相关,如何排序,如何分析,如何获得群集数据等。一系列的样品通过一个共同的属性连接,与同一提交者、很多样品相关。“系列”(Series)、“系列数据”(Series data)链接一系列相关样本,以提供整个研究的兴趣点和说明,并包含描述提取数据、简单结论和分析的表。每个系列都分配有唯一的搜索编号GSE*。例如,GSE 3541 http:/系列www . NCBI . NLM . NIH . gov/
5、geo/query/ACC . CGI?Acc=GSE3541、数据集组(DataSets)、GEO存储高吞吐量实验数据,这些数据经过广泛分类、多种处理,并以多种方式进行分析。为了说明这一点,GEO添加了辅助分析工具,该工具将提交的示例概括为具有生物学意义和统计意义的可比较GEO数据集(GEO DataSets),作为下游数据挖掘和数据显示工具的基础,提供了实验相关概述。数据集组存储所有元数据,并提供了GEO数据“实验中心”的主要透视。数据集组作为GDS*搜索。GDS2225,存储DataSets基因表达配置文件信息的配置文件。每个表达配置文件都用反映数据集内所有样本的基因表达的统计数据表示。
6、地理表达谱(Profiles)存储单个基因表达的数据资料,地理数据提供了“以基因为中心”的主要观点。GEO DataSets中的每个数据集组对象确定一个实验的数据集组和表示光谱的关系,GEO Profiles中的每个数据集组对应多个表示配置文件对象。平台上的每个基因(例如基因a)都有多个样本。多个相关样本构成数据集,可以生成单个或多个基因的表达配置文件比较表。在GEO数据的数据搜索方法、GEO数据库主页右侧的搜索栏、要查找信息的关键字或搜索单词(例如“mir29a”或“GDS2225 AND FTO”)中直接输入,将搜索相应的DataSets和Profiles。直接在主页的右侧打开库浏览器,然
7、后从各种产品系列、平台、示例、物种和历史记录中选择所需的数据类型。直接从GEO数据库的FTP服务器下载。Ftp :/ftp。NCBI./geo/,geo数据的数据检索方法将从NCBI主页直接检索到Entrez。GEO数据主要存储在GEO DataSets和GEO Profiles数据库中。Entrez是NCBI部署的生物医学数据库联合搜索系统。Entrez集成系统的最大特点是,可以通过任何数据库将检索到的信息直接连接到其他数据库,以查找相关的搜索结果。检索GEO数据的数据关键字、GEO可以像其他NCBI数据库一样,使用标准关键字和基于文本的布尔搜索、基于序列的搜索、基于特
8、定表示的行为挖掘搜索或这些参数的组合来执行搜索查询。例如,在GEO DataSets中,可以使用搜索单词“prostate cancer and humanorganism”查找人类前列腺癌微阵列实验数据集。搜索GEO数据的数据关键字,例如,在GEO Profiles数据库中,可以使用搜索词ftoGene Symbol AND (Smok*)搜索所有与吸烟相关且包含肥胖基因的相关实验的基因表达配置文件。以GEO数据处理、数据集组GDS402为例,介绍GEO数据库提供的一些数据挖掘分析工具。Find genes: Find gene name or symbol:直接在数据集组中找到该基因的基因
9、表达谱。find genes that are up/down for this condition(s):根据选定的实验过滤器,您可以找到一系列具有更明显表达差异的基因表达配置文件。数据分析工具1,基因表达配置文件,2型糖尿病和肾功能测试中Fto(肥胖基因)的表达配置文件示例:从原始样本记录中提取的基因表达值用红色条形柱表示。蓝色条形柱表示内部样本的百分位数信息,提供了该基因与阵列中所有其他基因进行比较的相对表达水平值。数据分析工具2,2。Compare 2 sets of samples:比较方法和重要程度选择a和b两个抽样组选择a、b抽样组比较确定两个基因可以比较的表达配置文件。,数据分
10、析工具3,3。cluster heatmaps cluster analyses are one of the most powerful methods to mine and visualization high-dimensional data。)有三种群集算法:级别群集方法:(Single- Link:最近距离,Complete-Link:最远距离,Average-Link:平均距离)分布式群集方法:K-medk优点:您可以处理任何类型的属性。对异常数据不敏感)K-Means算法(特征:群集中心以所有类型数据的平均值表示;优点:使用最广泛。收敛速度快。可扩展以用于大型数据集;缺点:凸分
11、布,大小相近,倾向于识别密度相近的簇;中心选择和噪声聚类对结果影响很大)基因在染色体上的位置聚类。数据分析工具3,数据分析工具4,4。experiement design and value distribution a box plot displaying the distribution of expression values of each sample within a dataset,geoblast,geo核酸数据库可以执行序列匹配。GEO2R工具,geo 2 r is an interactive web tool that allows users to compare two or more groups of samples in a geoseries in order to identify genes that arars,使用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 调节性T细胞在小鼠免疫介导肝炎中的关键作用及分子机制解析
- 调控TTA上转换中能量给体与受体激发态性质的策略与应用研究
- 2026浙江温州市中医院招聘120急救站点驾驶员2人考试参考题库及答案详解
- 诺帝干预下恶性胶质瘤裸鼠模型FPR表达与血管生成的关联研究
- 2026年商洛市商丹高级中学教师选聘考试模拟试题及答案详解
- 2026山东威海北洋电气集团股份有限公司招聘8人笔试模拟试题及答案详解
- 词根策略在高中英语词汇教学中的应用:以延津一中高一为例的深度剖析
- 2026四川德阳旌贤人力资源有限公司招聘1人笔试模拟试题及答案详解
- 2026山东农业大学招聘2人考试参考题库及答案详解
- 2026四川泸州合江县白米镇卫生院招聘见习人员3人考试模拟试题及答案详解
- 对外投资合作国别(地区)指南-日本(2025年版)
- 2026年江苏省无锡市金桥双语实验学校中考物理一模试卷(含答案)
- 水土保持研究方法课件
- DB35T 2290-2026 非物质文化遗产 福州茉莉花茶窨制工艺
- 酒店民宿客房消杀消毒规范手册
- 2026江西赣州市章贡区社区工作者(专职网格员)招聘102人参考考试试题及答案解析
- 悼念亲人的追思词写作技巧与范例
- 烹饪实训室安全教育课件
- 2026春外研版七年级下册英语期末试卷二(含听力音频答案)
- 一升二年级数学暑假衔接巩固预习每日一练材料
- 锅炉MFT讲解课件
评论
0/150
提交评论