




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
精品文档 1欢迎下载 DAVIDDAVID 使用说明文档使用说明文档 一 一 DAVIDDAVID 简介简介 DAVID the Database for Annotation Visualization and Integrated Discovery 的网址是 http david abcc ncifcrf gov DAVID 是一个生物信息数据库 整合了生物学数据和分析工具 为大规模的基因或蛋白列表 成百上千个基因 ID 或者蛋白 ID 列表 提供系统综合的生物功能注释信息 帮助用户从中提取生物学信息 DAVID 这个工具在 2003 年发布 目前版本是 v6 7 和其他类似的分析工具 如 GoMiner GOstat 等一样 都是将输入列表中的基因 关联到生物学注释上 进而从统计的层面 在数千个关联的注释中 找出最显著富集的生物学注释 最主要是功能注释和信息链接 二 二 分析工具 分析工具 DAVID 需要用户提供感兴趣的基因列表 在基因背景下 使用提供的分析工具 提取该列表中含有的生物信息 这里说的基因列表和 背景文件的选取对结果至关重要 1 基因列表 这个基因列表可能是上游的生物信息分析产生的基因 ID 列表 对于富集分析而言 一般情况下 大量的基因组成的列 表有更高的统计意义 对富集程度高的特殊 Terms 有更高的敏感度 富集分析产生的 p value 在相同或者数量相同的基因列表中 具有可比性 精品文档 2欢迎下载 DAVID 对于基因列表的格式要求为每行一个基因 ID 或者是基因 ID 用逗号分隔开 基因列表的质量会直接影响到分析结果 这里 定性给出好的基因列表应该具有的特点 一个好的基因列表至少要满足以下的大部分的要求 1 包含与研究目的相关的大部分重要的基因 如标识基因 2 基因的数量不能太多或者太少 一般是 100 至 10000 这个数量级 3 大部分基因可以较好的通过统计筛选 例如 在控制组和对照组样品间选择显著差异表达基因时 使用的 t test 标准 fold changes 2 P values 0 05 4 大部分是上下调的基因都涉及到特定的某一生物过程 而不是随机的散布到所有可能的生物过程中 5 一个好的基因列表比起随机产生的一个基因列表 应该含有更丰富的生物信息 6 在同样的条件下 列表具有高度可重复性 7 高通量数据的质量能够被其他独立的实验证实 以上 2 3 6 7 是来自上游的数据标准 DAVID 会自动检查其余的各项要求 即 1 4 7 2 基因背景 在一项研究中 如果一个生物过程不正常 那么通过高通量筛选技术 对该过程共同作用的基因有更大的可能性被选 为相关的一组 富集分析正是以此为基础 为检测富集的程度 必须选取一个背景来进行对比 基因背景的选取有一个指导原则 就是必须构建一个足够大的 研究者可能涉及的所有基因的集合 用户使用默认的背景文件 默认为该物种的所有基因 或者是 精品文档 3欢迎下载 上传一个基因列表文件作为基因背景 3 DAVID 为实现各项功能分析 提供了以下 4 个分析内容 共 6 个分析工具 1 GeneGene NameName BatchBatch ViewerViewer 这个工具能够实现将基因将基因 IDID 迅速翻译成基因名称迅速翻译成基因名称 从而给研究者对于基因 ID 列表一个直观的印象 初步判断基因列表是否符 合要求目的 图 1 中显示了该工具的分析结果 具体说明图 1 中标注 精品文档 4欢迎下载 图图 1 1 GeneGene NameName BatchBatch ViewerViewer 的分析结果的分析结果 2 Gene Functional Classification 这个工具是 Gene Name Batch Viewer 工具的延伸 由于基因名称并不能显著体现基因的功能 所以我们需要更加有效的功能 分类工具 该工具基于它们共同的注释信息 而不是基因名称 采用全新的模糊聚类算法 能够实现将功能相关的基因聚到一能够实现将功能相关的基因聚到一 精品文档 5欢迎下载 起作为一个单元 在生物学网络水平上去研究这些基因群起作为一个单元 在生物学网络水平上去研究这些基因群 对聚类结果打分 分值越高 代表该组内的基因在基因列表中越重分值越高 代表该组内的基因在基因列表中越重 要要 同时还提供了 2 D View 以热图形式展现聚类到同一组的基因和该组内各个 Term 之间的关系 结果见图 2 将列表中的基因将列表中的基因 IDID 作为聚类对象 将功能相关的基因分组显示作为聚类对象 将功能相关的基因分组显示 图 3 是以热图形式展示的 gene term 关系 图图 2 2 GeneGene FunctionalFunctional ClassificationClassification 的分析结果的分析结果 精品文档 6欢迎下载 图图 3 3 2 D2 D ViewView 展示展示 gene termgene term 关系关系 3 FunctionalFunctional AnnotationAnnotation 该工具是 DAVID 最核心的分析内容 包含了三个子工具 精品文档 7欢迎下载 Functional Annotation Chart 该工具提供该工具提供 gene termgene term 的富集分析 的富集分析 相比于其他富集分析软件而言 DAVIDDAVID 在该功能上最显著的特点是 注释范围的可扩展性在该功能上最显著的特点是 注释范围的可扩展性 从最初的 GO 注释 扩展到现在超过 40 中的注释种类 包括 GO 注释 KEGG 注释 蛋白相互作用 蛋白功能区域 疾病相关 生物代谢通路 序列特点 异构体 基因功能总结 基因在组织里的表达和论文等 用户可以根据需要选择其中的某些或者所 有种类的注释信息 结果中以基因列表中富集的结果中以基因列表中富集的 TermsTerms 为对象 将信息按照为对象 将信息按照 DAVIDDAVID 计算出来的计算出来的 p valuep value 排列 同时链接指向更多的信息排列 同时链接指向更多的信息 见图 4 精品文档 8欢迎下载 图图 4 4 FunctionalFunctional AnnotationAnnotation ChartChart 的分析结果的分析结果 Functional Annotation Clustering 该工具使用类似于 Gene Functional Classification 工具的模糊聚类方法 基于注释共同出现的程度作聚类 对被注释对被注释 上的上的 TermsTerms 做聚类做聚类 即 Terms 被分成多组 并将给出聚类的分值 分值越高 代表该组内的基因在基因列表中越重要分值越高 代表该组内的基因在基因列表中越重要 同 精品文档 9欢迎下载 时还提供了 2 D View 以热图形式展现聚类到同一组的基因和该组内各个以热图形式展现聚类到同一组的基因和该组内各个 TermTerm 之间的关系之间的关系 结果中 见图 5 即被注释上的被注释上的 TermsTerms 作为聚类对象 用户可以根据聚类的分值找到重要的作为聚类对象 用户可以根据聚类的分值找到重要的 TermsTerms 图图 5 5 FunctionalFunctional AnnotationAnnotation ClusteringClustering 的分析结果的分析结果 Functional Annotation Table 精品文档 10欢迎下载 该工具实现了基因的功能注释 将输入列表中每个基因在选定数据库中的注释以表格形式呈现将输入列表中每个基因在选定数据库中的注释以表格形式呈现 结果见图 6 图图 6 6 FunctionalFunctional AnnotationAnnotation TableTable 的分析结果的分析结果 精品文档 11欢迎下载 4 Gene ID Conversion 该工具实现不同数据库的基因标识间的转换 包含不同数据库的基因标识间的转换 包含 NCBI NCBI PIRPIR 和和 Uniprot SwissProtUniprot SwissProt 等重要数据库的基因标识信息 等重要数据库的基因标识信息 结果如图 7 所示 左边的表格左边的表格显示转换的情况 右边表格右边表格以列表呈现转换结果 和基因名称注释等 图图 7 7 GeneGene IDID ConversionConversion 分析结果分析结果 精品文档 12欢迎下载 总结 总结 对于以上 6 项分析工具各有偏重点 下面给出一个指示图 见图 8 帮助用户选择 DAVID 的各项分析工具 精品文档 13欢迎下载 hightly recommended recommended Gene ID Conversion Tool Gene Number Batch Viewer Gene Functional Classification Functional Annotation Chart Functional Annotation Clustering Functional Annotation Table Convert gene IDs from one type to another Gene ID Conversion Tool Gene Number Batch Viewer Gene Functional Classification Functional Annotation Chart Functional Annotation Clustering Functional Annotation Table Read all annotation contents associated with a gene Highlight protein functional domains and motifs Redirect to related literatures List interacting proteins Cluster redundant and heterozygous annotation terms Search other functionally similar genes in genome but not in list Search other annotation functionally similar to one of my interests Convert gene IDs from one type to another Diagnose and fix problems of gene IDs Explore gene namens in batch Dicover enriched functionally related gene groups Display relationship of many genes to many terms on 2 D view Initial glance of major biological functions associated with gene list Identify enriched over represented annotation terms Visualize genes on BioCarta KEGG pathway maps Link gene disease associations 图图 8 8 DAVIDDAVID 各项分析工具的选择指示图各项分析工具的选择指示图 精品文档 14欢迎下载 三 三 使用步骤 使用步骤 1 向 DAVID 网站提交一个基因列表 首先登录到网站 http david abcc ncifcrf gov 的首页 见图 9 点击页面顶端的 Start Analysis 在弹出页面的左边有一个 面板 Gene List Manager 在该面板的 upload 标签下提交基因列表 基因列表的格式为每行一个基因或者行内的多个基因以逗号 分隔 可以将基因列表黏贴到输入窗口或者以文件形式上传 接着选取输入基因列表的 ID 类型 最后确定列表的类型 是基因列表 还是作为背景文件 点击 use 进入分析 精品文档 15欢迎下载 图图 9 9 网站首页网站首页 上传的数据可以供所有的分析模块共享 而不需要重复上传 基因列表文件可以选取如图 10 中所示的 Demolist1 和 Demolist2 本 文中使用 DAVID 提供的 Demolist1 作为基因列表 附件一是人的血瘀和正常样品之间的显著差异表达基因列表 可供使用 如果你要做的是全基因组背景或者是接近全基因组背景的研究 就不需要上传那个背景文件 网站会自动根据上传的基因列表类型 选择对应物种的所有基因作为背景文件 如果你要自己设定背景 也可以在 upload 标签中上传 然后在 Background 标签中选 定所需的列表作为背景 本文中选取默认的背景文件 即人的全基因作为背景 Upload gene list here Example list click to use them 1 Paste gene list here Upload gene list file here 2 Choose the type of gene ID 3 Choose the gene list type 4 Submit the gene list 精品文档 16欢迎下载 图图 1010 上传数据窗口上传数据窗口 在 List 标签中 可以看到所有上传的列表 在图 11 所示的右侧中 选择分析项 Choose the analysis Type 图图 1111 LsitLsit 标签和分析工具选择窗口标签和分析工具选择窗口 1 选择 Gene Name Batch Viewer 这项分析 弹出的窗口显示分析结果 即基因 ID 和对应的基因名称 相关基因以及所属物种 用户可以据此初步判断 列表中是否含有感兴趣的基因 见图 12 Species 栏指向物种相关的 ncbi 信息网页 精品文档 17欢迎下载 Gene name translated by DAVID Input gene list 图图 1212 GeneGene NameName BatchBatch ViewerViewer 分析结果分析结果 点击 Related Genes 栏中的 RG 将会出现跟该行基因功能相关的基因列表 如图 13 所示的结果 精品文档 18欢迎下载 图图 1313 功能相关基因列表功能相关基因列表 2 选择 Gene ID Conversion Tool 这项分析工具 在弹出窗口 见图 14 中 选择目的标识类型 然后点击 Submit to Conversion Tool 弹出结果窗口 详细说明见图 15 参照网页 http david abcc ncifcrf gov helps conversion html result 精品文档 19欢迎下载 图图 1414 GeneGene IDID ConversionConversion ToolTool 窗口窗口 精品文档 20欢迎下载 图图 1515 GeneGene IDID ConversionConversion ToolTool 结果说明文件结果说明文件 3 选择 Gene Functional Classification 这项分析工具 弹出的结果和具体说明见图 16 具体说明参照网页 http david abcc ncifcrf gov helps functional classification html textmode 精品文档 21欢迎下载 图图 1616 GeneGene FunctionalFunctional ClassficationClassfication 3 选择 Functional Annotation Tool 这项分析工具 会弹出图 17 所示窗口 具体说明参照 http david abcc ncifcrf gov helps functional annotation html summary 精品文档 22欢迎下载 图图 1717 FunctionalFunctional AnnotationAnnotation ToolTool 界面界面 点击页面底部的三个选项 Functional Annotation Clustering Functional Annotation Chart Functional Annot
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汽车车载语音助手个性化设计创新创业项目商业计划书
- 直播相声创作后台创新创业项目商业计划书
- 环保驾驶挑战赛创新创业项目商业计划书
- 紧急制动辅助系统全速域覆盖创新创业项目商业计划书
- 二年级品德与生活上册 做好事不是为了表扬说课稿 北师大版
- 升降车操作及安全培训课件
- 2026届湖北省宜昌市第二中学高三物理第一学期期末综合测试试题
- 2025-2026学年山东省枣庄市现代实验学校物理高三第一学期期末教学质量检测试题
- 2025年天津市静海区瀛海学校高三物理第一学期期末经典试题
- 2025-2026学年吉林省蛟河市朝鲜族中学物理高三第一学期期末达标测试试题
- 《职业道德与法治》开学第一课(导言)(课件)-【中职专用】中职思想政治《职业道德与法治》高效课堂课件+教案(高教版2023·基础模块)
- 中职生职业素养全套教学课件
- 课件:性传播疾病讲解
- 财务工作内部培训课件
- 网络安全意识培训
- 医院检验科质量手册
- 小学数学课标培训课件:“数与代数”版块内容分析及教学建议
- 东方插花-盘插(花艺及插花技能)
- 教育行政学课件
- 安全挂梯施工方案
- 产品研发管理手册:免修版模板范本
评论
0/150
提交评论