医学数据挖掘课件:功能分析_第1页
医学数据挖掘课件:功能分析_第2页
医学数据挖掘课件:功能分析_第3页
医学数据挖掘课件:功能分析_第4页
医学数据挖掘课件:功能分析_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因表达数据的获得与分析基因芯片数据的基础分析思路预处理差异表达基因筛选聚类与分类功能注释和富集分析根据疾病风险基因识别疾病风险通路利用各种技术(基因表达谱、RNAseq、质谱、大规模突变、全基因组关联分析等)识别疾病风险基因注释这些基因到通路中识别疾病风险通路分析这些通路与疾病的相关性丙酮酸丙酮酸激酶2-磷酸甘油酸磷酸烯醇式丙酮酸烯醇化酶葡萄糖6-磷酸葡萄糖6-磷酸果糖1,6-双磷酸果糖3-磷酸甘油醛1,3-二磷酸甘油酸3-二磷酸甘油酸http://www.genome.jp/kegg-bin/show_pathway?org_name=rn&mapno=00010&mapscale=1.0&show_description=show葡萄糖代谢通路泛素化去磷酸化抑制激活磷酸化绑定/相关http://www.genome.jp/kegg/pathway/hsa/hsa04630.html节点间的各种关系通过这些详细的互作关系,我们能够更清晰的了解通路!http://www.genome.jp/kegg/document/help_pathway.htmlhttp://www.genome.jp/kegg/xml/docs/Detail:/ERGOBioCyc/GeneDB/通路数据库KEGG其它通路数据库:/ReactomeGWT/entrypoint.htmlReactomewikipathways/index.php/WikiPathwaysbiocarta/http://www.genome.jp/kegg/KEGG数据库介绍KyotoEncyclopediaofGenesandGenomes1995年5月,日本的教育、科学、体育和文化部携手建立了KEGG数据库。由日本京都大学生物信息学中心的Kanehisa实验室开发KEGG是系统地分析基因功能、链接基因组信息和功能信息的数据库,旨在揭示生命现象的遗传与化学蓝图。数据库的维护人员不定期的根据最近出版的一些学术论文和生物学实验得到的数据对该数据库进行更新,经过了17年的发展,数据库的规模不断的扩大,其应用价值也得到了世界范围内的认可。与其他数据库相比,KEGG的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系。KEGG主页KEGG分析工具KEGGPATHWAYhttp://www.genome.jp/kegg/pathway.html可以看到KEGG收录的所有代谢途径信息通路类别

KEGGpathway分类

1.Metabolism

2.GeneticInformationProcessing

3.EnvironmentalInformationProcessing

4.CellularProcesses

5.OrganismalSystems

6.HumanDiseases

6.1Cancers

6.2ImmuneSystemDiseases

6.3NeurodegenerativeDiseases

6.4CardiovascularDiseases

6.5MetabolicDiseases

6.6InfectiousDiseases

心血管疾病(CardiovascularDiseases

)肥厚性心肌病(HCM)

hypertrophiccardiomyopathy致心律失常性右心室心肌症(ARVC)

Arrhythmogenicrightventricularcardiomyopathy扩张性心肌症(DCM)Dilatedcardiomyopathy

病毒性心肌炎Viralmyocarditis糖尿病(TypeIIdiabetesmellitus)结肠直肠癌(Colorectalcancer)案例1:

查看单个疾病风险基因注释到哪些通路神经胶质瘤(Glioma)风险基因(NCBI-GeneID:1956),该基因编码表皮生长因子受体(EGFR)进入KEGG搜索界面http://www.genome.jp/kegg/tool/map_pathway2.html选择Searchagainst为:hsa选择PrimaryID类型为:NCBI-GeneID输入EGFR基因(如格式:1956red)点击Exec案例2:

查看多个疾病风险基因注释到哪些通路(适用于复杂疾病)从通过差异表达分析获得动脉硬化(artherosclerosis)风险基因集合:共234个基因进入KEGG搜索界面http://www.genome.jp/kegg/tool/map_pathway2.html选择Searchagainst为:hsa选择PrimaryID类型为:NCBI-GeneID输入差异表达基因,格式:19red368red点击Exec234个动脉硬化相关基因凝血相关功能数据库:GeneOntology(GO)/GO语义的分类分子功能(MolecularFunction)描述在个体分子生物学上的活性,如催化活性或结合活性。生物学过程(BiologicalProcess)由分子功能有序地组成的,具有多个步骤的一个过程,如细胞周期。细胞组件(CellularComponent)指基因产物位于何种细胞器或基因产物组中(如糙面内质网,核糖体,蛋白酶体等),即基因产物在什么地方起作用term:gluconeogenesisid:GO:0006094definition:

Theformationofglucosefromnoncarbohydrateprecursors,suchaspyruvate,aminoacidsandglycerol.

Source:

MetaCyc:GLUCONEO-PWY

Ontology:BiologicalProcessSynonyms

exact:glucosebiosynthesisexact:glucosebiosyntheticprocessWhat’sinaGOterm?/amigo/term/GO:0006094案例3:

查看单个疾病风险基因注释到哪些功能神经胶质瘤(Glioma)风险基因(NCBI-GeneID:1956),该基因编码表皮生长因子受体(EGFR)进入GO界面/输入EGFR基因(格式:EGFR)选择geneorproteinname点击Go!案例4:

查看多个疾病风险基因注释到哪些功能从通过差异表达分析获得动脉硬化(artherosclerosis)风险基因集合:共234个基因进入GO搜索界面

/cgi-bin/amigo/search.cgi?action=advanced_query&session_id=3352amigo1381455489在Enteryourquery文本框中输入查询基因输入差异表达基因,格式:ABCA1ABCC6Searchtype选择GenesorproteinsSearchfields选择:symbol点击Exec最多查询50个基因基因芯片数据的基础分析思路预处理差异表达基因筛选聚类与分类功能注释和富集分析基因集功能富集分析的原因一组基因直接注释的结果是得到大量的功能结点。这些功能具有概念上的交叠现象,不利于进一步的精细分析,所以研究人员希望对得到的功能结点加以过滤和筛选,以便获得更有意义的功能信息。富集分析方法通常是分析一组基因在某个功能结点上是否过出现(over-presentation)。由单个基因的注释分析发展到大基因集合的成组分析。由于分析的结论是基于一组相关的基因,而不是根据单个基因,所以富集分析方法增加了研究的可靠性,同时也能够识别出与生物现象最相关的生物过程。案例5:利用DAVID工具进行动脉硬化风险通路识别从GAD数据库收集动脉硬化(artherosclerosis)风险基因集合:共234个基因将234个基因输入到DAVID系统利用EASE检验计算每个通路的富集显著性(P-value)EASEScore,amodifiedFisherExactP-Value

疾病风险基因数

人类基因

InPathway

3

40

NotInPathway

297

29960FisherExactP-Value=

0.008EASEScore=

0.06EASE分值更加严格!-1DAVIDTools

步骤1:进入DAVID网站,选择

FunctionalAnnotation

DAVID地址:/步骤2:(1)输入234个动脉硬化基因集合(2)选择基因ID

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论