精准医学知识库构建_第1页
精准医学知识库构建_第2页
精准医学知识库构建_第3页
精准医学知识库构建_第4页
精准医学知识库构建_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精准医学知识库构建精准医学2011年11月,美国NRC:迈向精确医学:构建生物医学研究知识网络和疾病分类体系大样本研究获得疾病分子机制的知识体系掌新的疾病分类体系和诊疗标准提高国民健康水平基础依据组学数据患者个体特征 基因型 表型 减少无效、有害和过度医疗 降低医疗成本 优化国家医疗资源配置 环境 生活方式推动相关学科快速发展意义 现代遗传学 分子影像学 生物信息学 临床医学手段目标概念 精准预防集合了诸多现代医学科技发展的知识与技术体系,体现了医学科学发展趋势,也代表了临床实践发展方向。精准诊断 精准治疗知识库在精准医学研究中的重要性队列研究组学分析基因型表型环境生活方式基因组学蛋白质组学代

2、谢组学大样本、大数据知识库海量、异构数据知识网络文本资源生物信息知识标准精准医学目标或应用临床科研 疾病诊断 精准医疗 健康管理 资源配置 病例分析 信息查找 信息分析 知识再造 知识共享生物医学知识库已成为研究热点NCBI、EBI等国际大型生物信息中心依托海量资源持续构建生物医学知识库美国国立生物技术信息中心(NCBI)的知识库研究欧洲生物信息研究所(EBI)的知识库研究UPTODATEIPA软件 通过自然语言处理技术从文档中提取信息和知识 聘请专业人士进行判读,保证了知识的可靠性 致力于组学数据的建模、分析和理解GeneGo软件Linked Open Data in BiomedinceS

3、ource: 疾病研究精准医学知识库构建中国医学科学院医学信息研究所语义网络北京蛋白质组研究中心哈尔滨工业大学浙江大学共享平台军事医学科学院文本挖掘 大连理工大学疾病研究精准医学知识构建知识审编生物信息复旦大学中科院上海生命科学研究院上海生物信息技术研究中心北京基因组研究所集合了国内在语义网络、文本挖掘、生物信息、知识审编和共享平台方面的优势团队环境精准医学本体与语义网络药物reformulated totradename ofhas precise ingredientingredient of疾病/症状通路蛋白质基因/基因变异面向恶性肿瘤、代谢系统疾病、呼吸系统疾病、心脑血管疾病等重大疾病

4、药物Gene has MutationMutation has Size基因组treatsdisrupts蛋白质组is associated withinteracts withhas part疾病与症状暴露组is aaffectscomplicatesco-occurs with精准医学知识库的内涵药物疾病0,000,00000000000一般变异蛋白层次的变异通路基因重复出现变异功能性变异0变异知识库服务的基本思路 科研需求统一的表型本体统一的药品本体以及这些本体在临床的映射应用需求 临床需求知识库API 结合知识库内容和需求建设提供API 建设相应的知识库内容知识库建设 集成相关的知识库

5、服务知识库科研应用预期效果生物学问题搜索实验数据定制路径BioProfilerBio/Tox FunctionsDiseases / DisordersCanonical PathwaysUpstream RegulatorsMechanistic / Causal NetworksInteraction Networks对比分析精准医学知识库临床应用精准医学知识库应用接口(知识推送系统)精准医学场景案例风险评估精准诊断精准治疗精准预测精准用药知识库本体和语义网络12精准医学顶层本体可视化13精准医学本体关系可视化 - 114语义关系示例Relation_StringRIDDomainRang

6、eR0000002decreaseGenesDiseasesGenes:MEN1;Disease: liver cancer;source:24101467;IPA KB summary: Here, we show that heterozygous ablation of Men1in female mice reduces chemical carcinogen-induced livercarcinogenesis and represses the activation of theinflammation pathway.R0000003Chemicals andDrugsdecr

7、easeDiseasesChemicals and Drugss: dexmedetomidine;Disease:liver cancer;IPA KB source:ClinicalT NCT02016391Summary: dexmedetomidine is in Phase 4 clinical trial as atreatment for cancer of liver in human.15本体下层概念-概念表 概念主要参考MeSH及NCIt 术语来源素材包括MeSH、SnomedCT、NCIt、OMIM等 。16本体下层概念数据统计统计项统计值本体一级类名本体二级类名概念数术

8、语数Anatomy249717315Diagnostic and Therapeutic TechniquesOrganisms4691633265132254259085030Human PhenotypesPathological ConditionsSigns and SymptomsChemically-Induced DisordersCommunicable DiseasesDiseases by Site10721976573155098278542772134344718492164653285Hereditary Diseases and AbnormalitiesMenta

9、l DisordersDiseasesNeoplasms8089602418847780Nutritional and Metabolic DiseasesOccupational DiseasesSyndrome372636257167Cells4813710Cellular MechanismsMolecular MechanismsCellular StructuresCell Physiological PhenomenaBiomolecules3001672266143910652481665993205Biochemical PhenomenaGene886692250559632

10、7Genetic PhenomenaAllChemicals and Drugs2264474,465106060428,157合计17知识库资源层-领域数据&文本资源整合18领域数据库核酸数据库GenBank, RefSeq, miRBase, EMBLSwiss-Prot, trEMBL, PDBGEO, ArrayExpress蛋白质数据库表达谱数据库突变数据库基因数据库生物医学数据库dbSNP, dbVar,1000 Genomes ProjectTRANSFAC功能数据库通路数据库Reactome, KEGG, BiGGOMIM, ClinVar, HGMD, TCGA, COSMI

11、CHPO基因/突变-疾病数据库症状数据库诊疗数据库NGC药物数据库DrugBank, PharmGKB, PubChem精准医学文本资源整合系统总体设计信个性化定制服务检索应用资源导航全文数据接口服务息服务层用户管理数据维护信息分析与用户热点关注外部其它应用系统元数据加工数据仓储信息分类体系元数据接口服务元数据标准自动标引信息组织层元数据仓储信息采集层网页采集基本功能个性化定制分布式数据处理采集策略采集管理PubMedFDAC Thomson Innovatio20知识图谱构建21知识图谱构建 流程化系统架构知识图谱存储与检索数据索引数据存储文本关系抽取数据融合同义词检索实体类型推断数据模式转

12、换知识存储 数据插入:数据图谱化 将数据库条目数据,转化为知识图谱的RDF知识图谱补全跨语言实体链接三元组,并插入知识图谱 实体转换 原数据库中的entry,转化为知识图谱中的实体 属性-关系转换数据插入 原数据库属性转化为的SPO三元组冲突检测与修复知识获取关系抽取Gene Gene Id Alternative TranscriptsNameOMIM网页解析TP53COSG5 TP53_ENST0000054585191170数据库条目018,TP53_ENST00000269305数据采集分布式爬虫SubjectPredicateObjectCOSG501Gene nameTP53RDF

13、三元组COSG501Aternative TranscriptsAternative TranscriptsOMIMTP53_ENST00000545858互联网COSG501TP53_ENST0000026930522COSG50OMIM_TP53数据插入:基于知识图谱的数据融合 知识图谱中的等价性,具有传递性 实体相似度,取决于其邻居的相似度 更丰富的语义信息被使用 相似度经过多轮迭代sameAs(x1, x2) depends ony2)sameAs(y1,which depends on sameAs(x1,x2)PARIS - Probabilistic Alignment of R

14、elations, Instances, and Schema, PVLDB2011数据插入:冲突检测与修复 不同数据源可能存在数据不一致或数据冲突。检测并修复这些冲突,是综合利用多个医学数据库的基础。定义语义限制,检测冲突cDNA Sequence(A,B) & cDNA Sequence(A,C) = B=CType(TP53, gene) ,cDNA Sequence(TP53, X)KB1Type(TP53, gene) ,cDNA Sequence(TP53, Y)出发点:正确的数据值,应该是使得数据冲突个数最少的值。KB2算法:MaxSATType(TP53, gene) ,cDN

15、A Sequence(TP53,cDNA Sequence(TP53, YKB(融合后)SOFIE: a self-organizing framework for information extraction, WWW2009知识库界面展示与功能介绍26精准医学知识库资源展示页面资源检索系统统计资源访问与下载次数等,并以此排序简介资源展示,并监控资源服务状态树状结构的资源分类树链接原始地址核心分析功能基于精准医学知识库经典通路的分布富集分析相关疾病的分布富集分析预测提交数据的上游调控因子转录调控网络、相互作用网络毒理过程分布富集分析数据分析应用样本间的PCA分析样本间的cluster分析样本

16、的热图分析样本间的相关性分析目标蛋白的功能分析(GO,KEGG)目标蛋白的通路分布分析(KEGG,Reactome, PID)蛋白网络分析目标蛋白的信号网络分析转录调控网络分析代谢网络分析激酶-底物网络分析药物敏感性分析疾病基因分析(例驱动基因)药物靶标和药物分析整合生物学网络分析通路建模和仿真蛋白质基因组学分析体系的建立标志物寻找多组间的biomarker的分析不同组间的共同biomarker的展示通路展示功能Canonical Pathways Visualization应用场景32精准医疗场景获取病人状况概念归一化肝硬化 AND 糖尿病 AND 腹水 AND 脾肿大Cirrhosis A

17、ND Diabetes AND Ascites AND Splenomegaly利用知识库中的表现关系获得可能疾病列表Jeff Williams, 46y.o. Americanmale of ScottishdescentInitial Diagnosis:Cirrhosis &Diabetes due toalcoholism关联精准医学知识库The time it took toget a correctdiagnosis causedpermanentdamage.精准用药场景订阅知识转化平台知识的本地化药物基因组学相关知识内容精准医学知识库院内药物基因组学知识库氯吡格雷监控临床用药知识服务个性化用药建议临床工作站临床基因检测结果解析精准用药知识库现有基础建立肝癌生命组学知识库全面收集已经过初步验证的肝癌生命组学变化知识点,并进行抽提、归纳、注释和解析,挖掘和展示肝癌发生、发展、预后和药物反应性的潜在分子机理、生物标志物和药物作用靶点,建立肝癌

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论