语义网格在中医药知识共享与服务的应用研究973子课题_第1页
语义网格在中医药知识共享与服务的应用研究973子课题_第2页
语义网格在中医药知识共享与服务的应用研究973子课题_第3页
语义网格在中医药知识共享与服务的应用研究973子课题_第4页
语义网格在中医药知识共享与服务的应用研究973子课题_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,语义网格在中医药知识共享与服务的应用研究(973子课题)进展报告,浙江大学 吴朝晖,2018/1/19,2,语义网格在中医药知识共享与服务的应用研究,研究内容和目标 当前工作进展下一步计划总结,课题编号:2003CB316906,2018/1/19,3,研究内容与目标,本课题以中医数据与知识管理、个体化诊疗临床决策支持为需求背景;以传统的知识表达与知识共享方法为理论指导;以语义Web、网格计算相关规范和技术为实现基础;,课题编号:2003CB316906,2018/1/19,4,研究内容与目标,研究面向互联网的、特定领域相关的知识表达模型,研究基于知识的互联网信息资源共享方法论、松耦合的语义映射模型、分布式语义查询与协同推理算法,最终目标是构架一个支持中医药知识共享与服务的语义与知识网格。,课题编号:2003CB316906,2018/1/19,5,工作进展,课题编号:2003CB316906,经过一年多地研究和开发,本课题在语义网格的知识服务和共享的原型实现和理论研究方面都取得了重大突破和进展:原型方面主要围绕基于语义的数据库网格DartGrid、中医药本体网格以及分布式中医药KDD开展;理论方面主要面向中医药领域进行概念建模理论与方法,上下文相关语义表达理论,以及基于语义视图的分布式语义查询的相关研究;,2018/1/19,6,工作进展:原型实现,面向中医药知识共享与服务的语义与知识网格,主要以基于语义的数据库网格(DartGrid)平台为支撑,同时重点建设中医药本体网格和分布式中医药KDD系统。,课题编号:2003CB316906,2018/1/19,7,工作进展:基于语义的数据库网格,基于语义的数据库网格(DartGrid)总的研制目标是:通过定义和实现一个基于语义的虚拟组织模型,提供一整套在网格环境下构建支持大规模数据共享和管理的虚拟组织的解决方案。重点支持信息资源(如数据库、知识库等)的动态化的语义注册、分布式的语义查询与知识级的语义浏览。,课题编号:2003CB316906,2018/1/19,8,工作进展:基于语义的数据库网格,基于语义的数据库网格(DartGrid)总的研制目标是:通过定义和实现一个基于语义的虚拟组织模型,提供一整套在网格环境下构建支持大规模数据共享和管理的虚拟组织的解决方案。重点支持信息资源(如数据库、知识库等)的动态化的语义注册、分布式的语义查询与知识级的语义浏览。,课题编号:2003CB316906,2018/1/19,9,工作进展:基于语义的数据库网格,DartGrid从技术层面解决了大规模海量数据库的动态集成与协同共享问题,集成了近50多个包括文献、文档、关系型、多媒体等多类型的中药学科技信息数据库群;在应用层面着重针对中医药这一数据密集型和知识密集型领域,解决了海量中医药科学数据的共建共享问题,建立了多中心(大约20个科研、院校的分中心)协同共享和共建的模式;做为一个大型数据库网格综合管理平台,它充分结合了先进的网格计算和Semantic Web相关技术和标准,支持面向Internet的,跨管理域的,语义异质异构的数据库资源的动态语义集成,深度协同共享,实时监控与综合管理等功能。,课题编号:2003CB316906,2018/1/19,10,工作进展:基于语义的数据库网格,DartGrid平台基于GT4进行开发,并遵循GSA/OGSI标准,由多层次的知识网格服务和应用组成。,课题编号:2003CB316906,2018/1/19,11,工作进展:基于语义的数据库网格,DartGrid平台基于GT4进行开发,并遵循GSA/OGSI标准,由多层次的知识网格服务和应用组成。,课题编号:2003CB316906,2018/1/19,12,工作进展:基于语义的数据库网格,与上一个版本相比,新版本的DartGrid具备了以下新特性:,课题编号:2003CB316906,着重改进了分布式语义查询内核。使用了新的查询分配算法,提高查询效率。提供了具有更好的扩展性和抽象性的架构设计,为进一步扩展提供方便。设计了更易使用的本体规范,为实际应用提供便利。支持JDBC和网格服务等方式的数据源。在内核基础上,将查询功能包装为网格服务,形成中医药知识网格。完成了语义浏览器以及Web版本的网格客户端的开发。,2018/1/19,13,工作进展:基于语义的数据库网格,目前,最新版本的DartGrid平台已经全面布署并实际应用于支持中医药科学数据与知识的发布和共享。,课题编号:2003CB316906,2018/1/19,14,课题编号:2003CB316906,查询构造,本体树,查询结果,2018/1/19,15,工作进展:基于语义的数据库网格,基于语义的数据库网格平台DartGrid已经于2005年6月通过了由浙江省科技厅组织的科技成果鉴定,由领域专家组成的鉴定委员会一致认为,该研究成果整体达到了国内领先水平,其中多项关键技术达到了国际先进水平。,课题编号:2003CB316906,2018/1/19,16,工作进展:基于语义的数据库网格,基于语义的数据库网格方面的最新成果发表于以下国际会议和杂志:Chen HJ, Wu ZH, Zheng GZ, Mao YX, RDF-Based Schema Mediation for Database Grid, Grid Computing 2004. Wu ZH et al, DartGrid II: A Semantic Grid Platform for ITS, IEEE Intelligent Systems, vol.20, No.3, Jun. 2005. Chen HJ, Wu ZH, Mao YX, Dart Database Grid: A Dynamic, Adaptive, RDF-Mediated, Transparent Approach to Database Integration for Semantic Web, APWeb 2005Wu ZH et al, DartGrid: RDF-Mediated Database Integration and Process Coordination Using Grid as the Platform, APWeb 2005,课题编号:2003CB316906,2018/1/19,17,工作进展:中医药本体网格,协同中国中医研究院持续开发和完善世界上最大的中医药本体中医药学语言系统(TCMLS);目前包括了数十万个概念和近百万条实例,基本上覆盖了整个中医药领域的十几个子学科,,课题编号:2003CB316906,2018/1/19,18,工作进展:中医药本体网格,协同中国中医研究院持续开发和完善世界上最大的中医药本体中医药学语言系统(TCMLS);目前包括了数十万个概念和近百万条实例,基本上覆盖了整个中医药领域的十几个子学科,,课题编号:2003CB316906,中医药本体由十几个分中心和研究所协同开发,整个本体由按照中医药子学科划分的多个大型的本体组成。,2018/1/19,19,工作进展:中医药本体网格,对于这样一个庞大的本体,传统的集中式的本体工程的方法已经无法本体日益扩大和动态分布式的需求,需要一个有效的进行开发和开发和维护,因此,我们基于DartGrid平台的底层构架,按照知识网格的思想,将发布在不同节点上的不同中医药子学科的大型本体看作一种网络资源,通过网络服务将分布式本体连接起来,同时通过本体中包含的语义关系将其在逻辑上进行有机整合,组成一个本体网格。,课题编号:2003CB316906,2018/1/19,20,工作进展:中医药本体网格,中医药本体网格,采用网格技术在分布式环境下管理和共享多个的独立开发和维护的中医药子学科的局部本体,而这些局部本体可以在一个虚拟组织中共同组成一个大规模的全局本体,也就是中医药学语言系统。,课题编号:2003CB316906,2018/1/19,21,工作进展:中医药本体网格,中医药本体网格,采用网格技术在分布式环境下管理和共享多个的独立开发和维护的中医药子学科的局部本体,而这些局部本体可以在一个虚拟组织中共同组成一个大规模的全局本体,也就是中医药学语言系统。,课题编号:2003CB316906,2018/1/19,22,工作进展:中医药本体网格,中医药本体网格是广泛计算架构和领域知识集合的结合,整个构架分为两个层次:核心网格服务层和虚拟语义视图层。前者主要指网格中的资源以及直接基于DartGrid网格服务实现的服务;而后者指的是用于支持上层本体应用的虚拟语义视图。向用户提供了一个基于浏览器的统一的浏览和查询接口,而本体的分布式结构对终端用户来说则是完全透明的,呈现在用户面前的是一个虚拟的大规模的中医药学领域本体。,课题编号:2003CB316906,2018/1/19,23,工作进展:中医药本体网格,中医药本体网格是广泛计算架构和领域知识集合的结合,整个构架分为两个层次:核心网格服务层和虚拟语义视图层。前者主要指网格中的资源以及直接基于DartGrid网格服务实现的服务;而后者指的是用于支持上层本体应用的虚拟语义视图。向用户提供了一个基于浏览器的统一的浏览和查询接口,而本体的分布式结构对终端用户来说则是完全透明的,呈现在用户面前的是一个虚拟的大规模的中医药学领域本体。,课题编号:2003CB316906,2018/1/19,24,工作进展:中医药本体网格,目前由本体网格支持的中医药学语言系统的测试版已经正式在线发布,用于支持上层的面向中医药的知识应用其他相关工作:基于Protg进行二次开发,以插件的形式开发了关联导航、实例查询编辑、内容导出等工具,参照UMLS,初步实现了上层语义网络的发布和浏览;,课题编号:2003CB316906,2018/1/19,25,工作进展:中医药本体网格,中医药本体网格的最新成果发表于以下国际会议和杂志:Zhou XZ., Wu ZH, Yin AN, et al, Ontology Development for Unified Traditional Chinese Medical Language System, Journal of Artificial Intelligence in Medicine, 32(1), 15-27, 2004.毛郁欣,吴朝晖,陈华钧,汤萌芽,本体网格:面向语义网的领域知识共享,中国人工智能学会第十一届全国学术大会,2005,已录用Wu ZH, Mao YX, Chen HJ, Xu Z, An Ontology and Context Based Client Model for Dart Information Grid, Int. J. High Performance Computing and Networking, accepted.,课题编号:2003CB316906,2018/1/19,26,工作进展:分布式中医药KDD系统,据统计,目前国内收藏的辛亥革命以前的中医药学古籍文献就达1万3千多种,1987-2003年发表的中医药文献高达530,700篇。面对海量的中医药数据,如何充分共享并有效利用,是中医药现代化发展必须面对的一个问题; KDD所擅长的正是从海量的数据当中寻找有意义的模式、知识,中医药学数据挖掘研究是再现中医药理论一个有效手段,意义重大。我们围绕中医药文本挖掘、中医配伍规律中药效与药对规律研究,开展了一系列创新工作 ;,课题编号:2003CB316906,2018/1/19,27,工作进展:分布式中医药KDD系统,面向中医药文本的数据特点,即在小样本的情况下字频特征比词频特征能提供更好信息,提出了面向中文文本分类的分布字聚类方法; 基于分层聚类的药效知识挖掘,采用基于分层聚类的KDD方法,得出单味药间按照功效相似性分类的结果;高频集的药对规律的知识挖掘,得出大量方剂中“只有100味左右的单味药经常参与配伍”的事实依据,挖掘出“各库高频单味药以及形成药对相关理论非充分也非必要的推断等相关知识;首创了中医证候与基因相关关系的研究,为生命科学的发展提供了新知识和新方法;,课题编号:2003CB316906,2018/1/19,28,中医证候基因关系知识挖掘的图示,肾阳虚证的相关基因的基因网络,利用中医药文献提供的证候-疾病关系和Medline提供的疾病-基因关系发现肾阳虚证的可能相关基因(CRP,CRH,ACE,IL10,PTH,MPO),并从Pubgene中查询这些基因的基因网络,在这六个基因的网络当中都发现了CRAT基因,说明CRAT基因很有可能是肾阳虚证的新相关基因,2018/1/19,29,工作进展:分布式中医药KDD系统,网格服务对异质异构的数据进行了整合,使得用户可以忽略数据的来源以及形式。对用户透明的数据源以及统一的数据表式方式,为KDD在更广泛的数据分析上作好准备。同时,网格服务分布计算的服务能力,也为海量数据下的数据挖掘应用提供了强大的计算资源;分布式中医药KDD系统基于网格平台实现了分布并行的数据挖掘算法,为用户提供了高效的KDD服务。在该系统上对对中医药中3968味单味药以及相应的8871种功效进行挖掘分析,得出了大量有价值的结果,为中药药效基础、作用机理及方剂配伍规律的研究提供了新的依据和思路。,课题编号:2003CB316906,2018/1/19,30,中药药效知识挖掘的图示,这样的基于功效的单味药聚类,对于中医组方替代药的选择和药效分析具有重大意义,聚出的第一类药:活血消肿药,聚出的第二类药:止痛去湿药,按照功效对单味药进行聚类,2018/1/19,31,工作进展:分布式中医药KDD系统,分布式中医药KDD系统的最新成果发表于以下国际会议和杂志:Wu ZH, Zhou XZ, Liu BY, Chen JL, Text Mining for Finding Functional Community of Related Genes using TCM Knowledge. ECML/PKDD-2004, Italy, Pisa, Lecture Notes in Artificial Intelligence. Vol 3202/2004, pp.459-470, September 20-24,2004.Zhou XZ, Wu ZH, Distributional Character Clustering for Chinese Text Categorization. The 8th Pacific Rim International Conference on Artificial Intelligence, Auckland, New Zealand, Lecture Notes in Artificial Intelligence, vol 3157,pp.575-584, August 9-13, 2004.吴朝晖,封毅,KDD在中医药领域的若干探索,中国中医药信息杂志,2005,第12卷,第4期Feng Y, Wu ZH, Zhou ZM, Combining an Order-semisensitive Text Similarity and Closest Fit Approach to Textual Missing Values in Knowledge Discovery, KES 2005.Feng Y, Wu ZH, Zhou ZM, Multilabel Text Categorization Using K-Nearest Neighbor Approach with M-Similarity, SPIRE 2005, In Press,课题编号:2003CB316906,2018/1/19,32,工作进展:理论研究,理论研究方面,主要围绕网格环境下基于语义的知识服务和共享,针对以下几点展开深入研究:面向中医药进行概念建模,研究和完善了中医药学语言系统;提出并研究了面向语义网格的上下文相关的动态子本体进化理论;研究和完善了语义网格的分布式语义查询算法,在最新版本的Dart数据库网格加以应用;,课题编号:2003CB316906,2018/1/19,33,工作进展:中医药概念建模,中医药是蕴涵中国传统文化和辨证哲学的医学科学。作为一门复杂的科学,中医药的知识系统包含了大量的概念和关系,要从复杂的中医药知识系统中抽象出易于重用的领域知识,需要进行有效的概念建模,更好地支持中医药领域的基于知识的推理和挖掘提供了概念模型和基础。,课题编号:2003CB316906,2018/1/19,34,工作进展:中医药概念建模,参照UMLS,进行复杂语义网络(Semantic Network)的研究,通过上层语义网络,直接指导中医药本体的概念建模;研究如何将错综复杂的中医药术语概念一致化,整理并归纳众多概念之间内在的语义关系;进行了概念模型存储的相关研究,提出了基于数据库的有效的概念存储和查询框架;,课题编号:2003CB316906,2018/1/19,35,工作进展:中医药概念建模,中医药概念建模方面的研究成果发表于以下国际会议和杂志:Zhou XZ., Wu ZH, Yin AN, et al, Ontology Development for Unified Traditional Chinese Medical Language System, Journal of Artificial Intelligence in Medicine, 32(1), 15-27, 2004.Mao YX, Wu ZH, Chen HJ, Zheng XQ, An Interactive Visual Model for Web Ontologies, KES 2005 毛郁欣,吴朝晖,陈华钧,汤萌芽,本体网格:面向语义网的领域知识共享,中国人工智能学会第十一届全国学术大会,2005,已录用,课题编号:2003CB316906,2018/1/19,36,工作进展:上下文相关的子本体进化,考虑语义网格环境下,信息共享和知识推理的局部性(locality)和兼容性(compatibility),我们认为,一个面向某个潜在特定的子问题的Agent通常只需要大规模领域本体的某一部分知识。这就要求Agent能够从一个大型本体中抽取特定的部分,通过不断进化形成上下文(context)相关的可重用的动态子本体(Sub-Ontology)。这种能力对于解决需要多个领域知识本体的跨领域问题至关重要。,课题编号:2003CB316906,2018/1/19,37,工作进展:上下文相关的子本体进化,我们以语义Web技术为基础,进行基于多Agent的体系结构的研究,该体系结构包含了一套局部子本体进化机制,通过动态自组织的面向领域的子本体,支持分布式环境下智能有效的问题解决规划。该研究成果对知识重用和问题解决有较大的意义和价值。子本体进化可以定义为包含自动抽取、合并、映射和整合Agent引用过的领域本体的特定部分(定义为子本体)到本地的本体容器中以支持智能高效的问题解决。,课题编号:2003CB316906,2018/1/19,38,工作进展:上下文相关的子本体进化,我们可以设计一个由许多服务Agent为应用组件构成的分布式环境,包含了服务Agent,问题求解Agent和领域知识Agent,在该环境下开展研究。我们的主要目标是,探索大型领域本体的不同方面或者不同视图,在协同问题解决经验的作用下,如何自然地分配给分布式的Agent,形成可重用上下文相关的子本体。,课题编号:2003CB316906,2018/1/19,39,工作进展:上下文相关的子本体进化,上下文相关的子本体进化方面的研究成果发表于以下国际会议和杂志:Mao YX, Cheung W, Wu ZH, Liu JM, Dynamic Sub-Ontology Evolution for Collaborative Problem-Solving, AAAI-FSS 2005Mao YX, Wu ZH, Chen HJ, Xu Z, Context-based Web Ontology Service for TCM Information Sharing, ICWS 2005Wu ZH, Mao YX, Chen HJ, Xu Z, An Ontology and Context Based Client Model for Dart Information Grid, Int. J. High Performance Computing and Networking, accepted.,课题编号:2003CB316906,2018/1/19,40,工作进展:分布式语义查询,结合RDF模型的特点,提出了RDF语义视图的形式化系统、基于语义视图的Web语义查询问答包含算法与重写算法;证明了基于视图的语义查询问答问题与RDF语义查询的包含推理问题之间的等价性,回答了在OWS下查询计算的复杂度。,课题编号:2003CB316906,2018/1/19,41,工作进展:分布式语义查询,语义查询包含三个层面的含义:是指在一个开放的、语义良定义的网络环境下面的查询;查询是在概念层次进行的,用户不和底层的数据实现打交道;查询中的概念和结果都富含语义;,课题编号:2003CB316906,2018/1/19,42,工作进展:分布式语义查询,语义查询语言Q3:基于描述逻辑定义了不同表达能力的元语组,既支持数据库的查询,也支持知识库的查询;采用N3的基本语法,具有较好的可读性,并方便转化成自然语言;遵循RDF的基本语义表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论