基于本体的中医舌诊知识的获取.pdf_第1页
基于本体的中医舌诊知识的获取.pdf_第2页
基于本体的中医舌诊知识的获取.pdf_第3页
基于本体的中医舌诊知识的获取.pdf_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

收稿日期:2005-03-15;修返日期:2005-04-27基金项目:国家自然科学基金资助项目(60273019);国家科技部重大基础研究专项联合资助项目(2001CCA03000);首都师范大学实验室开放资金资助项目基于本体的中医舌诊知识的获取*曹宇峰1,2,曹存根2(1.首都师范大学计算机科学联合研究院,北京100037;2.中国科学院计算技术研究所,北京100080)摘要:中医舌诊知识是中医学的一个重要组成部分,它可以为计算机自动诊断、中医智能教学、中医自然语言理解提供知识基础。介绍了中医舌诊本体,建立了九个中医舌诊本体类和一些相关的本体类,同时也获取了舌诊知识的一些公理。关键词:中医舌诊知识;知识获取;本体中图法分类号:TP181文献标识码:A文章编号:1001-3695(2006)03-0031-04KnowledgeAcquisitionofTongueDiagnosis:AnOntology-basedApproachCAOYu-feng1,2,CAOCun-gen2(1.JointFacultyofComputerScientificResearch,CapitalNormalUniversity,Beijing100037,China;2.InstituteofComputingTechnology,ChineseAcademyofSciences,Beijing100080,China)Abstract:TonguediagnosisisaprofoundandspecialpartofthewholetraditionalChinesemedicine,andknowledgeoftonguediagnosisisthebasisformanycomputerapplicationssuchasautomateddiagnosisandtherapy,medicalinstructionandtrai-ning,andnaturallanguageprocessing.Thispaperintroducesadomain-specificontologyoftonguediagnosis,ithasbeenbuilt9categoriesaboutTCMtonguediagnosisandotherrelevantcategories.Keywords:TraditionalChineseMedicineTongueDiagnosis;KnowledgeAcquisition;Ontology1引言中医学是中华民族灿烂文化的重要组成部分,舌诊是中医学的重要组成部分,在临床辨证中起着重要的作用。如果让计算机具备中医舌诊的知识,计算机就可以成为帮助医生诊断的很好的助手。舌诊知识在很多领域有着广泛的应用,如计算机辅助医疗、中医专家系统、远程医疗等。笔者现在研究的课题“病案引导下的中医智能教学的研究”也需要舌诊知识的支持。知识获取是知识工程的一个公认的瓶颈问题,因此知识获取受到了广泛的重视和研究16。领域知识获取的途径主要有两种:从领域专家处获得专业知识;从文本或数据库中直接获取。对中医知识而言,由于专家的研究领域和研究精力的局限,很难给出完整的学科体系,而且据统计,90%以上的知识可以从文本中获取,因此,从领域文本中直接获取知识无疑是一种更可取的方法。我们获取中医舌诊知识的知识源以中国大百科全书10中医卷为主,其他权威资料为辅,在知识获取的过程中,我们采用人机交互的半自动的知识获取方法8,9。具体地说,中医学领域知识的获取工作主要分五步:(1)建立中医学本体。由知识工程师在中医专家的指导下完成15。(2)中医学文本的半结构化。将自然语言描述的中医学知识文本形式由知识工程师转变为中医学知识描述语言表示的半结构化的领域知识文本。(3)中医学知识公理的获取。公理是中医学本体不可缺少的组成部分,是推理和知识分析的基础。(4)基于中医学本体的知识编译和检查。在本体的驱动下,由计算机系统自动地实现半结构化知识文本到知识库存储形式的转换。(5)知识分析及知识链接5。对获得的中医学知识进行分析,检查其可能存在的异常现象,以确保所获得的知识的可用性。中医学知识获取的前三步是人工来完成的,后两步是由计算机系统自动完成,因此整个知识获取过程是一个半自动的过程。2中医学本体近年来,本体论的应用越来越受到重视,很多知名的知识系统都采用了本体论的思想。我们在处理中医知识的时候,使用了本体论作为建立一个结构良好、可共享复用的知识库的工具,用于刻画中医学概念及其相关知识。中医学本体论从知识工程的角度来说,指的是一个中医学本体结构以及对中医学概念的本体知识描述。在这里本体知识既可以在概念层次上进行定义,也可以在语言层次上进行描述,它包含了概念的所有相关知识。任何一门学科,它的一个基本任务是将所研究或观察到的事物进行分类,具有相同的性质的一组事物归属为一类事物,形成一个集合体,我们用类(Category)来表示。本体构成13第3期曹宇峰等:基于本体的中医舌诊知识的获取部分是概念通过分类关系形成的层次结构,因此,表示本体首先要准确表示出本体的分类结构。2.1中医舌诊本体类的划分在我们NKI课题组现有的中医本体的划分中,有中医诊断方法、中医术语、中医证、中医脉象、中医病机等30多个中医本体类。中医临床上,舌诊主要包括望舌质和望舌苔两部分内容。而中医传统诊法认为,舌质与舌苔在反映病证方面各有侧重。一般来说,舌质多反映五脏精气的盛衰,舌苔多反映病邪的性质及病位的深浅。因此在我们获取舌诊知识前,根据舌诊知识的特点,将舌诊本体划分为舌质本体类和中医舌苔本体类两个子类。而在临床上,望舌质又可细分为望舌神、望舌色、望舌形、望舌态四个方面。望舌苔又可分为望舌苔的“形质”和望舌苔的“颜色”两方面7。因此,我们又在舌质本体类下建立了舌神本体类、舌色本体类、舌形本体类、舌态本体类四个子类。在舌苔本体类下建立了苔质本体类和苔色本体类两个类,如图1所示。2.2中医舌诊本体的表示方法在对舌诊本体定义时,我们采用的是NKI1214所用的本体描述语言(NKIL)11。NKIL本体语言是一种框架语言(FrameLanguage),其主要文法如下:=:=defcategory:=:|空:=:|空:=:|空:类型:值域:例子:同义词:近义词:反义词:侧面:注释文法的核心是槽和类公理的定义,槽可分四种:属性槽(简称属性)。属性为名词,属性槽又分为布尔属性槽和非布尔属性槽,布尔属性槽对应于一元谓词。关系槽(简称关系)。关系为动词。属关槽(简称属关)。属关既可为名词又可为关系的槽,如“古称”和“简称”等。方法槽(简称方法)。槽值的类型比较复杂,有简单类型和复合类型之分。简单类型包括整数、实数、分数、数量、比例数、字符串、时间等;复合类型包括整数数组、实数数组、分数数组、数量数组、比例数数组、字符串数组、时间数组等。为了反映本体之间的关系,NKIL定义了继承和实现两种类间关系以处理类的相关类。:=继承;实现|实现;继承:=,和:=,和一个类C1继承另一个类C2表示三个含义:C1可以使用C2中的词汇(即C2中的属性、关系、属关和方法);C1遵循C2中的所有公理;若P是C1中的概念,则P必然是C2中的概念。例如图2所示的中医本体体系图中,舌苔本体类继承舌诊本体类,舌诊本体类又继承中医诊断本体类,如舌色本体类继承舌诊本体类,红舌是舌色本体类中的概念,同时也必然是舌诊本体类中的概念。一个类C1实现另一个类C2表示两个含义。C1可以使用C2中的词汇(即属性和关系);C1继承C2中的所有公理。使用NKIL本体描述语言,可以对本体中的类进行描述,如图2所示。上面给出了舌诊本体的部分内容,包括了一些基本和重要的属性和关系。下面对部分属性和关系加以说明。(1)汉语拼音。给出实例对象的汉语拼音,如实例红舌的汉语拼音是“hongshe”。(2)定义。给出实例对象的含义。(3)原因。说明实例对象出现是由什么原因引起的。(4)又称。实例对象的别名,通过引入又称关系可以解决同物异名带来的不一致性。(5)主证。表示某种实例对象所体现的主要中医病证是什么,如红舌的主证是热证。(6)是实例。列出此实例都是哪些本体类的对象,如红舌是舌色本体类的实例。(7)机理。说明产生某种舌色的原理,根据中医学机理的严密推导过程的特点,我们定义了“因果链”这个槽值类型,用来表示一步一步的推导过程,如红绛舌的机理:“机理:(热盛;导致;气血运行迅速;导致;舌体脉络充盈;导致;红绛舌)”。以上只是舌色本体类的一部分属性和关系,还有其他的本体类,限于篇幅,不能一一列举所有的舌诊本体的属性和关系。2.3中医舌诊知识的表示方法中医舌诊知识表示采用NKI中知识表示的方法,即本体+框架的方法。(1)本体。一个本体(Ontology)可由实例(Instances)、类(Categories)、属性(Attributs)、关系(Relations)、类间关系(In-ter-categoriesRelations)五种元素组成。下面是用于领域知识表示的本体模型。定义1一个领域本体是一个四元组O=,其中,C是本体中的类集,每个类是由属性集合A和关系集合R组成的;23计算机应用研究2006年舌诊本体类舌质本体类舌苔本体类舌神本体类舌色本体类舌形本体类舌态本体类舌质本体类舌色本体类图1中医舌诊本体类的划分defcategory舌色本体类继承中医舌质本体类属性院汉语拼音院类型字符串属性院定义院类型字符串属性院原因院类型字符串关系院又称院类型字符串数组关系院主证院类型字符串数组关系院是实例院类型字符串数组关系院机理院类型因果链噎图2中医舌诊本体中的类定义I是本体中的实例集;RI是类集C上的关系集合,类的继承关系(IS-A)是最常见的类间关系;公理集合AX是关于类内属性、关系以及类间关系的严格约束。(2)框架。在本体中,用框架来表示类的属性和关系。在领域上层本体的指导下,对每个对象给出框架形式的知识表示。下面我们给出用框架表述的中医舌诊的实例知识:defframe黄苔:苔色本体类又称:苔黄汉语拼音:huangtai英文:yellowcoat是实例:病理苔色主证:里证和热证分布部位:舌根和舌正中沟部位和全舌机理:(热证;热邪入里化热;热邪熏灼;导致;黄苔)3中医舌诊本体中的公理在知识获取后,只有将其公理化或规则化后才能成为知识推理和分析的工具。我们用一阶逻辑来表示公理,我们定义了一些谓词来表示公理,如表1所示。我们用“X:”表示X是一个类变量,X的取值是类中的任意一个实例;用“XS”表示X的某个槽S的取值。S(X,Y)表示X的在槽S上的取值为Y。表1中医舌诊本体的公理中使用到的部分谓词谓词含义原因(A,B)A发生的原因是B可见(A,B)A在临床上可见到B的临床表现常见人群(A,B)在B人群中常见A出现概率小于(A,B)A的出现概率小于Bisa(X,Y)谓词:XisaY表2给出了关于中医舌诊本体的一些公理的例子。公理分为类间公理和类内公理。类间公理约束一个类和另一个类,以及一个类的槽和另一个类的槽;类内公理约束类中的槽以及类中槽与槽之间的关系。表2中医舌诊本体中的部分公理公理类型公理实例类间公理(1)所有X:中医舌诊,存在Y:中医病因,原因(X,Y)(2)所有X:中医证,存在Y:中医舌苔,可见(X,Y)(3)所有X:中医舌诊,存在Y:人群,常见人群(X,Y)类内公理(4)所有X:中医舌诊,定义(X,Y)isa(Y,字符串)(5)所有X:中医舌诊,主证(X,Y)isa(Y,中医证)(6)所有X:中医舌诊,出现概率小于(X原因,X主要原因)4基于公理的中医舌诊知识分析知识工程师在获取知识的过程中,由于自身的或者知识源等各种原因,会出现各种问题。在中医学本体及中医学知识库建立之后,我们的一个非常重要的任务就是对中医学知识进行分析。知识分析内容包括知识一致性分析、冗余性分析、完整性分析。一致性分析是分析知识中的“言之无理”的部分,也就是与中医学领域知识矛盾的地方,这种矛盾可能来自于文本知识源的错误、人为的疏忽、对中医学领域的理解不够深而导致的本体设计上的失误,还可能来自对某个问题域描述的缺失。如有一条知识“舌红苔黄主证是口渴”,根据“公理:所有X:中医舌诊,主证(X,Y)isa(Y,中医证)”可知,这就是一条错误的知识,因为舌红苔黄是中医舌诊本体类的实例,但是口渴是中医症状而不是中医的证,这样就造成了语义类型上的不一致。冗余性分析是指相同知识在知识库中是否重复出现,包括本体的槽重复定义、公理冗余和框架知识冗余等。由于本体库相对知识库来说,其大小相对比较小,槽的重复定义可以通过程序检查。在知识库中,70%85%的容量都是框架知识,因此要保证知识库尽可能最小,就必须使框架知识冗余达到最小。例如我们已经获取了中医脉象知识,但是在舌诊知识获取过程中,又重复出现了一些脉象知识,因此我们获取完舌诊知识后要对知识库进行冗余性检查,使NKI知识库没有冗余。知识库中的知识有时是不完整的,需要不断地对其进行完备。比如说我们在获取舌诊知识时,对于胃热证主方是白虎汤,但是并没有得到白虎汤的方药组成,这样对胃热证的知识就是不完整的,因此我们就查寻医学词典,找到了白虎汤的方药组成,并把它填充到知识库中,使其完整。这样的情况在其他知识获取过程中也是常常出现的。5基于公理的中医舌诊知识推理5.1基于类间公理的医学知识推理基于类间公理的知识推理,有时可以推出新的结论和知识。(1)类与类公理。比如我们知道李四的舌象是“重舌”,那通过“公理:所有X:中医舌诊,存在Y:人群,常见人群(X,Y)”可知李四有很大的可能是小儿,因为重舌的常见人群是小儿。如果知道李四有腑实证,那么根据“公理:所有X:中医证,存在Y:中医舌苔,可见(X,Y)”就可以推出来李四的舌象是“舌苔焦躁有芒刺”。(2)类槽与类槽间公理。这类推理是通过知道两个类的槽值,得出新的结论和新的知识。比如知道张三患咳嗽痰湿蕴肺证,李四患胆胀阳虚郁滞证,那么根据“公理:所有X:咳嗽痰湿蕴肺证,所有Y:胆胀阳虚郁滞证,相同(X苔质,Y苔质)”可以推出张三和李四的苔质是相同的。还比如根据“公理:所有X:大肠湿热证,所有Y:膀胱湿热证,相同(X苔色,Y苔色)”,如果张三患大肠湿热证,李四患膀胱湿热证,我们就能推出来他们的苔色是相同的。5.2基于类内公理的中医舌诊知识推理(1)语义类型公理。这类公理是一种语义的确定性公理。通过这类公理可以得到一个概念的语义范畴。如:defframe浮垢苔:舌苔本体类定义:苔色晦暗而垢浊,或白或黄,称浮垢苔主证:食积证和痰浊证和湿热证根据“公理:所有X:中医舌苔,主证(X,Y)isa(Y,中医证)”知道食积证、痰浊证和湿热证都是中医的证。(2)属性关系公理。这类公理反映了属性与关系之间的约束,也可用于知识推理。比如黄苔主里证和热证,次证为虚33第3期曹宇峰等:基于本体的中医舌诊知识的获取证,根据“公理:所有X:中医舌苔,出现概率大于(X主证,X次证)”可以推出出现黄苔时是里证和热证的概率是大于虚证的,这是符合临床情况的。6总结本文探讨了中医舌诊知识获取和建立舌诊本体的方法,我们已经建立了一个比较完备的中医学本体体系,中医舌诊部分是对其的完备和补充。中医学是我们的国粹,在拯救人民于疾苦的过程中扮演着重要的角色。现在我国中医领域正在积极探索促进中医信息化、现代化方法,我们也想为中医学走向世界做点工作。我们现在建立的NKI中医学知识库有着广阔的应用前景,就拿本文阐述的中医舌诊知识来说,它可以为辅助中医专家诊断、中医专家系统、中医智能教学系统等提供所需要的知识,因此,它的重要性不言而喻。但是中医知识的获取却不是一件很容易的事情,这不但要求知识工程师对中医学知识有很好的理解,同时又要求有很扎实的计算机科学知识。因此在以后的工作中,我们将不断探索中医知识获取好的方法,发现知识获取的技巧,这些工作有着十分重要的意义。参考文献:1atalyaFNoy,MarkAMusen.SMART:AutomatedSupportforOn-tologyMergingandAlignmentC.Banff,Canada:Proceedingsofthe12thWorkshoponKnowledgeAcquisition,ModelingandManage-ment,1999.2YSure,SStaab,JAngele,etal.OntoEdit:GuidingOntologyDeve-lopmentbyMethodologyandInferencingC.Lyon,France:Prestig-ious,ApplicationsofIntelligenceSystem(PAIS),2002.3陆汝钤.世纪之交的知识工程与知识科学M.北京:清华大学出版社,2001.4曹存根.面向专家的知识获取M.北京:科学出版社,1998.5曾庆田.数学概念的知识获取与分析D.北京:中国科学院计算技术研究所,2005.6CungenCao.ExtractingandSharingMedicalKnowledgeJ.JournalofComputerScience&Technology,2002,17(3).7辛瑛,郭霞珍,张莉莎.舌诊M.天津:天津科技翻译出版公司,2001.8张德海,曹存根,张宇翔.国家和城市知识获取与本体论分析C.中国人工智能学会.9唐素勤,曹存根.智能教学系统:综述与改进C.中国人工智能学会第九届全国学术年会暨中国人工智能学会成立20周年庆祝大会,2001.1129-1132.10中国大百科全书之中医卷M.北京:中国大百科全书出版社.11CaoCungen,FengQiangze,GaoYing,etal.ProgressintheDeve-lopmentofNationalKnowledgeInfrastructureJ.JournalofComputerScience&Technology,2002,17:523-534.12CungenCao.TechnologyFocusof21stCenturyN.ComputerWorld,1998(D1-D3).13CungenCao.MedicalKnowledgeAcquisitionfromtheElectronicEn-cyclopediaofChinaC.LectureNotesinComputerScience,2001.268-271.14CungenCao,etal.ProgressintheDevelopmentofNationalKnow-ledgeInfrastructureJ.JournalofComputerScience&Technology,2002,17(5):1-16.15CCao,HWang,YSui.KnowledgeModelingandAcquisitionofTra-ditionalChineseHerbalDrugsandFormulaefromTextJ.Interna-tionalJournalofArtificialIntelligenceinMedicince,2004,32:3-13.作者简介:曹宇峰,硕士研究生,主要研究方向为人工智能、知识获取、智能教学;曹存根,研究员,博士生导师,主要研究方向为人工智能、知识工程、大规模知识处理、情感计算。(上接第4页)5结束语本文作为一篇综述性文章,总结了OODB常用最新技术原理和方法,叙述了OODB两种常用实现技术,并且对OODB的发展前景作了预测。OODB作为一项崭新技术,具有前两代数据库无法比拟的优点,满足复杂数据结构和海量存储需要,在各个学科大有发展之地,最终将会成为DBS的主流。参考文献:1王春森.系统设计师(高级程序员)教程M.北京:清华大学出版社,2001.2钟珞.系统分析员重点综述与试题分析(第4版)M.北京:中国民航出版社,2003.3MBlaha,WPmmerlani,HShe.ConvertingOOModelsintoRDBMSSch

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论