




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能基础,浙江大学计算机学院高济,4.3.专家系统实例MYCIN,MYCIN概况通过提供咨询服务来帮助普通内科医生诊治细菌感染性疾病的专家系统。1972年开始研制,74年基本完成,并投入实际应用。MYCIN的取名来自多种治疗药物的公共后缀,如clindamycin、erythromycin、kanamycin等。最有影响力的专家系统,围绕着MYCIN的各种研究工作一直沿续了10年,对于推动知识工程以及专家系统学科的建立和发展具有重要影响。典型的产生式系统深度优先的逆向链推理控制策略;INTERLISP编程,运行于DECPDP-10的操作系统TENEX下。主要内容:MYCIN知识库的构造,MYCIN推理机的设计,MYCIN系统服务设施,开发工具EMYCIN。,4.3.1.知识库的构造,以前提-动作型产生式规则来表示诊断和治疗细菌感染性疾病的专家级医学知识。规则的BNF定义::=RULEPREMISE($AND+)ACTION+:=|($OR+)规则可视为前提-结论型,并能表示不确定性;前提部分中的简单条件常用:(SAME);最常用的动作:(CONCLUDETALLY);TALLY存放规则前提的实际可信度(CFCertaintyFactor);规则前提CF为1(真)的情况下,结论为真的可能程度;规则结论的实际CFTALLY与的乘积。MYCIN系统建立的初期就以上述格式表示和收集了200多条规则于知识库。规则例:,4.3.1.知识库的构造,关联三元组:对象CNTXT(上下文),区分为10类,通过关联三元组中的属性名隐含指示;属性属性名隶属于特别类型的上下文对象;值通过向用户询问获取或基于规则推导出。,4.3.2.推理机的设计,分二个阶段四个步骤诊断和治疗细菌感染性疾病诊断阶段:确定病人有无治疗细菌感染的需要,确定引起感染的细菌;治疗阶段:制定若干可能的治疗方案,从中制定最佳的综合治疗方案。整个推理过程通过称为目标规则的092号规则来启动:,4.3.2.推理机的设计1诊断的推理控制,逆向推理和深度优先的搜索策略MYCIN由医生启动;以建立病人的治疗方案(REGIMEN)为目标,激活规则092;通过逆向激活和使用规则,形成规则链,直到链末端规则的前提包含的条件都能直接由原始证据(医生提供的观测结果)证实;推理过程导致与或推理树(或称目标树)的建立简单条件有与或关系,同一子目标(条件)激活多条规则。参见图4.9通过程序MONITOR和FINDOUT的嵌套调用推进整个推理(咨询)过程。MONITOR分析相关的规则能否激活,参见图4.11,FINDOUT搜索规则激活所需的数据(属性值及其CF),参见图4.12,导致深度优先的穷尽搜索。,1诊断的推理控制,在综合数据库(MYCIN称为动态数据库)中建立关于病人的上下文树(图4.10)。MYCIN将规则按上下文对象分类:每次对于一个目标作推理时,只需考虑该目标涉及的那个上下文对象相关的规则,大幅度提高了推理的效率。2不确定推理(略)3治疗选择机制(略),4.3.3.系统服务设施1推理解释,对医生的每次咨询都建立相应于病人的与或推理树和上下文树。在推理过程中或推理结束后可以回答医生(用户)对推理过程和推理结果的各种询问。规则追踪型推理解释回答三种询问:WHY、HOW和WHYNOT。高级解释功能:基于记载于推理树中的推理链,设置了参数:复杂性和重要性,量化知识单元(规则和对象属性)的可解释性,依据用户知识水平加以裁剪的解释,为重要的且复杂性高的推理设置了封装的细化解释(超出规则本身的文字描述),以解释规则的前提和结论间的因果关联细节。,2知识库维护,知识库中包含的推理规则,尽管形式上相互独立,但语义上却相互关联,形成推理树,语义上的关联,使知识库的维护面临困难。三类问题:包含(Subsumption)问题,单一规则的不一致,多规则的不一致推理链的不一致。推理解释机制为知识库的维护提供了有力的支持。TEIRESIAS高性能编辑器,能自动发现前述的包含和单一规则不一致问题,辅助知识库维护。3教学MYCIN的知识库包含了医学专家提供的丰富经验知识;GUIDON基于MYCIN知识库的医疗教学。,4.3.4.开发工具EMYCIN,从MYCIN系统抽取出的与应用领域无关的骨架型专家系统开发工具。用于开发任何旨在提供咨询服务的专家系统,尤其适合故障诊断问题。EMYCIN继承了MYCIN的主要特点,如下:采用逆向链深度优先的控制策略;使用产生式规则表示领域知识;允许事实和规则具有不确定性(以可信度指示)。规则的BNF定义::=(IFTHENELSE):=的与或组合:=:=:=()EMYCIN开发的专家系统:PUFF、HEADMED、SACON、ONCOCIN、CLOT、DART。,4.4.问题求解的结构化组织,开发和维护KB系统的困难一直困扰着知识工程;传统的观点知识获取瓶颈:知识获取比喻为采矿,而KB系统则视为存放知识的容器,未揭示困难的本质,并在某种程度上误导了了克服困难的努力方向。建模观点:KB系统是模拟人的问题求解行为和应用领域世界的模型,按系统化、结构化和功能化的方式来分析人的问题求解行为和领域世界。以概念模型作为语义框架,指导和约束知识获取及知识库维护。建模观点需要问题求解的结构化组织。主要内容:结构化组织的需求,事务表,黑板法,问题求解建模(略),新一代KB系统技术(略)。,4.4.1结构化组织的需求,表示和组合应用领域知识的最简单策略把问题求解所用的全部知识统统表示为规则。随着要求解决的实际问题越来越复杂,规则库也越来越大;产生式系统的缺点就显示出来:(1)难以扩展。尽管规则形式上相互独立,但在问题求解中却往往彼此相关。例如MYCIN系统使用逆向规则,每一规则之前提部分的谓词公式只要不与事实匹配,就必须通过别的规则作逆向推理,以搜索支持解答的证据。显然,这些规则具有紧密的相关性。实际上,MYCIN的规则构成了推理网。随着规则数目的增加,要使新加入的规则不与原有的规则发生矛盾变得越来越困难,即随着规则库的扩展,一致性维护越加困难。(2)选择规则的低效性。由于规则是堆积在规则库里的,问题求解中的每一推理步都要对规则库作穷尽的匹配检查,以便选择合适的规则。显然规则库大时,效率就低。实际上,一个推理步只涉及若干特别的规则,可以把它们构成一个规则组。只有上一规则组用完后,才考虑下一规则组。,4.4.1结构化组织的需求,(3)不灵活的控制策略。产生式系统往往采用单一的控制策略(例如按顺序考察规则库中每一规则),而实际问题的求解常需要综合应用不同的控制技术。(4)单一的表示形式。尽管从理论上讲,产生式系统可以表示任何推理知识,但对于有结构的知识或许以语义网络和框架系统表示更为有效。克服缺点的方法将求解复杂问题的知识划分为一组相对独立的模块。模块的划分:面向动作以推理动作的选取为核心组织问题求解所需的知识:面向“怎么做”知识的组织,医疗诊断中,知识是以症状和疾病间的关联、疾病与治疗动作间的关联等方式表示和组织的;面向对象以概念和个体为单元组织问题求解所需的知识:面向“是什么”知识的组织,建立关于疾病的分类体系和疾病症状的分类体系。,4.4.2.事务表,事务表(Agenda)一张应由系统执行的事务的列表,也称任务表。面向动作的问题求解组织方式。结构化组织(图4.13):表中元素表示一个等待执行的任务,任务由特定的推理模块执行,按优先级大小排序按理由表来计算,每个任务附有一张理由表,记载由其它任务提出的支持或反对执行该任务的理由。优先级最高的任务意味着它的执行最为紧迫和最有意义。模块间通信对执行某些任务提出支持或反对理由,模块间保持着相对的独立性。,4.4.2.事务表,数论概念发现系统AM应用事务表的典型系统:任务从集合论的一些基本概念出发,发现数论新概念,发现大量数论新概念(对AM来讲):从质数到哥德巴赫猜想;基本概念和发现的新概念组织为一个概念网(图4.14);概念以框架形式表示;启发式推理规则附加于表示基本概念的框架,指导新概念的提出和完善。执行任务的推理模块不固定任务执行时动态构成系统在概念网中收集(沿着该任务拟发现的概念到顶点的路径)分散于基本概念框架中的启发式规则。通过事务表,把有关问题求解的各种信息汇集起来,使独立的模块能在推理过程中合作求解问题。设计决策复杂问题分解为子问题的精细程度:分解太细:大幅度增加事务表中排序子任务的工作量;分解太粗:不利于发挥模块化的优点;需作权衡利弊。,4.4.3.黑板法,起源:70年代,口语理解系统HEARSAY。面向动作的组织方式。结构化组织一组知识源,信息黑板。知识源(KSKnowledgeSource)独立推理模块(图4.15):触发模式以谓词公式表示:与黑板上的内容匹配时,产生一个激活记录;记载该KS的名字、触发上下文和模式中变量的约束值。直接码一段Lisp代码:参考触发上下文和模式变量的约束值加以执行,将该KS有关的调度控制信息加进激活记录。,4.4.3.黑板法,KS体规则组甚至一段任意的程序,包含求解问题所需的专门知识。KS激活时,KS体不立即执行而是置于一排序表;排序KS体一个调度程序分配和修改每个激活记录的优先级;具有最高优先级的KS体下一个要执行的,其参考激活记录中的触发上下文和模式变量的约束值,KS体一经执行,不能中断,直至结束。信息黑板所有KS可以访问的公共数据区:黑板的内容由解答空间(状态空间)中的对象构成:这些对象可以是输入数据、部分解答和最终解答。黑板的分划:记载于黑板中的对象层次地划分到不同的分析级,每一级均设计一组相应的KSs:以该级对象作为输入,计算(推理)结果加到该级或其它级。HEARSAY(图4.16)将关于口语识别的假设(可能的解答,表示为对象)分为8个等级,从关于声音的低级假设到关于整个句子文法分析的高级假设。,4.5基于本体的知识系统,基于本体的语义知识表示推动了各种基于本体的知识系统(KnowledgeSystems)的开发,去实现智能信息服务、语义网格、知识管理、协同问题求解等,极大地丰富了语义Web的建设和应用。这些知识系统不同于传统封闭型KB系统的根本区别在于:前者是开放的,往往由分布于因特网的异构成员系统静态或动态构成,须依赖基于本体的语义互操作来实现协同工作,以及信息和计算资源的共享和重用。共享本体成为开发上述知识系统的基础,导致了本体工程从传统的知识工程脱颖而出,成为独立的研究领域。本体工程的研究可以划分为2个范畴:基础级本体工程聚焦于本体开发方法和支持工具;高级本体工程研究本体的学习、映射、演化和融合,以提高本体构建和管理的自动化程度。,4.5.1基础级本体工程,本体工程(OntologicalEngineering)研究本体开发方法论,并提供本体表示语言和开发工具。可以说本体工程是知识工程的后继,但远远超出知识工程的研究范围和效用。尽管知识工程促进了专家系统的成功,但维护、共享和重用知识库中的知识面临较大的困难。知识工程自90年代初开始从传统的面向表示的研究方式转变到面向内容的方式,旨在给知识库的设计、领域世界的概念化和概念的语义约束提供基本原理,以及知识积累的理论和技术。语义Web技术的兴起,推动了本体工程从面向知识库和专家系统的知识工程脱颖而出,成为新兴的研究领域。,4.5.1基础级本体工程,聚焦于本体开发的手工方式:由本体工程师借助本体编辑器来进行本体的人工构建。可以说,目前的本体开发大多采用手工方式。手工方式构建本体的成功关键:本体工程师必须充分理解应用域的概念化模型及其演化趋势,并广泛听取专家和潜在用户的意见,以使建立的本体能够正确反映世界本质,并获得应用域的一致赞同。手工方式面临耗时费力、易于出错、且不利于本体维护和更新的困境。通过提高自动化程度,高级本体工程技术有助于克服这种困境,但目前尚没有成熟的本体自动化生成方法。,4.5.1基础级本体工程1本体构建的准则和过程,构建本体的基本准则(史忠植和王文杰):明确性和客观性一致性可扩展性最小编码偏差最小本体承诺目前尚无公认的本体设计和评价标准,以及相应的质量保障体系。应用域共享本体的构建是一个循序渐进、逐步深化的过程(史忠植和王文杰提议的8-步骤过程):1)分析构建本体的功能需求和非功能需求2)规划本体的开发任务3)获取应用域基本信息4)确定本体应包含的概念、属性和关系5)编码抽取的概念化描述时6)评价建立的本体7)本体演化8)本体展示应该指出,上述8-步骤过程只是本体构建过程的一种粗略表征。,4.5.1基础级本体工程2本体开发方法,存在一些可以参考的方法,例如:METHONTOLOGYOn-To-Knowledgemethodology米泽格奇(Mizoguchi)提议将本体开发的指导划分为三层(图4.22):顶层以粗线条方式指导本体开发过程。鉴于开发的本体也可视为一种计算机程序,本体开发过程应遵从常规的软件开发过程。中层说明本体开发的主要步骤和次序,作为约束和指导。底层给设计本体的细节提供指导。米泽格奇设计了面向中层和底层的指导。,4.5.1基础级本体工程3本体开发工具,本体开发方法必须有相应的支持工具,并选用适当的语言表示建立的本体。本体表示语言的研究已逐渐收敛到RDF、DAML+OIL、OWL系列。支持本体开发的工具和环境:OntoEdit、WebODE、Protg、Hozo它们都覆盖大范围的本体开发过程,而非单一目的工具。WebODE体系结构的示意图,WebODE体系结构,4.5.1基础级本体工程4已开发的本体及其应用,已经存在相当数量的本体开发成功并投入应用,其中最著名的是Cyc自84年开始建立,初期作为一个常识性知识库,现已发展为拥有10万个概念和一万个谓词的特大型“upper”本体,用于描述关于“自然存在”的高级范畴,包括数量、性质、关系、位置、时间等通用概念。其它著名的本体有Wordnet(美国普林斯顿大学开发的联机词汇参考系统)、Enterpriseontology(英国爱丁堡大学)、Geneontology、Processontology:PSL、UpperOntology(SUO)、DAML+OILontologylibrary该库已包含251个以DAML+OIL或OWL表示的本体。依据本体的角色和特征,可以将本体的应用大致划分为5种类型:作为公共词汇、作为信息存取的辅助、作为相互理解的媒介、作为规格说明、作为实现知识系统化的基础,OpenCyc的顶层分类体系,4.5.2高级本体工程,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论