人工智能通识教程 课件 第5章-知识表示与知识库_第1页
人工智能通识教程 课件 第5章-知识表示与知识库_第2页
人工智能通识教程 课件 第5章-知识表示与知识库_第3页
人工智能通识教程 课件 第5章-知识表示与知识库_第4页
人工智能通识教程 课件 第5章-知识表示与知识库_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章知识表示与知识库主讲教师:王元刚人工智能通识基础1目录第五章知识表示与知识库知识表示的基本概念与经典方法01知识推理与推理机制02知识库的构建与管理03知识图谱与大规模知识库042目录知识表示的基本概念与经典方法0131.1什么是知识表示?41.1什么是知识表示?1.1.1知识表示的目标把人类知识“翻译”成计算机能理解的语言,进而支撑机器的智能行为。51.1什么是知识表示?1.1.2

知识表示示例如果天气下雨,就应该带伞。人类常识中的一种“条件——行动”类知识。如何让计算机理解并应用这个知识?IF天气=下雨THEN行为=带伞知识表示既是对事实的描述,也是一种支持推理和决策的结构化表达方式。61.2知识表示的作用71.2知识表示的作用1.2.1支持知识的存储与组织知识表示可以将结构化或非结构化的信息,转化为计算机可以理解和操作的内部形式,从而实现对知识的有效存储和组织。医学智能系统规则病历数据概念图谱医生的诊疗经验结构化表达可查询可扩展可更新便于系统长期积累和迭代升级81.2知识表示的作用1.2.2辅助智能推理与决策通过将知识表示为逻辑规则、语义网络或其他可推理结构,系统便可以依据已有知识进行逻辑推理、归纳总结或行为判断。提问:为什么我的账户被锁定?用户智能客服识别:安全类问题自动:推送重置密码91.2知识表示的作用1.2.3实现人与机器之间的知识交流知识表示可以作为人机交互的“中介”,帮助系统将内部复杂的知识结构,通过自然语言、图表、对话等形式直观地呈现给用户。101.2知识表示的作用1.2.4支撑人工智能应用的发展知识表示的质量在很大程度上决定了人工智能应用的“智力水平”和“可扩展性”。搜索引擎智能问答系统推荐系统自动驾驶知识表示为人工智能的推理、学习、交互和决策提供了坚实基础,是推动智能系统持续进化的关键引擎。111.3经典知识表示方法121.3经典知识表示方法1.3.1逻辑表示逻辑表示是一种形式化程度很高的知识表达方式,采用逻辑符号和推理规则,精确描述事物之间的因果关系和条件关系。命题逻辑谓词逻辑命题逻辑处理的是简单命题之间的逻辑关系。谓词逻辑引入了变量、函数和量词,可描述更复杂的知识关系。如果A为真,则B也为真。A

B∀x(学生(x)

爱学习(x))所有学生都爱学习。131.3经典知识表示方法1.3.2语义网络语义网络以图的形式组织知识,节点表示概念,边表示它们之间的语义关系,是一种直观而形象的知识表示方法。猫是一种宠物狗是一种宠物猫有尾巴狗有尾巴鱼有尾巴鱼生活在水中141.3经典知识表示方法1.3.3框架表示框架表示是一种用于描述事物及其属性信息的结构化方法。每个“框架”表示一个概念或实体,由多个“槽”组成,槽中包含与该概念相关的信息。槽(Slot)值(Value)姓名张三学号20230101专业人工智能GPA3.8框架名:学生结构化特性便于复杂实体建模、知识的继承与重用,适合处理稳定、结构清晰的领域知识。对动态变化的过程性知识和复杂逻辑条件的表达不够灵活,推理能力有限。151.3经典知识表示方法1.3.4产生式规则产生式规则采用“条件-动作”(IF-THEN)的结构,表达了知识中的条件与结论之间的因果联系,模拟人类在决策过程中的推理行为。IF

症状是咳嗽AND有发烧THEN

疑似感冒161.3经典知识表示方法1.3.5本体本体是一种更加系统化、标准化的知识表示方法,用于定义一个领域中的基本概念及其关系,强调语义的一致性和可共享性,它包括概念、实例、属性以及概念之间的关系。症状|—咳嗽|—流涕|—发热治疗|—药物治疗||—解热阵痛药

|||—布洛芬||—中成药

||—莲花清瘟|—非药物治疗|—休息疾病|—上呼吸道感染|—感冒【疾病-症状-治疗】的语义关联感冒具有“咳嗽”症状咳嗽是感冒的症状之一感冒采用“连花清瘟”治疗布洛芬针对“发热”症状休息作用于“感冒”疾病17目录知识推理与推理机制02182.1逻辑推理与演绎推理192.1逻辑推理与演绎推理2.1.1逻辑推理逻辑推理是基于形式逻辑系统进行的推理操作,它以明确的规则和符号系统为基础,对知识进行系统性演算。情景小明要么完成作业,要么不能出去玩;如果他完成作业并且天气好,他就会出去玩。命题表示

202.1逻辑推理与演绎推理2.1.2演绎推理演绎推理是逻辑推理的一种具体形式,它是从一般性的知识出发,推出特定个别情境下的结论。想法观察结论所有人都会死。苏格拉底是人。苏格拉底会死。212.2归纳推理与类比推理222.2归纳推理与类比推理2.2.1归纳推理归纳推理是一种“由个别到一般”的思维方式,它通过观察大量具体实例,从中归纳出普遍性规律。分析观察结论小明是人,小明喜欢吃苹果。小红是人,小红也喜欢吃苹果。人一般都喜欢吃苹果。232.2归纳推理与类比推理2.2.2类比推理类比推理是一种基于相似性的推理方式,它认为如果两个事物在某些方面相似,那么它们在其他方面也可能相似。源领域目标领域发现相似点得出结论鸟是一种会飞的动物。飞机是否能飞呢?鸟有翅膀,飞机也有“翅膀”。既然鸟能飞,飞机也可能能飞。242.3规则推理252.3规则推理2.3.1正向推理规则推理是一种基于“条件-动作”(IF-THEN)型规则进行的推理方式,是人工智能系统中最早被广泛应用的一种形式化推理方法。正向推理是一种由事实出发逐步推出结论的推理方式。它适用于系统掌握初始条件,但不确定最终目标的场景。

262.3规则推理2.3.2反向推理反向推理是一种从目标出发反推是否成立的推理方式。它适用于问题导向型场景,即“我们想验证某个结论是否成立”,而不是从头开始枚举所有可能性。问题:地面是否湿滑?系统检查:是否存在规则表明“地面湿滑

天气下雨”?若该规则存在

系统继续反查当前事实是否为“天气下雨”若成立

推理完成;否则继续查找其他路径。27目录知识库的构建与管理03283.1什么是知识库?293.1什么是知识库?3.1.1知识库的概念知识库是指一个系统化地存储、组织和管理知识的集合体,其中包含了人工智能系统所需的各种信息和规则,用于支持智能行为的实现。事实:水的沸点是100℃。规则:如果发烧且咳嗽,则可能是感冒。概念:动物、疾病。关系:猫是动物的一种。推理机制、查询接口、解释模块具备“理解世界”的能力用知识思考和行动303.1什么是知识库?3.1.2知识库的作用知识库是人工智能从符号主义到深度学习、再到神经符号融合过程中的贯穿性支柱,既是知识显式表达的基础,也是促进模型解释、推理与可信性的关键支撑。早期专家系统的核心知识表达推理的基础AI中的知识补充机制大模型的对齐支柱知识库存储了专家经验、规则和事实。与推理机结合,实现了模拟专家决策的功能。知识库推动了逻辑表示和推理方法的发展。形成了AI早期的“符号主义”范式。提供结构化语义信息帮助模型理解概念关系减少训练样本依赖作为权威与可校验的知识来源校正大模型生成的虚假信息引导模型的回答符合事实和伦理313.2知识获取与存储方式323.2知识获取与存储方式3.2.1知识获取方式(1)人工输入:最传统的知识获取方式优势局限性知识权威性、准确性高知识构建成本高适合医学、法律、航天等高精度领域获取速度慢、难以自动扩展和实时更新明确可控的知识来源不适合大规模、动态知识体系的构建与维护人工输入是最早期的知识获取方式,依赖领域专家将经验性知识转化为可表示的规则或事实,手动录入知识库。专家访谈知识抽取规则转化存知识库333.2知识获取与存储方式3.2.1知识获取方式(2)自动抽取:面向非结构化数据的智能知识获取借助自然语言处理、信息抽取等技术,可自动从非结构化或半结构化数据中获取知识。数据来源示例:网页、论文、新闻、社交媒体、百科等。构建结果:大规模知识图谱。优势挑战离散、自动化、可扩展存在语义歧义、命名不一致等问题适合开放领域知识图谱构建易出现错误传播,需要人工检验或后处理新闻实体识别知识片段图谱节点343.2知识获取与存储方式3.2.1知识获取方式(3)交互式学习通过系统与用户的实时交互过程,不断积累新的知识。典型应用场景:智能客服、推荐系统、大预言模型优势挑战实时性强、贴近用户需求系统需具备强学习能力和响应机制可持续演化,动态更新知识库对质量控制与反馈机制提出更高要求用户提问系统回答系统更新知识新内容反馈给用户353.2知识获取与存储方式3.2.2知识的存储方式(1)结构化数据库结构化数据库采用传统的表格形式来存储数据,适合表达明确的实体属性、规则条件等。规则ID条件动作1条件1动作12条件2动作2知识片段规则列表存入优势局限性结构清晰,适合规则与属性类知识难以表示复杂网络结构、非结构化或高维知识SQL成熟,支持事务管理与一致性控制363.2知识获取与存储方式3.2.2知识的存储方式(2)图数据库图数据库是专为存储网络结构化知识而设计的一种数据库,支持实体(节点)与关系(边)之间的图状连接。图数据库以其灵活的结构、强大的关联查询能力和可视化支持,成为现代语义网络、智能搜索和社交推荐系统中不可或缺的组件。373.2知识获取与存储方式3.2.2知识的存储方式(3)RDF三元组RDF(ResourceDescriptionFramework)三元组是知识表示中的一种标准形式,采用“主语-谓语-宾语”来描述事实。RDF存储是语义网和本体建模的核心,适合大规模语义数据的表达与交换,支持知识的标准化、共享和推理。383.3知识库的组织与检索方法393.3知识库的组织与检索方法3.3.1知识的组织方式(1)层次结构层次结构是最基础也是最直观的知识组织方式,类似于“树形结构”或“目录结构”。知识在这种结构中呈现出上位类与下位类、总类与子类的关系。动物界

|—脊索动物门

|—脊椎动物亚门

|—哺乳纲

|—食肉目

|—犬科

|—犬属

|—狼种

403.3知识库的组织与检索方法3.3.1知识的组织方式(2)语义网络语义网络使用图结构表示概念之间的多种语义关系,如“是……的种类”、“属于……”、“具有……特征”等。每个节点表示一个概念,边表示它们之间的关系。语义网络能够表达复杂的概念关联性,特别适合支持多跳查询与语义推理。构建知识图谱和自然语言理解系统的基础形式。413.3知识库的组织与检索方法3.3.1知识的组织方式(3)本体结构本体结构是一种更为标准化、语义层级更丰富的组织方式,它不仅定义概念及其属性,还明确规范了它们之间的各种语义关系与逻辑约束,具备共享性、可复用性和可推理性。使用本体建模,可以实现不同系统之间的知识共享,广泛应用于语义网、医学知识系统、行业知识平台等场景。/obo/flu/dev/flu.owlInfluenzaOntology423.3知识库的组织与检索方法3.3.2知识的检索方法(1)关键词匹配关键词匹配是最基础的检索方式,用户输入关键词,系统在知识库中查找包含这些词的内容并返回结果。示例:用户输入“感冒”,系统返回所有包含该词的定义、规则或案例。局限性:无法理解上下文语义易出现“词相同但含义不同”难以处理“词不同但意义接近”433.3知识库的组织与检索方法3.3.2知识的检索方法(2)语义匹配语义匹配相比关键词匹配则更进一步,强调理解用户的查询意图,并在知识库中寻找语义相关的内容,而非仅匹配字面文字。技术支持:自然语言处理、同义词识别、上下文分析优势:具备理解力更贴近人类语言表达是现代AI问答与语义搜索的基础443.3知识库的组织与检索方法3.3.2知识的检索方法(3)推理式查询推理式查询不仅依赖已有知识内容,还基于知识之间的规则和逻辑关系,推导出用户未直接查询但逻辑上可得出的知识。优势:这种查询方式不仅能返回已有信息,还能通过逻辑推理得到“隐藏知识”应用场景:专家系统诊断系统决策系统453.4知识库的维护与更新463.4知识库的维护与更新3.4.1常见的维护任务(1)新增知识随着数据积累或业务发展,需要不断引入新的知识条目、规则或实体。(2)纠错与修正在知识获取过程中不可避免地会出现录入错误、信息过时或语义歧义。维护工作需定期对知识库内容进行清洗,剔除冗余、过时、冲突项,并对错误信息进行更正。473.4知识库的维护与更新3.4.1常见的维护任务(3)知识演化管理知识不是一成不变的,例如同一个概念在不同版本或背景下可能含义不同。系统应具备知识版本管理功能,能够实现“可回溯、可审计”。(4)一致性检测知识库中的知识条目和规则之间可能存在矛盾、重复或逻辑冲突。必须通过一致性校验机制及时发现和处理,保障系统推理的稳定性与准确性。483.4知识库的维护与更新3.4.2现代知识库的智能更新机制(1)自动学习与增量更新通过机器学习模型,实时分析用户行为、日志数据、新文档内容等,自动提取有价值的知识,完成知识的自动补充或修正。(2)人机协同标注机制自动学习提取的内容往往需要人工复审确认,通过“人机协同”的方式建立半自动知识维护流程。(3)变化监测与知识演化识别利用图神经网络、时序建模等技术,可以识别知识图谱中的结构变化与节点演化,实现知识动态演进的建模与控制。(4)推理引擎反馈机制若频繁遇到“无法决策”或“冲突判断”的情况,通过反馈机制将这些“知识盲点”标记出来,提示进行知识补充或调整。493.4知识库的维护与更新3.4.3应用实例搜索引擎知识系统医疗知识库知识库的维护与更新不仅是技术问题,更是保障人工智能系统长期稳定运行、持续发挥价值的关键任务。50目录知识图谱与大规模知识库04514.1什么是知识图谱?524.1什么是知识图谱?4.1.1知识图谱的基本概念知识图谱通过将现实世界中的各类实体及其之间的关系,以图结构的形式系统地组织起来,构建出一个具备语义理解能力的知识网络。知识图谱的提出,旨在让计算机不只是“识别词语”,而是真正“理解事物”及其相互之间的逻辑关系。三元组是知识图谱的最小语义单元,多个三元组连接形成一个庞大且复杂的有向图结构,知识图谱就像一张现实世界的“概念地图”。534.1什么是知识图谱?4.1.2知识图谱的显著特征知识图谱基于图模型构建,结构非常清晰,概念之间的连接方式比较直观,适合可视化展示,也便于用户理解和系统检索。通过引入本体,知识图谱为每个实体、关系提供统一的语义定义,避免歧义,有利于系统对复杂概念进行标准化建模。知识图谱不仅可以进行直接查询,还可以通过逻辑推理挖掘“隐含知识”。知识图谱具有天然的开放性和可拓展性,能够整合来自不同来源的结构化或非结构化数据,支持构建大规模知识体系。544.2知识图谱的构建方法554.2知识图谱的构建方法564.3典型的大规模知识库574.3典型的大规模知识库4.3.1GoogleKnowledgeGraph谷歌在2012年正式推出的一个结构化语义知识库系统,旨在帮助其搜索引擎更好地“理解世界上事物之间的关系”,而不仅仅是匹配关键词。用户搜索“泰坦尼克号”,系统不仅匹配文本,还展示:是一艘船、是一部电影、1912年沉没、导演詹姆斯·卡梅隆、主演等。GoogleKnowledgeGraphSearchAPI584.3典型的大规模知识库4.3.2WikidataWikidata是由维基媒体基金会在2012年推出的一个自由、开放、协作的知识图谱项目,旨在为维基百科及其姊妹项目提供统一、结构化的数据支持,它是一个“人类可读+机器可读”的多语言知识库。Wikidata采用结构化的三元组存储模式,涵盖实体、属性和关系,内容每天都由全球志愿者不断更新与校对。594.3典型的大规模知识库4.3.3DBpediaDBpedia是一个从Wikipedia中自动抽取结构化信息,构建而成的开放知识图谱,项目始于2007年,由德国莱比锡大学和柏林自由大学等联合推动,旨在让机器“理解维基百科”,将自然语言内容转化为RDF格式的三元组。DBpedia的特点是对实体关系进行了统一命名和标准化建模,可与其他知识源互联互通,是LinkedOpenData运动的核心支柱。604.3典型的大规模知识库4.3.4YAGOYAGO是一个由德国马克斯·普朗克学会信息科学研究所于2007年发起的高质量本体化知识图谱,旨在为语义网络和人工智能系统提供结构清晰、语义一致的事实知识库。YAGO融合了Wikipedia的丰富实体信息、WordNet的严格本体分类体系,以及

GeoNames的地理知识,通过自动抽取与逻辑对齐,构建出包含数千万个实体与上亿条语义关系的图谱结构。每条三元组都附带语义类型、置信度及来源标注,确保知识的可靠性与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论