人工智能通识导论(慕课版)课件 第3章 人工智能的研究_第1页
人工智能通识导论(慕课版)课件 第3章 人工智能的研究_第2页
人工智能通识导论(慕课版)课件 第3章 人工智能的研究_第3页
人工智能通识导论(慕课版)课件 第3章 人工智能的研究_第4页
人工智能通识导论(慕课版)课件 第3章 人工智能的研究_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ArtificialIntelligence人工智能的研究领域第3章人工智能通识导论编者:×××3.1典型研究领域3.2前沿研究领域课堂实践3.33.1.1知识图谱知识图谱是一种将相互连接的实体及其关系等以图形化的形式表示出来的语义知识库,用于描述物理世界中的概念及其相互关系。它将知识以结构化的方式表示出来,使机器可以更好地理解和处理人类语言。1.知识图谱的定义图3-1 家庭成员知识图谱3.1.1知识图谱2.知识图谱的组成实体是知识图谱中的基本节点,代表着现实世界中的具体对象或抽象概念,如人、地点、组织、事件等。实体是知识图谱中最基本的单元。人工智能模型可以利用实体之间的关系和属性来理解复杂的语义信息,从而提高理解的准确性。实体关系描述了实体之间的各种相互作用和联系,它用于连接不同实体,表示它们之间的联系。关系的识别和分类有利于理解实体之间的相互联系,关系的精确识别和表达不仅丰富了知识图谱的语义层次,还为高级数据分析和人工智能应用提供了必要的结构化信息。关系属性是对实体的描述和补充,它提供了关于实体的详细信息,通常用来描述实体在某一方面的固有特性或状态。属性的准确识别和整合有利于丰富知识图谱的内容。在数据分析方面,属性分析能够帮助数据分析师深入地了解数据特征,从而进行有效的数据处理和分析;在人工智能应用中,属性的利用可以极大地提高模型的性能。属性3.1.1知识图谱3.知识图谱的构建数据收集数据清洗实体抽取关系抽取知识推理与验证知识融合数据建模属性抽取3.1.1知识图谱4.知识图谱的应用搜索引擎Part01在搜索引擎中,知识图谱能够优化搜索结果的相关性。通过构建大规模的知识图谱,搜索引擎可以更好地理解用户的查询意图。知识图谱还可以丰富搜索结果的展示。除了常规的文字链接,搜索结果还可以以知识卡片的形式展示实体的详细信息,包括图片、简介、相关实体等。智能客服Part02对于智能客服而言,通过构建包含常见问题、产品信息、服务流程等信息的知识图谱,智能客服就能够快速识别用户咨询的问题类型。智能医疗Part03在智能医疗领域,知识图谱可以整合海量的医学知识,包括常见问题、饮食建议、主要症状、并发症、药品等。通过对这些知识的结构化表示和关联分析,医生可以更快地获取准确的诊断信息。3.1.2专家系统专家系统是一种模拟人类专家知识和推理能力的计算机程序,它采用知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题,在领域常规问题上可达到与领域专家同等解决问题能力的水平,因此能辅助人类专家工作。1.专家系统的定义与发展以高度专业化、求解专门问题的能力强为特点,但在体系结构的完整性、可移植性,系统的透明性和灵活性等方面存在缺陷,求解通用问题的能力弱第一代专家系统第二代专家系统属于单学科专业型、应用型系统,其体系结构较完整,可移植性方面也有所改善,而且在系统的人机接口、解释机制,知识获取技术、不确定推理技术,知识表示和推理方法的启发性、通用性等方面都有所改进第三代专家系统属于多学科综合型系统,采用多种人工智能语言,综合采用各种知识表示方法和多种推理机制及控制策略,并开始运用各种知识工程语言、骨架系统及专家系统开发工具和环境来研制大型综合专家系统3.1.2专家系统专家系统通常由人机界面、知识获取程序、知识库、推理机、综合数据库、解释器等模块构成,如图3-4所示。2.专家系统的结构图3-4 专家系统的组成3.1.2专家系统人机界面是用户与专家系统进行交互的桥梁,它主要由显示设备、输入设备等部件组成。人机界面问题输入与查询用户通过人机界面输入问题或查询,专家系统则根据输入的信息进行推理和计算,最终给出答案或建议结果展示与解释专家系统通过人机界面向用户展示推理结果,并提供详细的解释和说明,以帮助用户理解结果背后的逻辑和依据用户交互与反馈人机界面允许用户与系统进行交互,如修改输入信息、选择推理路径等。3.1.2专家系统知识获取程序知识获取程序接着识别与选择知识源,识别潜在的知识源,如领域专家、文献、数据库等,并根据需求分析结果选择最可靠、最相关且易于获取的知识源首先分析知识需求,明确专家系统需要解决的具体问题和领域范围,以及确定所需知识的类型、范围和深度之后进行知识表示与转换,即将抽取和整理后的知识转换为专家系统可以理解和利用的形式最后将转换后的知识存储到专家系统的知识库中,并建立有效的知识管理机制,以便知识更新、维护和保护然后抽取与整理知识,即从选定的知识源中抽取知识,并对抽取的知识进行整理、分类和归纳,以确保其准确性、一致性和完整性3.1.2专家系统知识库知识库是存储和组织专家系统所需知识的核心组件,它包含领域专家的知识和规则,用于解决特定领域的问题,能够提供准确、全面且结构化的知识支持,以供专家系统推理和决策。规则关系概念事实3.1.2专家系统推理机推理机是专家系统的“大脑”,它执行推理过程,根据已知的事实和规则推导出解决问题的方法。推理机主要由推理引擎和控制策略两部分组成。推理引擎负责执行具体的推理操作,如逻辑推理、模式匹配等;而控制策略则指导推理引擎高效地利用知识库中的知识和规则进行推理。正向推理(前向推理)双向推理反向推理(逆向推理)3.1.2专家系统综合数据库综合数据库也称动态数据库或“黑板”,是专家系统在执行推理过程中用于存放所需要和产生的各种信息的工作存储器。它存储了问题的初始状态描述、中间结果、求解过程的记录以及用户对专家系统提问的回答等信息。用户对系统提问的回答:用户与系统交互过程中提供的额外信息或回答。求解过程的记录:推理过程中执行的操作和步骤的记录中间结果:推理过程中产生的中间结论和状态信息问题的初始状态描述:用户输入的问题及其相关背景信息3.1.2专家系统解释器解释器在专家系统中负责解释推理过程和结果,它的主要功能是向用户清晰地阐述系统是如何根据输入的问题和知识库中的知识进行推理,并最终得出结论的。通过解释器,用户可以更好地理解专家系统的决策过程,提高专家系统的透明度和可信度。具体应用时,解释器首先将从综合数据库中接收推理机输出的推理结果,对推理过程进行分析,提取出关键的推理步骤和依据的知识规则。基于分析的结果,解释器生成易于理解的解释文本,将生成的解释文本通过人机界面展示给用户,向用户阐述系统是如何根据输入的问题和已有的知识进行推理的,帮助用户理解系统的决策过程。3.1.2专家系统3.专家系统的分类按知识表示技术分类基于框架的专家系统基于语义网络的专家系统基于规则的专家系统基于逻辑的专家系统3.1.2专家系统按体系结构分类集中式专家系统其知识和控制机制都集中在一个系统或模块中,系统结构简单,易于实现和维护01分布式专家系统其由多个物理上独立的专家系统节点通过网络连接而成,共同协作以解决复杂问题02神经网络专家系统其利用神经网络模拟人类专家思维过程,进行知识表示、推理和决策033.1.2专家系统按应用领域分类医疗诊断和咨询专家系统工业专家系统法律专家系统其他领域专家系统气象预报专家系统农业专家系统教育专家系统3.1.3自然语言处理自然语言是指人类在日常生活中使用的语言,自然语言处理则是指利用计算机技术对自然语言进行自动处理,包括对自然语言进行理解、分析、生成和评估等。1.自然语言处理的定义及特点依赖性多模态性智能性复杂性动态性交互性3.1.3自然语言处理文本预处理是自然语言处理的首要环节,也是后续分析和处理的基础。2.自然语言处理的基本步骤文本预处理01分词02去除停用词03词干提取与词形还原04词性标注05句法分析3.1.3自然语言处理特征提取是自然语言处理中的重要步骤之一,它的目的在于从预处理后的文本中提取出有意义的特征,以便后续操作。特征提取01词袋模型02TF-IDF03Word2Vec05BERT及其变体04GloVe3.1.3自然语言处理在完成文本预处理和特征提取之后,接下来就是将这些特征输入机器学习或深度学习模型中进行训练与评估,使模型能够学习到数据中的模式,从而在新数据上做出准确的预测。模型训练与评估数据集划分模型训练模型调参与优化模型集成算法选择模型评估模型正则化3.1.3自然语言处理3.自然语言处理的应用信息检索是用户根据需要,借助检索工具,查询和获取信息的方法和手段信息检索机器翻译基于自然语言处理技术分析语句并理解语境,捕捉语句间的细微差异,从而提升翻译的准确性。机器翻译自动摘要是一项高效的信息处理技术,它能够自动从冗长的文本数据中提取出核心要点,生成简洁明了的摘要内容自动摘要情感分析作为一种强大的数据分析工具,在市场调研、品牌监控以及用户调研和分析中都有应用。情感分析问答系统是一种智能化的信息交互工具,它通过分析用户的问题,能够自动、准确地回答用户的各种疑问,常用于智能客服、医疗诊断辅助等问答系统3.1.4计算机视觉计算机视觉是使用计算机及相关设备对生物视觉进行模拟的一种技术,该技术能够通过处理采集的图片或视频来实现对相应场景的多维理解。1.计算机视觉的定义二维计算机视觉二维计算机视觉专注于从二维图像中提取信息,如边缘检测、形状分析、纹理识别等,这种技术适用于静态图像或视频帧的处理01三维计算机视觉三维计算机视觉处理三维空间中的数据,涉及立体视觉、深度感知、三维重建等,这种技术在机器人导航、自动驾驶等领域有所应用023.1.4计算机视觉2.计算机视觉的基本任务图像分类图像分类任务解决的是“是什么”的问题,即判断给定的一张图片或一段视频中包含哪些类别的目标,然后通过提取和分析图像的特征,将图像分配到特定的类别。目标定位目标定位需要通过在图像上绘制边界框来实现,边界框标识对象在图像中的位置和大小。目标检测目标检测任务综合了图像分类和目标定位两个任务中的内容,既要识别图像中的对象,又要确定它们的位置,且一般需要检测多个对象,并分别标注每个对象的位置及类别图像分割图像分割任务可以简单理解为目标检测任务的进一步细化操作3.1.4计算机视觉计算机视觉作为人工智能的一个重要研究领域,已经渗透到人们生活的方方面面,其应用也比较广泛。3.计算机视觉的应用自动驾驶医学影像分析无人机应用智能拍照与图像处理人脸识别安防监控增强现实(AugmentedReality,AR)和虚拟现实(VirtualReality,VR)3.1.5智能语音在技术层面,智能语音一般是指利用机器学习、深度学习等算法,对人类的语音信号进行识别、理解和处理,并将处理结果以语音形式反馈给用户的技术。以人机语音交互为例,常见的智能语音处理流程为:1.智能语音的定义机器接收到用户语音后,通过语音识别技术将语音自动转换为文本,并且可保留原有语音中有关语速、音量、停顿等特征信息。接着通过自然语言理解技术理解和分析识别出的文本,并通过自然语言生成技术智能决策后续动作,同时将决策后的动作生成为回复给用户的文本。最后,机器通过语音合成技术将回复给用户的文本转换为语音播放,至此便完成一次简单的人机语音交互。3.1.5智能语音智能语音的实现依赖许多技术的支撑,其中较为关键的技术主要包括以下6种。2.智能语音的关键技术语音合成噪声抑制与回声消除声纹识别语音识别自然语言理解自然语言生成3.1.5智能语音智能语音作为连接人类语言和智能应用的重要技术,以其卓越的语音识别、自然语言理解、自然语言生成和语音合成能力,极大地提升了人机交互的便捷性与自然度。3.智能语音的应用01车载语音02智能家居03智慧医疗04智慧教育05智能安防3.1典型研究领域3.2前沿研究领域课堂实践3.33.2.1 大语言模型与多模态融合大语言模型是指使用大量文本数据训练的深度学习算法的相关模型,这些模型可以生成自然语言文本或理解语言文本的含义。它们通过大规模的无监督训练学习自然语言的模式和结构,在一定程度上模拟人类的语言认知和生成过程。大语言模型的核心原理是基于神经网络结构,特别是Transformer架构。这种架构允许大语言模型在处理一个单词时考虑整个文本序列中的其他单词,从而更好地理解上下文含义。大语言模型的基本原理可以形象地比喻为一个小孩子学习语言的过程。1.大语言模型3.2.1 大语言模型与多模态融合2.多模态融合数据预处理决策制定融合策略选择特征提取不同模态的数据往往具有不同的格式、分辨率、采样率以及噪声特性,直接进行融合可能会导致数据混淆或处理效率低下识别并提取出能够代表数据本质信息的特征向量,这些特征应具有较高的区分度,能够准确反映数据间的内在联系与差异。融合策略作为多模态融合的核心,其选择直接决定了数据的整合方式与效率。常见的融合策略包括早期融合、晚期融合和混合融合。基于融合后的多模态数据,决策制定成为实现最终目标的关键3.2.2 智能机器人与具身智能机器人智能机器人是机器人的高级形态,它通过人工智能实现从“自动化”到“智能化”的跨越,二者的关系类似于“手机”与“智能手机”的关系,后者的智能化更显著。1.智能机器人图3-11 家庭扫地机器人3.2.2 智能机器人与具身智能机器人智能机器人的感知能力是其与外界环境互动的起点。这一要素依赖于各种先进的传感器,它们如同智能机器人的眼睛、耳朵和皮肤,能够捕捉外部环境的信息。感知传感器视觉传感器听觉传感器触觉传感器其他传感器3.2.2 智能机器人与具身智能机器人智能机器人的思维体现了其决策和推理能力。在这一过程中,智能机器人会利用强大的计算资源和智能算法处理和分析感知到的信息,进而做出合理的判断和决策。思维数据处理231决策制定学习能力3.2.2 智能机器人与具身智能机器人行为是智能机器人对外界环境做出响应的最终体现。通过行为,智能机器人可以根据感知和思维的结果,执行具体的任务和操作。行为运动控制01操作物体02互动交流033.2.2 智能机器人与具身智能机器人具身智能是指智能体通过身体与环境的互动产生的智能行为,强调智能体的认知和行动与其在物理世界中的行动是紧密相连的。具身智能机器人则是基于物理实体进行感知和执行的人工智能系统,它通常以人形机器人为载体,结合人工智能技术,以适应不同环境,理解问题、获取信息、做出决策并实现行动。2.具身智能机器人图3-13 正在装配汽车的具身智能机器人3.2.2 智能机器人与具身智能机器人具身智能机器人的核心是智能体具备与环境交互的感知能力,以及基于感知结果进行自主规划、决策、行动、执行等一系列行为的能力。动态适应情境依赖物理交互“感知—行动”循环3.2.3元宇宙与数字人元宇宙是一个集合了虚拟现实、增强现实、3D(3Dimensions,三维)图形、人工智能、云计算等技术的虚拟世界,旨在为用户提供沉浸式的体验,使用户可以在其中进行社交、娱乐、工作等活动。元宇宙的运行基于“4个产生”形成的大回路1.元宇宙01数字孪生02数字原生03物理孪生04物理原生3.2.3元宇宙与数字人数字人,也称为虚拟人、数字替身或AI数字分身,是指通过计算机技术构建的具有人类外观、语言能力和交互能力的虚拟角色,是一种基于计算机图形学,语音识别、自然语言处理等人工智能技术创建的二维图像或三维模型,也可以是全息投影技术呈现的立体形象,如图3-14所示。2.数字人图3-14 三维模型数字人3.2.3元宇宙与数字人数字人一般可分为两类:功能型数字人:这类数字人专注于特定任务,强调实用性,如客服数字人、导览数字人等形象型数字人:这类数字人注重拟真外观与情感表达,如虚拟偶像、虚拟主播等3.2.3元宇宙与数字人环节关键技术说明建模3D建模通过3D扫描、手工建模或参数化建模生成人体模型高精度扫描使用激光扫描、多视角摄像头捕捉真实人体数据深度学习生成利用生成对抗网络、神经辐射场等生成高保真模型动态细节模拟使用深度学习、计算机视觉等算法和技术对面部微表情、肌肉运动、

头发、衣物等进行物理仿真驱动动作捕捉驱动通过光学/惯性动捕设备将真人动作映射到数字人语音驱动利用语音信号生成口型、表情人工智能算法驱动基于深度学习算法相关的模型自动生成动作与表情交互自然语言处理依赖大语言模型实现对话能力语音合成生成拟人化语音情感计算通过语音、文本识别用户情绪,调整数字人的情感反馈多模态融合整合视觉、语音、文本信号,实现上下文感知3.2.4人工智能驱动科学人工智能驱动科学(ArtificialIntelligenceforScience)是指利用人工智能技术来推动科学研究的创新和突破。1.人工智能驱动科学的价值人工智能驱动科学的强大数据处理与分析能力,为科学研究带来强大助力。它可以快速筛选海量数据,挖掘隐藏信息与规律,助力科学家在复杂问题的求解上突破传统限制,无论是药物研发中对海量分子结构的筛选,还是气候预测里对众多气象因素的精准建模,都能通过人工智能驱动科学来大幅缩短研究周期、降低人力成本。3.2.4人工智能驱动科学数据驱动发现是一种基于大量数据的分析和挖掘来发现新知识、新规律和新模式的方法。它不依赖于预先设定的假设或理论,而是直接从数据中寻找潜在的信息和关系。2.人工智能驱动科学的发展方向数据驱动发现符号回归符号回归是一种通过遗传算法或神经网络从数据中挖掘物理方程的技术。它能够在没有明确物理模型的情况下,从大量数据中自动发现和提炼出隐藏的物理规律和方程01知识图谱构建知识图谱构建是通过整合文献数据,构建领域知识网络的过程。这种技术能够将分散在大量文献中的知识点整合起来,形成一张庞大的知识网络,为研究者提供全面的领域知识和研究线索023.2.4人工智能驱动科学物理约束人工智能是将物理定律、原理和约束条件融入人工智能大模型中,使人工智能大模型在学习和决策过程中遵循物理规律,从而提高人工智能大模型的准确性和可靠性。物理约束人工智能物理信息神经网络物理信息神经网络(Physics-InformedNeuralNetwork,PINN)是一种将偏微分方程的物理方程和边界条件嵌入网络的损失函数中的神经网络技术。它能够在训练过程中考虑物理定律的约束,使得人工智能大模型在预测时能够自然满足这些物理定律。01等变神经网络等变神经网络(EquivariantNeuralNetwork)是一种保持物理对称性的神经网络技术。它能够在输入发生旋转、平移等变换时保持输出的不变性,从而提高分子动力学模拟等需要保持物理对称性的应用场景的精度023.2.4人工智能驱动科学生成是指利用人工智能大模型创造出新的数据、内容或解决方案;优化则是在生成的基础上,通过一定的策略和方法,对生成的结果进行改进和完善,以达到更好的效果。生成与优化强化学习强化学习通过智能体与环境交互来优化实验策略。智能体根据环境的反馈信号来调整自己的行为策略,以最大化累积奖励扩散模型扩散模型是一种能够生成符合物理规律的分子构型的机器学习模型。它通过模拟分子在不同热力学条件下的扩散过程,生成具有特定性质的分子构型3.2.4人工智能驱动科学3.人工智能驱动科学的应用01生命科学02材料科学03基础物理04地球科学3.1典型研究领域3.2前沿研究领域课堂实践3.33.3.1设计并完成“动物专家”互动游戏1.实践目标专家系统实际上可以简单理解为根据用户提问回答问题的过程,越优秀的专家系统,给出的答案往往越准确和全面。本次实践便将通过开展“动物专家”这一趣味互动游戏,来模拟专家系统的问答形式,通过游戏来体验专家系统的本质,进而帮助读者更深入地了解专家系统。本次游戏一人扮演专家系统,另一人扮演用户。其中,动物知识库如表3-2所示。假设用户已知某种动物但不知道该动物的名称,因此需要与专家系统互动,由专家系统根据用户给出的信息找到正确的动物名称。3.3.1设计并完成“动物专家”互动游戏名称类别栖息地食性外貌特征独特行为

/

形体其他特征狮子哺乳类草原肉食大型,雄性有鬃毛群居,吼叫陆地奔跑企鹅鸟类南极/海洋肉食黑白羽毛,短翅膀不会飞,擅长游泳直立行走大象哺乳类草原/森林草食巨大体型,长鼻子用鼻子喷水,象牙大耳朵扇动长颈鹿哺乳类草原草食长脖子,斑纹皮毛非常高奔跑速度快熊猫哺乳类森林草食黑白毛,圆脸吃竹子,爬树中国特有考拉哺乳类树林草食灰色毛,圆耳长时间睡觉澳大利亚特有斑马哺乳类草原草食黑白条纹群居善奔跑鳄鱼爬行类河流/沼泽肉食长吻,鳞甲爱潜伏、善突袭产卵繁殖袋鼠哺乳类草原草食后肢发达,育儿袋跳跃前进澳大利亚特有猫头鹰鸟类森林肉食大眼睛,头部可旋转270°夜间活动,无声飞行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论