人工智能通识教程课件 第2章 人工智能核心要素和关键基础技术_第1页
人工智能通识教程课件 第2章 人工智能核心要素和关键基础技术_第2页
人工智能通识教程课件 第2章 人工智能核心要素和关键基础技术_第3页
人工智能通识教程课件 第2章 人工智能核心要素和关键基础技术_第4页
人工智能通识教程课件 第2章 人工智能核心要素和关键基础技术_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ArtificialIntelligence人工智能核心要素和关键基础技术第2章编者:×××2.1人工智能核心要素2.2机器学习深度学习2.3知识图谱2.42.5专家系统2.6自然语言处理计算机视觉2.7章节实训与思考2.82.1.1人工智能的基石——数据1.数据对人工智能的重要性二一三四泛化能力是衡量人工智能模型性能优劣的关键指标,它体现在模型处理全新、未

见过的数据时的表现。●

泛化能力。数据是训练人工智能模型不可或缺的基础。只有依托大量高质量的数据,模型才能学到更全面的规律,进而具备更强的智能水平。●

模型训练和性能。数据的多样性直接决定了模型的适应性。多样化的数据集能够助力模型在各类任务中展现卓越的适应能力。●

适应性。在复杂环境中,模型必须依托海量数据才能做出科学的判断。●

决策支持。2.1.1人工智能的基石——数据2.人工智能数据的主要类型性自有数据是企业在日常业务活动中逐步积累起来的专属核心数据,具有极强的针对性和极高的价值。自有数据是训练与业务紧密相关的人工智能模型的“第一手资料”。自有数据合成数据是通过统计方法或使用人工智能技术生成的数据,它旨在模拟真实世界的数据的分布和特征。合成数据外部采购数据来源于专业的数据服务商,这些数据经过了严格的筛选与处理流程,具有较高的可信度和可用性。企业通过购买这类数据,可以节省数据采集与整理的成本。外部采购数据合作伙伴数据是通过机构之间的合作共享机制来实现的。这种数据共享方式能够整合各方的优势资源,有效扩大数据的规模。合作伙伴数据公开数据是由政府或公共机构发布的,具有权威性、通用性及免费的特点,是人工智能模型训练的重要基础。公开数据2.1.1人工智能的基石——数据3.人工智能数据的处理方法1数据清洗。数据清洗是确保数据质量的关键环节,主要针对重复数据、缺失数据和异常数据进行处理。2

数据转换。数据转换旨在将原始数据调整为适合机器学习算法处理的形式。3

数据集划分。为了确保模型具有良好的泛化能力,需要将原始数据划分为训练集和验证集。训练集占比通常为70%~80%,用于模型的学习过程;验证集占比则通常为20%~30%,用于验证模型,以评估模型的性能。4数据增强。数据增强通过人工生成新样本来扩大数据规模,进而提升模型的泛化能力。对于图像数据,可以通过旋转、平移等方式进行增强;对于文本数据,可以利用同义词替换、句子重组等方式进行增强;对于时序数据,则可以通过时间序列平移等方式进行增强。5数据标注数据标注是为数据添加“标签”的过程,这些标签有助于模型理解数据的含义。数据标注分为人工标注和半自动标注两种方式。6数据集成数据集成可以将来自多个不同数据源的数据加以合并,整合成一个统一的数据集。主要解决两个方面的问题。一方面是数据格式不一致的问题,如统一不同数据源中的日期格式;另一方面是数据冲突问题,如不同数据源中同一字段的值存在差异,可通过业务规则或统计方法进行处理。2.1.2人工智能的核心——人工智能算法人工智能算法是驱动人工智能思考、学习与决策的“大脑”。人工智能算法是一系列用于解决特定问题、模拟智能行为或实现自主学习的程序指令和规则。它能够处理海量数据,识别数据中的模式,进而做出决策或预测,其核心目标是模拟人类智能运作机制,赋予人工智能类似人类的思考、理解、学习与创造能力。2.1.2人工智能的核心——人工智能算法1.人工智能算法的发展历程01020304051956年,逻辑理论家程序引入了启发式搜索,这一创新成为人工智能算法的重要基石;1968年,DENDRAL专家系统出现,它将专家经验转化为算法规则,有力推动了机器学习与数据挖掘领域的发展。20世纪80年代,商用专家系统R1的诞生具有双重意义,一方面验证了符号主义算法在知识处理方面的实用性,另一方面也暴露了其规则僵化等缺陷。1986年,反向传播算法被引入,为多层神经网络的训练提供了有效方法,为深度学习的发展奠定了基础。1943年,M-P神经元模型被提出,这标志着人工神经网络算法的开端,为后续相关研究提供了数学基础。如今,多模态大模型、强化学习与因果推理相互融合,持续推动人工智能算法朝着更先进的方向发展。进入21世纪后,人工智能算法迎来了爆发式发展。2006年,深度信念网络推动了深度学习的诞生;2014年,生成对抗网络开辟了生成模型的新方向;2016年,AlphaGo展示了强化学习在复杂决策领域的强大实力;2021年,AlphaFold实现了蛋白质结构的精准预测。2.1.2人工智能的核心——人工智能算法2.人工智能算法的核心功能在学习阶段,人工智能算法会经历一个训练过程,即通过分析训练数据来不断调整其

内部参数,从而最小化预测结果与真实标签之间的误差。●

学习。当进入决策阶段时,经过充分训练的人工智能模型能够对未知数据进行预测或分类。

随着技术的持续发展,人工智能算法的决策能力正经历着从被动响应到主动预测,乃至自主优化的重要转变。●

决策。2.1.3人工智能的动力——算力1.人工智能算法的发展历程算力指计算系统处理信息与执行计算的能力,是衡量人工智能设备性能的关键指标,更是人工智能发展的核心“动力引擎”。无论是训练拥有数千亿参数的复杂深度学习模型,还是实现自动驾驶中的实时推理决策,都离不开强大算力的支撑。基础算力。01智能算力。02超级算力。03新一代算力。042.1.3人工智能的动力——算力2.算力中心通用算力中心超算中心智算中心融合算力中心2.1.4人工智能要素间的关系与支撑数据、人工智能算法、算力三者并非彼此孤立,而是构成了一个相互依存、相互促进的有机整体。以制造业的智能调度场景为例,1.数据为决策提供了坚实的基础;2.算法则负责计算出最优的路径和调度方案;3.而算力则确保了算法能够实时运行,并快速做出响应。这三者紧密结合,共同铸就了人工智能系统的核心竞争力。2.1人工智能核心要素2.2机器学习深度学习2.3知识图谱2.42.5专家系统2.6自然语言处理计算机视觉2.7章节实训与思考2.82.2.1机器学习的定义机器学习是人工智能的核心分支,旨在让计算机系统通过数据自动学习并改进,而非依赖显式编程。与传统编程中程序员预先定义规则和逻辑不同,机器学习通过构建数学模型,从海量样本数据中自动挖掘规律和模式,进而对未知数据进行预测或决策。其本质是让机器“从经验中学习”,这里的“经验”即数据。机器学习具有以下特点。自动化与适应性。个性化服务。高效数据处理。预测与决策。可扩展性。2.2.2机器学习的主要类型监督学习是机器学习领域中最基础且应用最广泛的方法之一。其核心在于利用带标签的数据集进行模型训练,使模型能够学习从输入特征到输出标签的映射关系,从而对未见过的数据进行准确预测。1.监督学习强化学习是一种通过智能体与环境交互来学习决策策略的机器学习方法。智能体在环境中执行动作,环境根据动作反馈奖励信号。3.强化学习无监督学习算法面对的是未标记的数据集,这些数据没有预先定义的类别或输出标签。与监督学习依赖已知标签来指导模型训练不同,无监督学习要求模型通过分析数据的统计特征、相似度等,自主发现数据中的结构和模式。2.无监督学习2.2.3机器学习的基本流程这是机器学习流程的第一步,也是至关重要的一步。数据的质量直接决定了模型性能的上限。

这一阶段主要包括数据收集、数据清洗、数据集成、数据变换及特征工程等。1.数据收集与预处理在完成数据收集与预处理后,我们需要根据具体的任务和数据的特点,选择一个合适的机器学习算法或模型。2.模型选择与训练模型选择与训练完成后,我们需要对其性能进行评估,以判断其是否达到预期的效果。评估模型性能的指标有很多,如准确率、召回率、F1分数、均方误差等,选择哪个指标取决于具体的任务。通常会将数据集划分为训练集、验证集和测试集,在训练集上训练模型,在验证集上调整模型的超参数,最后在测试集上评估模型的最终性能。3.模型评估与优化2.2.4经典机器学习算法01020304线性回归与逻辑回归线性回归和逻辑回归是两种最基础、最常用的监督学习算法。线性回归主要用于解决回归问题,它假设输入特征与输出值之间存在线性关系,通过拟合一条直线或一个超平面来预测连续的数值。

逻辑回归虽然名称中带有“回归”二字,但实际上是一种分类算法,它通过Sigmoid函数将线性回

归的输出映射到(0,1)区间,从而得到一个概率值,用于判断样本属于某个类别的可能性。这两种算法简单、高效、易于解释,在许多实际问题中都有着广泛的应用。决策树与随机森林决策树是一种基于树状结构进行决策的算法,它通过一系列“是/否”问题来划分数据,最终达到分类或回归的目的。决策树的优点是模型直观、易于理解,但容易过拟合。为了解决这个问题,研究者们提出了

集成学习的方法,其中最著名的就是随机森林。随机森林通过构建多棵决策树,并对它们的预测结果进行投票或平均化,从而得到最终的输出结果。这种方法能够有效降低模型的方差,提高预测的准确性和稳定性。支持向量机支持向量机是一种非常强大的分类算法,其核心思想是在特征空间中找到一个能够将不同类别的样本点分得“最开”的超平面。SVM通过引入核函数的技巧,可以处理非线性可分的数据,即将数据映射到更高维度的空间,使其变得线性可分。SVM在许多分类任务中都表现出色,尤其是在小样本、高维度的数据集上。K-均值聚类K-均值聚类是一个经典的无监督学习算法,用于解决聚类问题。它的目标是将数据集划分为K个簇,使每个簇内的数据点尽可能紧密地围绕其中心点。K-均值聚类的实现过程简单、高效,但其结果对初始中心点的选择比较敏感,且需要预先指定簇的数量K。尽管如此,K-均值聚类在客户分群、图像分割、异常检测等领域仍然有着广泛的应用。2.1人工智能核心要素2.2机器学习深度学习2.3知识图谱2.42.5专家系统2.6自然语言处理计算机视觉2.7章节实训与思考2.82.3.1深度学习的概念深度学习是机器学习的一种,特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上,结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特点是具有自动提取特征的能力,所提取的特征也称为深度特征或深度特征表示,相比于人工设计的特征,深度特征的表示能力更强、更稳定。因此,深度学习的本质是能够自动学习数据的有效表示,这些表示有助于解决各种复杂的分类、检测和预测任务。2.3.2深度学习的发展历程神经网络的概念早在20世纪40年代就已提出,并在80年代随着反向传播算法的提出而迎来第一次发展高潮。然而,由于当时计算能力的限制、训练数据的匮乏以及网络结构设计的局限,神经网络的研究在20世纪90年代后期陷入瓶颈。浅层的神经网络在许多复杂问题上表现不佳,而深层网络则面临严重的梯度消失问题,难以有效训练。尽管如此,这些研究,特别是对梯度消失等核心问题的识别,为后来深度学习的复兴奠定了基础。早期探索与瓶颈2.3.2深度学习的发展历程深度学习的复兴始于21世纪初。2006年,杰弗里·辛顿等人提出的深度信念网络(DeepBeliefNetwork,DBN)为解决深层网络的训练难题提供了新的思路。与此同时,GPU等并行计算硬件的发展,为大规模神经网络的训练提供了强大的算力支持。更重要的是,互联网的普及带来了海量的数据,为深度学习模型的训练提供了充足的“养料”。在这些因素的共同推动下,深度学习在2012年的ImageNet大规模视觉识别挑战赛中取得压倒性胜利,开启了深度学习的新纪元。深度学习的复兴2.3.2深度学习的发展历程近年来,随着算力的进一步增强和数据的持续积累,深度学习模型变得越来越大,参数量从数百万、数十亿,发展到数千亿甚至万亿级别。这些被称为大模型或基础模型的庞然大物,如GPT系列、BERT等,展现出惊人的能力。它们不仅在特定任务上表现出色,还展现出强大的通用能力和“涌现能力”,如上下文学习、零样本/少样本学习等。大模型的出现,标志着人工智能进入了新的时代,即通过大规模预训练和微调,来解决各种下游任务,极大地降低了人工智能应用的开发门槛。大模型时代的到来2.3.3典型深度学习算法卷积神经网络是深度学习的代表算法之一,其独特的网络结构和运算方式,使其特别适用于处理图像数据。卷积神经网络由多个层次的神经网络组成,其结构原理如图所示,其中每一层都对输入的数据进行特定的处理,最终输出分类结果。1.卷积神经网络2.3.3典型深度学习算法循环神经网络是一类用于处理序列数据的神经网络,能够处理输入信息的序列,并在序列的不同时间点共享参数。循环神经网络的核心是隐藏状态,它包含关于过去输入的信息,被用于影响当前和未来的计算。2.循环神经网络一个简单的循环神经网络如图所示,它由输入层、一个隐藏层和一个输出层组成,其中x是输入数据;a是隐藏层的值,a不仅取决于当前这一次的输入x,还取决于上一次隐藏层的值a;y是输出数据,输出层是一个全连接层,它的每个节点都和隐藏层的每个节点相连;U是输入层到隐藏层的权重矩阵;V是隐藏层到输出层的权重矩阵;W是隐藏层上一次的值作为这一次输入的权重。2.3.3典型深度学习算法生成对抗网络由生成器和判别器两部分组成。生成器的任务是生成尽可能逼真的数据样本,而判别器的任务是区分这些生成的样本与真实样本,两者通过对抗的方式相互训练,以提升彼此的性能。图所示为生成对抗网络的结构原理,生成器和判别器都可以用人工神经网络实现。3.生成对抗网络图中,左侧是生成器,其输入是z,对于原始的生成对抗网络,z是由高斯分布随机采样得到的噪声,噪声z通过生成器得到假样本。生成的假样本与真实样本放在一起,被随机抽样送入判别器,由判别器去区分输入的样本是生成的假样本还是真实的样本,整个过程简单明了。生成对抗网络中的“生成对抗”主要体现为生成器和判别器之间的对抗。2.1人工智能核心要素2.2机器学习深度学习2.3知识图谱2.42.5专家系统2.6自然语言处理计算机视觉2.7章节实训与思考2.82.4.1知识图谱的定义知识图谱是一种用图的结构化方式来表示知识和世界万物之间关系的技术。它将现实世界中的实体抽象为“节点”,并将事物之间的关系抽象为“边”,从而形成一个庞大的知识网络。知识图谱的核心思想是将非结构化的文本信息转化为结构化的、机器可理解的知识,为人工智能应用提供坚实的知识基础。它不仅是数据的集合,更是富含语义的知识库,能够帮助人工智能系统更好地理解世界、进行推理和回答问题。图所示为一个简单的家庭成员知识图谱,它以图形化的方式让我们一目了然地看到各个实体之间的关系,从而更好地理解和分析数据。2.4.2知识图谱的表示方法资源描述框架是知识图谱的一种标准表示方法,它将知识表示为一系列的三元组,其基本组成单元是“实体-关系-实体”,通常表示为(主语,谓词,宾语)。知识图谱的表示方法涉及以下3个方面的内容。实体实体是指现实世界中可区分的、独立存在的事物,如“黄

××”“成都”。在知识图谱中,实体被表示为节点。关系关系是指连接两个实体的语义联系,如“出生于”。在知识图谱中,关系被表示为边。属性属性是指实体或关系所具有的特征或描述信息。例如,“黄

××”这个实体可以有“出生日期”“性别”“年龄”等属性。1232.4.3知识图谱的构建流程根据知识图谱的应用场景和目标,确定所需的数据来源。例如,要想构建一个医疗领域的知识图谱,就可能需要收集医学文献、电子病历、药品说明书等数据。收集数据时,对于结构化和半结构化数据,可以通过直接访问数据库或使用应用程序编程接口获取;对于非结构化数据,则需要通过网络爬虫技术从网页、文档等对象中抓取。在数据的收集过程中,要注意数据的合法性和合规性,遵守相关的法律法规和网站的使用条款。1.数据收集初步筛选收集到的数据,删除重复、无效、错误的数据,以提高数据质量。例如,去除格式错误的记录、纠正拼写错误、填补缺失的值等。为了便于后续处理和分析,还需要将不同格式的数据转换为统一的格式和单位。例如,将日期格式统一为“YYYY-MM-DD”,将货币单位统一为人民币等。当来自不同数据源的数据存在矛盾或不一致时,需要通过人工审核、规则判断或统计分析等方法处理,确保数据的一致性。2.数据清洗2.4.3知识图谱的构建流程实体抽取是指从数据中识别并提取有意义的实体,这些实体通常具有一定的语义和特定性,如人名、地名、组织等,可采用的抽取方法如下。3.实体抽取01根据预先定义的规则和模式,识别出数据中的命名实体。基于规则的方法03使用预训练的深度学习算法相关的模型,如循环神经网络,对文本进行语义理解和实体识别。基于机器学习的方法02利用词频、互信息等统计指标,计算词语的重要性和关联度,从而识别出可能的实体。基于统计的方法2.4.3知识图谱的构建流程4.关系抽取根据预先定义的关系模板,在文本中查找符合模板的句子或短语,从而识别出实体之间的关系。基于模板匹配的方法。依存句法是一种描述各个词语之间依存关系的方法,基于该方法的关系抽取是通过分析句子的语法结构,确定词语之间的依存关系,从而推断出实体之间的关系。●

基于依存句法分析的方法。使用循环神经网络等深度学习算法,对大量的数据进行训练,学习实体之间的关系模式,从而实现自动进行关系抽取。●

基于机器学习的方法。5.属性抽取根据实体的类型和属性的定义,编写相应的规则来抽取属性值。基于规则的方法。01利用分类算法或回归算法,预测和抽取实体的属性。基于机器学习的方法。022.4.3知识图谱的构建流程6.数据建模将抽取到的知识要素转化为机器可处理的格式,常见的表示方法有资源描述框架、属性图等。资源描述框架是一种基于三元组的表示方法,即将知识表示为主体、谓词和课题的形式;属性图则是一种图结构表示方法,以节点表示实体,边表示关系,节点和边都可以附带属性。

选择表示方法本体是知识图谱的概念模型,定义了实体类型、关系类型及其属性。构建本体可以参考已有的本体标准,如网络本体语言等,也可以根据具体需求自定义本体。通过构建本体,可以明确知识图谱的结构和语义,为知识的存储、查询和推理提供基础。构建本体2.4.3知识图谱的构建流程7.知识融合将来自不同数据源的相同实体进行合并和统一表示,解决实体名称不同但实际指向同一对象的问题。实体对齐通常基于对实体的属性相似度、上下文信息等进行计算,并通过设定一定的阈值来判断两个实体是否为同一实体。

实体对齐1整合不同来源的知识,去除重复的知识,解决知识之间的冲突和矛盾。在合并过程中,需要综合考虑知识的可信度、时效性等因素,以确保合并后的知识具有较高的质量和准确性。

知识合并22.4.3知识图谱的构建流程8.知识推理与验证知识推理知识验证01利用已有知识,通过逻辑推理、规则推理、概率推理等方法,推导出新知识和隐含的关系,从而丰富和完善知识图谱。02验证和评估知识图谱中的知识,确保知识的正确性和可靠性。具体可以通过人工审核、与权威数据源进行对比、基于统计和机器学习的方法等方式进行验证,及时发现和纠正知识图谱中的错误和不一致之处。2.4.4知识图谱应用知识图谱可以极大地提升搜索引擎的智能化水平。传统的搜索引擎主要基于关键词匹配,而融合知识图谱的搜索引擎能够理解用户的真实意图,并提供更精准、更丰富的答案。智能搜索智能问答智能问答是知识图谱最典型的应用之一,基于知识图谱的智能问答系统能够直接回答用户提出的自然语言问题。系统首先通过自然语言理解技术,将用户的问题解析成结构化的查询,然后在知识图谱中进行查询,最后将查询结果以自然语言的形式返回给用户,比传统的基于检索的问答系统更加精准和高效。在金融领域,知识图谱被广泛应用于风险控制、反欺诈和合规审查等方面。通过构建企业、个人、账户、交易等实体之间的关联关系图,可以识别出异常的资金流动和潜在的欺诈团伙。金融风控2.1人工智能核心要素2.2机器学习深度学习2.3知识图谱2.42.5专家系统2.6自然语言处理计算机视觉2.7章节实训与思考2.82.5.1专家系统的概念专家系统是一种模拟人类专家解决特定领域问题的计算机程序,其核心思想是将人类专家的知识和经验,以某种形式存储在计算机中,并利用这些知识来解决需要专家才能解决的复杂问题。2.5.2专家系统的结构2.5.2专家系统的结构人机界面主要由显示设备、输入设备等部件组成。它不仅是用户与专家系统进行信息交流的桥梁,还是用户了解系统行为、结果和推理过程的重要途径,其主要作用如下。1.人机界面用户通过人机界面输入问题或查询,专家系统则根据输入的信息进行推理和计算,最终给出答案或建议。问题输入与查询专家系统通过人机界面向用户展示推理结果,并提供详细的解释和说明,以帮助用户理解结果背后的逻辑和依据。结果展示与解释人机界面允许用户与系统进行交互,如修改输入信息、选择推理路径等。同时,专家系统通过人机界面向用户反馈操作结果和状态信息,以便用户及时调整和优化输入的信息。用户交互与反馈2.5.2专家系统的结构知识获取程序的主要作用是从领域专家或其他可靠来源中抽取、整理、转换和存储知识,其大致步骤为:2.知识获取程序分析知识需求,明确专家系统需要解决的具体问题和领域范围,以及确定所需知识的类型、范围和深度;抽取与整理知识,即从选定的知识源中抽取知识,并对抽取出来的知识进行整理、分类和归纳,以确保其准确性、一致性和完整性;将转换后的知识存储到专家系统的知识库中,并建立有效的知识管理机制,以便更新、维护和保护知识。识别知识源,包括潜在的知识源,如领域专家、文献、数据库等,并根据需求分析结果选择最可靠、最相关且易于获取的知识源;进行知识表示与转换,即将抽取和整理后的知识转换为专家系统可以理解和利用的形式;2.5.2专家系统的结构知识库是存储和组织专家系统所需知识的核心组件,包含领域专家的知识和规则,用于解决特定领域的问题,能够提供准确、全面且结构化的知识支持,以供专家系统推理和决策。常见的知识表示方式如下。3.知识库04030201事实事实是关于领域或问题的具体信息,如数据、定义、定理等。关系关系描述了领域中的实体之间的关联或联系。概念概念是对领域中的实体、属性或关系的抽象描述规则规则是专家系统中常用的知识表示方式。2.5.2专家系统的结构推理机是专家系统的“大脑”,它执行推理过程,根据已知的事实和规则推导出解决问题的结论。推理机链接知识库中的规则和综合数据库中的事实,通过逻辑推理、模式匹配等方法,找到符合问题要求的解决方案。推理机主要由推理引擎和控制策略两部分组成。推理引擎负责执行具体的推理操作,如逻辑推理、模式匹配等;而控制策略则指导推理引擎如何高效地利用知识库中的知识和规则进行推理。推理机可以采用多种推理方法,常见的推理方法如下。4.推理机01正向推理(前向推理)从已知的事实出发,根据知识库中的规则逐步推导出结论。02反向推理(逆向推理)先假设一个结论,然后验证这个结论是否满足知识库中的规则。03双向推理结合正向推理和反向推理的优点,同时进行正向推理和反向推理,直至某一时刻正、反向推理过程达到某种一致状态,从而获得问题的解。2.5.2专家系统的结构综合数据库也称动态数据库或“黑板”,是专家系统在执行推理的过程中用于存放所需要和产生的各种信息的工作存储器。综合数据库的内容在专家系统运行过程中是不断变化的,因此它是一个动态的存储区。5.综合数据库01问题的初始状态描述用户输入的问题及其相关背景信息。02中间结果推理过程中产生的中间结论和状态信息。03求解过程的记录推理过程中执行的操作和步骤的记录。04系统对于用户对其的提问的回答在用户与系统交互过程中,系统提供的额外信息或回答。2.5.2专家系统的结构解释器在专家系统中负责解释推理过程和结果,它的主要功能是向用户清晰地阐述系统是如何根据输入的问题和知识库中的知识进行推理并最终得出结论的。通过解释器,用户可以更好地理解专家系统的决策过程,增加专家系统的透明度和可信度。具体应用时,解释器将先从综合数据库中接收推理机输出的推理结果,对推理过程进行分析,提取关键的推理步骤和依据的知识规则。然后基于分析的结果,解释器会生成易于理解的解释文本,将生成的解释文本通过人机界面展示给用户,向用户阐述系统是如何根据输入的问题和已有的知识进行推理的,帮助用户理解系统的决策过程。6.解释器2.5.3专家系统的应用在医疗领域,专家系统通过整合医学知识、临床经验和患者信息,帮助医生进行疾病诊断与治疗规划。系统能够根据患者的症状、病史及检查结果,匹配知识库中的疾病模型,提供可能的诊断建议及治疗推荐。1.医疗领域专家系统在农业领域也有重要应用,可帮助农民进行作物种植、病虫害诊断和农业资源管理。系统结合当地土壤、气候、作物生长周期及病虫害知识,为用户提供种植建议、施肥指导及病害防治方案。2.农业领域在教育领域,专家系统可用于个性化辅导与技能培训。系统根据学生的学习进度、知识掌握情况和错误模式,提供定制的学习内容与练习题目,模拟教师进行答疑和指导。3.教育领域2.1人工智能核心要素2.2机器学习深度学习2.3知识图谱2.42.5专家系统2.6自然语言处理计算机视觉2.7章节实训与思考2.82.6.1自然语言处理的概念自然语言处理的核心目标是让计算机能够理解、解释、生成和处理人类的自然语言,如中文、英文等。自然语言是人类在社会交流中自然形成的工具,具有模糊性、歧义性,且高度依赖上下文,这使其处理极具挑战性。自然语言处理技术可以赋予计算机像人类一样的语言理解能力,进而实现高效且智能的人机交互。从广义层面来看,自然语言处理包括一系列操作与加工过程,如字、词、句到篇章的输入、输出、识别、分析、理解及生成等。该技术不仅关注语言的字面含义,更致力于挖掘语言背后的意图、情感和语境,是实现真正智能的关键一步。2.6.2自然语言处理的基础技术词法分析词法分析是自然语言处理的基础,主要包括分词和词性标注。分词,尤其是在中文等没有天然空格的语言中,是将连续的文字序列切分成具有独立语义的词汇单元。句法分析句法分析主要聚焦于剖析句子的语法结构,其目的在于清晰地呈现词汇之间的层次架构及依存关系,能够帮助计算机精准把握句子的“骨架”以及具体的组成方式。它一般可划分为成分句法分析与依存句法分析两种类型。其中,成分句法分析通过构建语法树的方式,直观地展示短语的结构;依存句法分析则侧重于识别词语之间的二元依存关系,如主谓关系、动宾关系等。语义分析语义分析是理解语言真正含义的关键环节,其目的在于消除词汇和结构层面可能存在的歧义,进而构建出能够精准反映文本意义的语义表示。1232.6.3自然语言处理的应用文本生成使计算机能够依据输入的信息,自动生成连贯且流畅的自然语言文本。近年来,大语言模型在文本生成领域实现了突破性进展,所生成的文本质量极高。而文本摘要则是将长篇文本自动压缩为简短精练的摘要,同时确保原文的核心信息得以保留。文本生成与摘要智能客服与聊天机器人是自然语言处理最为广泛的应用领域之一。依托自然语言处理技术,智能客服能够提供7x24小时不间断的服务,迅速响应用户咨询。借助自然语言理解技术,智能客服可以精准识别用户意图,进而给出精确的答案。智能客服与聊天机器人机器翻译是一种借助计算机技术,实现将一种自然语言自动翻译成另一种自然语言的技术。在机器翻译的发展历程中,早期的机器翻译主要基于规则;随后,逐步发展为统计机器翻译;而近年来,神经机器翻译已成为主流技术。神经机器翻译采用端到端的神经网络模型,能够直接将源语言句子映射为目标语言句子。机器翻译2.1人工智能核心要素2.2机器学习深度学习2.3知识图谱2.42.5专家系统2.6自然语言处理计算机视觉2.7章节实训与思考2.82.7.1计算机视觉的概念计算机视觉作为人工智能与深度学习领域的核心研究方向,其核心目标在于赋予计算机类似人类的视觉感知能力,使其能够自主理解外部世界。该领域通过构建复杂的算法模型,实现从数字图像和视频中自动提取、解析有效信息的功能。简单来说,计算机视觉旨在让机器具备“看懂”图像和视频的能力。这项技术虽以模拟人类视觉系统为基础,但在处理效率方面有显著优势,尤其在精细分类、微小特征识别等专项任务中,其准确性和速度甚至能够超越人类视觉的生理极限。2.7.2计算机视觉的主要任务1.图像分类图像分类是计算机视觉的基础任务之一,其核心目标是将输入的图像划分到预先定义好的类别当中。3.图像分割图像分割是将图像划分为多个具有相似特征的区域或像素集合的过程,旨在更精细地理解图像内容。它可以分为语义分割、实例分割和全景分割等不同类型。语义分割是为图像中每个像素赋予一个类别标签,如将一张城市街景图像分割为道路、建筑物、树木等不同语义区域;实例分割则不仅要区分不同语义类别,还要将同一类别中的不同个体区分开来,如在一群人中准确分割出每个人;全景分割是语义分割和实例分割的结合,既区分语义类别,又区分不同个体。2.目标检测进行目标检测时,计算机视觉不仅要识别出图像中存在的目标类别,还要确定这些目标在图像中的具体位置,通常以矩形框的形式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论