人工智能基础与应用课件 项目3 认知人工智能的应用技术_第1页
人工智能基础与应用课件 项目3 认知人工智能的应用技术_第2页
人工智能基础与应用课件 项目3 认知人工智能的应用技术_第3页
人工智能基础与应用课件 项目3 认知人工智能的应用技术_第4页
人工智能基础与应用课件 项目3 认知人工智能的应用技术_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目3认知人工智能的应用技术任务1任务2任务3认识计算机视觉认识自然语言处理认识智能语音语义目录任务4任务5认识机器学习认识知识图谱任务6认识人工智能芯片任务1认识计算机视觉学习目标理解计算机视觉的定义及其核心原理理解计算机视觉的基础知识,包括图像的数字化表示、图像的数字化过程以及图像增强等掌握计算机视觉的主要任务,包括图像分类、目标检测、语义分割、实例分割和目标追踪等能够运用计算机视觉工具完成图像和视频的生成能够运用计算机视觉工具完成图像的处理和分析等任务(如车牌识别)对计算机视觉技术充满兴趣,积极学习和探索新的技术与应用在学习和运用计算机视觉技术解决问题的过程中,培养问题解决能力和创新思维知识目标能力目标素养目标一、认识计算机视觉1.计算机视觉的定义计算机视觉是一门研究如何使计算机通过数字图像或视频数据来获取、处理和理解视觉信息的科学与技术。①图像处理。通过对原始图像进行预处理,即突出关键信息并抑制不必要的干扰,提高后续分析的效果。这一过程涉及的常见技术包括图像增强、去噪和滤波等。②特征提取。利用算法(如边缘检测、角点检测和特征点提取)从那些经过处理的图像中提取具有代表性的特征。这些特征能够用于描述图像内容,为后续的目标识别与跟踪奠定基础。③机器学习。运用机器学习,特别是深度学习技术,对提取的特征进行学习和训练,以实现计算机对图像内容的理解与识别。一、认识计算机视觉2.计算机视觉的基础知识(1)图像的数字化表示图像数字化是指将客观世界中的一幅模拟图像(画面)转换为计算机能够识别、存储与处理的数字图像的过程。数字图像由二维元素组成,每一个元素具有一个特定的位置坐标(x,y)和幅值f(x,y),这些元素被称为像素,如图3.1.3所示。其中,幅值f(x,y)指的是每个像素所代表的颜色值或亮度值。将一幅数字图像(F)左上角像素的中心点作为坐标系原点,记作f(0,0),那么一幅大小为m×n(高×宽)的数字图像,可以用如图3.1.4所示矩阵来表示。一、认识计算机视觉2.计算机视觉的基础知识(1)图像的数字化表示数字图像根据灰度级数的差异可以分为:黑白图像、灰度图像和彩色图像。①黑白图像:幅值为0或1,0表示白,1表示黑。②灰度图像:幅值在0到255之间,表示不同的灰度级。③彩色图像:由RGB(红色、绿色、蓝色)三个颜色通道组成,每个通道的幅值在0到255之间。一幅彩色图像,通常需要三个独立的矩阵来表示,分别对应每个颜色通道的幅值。这三个矩阵可以合并成一个三维矩阵,其中每个维度代表一个颜色通道。一、认识计算机视觉2.计算机视觉的基础知识(1)图像的数字化过程图像的数字化过程包括采样和量化两个关键环节。采样是在空间上对连续的图像信号进行离散化的过程。量化是在幅度上对采样得到的图像信号进行离散化的过程,即将每个像素点的亮度值或颜色值划分成有限个等级,并将其转换为对应的数字代码。一、认识计算机视觉2.计算机视觉的基础知识(3)图像增强通过图像增强技术,能够改善图像的视觉呈现效果,提升计算机对图像的判读能力,为后续的图像分析与处理打下坚实的基础。在数字图像处理中,图像增强技术主要分为两大类:空间域增强和频率域增强。空间域增强是直接对图像的像素进行处理,以达到增强效果;频率域增强则是对图像经傅里叶变换(这是一种将图像从空间域转换为频率域的数学方法,用于将图像分解成不同频率的成分)后的频谱成分进行处理,然后通过傅里叶逆变换还原出所需的图像。一、认识计算机视觉2.计算机视觉的基础知识(3)图像增强图像滤波是通过卷积运算的方式对图像进行空间域增强的方法,即在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制。图像噪声是指在图像采集、传输或处理过程中引入的非期望信号干扰,表现为图像中出现的随机或规律性异常像素值变化。这些信号会导致图像质量下降,影响计算机对图像信息一、认识计算机视觉3.计算机视觉的主要任务(1)图像分类图像分类是计算机视觉中的基本任务。它的目标是将输入的图像分配到一个预先定义的类别中。通过图像分类任务,计算机能够识别出图像中的各类物体。(2)目标检测目标检测是在图像或视频中,确定预先定义的特定目标的位置和类别。一、认识计算机视觉3.计算机视觉的主要任务(3)语义分割语义分割是将图像中的每个像素分配到一个特定的类别中,以实现对图像的像素级理解。(4)实例分割实例分割是在语义分割的基础上,进一步区分同一类别中的不同个体。一、认识计算机视觉3.计算机视觉的主要任务(5)目标追踪目标追踪用于追踪随着时间不断移动的对象。它利用连续视频帧作为输入,从而获取目标的运动轨迹和状态变化。二、了解计算机视觉的发展历程1.萌芽阶段(20世纪50年代)1959年,神经生理学家大卫·休伯尔和托斯坦·维泽尔开展了一项针对猫视觉系统的实验。这项研究首次揭示了视觉初级皮层神经元对移动边缘刺激的敏感性,并发现了视功能柱结构,为视觉神经科学研究奠定了坚实的基础。这一发现不仅在当时具有重要意义,而且促成了四十年后计算机视觉技术的突破性发展,并为深度学习领域奠定了理论基础。2.探索阶段(20世纪60年代)1965年,劳伦斯·罗伯茨在《三维固体的机器感知》一书中描述了从二维图片中推导三维信息的过程,这本书被广泛认为是现代计算机视觉的奠基性著作之一。二、了解计算机视觉的发展历程3.理论构建阶段(20世纪70年代)1977年,大卫·马尔在麻省理工学院(MIT)人工智能实验室提出了计算机视觉理论。该理论成为当时计算机视觉领域的重要理论框架,不仅为该领域构建了系统的理论体系,还对计算机视觉技术的发展产生了深远且重要的推动作用。4.独立学科形成阶段(20世纪80年代)1980年,日本计算机科学家福岛邦彦受到大卫·休伯尔和托斯坦·维泽尔研究的启发,建立了自组织的人工神经网络——“神经认知机”(Neocognitron)。1982年,大卫·马尔发表了具有影响力的论文《愿景:对人类表现和视觉信息处理的计算研究》,并出版了《视觉》一书,这标志着计算机视觉成为一门独立学科。二、了解计算机视觉的发展历程5.发展繁荣阶段(20世纪90年代)1997年,吉腾德拉·马利克发表了一篇论文,描述了他试图解决感性分组的问题。1999年,大卫·洛发表《基于局部尺度不变特征(SIFT特征)的物体识别》一文,标志着研究者开始停止通过创建三维模型来重建对象,而是转向基于特征的对象识别。1999年,英伟达公司在推广GeForce256芯片时,提出了GPU的概念。6.深度学习助力阶段(21世纪初期至今)21世纪初期,图像特征工程领域出现了真正拥有标注的高质量数据集。2009年,李飞飞等人发布了ImageNet数据集,推动了计算机视觉和深度学习的发展。从2010年到2017年,基于ImageNet数据集的ImageNet挑战赛(ImageNetLargeScaleVisualRecognitionChallenge,ILSVRC)将目标检测算法推向新高2014年,生成对抗网络被提出,它是计算机视觉领域的重大突破。2017年至2018年,深度学习框架PyTorch和TensorFlow逐渐趋于成熟,并成为被广泛使用的框架。近年来,国内外众多企业纷纷在计算机视觉领域加大研发投入。三、学会应用计算机视觉工具1.可灵AI可灵AI是一款由我国企业自主研发的视频与图片生成工具。进入可灵AI首页,点击“图片生成”,在“创意描述”框中填写图片信息,如“帅气小男孩,黑头发,微笑,正脸,全身照,完美光线,漫画,细节清晰,16K”。点击“立即生成”,可灵AI便会根据指令生成图片。三、学会应用计算机视觉工具2.百度AI开放平台百度AI开放平台(网址:)是面向开发者与企业的综合性人工智能技术服务平台,集成了丰富的技术能力。这里将重点介绍该平台文字识别服务体系中的车牌识别功能。点击首页中的“文字识别/车牌识别”选项,上传车牌照片,体验识别效果。三、学会应用计算机视觉工具2.百度AI开放平台在开发产品时,如果需要用到车牌识别功能,可以调用百度AI开放平台中的相关技术能力来实现。具体操作步骤如下:(1)成为百度AI开放平台的开发者(2)开通文字识别服务①

领取免费资源。②创建应用。(3)使用文字识别服务三、学会应用计算机视觉工具2.百度AI开放平台在开发产品时,如果需要用到车牌识别功能,可以调用百度AI开放平台中的相关技术能力来实现。具体操作步骤如下:(1)成为百度AI开放平台的开发者(2)开通文字识别服务①

领取免费资源。②创建应用。(3)使用文字识别服务任务2认识自然语言处理学习目标理解自然语言处理的定义及其主要任务了解自然语言处理的应用领域,能够识别其在实际应用中的场景能够利用自然语言处理工具,将文字转换成语音能够在运用自然语言处理技术解决问题的实践中,培养问题解决能力和创新思维知识目标能力目标素养目标一、认识自然语言处理1.自然语言处理的定义自然语言处理是人工智能的一个分支,它致力于使计算机能够理解和处理人类语言。NLP的目标是让机器能够像人类一样理解并生成语言,从而实现人与机器之间的自然交互。一、认识自然语言处理2.自然语言处理的主要任务(1)词法分析

①分词

②词性标注

③词形还原(2)句法分析

①短语结构分析

②依存关系分析(3)语义理解

①词义消歧

②语义角色标注

③语义表示(6)问答系统

①基于规则的问答系统

②基于检索的问答系统

③基于生成的问答系统(7)文本生成

①语言模型

②摘要生成

③对话生成

④故事生成(4)情感分析

①情感分类

②情感强度分析

③情感对象识别(5)机器翻译

①规则-based翻译

②统计机器翻译

③神经机器翻译一、认识自然语言处理3.自然语言处理的应用案例(1)智能客服(2)智能写作助手(3)社交媒体分析(4)语言学习工具二、了解自然语言处理的发展趋势1.多模态融合多模态融合是指将文本、图像、语音、视频等多种模态的数据进行联合处理与分析,以提升模型对复杂场景的理解能力。2.轻量化模型轻量化模型是指在保持模型性能不变的前提下,通过压缩、优化或改进架构来降低模型的计算和存储资源消耗。3.强化学习赋能NLP基于强化学习框架,可通过奖励机制优化模型的决策能力,从而生成更符合预设目标的输出结果。二、了解自然语言处理的发展趋势4.可解释性增强可解释性增强有助于提升模型决策的透明度,使人类能够理解模型的推理过程和预测依据。5.跨语言处理跨语言处理技术使模型能够直接处理多种语言的任务,无须依赖中间语言或单独训练。跨语言处理的技术方法包括多语言预训练模型、零样本学习。三、学会应用自然语言处理技术1.学习自然语言处理课程(1)注册并登录在搜索引擎中输入关键词“飞桨AIStudio”,找到其官方网站,点击进入飞桨AI开放平台的首页(如图3.2.2所示),然后完成注册并登录。(2)学习在线课程在“学习”模块中选择“课程”,随后点击“自然语言处理”大类,从中找到你感兴趣的实践课程进行学习,如图3.2.3所示。三、学会应用自然语言处理技术1.探索马克配音(1)进入平台在搜索引擎中输入关键词“TTSMaker”,找到其官方网站,点击进入平台首页,如图3.2.4所示。(2)输入文本内容并生成音频文件①在输入框中键入文本内容,确保不超过字数限制。此处以《赤壁赋》为例。②从平台提供的声音选项中选择合适的声音,建议先进行试听,然后再做出选择。③在输入验证码后,点击“开始转换”按钮,如图3.2.5所示。转换完成后,可以在线预览音频。任务3认识智能语音语义学习目标理解智能语音语义的定义、基础知识和主要任务了解智能语音语义的应用领域,如智能家居、手机助手等能够熟练使用智能语音常用工具,如智能音箱等能够利用智能语音语义开发平台开发智能语音助手或创建语音智能体乐于探索智能语音语义的新应用和新技术,培养创新思维能够将智能语音语义知识与其他学科知识相结合,探索交叉应用路径知识目标能力目标素养目标一、认识智能语音语义1.智能语音语义的定义智能语音语义智能语音语义融合了语音技术与语义理解技术,是一种旨在让机器听懂、理解人类语言并做出恰当反馈的综合性技术体系。在语音层面,该技术可实现语音与文本的相互转换;在语义层面,则可深入挖掘和解析语言背后的真实意图与逻辑关系,助力人机自然交互。2.智能语音语义的基础知识(1)语音识别技术(ASR)语音识别的核心任务是把人类的语音信号精准转换为对应的文本。(2)自然语言理解技术(NLU)自然语言理解致力于让计算机理解人类自然语言所表达的含义和意图。(3)语音合成技术(TTS)语音合成与语音识别的过程相反,它是将计算机中的文本信息转化为可听的语音信号。一、认识智能语音语义3.智能语音语义的主要任务(1)对话管理对话管理是智能语音语义系统的核心任务之一,负责在人机交互过程中维护对话的连贯性和逻辑性。

(2)语音增强语音增强是通过信号处理技术改善语音信号的质量,去除噪声、回声等干扰因素,从而提高语音的辨识度和清晰度。(3)声纹识别声纹识别是通过分析语音信号的特征来识别说话人的身份。(4)关键词检出关键词检出是从大量的语音或文本数据中提取出用户关注的特定词汇或短语。(5)内容分析与挖掘内容分析与挖掘是对语音或文本数据进行深度分析,提取其中的语义信息、情感倾向和主题等。(6)多模态交互多模态交互是指融合语音、文字、图像、手势等多种输入方式,以实现更加自然、丰富的交互体验。(7)智能问答智能问答是指系统根据用户的问题,快速准确地生成回答。二、了解智能语音语义的应用1.智能家居智能语音语义技术在智能家居领域的应用极大地提升了家居设备的智能化水平和用户体验。2.车载娱乐智能语音语义技术在车载系统中发挥着重要作用,显著提升了驾驶的安全性、便利性及娱乐体验。3.手机助手智能语音语义技术赋予了手机更强大的交互能力,让操作更高效、沟通更顺畅。4.智慧医疗智能语音语义技术在智慧医疗领域的应用,正逐步改变着传统的医疗模式。5.智慧教育在教育信息化浪潮中,智慧教育借助智能语音语义技术,为传统教学模式带来了颠覆性的变革。6.智能安防作为新一代安防系统的“神经中枢”,智能语音语义技术突破传统被动监控模式,大幅提升了安全管理的效率与精准度。三、学会应用智能语音语义工具1.开发智能语音助手(1)语音识别工具开源工具:以CMUSphinx为代表。商业工具:如百度语音识别和科大讯飞语音识别等。(2)自然语言理解框架开源框架:NLTK(自然语言工具包)和SpaCy。深度学习框架:如TensorFlow和PyTorch。(3)语音合成工具开源工具:如eSpeak。商业工具:如百度语音合成和讯飞语音合成等。(4)AIoT语音语义平台例如:讯飞开放平台。

2.创建智能语音体下面以豆包为例介绍语音智能体的创建方法。①进入DeepSeek,输入提示词,让DeepSeek生成一段智能体的“设定描述”。②检查生成的“设定描述”是否符合要求,如果不符合要求,可以让DeepSeek继续修改。如果符合要求,可直接复制这段“设定描述”。③打开豆包,点击左上角的“+”,选择“创建AI智能体”。④将平时需要记录、提醒的事项通过语音发送给智能体,让它帮助我们记录。此外,智能体还支持在线语音通话,为用户提供即时、高效的语音交互服务。三、学会应用智能语音语义工具任务4认识机器学习学习目标理解机器学习的定义和原理了解常见的机器学习模型掌握机器学习系统的开发步骤能够利用AI开放平台构建简单的机器学习模型在学习和运用机器学习解决问题的过程中,培养问题解决能力和创新思维知识目标能力目标素养目标一、认识机器学习1.机器学习的定义1959年,塞缪尔将机器学习定义为“在不直接针对问题进行明确编程的情况下,赋予计算机学习能力的研究领域”。1998年,机器学习研究领域的知名教授汤姆·米切尔引入了三个概念:经验(Experience,E)、任务(Task,T)以及衡量任务完成效果的指标(PerformanceMeasure,P)。基于这三个概念,机器学习的定义被更加严谨地表述为:对于一个计算机程序而言,若给定一个任务T和一个衡量指标P,在经验E的影响下,该程序能够改进P对T的测量结果,则称该程序能够从E中学习。一、认识机器学习2.人工智能、机器学习和深度学习的关系人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新兴技术科学。机器学习是人工智能的子集,是实现人工智能的一种途径,是人工智能的核心。深度学习是一种机器学习方法,是机器学习的子集。深度学习能够模仿人脑的工作原理。它通过构建和训练多层神经网络来处理和解释复杂的数据,从而在图像识别、语音识别、自然语言处理等领域取得了显著的成果。一、认识机器学习3.数据集(1)数据集的基本概念数据集是指一组数据的集合,是机器学习的基础。在数据集中,常见的组成要素包括样本、特征和标签。样本也被称为观测值或数据点,是数据集中的一个独立单元。一个样本可以包含一个或多个特征,还可能包含一个标签。特征主要用来描述样本的属性或属性组合,可以是连续值、离散值或文本信息。标签主要出现在监督学习的数据集里,它是与每个样本相对应的目标变量,是希望模型能够预测的结果。一、认识机器学习3.数据集(2)数据集的划分在机器学习算法中,通常将原始数据集划分为三个部分:训练集、验证集和测试集。①训练集:用于训练模型的数据集部分。模型通过学习训练集中样本特征与标签之间的关系来构建自身的参数。训练集通常占整个数据集的大部分,一般为60%—80%。②验证集:用于在模型训练的过程中调整模型的超参数。超参数是在模型训练开始前需要人为设定的参数。通过在验证集上评估模型在不同超参数设置下的性能,可以选出最佳的超参数组合。验证集的大小通常占数据集的10%—20%。③测试集:用于评估最终模型的性能。在模型训练及超参数调整结束后,可利用测试集对模型在未见数据上的性能进行无偏估计。一、认识机器学习4.机器学习的类型(1)监督学习监督学习通过使用已知输入数据(特征)及其对应的输出结果(标签)来训练模型,使模型能够预测新的输入数据的输出结果。监督学习还可以进一步分为分类(Classification)和回归(Regression)两大类。它们的本质区别在于输出变量类型的不同。分类输出的是有限的、离散的类别标签,而回归输出的则是连续的数值。①分类。在分类任务中,目标是根据输入的样本数据特征,对其类别进行预测,其结果是离散的。②回归。在回归任务中,目标通常是一个连续的数值。一、认识机器学习4.机器学习的类型(2)无监督学习无监督学习使用没有标记的数据集来训练模型,其中的数据只有特征,没有标签。无监督学习的目标是从数据中发现隐藏的结构和模式,而不是预测特定的标签或目标。聚类是无监督学习中最常见的任务之一,它依据样本之间的相似性度量,将数据样本划分成多个相似的组别或簇。一、认识机器学习4.机器学习的类型(3)强化学习强化学习又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一。在强化学习中,智能体无须被明确指示如何执行任务,而是在与环境的交互中,通过试错来学习最优策略。智能体在环境中执行行动,并根据行动的结果接收反馈,也就是奖励。这些奖励信号会引导智能体调整自身策略,以实现长期累积奖励的最大化。一、认识机器学习5.常见的机器学习模型(1)线性回归线性回归是机器学习中常用的预测模型。该模型假设因变量(标签)与一个或多个自变量(特征)之间存在线性关系,并旨在找到最佳拟合的直线(或超平面),使得预测值与实际值之间的差异最小。线性回归公式为:y=wx+b。其中,y是因变量(标签),x是自变量(特征),w是特征权重,b是偏置项。利用给定的数据集,可以求出w和b的值。线性回归又分为两种类型:简单线性回归,仅含有一个自变量;多变量线性回归,含有两个或两个以上的自变量。(2)逻辑回归逻辑回归是一种经典的监督学习分类模型,尽管名称中包含“回归”,但其核心功能是通过自变量预测事件发生的概率,其输出范围在0到1之间,而非直接输出二分类标签。一、认识机器学习5.常见的机器学习模型(3)决策树决策树算法是机器学习中一种常用的分类与回归方法。它通过从数据集中学习简单的决策规则,实现对目标变量值的预测。(4)K-近邻K-近邻(K-NearestNeighbors,KNN)是一种基本的分类与回归方法,属于监督学习范畴。它的工作原理是在特征空间中寻找与新样本距离最近的K个训练样本点,并根据这些邻近点的信息预测新样本的类别。一、认识机器学习5.常见的机器学习模型(5)支持向量机支持向量机(SupportVectorMachine,SVM)是一种监督学习算法,用于分类与回归问题。在SVM中,我们将每个样本映射为高维特征空间中的一个点,并尝试构建一个超平面将不同类别的样本分开。超平面的选择遵循最大化两个类别之间间隔的原则。二、开发机器学习系统1.机器学习的步骤(1)收集数据在数据分析和机器学习领域,获取并准备好高质量的数据集是非常重要的环节,因为数据的质量和数量直接决定能否成功构建预测模型。常用的数据采集方式包括:①网络爬虫,通过编写爬虫程序从网页上抓取所需数据,通常在因原始数据不足而需要扩展数据的情况下使用。然而,需要注意的是,在运用网络爬虫技术时,应有所约束,确保数据的合法获取与使用,避免侵害他人权益。②API接口,一些组织会提供开放的API接口,通过这些接口可以获取规范的数据。③数据库查询,这是一种常见且理想的方式,即直接从数据库中提取数据。④文件导入,从本地文件系统或多种文件格式(如CSV、Excel)中导入数据。二、开发机器学习系统1.机器学习的步骤(2)数据准备在实际情况中,我们收集到的数据可能会有很多问题,如存在缺失值、异常值和重复值等,因此通常需要先开展数据清洗工作。具体包括:①缺失值处理,填充缺失值或删除缺失值。②异常值处理,识别和处理异常值,可以用均值、中位数等替代或直接删除。③重复值处理,去除重复的数据。在完成数据清洗后,需要进行数据转换和特征工程。①数据转换:将数据转换成适合模型处理的格式,如独热编码、标准化、归一化等。②特征工程:构建新的特征,以提高模型的性能,包括特征提取、特征选择、特征组合等。在确定数据本身没有问题后,可以对数据集进行划分,用于后面的验证和评估工作。二、开发机器学习系统1.机器学习的步骤(3)模型选择对于二分类问题(如判断邮件是否为垃圾邮件),可以选择逻辑回归、支持向量机等模型。对于多分类问题(如识别手写数字0—9),可以选择决策树、随机森林、多层感知机等模型。在回归问题中,如果数据呈现出明显的线性关系,可以选择简单线性回归模型。它通过拟合一条直线来预测目标变量的取值。当数据呈现非线性关系时,则可以使用多项式回归、支持向量回归等模型。对于无监督问题中的聚类问题(如将客户按消费行为分组),常用的模型包括K-均值聚类、层次聚类等。而在降维问题中,主成分分析可以通过线性变换将高维数据投影到低维空间,从而在减少数据维度的同时保留主要信息。(4)模型训练这个过程不需要人工参与,机器可以独立完成。二、开发机器学习系统1.机器学习的步骤(5)模型评估在模型训练完成后,就可以对模型进行评估,以确定其是否有效或有用。在本环节,之前预留的测试集将发挥作用。我们将剩余样本的特征值输入模型中,观察模型给出的结果(预测值)是否与标签一致。常用的分类评估指标包括准确率、召回率、F1分数等。通过这一过程,可以了解模型如何对尚未遇到的数据进行预测。如果模型表现不佳,则可能需要返回到前面的步骤进行调整。(6)参数调整在进行模型训练时,我们会预先设置一系列参数。通过调整这些参数,可以有效提升模型的性能表现。在此过程中,往往需要多次尝试和比较不同的超参数组合,从而找到最佳的超参数配置方案。(7)模型应用前文所阐述的各个步骤,均是为达成“模型应用”这一核心目标而服务的。二、开发机器学习系统2.海康威视AI开放平台的使用方法海康威视AI开放平台是一个专为AI从业者和企业用户设计的一站式服务平台。该平台依托全图形化操作界面,提供了从数据准备、标注到模型训练、部署的全流程一站式服务。(1)进入海康威视AI开放平台注册并登录海康威视AI开放平台,选择“一站式训练平台”中的“图像单标签分类”。进入平台界面后,页面顶部区域显示有“数据服务”和“模型服务”两个模块。“数据服务”包括数据创建、数据导入、数据查看、数据标注等服务。“模型服务”包括模型生成、模型训练、模型测试、下发模型等服务。二、开发机器学习系统2.海康威视AI开放平台的使用方法(2)新建模型进入“模型服务”,根据实际需要选择对应的训练模式和模型,填写相关信息即可创建模型。此处使用“通用算法训练”模式中的“物体检测模型”。(3)数据服务在模型创建成功后,点击“数据服务”。根据采集的猫狗图片特点,将算法模型设置为“图像分类模型/图像单标签分类模型”,创建并导入本地数据,完成数据集的创建,如图3.4.14所示。二、开发机器学习系统2.海康威视AI开放平台的使用方法(4)模型训练在数据处理完毕后,便可进行模型训练。在“模型训练”中,选择新建好的模型。在完成模型训练后,可点击“评估报告”查看训练详情和模型性能评估报告。(5)模型测试平台支持模型在线测试功能,可以模拟实际生产环境,对模型效果进行进一步评估。测试分为已有测试集测试和本地数据测试。测试集可以在“数据服务”中创建,也可选择上传本地图片进行测试。测试完成后,平台会自动生成性能评估报告,可查看、下载校验推理结果。如果对模型效果不满意,可发起模型效果分析,从而获取模型优化建议。二、开发机器学习系统2.海康威视AI开放平台的使用方法(6)下发模型在模型测试完成后,可以发布或导出模型。选择训练完成的模型及其版本,点击“确定”按钮,即可将模型下载至本地或进行在线发布,如图3.4.18所示。在线发布的模型可以通过生成的接口实现在线调用,下载后的模型可在海康AI设备(如监控摄像头)中使用。如果没有设备,可以使用模型测试功能查看新样本的预测结果。任务5认识知识图谱学习目标理解知识图谱的定义及其主要任务能够识别知识图谱在实际应用中的场景,如聊天机器人、搜索引擎、社交媒体分析等能够熟练使用知识图谱工具和库,构建简单的知识图谱在学习和运用知识图谱技术的过程中,培养问题解决能力和创新思维知识目标能力目标素养目标一、认识知识图谱1.知识图谱的定义知识图谱是指将不同类型的信息连接在一起,从而形成一个关系网络。它综合运用数学、图形学、信息可视化技术、信息科学等学科的理论知识,结合计量学中的引文分析、共现分析等方法,通过可视化图谱来展示知识的整体架构。知识图谱本质上是一种用于描述实体之间关系的语义网络,是一种半结构化数据的表示方法,可以应用于构建智能搜索引擎、推荐系统、问答系统等人工智能领域。知识图谱通过将现实世界中的信息转化为图形,实现对知识的结构化组织和表示。一、认识知识图谱2.知识图谱的基础知识(1)知识图谱的数据类型与存储方式①知识图谱的数据类型。知识图谱的数据类型主要包括结构化数据、半结构化数据和非结构化数据。在知识图谱的构建过程中,不同数据类型各有其独特的应用场景和优势。②知识图谱的存储方式。知识图谱的存储方式主要有两种:基于RDF(ResourceDescriptionFramework,资源描述框架)结构的存储方式和基于图数据库的存储方式。基于RDF结构的存储方式:RDF是一种用于表示资源描述的语义网络模型。该存储方式将知识图谱的三元组信息,即主体(subject)、谓词(predicate)和客体(object),以RDF格式进行存储和表示。基于图数据库的存储方式:图数据库是一种专门用于存储和处理图结构数据的数据库。基于图数据库的存储方式将知识图谱中的实体、属性和关系表示为图的节点和边。图数据库采用图结构存储数据,实体与关系之间的映射关系直观且清晰。一、认识知识图谱2.知识图谱的基础知识(1)知识图谱的构建基础知识图谱的构建基础主要包括实体、属性、关系等知识元素。知识图谱通过将这些元素进行抽象、分类和表示,最终形成一张图谱,使得计算机能够更好地理解和利用这些知识。①实体是知识图谱中的节点,代表现实世界中的对象或概念。②属性用于描述实体的特征和性质。每个实体都可以拥有多个属性。③关系用于描述实体之间的关联。其类型包括一对一、一对多或多对多。一、认识知识图谱2.知识图谱的基础知识(1)知识图谱的逻辑结构知识图谱通常分为数据层和模式层,两者紧密配合,类似于“实例”与“模板”的关系。数据层主要由一系列事实组成,这些事实以个体事实为单位进行存储。模式层则构建在数据层之上,主要通过本体库来规范数据层的一系列事实表达。本体(Ontology)是结构化知识库的“概念模板”,它定义了知识图谱中实体、属性以及关系的类型和约束规则。通过本体库形成的知识库具有较强的层次结构和较小的冗余度,使得知识的组织和检索更加高效。也就是说,模式层的作用是定义实体和属性、建立关系模板以及对数据进行规范化处理。一、认识知识图谱2.知识图谱的主要任务(1)数据获取知识图谱的数据获取主要依赖于知识抽取技术,这一技术能够从结构化、半结构化和非结构化数据中提取出有用的信息。知识图谱的构建是后续应用的基础,数据获取是构建知识图谱的前提条件,也是自动构建知识图谱的关键要素。除本项目任务4中提及的网络爬虫、API接口、数据库查询及文件导入等数据获取方法外,还可通过自然语言处理、众包平台、专家系统等途径获取数据。(2)信息抽取信息抽取是指从不同来源、不同结构的数据中提取事实性信息,并将这些信息提供给知识图谱进行进一步加工与处理。信息抽取的数据源可以是结构化数据(如链接数据、数据库)、半结构化数据(如网页中的表格、列表)和非结构化数据(如纯文本数据)。面对不同类型的数据源,知识抽取所需解决的技术难点及涉及的关键技术存在差异。一、认识知识图谱2.知识图谱的主要任务(3)关系构建关系构建是知识图谱构建中的关键环节,主要涉及关系分类、关系验证等步骤。信息抽取的结果可能包含多种类型的关系,因此需要对这些关系进行分类,确定其准确的语义类型。(4)知识推理知识推理是指基于已有知识获得潜在知识的过程,也可以是根据知识库中已有的规则推演出新规则。知识推理在知识问答、语义搜索等领域扮演着关键角色。(5)知识融合知识融合是将多源异构数据进行对齐、整合与推理,最终生成语义一致、结构统一的知识图谱的过程。(6)知识表示知识表示是将知识以某种形式(如符号、结构、模型)表达出来,以便存储、处理和推理的过程。二、学会应用知识图谱工具1.Neo4j数据库Neo4j是一个高性能的开源NoSQL图数据库,使用图形模型来存储数据,并支持复杂的图形查询。下面将介绍Neo4j的使用方法。(1)成为Neo4j数据库使用者登录Neo4j数据库官网,下载并安装数据库。完成后,通过网址(http://localhost:7474/)进入数据库首页。(2)构建关系实体点击左上角按钮进入数据库,再点击“PropertyKeys”创建所需的关系实体。(3)形成关系图在关系实体创建完成后,需要确定实体间的关系。点击“RelationshipTypes”,然后输入实体间的关系。二、学会应用知识图谱工具2.NRDStudio图谱NRDStudio(享岚脑图)是一款在线知识图谱制作工具,集数据编辑、可视化和分析于一体,能够全方位、多层次挖掘关系链。(1)运用DeepSeek构建知识图谱的关系数据这里以构建人工智能知识图谱为例进行介绍。在DeepSeek中输入如下提示词,自动生成JSON格式的人工智能知识数据库。二、学会应用知识图谱工具2.NRDStudio图谱(2)运用NRDStudio生成知识图谱在浏览器中打开NRDStudio,注册并登录平台。进入“我的项目”界面,点击“导入”按钮,如图3.5.7所示。点击“高级”,进入“本地导入”对话框,项目类型选择“2D图谱”(也可以选择其他类型),导入的数据类型选择“JSON”,文件类型选择“纯文本”,将DeepSeek生成的数据复制到文本数据框中,点击“开始解析”。确认各节点及其关系正确后,点击“开始导入”,平台将自动创建知识图谱。选择“文件/导出/文本文件”,点击“导出”按钮,将文件保存到本地。任务6认识人工智能芯片学习目标了解人工智能芯片的基本概念及其重要性掌握人工智能芯片的主要类型及其应用场景能够识别不同类型的人工智能芯片及其特性能够依据具体的应用场景,选择适配的人工智能芯片提高对人工智能技术发展趋势的关注度和思考能力培养对智能硬件技术的学习兴趣知识目标能力目标素养目标一、认识人工智能芯片1.什么是人工智能芯片人工智能芯片是专为高效执行人工智能计算任务设计的计算硬件。它通过融合新型计算范式与半导体创新工艺,显著提升了智能算法的能效比和实时响应能力。2.人工智能芯片的技术路线①图形处理器(GPU)②现场可编程门阵列(FPGA)③专用集成电路(ASIC)④神经网络处理器(NPU)一、认识人工智能芯片3.人工智能芯片与传统芯片的区别(1)设计目标与应用场景传统芯片:CPU和GPU是通用处理器,旨在执行广泛的计算任务,包括操作系统管理、应用程序运行和图形渲染等。AI芯片:专为加速人工智能算法(如深度学习、机器学习)而设计,能够高效处理大量并行计算任务,适用于图像识别、语音识别、自然语言处理等AI应用。(2)架构与计算能力传统芯片:CPU主要采用串行处理架构,擅长处理复杂的逻辑运算和顺序任务。GPU则采用并行处理架构,适合处理大量相同类型的计算任务,如图形渲染。AI芯片:通常采用高度并行的架构,内置大量乘加运算单元(乘加单元是机器学习和深度学习算法中的基本计算单元),专门针对矩阵乘法和向量加法等操作进行优化,以满足深度学习等AI算法的高计算性能需求。

一、认识人工智能芯片3.人工智能芯片与传统芯片的区别(3)性能

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论