版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能基础与应用第三章人工智能的应用技术导读人们主要通过视觉和听觉感知外界信息,然后由大脑对这些信息进行认知。在人工智能领域中,机器利用图像识别等技术“看”世界万物,采用语音识别等技术“听”外界的信息,使用自然语言处理和知识图谱等技术“思”万物之间的内涵。本章将介绍实现机器“看”世界、机器“听”声音、机器“思”内涵的技术,并分别设置实践体验,拉进理论知识与实践应用的距离。学习目标
熟悉图像识别、人脸识别和文字识别等机器“看”世界技术。熟悉语音识别、声纹识别等机器“听”声音技术。熟悉自然语言处理、知识图谱等机器“思”内涵技术。231素质目标01熟悉人工智能的应用技术,拓展学生的视野,增加学生的知识储备。02探究应用实践背后的技术原理,培养学生的钻研精神。
03体验技术新科技,激发学生的学习兴趣和创新思维。目录CONTENTS机器“看”世界0102机器“听”声音03机器“思”内涵机器“看”世界013.1机器“看”世界对于人们而言,可以通过眼睛看世界。要想让机器像人们一样具有“看”世界的能力,计算机就需要具备视觉感知力。计算机视觉(computervision,CV)是一门研究如何使机器“看”的学科,它属于人工智能中的视觉感知智能范畴。从人类视觉系统的角度出发,计算机视觉可形象地理解为给机器安装上“眼睛”(指摄像机等成像设备)和“大脑”(指某些智能算法),让计算机能够感知外界环境,从而实现机器“看”世界。从工程应用的角度出发,计算机视觉是指将从成像设备中获得的图像或视频进行处理、分析和理解等。计算机视觉的目标是对环境的理解和表达,核心问题是研究如何对输入的图像信息进行组织,对物体和场景进行识别,进而对图像内容给予解释。目前,实现机器“看”世界的技术有很多,其中,人们接触最多的技术有图像识别、人脸识别和文字识别。3.1机器“看”世界3.1.1图像识别图像识别是利用计算机智能算法对数字图像进行处理、分析和解释,以达到识别各种不同状态的目标和对象的技术。它的主要用途就是利用计算机对图像进行加工处理,以得到某些预期的效果,然后从中提取有用的信息,实现计算机对事物或现象的分析、描述、判断和识别。图像识别图像识别是人工智能行业应用的一个重要方向,也是机器学习最热门的领域之一。它在科学研究和工业生产中都得到了广泛应用。3.1机器“看”世界图像识别的原理人们识别图像时,会依据图像所具有的自身特征进行分类,在识别过程中,人们的大脑会根据存储记忆中已经分好的类别进行识别,查看是否有与该图像具有相同或相似特征的存储记忆,从而识别出是否见过该图像。图像识别的原理与人们进行图像识别的原理基本类似,即计算机先对图像进行处理,然后提取图像的特征,接着对这些特征进行分类,最后根据特征的分类结果确定图像的信息,从而实现图像识别。计算机对图像特征提取的效果,将直接影响计算机的图像识别效率。3.1机器“看”世界图像识别的过程图像识别的过程可归纳为3个部分,即图像获取、图像预处理和图像识别,如图1所示。图1图像识别的过程(1)图像获取部分主要是指图像采集,即借助摄像机、扫描仪或摄像头等设备(见图2)采集静态或动态图像,并将它们转换成数字图像进行存储。也可以理解为获取研究对象的基本信息并通过某种方法将其转变为机器能够认识的信息。摄像机扫描仪摄像头图2图像采集设备3.1机器“看”世界(2)图像预处理部分包括4个环节,即图像增强、图像复原、图像编码与压缩和图像分割。图像增强是指对图像进行改善,以减少图像中的干扰和噪声,突出图像中的重要特征,为后期的图像分析和理解奠定基础。图像复原是利用退化过程的先验知识去恢复已退化图像的本来面目,从而提取比较清晰的图像。图像编码与压缩是对图像的大小进行压缩,从而快速方便地在网络环境下传输图像。图像分割是指把图像分成若干个特定的、具有独特性质的区域,并提取感兴趣目标的技术和过程。(3)图像识别部分包括3个环节,即图像特征提取与选择、分类器设计和分类决策。图像特征提取与选择是指利用某种方法,研究各式各样的图像,提取图像所具有的特征,并从提取的特征中,选择对本次识别有用的特征。分类器设计是指通过训练得到一种识别规则,通过此规则可以得到特征的分类结果,提高图像识别的识别率。分类决策是指在特征空间中对待识别对象进行分类,从而更好地识别出研究对象的所属类别。图1图像识别的过程3.1机器“看”世界3.1.2人脸识别人脸识别,通常也称为人像识别、面部识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术,也是图像识别的一个研究方向。人脸识别技术主要利用摄像机或摄像头等成像设备采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行识别。人脸识别人脸识别的特点人脸与人体的其他生物特征(如指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制性为身份鉴别提供了必要的前提,与其他类型的生物识别技术相比较,人脸识别还具有如下特点。非强制性。人脸采集设备几乎可以在用户无意识的状态下获取人脸图像,即用户不需要专门配合人脸采集设备,这样的采集方式对用户而言没有强制性的要求。非接触性。用户不需要和设备直接接触,设备就能获取人脸图像。并发性。在实际应用场景中,人脸识别可以同时对多个人脸进行分拣、判断和识别。除此之外,人脸识别还符合视觉特性,即“以貌识人”的特性。而且,人脸识别的操作简单、结果直观。3.1机器“看”世界人脸识别的过程人脸识别的过程主要包含4个部分,即人脸图像采集与检测、人脸图像预处理、人脸图像特征提取和人脸图像匹配与识别,如下图所示。图人脸识别的过程3.1机器“看”世界(1)人脸图像采集与检测部分具体包含人脸图像采集和人脸检测。在人脸图像采集过程中,当用户在采集设备的拍摄范围内时,采集设备会自动搜索并拍摄用户的人脸图像。人脸检测是人脸识别中的重要组成部分。它是指应用一定的策略对采集的图片或视频进行检索,判断是否存在人脸,如果存在,则定位出每张人脸的位置、大小与姿态的过程。一张包含人脸的图像通常情况下还可能会包含其他内容,这时候就需要采用人脸检测方法定位出人脸信息,这样做可以排除图像中的干扰信息,加快人脸图像的特征提取效率,从而增强人脸图像的识别率。右图展示了人脸检测的过程。图人脸检测的过程3.1机器“看”世界(2)人脸图像预处理是在人脸检测结果的基础上,对图像进行处理,最终服务于特征提取的过程。由于系统获取的原始图像受到各种条件的限制和外在环境的干扰,往往不能直接使用,所以在图像识别过程的早期阶段需要对图像进行灰度校正、噪声过滤等预处理。对于人脸图像而言,其预处理过程主要包括人脸对齐、光照补偿、灰度变换、直方图均衡化、归一化、几何校正、中值滤波和锐化等。(3)人脸图像特征提取,也称为人脸表征,它是针对人脸的某些特征进行的,是对人脸进行特征建模的过程。人脸图像特征提取的方法可归纳为两大类,即基于知识的表征方法和基于代数特征或统计学习的表征方法。人脸识别系统可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征和人脸图像代数特征等。3.1机器“看”世界(4)人脸图像匹配与识别是指将提取的人脸图像的特征数据与数据库中存储的特征模板进行匹配,并设定一个阈值,然后通过将匹配的相似度与阈值进行比较,来判断人脸的身份信息。当匹配的相似度超过阈值时,则输出匹配得到的结果,确定人脸的身份信息;反之,匹配不成功,数据库中无此人脸的身份信息。常见的人脸图像匹配与识别过程有两种,一种是确认,即一对一进行图像比较的过程;另一种是辨认,即一对多进行图像匹配对比的过程。3.1机器“看”世界3.1.3文字识别文字识别是利用计算机自动识别字符的技术。其中,最为常见的有光学字符识别(opticalcharacterrecognition,OCR),它是通过扫描、拍摄等输入方式将各种票据、报刊、书籍、文稿及其他印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的文本的计算机输入技术。OCR的发展历程OCR的概念是在1929年由奥地利科学家古斯塔夫•陶舍克(GustavTauschek)最先提出来的。后来,美国科学家汉德尔(Handel)也提出了利用技术对文字进行识别的想法。而最早研究识别印刷体汉字的是国际商业机器(internationalbusinessmachines,IBM)公司的凯西(Casey)和纳吉(Nagy),1966年他们发表了第一篇关于汉字识别的文章,采用了模板匹配法识别了1000个印刷体汉字。文字识别OCR是计算机视觉中常见的方向之一,也是图像识别的一个研究方向,其目的是让计算机和人一样能够识字。3.1机器“看”世界早在20世纪六七十年代,世界各国就开始研究OCR了,而研究的初期,多以文字的识别方法为主,且识别的文字仅为数字0~9。中国在OCR技术方面的研究工作起步较晚,在20世纪70年代才开始对数字、英文字母及符号的识别进行研究,并于70年代末期开始研究汉字识别。早期的OCR软件,由于识别率及产品化等多方面的因素,未能达到实际的要求。同时,又由于硬件设备成本高、运行速度慢等问题,OCR软件也没有达到实用的程度。所以,只有个别部门(如信息部门、新闻出版部门等)使用了OCR软件。1986年以后,中国的OCR研究有了突破性的进展,不仅在汉字建模和识别方法上都有所创新,还在系统研制和开发应用中都取得了丰硕的成果,而且不少单位相继推出了中文OCR产品。进入20世纪90年代后,随着平台式扫描仪的广泛应用,以及中国信息自动化和办公自动化的普及,大大推动了OCR技术的发展,使OCR的识别正确率和识别速度得到了提升,从而满足了广大用户的需求。目前,随着人工智能时代的到来,深度学习技术进入了计算机视觉领域,一种全新的基于深度学习的智能OCR问世。智能OCR不仅实现了从单字识别到多字识别的跨越,还实现了对手写字体的识别。3.1机器“看”世界OCR的基本流程OCR的发展为无纸化、智能化办公提供了技术支持,其实现的基本流程可归纳为8步,即图像输入、图像预处理、版面分析、字符切割、字符特征提取、字符识别、版面恢复和后处理校正,如下图所示。图OCR的基本流程3.1机器“看”世界3.1.4实践体验:纸质文档电子化在这个智能化时代,一个智能手机就可以实现纸质文档电子化。下面大家一起来体验一下纸质文档电子化的操作过程。步骤一:安装文字识别类App。打开手机,在“应用市场”App的搜索框中输入“拍照取字”或“OCR文字识别”等与文字识别相关的文字,选择一款文字识别类App,如“拍照取字”,点击“安装”按钮进行安装,如右图所示。图1安装“拍照取字”App3.1机器“看”世界步骤二:打开文字识别类App。在手机桌面上点击“拍照取字”图标,左滑查看该App的使用介绍,然后查看《用户协议》和《隐私政策》,并勾选“同意《用户协议》和《隐私政策》”单选钮,最后点击“立即开启”按钮,如下图所示。图2
打开“拍照取字”App3.1机器“看”世界步骤三:使用文字识别类App。在“拍照取字”App的首页点击“拍照取字”图标,将摄像头对准待识别的纸质文档进行拍照,然后根据需要调整检测框,调整好之后点击下方中间的“对号”图标确认,App便开始自动识别文字了,识别结束便可得到取字结果,最后点击“保存”按钮,即可在App首页的历史记录中查询取字结果,如右图所示。图3使用“拍照取字”App机器“听”声音023.2机器“听”声音除了用眼睛看世界以外,人们还可以用耳朵听声音。要想让机器具有“听”声音的能力,计算机就需要具备听觉感知力。语言是人与人之间交流的工具,也是人与机器之间交流的阻碍,为了冲破这层阻碍,常采用语音识别技术对人们说的语言进行文本翻译,从而让机器“听懂”人们的语言。3.2.1语音识别语音识别(speechrecognition)是机器通过识别和理解将语音信号转变为相应的文本或命令的技术。它是实现语音自动控制的基础,是利用计算机自动对语音信号的音素、音节或词进行识别的技术总称。语音识别所涉及的领域包括信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等。语音识别语音识别的分类语音识别起源于20世纪50年代的“口授打字机”梦想,当时科学家在掌握了元音的共振峰变迁问题和辅音的声学特性之后,相信从语音到文字的转化过程是可以用机器实现的,即机器可以把普通的读音转换成书写的文字。近二十年来,语音识别取得了显著进步,开始从实验室研究走向市场应用。3.2机器“听”声音从不同的角度出发,可以将语音识别分为不同的类别,具体如下图所示。图语音识别的分类小词汇量是指50个词以下,中词汇量是指50~500个词,大词汇量是指500个词以上,超大词汇量是指几千至几万个词。认人识别是指只对特定的发音人识别,不认人识别是指不分发音人是谁都能识别。3.2机器“听”声音语音识别的过程语音识别的过程一般包含特征提取、声学模型、语言模型、语音解码和搜索算法4大部分,如下图所示。图语音识别的过程其中,特征提取是将待分析语音的特征从原始语音中提取出来,为声学模型提供合适的特征向量。为了更有效地提取语音的特征,需要对语音进行预处理,通常包括对语音的幅度标称化、频响校正、分帧、加窗和始末端点检测等内容。3.2机器“听”声音声学模型是可以识别单个音素的模型,是对声学、语音学、环境的变量、说话人性别、口音等要素的差异的知识表示。利用声学模型可以对语音进行声学参数分析,包括对语音共振峰频率、幅度等参数,以及对语音的线性预测参数的分析。计算机进行解码时,需要用到声学得分和语言得分。其中,声学得分由声学模型计算得到,语言得分由语言模型计算得到。语言模型是对一组字序列构成的知识表示,它根据语言学的相关理论,结合发音词典,计算某一声音信号对应的可能字序列的概率。语音解码和搜索算法的主要任务是在由声学模型、发音词典和语言模型构成的搜索空间中寻找最佳路径。3.2机器“听”声音3.2.2声纹识别声纹识别(voiceprintrecognition,VPR)和语音识别的概念相近,但是它们的用途却大不相同。人们研发语音识别的目的是为了提高人们的工作效率和生活质量,而研发声纹识别则是为了给人们高效率、高品质的智能化生活提供安全保障。声纹识别也称为说话人识别,相较于语音识别,它不仅可以捕捉语音内容,还可以根据说话人的生理特征、声波特点等参数,自动识别说话人的身份信息。声纹识别声纹识别是一种生物识别技术。除此之外,常见的生物识别技术还有人脸识别、指纹识别、手掌几何学识别、虹膜识别、视网膜识别和签名识别等。3.2机器“听”声音声纹识别的分类随着计算机技术的成熟,声纹识别也得到了迅速的发展。从不同的角度出发,声纹识别可划分为不同的类别。(1)根据实际的应用范畴,可将声纹识别分为两类,即声纹辨认和声纹确认。它们的识别目标略有不同,声纹辨认是指判定待测试语音属于目标说话人模型集合中的哪一个人,是一对多的选择问题,如图1所示。而声纹确认是确定待测试语音是否属于所声明的目标说话人,是一对一的判决问题,如图2所示。图1声纹辨认图2声纹确认不同的任务和应用会使用不同的声纹识别技术。例如,警察在缩小刑侦范围时,需要声纹辨认技术;而银行交易时,则需要声纹确认技术。3.2机器“听”声音(2)根据待识别语音的文本内容,可将声纹识别分为3类,即文本无关、文本相关和文本限定。对比这两类声纹识别,文本相关的声纹识别的语音内容匹配性优于文本无关的声纹识别。所以,一般来说其系统的性能也会相对较好,但需要用户配合,并且识别文本容易被窃取。而文本无关的声纹识别,使用较为灵活方便,用户是无感的。因此,它具有更好的推广性和适应性,适合海量后台监控场景。文本无关是指声纹识别系统对于语音文本的内容没有任何要求,说话人的说话内容比较自由随意。文本相关是指声纹识别系统要求用户必须按照事先指定的内容进行发音,系统可以精确地建立每个人的声纹模型。文本限定综合了前两者的优点,它是指识别的时候,从限定的文本库中随机提取若干词汇组合后提示用户进行下一步操作。例如,采用10个数字进行组合生成限定文本,就是一种最常用的方式。目前,科大讯飞公司的数字声纹密码系统就是采用的这种方式。这样不仅避免了文本相关的假冒录音闯入,实现还相对简单,安全性也高,是声纹识别的一大热点。3.2机器“听”声音声纹识别的过程声纹识别的过程主要包含了声纹模型训练和测试语音识别两个阶段,如下图所示。图声纹识别的过程其中,在声纹模型训练阶段,声纹识别系统预留说话人充足的语音,并对不同说话人的语音进行预处理,然后提取声纹特征,接着根据每个说话人的声纹特征进行训练得到对应的声纹模型,最后将全部说话人的声纹模型集合在一起便组成了声纹模型库。在测试语音识别阶段,声纹识别系统同样对测试语音进行预处理,然后进行声纹特征提取,接着将提取的声纹特征与声纹模型库中的声纹特征进行对比,最终根据对比结果的相似性获得识别结果。常用的语音预处理操作有语音增强、语音质量检测和有效语音提取等。3.2机器“听”声音3.2.3实践体验:语音转换文字“讯飞听见录音转文字”是由科大讯飞公司推出的以语音转文字为核心功能的系列产品和服务,它可满足多场景、多终端、多形式的语音转文字需求。下面大家一起来体验一下语音转换文字的操作过程。步骤一:安装语音转换文字类App。打开手机在“应用市场”App的搜索框中输入“语音转换文字”,然后选择一款语音转换文字类的App进行安装,如“讯飞听见录音转文字”。3.2机器“听”声音步骤二:打开语音转换文字类App。在手机桌面上点击“讯飞听见录音转文字”图标,左滑查看该App的使用介绍,然后点击“立即使用”按钮,接着查看温馨提示中的《用户协议》和《隐私政策》,并点击“同意并继续”按钮,最后使用手机号或其他方式进行登录(注意查看并勾选下方的协议复选框),如右图所示。图1打开“讯飞听见录音转文字”App3.2机器“听”声音步骤三:
使用语音转换文字类App。首先,在“讯飞听见录音转文字”App的首页点击“开始录音”按钮,进入录音界面。然后,点击下方中间位置的“话筒”按钮开始录音,录音暂停点击“暂停”按钮,录音完成点击“完成”按钮。录音完成后,点击App首页文件下方录音记录旁边的“转文字”按钮,上传音频,根据提示提交订单并完成支付。支付完成之后,在App首页便可看到转写完成的录音记录,点击这条记录可以看到转写结果,接着点击右上角的“导出”按钮,根据提示选择自己需要导出的文件格式,即可将转写结果导出到文件中,如右图所示。图2使用“讯飞听见录音转文字”App机器“思”内涵033.3机器“思”内涵人工智能更“聪明”的行为是认知行为,就是让机器能理解、能思考、能主动采取行动。为了让机器变得更“聪明”,机器就需要具备“思考”的能力。如何让机器具备这种能力呢?首要任务是机器需要理解人们的语言。如果机器和人们一样具有完整的语言体系,那么机器与人之间的交流就更加顺畅了。此外,机器还需要拥有强大的知识库。因为人与人之间能够无障碍地交流正是因为他们具有知识储备。如果机器也拥有了知识库,那么机器的自我训练和理解能力就会得到快速的提升。目前,人们通过自然语言处理技术实现了与机器的交流,通过知识图谱技术为机器构建了知识库,初步实现了机器“思”内涵。3.3机器“思”内涵3.3.1自然语言处理语言是思维的载体,是交际的主要媒介,包括口语、书面语和形体语(如哑语)等。自然语言是指人们生活中使用的语言,如汉语、英语、德语等。自然语言处理(naturallanguageprocessing,NLP)主要是研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人们生活中使用的自然语言,并实现人机之间的自然语言通信,从而进一步实现计算机代替人进行部分脑力劳动的目标。其中,部分脑力劳动主要包括查询资料、解答问题、摘录文献、汇编资料,以及一切与自然语言信息有关的加工处理。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,它主要包括自然语言理解和自然语言生成两方面内容。自然语言理解又称为计算语言学,是指将自然语言转化成易于计算机程序理解和处理的形式。自然语言生成则是将存储于计算机中的数据转化为人们能够理解的自然语言。自然语言处理3.3机器“思”内涵自然语言处理的基本框架自然语言处理不是一个独立的技术,它受到大数据、云计算、机器学习等多方面理论的支撑。自然语言处理的基本框架可用下图表示。图自然语言处理的基本框架3.3机器“思”内涵自然语言处理的过程划分自然语言是由字成词,由词成句,由句成段的一个层次化过程。因此,完整的自然语言处理也是一个层次化的过程。许多现代语言学家将这个过程划分为5个层次,如下图所示。图自然语言处理的过程(1)语音分析是根据音位规则,从语音流中区分出独立的音素,再根据音位形态规则找出音节及其对应的词素或词语的过程。(2)词法分析是从句子中切分出单词,找出词语的各个词素,从中获得单词的语言学信息并确定单词的词义。不同的语言(如英语、汉语等)对词法分析的要求是不同的。(3)句法分析是对句子或短语结构进行分析,其目的是确定构成句子的词、短语等之间的相互关系,以及它们在句子中的作用等,并将这些关系以一种层次结构表达,最后对句法结构进行规范化。句法分析的最大单位是一个句子。(4)语义分析是通过找出词义、结构意义及不同词结合的意义,确定语言所表达的真正含义或意思。常用的语义分析方法有语义文法和格文法。(5)语用分析就是研究语言所在的外界环境对语言使用产生的影响。它是自然语言处理中更高层次的研究。3.3机器“思”内涵自然语言处理的基本流程虽然自然语言处理技术可应用于多个不同的领域,但其基本流程大致相同,其中,基于语料库的自然语言处理技术的基本流程可用下图所示。(1)获取语料的常见途径有两种,即整理语料和抓取语料。整理语料是指在已有语料的基础上,对很多业务部门、公司等单位积累的大量纸质或者电子文本资料稍加整合,并把纸质的文本全部电子化就可以作为语料库。抓取语料是指在没有语料的情况下,通过网络下载国内外公开的语料库或利用爬虫技术抓取网络的公开数据构建语料库。图自然语言处理的基本流程语料是指语言材料,它是构成语料库的基本单元。通常,人们会简单地用文本表示语料,并把文本中的上下文关系作为现实世界中语言上下文关系的替代品。通常将一个文本集合称为语料库,将多个这样的文本集合称为语料库集合。3.3机器“思”内涵(2)语料预处理是自然语言处理流程中的关键步骤,语料预处理效果的好坏直接影响到自然语言处理技术的性能。语料预处理的基本过程可用下图描述。图语料预处理的基本过程数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并保证数据一致性。常用的数据清洗方法有人工去重、标记、降噪和对齐等,规则提取内容、正则表达式匹配、根据词性和命名实体提取等,编写脚本或代码批处理等。分词是指将短文本和长文本处理为最小单位粒度(词或词语)的过程。常见的分词方法有基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法和基于规则的分词方法等。其中,每种方法下面对应许多具体的算法。词性标注就是给每个词或者词语打词类标签,如形容词、动词、名词等。它有助于让文本在后面的处理中融入更多有用的语言信息。
停用词一般指对文本特征没有任何贡献的字或词,如标点符号、语气、人称等。在实际的操作中根据具体的场景决定去掉哪些停用词。3.3机器“思”内涵(3)特征工程是指将分词之后的字和词语表示成可供计算机计算的类型。常用的表示模型有词袋模型和词向量。(4)特征选择是指选择合适的、表达能力强的特征,构造好的特征向量。(5)模型训练是指利用选好的特征向量进行训练。针对不同的应用需求,要使用不同的模型。传统的机器学习模型有KNN、SVM、K-means和决策树等;深度学习模型有CNN、RNN、TextCNN和LSTM等。(6)模型评估是对训练好的模型进行评估,目的是使模型对语料具有较好的泛化能力。常用的评价指标有错误率、准确率、精确度、召回率、F1衡量、ROC曲线和AUC曲线等。3.3机器“思”内涵3.3.2知识图谱知识图谱(knowledgegraph)的概念是由谷歌公司于2012年正式提出的,当时旨在实现更智能的搜索引擎,但随着智能信息服务的不断发展,知识图谱已广泛地应用于智能搜索、智能问答、个性化推荐、大数据风控等多个领域。从本质上理解,知识图谱是一张结构化的语义网络图,用于迅速描述真实世界中存在的各种实体(或概念)及其相互关系。它通过对错综复杂的数据进行有效的加工、处理和整合,将这些数据中隐藏的实体(或概念)间关系转化为简单、清晰的三元组(“实体—关系—实体”),最后通过聚合形成一张巨大的语义网络图(见下图),从而实现知识的快速响应和推理。知识图谱图知识图谱3.3机器“思”内涵知识图谱的体系架构知识图谱的体系架构是指其构建模式的结构,它主要包含知识
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026韩山师范学院招聘辅导员20人备考题库及答案详解(夺冠系列)
- 2026重庆财经职业学院考核招聘10人备考题库含答案详解(培优a卷)
- 2026庐山云雾茶产业集团有限公司社会招聘工作人员16人备考题库及答案详解(新)
- 2026年福建省晋江一中教育集团紫帽中学关于教师应聘意向摸底的备考题库完整答案详解
- 2026国家纳米科学中心刘晶课题组招聘1人备考题库及答案详解(新)
- 2026江苏徐州市新盛集团下属润彭企管公司招聘1人备考题库含答案详解(基础题)
- 2026云南空港百事特商务有限公司招聘4人备考题库含答案详解(综合题)
- 2026江苏南京大学物理学院专业、技术人员招聘备考题库(含答案详解)
- 2026四川宜宾高县硕润建设开发有限公司招聘2人备考题库及答案详解(必刷)
- 2026年河南省南阳市事业单位公开联考招聘755名备考题库及参考答案详解一套
- 2025版国际护士节护士压力与情绪管理讲座课件
- 更正登记申请书范本律师
- 黄帝文化精髓与民族精神
- 2026年人教版八年级数学下册 第十九章 二次根式 单元检测基础测试卷(含答案)
- 2025年《地质与矿业工程基础》真题(附答案)
- 2021公路项目安全性评价规程
- 康复护士进修结业汇报
- 2025年11月广东深圳市公办中小学招聘教师454人(编制)(公共基础知识)测试题附答案解析
- 胃食管反流常见症状及护理方法培训
- 消防交通安全培训课件下载
- 采伐安全施工技术交底
评论
0/150
提交评论