人工智能技术导论(微课版)课件 张寺宁 第1-3章 初识人工智能 -机器学习经典算法介绍_第1页
人工智能技术导论(微课版)课件 张寺宁 第1-3章 初识人工智能 -机器学习经典算法介绍_第2页
人工智能技术导论(微课版)课件 张寺宁 第1-3章 初识人工智能 -机器学习经典算法介绍_第3页
人工智能技术导论(微课版)课件 张寺宁 第1-3章 初识人工智能 -机器学习经典算法介绍_第4页
人工智能技术导论(微课版)课件 张寺宁 第1-3章 初识人工智能 -机器学习经典算法介绍_第5页
已阅读5页,还剩204页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章

初识人工智能学习目标

了解人工智能的定义、起源与发展、产品的分类、学派和研究领域。

了解人工智能、机器学习与深度学习的关系。

了解人工智能的学习路线和岗位需求。1.1人工智能简介1.2人工智能的起源与发展1.3人工智能的分类1.4人工智能的学派1.5人工智能、机器学习与深度学习的关系1.6人工智能的研究领域1.7人工智能的人才需求1.1人工智能简介1.1人工智能简介

人工智能是当今非常流行的名词。那么,到底什么是人工智能呢?1.数字人

在每年的“双11”、“双12”大促中,直播带货是许多商家销售商品的一条重要渠道。近些年,在各大平台的直播间,出现了一些新面孔——数字人主播。数字人是基于人工智能技术和虚拟仿真技术构建的数字化虚拟人物。数字人主播具备贴近真人的形象、声音和动作表现,能够即时向观众介绍产品特点、解答疑问,甚至进行互动。与真人主播相比,数字人主播能够24小时直播、快速切换直播形象、减少直播成本,解决了许多商家备战大促的难题。此外,数字人还能够应用在长/短视频生成、课件录制、新闻播报、企业招聘、知识分享、会议培训等场景。利用人工智能的多模态交互和生成能力,用户只需输入文案或上传录音,即可自动生成由数字人呈现相关内容的视频。1.1人工智能简介2.无人机

人工智能技术的应用拓展了无人机的应用场景。尤其是在“低空经济”政策的支持下,无人机在诸多领域得到了广泛的应用,其中典型的应用就是无人机智能巡检。无人机智能巡检是一种将无人机技术与人工智能、计算机视觉、图像处理、大数据分析等现代信息技术相结合的新型巡检方式,主要用于替代或辅助传统的人工巡检,在多个领域进行高效、精准和安全的巡查工作。例如,交管部门可以利用无人机搭载高清摄像头巡检高速公路,采集图像及视频,自动识别异常行为、车辆特征等关键信息,以便快速定位问题,缩短响应时间。城管部门可以利用无人机搭载高清摄像头巡检城市街道,采集图像及视频,智能识别违法施工、摊贩占道经营等城市治理问题。森林消防部门可以利用无人机搭载高清摄像头巡检山林,及时发现森林火灾、山体滑坡、树木倒地等险情和隐患,缩短了有关人员对险情和隐患的响应时间。1.1人工智能简介3.小爱同学个人智能助手

小爱同学个人智能助手是小米旗下的人工智能交互引擎。它采用了先进的人工智能技术,能够准确识别用户的语音指令,并在极短的时间内做出响应。无论是查询天气、播放音乐,还是设定闹钟、发送信息等,用户只需简单地对着手机或其他支持小爱同学个人智能助手的设备发出语音指令,小爱同学个人智能助手就能迅速理解并执行,极大地提高了用户的操作效率。除了基本的查询操作和任务执行,小爱同学个人智能助手还提供了丰富的功能和服务。用户可以通过它与智能家居设备连接,实现语音控制,享受智能生活。1.1人工智能简介

通过以上3个例子,归纳的共性如下。

(1)它们都是人工制造产品,不存在于自然界。

(2)它们都是智能化产品,都能提供智能化功能,这些功能的实现都依赖于数字计算机。

综上所述,人工智能是利用数字计算机或数字计算机控制的人工制造产品来模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能是一门综合学科,它融合了计算机科学、数学、神经科学和社会学等多个学科。目前,人工智能技术主要被用来模拟人类,实现识别、认知、分析、决策等多种功能,可总结为4个字:听、说、写、看。例如,当我们说一句话时,机器能够识别成文字,理解我们所表达的意思,并和我们对话;工厂生产线通过摄像头采集产品数据,经过智能分析,自动分拣合格产品和不合格产品。1.2人工智能的起源与发展1.2人工智能的起源与发展

人工智能技术起源于20世纪50年代,其发展历程可分为3个阶段。1.2人工智能的起源与发展

1.第一个阶段(20世纪50年代末—20世纪70年代末)1950年,艾伦·图灵在《计算机器与智能》一文中提出图灵测试,这是机器是否具有智能的重要测试手段。按照图灵的设想,如果一台机器能够与人类开展对话而不被人类辨别出其机器身份,那么这台机器就具有智能。1951年,世界上第一台模拟神经网络的计算机问世。1956年,计算机科学家约翰·麦卡锡在达特茅斯会议上首次提出“人工智能”这一概念,这标志着人工智能这个新的研究领域的正式诞生。1959年,亚瑟·塞缪尔提出了“机器学习”这一术语。机器学习是指机器通过学习来获取智能。

很多学者对机器向人工智能发展充满了信心,甚至认为“二十年内,机器将能完成人能做到的一切”。1.2人工智能的起源与发展

2.第二个阶段(20世纪70年代末—20世纪90年代末)20世纪70年代末期至20世纪80年代中期,专家系统开始兴起。专家系统是一类智能的计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验。它能够应用人工智能技术,根据系统中的知识与经验进行推理和判断,模拟人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题。

然而,随着专家系统应用的不断深入,它暴露出一些问题(如知识获取难、知识范围窄、推理能力弱、实用性差等),由于这些问题在当时难以克服,人工智能的发展进入低谷期。1.2人工智能的起源与发展

3.第三个阶段(20世纪90年代末至今)20世纪90年代,随着人工智能技术,尤其是神经网络技术的发展人工智能技术进入稳步发展期。1997年,IBM公司研发的深蓝(DeepBlue)计算机战胜国际象棋世界冠军加里·卡斯帕罗夫,成为首个战胜国际象棋世界冠军的计算机。2006年,杰弗里·辛顿开创了机器学习的新分支——深度学习。深度学习的核心思想是利用深度神经网络进行机器学习。深度学习的出现为人工智能的发展产生了深远影响。2010年后,随着“大数据”时代的到来,计算机的运算能力显著提升,机器学习算法不断优化,人工智能进入爆发增长期。1.2人工智能的起源与发展

随着人工智能技术的快速发展,产业界也涌现出大量创新成果。2011年,IBM的Waston自动问答系统在智力竞赛电视节目《危险边缘!》中战胜了最高奖金得主和连胜纪录保持者。2012年,谷歌大脑通过模仿人类大脑,利用非监督深度学习方法从大量视频中成功识别出一只猫。2014年,微软公司推出了实时口译系统,可以模仿说话者的声音并保留其口音;同年发布了个人智能助理产品——微软小娜(Cortana)。2016年,谷歌研发的AlphaGo在围棋比赛中击败了世界冠军李世石。2017年,苹果公司推出了升级版的智能私人助理Siri和智能音箱HomePod。2022年,OpenAI推出了ChatGPT-3对话系统,2023年,OpenAI发布了更强大的多模态大模型——GPT-4。

国内也涌现出众多大模型产品,如百度的“文心一言”、科大讯飞的“讯飞星火”和阿里云的“通义”等。1.3人工智能的分类1.3.1弱人工智能

人工智能总体上可以分为3类,分别是弱人工智能、强人工智能和超人工智能。1.弱人工智能

弱人工智能是指不能真正实现推理和解决问题的人工智能。迄今为止,大部分的人工智能系统是实现特定功能的专用智能系统,不像人类那样能够不断适应复杂的新环境并掌握新技能,因此属于弱人工智能产品。

目前,弱人工智能在语音识别、图像处理和物体分割、机器翻译等方面取得了重大突破,其智能化水平接近或超越人类的水平。典型的弱人工智能产品有人脸识别系统、目标检测系统、工厂自动分拣生产线、AlphaGo机器人等。1.3.2强人工智能

2.强人工智能

弱人工智能发展的下一个阶段就是强人工智能。强人工智能是指具有高度类人思维的智能,这类系统具有知觉和自我意识。强人工智能可分为类人与非类人两大类。

达到人类水平的、能够自主应对外界环境挑战、具有自我意识的人工智能称为强人工智能产品。

强人工智能和弱人工智能的根本区别在于,强人工智能有自己的思考方式,能够进行推理,制订并执行计划,并且拥有一定的学习能力,能够在实践当中不断进步。有些强人工智能甚至拥有自己的感情,在做同一件事时比人类做得更好。强人工智能在技术研究与实现上面临非常大的挑战,在短期内是难以实现的。1.3.3超人工智能3.超人工智能

超人工智能是指在所有领域的表现都显著超越人类表现的智能机器。在超人工智能阶段,人工智能将突破“瓶颈”,其计算和思维能力将远超人类。超人工智能产品将拓宽人类的理解和想象,打破人类受到的限制,促进社会发展。目前,我们距离实现超人工智能还很遥远。1.4人工智能的学派1.4.1符号主义

人工智能领域影响较大的学派主要有符号主义、联结主义、行为主义和仿真主义等。1.符号主义

符号主义(Symbolism)是一种基于逻辑推理的智能模拟方法,又称为逻辑主义、心理学派或计算机学派。

符号主义认为人工智能源于数学逻辑,数学逻辑可以用于描述智能行为。符号主义将人的认知思维看作一个个的符号,认为认知过程是符号的运算过程。符号主义认为用计算机的符号操作能够模拟人的认知过程。通过研究人类认知系统的功能机理,用符号描述认知过程并输入计算机,就能实现人工智能。专家系统就是符号主义的产物,其成功开发与应用对人工智能从理论走向实际应用具有重要的意义。即便后来出现其他学派,符号主义仍然是人工智能的主流学派之一。1.4.2联结主义1.4.2联结主义

联结主义(Connectionism)是一种基于神经网络及其网络间的连接机制与学习算法的智能模拟方法。联结主义认为人工智能源于生物仿生学,特别是对人脑模型的研究。1943年,神经科学家沃伦·麦卡洛克和逻辑学家沃尔特·皮茨提出了一种神经网络模型,即MP(McCulloch-Pitts)模型,开创了用电子装置模仿人脑结构和功能的新途径,MP模型也成为联结主义的代表性成果。MP模型从神经元开始,研究神经网络模型和脑模型,为人工智能开辟了新的发展方向。联结主义基于神经生理学和认知科学的研究成果,认为人的智能是人脑活动的结果,是由大量简单的单元通过复杂的相互连接后并行运行的结果。

1986年,戴维·鲁梅尔哈特等人提出多层网络中的反向传播(BackPropagation,BP)算法,为神经网络计算机的实用化奠定了基础。BP算法也衍生出很多改进版本。1.4.3行为主义1.4.3行为主义

行为主义(Behaviorism)又称进化主义或控制论学派,是一种基于“刺激—反应”的行为智能模拟方法。行为主义起源于20世纪初的心理学机理主义流派。行为主义认为,行为是有机体用以适应环境变化的各种身体反应的组合,行为主义的理论目标在于预见和控制行为。

在20世纪40年代—20世纪50年代,控制论思想成为时代思潮的重要组成部分。例如,诺伯特·维格和沃伦·麦卡洛克等人提出了控制论和自组织系统,钱学森等人提出了工程控制论和生物控制论。控制论认为,神经系统的工作原理与信息理论、控制理论、逻辑以及计算机科学密切相关。

控制论早期的研究工作是模拟人在控制过程中的智能行为和作用,例如,对自寻优、自适应、自校正、自镇定、自组织和自学习等控制论系统的研究。

在20世纪60年代—20世纪70年代,控制论系统的研究取得了一定进展。在20世纪80年代,智能控制和智能机器人系统诞生。1.4.4仿真主义1.4.4仿真主义

仿真主义认为,实现人工智能要从人的大脑结构入手,通过制造先进的大脑探测工具从结构上解析大脑,再利用工程技术手段构造出模仿大脑神经网络的神经元及结构的仿脑装置,最后通过环境刺激和交互训练仿脑装置实现类人智能,归纳起来就是“先结构,后功能”。例如,可以利用通用计算机作为逻辑推理等智能的实现载体,按照仿真主义“仿制大脑”的思想,设计并制造全新的软硬件系统,实现“类脑计算机”(又称为“仿脑机”)的研制。“类脑计算机”将是仿真主义的标志性成果,也将是通向强人工智能之路的重要里程碑。虽然研制类脑计算机十分困难,但是在科技发达的未来未必不能实现。1.5人工智能、机器学习与深度学习的关系1.5人工智能、机器学习与深度学习的关系

人工智能赋予人工制造产品类似人的智能化功能。这种智能化功能是如何实现的呢?机器学习是一种实现人工智能的方法。1.机器学习

举个例子,如果要把一筐水果中的苹果挑出来,但之前没有见过苹果,是没有办法完成任务的。这种情况下,需要先通过直接学习(自学)或者是间接学习(由其他人告知)来确定苹果的特征,然后根据学习到的苹果的特征来分辨筐里的水果是不是苹果。同样的道理,如果要实现智能分拣,把这件工作交给机器去完成,就必须要事先让机器知道什么是苹果、苹果有哪些特征。然后机器利用学习到的苹果的特征去分拣苹果。这个过程就是机器学习。

机器学习中基本的做法是使用算法来解析数据,从数据中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务而采用硬编码的软件程序不同,机器学习采用大量的数据进行“训练”,通过各种算法从数据中学习如何完成任务。1.5人工智能、机器学习与深度学习的关系

例如,当用户浏览网上商城时,经常会出现商品推荐信息。网上商城根据用户以往的购物记录、浏览过的商品和收藏清单,识别出的用户可能感兴趣、并且愿意购买的商品,提升商品销售率。

机器学习算法起源于早期的人工智能研究,包括决策树算法、聚类算法、贝叶斯分类算法、支持向量机算法、最大期望(ExpectationMaximization,EM)算法、自适应增强(AdaptiveBoosting,AdaBoost)算法等。机器学习算法按照学习方法分类可分为监督学习算法(用于解决分类问题等)、无监督学习算法(用于解决聚类问题等)、半监督学习算法、深度学习算法和强化学习算法等。1.5人工智能、机器学习与深度学习的关系2.深度学习

深度学习算法是当前热门的一种机器学习算法。深度学习算法并不是一种独立的算法,它依赖于传统的监督学习算法和无监督学习算法来训练深度神经网络。深度神经网络是一类包含多个隐藏层的神经网络。为了提高深度神经网络的训练效果,通常会对神经元的连接方法和激活函数等方面进行相应的调整。1.5人工智能、机器学习与深度学习的关系

对比传统机器学习算法和深度学习算法的执行流程可以发现,输入原始数据后,深度学习算法会利用数据进行学习,其学习到的基础特征是机器自主提取的,无须人为干预,学习的成果更贴近实际。而传统机器学习算法基于数据样本进行学习,其学习到的特征是人工提取的,学习的成果更具主观性。深度学习拓展了人工智能的应用范畴,一些用传统机器学习算法不能解决的问题,可以尝试用深度学习算法来解决。1.5人工智能、机器学习与深度学习的关系

人工智能、机器学习与深度学习的关系:机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的方法。1.6人工智能的研究领域1.6人工智能的研究领域

人工智能是使人工制造产品能够模拟、延伸和扩展人的能力的智能,人工智能的研究领域也应该和人所需要具备的能力相对应。1.6.1感知能力

人的感知能力主要分为视觉、听觉、触觉、嗅觉等,但是由于技术水平限制,目前大部分人工智能设备(如机器人)仅在视觉、听觉领域实现了特定的功能,还未涉及触觉、嗅觉领域。视觉、听觉对应的人工智能研究领域即计算机视觉和语音识别。1.计算机视觉

计算机视觉是指用摄影机和计算机代替人眼对目标进行跟踪、识别、分析、处理等操作。形象地说,计算机视觉的目标就是给计算机安装上“眼睛”(摄影机)和“大脑”(算法),让计算机能够感知环境。

计算机视觉技术目前主要运用在图像识别(如简单几何图形识别、人脸识别、印刷或手写文字识别、车辆识别等)、目标跟踪(如识别并跟踪运动的物体)、场景重建(如机器人将它看到的东西用语言描述出来或“画”出来)、图像恢复(如恢复有缺陷、被遮挡的图像或者模糊不清的图像)等场景。1.6.1感知能力2.语音识别

语音识别是指让机器通过识别和理解,把人类的语音信号转变为相应的文本或命令的过程。通俗地说,语音识别的目标就是给机器安装上“耳朵”,让机器能够“听懂”。语音识别的过程分为训练阶段和识别阶段。当前,语音识别的方法主要是模式匹配法。在训练阶段,用户将词汇表中的每一个词依次说一遍,机器将用户语音的特征矢量作为模板存入模板库。在识别阶段,机器将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较,将相似度最高的模板作为识别结果输出。根据识别对象的不同,语音识别任务大体可分为3类,单个词语识别(识别事先已知的单个词语,如“开机”“关机”等)、关键词识别(识别语音中是否包含特定关键词)和连续语音识别(识别一个句子或一段话)。1.6.2语言能力

语言能力对应的人工智能研究领域是自然语言处理(NaturalLanguageProcessing,NLP)。自然语言处理是人工智能领域中重要的研究方向。它研究人与计算机之间用自然语言进行有效沟通的各种理论和方法。自然语言处理是一门融合语言学、计算机科学和数学的交叉学科。自然语言处理的应用包括语音转文字、文字转语音、文本语义抽取、文本情感分析、文本分类、文本分词、语法分析等。由于自然语言文本和对话在各个层次上都具有歧义性或多义性,因此同一句话在不同的应用场景或不同的上下文中表达的意思可能完全不同。这给机器理解和生成自然语言文本和对话造成了很大困难。1.6.2语言能力

目前,自然语言处理技术主要运用在以下几个方面。1.机器翻译

机器翻译是将一种自然语言翻译成另一种自然语言的过程、技术和方法。谷歌、百度等人工智能行业代表公司都推出了自己的机器翻译平台,占据着机器翻译领域的主导地位。2.垃圾邮件过滤

自然语言处理技术通过分析邮件中的文本内容,能够比较准确地识别垃圾邮件。例如,基于贝叶斯算法的垃圾邮件过滤技术通过学习大量的垃圾邮件和正常邮件,提取邮件中的特征词,构建垃圾词库和正常词库,然后根据词频统计计算出收到的邮件属于垃圾邮件的概率,并以此作为依据进行判断。3.文本情感分析

文本情感分析作为自然语言处理技术的一种常见应用,可以从大量数据中识别和总结相关信息,还可以理解这些信息更深层次的含义。例如,企业分析消费者对产品的反馈,特别是评论中的差评等。4.自动问答

自动问答通过正确理解用户提出的问题,提取关键信息,在已有的语料库或者知识库中进行检索匹配,最终将获取的答案反馈给用户。1.6.3记忆能力

人类能够凭借记忆记住学习过的知识,是因为大脑存储了知识的表示形式。那么机器如何获得记忆能力呢?

知识表示是帮助机器获得记忆能力的一项技术,这项技术决定着机器如何学习知识。知识是信息接收者通过对信息的提炼和推理而获得的正确结论,是对自然世界、人类社会的认识和理解,是通过重新组合得到的系统化的信息集合。知识表示就是将知识符号化并输入计算机的过程和方法。同一种知识可以采用不同的方法表示。反过来,一种知识表示方法可以表达不同的知识。知识表示中最难表示的就是常识。例如,描述“狗”,不能说“会吐舌头的就是狗”,也不能说“4条腿的就是狗”。有的狗虽然只有3条腿,但它也是狗。甚至有时候你并没有看见狗,只听见“汪汪”的叫声,也知道那是狗。在人工智能中,帮助机器获得记忆能力的算法很多,如第4章要介绍的Hopfield神经网络,该网络具有记忆功能,能够用来识别带有噪声污染或残缺的图像。Hopfield神经网络事先学习并记住了完整的数字1和2的图像,并利用记忆正确识别带有噪声污染或残缺的数字1和2的图像。1.6.4推理能力

人的推理基于知识,机器的自动推理也是基于知识的。有了知识,我们就可以通过推理得到新知识,或直接利用旧知识推理得出解决问题的新方法。目前,即使是利用深度学习技术的机器仍未具备很强的推理能力。虽然人工神经网络起源于人脑神经网络,但人工神经网络的工作方式与人脑神经网络的存在差别。首先,在大多数情况下,人工神经网络都需要成千上万的数据来训练。如果想让人工神经网络执行一种新的任务,就必须从头开始训练该网络。其次,人工神经网络,即使是深度神经网络,也难以利用训练得到的抽象知识,对未知问题进行推理。1.6.5规划能力

人具有规划能力,能够对要做的事情进行规划。机器要实现智能化,也需要有规划能力。自动规划主要是指机器对解决某个实际问题的最优决策、路线、动作的选取。例如,当自动驾驶汽车在行驶过程中时,可以借助传感器感知到周围的环境变化,通过自动规划算法来决定行进路线。再如,一个机器人要搬动某工件,必须先移动到该工件附近,再抓住该工件,然后带着该工件沿着预定的路径移动到目的地。这些都离不开高性能、高精度的自动规划算法。1.6.6学习能力

人具有学习能力,能够通过学习不断提升自身的水平。机器要实现智能化,也需要具有学习能力,能够总结经验、修正错误、发现规律、提升性能,具备更强的环境适应能力。机器学习是机器智能化的一个主要途径,它是通过运行各种不同的机器学习算法来实现的。不同的机器学习算法在不同的场景下,学习性能各不相同。机器学习算法主要分为传统机器学习算法和基于大数据的机器学习算法。传统机器学习算法在学习时只使用少量数据样本,具有局限性。基于大数据的机器学习算法在学习时使用海量数据,再结合深度学习算法,进一步拓展了人工智能的应用领域。例如,文心一格人工智能艺术和创意辅助平台利用深度学习、强化学习等技术学习了大量不同风格的绘画作品,不断提高生成绘画作品的准确性和质量。随着时间的推移,该平台生成的绘画作品的效果已经达到甚至超越人类创作的绘画作品的效果。1.7人工智能的人才需求1.7人工智能的人才需求

目前,我国人工智能的发展方向主要以技术应用为主。1.7人工智能的人才需求

人工智能技术应用型人才的技能需求:1.数学基础

人工智能技术应用型人才需要具备一定的数学基础。人工智能涉及大量的数学知识,包括高等数学、线性代数、概率论与数理统计等的知识。高等数学中涉及微积分等概念,能够优化算法,辅助理解和建模复杂问题。线性代数可用于描述和求解高维空间中的问题。概率论与数理统计则是人工智能中进行概率计算和推理的关键工具。2.计算机基础

人工智能技术应用型人才需要熟练使用计算机,需要掌握至少一门编程语言(如Python、Java等),用来实现和应用机器学习算法。机器学习算法涉及很多的数据结构与算法,了解常用的数据结构与算法能更好地理解和实现机器学习算法。此外训练模型需要和数据库进行交互,因此要熟悉数据库的使用。

3.人工智能技术

人工智能技术应用型人才需要借助Python爬虫和开源数据集采集数据;了解人工智能基础算法,包括机器学习算法、深度学习算法、神经网络算法等的基本原理和使用方法;掌握人工智能开源框架(如TensorFlow、PyTorch、Caffe等)的基本原理和使用方法。1.7人工智能的人才需求

由人工智能技术应用型人才的技能需求得出人工智能的学习路线:学习路线中前期课程主要涉及微积分、矩阵、向量、概率计算等数学知识和编程语言、数据库、数据可视化、数据分析等计算机基础知识。中期课程主要涉及数据采集和监督学习、无监督学习、半监督学习、强化学习、深度学习等机器学习常用算法的原理和使用。后期课程主要涉及TensorFlow、PyTorch、Caffe等主流的人工智能开源框架的原理和使用。

1.7人工智能的人才需求

人工智能技术应用型人才的就业岗位相对丰富,如人工智能开发工程师、人工智能算法工程师、Python爬虫研发工程师等。

人工智能开发工程师:负责智能人机交互方案和技术研究,参与相关产品的原型验证和开发;负责机器学习、智能控制等方面的技术研究和方案设计开发工作;

人工智能算法工程师:负责视觉算法的移植和优化,包括应用于人脸识别、物体检测、物体识别、场景识别的算法的移植和优化等研发工作;Python爬虫开发工程师:参与分布式爬虫和数据采集系统的设计和开发;负责制订网络数据爬取规划,定期爬取指定网站的数据;

人工智能架构工程师:负责智能中台、智能语音机器人、智能知识库、语音分析和文本挖掘、声纹识别等人工智能应用的系统架构规划、设计及调优

大模型算法工程师:负责多模态大模型的结构设计、预训练、评测等工作;参与大模型,例如LLM(LargeLanguageModel,大语言模型)的训练、部署、优化环节;

THANKS

谢谢第二章

人工智能应用案例学习目标

了解人工智能技术在城市治理领域的应用。

了解人工智能技术在教育领域的应用。

了解人工智能技术在制造业领域的应用。

了解人工智能技术在医疗领域的应用。

了解人工智能技术在构建用户画像、智能推荐领域的应用。2.1阿里云城市大脑2.2科大讯飞英语听说智能测试系统2.3海尔COSMOPlat工业互联网平台2.4腾讯觅影2.5爱奇艺智能网络视频云服务平台2.1阿里云城市大脑2.1.1需求背景

我国的信息化建设已经取得了阶段性成果,并积累了海量数据。然而,各部门采用的信息化管理系统和平台大都按照传统的信息化模式建设,建设标准和运行模式不统一,不能很好地互通和协同运行,这导致了信息孤岛的产生。各类数据资源相互割裂,数据的共享和开放程度低。这种情况下不能很好地挖掘和利用数据的价值。城市大脑可以很好地解决上述问题。

1.城市治理模式突破

以城市数据为资源,解决城市治理中的问题,实现城市治理智能化、集约化、人性化。

2.城市服务模式突破

随时随地为组织和个人提供针对性服务,使城市服务更加高效,同时有效节约城市公共资源。

3.城市产业发展突破

共享、开放的城市数据是重要的产业发展资源,对产业发展起着催生、带动作用,能促进传统产业转型升级。2.1.2阿里云城市大脑简介

2016年,阿里云发布了智能城市解决方案——城市大脑。城市大脑是基于云计算、大数据、人工智能、物联网等新一代信息技术构建的人工智能开发创新和运营的平台。城市大脑通过阿里云数据资源平台对企业数据、公安数据、政府数据、运营商数据等多种城市数据进行汇聚,同时应用机器学习算法等人工智能技术,对城市运行状态进行全局的实时分析,及时修正运行缺陷,推动城市可持续发展。2.1.2阿里云城市大脑简介

阿里云城市大脑3.0架构主要分为“云”“脑”“端”3层。(1)稳定的“云”“云”通过视频联网平台城市基础网络、物联网平台和区块链平台等进行全网数据实时汇聚,让数据成为城市的资源。城市大脑能保障数据的安全性,提升数据质量,通过数据调度发挥数据价值。其中,飞天云平台为城市大脑提供足够的计算能力。(2)强大的“脑”“脑”使用数据和业务双中台架构,通过云计算、大数据以及互联网高可用技术,优化和完善城市运行管理业务体系,实现各个环节与各部门之间的无障碍沟通,实现数据及时上传,消除信息孤岛现象。“脑”通过深度学习技术和各种机器学习算法挖掘数据资源中有价值的信息,让城市具备“思考”能力。(3)灵活的“端”“端”基于各种应用场景构建各种信息技术服务,包括交通治理、智慧应急、智慧监管等,这些信息技术服务给政府和社会公众带来便利,构建绿色、低碳、环保的智慧城市,推动产业生态的繁荣发展。。2.1.2阿里云城市大脑简介2.1.2阿里云城市大脑简介

阿里云城市大脑的技术支撑。

(1)性能成本双领先的大数据计算能力

城市大脑采用阿里云自主研发的云原生大数据计算服务MaxCompute进行海量数据计算。MaxCompute是一款性能高、成本低,运算效率高的大数据计算集群。

(2)海量多源数据规模化处理与实时分析

城市大脑实时汇聚全网数据,让数据成为资源,可实现EB级的数据存储和PB级别的日均数据处理能力,以及计算请求秒级响应。

(3)实时视频识别及自动巡检

城市大脑利用图像识别技术实时分析杭州3000多路视频,视频利用率显著提高,实现车辆图搜以及视频实时自动巡检,在特定光照条件下,低分辨率车辆检测准确率有效提高。

(4)类脑神经元网络物理架构

城市大脑在百亿节点万亿边级别网络上处理EB级别数据,通过模糊认知反演算法,发现复杂场景背后的关联情况,已成功应用到道路交通、工业制造和其他领域。2.1.2阿里云城市大脑简介

阿里云城市大脑的技术支撑。

(1)性能成本双领先的大数据计算能力

城市大脑采用阿里云自主研发的云原生大数据计算服务MaxCompute进行海量数据计算。MaxCompute是一款性能高、成本低,运算效率高的大数据计算集群。

(2)海量多源数据规模化处理与实时分析

城市大脑实时汇聚全网数据,让数据成为资源,可实现EB级的数据存储和PB级别的日均数据处理能力,以及计算请求秒级响应。

(3)实时视频识别及自动巡检

城市大脑利用图像识别技术实时分析杭州3000多路视频,视频利用率显著提高,实现车辆图搜以及视频实时自动巡检,在特定光照条件下,低分辨率车辆检测准确率有效提高。

(4)类脑神经元网络物理架构

城市大脑在百亿节点万亿边级别网络上处理EB级别数据,通过模糊认知反演算法,发现复杂场景背后的关联情况,已成功应用到道路交通、工业制造和其他领域。2.1.3阿里云城市大脑实践应用

1.城市事件感知与智能处理

城市大脑通过视频识别交通事故、拥堵状况,融合互联网数据及接警数据,即时、全面地对城市突发情况进行感知;结合智能车辆调度技术,对警车、消防车、救护车等各类特种车辆进行联合指挥调度,同时联动信号灯,让与紧急事件相关的车辆优先通行。城市大脑增加了被智能发现的事件的数量,降低了响应和处理事件的平均时长。2.社会治理与公共安全

城市大脑用视频分析技术为整个城市建立预警体系,使有关部门能够采取预防措施,确保公众的安全。城市大脑能加强安全保障,缩短应急响应时间,实现防患于未然2.1.3阿里云城市大脑实践应用3.交通评价与信号灯配时优化

城市大脑通过高德地图实时定位、视频数据的融合,对高架和地面道路的交通状况进行全面评价,精准锁定拥堵地点,分析拥堵原因,通过对信号灯配时的优化,降低拥堵指数,缩短通行时间。

4.公共出行与运营车辆调度

城市大脑通过视频数据、来自高德等位置服务提供商和运营商的数据对人群密集区域进行有效的监控,测算所需要的运力。城市大脑根据运力需求调整和规划公交车班次、接驳车路线、出租车数量,降低重点场馆与重要交通枢纽的滞留率,提高公共出行的效率。2.2科大讯飞英语听说智能测试系统2.2.1需求背景

随着国际交流的日益增多,英语交流能力越来越重要。虽然国家、社会、学校都很重视英语教学工作,但是由于缺乏有效的评估和教学手段,“哑巴英语”等现象仍然大量存在。目前,全国很多地区都已开展高考英语听力考试和口语加试,在未来的教育中,英语听说考试将占据越来越重要的地位。2.2.2科大讯飞英语听说智能测试系统简介

科大讯飞英语听说智能测试系统实现了英语听说考试全过程的自动化与智能化,该系统由考试信息管理、试卷制作、现场考试、评分4个子系统构成,支持短文朗读、情景反应、角色扮演、口语表达、话题复述等主流题型。2.2.2科大讯飞英语听说智能测试系统简介

科大讯飞英语听说智能测试系统的核心技术为科大讯飞语音评测技术,如图2-8所示。科大讯飞语音评测技术能自动对发音水平进行评价,识别错误发音,进行缺陷定位和问题分析,分析维度包括准确度、流畅度、完整度、意群停顿、连读、重读、句末升调,每一维度都能得到对应的评测结果。科大讯飞语音评测技术的评测对象可以是词、句、篇章,也可以是音节、音素等更细节的维度。科大讯飞语音评测技术主要可分为两个部分:中文普通话发音水平自动评测技术和英文发音水平自动评测技术。2.2.3科大讯飞英语听说智能测试系统实践应用

在2012年广东省科技鉴定中,科大讯飞智能语音评测技术的计算机评分相关度超过所有专家,平均误差低于所有专家,整体效果方面全面超过人工评分。2.3海尔COSMOPlat工业互联网平台2.3.1需求背景

在制造强国目标的号召下,许多制造业企业积极探索数字化转型、高质量发展之路。然而,在这一过程中,企业往往会遭遇用户需求难以把控、设备管理流程混乱、质量问题难以追溯等一系列问题。如果这些问题得不到妥善解决,企业就难以实现数字化转型和高质量发展。COSMOPlat利用自身技术、经验和资源的优势,构筑工业互联网解决方案资源池,为各类型企业提供智能制造、数字化转型全流程服务,助力企业提质增效,促进产业融通发展。2.3.2COSMOPlat工业互联网平台简介COSMOPlat通过实时采集设备资产数据,对资产进行在线实时监测和管理,并根据资产模型和运行大数据,优化资产价值。例如,采集设备实时数据,结合设备机理分析和建模,实现预测性维护,提升效率、降低成本。2.3.2COSMOPlat工业互联网平台简介

海尔互联工厂以COSMOPlat为核心,集成了虚实融合双胞胎系统、射频识别RFID、智能相机、双臂机器人、自动导引车AGV、网络安全等多种智能系统、设备和技术。用户可以应用在线交互设计平台,自主定义所需产品。平台整合用户需求并形成用户订单,引进相关资源在线开展虚拟设计。订单可直达工厂与模块商,自动匹配所需模块部件,再通过自动引导车与空中积放链等智能物流系统实现按需配料和立即配送,全流程追溯和可视化制造过程信息数据。COSMOPlat不仅使海尔实现了冰箱、洗衣机等电器产品从个性化定制、远程下单到智能制造的全过程,同时也实现了智能产品和智能制造的全流程无缝连接。2.3.3COSMOPlat工业互联网平台实践应用

1.工业制造故障分析检测

为了更好地服务于工业制造领域,COSMOPlat自主研发了工业大模型COSMO-GPT。工业大模型COSMO-GPT以开源通用大模型为基础,通过知识注入、模型融合、模型判决,提升其在工业制造领域的表现。目前COSMO-GPT已在服装、化工、家电、能源等多个行业的不同工业流程中得到应用。COSMO-GPT通过事先学习生产线上各种设备的故障代码及相应的处理方案,在生产线遇到问题之后,它能够快速识别出是哪条生产线的哪个设备出了什么样的故障,以及该故障应该如何去维修,并将相关信息及时告知运维人员,极大地节省了设备维修的时间。2.3.3COSMOPlat工业互联网平台实践应用

2.工厂智慧安全管控

某企业中央空调工厂存在员工行走越界、闯入叉车车道或叉车行驶越界、闯入人行道的问题,给工厂的安全生产造成了隐患。COSMOPlat为该企业打造了智慧安全云平台。通过平台算法,实现叉车智能识别,智能判断员工及叉车是否各行其道。如果出现员工进入车道的情形,即时预警播报;如果出现叉车驶入人行道的情形,则控制车辆,自动锁车。同时在叉车作业区域布控多个摄像头,标定叉车坐标,根据叉车行驶路线,智能计算员工安全操作区域。在叉车作业过程中,如果发现员工出现在危险区域内,即时通过声控播报预警,同时报告安全管理人员,实现对企业工厂智能、高效、安全的全方位监控。2.4腾讯觅影2.4.1需求背景

随着医学成像技术的不断进步,X光、超声波、计算机断层扫描CT,核磁共振NMR、消化道内镜、眼底照相等新兴医学成像技术的发展突飞猛进,各类医学图像数据呈爆炸性增长。在传统临床领域,医学图像的判读主要是由医学影像专家、临床医生来负责的,日益增长的医学图像判读需求给医生带来极大的挑战和压力。随着计算机技术的不断突破,计算机辅助医学图像的判断成为可能,并且在临床辅助诊断中所占比重逐年增大。相较于人工,计算机可以有效提高判读速度,降低误判率,减少医生工作量和压力。2.4.2腾讯觅影简介

2017年8月3日,腾讯公司发布了将人工智能技术运用在医学领域的人工智能产品——腾讯觅影。腾讯觅影数智医疗影像平台由觅影影像云提供多模态医学影像云端存储和应用,并面向患者提供云胶片服务;针对有科研诉求的企业、院校,通过开放实验平台的算力、资源开展人工智能模型训练,并最终实现将成熟人工智能应用于临床场景的目标;同时,可将开放实验平台的实验数据用于临床示教实训体系,以提升临床人员的实操技能。2.4.2腾讯觅影简介

腾讯觅影的核心功能是AI辅诊开放平台,主要提供智能导诊、病案智能管理、诊疗风险监控三大功能。AI辅诊开放平台旨在依托腾讯觅影在医疗领域积累的医学知识图谱、诊断模型、病情理解、名医专家库等AI辅诊基础能力,深度切入医院的疾病预测、辅助决策、数据分析等应用场景,提供一站式的服务。2.4.2腾讯觅影简介AI辅诊开放平台的核心功能:1.智能导诊

智能导诊是AI辅诊开放平台推出的功能,通过切入疾病预测的分诊导诊这一细分场景,可以根据医院需求定制导诊系统,为患者提供智能服务,缓解医院分诊导诊的咨询压力。2.患者档案管理

患者档案(SmartMedicalRecord)是为医生及患者双方提供医疗报告存、查、用功能的智慧电子云病历。人工智能医疗文本结构化能力将自动解析、整理患者上传的报告,患者可随时随地在手机端查看、使用。患者上传数据后,人工智能医疗文本结构化引擎可分析报告类型,回收数据均可通过可视化图表快速掌握。医生可随时在医生端查看患者上传的病历资料,管理患者,提供诊后智能随访、量表下发、患教触达等多种服务。2.4.3腾讯觅影实践应用

通过对大量学科知识、临床数据以及专家临床经验的深度学习,“腾讯觅影”青光眼筛查功能建立起了专业的诊断模型,实现对眼底视盘与视杯区域高精度、像素级的分割,智能化精确计算具有重要临床意义的杯盘比等参数,辅助医生实现快速且稳定的临床参数计算,从而实现对青光眼,尤其是早期青光眼,进行高精度智能判别,准确率超过95%,有助提高青光眼筛查的效率,弥补青光眼诊断专家稀缺的问题。2.5爱奇艺智能网络视频云服务平台2.5.1需求背景

作为国内较大的网络视频分享平台,爱奇艺每天处理上万小时的新增视频,产生千亿条的用户日志。这些海量的内容蕴藏着很高的价值,也对网络视频行业发展提出新的挑战。首先,面对海量的内容,视频平台急需优化生产和审核流程,提高内容生产的效率,为用户提供更加便捷、优质的服务。其次,面对海量的内容,用户的选择成本太高,视频平台需要为用户挑选和推荐他们感兴趣的优质内容。最后,粗放投放为视频平台带来高额的营销成本,视频平台需要精准的广告投放和精细化的商业运营。2.5.2爱奇艺智能网络视频云服务平台简介

为了应对挑战,爱奇艺推出智能网络视频云服务平台,该平台搭载功能完备的智能网络视频云服务系统。该系统可自动对视频进行智能识别、处理,大幅度提高生产效率,并通过智能算法对用户行为大数据进行分析,构建用户画像,提供精准的个性化推荐。同时,该系统支持商业合作伙伴进行精准营销和广告投放,通过“闪植”和“随视购”技术,创新性地打通了电商系统和视频系统,实现“视频内物品所见即所买”的精准投放。

爱奇艺智能网络视频云服务平台架构包括基础层、感知层、认知层、平台层

和应用层。2.5.2爱奇艺智能网络视频云服务平台简介

基础层:提供人工智能服务所需的算力、数据和基本算法,极大地降低了对本地硬件设备和软件系统的要求,减少了运维成本和风险。

感知层:模拟人的听觉、视觉,实现语音识别、图片识别、视频分析以及增强现实虚拟现实(AugmentedReality/VirtualReality,AR/VR)配准渲染等功能。

认知层:模拟大脑的语义理解功能,实现自然语言处理、知识图谱的记忆推理和用户画像分析等功能,构成爱奇艺智能网络视频云服务平台的大脑。平台层通过开放服务接口,为应用层的视频创作、视频生产、内容分发、社交互动、商业变现等上层应用赋能。

应用层:最主要的应用系统为智能视频生产系统、智能内容分发系统和智能商业变现系统。2.5.2爱奇艺智能网络视频云服务平台简介

应用层系统主要是智能视频生产系统、智能内容分发系统和智能商业变现系统。

1.智能视频生产系统

智能视频生产系统依托音视频智能识别技术,实现基于内容的视频拆条、视频标注和视频审核。爱奇艺自主研发基于卷积神经网络(ConvolutionNeuralNetwork,CNN)的深度学习技术进行高精度明星识别、情感识别、物品识别和场景识别,基于双向长短期记忆(BidirectionalLongShort-TermMemory,BLSTM)网络进行视频字幕识别、语音识别、语义标注和封面图识别。

2.智能内容分发系统

智能内容分发系统是在大数据分析和人工智能技术的基础上,通过研究视频内容和用户的兴趣偏好,进行个性化推荐;通过社交网络宣发和热点发掘,给用户提供高质量的个性化内容,解决信息过载的问题,更好地满足用户的需求。2.5.2爱奇艺智能网络视频云服务平台简介3.智能商业变现系统

智能商业变现系统利用人工智能技术充分挖掘视频内容的价值,包括闪植广告、随视购广告、智能票房预测等系统。它通过大数据分析,对用户的浏览、点击、购买等行为进行统计和监测,可以进行用户群体定位和商品的流行性预测,更好地指导商家生产用户需要的商品,及时调整广告的投放策略,促进商品销量增长。2.5.3爱奇艺智能网络视频云服务平台实践应用

该系统投入使用3年后,视频数量增长了约20倍,但员工人数仅增长了约2倍。通过人工智能技术,剪辑视频中精彩片段的效率提升了2.5倍。

通过人工智能技术,实现了每天为几十万用户生成内容(User-GeneratedContent,UGC)视频自动生成封面图。

通过情感识别技术则将三维卷积神经网络和循环神经网络模型应用到情感识别领域,准确地捕捉表情的时序变化,协助视频推广人员发掘视频中的精彩片段。

智能内容分发系统建立了精准的用户画像,使用人工智能技术赋能个性化搜索推荐,进行高效的内容分发。

智能商业变现系统打通了内容生产、人机交互和电商服务的各个层面,增加了爱奇艺作为网络视频平台的广告和商业价值。THANKS

谢谢第三章

机器学习经典算法介绍学习目标

了解机器学习的定义、流程和类型。

能够在计算机上自主搭建机器学习环境。

掌握机器学习常见的分类、回归、聚类算法。

能够利用Python的机器学习库编程实现分类、回归、聚类算法。3.1机器学习简介3.2机器学习经典算法3.3机器学习经典算法案例编程3.1机器学习简介3.1.1机器学习定义

机器学习是计算机利用已有的数据,训练出某种数学模型,并利用此模型预测未来的一种方法。机器学习的过程与人类学习的过程是类似的,不过机器学习能考虑更复杂的情况(能考虑的因素更多),执行更加复杂的计算。事实上,机器学习的主要目的就是把人类通过思考归纳经验的过程转化为计算机通过数据处理和计算得出模型的过程。计算机得出的模型能够以近似于人的方式解决很多灵活、复杂的问题。3.1.2机器学习流程

机器学习流程:(1)了解实际应用中要利用机器学习技术解决什么问题,达到什么目的。(2)选择并初步分析数据,选择合适的特征构建特征向量。特征选择的方式可以采用人工选择或模型自动选择。(3)拆分数据集为训练集和测试集。通常以8∶2或者7∶3的比例进行数据集拆分。(4)选择合适的模型,设置模型的相关参数。(5)在模型中输入训练集进行模型训练。(6)训练完毕后,评估模型的训练效果,若效果不达标,则重新选择模型或调整参数进行训练。(7)训练模型通过评估后,将测试集输入训练后的模型中进行测试(8)评估模型的测试效果,如果效果达标,则该模型就可以用来解决实际问题,如预测结果。若效果不达标,则重新选择模型或调整参数进行训练。3.1.2机器学习流程3.1.3机器学习类型

根据训练数据有无标签,机器学习主要划分为监督学习、无监督学习、半监督学习、强化学习、深度学习。其中,强化学习通过与环境交互获得反馈进行学习。深度学习是基于深层神经网络的学习方法,可以应用于上述多种学习类型。3.1.3机器学习类型1.监督学习

监督学习就是根据已有的数据在已知输入和输出之间关系的情况下,训练得到一个最优的模型。在监督学习中,训练数据既包含特征(问题描述)又包含标签(答案),通过训练,机器可以学习特征和标签之间的联系,从而在面对只有特征没有标签的数据时,可以判断出其标签。

监督学习的应用分为两类:回归和分类。

回归:适用于连续型变量。例如,给定一组房屋特征(房屋大小、房间数、地理位置等),预测房屋的价格。回归就是对已经存在的数据(已知房屋大小、房间数、地理位置的多套房屋的价格)进行分析,拟合出适当的回归函数模型y=

f

(x),这里x就是自变量(房屋大小、房间数、地理位置等),y就是数据的标签(房屋的价格),而对于一个新的自变量x,通过这个回归函数模型可以得到标签y。

分类:适用于离散型变量,其输出结果是有限的类型。例如,邮件分类问题的输出中只有两种类别:正常邮件或垃圾邮件。3.1.3机器学习类型

2.无监督学习

比起监督学习,无监督学习更像是让机器自学。无监督学习和监督学习最大的区别就是输入的训练数据是没有标签的。无监督学习让机器自己从训练数据中找出它们的特征和内在联系,把特征相似和具有内在联系的数据聚合成一个簇。例如在市场细分时,某公司的数据库中存储了许多客户的信息,可以通过无监督学习把客户分成不同的客户群,这样公司就可以对不同的客户群销售不同的产品或者提供不同的服务。

3.1.3机器学习类型

无监督学习的应用可分为聚类、关联分析、降维3类。聚类也叫无监督分类。

聚类:聚类的结果是把数据聚合成一个个簇,各个簇内部的数据具有相似的特征和内在联系。因此,聚类同样也实现了分类效果,只不过每个类别没有标签。3.1.3机器学习类型

关联分析:主要用于发现事件共同发生的概率。例如如果一个中年男性顾客购买了黄酒,他很可能也购买了白酒。3.1.3机器学习类型

降维:指的是减少数据集的变量数量。如果数据集的维度较高,机器的学习时间会增加,学习过程会变复杂。为了改善这种情况,需要做降维处理,同时最大限度地保留原始数据的大部分特征信息。常用的降维方法有主成分分析PCA法。PCA方法的思想是将高维空间的数据投影到低维空间上,使得数据在低维空间上尽可能地分散,从而保留数据的绝大部分信息。3.1.3机器学习类型3.半监督学习

半监督学习介于监督学习和无监督学习之间,它使用的训练数据少部分是有标签的,而大部分是没有标签的。和监督学习相比较,半监督学习的成本较低,不需要对所有数据打标签,同时又能达到较高的准确度。在现实任务中,没有标签的样本多、有标签的样本少是一种比较普遍的现象。利用好没有标签的样本来提升模型的泛化能力,是半监督学习研究的重点。

4.强化学习

强化学习是一种试错方法,其目标是让模型在特定环境中能够获取最优的结果。强化学习使用的训练数据没有标签,输出的结果也没有标签。模型每次的行为都会对外部环境产生影响,外部环境依照某种规则对该影响进行好坏的判断。如果判断当前行为是好的,则模型的行为以后就多往这个方向发展;如果判断当前行为是坏的,模型就进行自我调整,规避这样的行为。模型通过不断地调整,最终达到最优状态。例如,当宝宝把玩具弄乱时,就给他相应的惩罚,当宝宝把玩具收拾好后,就给他相应的奖励,那么宝宝最终会明白把玩具弄乱是不好的行为。3.1.3机器学习类型5.深度学习

深度学习是机器学习新的发展方向之一,深度学习的核心是深度神经网络。区别于传统神经网络,深度神经网络能够通过训练自动找寻样本数据的内在规律和表示层次,使深度学习更容易应对传统机器学习无法解决的问题,拓宽了机器学习的应用场景。3.2机器学习经典算法3.2.1分类算法

分类是利用已有类别标签的样本数据,训练或者构造出一种分类器,该分类器能够对未知数据进行预测分类,得到离散的结果。由于样本数据已有类别标签,因此分类算法属于监督学习。分类算法主要应用在二分类问题和多分类问题上。

分类算法的流程。3.2.1分类算法(1)数据集分割:将原始数据集分为训练集和测试集,一般训练集和测试集比例为5∶1。训练集用来训练模型,测试集用来检验训练后模型的分类准确度。(2)选择合适的分类算法:分类算法有很多种,如线性分类、决策树分类、支持向量机分类、贝叶斯分类等。针对不同特征的数据集,每种分类算法的效果都不一样。可以根据经验,选择其中的一种或几种算法。(3)训练模型:基于选择的分类算法,使用训练集训练模型。(4)测试模型:模型训练好后需要进行测试,以检验模型的分类准确度,如果同时训练了几种模型,可以比较它们各自的分类准确度,挑选分类准确度最好的模型。(5)模型应用于未知数据集:把挑选的模型应用于未知数据集的分类预测上。3.2.1分类算法

根据分类函数是否线性,分类算法可以分为线性分类算法和非线性分类算法。

线性分类算法:包括线性判别分析、逻辑回归、贝叶斯分类、单层感知机等。

非线性分类算法:包括KNN分类、决策树分类、随机森林分类、多层感知机(神经网络)算法等。支持向量机分类根据核函数的不同,可以是线性分类算法也可以是非线性分类算法。线性分类算法编程实现简单、运行速度快,但是拟合能力较差。非线性分类算法编程复杂,但是拟合能力强。3.2.1分类算法

常用的分类算法:(1)KNN分类算法KNN分类算法是机器学习中最简单的分类算法之一。它的核心思想就是“邻近原则”,即每个测试点的类别由距离它最近的k个训练点的类别决定,如果这k个训练点中的大多数属于某个类别,则该测试点也属于该类别。这个过程类似于“少数服从多数”的决策方式。KNN分类算法的流程如下。①

计算测试点和其他所有训练点之间的距离,并将距离按递增顺序排序,选取与测试点距离最近的前k个训练点。②

根据前k个训练点各自所属的类别,计算各个类别出现的频率。③

把出现频率最高的那个类别作为测试点的类别。3.2.1分类算法KNN分类算法的分类效果和3个因素有关。

k值的选择

如果k值过小,只有与测试数据距离非常近的训练点影响测试结果,容易发生过拟合,导致模型泛化能力差。如果k值过大,则与测试数据距离非常远的训练样本数据也会影响测试结果,进而影响分类的准确度,导致模型的学习能力差。一般通过交叉验证方法选择最优k值,②

距离的计算方法

KNN分类算法将测试数据和训练样本之间的距离作为样本之间相似性的度量指标。距离的计算方法有很多种,包括欧氏距离、余弦值、曼哈顿距离等,其中比较常用的是欧氏距离和曼哈顿距离。③

分类决策

KNN分类算法中分类决策采用“少数服从多数”原则。默认情况下每个训练点无论距离测试点多远,权重都是一样的,但是在实际分类中,权重可能不同,通常设置距离测试点近的训练点权重大,距离远的训练点权重小。3.2.1分类算法

(2)决策树分类算法

决策树分类算法采用一种特殊的树形结构(一般由节点和有向边组成)。其中,普通节点表示属性。有向边表示判断条件,叶子节点表示类别。决策树可以应用于分类,也可以应用于回归。决策树常用的算法有ID3、C4.5、CART。3.2.1分类算法

决策树分类算法的流程如下。①

获取原始数据集的所有属性,建立属性列表。②

计算所有属性的信息增益/信息增益比。③

选择信息增益/信息增益比最大的属性作为第一次分类的属性。④

根据该属性对数据进行分类,分割原始数据集,并将该属性从属性列表中移除。⑤

返回③,循环进行③~④的流程,不断分割数据集,从属性列表中移除属性,直到所有的属性都被遍历,或者每个判断条件下的数据在同一类别。⑥

决策树分类算法结束。3.2.1分类算法

(3)支持向量机分类算法

支持向量机(SupportVectorMachine,SVM)分类算法是一种基于核的机器学习算法,属于监督学习算法。支持向量机可以用于分类预测,也可以用于回归预测。支持向量机两大核心思想是最优决策超平面和核函数。①

最优决策超平面

分类的目标是划分数据集,即尝试找到一个超平面将数据分开。在数据线性可分的情况(即存在一个线性函数能够将数据分开)下,超平面在二维空间是一条直线,在三维空间是一个平面。而这样的超平面有很多。如何选择最优的超平面来进行分类呢?在分类时,那些远离超平面的数据点不会被错误分类,而那些离超平面很近的数据点容易被错误分类。支持向量机分类算法引入最优决策超平面进行分类,在保证分类准确度的情况下使得超平面两侧距离超平面最近的两类数据点间的距离最大化,最大限度减少分类错误,实现最优分类。3.2.1分类算法

核函数

如果数据在二维空间线性不可分,即无法通过一个线性函数来分类,必须使用椭圆才能分开数据,该怎么办呢?为此,支持向量机引入了核函数的概念,将数据通过一个映射函数从原始空间映射到更高维的特征空间,使得数据在高维特征空间线性可分,因此可以在高维特征空间找到最优决策超平面来对数据进行分类,这个映射函数就是核函数。支持向量机提供的核函数有很多种,如线性核函数、多项式核函数、高斯核函数、傅里叶核函数等。

那么,将数据映射到高维空间,计算量会不会大大增加,导致无法计算呢?核函数能避免这个问题。核函数的计算是在低维空间中进行的,利用了核函数内积的性质将分类效果表现在高维空间中,避免了直接在高维空间中进行复杂计算,真正解决了线性不可分的问题。目前已经证实,如果原始空间是有限维的,那么一定存在一个高维特征空间可以使数据可分。3.2.1分类算法支持向量机分类算法的流程如下。①

将原始数据集的数据格式转换为支持向量机算法要求的数据输入格式,并将原始数据集划分为训练集和测试集。②

对原始数据集进行数据标准化处理。③

选择相应的核函数,建立对应分类模型。④

利用交叉验证法,对核函数的参数进行调优,建立最优支持向量机分类模型。⑤

利用训练集和最优支持向量机分类模型进行训练。⑥

利用测试集进行模型测试。⑦

算法结束。3.2.1分类算法(4)贝叶斯分类算法

贝叶斯分类算法是利用概率统计知识进行分类的算法的总称,这类算法都以贝叶斯定理为基础。朴素贝叶斯分类算法是贝叶斯分类算法中较为简单和常见的一种分类算法,属于监督学习算法。贝叶斯分类算法与其他分类算法的不同在于,贝叶斯分类算法得出的结果并不是一个确定的值,而是未知数据可能属于每种类别的概率。贝叶斯分类算法的核心思想就是在所有类别中选择概率最高的类别作为预测类别。

设数据集中的数据有n个属性,可以表示成一个n维的特征向量,假设这些属性互相独立(这是贝叶斯定理使用的基本条件)。这些数据被分为m个类。如果要给一个未知的数据进行分类,根据贝叶斯分类算法的核心思想,选择所有类别中概率最高的类别作为预测类别,就是未知数据属于类别的概率。贝叶斯公式:能够根据训练数据计算得到。因此结果可以求得。和其中,是未知数据x属于类别

的概率3.2.1分类算法

假设,要利用朴素贝叶斯分类算法判断一个色泽青绿、根蒂蜷缩的西瓜是不是好瓜,需要计算P(好瓜|青绿,蜷缩)和P(坏瓜|青绿,蜷缩)。若前者更大,则为好瓜;若后者更大,则为坏瓜。3.2.1分类算法根据贝叶斯定理:P(好瓜|青绿,蜷缩)=P(青绿,蜷缩|好瓜)·P(好瓜)/P(青绿,蜷缩),P(坏瓜|青绿,蜷缩)=P(青绿,蜷缩|坏瓜)·P(坏瓜)/P(青绿,蜷缩)。贝叶斯定理假设各个属性互相独立,上面的公式可以写成:P(好瓜|青绿,蜷缩)=P(青绿|好瓜)·P(蜷缩|好瓜)·P(好瓜)/P(青绿,蜷缩),P(坏瓜|青绿,蜷缩)=P(青绿|坏瓜)·P(蜷缩|坏瓜)·P(坏瓜)/P(青绿,蜷缩)。由西瓜数据可知:P(青绿|好瓜)=3/8,P(青绿|坏瓜)=3/9=1/3,P(蜷缩|好瓜)=5/8,P(蜷缩|坏瓜)=3/9=1/3,3.2.1分类算法P(好瓜)=8/17,P(坏瓜)=9/17,P(青绿,蜷缩)=3/17,可以计算出:P(好瓜|青绿,蜷缩)=5/8,P(坏瓜|青绿,蜷缩)=1/3。由于P(好瓜|青绿,蜷缩)>P(坏瓜|青绿,蜷缩),可以得出色泽青绿、根蒂蜷缩的西瓜是好瓜。3.2.2回归算法

回归是在已有样本数据的基础上,训练或者构造出回归模型,并利用该回归模型对未知数据的真实值进行预测的过程。回归是分类的拓展。

回归与分类的区别:分类输出的是离散的数值,而回归输出的是连续的数值。简单来说,分类是打标签,而回归是无限逼近真实值,输出结果没有对错之分。比如,房价为100万元,模型输出99万元和输出50万元都是对100万元的逼近,只不过逼近的效果不同。又如,如果预测明天的气温是多少摄氏度,这是一个回归问题;如果预测明天的天气是阴天、晴天还是雨天,这是一个分类问题。回归算法的训练样本是有标签的,所以回归算法也属于监督学习算法。3.2.2回归算法

回归算法主要应用于连续值预测(如房价预测、经济预测、天气预测等)。常用的回归算法有KNN回归算法、决策树回归算法、支持向量机回归算法、神经网络回归算法等。

(1)KNN回归算法KNN回归算法是KNN算法在回归方面的运用。与KNN分类算法类似,KNN回归算法通过找出距离某个未知数据点最近的k个近邻点,并且将这k个近邻点的平均值作为该未知数据点的预测值。一般来说,不同距离的近邻点对该未知数据点产生的影响是不一样的,距离更近的近邻点产生的影响相对比较大,距离更远的近邻点产生的影响相对比较小。为了提高预测精度,可以引入权值来计算k个近邻点的平均值,通常权值和距离成反比。3.2.2回归算法

(2)决策树回归算法

决策树回归算法的思想类似于决策树分类算法的,区别在于叶子节点。决策树分类算法的叶子节点的数据是离散值,而决策树回归算法的叶子节点的数据是连续值(连续区域)。在同一连续区域内部的数据具有相似性,而不同连续区域内部的数据不同。在进行回归预测时,只能预测未知数据落在哪个连续区域内,然后把该区域的输出值作为预测结果。决策树回归算法一般用来将比较复杂的训练数据划分为一个个内部数据相似的小数据集,对每个小数据集可以利用其他机器学习算法来进一步处理。3.2.2回归算法

假设需要利用左图决策树回归模型预测向量(7,7)对应的输出。向量(7,7)第一维分量7介于5和8之间,第二维分量7小于8,根据决策树模型可以判断(7,7)所在的区域为所示二维平面的阴影区域,其对应的输出值为c3。划分区域的过程也就是决策树的构建过程,每次划分,都可以确定划分区域对应的输出值。当划分完成的时候,每个区域的输出值也就确定了,所有的叶子节点也确定了。

(3)支持向量机回归算法

支持向量机回归算法利用支持向量机来预测连续数据值,算法原理类似于支持向量机分类算法。3.2.3聚类算法

前面介绍的分类算法和回归算法都属于监督学习算法,训练样本包含标签。接下来介绍无监督学习算法。无监督学习算法的特点是机器学习过程中没有训练步骤,所有数据不包含标签,即不知道输入数据后对应输出的结果是什么,无监督学习算法的整个运行过程是不需要人工干预的。无监督学习算法的代表是聚类算法。

聚类也叫群分析,和分类相似,它的目的也是要确定一个物体的类别,但和分类不同的是,聚类时没有事先定义好的类别,机器要自己想办法把样本分成多个类别,保证每一个类别中的样本之间是相似的,而不同类的样本之间是不同的,因此聚类也叫作无监督分类。在聚类中每个类别被称为“簇”(Cluster)。3.2.3聚类算法

假设有一堆水果,需要我们去聚类,聚类时我们也没有被告知聚类标准,只能根据自己的判断对水果进行聚类。有的人按照颜色分类,把颜色相似的水果归为一类;有的人按照形状聚类,把形状相似的水果归为一类;也有的人按照大小聚类,把大小相似的水果归为一类;还有的人按照季节聚类,把同一季节成熟的水果归为一类。这个过程就是聚类,每个人都可以根据自己定义的规则,将相似的样本划分成一类,不相似的样本划分成不同的类。由于事先不知道样本能分为几类,也没有统一标准,所以不存在训

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论