




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能导论人工智能导论--项目1---人工智能的前世今生.pptx人工智能导论--项目2---人工智能基础.pptx 人工智能导论--项目3---人工智能编程语言Python.pptx人工智能导论--项目4---图像识别.pptx 人工智能导论--项目5---人脸识别.pptx 人工智能导论--项目6---生物信息识别.pptx 人工智能导论--项目7---自然语言处理.pptx 人工智能导论--项目8--智能语音.pptx 人工智能导论--项目9---无人驾驶.pptx 人工智能导论--项目10---数据挖掘.pptx
人工智能导论项目1人工智能的前世今生01项目背景02思维导图03思政聚焦04项目相关知识05项目小结与展望目录CONTENTS01项目背景想象一下你作为一名普通的上班一族,人工智能是如何使你的生活变得更加美好的。清晨,悠悠转醒的你,通过简单的语音指令拉开了窗帘和打开了房间的灯,通过人脸或指纹识别解锁手机,各式各样的社交、新闻App已经准备好为你推送你感兴趣的信息。早餐后,你坐上了自己的车准备出发去上班,导航App已经根据当时的路况筛选出了最便捷的路径,音响中也开始自动播放你喜爱的歌曲,自动驾驶或辅助驾驶功能也让开车的过程变得愈发的轻松,智能交通信号“绿波带”更让你的心情变得愉悦起来。你刷脸进入了公司的大楼,电梯门像先知先觉似的在你到达的时候开启,你无需按楼层按键,电梯按默认记忆将你送达办公楼层,通过生物识别你进入了办公室,照明和空调系统已根据你的习惯和当天的天气情况打开,在舒适的办公环境中你开始了一天的工作。工作的繁忙可能让你没空去餐厅享用午餐,贴心的送餐机器人会将经过智能营养配餐的午饭准时送到你的办公室。以前下班的你,可能会站在大厦数层的巨大停车场前茫然地回忆早上究竟把车停在哪儿了,而现在在智能寻车系统的帮助下,这样的情形早已不复存在。回到家中你发现,扫地机器人也已经完成了每天的清洁工作,花园里的植物在智能浇灌系统的照料下不需要你过多的操心,不善厨艺的你,甚至可以问问冰箱有关营养搭配和烹饪技巧的问题。躺在床上随着逐渐变暗的灯光渐入梦乡的你,更会对人工智能的未来充满了期待。02思维导图思维导图03课程思政中国智能科学研究的领军人-吴文俊院士吴文俊获得首届国家最高科学技术奖中国人工智能学会2011年发起主办“吴文俊人工智能科学技术奖”中国智能科学研究的领军人-吴文俊院士吴院士开创了数学机械化研究领域,提出的用计算机证明几何定理的方法在国际上被誉为“吴方法”,人工智能、模式识别等诸多领域背后都有数学机械化的广泛应用。美国人工智能协会前主席W.Bledsoe等人主动写信给中国主管科技的领导人,称赞“吴关于平面几何定理自动证明的工作是一流的,他使中国在自动推理领域进入国际领先地位”。04项目相关知识项目相关知识人工智能的迭起兴衰中国人工智能的发展人工智能元年(1956)人工智能的萌芽和早期发展12341.人工的萌芽和早期发展人工智能发展的思想、理论与物质基础010203040506公元前384-公元前322年,亚里士多德在他的名著《工具论》中提出提出了演绎推理的基本依据:三段论英国哲学家培根系统地提出了以观察和实验为基础的归纳法—科学归纳法德国数学家和哲学家莱布尼茨(G.W.Leibniz)提出了万能符号和推理计算的思想英国数学家艾伦·麦席恩·图灵(A.M.Turing)在1936年提出了一种理想计算机数学模型,即图灵机英国逻辑学家布尔(C.Boole)在《思维法则》一书中首次用符号语言描述了思维活动的基本推理法则美国神经生理学家麦克洛奇与匹兹(W.Pitts)在1943年建成了第一个神经网络模型(M-P模型)。1.人工的萌芽和早期发展早期文学作品中的“机器人小滴答”-“Tik-Tok”北京时代华文书局出版的《绿野仙踪全集—机器人小滴答》封面美国儿童文学作家莱曼·弗兰克·鲍姆(1856-1919)在1914年创作了《机器人小滴答(Tik-TokofOZ)》。这个叫做“Tik-Tok”的机器人角色在作者的想象中,是一个非常具有责任心、有想象力能够流利使用人类语言的人形机械(mechanicalman),它能思考会说话,可以做到一切人类能做到的事情。“Tik-Tok”被广泛地认为是人类文学作品中最早的比较完善的“机器人”角色,是机器人这个概念的“原型机”。1.人工的萌芽和早期发展启蒙与发展---图灵机与图灵测试图灵机的基本构造人工智能历史上的第一座里程碑,便是图灵机。在1936年,被称为计算机科学之父、人工智能之父的英国数学家艾伦·麦席恩·图灵提出了一个抽象的计算模型的构想-图灵机。左图便是图灵机的基本构造,我们可以简单地将其理解为三部分:纸带、程序和处理盒。1.人工的萌芽和早期发展启蒙与发展---图灵机与图灵测试1950年,艾伦·麦席恩·图灵发表了一篇划时代的论文,这也为他正式获得了“人工智能之父”这一桂冠。图灵提出了一个测试方法,这个方法就是通常说的“图灵测试”。测试的具体形式采取问与答的模式,观察者通过打字机与两个被测试对象(一人类一机器)通话,观察者不断提出问题,通过被测试对象的回答来辨别其是人还是机器,如果机器使30%以上的观察者对其身份产生了误判,那么这个机器就可以被认定为具备智能。图灵测试为人工智能的概念与方向做出了进一步的解释与分析,也为人工智能做出了基本的标准。为纪念图灵对计算机科学和人工智能领域的贡献,美国计算机协会(ACM)于1966年设立了计算机奖项“A.M.图灵奖(ACM
A.MTuringAward)”,简称“图灵奖(TuringAward)”。2.人工智能元年在人工智能发展历史上称得上里程碑式的会议就是1956年8月在在美国的达特茅斯学院召开的达特茅斯会议,又称为达特茅斯夏季人工智能研究计划(DartmouthSummerResearchProjectonArtificialIntelligence)。在这个会议上人工智能(ArtificialIntelligence)这个词被正式使用和广泛接受,因此1956年被普遍称为人工智能元年。2.人工智能元年达特茅斯会议的主题是“用机器来模仿人类学习以及其他方面的智能”,包括七个相关的基础议题:自动计算机AutomaticComputer如何通过编程使计算机使用自然语言HowCanaComputerbeProgrammedtoUseaLanguage神经元网络NeuronNets计算规模理论TheoryoftheSizeofaCalculation自我提升Self-Improvement抽象概念Abstraction随机性和创造力RandomnessandCreativity3.人工智能的迭起兴衰ABCDEF第一次繁荣(1956-1974)第一次“寒冬”(1974-1980)重振旗鼓(1980-1987)第二次寒冬(1987-1993)稳健时代(1993-2011)走向新的繁荣(2012-今)3.人工智能的迭起兴衰-大事记第一次繁荣期(1956-1974)Unimate机器人机器人WABOT-13.人工智能的迭起兴衰-大事记重振旗鼓期(1980-1987)专家系统卡耐基梅隆大学(CMU)1978年研发的XCON,在1980年正式投入工厂使用,XCON是一款能够帮助顾客自动选配计算机配件的软件程序,这是个完善的专家系统,包含了设定好的超过2500条规则,在后续几年处理了超过80000条订单,准确度超过95%,每年节省超过2500万美元。这成为一个新时期的里程碑。日本的第五代计算机系统日本研发的第五代计算机日本尝试使用大规模多CUP并行计算来解决人工智能计算力问题,并希望打造面向更大的人类知识库的专家系统来实现更强的人工智能。3.人工智能的迭起兴衰-大事记稳健时代(1993-2011)1997年5月,“深蓝”以3.5-2.5正式击败国际象棋世界冠军卡斯巴罗夫,成为了首个在标准比赛时间内击败国际象棋世界冠军的计算机系统。人工智能在某个领域正式超越人类的消息广为传播,引起了世界的轰动。超级计算机“深蓝”的其中一个机组3.人工智能的迭起兴衰-大事记走向新的繁荣(2012-今)阿尔法狗(AlphaGo)同样是下棋,对于计算机来说,围棋的难度要远高于国际象棋,因为围棋的落子点太多,分支因子也远多于其他游戏。AlphaGo通过数万盘的自我对弈进行练习强化,于2016年3月以4:1击败了韩国最强的职业棋手李世石。3.人工智能的迭起兴衰-大事记走向新的繁荣(2012-今)波士顿动力学公司机器狗和机器人的演进大狗机器人(Bigdog)大狗机器人(Bigdog)因形似机械狗被命名为“大狗”。大狗机器人由波士顿动力学工程公司研制,1992年MarcRaibert与他人一起创办了波士顿动力学公司。他首先开发了全球第一个能自我平衡的跳跃机器人。左图所示是波士顿动力学公司机器狗和机器人的演进。4.中国人工智能的发展20141978年20世纪80年代初19842006邓小平发表了“科学技术是生产力”的重要讲话科技事业迎来了春天钱学森等主张开展人工智能研究人工智能研究进一步活跃邓小平批示批示“计算机普及要从娃娃抓起”研究境遇有了极大改善人工智能学科诞生50周年,东北大学的“棋天大圣”象棋软件获得机器博弈冠军人工智能科技取得了长足的进步人工智能成为国家发展战略进入快速发展通道4.中国人工智能的发展人工智能等新技术的进步极大地推动了中国制造向高端制造领域发展,近些年来,我国也诞生许多与人工智能相关的世界级品牌产品。以华为,小米,OPPO,VIVO为代表的智能手机,已形成中国智能手机集群优势,在全球占有极大的市场份额。研发大疆无人机的深圳市大疆创新科技有限公司,创立于2006年,短短的十五年时间,大疆创新的业务从无人机系统拓展至多元化产品体系,在无人机、手持影像系统、机器人教育等多个领域成为全球领先的品牌,以一流的技术产品重新定义了“中国制造”的内涵。MavicAir2型号大疆无人机04项目小结与展望项目小结本项目我们学习了人工智能的发展史,从公元前伟大的哲学家亚里士多德的三段论的形式逻辑,到科学归纳法、数量逻辑、思维规律机械化、神经网络模型、计算机数学模型、世界上第一台电子计算机等成就奠定了人工智能发展思想、理论和物质基础。人工智能历史上的第一座里程碑是图灵机与图灵测试;以时间轴看,从人工智能元年(1956年)到今天的2021年,人工智能经历了第一次繁荣(1956-1974)、第一次“寒冬”(1974-1980)、重振旗鼓(1980-1987)、第二次寒冬(1987~1993)、稳健时代(1993-2011)和走向新的繁荣(2012-今)的曲折的发展阶段后才有了今天的辉煌。项目展望以史为鉴,面向未来,毫无疑问,人工智能的崭新时代已经来临,我们未来的生活和工作都离不开它。作为大学生,我们需要了解、认识人工智能,下一单元,我们会带大家从零开始认识人工智能。感谢您的观看接下来让我们通过纪录片的方式,去“亲历”人工智能的前世今生《杨澜访谈录》人工智能系列纪录片——《探寻人工智能》/video/BV1LW411Y7Ui?from=search&seid=8443311150423123977人工智能导论项目2人工智能基础01项目背景02思维导图03思政聚焦04项目相关知识目录CONTENTS05项目任务06项目小结与展望01项目背景人工智能典型应用场景–指纹识别与手写输入事先反复录入,保存特征使用简单,即刻识别检测目标:个人身份事先无需录入直接使用,即刻识别检测目标:手写内容人工智能系统需要处理的数据对象千差万别,其技术是否也是千变万化、难以捉摸呢?恰恰相反,人工智能的工作原理、数据的处理流程和处理目标都有极高的相似性。一般来说,人工智能技术能够通过对已有数据进行学习,从而习得数据之中的模式和规律,之后能够对新的数据进行预测、判别、归类和推荐等。人工智能的处理对象–数据与模式02思维导图项目二思维导图03课程思政我国在2017年以“国家战略”的形式颁布了人工智能发展总体框架《新一代人工智能发展规划》,并随之推出了一系列政策推进人工智能关键核心技术和产业发展。美国、德国、法国等西方传统强国和日本也都制定了国家层次的人工智能发展战略。人工智能已经进入国家的战略层次,对推动国家经济高质量发展、保障国家安全都具有十分重要的意义。人工智能技术进入国家战略层次关键核心技术必须牢牢掌握在我们自己手中我们必须居安思危。与美国相比,我国在人工智能领域的关键核心技术仍有一定距离,尤其在人工智能基础技术领域的差距更为明显。作为国之重器,关键核心技术是我国创新能力体现和结晶,是我国科技发展、实现科技强国、国家伟大复兴的重要保障,“关键核心技术必须牢牢掌握在我们自己手中”。人工智能关键核心技术的发展,既要保护我们在人工智能方面现有的技术优势,更需要不断发扬创新精神和工匠精神,在基础关键核心领域不断取得突破。而这正等待着作为本书读者的你,积极投身人工智能相关领域的研究和应用之中,为民族富强、国家复兴而奋斗。关于工匠精神04项目相关知识项目相关知识2.1AI基础知识1、智能的具体表现人的五官和肢体表面的各种传感器代表了人的感知能力,是人类接收外界信号方式和渠道,没有了感知就像闭关锁国的清朝;人的大脑代表了智力,表示人类认识、理解客观事物并运用知识、经验等解决问题的能力,是人工智能的最核心技术;人的心脏和四肢代表了体力,这是人类各项能力的基础,支撑着人身体的运动,是人影响外界的主要途径。人工智能在“感知能力”“智力”和“体力”三个领域发展迅速,在部分领域甚至已经远超人类,这种趋势在将来将会愈演愈烈。2、人工智能的三种形态根据智能水平的高低,产业界将人工智能分为三种形态:弱人工智能、强人工智能和超人工智能。2.1AI基础知识人类智能水平2.1AI基础知识3、AI技术四要素,一个都不能少4、AI技术体系:基础很重要2.1AI基础知识人工智能以知识为研究中心,涉及到知识的获取、表示、处理、分析和使用五个主要环节。人工智能中的“智能”体现在上述每一个环节,要求AI具备五个方面的智能:知识表示、机器感知、机器思维、机器学习与机器行为。2.2AI的主要表现形式1、知识表示知识经过一定的表示,才能把知识存储到计算机中,供求解问题使用。知识表示方法可分为两大类:-符号表示法-连接机制表示法。2.2AI的主要表现形式2、机器感知,让认识和感知世界,计算机具有类似于人的感知能力,从而模拟、延伸和扩展人从外界获取信息的能力,如视觉、音频(即听觉)、语音、自然语言等。目前已经形成了两个专门的机器感知研究领域:模式识别、自然语言理解。2.2AI的主要表现形式3、机器思维:让机器可以自动推理与搜索机器思维是指对通过感知得来的外部信息以及机器内部生产的各种工作信息进行有目的的处理,是人工智能研究中最重要也是最为关键的研究内容。机器思维使得计算机能够模拟人类的思维活动,既可以进行逻辑思维,又可以进行形象思维。2.2AI的主要表现形式4、机器学习:自主学习、自我完善的能力。机器学习是指在一定的知识表示框架下获取新知识的过程,主要研究如何使计算机具有类似于人的学习能力,从而使AI能够像人一样通过学习自动地获取知识,并在实践中不断地完善和提高自我。常见方法有回归分析、分类、推荐、计划、优化和模式识别2.2AI的主要表现形式5、机器行为:影响世界的能力机器行为主要是指计算机的表达能力,包括说、写、画等能力。对于智能机器人来说,它还应具有人的四肢功能,即能走路、能取物、能操作等。2.2AI的主要表现形式AI应用场景极其广泛,小到智能灯、刷脸、空调温度自动调控,大到无人驾驶、载人航天、马斯克的火箭自动回收等。每个应用场景都涉及三个基本问题:-做什么、-学什么、-怎么学。2.3AI的典型任务1、回归(Regression)是一种针对数值型连续数据进行预测和建模的有监督学习算法。回归任务的特点是需要标注的数据集,任务输入数据是连续性数据,任务目标也是连续型数值。也就是说,每一个观察样本都有一个数值型的标注真值。典型的回归算法有线性回归、多项式回归、逻辑回归、Ridge回归、Lasso回归等。2.3AI的典型任务2、分类(Classification)就是给数据贴标签的过程,要求尽肯能为不同类别数据贴上正确的类别标签。分类任务的目标就是让机器通过经验学习从而具有正确贴标签的能力。从数学角度来看,分类是一种对离散型随机变量建模或进行预测的一种有监督学习算法。与回归算法不同的是,分类算法通常适用于预测一个类别(或类别的概率)而不是连续的数值。2.3AI的典型任务3聚类(Clustering)就是给相似的或相近的数据划分到同一类别,把不相似或者不相近的数据划分到不同类别,聚类一般不需要预先给数据打标签。从技术上来讲,聚类是一种无监督学习任务,该算法基于数据的内部结构寻找观察样本的自然族群(即集群)。聚类常被用作分类算法的数据预处理步骤,用于处理缺少标签的数据。通过聚类分析,可以获得数据分布的基本概况,从而有助于提高分类算法的效率有效性。2.3AI的典型任务2.4AI基础技术当前主流的人工智能技术:-基于统计的机器学习(MachineLearning,简称ML)-人工神经网络(ArtificialNeutralNetwork,简称ANN)-深度学习(DeepLearning,简称DL)-强化学习(ReinforcementLearning,简称RL)。在实际应用中,机器学习可以理解为一种数据科学技术,通过算法帮助计算机从现有的数据中学习、获得规则,从而预测未来的行为、结果和趋势(图2-13)。机器学习的特点是只能解决存在过的能够提供经验数据的场景、而不能解决未遇见过的问题或场景,所以属于弱人工智能范畴。1、机器学习是人工智能的核心技术和实现手段。简单来说,机器学习就是让计算机具有学习的能力,从而使得计算机能够模拟人的行为。2.4AI基础技术机器学习的基本原理:机器学习一般包括三个步骤:一是收集历史数据,二是通过算法学习获得分布模式,三是应用模型处理新数据从而预测未来。其中,步骤二是机器学习研究的重点,学习的过程就是根据数据确定模型参数的过程。因此,机器“学习”的过程可以简化为寻找一个函数的过程,学习的结果也就是一个确定了参数的数学函数。2.4AI基础技术机器学习算法分类分类
算法任务目标学习方式分类聚类回归降维有监督无监督半监督强化学习回归算法√
√
√
K近邻(KNN)√
√
k-Means
√
√
决策树√
√
√
贝叶斯方法√
√
√
核方法:SVM/RBF/LDA√
√
√
期望最大化(EM)√
√
√√
神经网络√√
√√
深度学习√√
√√
主成份分析(PCA)
√
√
图论推理算法√
√
√
拉普拉斯SVM√
√
√
Q-Learning√√√
√时间差学习√√√
√机器学习算法众多,不同视角有不同的分类方式,这里主要介绍学习任务和学习方式两种视角。-根据学习任务的不同,可以把人工智能算法分为分类、聚类、回归以及降维四种类别。降维是数据预处理的一种方法,其作用是降低计算量,服务于回归、聚类和分类三种任务。-根据学习方式的不同,机器学习算法可以分为有监督学习、无监督学习、半监督学习和强化学习。2、人工神经网络(ArtificialNeutralNetwork,ANN)人工神经网络是一种模拟生物神经系统结构和功能的计算网络,因而生物神经网络是人工神经网络的技术原型。人类大脑皮层由大约140亿个生物神经元(简称神经元)组成,每个神经元又与大约103个其它神经元相连接,形成一个高度复杂又高度灵活的不断变化的动态网络。2.4AI基础技术生物神经元神经元以细胞核为中心,细胞核外有树突与轴突,树突接收其他神经元的脉冲信号,而轴突将神经元的输出脉冲传递给其他神经元,一个神经元传递给不同神经元的输出是相同的。神经元有两种状态:非激活和激活,非激活状态的神经元不输出电脉冲,而激活状态的神经元会输出电脉冲。神经元的激活与否由其接收的所有脉冲信号决定。一个神经元可以描述为一个处理电脉冲信号的非线性单元,该单元能够接受来自多个其他神经元的电脉冲,对接收到的电信号进行一定的处理,能够决定是否发射电脉冲信号。1943年,神经科学家麦卡洛克和数学家皮兹联手,根据生物神经元细胞的结构和工作原理,构造并提出了神经网络的数学模型MCP(McCulloch-Pitt:MCP),从而形成了“模拟大脑”、开启了人工神经网络(一般简称神经网络)的大门。人工神经元(又称感知器)结构如图2-17所示,其工作过程分为三个数学过程:对输入信号进行线性加权,加权后求和,以及采用一定阈值实现输出信号的激活。由于输出信号采用了阈值激活函数,人工神经元实现了非线性信号处理。人工神经元神经网络的拓扑结构与学习过程典型的神经网络由一个输入层、至少一个隐含层和一个输出层组成(图2-18),每层网络由多个神经元构成,层与层之间一般采用全连接,神经元之间的连接强度ω表示神经元之间联系的紧密程度。神经网络的模型众多,不同模型具有不同的网络结构,形成了不同的神经网络算法。值得注意的是,深度学习网络(如DBN、DCN、GAN、DRN等)也属于神经网络。与非深度神经网络相比,深度学习网络框架的层数往往较多、计算量巨大。神经网络技术发展历程3、深度学习(DeepLearning,DL)是机器学习中的一个研究分支,是神经元层数较多的神经网络,因此深度学习网络也被称为深度神经网络。大家耳熟能详的深度学习网络有很多,比如卷积神经网络(CNN),循环神经网络(RNN),生成对抗网络(GAN),深度强化学习(DRL)等。一般来说,其隐藏层的层数依具体问题可以是几层、几十层、几百层甚至数千层。2.4AI基础技术4、强化学习(ReinforcementLearning,RL)是机器学习领域的一个分支,强调如何基于环境而行动,以取得最大化的预期利益。可以认为强化学习是一套通用的学习框架,可用来解决通用人工智能的问题。因此强化学习也被称为通用人工智能的机器学习方法,在无人驾驶、工业自动化、金融贸易、自然语言处理、以及游戏等领域具有广泛的应用。强化学习的学习方式是在获得样例过程中进行探索性学习(图2-21),在获得样例之后根据环境反馈的奖赏和状态更新自己的模型,利用更新后的模型来指导下一步的行动,下一步的行动获得奖赏反馈之后再更新模型,不断迭代重复直到模型收敛。强化学习的典型应用有AlphaGoZero、基于RL的医疗保健动态治疗方案(DTRs)、京东和阿里的产品推荐和广告出价、新闻推荐等。2.4AI基础技术5、中国人工智能产业分布国际一流发展迅速有待加强2.4AI基础技术2.5AI典型应用领域1、计算机视觉(ComputerVision,CV):CV让机器“看的见、看得懂”,是人工智能主要应用领域之一。我国在机器视觉方面处于世界领先地位。2、智能语音:主要为机器人加上耳朵和嘴巴,让机器人能够“听得懂”、并且“说得好听”。3、自然语言处理(NaturalLanguageProcessing,NLP):NLP被用于分析、理解和生成自然语言,以方便人和计算机设备进行交流、以及人与人之间的交流。4、无人驾驶:通过自动驾驶系统,部分或完全的代替人类驾驶员,安全地驾驶车辆、船舶、飞机等各种运输设备。5、数据挖掘(DataMining),通过对海量数据的整理分析和归纳整合,分析并找出数据之间的潜在联系,为做出理想决策或预测发展趋势提供支撑性材料和建议,实现从海量数据中提取用于辅助决策的潜在的信息、知识、规律和模式。2.5AI典型应用领域“科学技术都是一把双刃剑”。伴随着人工智能技术的成熟和广泛应用,人与机器之间的矛盾凸显,人工智能的伦理问题引起了社会和各行各业的日益关注。人类对待AI出现了不同的观点,在科幻电影甚至传统媒体中均有体现。2.6人工智能伦理(EthicsofAI)AI在军事上的应用军用智能机器的性能和杀伤力远超人类士兵,无疑引起了人类对未来的担忧、以及对自主武器的争论,目前争论的核心是“自主武器该不该被使用”。2.6人工智能伦理(EthicsofAI)-AI伦理问题的解决方法阿西莫夫三定律:(1)机器人不得伤害人类,或因不作为使人类受到伤害。(2)除非违背第一定律,机器人必须服从人类的命令。(3)除非违背第一及第二定律,机器人必须保护自己。阿西莫夫第零定律:(0)机器人不得伤害人类整体,或因不作为使人类整体受到伤害。2.6人工智能伦理(EthicsofAI)人工智能的伦理问题仍需人类的统一意见和行动,需要政府统一制定政策并推进执行。2017年7月,中国国务院发布《新一代人工智能发展规划》,关于人工智能伦理和法律制定了三步走的战略目标:到2020年,部分领域的人工智能伦理规范和政策法规初步建立;到2025年,初步建立人工智能法律法规、伦理规范和政策体系;到2030年,建成更加完善的人工智能法律法规、伦理规范和政策体系。2.6人工智能伦理(EthicsofAI)-AI伦理问题的解决方法05项目任务06项目小结与展望项目小结人工智能定位于人类能力的模拟和延伸,其定义和内涵随着时代的前进而不断变化,其智能程度也在不断提高,包括了早期的弱人工智能,现在正在发展的强人工智能,以及将来的超人工智能。人工智能需要解决的任务主要有三类:回归、分类和聚类,其实现的技术手段以机器学习和神经网络为基本技术、以深度学习、强化学习等为主流方法。伴随着人工智能技术在社会各行业、各领域的深入应用,人工智能的伦理问题也日益突出,成为政府和社会关注的焦点,也成为了影响人工智能走向的关键因素。我国是AI技术研发和应用的大国,多项技术均处于国际领先地位。在我国“十四五”规划中,AI被明确列为优先发展的前沿科技领域之一,其基础研究工作更是被放到了战略地位,期待着更多的优秀青年加入到AI基础和核心研究中来。项目展望随着人脸识别技术的逐步成熟,靠“脸”生存将不再是幻想。伴随着人脸识别等人工智能技术的发展,今后,从个人生活、教育、商业服务到城市管理都将全面迈入智能化时代。特别是高校在课堂上引入人脸识别技术、对学生面部表情进行识别,记录学生的学习状态,能更好的了解学生的学习情况,从而及时调整教学节奏。感谢您的观看人工智能导论项目三人工智能编程语言Python01项目背景02思维导图03思政聚焦04项目相关知识05项目任务目录CONTENTS06展望01项目概述Python简介Python已经成为最受欢迎的程序设计语言之一,目前在人工智能科学领域被广泛应用。Python是人工智能(机器学习)的首选编程语言,它拥有众多模块,能完成人工智能开发的所有环节。使用Python进行AI的一个主要优点是它内置了许多与机器学习相关的库。Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言。主流的人工智能开发软件如谷歌的TensorFlow、Facebook的PyTorch和百度的PaddlePaddle等都使用python作为开发语言。可以说,学习人工智能,很难不学Python。02思维导图思维导图03课程思政杨辉三角杨辉,字谦光,南宋时期杭州人。在他1261年所著的《详解九章算法》一书中,辑录了三角形数表,称之为“开方作法本源”图,并说明此表引自11世纪中叶(约公元1050年)贾宪的《释锁算术》,并绘画了“古法七乘方图”。故此,杨辉三角又被称为“贾宪三角”。如图3-1所示。生成杨辉三角的规律为:杨辉三角的两个腰边的数都是1,从第3行起,除第一个数和最后一个数外,其它位置的数都是上顶上两个数之和。图3-1杨辉三角形04项目知识准备Python基础语法任何一门编程语言都有其专属的语法,编程语言之间有着相似的语法规定。我们需要遵守语法规定去编写代码向计算机发出正确的指令,计算机才会去执行。Python的基本语法包括变量和常量、字典、列表、元组、条件判断、循环、函数和类等。Python基础语法标识符简单地理解,标识符就是一个名字,就好像我们每个人都有属于自己的名字,它的主要作用就是作为变量、函数、类、模块以及其他对象的名称。Python中标识符的命名不是随意的,而是要遵守一定的命令规则。标识符是由字符(A~Z和a~z)、下划线和数字组成,但第一个字符不能是数字。标识符不能和Python中的保留字相同。Python中的标识符中,不能包含空格、@、%以及$等特殊字符。标识符区分大小写。Python基础语法标识符下面所列举的标识符是合法的:UserID,name,mode12,user_age以下命名的标识符不合法:4word#不能以数字开头try#try是保留字,不能作为标识符$money#不能包含特殊字符Python基础语法缩进Python中的缩进(Indentation)决定了代码的作用域范围。这一点和传统的c/c++有很大的不同(传统的c/c++使用花括号花括号{}符决定作用域的范围;python使用缩进空格来表示作用域的范围,相同缩进行的代码是处于同一范围)。每行代码中开头的空格数用于计算该行代码的缩进级别。Python基础语法注释注释用来向用户提示或解释某些代码的作用和功能,它可以出现在代码中的任何位置。Python解释器在执行代码时会忽略注释,不做任何处理,就好像它不存在一样。Python支持两种类型的注释,分别是单行注释和多行注释。单行注射以#开头,多行注释使用三个连续的单引号‘’‘或者三个连续的双引号“”“。例如:#这是单行注释‘’’这是多行注释’’’Python基础语法关键字Python有一组关键字,这些关键字是保留字,不能用作变量名、函数名或任何其他标识符。如and、as、break、continue和class等,我们在后续的学习中会逐步认识这些关键字。Python基础语法变量我们定义一个计算机变量就好像向快递柜申请一个格子用来存放东西,这个格子的大小呢是根据我们变量的类型(就是想要存放的物品的可能尺寸)来分配的。而在申请一个格子的时候,里面可能会存在一些东西,当我们放新的东西的进去的时候就会把原来的东西给挤走(更准确说是覆盖,旧的东西找不回来了)。如果我们想让这个格子里的内容参与运算的时候,我们只需要告诉运算的指令这个格子的名称(即变量的名称)即可。Python变量、类型和运算符所有的编程语言都支持变量,Python也不例外。变量是编程的起点,程序需要将数据存储到变量中。Python基础语法变量在编程语言中,将数据放入变量的过程叫做赋值。Python使用等号=作为赋值运算符,具体格式为:name=valuename表示变量名;value表示值,也就是要存储的数据。例如:>>>var1=123>>>var2=4.56Python基础语法变量类型变量可以指定不同的数据类型,这些变量可以存储整数,小数或字符。Python定义了一些标准类型,用于存储各种类型的数据。这些类型包括数字、字符串、列表、元组和字典。数字数据类型用于存储数值。他们是不可改变的数据类型,这意味着改变数字数据类型会分配一个新的对象。当你指定一个值时,数字对象就会被创建。例如:var1=1var2=10Python基础语法输入与输出Python使用input()和print()函数来完成输入和输出操作。a=input('输入你的名字:')b=input('输入你的生日:')print('你的姓名:',a)print('你的生日:',b)Python基础语法运算符1+2=3。其中,1和2被称为操作数,“+”称为运算符。Python支持多种运算符。请到平台中练习Python运算符的使用。Python基础语法编码规范一、规范的代码可以促进团队合作二、规范的代码可以减少bug三、规范的代码可以降低维护成本四、规范的代码有助于代码审查[1]/xiaxianfei/p/5275022.html数据类型数字Python中有三种数字类型:整数类型、浮点类型和复数类型。为变量赋值时,将创建数值类型的变量。Python中布尔类型为bool,bool是int的子类。bool类型只有两个值:True和False。任何类型数据都可以通过bool()函数转换为布尔值,“没有的”或“空的”值会转换为False,反之转换为True。如:None(空对象)、False、0、0.0、0j(复数)、''(空字符串)、[](空列表)、()(空元组)和{}(空字典)这些值会转换为False,否则是True。数据类型字符串字符串是Python中最常用的数据类型,字符串通常是由数字,子母、符号组成的一串字符。我们可以使用引号('或")来创建字符串。创建字符串的过程十分简单,我们只要为变量分配被引号包围住的一个值即可。例如:String1=‘张三’,String2=‘abc’数据类型列表列表是最常用的Python数据类型,它可以作为一个方括号内的逗号分隔值出现。列表的数据项不需要具有相同的类型。创建一个列表,只要把逗号分隔的不同的数据项使用方括号括起来即可。如下所示:list1=['physics','chemistry',1997,2000]list2=[1,2,3,4,5]list3=["a","b","c","d"]列表索引从0开始。第一个索引是0,第二个索引是1,依此类推。数据类型集合集合(set)是一个无序的不重复元素序列。可以使用大括号{}或者set()函数创建集合,注意:创建一个空集合必须用set()而不是{},因为{}是用来创建一个空字典。数据类型元组Python的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号,列表使用方括号。元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可。tup1=('physics','chemistry',1997,2000)tup2=(1,2,3,4,5)tup3="a","b","c","d“元组与列表类似,下标索引从0开始,可以进行截取,组合等。数据类型字典字典是另一种可变容器模型,且可存储任意类型对象。为了方便理解字典这一数据结构,我们可以这样去解释:你手上有一本电话本(字典),当你想查阅张三的电话号码(value),你就得在电话本上根据张三的名字(key)去寻找对应的张三的电话号码。张三的电话号码可以有很多个,但是电话本上张三的名字只能有一个。dictionary={ “name”:”张三”, “phone”:”12345”, Key3:value3, …}print(dictionary[“name”])#访问字典里对应name的值数据类型字典程序在一般情况下是按顺序执行的,就像流水账一样,一条一条从上往下按照顺序执行。有时候我们需要根据条件来有选择地执行某些语句,这就要使用到Python的条件判断语句——if。Python条件语句是通过一条或多条语句的执行结果(True或者False)来决定执行的代码块。可以通过右图来简单了解条件语句的执行过程:条件控制语句条件判断实例
#1.定义年龄变量age=18
#2.判断是否满18岁#if语句以及缩进部分的代码是一个完整的代码块ifage>=18:print("你是一个成年人了……")循环的概念循环是大多数编程语言都有的基本功能,它可以帮助我们执行一些重复的代码工作,但不同的语言循环结构会有一定的差异。Python中有for和while两种循环结构。for循环for循环是在希望创建循环时经常使用的工具。Pythonfor循环可以遍历任何可迭代对象,包括列表、元组、集合、字典甚至字符串。for循环的一般代码格式如下:for迭代变量in字符串|列表|元组|字典|集合:代码块fruits=["apple","banana","cherry"]forxinfruits:print(x)
while循环while循环的一般形式如下:while(判断条件):代码块
while循环while循环的一般形式如下:while(判断条件):代码块
迭代器迭代是Python最强大的功能之一,是访问元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。迭代器有两个基本的方法:iter()和next()。字符串,列表或元组对象都可用于创建迭代器。>>>list=[1,2,3,4]>>>it=iter(list)#创建迭代器对象>>>print(next(it))#输出迭代器的下一个元素1>>>print(next(it))2
函数的概念函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。函数的实例>>>defhello():print("HelloWorld!")
>>>hello()面向对象编程思想类(Class):
用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。方法:类中定义的函数。类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。数据成员:类变量或者实例变量用于处理类及其实例对象的相关的数据。方法重写:如果从父类继承的方法不能满足子类的需求,可以对其进行改写,这个过程叫方法的覆盖(override),也称为方法的重写。局部变量:定义在方法中的变量,只作用于当前实例的类。实例变量:在类的声明中,属性是用变量来表示的,这种变量就称为实例变量,实例变量就是一个用self修饰的变量。继承:即一个派生类(derivedclass)继承基类(baseclass)的字段和方法。继承也允许把一个派生类的对象作为一个基类对象对待。例如,有这样一个设计:一个Dog类型的对象派生自Animal类,这是模拟"是一个(is-a)"关系(例图,Dog是一个Animal)。实例化:创建一个类的实例,类的具体对象。对象:通过类定义的数据结构实例。对象包括两个数据成员(类变量和实例变量)和方法。Python模块Python模块(Module),是一个Python文件,以.py结尾,包含了Python对象定义和Python语句。模块让你能够有逻辑地组织你的Python代码段。把相关的代码分配到一个模块里能让你的代码更好用,更易懂。模块能定义函数,类和变量,模块里也能包含可执行的代码。04项目任务任务1:用python实现杨辉三角任务描述利用Python对数列的循环操作,实现中国南宋数学家杨辉在1261年所著的《详解九章算法》中出现的杨辉三角。
任务1:用python实现杨辉三角技术分析在我们编写程序前,我们需要了解其编程的思想,才能更好更快的写出质量优雅的代码。而生成杨辉三角的主要规律为:杨辉三角的两个腰边的数都是1,从第3行起,除第一个数和最后一个数外,其它位置的数都是上顶上两个数之和,如下图所示。任务1:用python实现杨辉三角任务实现---请大家扫二维码根据步骤测试实现任务2:用python实现词云图任务描述本节将利用wordcloud中的方法生成一个词云图。任务2:用Python实现词云图技术分析词云就是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出。词云图过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。制作词云也十分容易上手,我们首先需要通过pip命令安装wordcloud与jieba依赖库,通过库中封装好的方法处理,即可做出你想要的词云图。任务2:用Python实现词云图任务实现---请大家扫二维码根据步骤测试实现任务3:用Python画出象棋棋盘任务描述下载并安装Python入门级用于基础绘图的turtle库,利用turtle库抽象出的方法编写出相应的代码,画出中国象棋棋盘。任务3:用Python画出象棋棋盘技术分析中国象棋是起源于中国的一种棋,属于二人对抗性游戏的一种,在中国有着悠久的历史。由于用具简单,趣味性强,成为流行极为广泛的棋艺活动。中国象棋是中国棋文化,也是中华民族的文化瑰宝,它源远流长,趣味浓厚,基本规则简明易懂。中国象棋在中国的群众中基础远远超过围棋,是普及最广的棋类项目,中国象棋已流传到十几个国家和地区。中国象棋是一种古老的棋类游戏,大约有两千年的历史。是中华文明非物质文化经典产物,艺术价值泛属于整个人类文明进化史的一个分枝。绘制出中国象棋棋盘需要充分掌握Python的一个绘画库——turtle,turtle库带有画布(canvas)、画笔、绘图命令、画笔控制命令等抽象方法。任务3:用Python画出象棋棋盘任务实现---请大家扫二维码根据步骤测试实现04项目小结与展望展望Python已发展成为一种非常通用的语言,无论是从入门级选手到专业技术数据挖掘、科学计算、图像处理、人工智能,Python都可以胜任。大数据和人工智能的时代,将会有大量的数据需要处理,而Python对数据的处理,有着得天独厚的优势。未来,python仍会是一种主流的编程语言,继续在各个领域发挥作用。人工智能导论项目四物体识别--计算机视觉的应用01项目背景02思维导图03思政聚焦04项目相关知识05项目任务目录CONTENTS06项目小结与展望01项目背景物体识别背景介绍伴随着图片成为互联网中的主要信息载体,难题随之出现。当信息由文字记载时,我们可以通过关键词搜索轻易找到所需内容并进行任意编辑,而当信息由图片记载时,我们却无法对图片中的内容进行检索,从而影响了我们从图片中找到关键内容的效率。图片给我们带来了快捷的信息记录和分享方式,却降低了我们的信息检索效率。在这个环境下,借助计算机实现图像主体的识别技术就显得尤为重要。计算机视觉应用----物体识别物体识别,指利用计算机对图像进行处理、分析和理解,以识别图像中各种不同模式的目标和对象的技术。通俗地讲,物体识别是让计算机像人一样读懂图片的内容,识别出图像中有什么物体,并报告出这个物体在图像中的位置和方向。02思维导图思维导图03课程思政物体识别技术应用在互联网的海量图片、视频资料中,不少涉政敏感信息、暴力、低俗等内容的图片充斥其中,这些图片严重影响着国家安全和网络文明。在物体识别还未发展成熟以前,需要人工随机抽取图片对图片内容进行审核。借助人工智能、深度学习和大数据样本等技术,这一问题得到了很好地解决。当然,智能图片鉴别模型并不能完全取代人工鉴别,相比人工审核,机器还很难理解内容背后的深意。最佳的审核方式是智能为主,人工为辅。先由智能图片鉴别模型将可疑的图片筛选出来,再由人工审核一遍,这样既能保证效率又能保证准确率。物体识别技术应用网络上的内容并不都是文明和健康的,我们应该要懂得文明上网,取其精华,去其糟粕。对于个人而言,不得在网上发布和传播虚假信息、低俗或暴力信息;不得在网上通过发帖、评论等方式攻击、谩骂他人;不得在网上从事其他违背公序良俗、损害他人合法权益的活动;不去浏览一些负面新闻,更不应该去浏览一些低俗、暴力的网站,让自己自觉抵制不良内容;不参与网络敏感话题,对于一些敏感的或者反动的话题,要及时制止,不参与,不散播。04项目相关知识物体识别人类和计算机是如何识别这张图片的呢?物体识别的任务划分
a)分类b)分类+定位c)多目标检测物体识别任务划分分类的相关技术图像分类的流程包括训练阶段和测试阶段名词解释:训练集、测试集、独热编码、置信率4种类别的训练图片图像的原始特征表示形式莱娜灰度图图像的原始特征表示形式(a)彩色莱娜图(b)红色分量(c)绿色分量(d)蓝色分量彩色莱娜图及其红色、绿色、蓝色分量图像的预处理平移:把我们感兴趣的、图中的对象移到图像的中间位置,便于尽可能准确地、定量地分析图像的特征缩放:一个数组越大,计算机处理该数组时消耗的内存越大、花费的时间越长,因而可以根据需要对图像大小进行调整填充:为了使待处理图片符合分类模型对图像像素尺寸的要求,用特定的像素值对图片的长或宽的像素数量进行补充传统分类算法特征提取:(1)颜色直方图、局部二值模式、方向梯度直方图特征、尺度不变特征变换、Gabor特征、区域协方差描述符(2)主成分分析(PrincipalComponentAnalysis,PCA)、线性判别分析(lineardiscriminantanalysis,LDA)、流形学习(manifoldlearning)和稀疏编码(SparseCoding,SC)分类器:K近邻(K-NearestNeighbor,KNN)、支持向量机(SupportVectorMachine,SVM)、决策树、朴素贝叶斯、逻辑回归等传统分类算法KNN分类器原理示意图深度学习算法深度学习算法的特点优势:在训练集数量充足的情况下准确率高局限性:(1)大数据集花费昂贵且耗时,并不容易获得(2)训练阶段对硬件要求高目标检测相关技术滑动窗口检测示意图目标检测相关技术预测框的交并比说明非极大值抑制(Non-MaximumSuppression,NMS):当边框预测环节生成了大量建议边框后,接着要为每个矩形框做类别分类概率,最后需要判别哪些矩形框是没用的。所谓的非极大值抑制就是根据分类器类别分类概率做排序,从小到大排序,先拿最大概率候选框与其他框计算重叠度IOU,丢弃高于阈值的建议框。然后从没有被丢弃的建议框中再找最大概率建议框,重复上述操作,直到找到所有被保留下来的建议框。滑窗法改进YOLO算法示意图1.两步检测算法:R-CNN2.一步检测算法:YOLO物体识别的局限性1.多视角和尺度:同一个物体的图像,它的角度和尺度是多变的,获取到的这个物体的图片也是多样的;2.遮挡:目标物体可能被挡住,图片中只有目标物体的一小部分;3.光照条件:在像素层面上,光照对图片的影响非常大;4.类内差异:同一类别的个体之间有许多不同的对象,每个个体都有自己的外形。物体识别的优势1.在大数据时代,人类获取的图片资料越来越多,人们需要借助计算机去承担这些复杂沉重的工作,否则这些工作将由人类负担。2.在一些极端环境下,比如水下、严寒或酷暑的环境下的物体识别,如果工作由人工智能来完成,人类面临的危险、伤害和压力将有所减轻。3.人类判断物体类别的准确率总体上会比机器的识别率高,但在一些要求精密度的识别,比如缺陷识别、医学图片等识别,人类的优势可能会相应降低。在这类场合,通过机器替代人来实现物体识别,能够减少错误和缺陷。物体识别的应用1.光学字符识别2.图片识别分析3.工业瑕疵检测4.视频监控分析5.医疗影像诊断04项目任务任务1:数字识别1、任务描述手写数字识别是常见的图像识别任务。不同人的手写体风格迥异,大小不一,造成了计算机对手写数字识别任务的一些困难。任务1实践的主要目的是了解数字识别的基本原理与过程。首先通过查看数字图像的像素表达,了解图像到数字的转化过程,再通过手写数字的识别了解手写体识别的功能。2、任务实现2、任务实现2、任务实现任务2:目标检测1、任务描述目标检测是一个典型的计算机视觉任务,主要是完成图像中的物体的识别。与图像分类不同的是,图像分类是预测图像属于哪一种类别,而目标检测则是对图像中的一个或多个对象进行定位和分类。如果是视频,则通过不断的读取视频中的每一帧作为一幅幅图像来进行检测。任务2实践的主要目的是了解目标检测的基本原理与过程,通过上传图片来验证和实践目标检测中的图像预处理、目标定位与分类的各个步骤。2、任务实现2、任务实现2、任务实现04项目小结与展望项目小结人类感觉信息中的80%都是视觉信息,图像是人类获取和交换信息的主要来源。机器视觉之于人工智能的意义就是视觉之于人类的意义,而决定着机器视觉技术之一就是物体识别技术。随着计算机技术的不断发展,图像识别技术也在不断地优化,其算法也在不断地改进。在某些应用场景,机器视觉比人类的生理视觉更具优势,它更加准确、客观和稳定。利用计算机代替人类实现物体识别,能够尽量缩短时间并减少资源。项目展望人们一直致力于开发各种智能工具辅助人们的生产生活,比如机器人的研制,但是要想使得机器人可以像人一样运动,辅助人们的工作生活,那么前提是机器人必须具备类似于人的视觉系统,能够识别物体以及场景,真正的智能工具应该要具备“视觉”。目前的图像识别技术是作为一个工具来帮助我们与外部世界进行交互,为我们自身的视觉提供强有力的辅助和增强,所有的行动还需我们自己完成。而当机器真正具有了视觉之后,它们完全有可能代替我们去完成这些行动。总体而言,目前的物体识别还存在着很多困难,但是随着人类对自己视觉的逐步了解,一个通用的物体识别技术终会被研究成功。未来的图像识别技术将会同其他人工智能技术融合在一起,更加智能地出现在我们的生活中,为人类社会的更多领域带来重大的应用。感谢您的观看人工智能导论项目五人脸识别--计算机视觉的应用01项目背景02思维导图03思政聚焦04项目相关知识05项目任务目录CONTENTS06项目小结与展望01项目背景人脸识别---计算机视觉技术介绍“眼睛是心灵的窗户”,通过眼睛,我们可以观察周围的任何事物,可以看到很多风景,可以捕捉许多对我们有用的信息。同样,计算机视觉也是一双“眼睛”,通过它,计算机可以感知环境、获取信息。我们可以将计算机视觉理解为计算机的“眼睛”,但是计算机的“眼睛”只是对生物视觉的一种模拟而已。人脸识别----计算机视觉应用计算机视觉技术的广泛应用,信息时代促进了计算机的进一步发展,而计算机与各大领域的结合,使得人们对计算机越来越依赖。人工智能人脸方面的应用,包括人脸识别、人脸检测、人脸匹配、人脸对齐等等,这应该是计算机视觉方面最热门也是发展最成熟的应用,而且已经比较广泛的应用在各种安全、身份认证等,比如人脸支付、人脸解锁。计算机视觉是一个跨学科的领域,涉及的部分学科如图5-1所示。
计算机视觉计算机科学信号处理应用数学统计学神经生理学图5-1计算机视觉涉及的部分学科02思维导图项目五---思维导图03思政聚焦人脸识别技术应用人脸识别系统在很多领域都发挥了很多的作用,越来越多的现实场景开始采用人脸识别门禁系统来确保进出人员的安全,国内大部分的办公场所应用非常广泛,甚至在国内一些小区,开始鼓励小区应用人脸识别系统来进行身份识别,所以相信未来,随处都可以看到人工智能管理应用如图5-3所示如图5-3所示人脸识别技术应用启用人脸识别测温系统,兼具人脸识别门禁考勤和测温检测两大功能,不仅快速准确识别人员身份,还能检测播报人体温度,自动记录提交进出记录、测温数据,报表形式输出方便查看和监控,发信异常情况也能追溯分析如图5-4所示。如图5-4所示04项目知识准备人脸识别过程图5-5人脸识别过程人脸采集人脸检测预处理特征提取特征比对识别决策基于几何特征的人脸识别010203040506人脸识别常用方法基于神经网络的人脸识别基于特征脸(PCA)的人脸识别方法弹性图匹配的人脸识别方法线段Hausdorff距离(LHD)的人脸识别方法支持向量机(SVM)的人脸识别方法07多光源人脸识别技术人脸特征提取方法基于人脸特征点的识别算法通过对特征点进行局部特征纹理征提取,然后结合各部分的相对位置关系得到要优化的目标函数并构造迭代的方法,在给定的人脸图片上首先定位到眼睛等部位的位置,然后提取各特征点之间的分布形状特征和特征点自身具有的纹理、轮廓等特征,计算不同人脸的特征的“距离”从而对人脸进行识别。基于整幅人脸图像的识别算法通过信息理论中对人脸图像进行分析,寻找对信息最高效的编码,具体化来说,将图像作为一个高维的数据输入,通过子空间的划分(子空间划分可以借助傅立叶变换来理解,用一组基底的线性组合表示当前的信号,达到既降维又好分类的目的)得到对人脸图像最有效的表达,并由此来对人脸进行识别,也称子空间方法或特征脸方法。04项目任务任务1:人脸检测1、任务描述人脸检测是将上传的人脸图像,采用上文讲述的人脸预处理方法将人脸图片转化为灰度图,进行搜索以确定其中是否含有人脸,如果是有人脸则返回脸的位置、大小和姿态。任务1:人脸检测2、技术分析人脸检测处理流程如下图所示:获取人脸图像图像转为灰度图获取人脸框xy坐标获取眼镜框xy坐标任务2:人脸验证1、任务描述人脸验证是将上传的两张人脸图像,首先是运用任务1中的人脸检测法得到图片中人脸位置的xy坐标人脸框之后,对人脸框内的人脸进行人脸关键点定位,得到面部关键点所在的x,y坐标,得到面部关键点之后可运用坐标轴变换得到扭正后的人脸,接下来通过运用训练好的深度神经网络将输入的人脸图像转换成一个特征向量表示并进行比较,得到相似度值后判断两张人脸图像是否同一个人。任务2:人脸验证2、技术分析人脸验证处理流程如下图所示:任务3:AI人脸融合技术1、任务描述AI人脸融合技术是将上传的两张人脸图像,获得人脸的关键坐标,后台运用算法计算合成人脸关键点坐标,再通过三角剖分对两张人脸进行融合处理,生成的新人脸同时具备两张人脸的外貌特征。任务2:人脸验证2、技术分析本任务为指定人脸融合,首先检测到两张人脸图片,获取到人脸的关键点坐标,后台运用算法计算出合成的人脸关键点坐标,再通过三角剖分算法将人脸划分多个三角形,然后返回三角剖分结果,并描点连线绘制出来最终得到两张人脸融合图,生成最终的两张人脸图像的合成图像。AI人脸融合处理流程如下图所示:获取两张人脸图像获取人脸的关键点合成人脸关键点人脸三角剖分人脸合成04项目小结与展望项目小结在本章中,我们了解了人脸识别的关键技术与原理。如果要从一张图片或一段视频中做人脸识别,首先要在图像中准确标定出人脸的位置和大小。对截图的人脸图像进行预处理之后,再根据人脸五官关键点坐标,计算特征值。将提取的人物图像的特征值与数据库中存储的特征值进行匹配,如果相似度超过预设的阈值,则把匹配得到的结果输出。人脸识别就是将待识别的人脸特征与已得到的人脸特征进行比较,根据相似度对人脸的身份信息进行判断。项目展望随着人脸识别技术的逐步成熟,靠“脸”生存将不再是幻想。伴随着人脸识别等人工智能技术的发展,今后,从个人生活、教育、商业服务到城市管理都将全面迈入智能化时代。特别是高校在课堂上引入人脸识别技术、对学生面部表情进行识别,记录学生的学习状态,能更好的了解学生的学习情况,从而及时调整教学节奏。感谢您的观看人工智能导论项目六生物信息识别01项目背景02思维导图03思政聚焦04项目相关知识05项目任务目录CONTENTS06项目小结与展望01项目背景生物医学信号概述生物医学信号是人体生命信息的集中体现!是窥视生命现象的一个窗口。因此,深入进行生物医学信号检测与处理理论与方法的研究对于认识生命运动的规律,探索疾病预防与治疗的新方法以及发展医疗仪器这一高新技术产业都具有极其重要的意义。02思维导图项目五思维导图03课程思政近年来,我国发布了多条全国性政策和医疗人工智能专项政策,人工智能医疗上升为国家战略。我国医疗需求不断提升的同时,医疗资源分配不均,医护人员短缺等问题仍然十分严峻,而人工智能刚好弥补了这一短缺,加之人工智能医疗的政策规划不断落地,更加速我国人工智能医疗的发展。现阶段,人工智能+医疗主要有八大应用场景,分别是虚拟助理、医学影像、辅助诊疗、疾病风险预测、药物挖掘、健康管理、医院管理和辅助医学研究平台。我国居民心理行为问题和精神障碍的人群逐渐增加,民众心理健康问题日益凸显,国家对于心理健康和精神卫生的问题也越来越重视,各种相关政策陆续出台。精神疾病不仅降低个人的生活质量,还会导致医疗支出增加。人工智能的进步正把心理治疗带给更多需要它的人。04项目知识准备常见的生理信号人体给出的信号非常丰富,每一种信号都携带着对应一个或几个器官的生理或病理的信息。这些信号可大致分为电生理信号、非电生理信号、人体生理特征信号、生化信号和生物信息。电生理信号
其中,重要的是心电信号(ECG)、脑电信号(EEG)和肌电信号(EMG)。其次是胃电信号、眼视网膜信号和眼电信号。这些电信号源自于人体内细胞膜内外的电位差。亿万细胞的电活动通过人体组织传到体表,并叠加在人体不同部位形成了相应的电生理信号。只要人的生命特征存在,这些电生理信号总存在。电生理信号
心电信号心电信号是反映人体心脏情况的信号。心电信号的应用已经走进了我们的日常生活。除了医院使用的专业仪器,市场上也有很多穿戴式设备可以用于日常的ECG信号检测,如AppleWatch,华为手表,和Fitbit等。图6-1展示了AppleWatch.图6-1AppleWatch电生理信号
脑电信号脑电图(EEG)是脑神经细胞电生理活动在大脑皮层或头皮表面的总体反映。脑电信号中包含了大量的生理与疾病信息,在临床医学方面,脑电信号处理不仅可为某些脑疾病提供诊断依据,而且还为某些脑疾病提供了有效的治疗手段。在工程应用方面,人们也尝试利用脑电信号实现脑-计算机接口(BCI)。图6-2EEG脑电信号脑电(Electroencephalogram,EEG)是一种使用电生理指标记录大脑活动的方法,大脑在活动时,大量神经元同步发生的突触后电位经总和后形成的。它记录大脑活动时的电波变化,是脑神经细胞的电生理活动在大脑皮层或头皮表面的总体反映。脑电信号的电压很小,需要高精度的仪器才能探测到。常用于脑电分析的频域特征有α、β、δ、θ和γ等。脑电信号α频率于8-13Hz之间,大多发生在成人时期中,是节律性脑电波中最明显的波,通常出现在头的后部,在头两侧都会有,主导侧的振幅会比较高。当清醒的人处于放松或者闭眼状态时,可以在枕叶区探测的EEG中检测到alpha波。α代表放松的状态,是学习与思考的最佳脑波状态。脑电信号β波频率于13-30Hz之间,通常振幅小于30uV,会出现于所有年龄层的警戒状态以及被个人期望所引发的焦虑情绪中。β波涉及有意识的思想,逻辑思维,适量的β波帮助我们集中精力完成任务,有利于学习等认知行为,但是当β波过多的时候身体处于紧张的状态,容易引发焦虑和压力。脑电信号γ波频率位于30-70Hz之间,与情绪稳定、正面思考有关。近年研究发现,此波和选择性注意力有关。当此波形出现大幅波动时,表示受试者喜欢被测试的对象。出现该频段时人通常处于十分激动、亢奋的状态,或是受到了强烈的刺激。脑电信号δ波频率范围0-4Hz,与最深层次的放松和恢复,愈合、睡眠有关。有助于我们在睡眠良好后彻底恢复活力。太多的δ波与脑损伤、学习问题有关,太少则可能无法兴奋大脑。脑电信号θ波频率位于4-8Hz之间,有助于帮助改善我们的直觉,创造力,大多出现于幼童时期或是成人半睡半醒的状态以及意识静止的冥想放松状态之间。太多的θ波与多动症、注意力不集中有关,太少则与焦虑、压力大有关。最佳状态时有助于发挥创意和放松。这些意识的组合,形成了一个人的内外在的行为、情绪及学习上的表现。电生理信号
肌电信号肌电信号(EMG)是众多肌纤维中运动单元动作电位(MUAP)在时间和空间上的叠加。表面肌电信号(SEMG)是浅层肌肉EMG和神经干上电活动在皮肤表面的综合效应,能在一定程度上反映神经肌肉的活动。SEMG在临床医学、人机功效学、康复医学以及体育科学等方面均有重要的实用价值。图6-3肌电信号示意图情绪识别情感是人类在适应社会环境的过程中所逐渐形成的一种机制。情绪本身具有非常高的复杂性和抽象性,通常将情绪分为离散型模型和连续型模型两种。离散型情绪包括生气、讨厌、害怕、高兴、悲伤和惊讶等6种基本情绪类别,连续型情绪模型可以从维度观的角度进行理解,情绪的维度空间模型又可以分为二维、三维等不同类型。二维连续型模型如图6-3所示。图6-4情绪的连续型二维空间表示,情绪识别脑电信号可以用于情绪的识别。在基于脑电信号的情绪识别任务中,需要对脑电信号进行预处理以提高信号的质量,预处理一般包括降采样、滤波、去除伪迹以及特征提取等环节。对情绪的识别主要包含以下步骤:(1)诱导情绪(2)数据预处理(3)特征提取和特征选择(4)训练模型情绪识别如果采用离散情绪模型,那么情绪识别任务将是一个分类任务。对于分类任务,有许多的分类模型可以选择。传统的有监督和无监督等机器学习模型包括KNN、SVM、NaiveBayes、决策树、GBDT、K-means等模型。本任务中,我们选择支持向量机(supportvectormachines,SVM)作为分类器。支持向量机是一种二分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 超神数学-高考数学总复习拔高篇(二轮)专题2周期函数与类周期函数(含答案或解析)
- 房地产行业报告:百强房企拿地优于去年市场延续分化
- 部编版语文五年级下册《习作-神奇的探险之旅》课件
- PEEK行业深度:“机器人浪潮”下的特种塑料“弄潮儿”
- 2025年农业灌溉用水高效利用的节水灌溉设备市场分析报告
- 新零售时代下的连锁药店扩张路径与数字化运营模式研究报告
- 汽车行业供应链全球化背景下的韧性构建与风险管理报告
- 大数据与社交媒体融合的2025年精准营销策略研究报告
- 金融行业2025年反欺诈技术革新与大数据融合应用报告
- 2025年多式联运信息平台物流企业国际化发展与拓展报告
- 2023版浙江评审卫生高级专业技术资格医学卫生刊物名录
- 天津地理会考知识要点精华版
- GB/T 1689-1998硫化橡胶耐磨性能的测定(用阿克隆磨耗机)
- GB/T 16823.3-2010紧固件扭矩-夹紧力试验
- 江苏省金陵中学2023学年物理高一下期末调研试题(含答案解析)
- 2023年合肥城建发展股份有限公司校园招聘笔试模拟试题及答案解析
- DB11-T1834-2021 城市道路工程施工技术规程高清最新版
- 广东省珠海市2022-2023高一物理下学期期末学业质量检测试题
- 小学语文扩句、缩句专题
- PDCA降低I类切口感染发生率
- 人类能源史课件
评论
0/150
提交评论