第8章-大数据与人工智能_第1页
第8章-大数据与人工智能_第2页
第8章-大数据与人工智能_第3页
第8章-大数据与人工智能_第4页
第8章-大数据与人工智能_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章大数据与人工智能BigDataandArtificialIntelligence.

人工智能时代的到来8.1什么限制着人工智能的发展8.2大数据与人工智能的关系8.3人工智能技术的发展趋势8.48.1.1人工智能AI概念及分类

人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。人工智能是研究使计算机模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机、使计算机实现更高层次的应用。人工智能涉及哲学、语言学、认知科学、数学、神经生理学、心理学、计算机科学、信息论、控制论、不定性论等学科,属于自然科学和社会科学的交叉学科。8.1人工智能时代的到来8.1.1人工智能AI概念及分类

弱AI和强AI:从人工智能的发展阶段来看,可以将AI分为两类:一种是弱人工智能阶段(ArtificialNarrowIntelligence,ANI),另一种是强人工智能阶段(ArtificialGeneralIntelligence,AGI)。(1)弱AI又称窄AI,指专门针对特定任务而设计和训练的AI,如苹果的虚拟语音助手Siri。在“弱人工智能”阶段,ANI只专注于完成某个特定的任务,如语音识别、图像识别和翻译,是擅长单个方面的人工智能,类似高级仿生学。它们只是用于解决特定具体类的任务问题而存在,大多是统计数据从中归纳出模型。谷歌的AlphaGo是典型的“弱人工智能”,它可以被称为一个优秀的数据处理者,但是AlphaGo也仅会下棋,是一项擅长于单个游戏领域的人工智能。(2)强AI又称通用AI,具备通用化的人类认知能力,具备足够的智能以解决不熟悉的问题。在“强人工智能”阶段,AGI就能在各方面都与人类媲美,拥有AGI的机器不仅是一种工具,而且本身可拥有“思维”。有知觉和自我意识的AGI能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习等,人类能干的脑力活它基本都能胜任。事实上,人工智能国际主流学界所持的目标是弱人工智能,目前很少有人致力于强人工智的研究,也没有相应的成果。8.1人工智能时代的到来8.1.1人工智能AI概念及分类

反应式机器、有限记忆、意志理论、自我意识:密歇根州立大学的ArendHintze教授从现有的人工智能系统类型到尚不存在的有感知系统将人工智能分为四类。(1)反应式机器这一类型的人工智能涉及计算机对世界的直接感知并作出相应反应,而并不依赖于对世界的内部概念。最基本的AI系统就是完全反应式的,既不能形成记忆,也不能利用过去的经验来指导当前决策。代表性范例:IBM的国际象棋超级计算机——DeepBlue“深蓝”。DeepBlue能够识别棋盘上的棋子,并且知道每个棋子如何移动。它可以预测下一步自己和对手如何移动,然后从中选择最佳移动方案。DeepBlue不考虑之前发生的任何事,也没有任何关于之前的记忆,只考虑当前棋盘上棋子的位置,然后从所有可能的下一步动作中选择一种。这种反应式的方法确实让AI系统在特定游戏中表现更出色。但这种计算机思维没有更宽泛的世界的概念——这意味着它们无法执行特定任务之外的其他任务,无法交互性地参与真实世界。(2)有限记忆这一类型的人工智能可以观察过去的情况以用于预测在不远的未来将发生的行为。代表性范例:自动驾驶汽车。自动驾驶的汽车会观察其他车辆的速度和方向。观察过去的情况无法短时间内完成,而是需要识别特定对象并持续监视。这些待观察物体被添加到自动驾驶汽车预编程的“表示”中。这些“表示”包括车道标记、交通指示灯等其他重要元素。当无人驾驶汽车为避免阻拦其他司机或与其他汽车相撞而决策变道时,这些因素都会被考虑在内。但是这些关于过去的简单片段化信息是短暂的,与驾驶员积累多年驾驶经验的方法不同的是,这些简单片段化的信息不会被保存为可从中学习的经验库信息。8.1人工智能时代的到来8.1.1人工智能AI概念及分类

(3)意志理论这一类型的人工智能能够理解影响自身决策的观点、欲求和目的。目前这类AI尚不存在。心理理论这一点可以被视为目前AI机器与未来AI机器的重要分界点。在心理学中将人、生物和其他物体有影响自己行为的思想和情绪称为“心理理论”。这对人类如何形成社会至关重要,因为它让人类进行社会性互动。如果不理解对方的动机和意图,或者没有考虑到别人对自己或周围环境的认知,就会给工作带来困难。(4)自我意识这一类型人工智能是具有自我意识的机器,能够理解自身目前的状态,并能利用现有信息推测他人的思维。目前这类AI尚不存在。自我意识属于AI发展的最后一步,即是构建可以形成自我“表示”的AI系统。在某种意义上,这是第三类人工智能的“心理理论”的延伸。这时AI研究人员不仅需要了解意识,而且还要构建拥有意识的机器。8.1人工智能时代的到来8.1.1人工智能AI概念及分类

认知AI、机器学习AI和深度学习:根据AI的主要研究方向,可以将AI分为以下三种类型。(1)认知AI认知AI(CognitiveAI)是最受欢迎的人工智能分支,负责所有类似于人类的交互。认知AI能够轻松处理复杂性和二义性,同时还持续不断地在数据挖掘、NLP(Neuro-LinguisticProgramming,自然语言处理)和智能自动化的经验中学习。如今的认知AI能够综合人工智能做出的最佳决策和人类工作者们的决定,以监督更棘手或不确定的事件。这可以帮助扩大人工智能的适用范围,并生成更快、更可靠的答案。(2)机器学习AI机器学习AI(MachineLearningAI)处于计算机科学前沿,如自动驾驶技术,但将来有望对日常工作产生极大的影响。机器学习要在大数据中寻找一些“模式”,然后在没有过多人为解释的情况下,用这些模式来预测结果,而这些模式在普通的统计分析中是看不到的。机器学习需要以下三个关键因素才能有效。①数据。为了教给人工智能新技巧,需要将大量的数据输入给模型,用以实现可靠的输出评价。如特斯拉已经向其汽车部署了自动转向特征,同时把它所收集的所有数据,例如驾驶员的干预措施、成功逃避、错误警报等都会发送到总部,从而在错误中学习并逐步锐化感官。8.1人工智能时代的到来8.1.1人工智能AI概念及分类

②部署。机器学习需要从计算机科学实验室进入到软件当中。越来越多的像CRM(CustomerRelationshipManagement,客户关系管理)、Marketing、ERP(EnterpriseResourcePlanning,企业资源计划系统)等供应商正在提高嵌入式机器学习或与提供它的服务紧密结合的能力。(3)深度学习如果机器学习是前沿的,那么深度学习(DeepLearning)则是尖端的。它将大数据和无监督算法的分析相结合。它的应用通常围绕着庞大的未标记数据集,这些数据集需要结构化成互联的群集。深度学习的这种灵感来自于大脑中的神经网络,因此也将其称为人工神经网络。深度学习是许多现代语音和图像识别方法的基础,并且与以往提供的非学习方法相比,具有更高的精确度。8.1人工智能时代的到来8.1.2人工智能发展史

1.人工智能的诞生(20世纪40~50年代)1943年,阿兰·图灵发明了“图灵机”,为智能机器的判定设置了基准:“能够成功骗过人类,让后者以为自己是人类的机器,称为智能机器”。1950年,科幻作家艾萨克·阿西莫夫发表短篇科幻小说集《我,机器人》,书中提出了影响深远的“机器人三原则”。第一条:机器人不得伤害人类,或看到人类受到伤害而袖手旁观。第二条:机器人必须服从人类的命令,除非这条命令与第一条相矛盾。第三条:机器人必须保护自己,除非这种保护与以上两条相矛盾。他提出的“机器人三原则”被称为现代机器人学的基石,他也因此被称为“机器人学之父”,如图所示。1954年,第一台可编程机器人诞生。美国人乔治·戴沃尔设计了世界上第一台可编程机器人。1956年,美国达特茅斯学院举行了历史上第一次人工智能研讨会,会上麦卡锡首次提出“人工智能”概念,当时盛行“由上至下”的思路,即由预编程的计算机来管治人类的行为。8.1人工智能时代的到来8.1.2人工智能发展史

2.人工智能的黄金时期(20世纪60~70年代)1966年,美国麻省理工学院发布了世界上第一个聊天机器人ELIZA,其智能之处在于能通过脚本理解简单的语言,从而产生类似人类的互动。1968年,首个通用式移动机器人诞生,能够通过周围环境来决定自己的行动。1969年,MIT人工实验室创始人马文·明斯基为导演斯坦利·库布里克的电影《2001漫游太空》担任顾问,塑造了片中超级智能计算机HAL9000的银幕形象。8.1人工智能时代的到来8.1.2人工智能发展史

3.人工智能的低谷(20世纪70~80年代)1973年,AI“寒冬“论开始出现。在AI上的巨额投入几乎未收到任何回报和成果,对AI行业的资助开始大幅滑坡。20世纪70年代,当时的计算机内存有限且处理速度慢,不足以解决任何实际的人工智能问题,人工智能发展遭遇了瓶颈。8.1人工智能时代的到来8.1.2人工智能发展史

4.人工智能的繁荣期(20世纪90年代至今)1990年,RodneyBrooks提出了“由下自上”的研究思路,开发能够模拟人脑细胞运作方式的神经网络,并学习新的行为。1997年,超级计算机“深蓝”问世,并在国际象棋人机大战中击败人类顶尖棋手、特级大师加里·卡斯帕罗夫。IBM“深蓝”以3.5:2.5击败卡斯帕罗夫,成为首个在标准比赛时限内击败国际象棋世界冠军的电脑系统。如图所示。8.1人工智能时代的到来8.1.2人工智能发展史

2002年,iRobot公司打造出全球首款家用自动化扫地机器人。2005年,美国军方开始投资自动机器人,波士顿动力的“机器狗”是首批产品之一。2008年,谷歌在iPhone上发布了一款语音识别应用,开启了后来数字化语音助手(Siri、Alexa、Cortana)的浪潮。2010年,上海世博会上,来自NAO公司的20个跳舞机器人献上了一段长达8分钟的完美舞蹈。2011年,IBMWatson在Jeopardy答题竞赛中战胜了表现最优秀的人类选手。2014年,在图灵测试诞生64年后,一台名为EugeneGoostman的聊天机器人通过了图灵测试。谷歌向自动驾驶技术投入重金,Skype推出实时语音翻译功能。2015年,Google开源了利用大量数据直接能训练计算机来完成任务的第二代机器学习平台TensorFlow,剑桥大学建立了人工智能研究所。2016年,Google人工智能AlphaGo以4比1的总比分战胜围棋世界冠军李世石,这一轮人机对弈让人工智能正式被世人所熟知,整个人工智能领域迎来新一轮爆发。回顾人工智能的发展史,可以看到在这80年里,其发展并非一帆风顺,其间经历了20世纪50~60年代以及80年代的人工智能浪潮期,也经历过70~80年代的沉寂期,最终在21世纪初迎来了发展黄金时期。8.1人工智能时代的到来8.1.2人工智能发展史

第一次浪潮:五十年代的达特茅斯会议确立了人工智能AI这一术语,又陆续出现了感知神经网络软件和聊天软件,并用机器证明的办法去证明和推理一些定理。人类惊呼“人工智能来了”。然而,当时理论和模型只能解决一些非常简单的问题,人工智能进入第一次寒冬。第二次浪潮:八十年代Hopfield神经网络和BT训练算法的提出,使得人工智能再次兴起,出现了语音识别、语音翻译计划,以及日本提出的第五代计算机。但由于训练学习时数据量过大,很多结果到一定程度就不再往上升,且在一定程度上这些设想迟迟未能投入应用,人工智能进入了第二次寒冬。第三次浪潮:随着2006年出现的深度学习技术,以及2012年ImageNet竞赛在图像识别领域带来的突破,人工智能再次爆发,核心是基于互联网大数据的深度学习,把一些技术、神经元网络和统计的方法结合到一起,形成AI生态圈,并逐渐走向成熟。随着近年来数据爆发式的增长、计算能力的大幅提升以及深度学习算法的发展和成熟,迎来了人工智能概念出现以来的第三个浪潮期。8.1人工智能时代的到来8.1.3人工智能产业分析据VentureCapital调查报告显示,截至2016年底,全球范围内总计1485家与人工智能技术有关公司的融资总额达到了89亿美元。将人工智能行业细分为了11个类别。1.计算机视觉/图像识别该技术领域通过处理和分析图像以从中获取信息,示例包括用于开发人员的视觉搜索平台和图像标记API。这一类别下的企业主要提供分析图像采集和识别相关信息的底层支持技术解决方案并从属于各行业的垂直细分行业,利用图像处理技术应用到各种具体的实际应用中,例如面部识别、图片识别、图像检索等。2.深度学习/机器学习该技术领域基于现有数据进行学习操作,开发计算机算法,示例包括预测数据模型和分析行为数据。这一类型的企业主要通过利用特定的学习算法来对已有的信息进行学习和操作以供某一特定领域使用,或主要专注于算法的开发研究,旨在实现通过已有数据进行学习,包括搭建用于预测的数据模型、分析行为数据等。3.自然语言处理该技术领域通过对人类语言的处理并将其转换为可理解的描述,示例包括自动生成叙述文本,并挖掘应用到数据中。这一类型的公司研发和搭建的算法主要用于处理人类语言输入,并将其转化为多种其他的表现形式,例如语音与文字的双向转换等。8.1人工智能时代的到来8.1.3人工智能产业分析

4.语音识别该技术领域能够处理人类言语的声音片段,精确识别词语并从中推断出含义,示例包括检测语音命令并将其转换为可操作数据的软件。这一类型的公司研发能够处理人类语音并准确识别其含义的技术产品,例如通过接收语音指令实现要求的相关操作等。5.智能机器人该技术领域能够研发可以从自身经验中学习,并根据自己的环境条件自主行动的机器人,例如可以在互动中对人们的情绪做出反应的家庭机器人,可以帮助客户在商店中购买商品的零售机器人。6.虚拟个人助手该技术领域能够基于反馈和命令为个人执行日程任务和服务的软件助理。这一类型的公司主要研发能够基于用户指令完成日常任务与服务的助理软件,例如个人助理APP和网络客服等,帮助企业管理产品售后服务或负责管理私人日程安排等。8.1人工智能时代的到来8.1.3人工智能产业分析

7.手势控制该技术领域能够通过手势与计算机进行交互和通信,示例包括能够通过身体动作来控制视频游戏角色,或者通过单独的手势来操作计算机和电视的软件。这一类型的公司主要研发可以让用户通过手势与计算机交互的技术。8.推荐引擎和协助过滤算法这一类型的公司研发根据过去的选择能够预测用户对电影、餐厅等偏好并依此做出个性化推荐的技术。例如音乐推荐应用。9.情景感知计算这一类型的公司主要研发能够自动感知周围环境(位置、方向、光度、温度等)并基于感知到的信息进行自身调整的软件。例如当检测到环境处于黑暗时自动调高亮度的应用程序。8.1人工智能时代的到来8.1.3人工智能产业分析

10.视频内容自动识别该技术领域能够将视频内容抽样与源内容进行比较,通过其独特特征来识别内容的软件。包括通过将其与受版权保护的内容进行比较,在用户上传的视频中检测受版权保护内容的软件。这一类型的公司主要研发将视频内容样本与源内容文件进行比较识别的技术,可以应用于识别用户上传视频与版权视频文件比较,以检测是否侵权。11.语音翻译该技术领域可以自动识别人类的语言并实时翻译成另一种语言。示例包括将视频聊天或网络讨论内容自动、实时地转换为多语言的软件。8.1人工智能时代的到来

1.可解释性问题随着深度学习的成功和采用,人工智能系统也在不断发展,带来了更多样化、更先进的应用,也带来了更多的不透明性。更大及更复杂的模型使我们很难用人类的语言来解释为什么会做出某种决定(而在实时做出某种决定时就更难了)。这是人工智能工具在一些对可解释性有需求的应用领域的使用率仍然很低的原因之一。此外,随着人工智能应用的扩展,监管规定也可能推动对更多可解释的人工智能模型的需求。2.数据标签目前大多数人工智能模型都是通过“监督学习”进行训练的。这意味着,人类必须对底层数据进行标记和分类,这可能是一个相当庞大且容易出错的任务。例如,开发自动驾驶汽车技术的公司雇佣了数百人来手工标注原型车的视频输入时数来帮助培训这些系统。不过目前的生成对抗网络(GenerativeAdversarialNetworks,GANs)这种半监督式方法能有效解决这一问题。3.获取大量的训练数据集已经证明,使用线性模型的简单人工智能技术在某些情况下与医学和其他领域专家的能力相接近。然而,当前机器学习浪潮需要训练数据集,这些数据集不仅要有标记,而且要足够庞大和全面。深度学习方法需要成千上万的数据记录,才能使模型在分类任务上变得相对优秀,在某些情况下,还需要数以百万计的数据记录才能达到人类的水平。对于许多业务用例来说,大量的数据集可能很难获得或创建(试想:利用有限的临床试验数据来更准确地预测治疗结果)。在分配的任务中,每一个微小的变化都需要另一个大数据集进行更多的训练。如教一辆自动驾驶汽车在天气不断变化的采矿地点进行导航,将需要一个包含车辆可能遇到的不同环境状况的数据集。8.2什么限制着人工智能的发展

4.学习的普遍性与人类的学习方式不同,人工智能模型很难将它们的经验从一种环境转移到另一种环境。实际上,模型为给定用例实现的任何东西都只适用于该用例。因此,即使用例非常相似,公司也必须反复提交资源来培训另一个模型。应对这一挑战的一个前景可期的答案是学习迁移。5.数据和算法中的偏差到目前为止,我们专注于通过在工作中已经应用的技术解决方案可以克服的一些限制。当人类的偏好(有意识或无意识)在选择使用哪些数据点和忽视哪些数据点时,会产生潜在的破坏性的社会影响。此外,当数据收集本身的过程和频率在不同的组别观察到的行为不一致时,算法分析数据、学习和预测的方式很容易出现问题。负面影响包括错误的招聘决策、错误的科学或医学预测、扭曲的金融模型和刑事司法决策等。在许多情况下,这些偏见在“高级数据科学”、“专有数据和算法”或“客观分析”的面纱下被忽视或忽略。在新的领域部署机器学习和人工智能算法时,可能会有更多的实例将这些潜在偏差问题纳入数据集和算法中。这种偏差一般根深蒂固,因为识别它们并采取措施解决它们需要深入掌握数据科学技术,以及对现有社会力量(包括数据收集)的更深的元认识。总而言之,去偏差被证明是迄今为止最令人畏惧的障碍之一,也是最让社会担忧的问题之一。8.2什么限制着人工智能的发展随着大数据技术的快速发展,计算能力、数据处理能力和处理速度得到了大幅提升,人工智能的价值得以展现。大数据与人工智能二者相辅相成,随着智能终端和传感器的快速普及,海量数据快速累积,基于大数据的人工智能也因此获得了持续快速发展的动力来源。大数据和人工智能的关注点并不相同,但却有着密切的联系:一方面人工智能需要大量的数据作为“思考”和“决策”的基础,另一方面大数据也需要人工智能技术进行数据价值化操作,如机器学习就是数据分析的常用方式。在大数据价值的两个主要体现中,数据应用的主要渠道之一就是智能体(人工智能产品),为智能体提供的数据量越大,智能体的运行效果就会越好,因为智能体通常需要大量的数据进行“训练”和“验证”,从而保障运行的可靠性和稳定性。8.3大数据与人工智能的关系大数据的积累为人工智能发展提供燃料:如果我们把人工智能看成一个拥有无限潜力的婴儿,那么某一领域海量的数据就是奶粉。奶粉的数量决定了婴儿是否能长大,而奶粉的质量则决定了婴儿后续的智力发育水平。《数据时代2025》白皮书显示,到2025年全球数据总量将达到163ZB,其中属于数据分析的数据总量将比2016年增加50倍,达到5.2ZB(十万亿亿字节)。爆炸性增长的数据推动着大数据技术的壮大,也为人工智能技术提供了丰厚的数据土壤。以人脸识别所用的训练图像数量为例,百度训练人脸识别系统需要2亿幅人脸画像。又如百度的无人驾驶,需要采集大量路况信息(路口红绿灯信息、路况人流量、道路车辆等)。当无人驾驶汽车行驶到某个路口的红绿灯时,需要根据记录的数据分析是停车还是继续驾驶;当前路面湿滑时,需要根据数据分析汽车应该减速到某个时速,这样才比较安全;当前方有行人过马路时,汽车系统需要捕获照片,“决策”暂停行驶等。所以无人驾驶系统底层架构一定要是基于大数据的逻辑算法,也能存储海量数据信息,根据底层大数据、用户的需求进行分析,然后编码成逻辑程序。8.3大数据与人工智能的关系数据处理技术推进运算能力提升:人工智能领域富集了海量数据,传统的数据处理技术难以满足高强度、高频次的处理需求。AI芯片的出现,大大提升了大规模处理大数据的效率。目前,出现了GPU(GraphicsProcessingUnit,图形处理器)、NPU(NeuralNetworksProcessUnits,神经网络处理单元)、FPGA(Field-ProgrammableGateArray,现场可编程门阵列)和各种各样的AI专用芯片,比传统的双核CPU提升约70倍的运算速度。8.3大数据与人工智能的关系人工智能推进大数据应用深化:在计算力指数级增长及高价值数据的驱动下,以人工智能为核心的智能化正不断延伸其技术应用广度、拓展技术突破深度,并不断增强技术落地(商业变现)的速度,例如,在新零售领域,大数据与人工智能技术的结合,可以提升人脸识别的准确率,商家可以更好地预测每月的销售情况;在交通领域,大数据和人工智能技术的结合,基于大量的交通数据开发的智能交通流量预测、智能交通疏导等人工智能应用可以实现对整体交通网络进行智能控制;在健康领域,大数据和人工智能技术的结合,能够提供医疗影像分析、辅助诊疗、医疗机器人等更便捷、更智能的医疗服务。同时在技术层面,大数据技术已经基本成熟,并且推动人工智能技术以惊人的速度进步;在产业层面,智能安防、自动驾驶、医疗影像等都在加速落地。8.3大数据与人工智能的关系按产业链结构划分,人工智能可以分为基础技术层、AI技术层和AI应用层。基础技术层主要聚焦于数据资源、计算能力和硬件平台,数据资源主要是各类大数据,硬件资源包括芯片研发、存储设备开发等。AI技术层着重于算法、模型及可应用技术,如计算智能算法、感知智能算法、认知智能算法。AI应用层则主要关注将人工智能与下游各领域结合起来,如无人机、机器人、虚拟客服、语音输入法等。8.3大数据与人工智能的关系随着人工智能的快速应用及普及,大数据不断累积,深度学习及强化学习等算法不断优化,大数据技术将与人工智能技术更紧密地结合,具备对数据的理解、分析、发现和决策能力,从而能从数据中获取更准确、更深层次的知识,挖掘数据背后的价值,催生出新业态、新模式。作为引领新一轮科技革命和产业变革的战略性技术,人工智能的产业化已经取得了显著的效果,在各领域的逐步应用也显示出带动性很强的“头雁”效应。中国、美国、英国、德国、法国、日本等主要国家都纷纷将人工智能上升为国家级战略,积极抢占人工智能竞争的制高点。我国还进一步强调要加强人工智能领域前沿技术布局,支持科学家勇闯人工智能科技前沿的“无人区”。在云计算、大数据和芯片等的支持下,人工智能已经成功地从实验室中走出来,开始进入到了商业应用,并在机器视觉、自然语言处理、机器翻译、路径规划等领域取得了令人瞩目的成绩。未来人工智能技术将分别沿着算法和算力两条主线向前发展,并逐步带领人类进入到人机协同的新时代。8.4人工智能技术的发展趋势8.4.1深度学习

深度学习(DeepLearning,DL)是机器学习领域中一个新的研究方向,其动机在于建立模拟人脑进行分析学习的神经网络。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习是一类模式分析方法的统称,就具体研究内容而言,主要涉及三类方法。(1)基于卷积运算的神经网络系统,即卷积神经网络(ConvolutionalNeuralNetwork,CNN)。(2)基于多层神经元的自编码神经网络,包括自编码(Autoencoder)以及近年来受到广泛关注的稀疏编码(SparseCoding)两类。(3)以多层自编码神经网络的方式进行预训练,进而结合鉴别信息进一步优化神经网络权值的深度置信网络(DeepBeliefNetwork,DBN)。8.4人工智能技术的发展趋势8.4.1深度学习

机器学习是人工智能的核心,是使计算机具有智能的根本途径。机器学习作为一门多学科交叉专业,涵盖概率论、统计学、近似理论和复杂算法知识,使用计算机作为工具并致力于真实且实时地模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率,支撑着人工智能的技术层面。而在机器学习的具体实践任务中,选择一组具有代表性的特征用于构建模型是非常重要的问题。而人工选取特征依赖人力和专业知识,不利于推广。于是我们需要通过特征学习来抽取和学习特征,使机器学习的工作更加快捷、有效。而特征学习又包括深度学习、成分分析、自编码器、矩阵分解和各种形式的聚类算法。通过深度学习的多层处理,逐渐将初始的“低层”特征表示转化为“高层”特征表示后,用“简单模型”即可完成复杂的分类等学习任务。由此深度学习使得特征学习技术向前迈进一大步。如图所示。8.4人工智能技术的发展趋势8.4.1深度学习

(1)自下上升的非监督学习自下上升的非监督学习是从底层开始,一层一层地往顶层训练。采用无标定数据(有标定数据也可)分层训练各层参数,这一步可以看作是一个无监督训练过程,这也是和传统神经网络区别最大的部分,可以看作是特征学习过程。具体的,先用无标定数据训练第一层,训练时先学习第一层的参数,这层可以看作是得到一个使得输出和输入差别最小的三层神经网络的隐层,由于模型容量的限制以及稀疏性约束,使得得到的模型能够学习到数据本身的结构,从而得到比输入更具有表示能力的特征;在学习得到n-l层后,将n-l层的输出作为第n层的输入,训练第n层,由此分别得到各层的参数。(2)自上而下的监督学习自上而下的监督学习是通过带标签的数据去训练,误差自顶向下传输,对网络进行微调。基于第一步得到的各层参数进一步优调整个多层模型的参数,这一步是一个有监督训练过程。第一步类似神经网络的随机初始化初值过程,由于第一步不是随机初始化,而是通过学习输入数据的结构得到的,因而这个初值更接近全局最优,从而能够取得更好的效果。8.4人工智能技术的发展趋势8.4.2卷积神经网络(CNN)

卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习的代表算法之一。卷积神经网络具有表征学习(representationlearning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariantclassification),因此也被称为“平移不变人工神经网络(Shift-InvariantArtificialNeuralNetworks,SIANN)”。与传统的全连接神经网络相比,CNN的层级结构具有层内的卷积核参数共享和层间连接的稀疏性两个特点,使得其能够以较小的计算量达到稳定的学习效果且对数据没有额外的特征工程要求,这样大量地减少了需要训练参数的数量。8.4人工智能技术的发展趋势8.4.2卷积神经网络(CNN)卷积神经网络的结构包含下面几层:1.数据输入层:卷积神经网络的输入层可以处理多维数据,常见地,一维卷积神经网络的输入层接收一维或二维数组,其中一维数组通常为时间或频谱采样;二维数组可能包含多个通道;二维卷积神经网络的输入层接收二维或三维数组;三维卷积神经网络的输入层接收四维数组。与其他神经网络算法类似,由于使用梯度下降算法进行学习,卷积神经网络的输入特征需要进行标准化处理。具体地,在将学习数据输入卷积神经网络前,需在通道或时间/频率维对输入数据进行归一化,若输入数据为像素,也可将分布于[0,255]的原始像素值归一化至区间[0,1]

。输入特征的标准化有利于提升卷积神经网络的学习效率和表现。8.4人工智能技术的发展趋势8.4.2卷积神经网络(CNN)

2.卷积计算层:卷积层是CNN的核心,其主要过程是滑动窗口扫描图像,也就是图像像素对应与卷积核进行加权求和,这个过程与滤波器滤波时的操作相似。卷积的目的是为了提取图像特征,利用若干卷积核通过局部连接和权值共享训练提取图像特征。如图显示的是输入一张5*5大小的灰度图像,卷积核的尺寸为3*3,步长为2,将卷积核在灰度图像矩阵上做滑动和计算,将卷积核中每个参数和图像矩阵中每个像素点的像素值相乘然后加上偏置参数,最后取和得到右边的结果。8.4人工智能技术的发展趋势8.4.2卷积神经网络(CNN)3.激励层:激励层负责把卷积层输出结果做非线性映射,CNN采用的激励函数一般为ReLU函数(TheRectifiedLinearUnit,修正线性单元):f(x)=max(x,0)f(x)=max(x,0),它的特点是收敛快,求梯度简单。8.4人工智能技术的发展趋势8.4.2卷积神经网络(CNN)4.池化层池化层也是CNN中很重要的一层,通常与卷积层成对的出现,其目的和作用是对卷积层输出的特征图进行深度不变的降维。池化层在提取了主要特征的同时对数据量进行了缩减,降低卷积神经网络计算的复杂度,过程如下:其中s代表所选池化模板,是模板的权值。按照的不同运算方式,可以把池化分成平均池化、最大池化与随机池化等等。本文采用的是最大池化。如图所示,选用2×2尺寸的池化滤波器模板,通过区域不重复的最大池化操作,也就是将模板内的图像特征矩阵中的像素值按照大小进行排序,选择数值最大的像素值作为最后的结果,最终把一张尺寸为4×4的特征图矩阵转化为了2×2尺寸的矩阵,像素点个数由16个减少为4个,池化后的维数得到了降低,且出现过拟合的可能性大大降低,有利于减少计算量和增强CNN的鲁棒性。8.4人工智能技术的发展趋势8.4.2卷积神经网络(CNN)5.全连接层全连接层是指该层的每个节点都和上一层的节点进行了连接,把上一层输出的特征全部进行综合,因此该层的权值参数最多。全连接层将每个节点相互连接起来作内积运算,一般分为两层。第一层全连接层连接前一层的输出,接着与第二层全连接层进行逻辑处理,最后将输出值送出给分类器进行分类。图中连线最密集的两个地方就是全连接层,很明显的可以看出全连接层的参数很多。其具体原理是将每个节点和上一层的特征做线性的加权求和,上一层输出的每个节点与权重系数相乘,再加上偏置值。在图8-7中,全连接第一层的输入为60×2×2个神经元,输出为1000个节点,那么共需600×2×2×1000=2400000个权值参数和1000个偏置。8.4人工智能技术的发展趋势8.4.3图像数据处理图像数据处理是利用图像数据去噪、图形分割、图像数据增强等手段根据需求对图像数据进行处理的技术。近年来,图像处理技术日趋成熟,被航空航天、军事、生物医学及人工智能等广泛应用。图像数据处理技术主要分成两大类:模拟图像处理(AnalogImageProcessing)和数字图像处理(DigitalImageProcessing)。数字图像处理是指将图像信号转换成数字信号并利用计算机进行处理的过程。其优点是处理精度高,处理内容丰富,可进行复杂的非线性处理,有灵活的变通能力,一般来说只要改变软件就可以改变处理内容。困难主要在处理速度上,特别是进行复杂的处理。数字图像处理技术主要包括如下内容:几何处理(GeometricalProcessing)、算术处理(ArithmeticProcessing)、图像增强(ImageEnhancement)、图像复原(ImageRestoration)、图像重建(ImageReconstruction)、图像识别(ImageRecognition)。图像处理技术的发展涉及信息科学、计算机科学、数学、物理学以及生物学等学科,其理论和技术的发展对图像处理科学的发展有越来越

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论