算力是人工智能的基础设施算法是人工智能的灵魂_第1页
算力是人工智能的基础设施算法是人工智能的灵魂_第2页
算力是人工智能的基础设施算法是人工智能的灵魂_第3页
算力是人工智能的基础设施算法是人工智能的灵魂_第4页
算力是人工智能的基础设施算法是人工智能的灵魂_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1算力是人工智能的基础设施PPT课件算力是人工智能的基础设施,算法是人工智能的灵魂人工智能研究框架培训01算力是AI产业发展的根基算力是承载人工智能应用发展的基础,是人工智能最核心的要素图20:算力是AI产业发展的根基数据的快速增长对算力发展提出更高要求。随着信息化、数字化的持续推进,全球新产生的数据量正在快速增长,根据IDC数据显示,

2021年全球新增数据总量达到84.5

ZB,预计到2026年全球新增数据总量将达到221.2

ZB,2021年至2026年间的年复合增速达到21.22%新应用场景的出现对数据实时性要求更高,从而使得边缘计算能力变得愈发重要,人工智能应用也越来越依赖边缘算力支撑。算力、算法和数据是人工智能产业发展的三个核心要素,在三大要素中,算力才是最核心的要素数据的生产不再是问题,如何处理、分析和使用数据才是问题。算法经历了数十年的发展,在深度学习和加速计算出现之后,得到了迅速的发展和优化算力是承载和推动人工智能走向实际应用的决定性力量算力算法模型的复杂化和巨量化需要更强算 力的支撑。近些年,算法模型的参数量 和复杂程度都在呈现指数级增长态势, 尤其是自然语言处理等新兴认知智能领 域对算力的要求远超图像识别和语音识 别等传统AI领域数据来源:证券研究数据算法

282算力是人工智能的基础设施PPT课件人工智能研究框架培训01算力提升有极强的经济效益算力的经济效益使其成为各国政策支持的重点根据清华大学全球产业院与浪潮信息联合发布的《2021-2022全球计算力指数评估报告》,通过对全球15个重点国家的计算力指数与数字经济及GDP的回归分析,得到15个重点国家的计算力指数平均每提高1点,国家的数字经济和GDP将分别增长3.5‰和1.8‰进一步研究发现,当一个国家计算力指数分别达到40分及60分以上时,计算力指数每提升1点,其对GDP增长的推动力将分别增加到1.5倍及3倍。智能算力提升具备重大经济效益,对算力基础设施发展的支持性政策成为各国政策的重点。图21:算力提升具有极强的经济效益数据来源:《2021-2022全球计算力指数评估报告》,证券研究

293算力是人工智能的基础设施PPT课件人工智能研究框架培训01AI

数据中心需求激增,AI

服务器快速放量AI

数据中心是专门用于支持人工智能计算和数据处理任务的设施或物理空间AI

数据中心通常拥有大量高性能的服务器、GPU

加速器和专门的存储系统,以提供强大的计算能力并加速深度学习AI

数据中心配备了高速的网络设备和优化的软件框架,以支持高效的数据传输和算法训练通过这些专门的配置和优化,AI

数据中心能够为各种规模和复杂度的AI

工作负载提供可靠稳定的计算环境,并满足大规模数据存储、备份和分析的需求AI

数据中心在推动人工智能技术的发展和应用方面起到关键作用,为各行各业的AI

应用和服务提供了强大的支持图22:AI数据中心比普通数据中心需要更好的计算能力、存储需求、网络带宽和软件支持用于快速数据传输和通信的高网络带宽、低延迟网络,以满足对数据传输速度的敏感需求用于大规模并行计算,处理复杂机器学习和深度学习算法的高性能计算设备(如GPU和特定的AI芯片)软件支持针对机器学习和深度学习任务的软件支持,包括专门的AI框架、库和工具,以及优化的软件栈和分布式计算平台,以提高计算效率和性能计算能力储存需求用于存储大规模数据集的大容量、高速存储网络宽带数据来源:证券研究

304算力是人工智能的基础设施PPT课件人工智能研究框架培训01AI

数据中心需求激增,AI

服务器快速放量大模型的出现和技术创新对AI数据中心的发展起到推动作用大模型的出现带来了算力的增量需求根据OpenAI

发布的有关GPT-3模型的文档,它包含1750

亿个参数,需要进行数千万次的计算操作来完成一次推理任务ChatGPT

的总算力消耗约为3640PF-days,需要7~8

个投资规模30

亿、单体算力500P

的数据中心才能支撑运行,这样的规模和复杂性需要高

性能的计算设备和大规模的并行计算能力,带动了AI

数据中心需求的增长新的处理器架构、高速网络、存储技术以及更高效的冷却和能源管理系统的出现,提升了数据中心的性能和效率,为AI

数据中心的发展提供了技术支持图23:大模型时代使算力需求翻倍提升数据来源:IJCNN

315算力是人工智能的基础设施PPT课件人工智能研究框架培训01AI

服务器中,GPU

价值量最大AI

服务器是AI

数据中心重要的组成部分AI

服务器是专门为人工智能应用而设计和配置的服务器,具备强大的计算能力和高效的数据处理能力,是执行AI

任务和处理大规模数据的关键组件,为数据中心提供计算资源和算力,用于执行复杂的AI

算法和模型。AI

服务器有两种主要架构:混合架构和基于云平台的架构。图24:AI服务器主要使用混合架构和云平台架构基于云平台的架构混合架构使用远程存储技术和混合云存储(一种联合本地存储和云存储的技术)进行数据存储,利用云端的计算资源进行AI模型的训练和推理可以将数据存储在本地,利用本地的计算资源进行

AI模型的训练和推理描述优点缺点提供弹性的存储和计算能力保证数据的安全性和隐私性可能存在数据的安全性和隐私性问题可能受限于本地的存储和计算能力数据来源:证券研究

326算力是人工智能的基础设施PPT课件人工智能研究框架培训01AI

服务器中,GPU

价值量最大AI

服务器中的主要元器件包括CPU、GPU

板组、内存、存储、网络接口卡、机箱、主板、散热系统和电源图25:AI服务器拆箱图如下所示加速卡(如GPU、TPU)提供高性能的并行计算能力,用于加速机器学习和深度学习任务,可以加快模型训练和推理的速度CPU负责执行计算任务和处理数据,是服务器的主要计算引擎,可以进行复杂的算法和模型运算背板提供连接各个部件的接口,而布线则用于传输电力和数据信号散热系统用于控制服务器的温度并保持其在安全范围内运行。散热片吸收和分散热量,而风扇则提供气流来冷却服务器内部。主板是AI服务器的核心电路板,连接各个部件并提供电源和数据传输的接口,承载着CPU、内存插槽、扩展插槽和其他重要组件内存(RAM)用于临时存储数据和程序代码,提供快速的数据访问和处理能力。AI服务器通常配备大容量的内存,以支持大规模的数据集和模型电源提供服务器所需的电能,确保各个组件正常运行机箱是AI服务器的外部框架,提供支撑和保护内部组件的结构数据来源:英伟达官网,证券研究

337算力是人工智能的基础设施PPT课件人工智能研究框架培训01AI

服务器中,GPU

价值量最大GPU

是AI

服务器中价值量最高的部件,承担了大部分的计算任务和深度学习模型的训练与推理图26:整个AI硬件产业链中的各个环节紧密合作,共同构建了支持AI应用和服务的完整生态系统在整个AI服务器的投入比例中,

GPU通常占据较大的比例,大约在整体投入的30%至60%之间。

GPU提供了强大的并行计算能力和高效的深度学习加速,是实现高性能AI计算的关键。GPU冷却系统CPU作为服务器的核心计算单元发挥着重要作用,而存储、网络设备、冷却系统和电源等则在支持和维护服务器功能上起到关键作用。电源CPUAI服务器其他部件在整体投入中比例相对较小,但它们同样是确保服务器正常运行和数据中心高效运作的必要组成部分存储网络设备数据来源:证券研究

348算力是人工智能的基础设施PPT课件人工智能研究框架培训AIGC拉动AI算力需求,AI芯片将成为未来科技石油01基于APU架构的MI300预计于年底开始应用于超级计算机随着AI进入“大模型”时代,训练数据不断增长、算法复杂度不断提高,国内人工智能厂商对算力的需求陡升。AI芯片作为大模型及AI应用落地的算力基础,重要性日益凸显。广义的AI芯片指专门用于处理人工智能应用中大量计算任务的模块,即面向人工智能领域的芯片均被称为AI芯片。狭义的AI芯片即针对人工智能算法做了特殊加速设计的芯片。狭义的AI芯片与传统芯片(如CPU)相比,性能优势主要体现在专用性的侧重上。图27:AI芯片产业链较为复杂IP授权设计晶圆代工AI芯片云端/边缘端终端训练推理智能汽车智能手机AIoT机器人数据来源:证券研究

35算力是人工智能的基础设施PPT课件人工智能研究框架培训AIGC拉动AI算力需求,AI芯片将成为未来科技石油01GPUFPGAASIC定制化程度通用型半定制化定制化灵活性好好不好成本高较高低编程语言/架构CUDA,OpenCL等Verilog/VHDL等硬件描述语言,OpenCL、HLS/功耗大较大小主要优点峰值计算能力强,产品成熟平均性能较高,功耗较低,灵活性强平均性能很强,功耗很低,体积小主要缺点效率不高,不可编辑,功耗高量产单价高,峰值计算能力较低,编程语言难度大前期投入成本高,不可编辑,研发时间长,技术风险大主要应用场景云端训练,云端推理云端推理,终端推理云端训练,云端推理,终端推理AI

芯片主要分为三种类型:通用型(GPU)、半定制型(FPGA)、定制型(ASIC)三类芯片代表分别有英伟达(NVIDIA)的GPU、赛灵思的FPGA和Google的TPU。GPU的计算能力最强,但是成本高、功耗高;FPGA可编程,最灵活,但是计算能力不强;ASIC体积小、功耗低,适合量产,但是研发时间长,且不可编辑,前期投入成本高,带来一定的技术风险。表1:AI芯片分为GPU、FPGA、ASIC三种类型数据来源:证券研究

3610算力是人工智能的基础设施PPT课件人工智能研究框架培训AIGC拉动AI算力需求,AI芯片将成为未来科技石油01针对不同技术路径,国内厂商均已有所布局GPU:国内GPU厂商已有部分产品落地,国产GPU迎来黄金发展期图28:国内GPU企业迎来较快发展公司于

2014

年成功研发出国内首颗国

2022

年5月,公司M9系列第二款产高性能、低功耗

GPU

芯片JM5400,

图形处理芯片成功研发,可以满足地打破了国外产品长期垄断我国GPU

理信息系统、媒体处理、CAD

辅助景嘉微自主研发了一系列GPU芯片,包括JM54系列、JM72系列、JM92系列三代GPU产品设计、游戏、虚拟化等高性能显示需求和人工智能计算需求,可广泛应用于各种设备场的局面,并不断研发更为先进的JM7200和JM9系列海光DCU系列产品深算一号已经实现商业化应用,于2021年实现规模化出货,未来将广泛应用于大数据处理、人工智能、商业计算等领域海光DCU系列产品以基于通用的

GPGPU架构,采用7nm工艺,兼容“类

CUDA”环境以及国际主流商业计算软件和人工智能软件,软硬件生态丰富其产品性能达到了国际上同类型主流高端处理器的水平,具有较强的并行计算能力和较高的能效比,在国内处于领先地位数据来源:证券研究

37数据来源:证券研究11算力是人工智能的基础设施PPT课件人工智能研究框架培训AIGC拉动AI算力需求,AI芯片将成为未来科技石油01针对不同技术路径,国内厂商均已有所布局图29:CPU+FPGA:国内巨头纷纷布局CPU+FPGA的混合异构加速AI计算表2:ASIC:国内ASIC厂商实力雄厚,积极追赶国外芯片巨头此前被全球最大

FPGA厂商赛灵思收购的深鉴科技也基于FPGA来设计深度学习的加速器架构数据来源:证券研究全球科技巨头纷纷布局云端FPGA生态,国内包括腾讯云、阿里云均在2017年推出了基于FPGA的服务,百度大脑也使用了FPGA芯片数据来源:证券研究

3812算力是人工智能的基础设施PPT课件人工智能研究框架培训AIGC拉动AI算力需求,AI芯片将成为未来科技石油01实现专用算法“硬件优化”,ASIC路线在AI领域的长期成长性值得期待图30:ASIC路线在AI领域的长期成长性值得期待ASIC具备性能更强、体积更小、功耗更低、成本更低、可靠性更髙等优点,将更具备一定竞争优势FPGA方案及ASIC方案成本曲线存在差异ASIC无法重新编程前期投入成本较高

39数据来源:头豹研究院,证券研究13算力是人工智能的基础设施PPT课件人工智能研究框架培训要解决人类指定的各类任务,先要让计算机模拟人类的学习机制01人类跟计算机的能力维度各有优势,让计算机学习和模拟人类的解决问题的方法是各类算法的起点人类会非常容易的辨别出垃圾邮件与猫狗,但是让计算机做却非常困难,因为这与发明计算机的最初任务有本质区别。比如对1亿数据进行混合四则运算或大小排序,这些任务让人类执行会非常低效,但计算机却可以快速完成。而人工智能要处理的任务与计算机最初的任务恰好相反。这就促使了让人们思考人类到底是怎么进行学习的。人类的学习机制:婴儿根本不知道猫狗到现在我们可以一眼分辨出猫狗,是一个经验学习过程:首先需要一定的样本资料,从小可能在电视中、现实中或图书中或家长教育中获得大量信息,然后大脑将接受的信息进行学习、归纳、整理、总结,最后形成我们的知识与经验。对于计算机,它的优势是计算能力非常强,可以处理海量数据。我们需要给它提供成千上万的资料数据(猫狗照片)让它进行学习,然后计算机再面对新样本时才能以较高的准确率进行分辨。图31:理解人类的学习机制,有助于让人工智能来有效复刻这种能力机制图32:让计算机模仿人类来解决问题具备理论上的可行性

40数据来源:AI有温度微信公众号,证券研究数据来源:AI有温度微信公众号14算力是人工智能的基础设施PPT课件人工智能研究框架培训基于AI习得的能力,AI

就能处理两大类任务01AI

所能处理的这些任务背后的根本任务只有两类,就是分类与回归人类大脑每日处理的其实也是分类与回归问题。比如我们会思考晚上吃烧烤还是火锅,会选择出门穿哪件衣服,这些都可看做是分类问题;在称重上秤前我们会先估计自己多重,约会时会预计对方几点到达,这些都可看做是回归问题。图33:分类和回归是人工智能所处理任务的主要类别例如预测一封邮件是否是垃圾邮件、预测照片中的人是男性还是女性还是偏中性?这种结果只有两个值或者多个值的问题,我们可以把每个值都当做一类,预测对象到底属于哪一类。对于结果只有两个值的问题,一般称为二分类问题,结果有多个值的问题称为多分类问题。分类分类任务:模型输出是:对象的所属类别;数据类型是:离散数据例如要通过一个人的饮食预测一个人的体重,体重的值可以有无限多个,有的人60kg,有的人61kg,而且在60和61之间也有无限多个数。这种预测结果是某一个确定数,而具体是哪个数有无限多种可能,预测的这个变量(体重)因为有无限多种可能,在数轴上是连续的,所以称这种变量为连续变量。回归人工智能要处理的任务多种多样。比如人脸识别、垃圾邮件检测、电源票房预测、降雨量预测等等。但是这些任务背后的根本任务只有两类,就是分类与回归。回归任务:模型输出的结果是:一个值;数据类型是:连续型数据

41数据来源:证券研究15算力是人工智能的基础设施PPT课件人工智能研究框架培训分类任务:模型输出是对象的所属类别,数据类型是离散数据01分类任务:有二分类和多分类二分类任务包括前面提到的垃圾邮件检测与猫狗图像识别的例子。多分类任务场景包括下棋与自动驾驶等场景。在棋盘上可以落子的个数是有限的,所以每一步阿尔法Go要做的就是根据当前已落子信息,预测出落子在每个可落子位置的胜率,然后选取胜 率最高的位置进行落子即可;自动驾驶车辆上装有多个摄像头和传感器来时刻监视车辆四周的环境信息,可根据这些环境的图像信息让它选择在每种情况下方向盘转动多少角度、油门或刹车踩多深来实现车辆的自动行驶。图34:棋牌类是多分类任务的场景案例之一

图35:自动驾驶也是一种多分类任务可给方向盘设置900个选择方案(普通车的方向盘一般是

900度,也就是两圈半),给油门刹车分别设置10个档位。那么整个自动行驶的过程,其实就是在每个时刻根据环境信息来对这三个关键部件进行操作选择,所以可以将它看作为分类任务。数据来源:百度数据来源:广汽

4216算力是人工智能的基础设施PPT课件人工智能研究框架培训回归任务:模型输出的结果是一个值,数据类型是连续型01以网约车出行预测以及股价预测来说明回归任务。回归任务和分类任务并非严格区分。案例一:可根据上下车地点、时间、天气情况、人流密度以及历史记录等因素,预测此刻某区域的网约车订单数,并以此为依据进行车辆调度,保证供需平衡。案例二:股价预测也可看做为一个回归问题。因为可根据历史走势、利弊政策、公司财报等因素对股价进行预测。其实分类问题在某种程度上可以看做为一个回归问题:比如可以定义若一支股票涨幅会大于5%,就把它归为买入类;在-5%至5%之间,就将它归为持有类;跌幅大于5%的话就将它归为卖出类。图36:网约车出行流量预测是一种回归任务图37:股价预测也是典型的回归任务根据相应程序可以预测股价趋势,可看做回归问题数据来源:百度地图数据来源:微软

4317算力是人工智能的基础设施PPT课件人工智能研究框架培训最终计算机解决这些任务的方案,我们称之为算法01从人工智能大的子领域来看,常用的算法类型有专家系统、传统机器学习与深度学习。专家系统通俗来说就是制定规则;传统的机器学习主要运用可解释的数学公式进行推导预测;而目前大火的深度学习则是模拟人脑神经元进行学习与预测,通常不具有可解释性,但却能很好的解决问题(之后会详细解释)。图38:AI核心算法主要分为三大类专家系统利用以往知识与经验制定规则传统机器学习通过训练集,不断识别特征,不断建模,最后形成有效的模型,这个过程就叫“机器学习”!无论使用什么算法,使用什么样的数据,最根本的思路都逃不出上面的3步。深度学习模拟人脑神经元进行学习与预测,通常不具有可解释性

44数据来源:证券研究18算力是人工智能的基础设施PPT课件人工智能研究框架培训专家系统算法:基于以往知识与经验来制定规则01早期AI

根据设定的规则,让电脑去执行预测。这种早期算法也叫做“专家系统”。专家系统是模拟人类专家解决某一类具体问题的人工智能系统,如疾病诊疗、机械设计等。那么, 如何让计算机模拟人类专家?思路很简单:想办法将专家掌握的知识抽取出来,利用这些知识,

计算机就可以像专家一样工作了。例如,AI在互联网中的早期应用有识别垃圾邮件。邮箱每天会收到众多邮件,而把垃圾邮件剔除就可以大大节约人们在垃圾邮件中浪费的时间。传统的方法是制定规则,比如一篇文章中大量出现“免费”“特价”“发财”“代理”“稳赢”等等关键词,我们就把它定义为垃圾邮件,根据设定的规则,然后让电脑去执行预测。实现专家系统要解决两个问题:一是如何表示知识,二是如何利用知识解决问题首先是知识表示的问题,即如何将专家的知识梳理出来,并表示成计算机能读懂的结构。知识表示有很多种方法,最简单的是写成“如果...就...”这样的判断句,称为“产生式规则”。第二个问题涉及到推理方法,即如何利用既有知识解决问题。以诊疗系统为例,如果病人的表现是打喷嚏和发烧,人类的医生会基于打喷嚏和发烧这些表现,判断病人可能是感冒了,而治疗感冒的常用药物是阿司匹林,因此医生会告诉病人:吃几片阿斯匹林。这个过程就是人类的推理过程。计算机医生会模仿这个过程,首先会将病人发烧和打喷嚏作为前提在知识库中查找。图39:用IF语句来举例理解专家系统知识表示基于该知识推论病人是否感冒。得出结论后,通过“感冒”,在知识库中继续查找,发现下面的知识解决问题基于该知识,计算机就知道要给病人开阿司匹林IF发烧AND打喷嚏Then感冒IF感冒THEN开阿司匹林数据来源:证券研究

4519算力是人工智能的基础设施PPT课件人工智能研究框架培训单一的专家系统算法会遇到诸多瓶颈01但在实践过程中,有些任务本身的规则很难定义。一个典型的例子就是图像识别。在图像识别领域中,一个最基础的问题就是分辨这个图像是什么。举例来说,告诉你一张图像不是猫就是狗,现在给你一张图片,让你分辨一张图片到底是猫还是狗。人类可以轻松地分辨出左侧是猫右侧是狗,但是让你具体说出你是究竟根据什么来分辨出猫与狗的,突然发现这个问题很难回答。例如,猫跟狗都有五官与体毛,并有基本相同的姿势等等,计算机量化描述这些规则的话,难度和复杂度极大。图41:因为图像的细节特征太多,编写规则来进行判断的难度极大图40:识别图像的工作极大提升了传统算法的难度数据来源:AI有温度微信公众号数据来源:AI有温度微信公众号

4620算力是人工智能的基础设施PPT课件人工智能研究框架培训传统的机器学习主要运用可解释的数学公式进行推导运算01案例任务:收集鸢尾花花萼的长度与宽度,来判断它具体属于哪一品种(由于可视化与易推导的需求,此处将数据维度降到2维或3维来说明传统机器学习的原理。而现实中的数据通常是具有多种特征的,比如鸢尾花的数据集原本有4个特征,其实我们应该在一个4维空间对数据进行切分)。机器学习背后的数学保证了低维空间的算法推导到高维空间也同样适用。图42:传统的机器学习主要运用可解释的数学公式进行推导预测根据两组数据计算出一条

f(x)=k1x1+k2x2+b(可理解为

y=kx+b)的直线将两类数据分离:首先将花萼的长度与宽度绘制在一张二维图中,红色代表一类,蓝色代表一类如果再来一组数据落入直线上方,就归属于红色类;若落入直线下方,则属于蓝色类数据来源:AI有温度微信公众号,,证券研究

4721算力是人工智能的基础设施PPT课件人工智能研究框架培训传统的机器学习对图像识别有天然优势01传统机器学习同样可以运用到图像领域可以看到在鸢尾花分类任务中的特征都有明确的含义,每个数字代表什么意思。而其实在机器学习中,特征可以是很抽象的,在图像识别领域中,通常将每一个像素点看做一个特征。在数字识别任务中,将图像放大,每一个像素由一个方块表示,方块颜色的深浅不同就对应着不同的值,所以可以用28*28=784个特征来代表这张图像,然后将数字按顺序排开喂给机器机进行学习,并归纳整理每个位置的值与最终结果的关系。在算法领域中特征可能是不具有含义的,而是抽象的,甚至这个特征与最终结果毫无关系。图44:传统机器学习的工作流程如下所示图43:利用机器学习来处理像素点可以实现图像识别数据来源:雷锋网数据来源:华为云官网

4822算力是人工智能的基础设施PPT课件人工智能研究框架培训根据机器学习训练方式,又分监督学习、无监督学习和强化学习01监督学习需要有明确的目标,很清楚自己想要什么结果。比如:按照“既定规则”来分类、预测某个具体的值…监督并不是指人站在机器旁边看机器做的对不对,而是具有四个步骤的流程。图45:监督学习可以处理回归和分类两种任务,下面以芝麻信用评分(回归任务)来说明监督学习步骤4

:对新用户进行预测当我们想知道一个新用户的信用状况时,只需要收集到他的这5种数据,套进公式f

计步骤2

:收集已知数据为了找出公式f,需要先收集大量的已知数据,这些数据必须包含一个人的5种数据和他的信用状态(把信用状态转化为分数)。算一遍就知道结果了!把数据分成几个部分,一部分用来训练,一部分用来测试和验证。04

在新数据上使用方法论人类把”新的问题”(测试集)给机器,让他去解答01

训练出方法论02

提供训练数据01

合适的模型先把部分已知“问题和答案”(训练集)给机器去学习机器总结出了自己的“方法论”选择一个合适的数学模型步骤1

:构建问题,选择模型首先找出个人信用的影响因素,从逻辑上讲一个人的体重跟他的

信用应该没有关系,而财富总额貌似跟信用有关,所以根据判断,找出了下面5个影响因素:付款记录、账户总金额、信用记录跨度(自开户以来的信用记录、特定类型账户开户以来的信用记录…)、新账户(近期开户数目、特定类型账户的开户比例…)、信用类别(各种账户的数目)数据来源:easyai官网,证券研究步骤3

:训练出理想模型有了这些数据,通过机器学习,就能”猜测”出这5种数据和信用分数的关系。这个关系就是公式f。然后再用验证数据和测试数据来验证一下这个公式是否OK。

4923算力是人工智能的基础设施PPT课件人工智能研究框架培训

5001图:朴素贝叶斯

决策树

SVM

逻辑回归

线性回归

回归树K邻近

Adaboosting 神经网络贝叶斯分类法是基于贝叶斯定定理的统计学分类方法。它通过预测一个给定的元组属于一个特定类的概率,来进行分类。朴素贝叶斯分类法假定一个属性值在给定类的影响独立于其他属性的——类条件独立性。分类任务回归任务回归+分类练数据构建决策树,对未知的数据进行分类。支持向量机把分类问题转化为寻找分类平面的问题,并通过最大化分类边界点距离分类平面的距离来实现分类。决策树是一种简单但广泛使用的分类器,它通过训逻辑回归是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法。线性回归是处理回归任务最常用的算法之一。该算法的形式十分简单,它期望使用一个超平面拟合数据集(只有两个变量的时候就是一条直线)。回归树(决策树的一种)通过将数据集重复分割为不同的分支而实现分层学习,分割的标准是最大化每一次分离的信息增益。这种分支结构让回归树很自然地学习到非线性关系。通过搜索K个最相似的实例(邻居)的整个训练集并总结那些K个实例的输出变量,对新数据点进行预测。从训练数据中学习一系列的弱分类器或基本分类器,然后将这些弱分类器组合成一个强分类器。它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。主流的监督学习算法种类较多图46:主流的监督学习算法包括朴素贝叶斯、决策树、SVM等多种算法,目前也在逐步丰富中Adaboost目的就是数据来源:证券研究24算力是人工智能的基础设施PPT课件人工智能研究框架培训无监督学习跟监督学习相比,主要有三个特点01无监督学习是一种机器学习的训练方式,它本质上是一个统计手段,在没有标签的数据里可以发现潜在的一些结构的一种训练方式。下面通过跟监督学习的对比来理解无监督学习:监督学习是一种目的明确的训练方式,你知道得到的是什么;而无监督学习则是没有明确目的的训练方式,你无法提前知道结果是什么。监督学习需要给数据打标签;而无监督学习不需要给数据打标签。监督学习由于目标明确,所以可以衡量效果;而无监督学习几Ⓖ无法量化效果如何。图47:举例说明无监督学习案例1:发现异常案例2:用户细分案例3:推荐系统比如大家在淘宝、天猫、京东上逛的时候,总会根据你的浏览行为推荐一些相关的商品,有些商品就是无监督学习通过聚类来推荐出来的。系统会发现一些购买行为相似的用户,推荐这类用户最”喜欢”的商品。背景:有很多违法行为都需要”洗钱”,这些洗钱行为跟普通用户的行为是不一样的,到底哪里不一样?如果通过人为去分析是一件成本很高很复杂的事情,我们可以通过这些行为的特征对用户进行分类,就更容易找到那些行为异常的用户,然后再深入分析他们的行为到底哪里不一样,是否属于违法洗钱的范畴。通过无监督学习,可以快速把行为进行分类,虽然不知道这些分类意味着什么,但是通过这种分类,可以快速排出正常的用户,更有针对性的对异常行为进行深入分析。用户细分对于广告平台很有意义,不仅把用户按照性别、年龄、地理位置等维度进行用户细分,还可以通过用户行为对用户进行分类。

51业·创新诚信·责任·亲和·专数据来源:easyai官网,证券研究25算力是人工智能的基础设施PPT课件人工智能研究框架培训强化学习不需要大量的“数据喂养”,通过自我尝试学会技能01跟监督、无监督学习类似,强化学习并不是某一种特定的算法,而是一类算法的统称。强化学习算法的思路非常简单,以游戏为例,如果在游戏中采取某种策略可以取得较高的得分,那么就进一步「强化」这种策略,以期继续取得较好的结果。这种策略与日常生活中的各种「绩效奖励」非常类似。强化学习和监督学习、无监督学习最大的不同就是不需要大量的“数据喂养”。而是通过自己不停的尝试来学会某些技能。图48:强化学习的主流算法包括免模型学习(Model-Free)和有模型学习(Model-Based)免模型学习(Model-Free)放弃了模型学习,在效率上不如后者,但是这种方式更加容易实现,也容易在真实场景下调整到很好的状态。所以免模型学习方法更受欢迎,得到更加广泛的开发和测试。有模型学习(Model-Based)对环境有提前的认知,可以提前考虑规划,但是缺点是如果模型跟真实世界不一致,那么在实际使用场景下会表现的不好。数据来源:easyai官网,证券研究

5226算力是人工智能的基础设施PPT课件人工智能研究框架培训深度学习的灵感来自大脑的结构和功能01深度学习的概念源于人工神经网络的研究,但是并不完全等于传统神经网络,可以看做神经网络的升级版本根据李开复在《人工智能》内容,以识别图片中的汉字为例来解释深度学习:假设深度学习要处理的信息是“水流”,而处理数据的深度学习网络是一个由管道和阀门组成的巨大水管网络。网络的入口是若干管道开口,网络的出口也是若干管道开口。这个水管网络有许多层,每一层由许多个可以控制水流流向与流量的调节阀。根据不同任务的需要,水管网络的层数、每层的调节阀数量可以有不同的变化组合。对复杂任务来说,调节阀的总数可以成千上万甚至更多。水管网络中,每一层的每个调节阀都通过水管与下一层的所有调节阀连接起来,组成一个从前到后,逐层完全连通的水流系统。那么,计算机该如何使用这个庞大的水管网络来学习识字呢?比如,当计算机看到一张写有“田”字的图片,就简单将组成这张图片的所有数字(在计算机里,图片的每个颜色点都是用“0”和“1”组成的数字来表示的)全都变成信息的水流,从入口灌进水管网络。我们预先在水管网络的每个出口都插一块字牌,对应于每一个我们想让计算机认识的汉字。这时,因为输入的是“田”这个汉字,等水流流过整个水管网络,计算机就会跑到管道出口位置去看一看,是不是标记由“田”字的管道出口流出来的水流最多。如果是这样,就说明这个管道网络符合要求。如果不是这样,就调节水管网络里的每一个流量调节阀,让“田”字出口“流出”的水最多。与训练时做的事情类似,未知的图片会被计算机转变成数据的水流,灌入训练好的水管网络。这时,计算机只要观察一下,哪个出水口流出来的水流最多,这张图片写的就是哪个字。图49:深度学习就像自来水管系统,不断调节各个阀门,让对应出口的流量符合要深度学习大致就是这么一个用

人类的数学知识与计算机算法

构建起来的整体架构,再结合

尽可能多的训练数据以及计算

机的大规模运算能力去调节内

部参数,尽可能逼近问题目标

的半理论、半经验的建模方式。求

5327算力是人工智能的基础设施PPT课件人工智能研究框架培训

54机器学习VS

深度学习01机器学习与深度学习有着明显的异同点在数据准备和预处理方面,两者是很相似的。他们都可能对数据进行一些操作:数据清洗、数据标签、归一化、去噪、降维。核心区别:传统机器学习的特征提取主要依赖人工,针对特定简单任务的时候人工提取特征会简单有效,但是并不能通用;深度学习的特征提取并不依靠人工,而是机器自动提取的。这也是为什么都说深度学习的可解释性很差,因为有时候深度学习虽然能有好的表现,但是我们并不知道他的原理是什么。图50:深度学习与机器学习在不同阶段有不同的异同点数据来源:证券研究数据预处理特征提取选择分类器数据预处理设计模型训练传统机器学习深度学习传统机器学习与深度学习的相似处传统机器学习和深度学习的核心区别图51:深度学习的优缺点如下所示优点1:学习能力强从结果来看,深度学习的表现非常好,他的学习能力非常强。优点2:覆盖范围广,适应性好深度学习的神经网络层数很多,宽度很广,理论上可以映射到任意函数,所以能解决很复杂的问题。优点3:数据驱动,上限高深度学习高度依赖数据,数据量越大,他的表现就越好。在图像识别、面部识别、NLP等部分任务甚至已经超过了人类的表现。同时还可以通过调参进一步提高他的上限。优点4:可移植性好由于深度学习的优异表现,有很多框架可以使用,例如TensorFlow、Pytorch缺点1:计算量大,便携性差深度学习需要大量的数据很大量的算力,所以成本很高。缺点2:硬件需求高深度学习对算力要求很高,普通的CPU已经无法满足深度学习的要求。主流的算力都是使用GPU和TPU。缺点3:模型设计复杂深度学习的模型设计非常复杂,需要投入大量的人力物力和时间来开发新的算法和模型。大部分人只能使用现成的模型。缺点4:没有”人性”,容易存在偏见由于深度学习依赖数据,并且可解释性不高。在训练数据不平衡的情况下会出现伦理风险。数据来源:easyai官网,证券研究28算力是人工智能的基础设施PPT课件人工智能研究框架培训深度学习包括四种典型的算法014种典型的深度学习算法:卷积神经网络、循环神经网络、生成对抗网络、深度强化学习图52:深度学习的几种主要算法如下生成对抗网络–GANGAN是最近2年很热门的一种无监督算法,他能生成出非常逼真的照片,图像甚至视频。我们手机里的照片处理软件中就会使用到它。卷积神经网络–CNN能够将大数据量的图片有效的降维 成小数据量(并不影响结果)能够保留图片的特征,类似人类的视觉原理循环神经网络–

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论