算力是人工智能的基础设施算法是人工智能的灵魂（培训）

上传人：加*** IP属地：北京上传时间：2025-12-11 格式：DOCX 页数：60 大小：7.23MB 积分：8.4 举报 版权申诉

已阅读5页，还剩55页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

算力是人工智能的基础设施，算法是人工智能的灵魂n算力是承载人工智能应用发展的基础，是人工智能最核心的要素算力、算法和数据是人工智能产业发展的三个核心数据的生产不再是问题，如何处理、分析和使用数据才是问题。算法经历了数十年的发展，在深度学算法模型的复杂化和巨量化需要更强算力的支撑。近些年，算法模型的参数量和复杂程度都在呈现指数级增长态势，尤其是自然语言处理等新兴认知智能领域对算力的要求远超图像识别和语音识数据来源：证券研究算法数据新应用场景的出现对数据实时性要求更高，从而使得边缘计算能力变得愈发重要，人工智能应用也越来n算力的经济效益使其成为各国政策支持的重点根据清华大学全球产业院与浪潮信息联合发布的《2021-2022全球计算力指数评估报告》，通过对全球15个重点国家的计算力指数与数字经济及GDP的回归分析，得到15个重点国家的计算力指数平均每提高1点，国家的数字经济和GDP将分别增长3.5‰和1.8‰进一步研究发现，当一个国家计算力指数分别达到40分及60分以上时，计算力指数每提升1点，其对GDP增长的推动力将分别增加到1.5倍及3倍。智能算力提升具备重大经济效益，对算力基础设施发展的支持性政策成为各国政策的重点。 nAI数据中心是专门用于支持人工智能计算和数据处理任务的设施或物理空间AI数据中心通常拥有大量高性能的服务器、GPU加速器和专门的存储系统，以提供强大的计算能力并加速深度学习AI数据中心配备了高速的网络设备和优化的软件框架，以支持高效的数据传输和算法训练通过这些专门的配置和优化，AI数据中心能够为各种规模和复杂度的AI工作负载提供可靠稳定的计算环境，并满足大规模数据存储、备份和分析的需求AI数据中心在推动人工智能技术的发展和应用方面起到关键作用，为各行各业的AI应用和服务提供了强大的支持用于大规模并行计算，处理复杂机器学习和深度学习算法的高性能计算设网络带宽、低延迟网络网络带宽、低延迟网络，以满足对数据传输速度的敏感需求计算能力计算能力储存需求网络宽带数据来源：证券研究用于存储大规模数据集的大容量、高速存储持，包括专门的AI框架、库和工具持，包括专门的AI框架、库和工具，以及优化的软件栈和分布式计算平台，以提高计算效率和性能 n大模型的出现和技术创新对AI数据中心的发展起到推动作用大模型的出现带来了算力的增量需求根据OpenAI发布的有关GPT-3模型的文档，它包含1750亿个参数，需要进行数千万次的计算操作来完成一次推理任务ChatGPT的总算力消耗约为3640PF-days，需要7~8个投资规模30亿、单体算力500P的数据中心才能支撑运行，这样的规模和复杂性需要高性能的计算设备和大规模的并行计算能力，带动了AI数据中心需求的增长新的处理器架构、高速网络、存储技术以及更高效的冷却和能源管理系统的出现，提升了数据中心的性能和效率，为AI数据中心的发展提供了技术支持 nAI服务器是AI数据中心重要的组成部分AI服务器是专门为人工智能应用而设计和配置的服务器，具备强大的计算能力和高效的数据处理能力，是执行AI任务和处理大规模数据的关键组件，为数据中心提供计算资源和算力，用于执行复杂的AI算法和模型。AI服务器有两种主要架构：混合架构和基于云平台的架构。混合架构保证数据的安全性和隐私性可能受限于本地的存储和计算能力数据来源：证券研究可以将数据存储在本地，利用本地的计算资源进行保证数据的安全性和隐私性可能受限于本地的存储和计算能力数据来源：证券研究可以将数据存储在本地，利用本地的计算资源进行AI模型的训练和推理描述优点缺点基于云平台的架构使用远程存储技术和混合云存储（一使用远程存储技术和混合云存储（一种联合本地存储和云存储的技术）进行数据存储，利用云端的计算资源进行AI模型的训练和推理提供弹性的存储和计算能力可能存在数据的安全可能存在数据的安全性和隐私性问题 nAI服务器中的主要元器件包括CPU、GPU板组、内存、存储、网络接口卡、机箱、主板、散热系统和电源图25：AI服务器拆箱图如下所示散热系统用于控制服务器的温度并保持其在安全范围内运行。散热片吸收主板是AI服务器的核心电路板，连接各个部件并提供电源和数据传输的接口，承载着CPU、内存插槽、扩展插槽和其支持大规模的数据集和模型数据来源：证券研究 nGPU是AI服务器中价值量最高的部件，承担了大部分的计算任务和深度学习模型的训练与推理图26：整个AI硬件产业链中的各个环节紧密合作，共同构建了支持AI应用和服务的完整生态系统CPU作为服务器的核心CPU作为服务器的核心计算单元发挥着重要作用，而存储、网络设备、冷却系统和电源等则在支持和维护CPUAI服务器源键作用。存存正常运行和数据中心高效运作的储 n基于APU架构的MI300预计于年底开始应用于超级计算机图27：AI芯片产业链较为复杂IP授权设计晶圆代工AI芯片云端/边缘端终端训练推理智能汽车智能手机AIoT机器人 nAI芯片主要分为三种类型：通用型（GPU）、半定制型（FPGA）、定制型（ASIC）表1：AI芯片分为GPU、FPGA、ASIC三种类型定制化程度通用型半定制化定制化好好不好成本高较高低编程语言/架构OpenCL、HLS/功耗大较大小主要优点主要缺点语言难度大主要应用场景 01AIGC拉动AI算力需求，AI芯片将成为未来科技石油n针对不同技术路径，国内厂商均已有所布局图28：国内GPU企业迎来较快发展理信息系统、媒体处理、CAD辅助设计、游戏、虚拟化等高性能显示需求和人工智能计算需求，可广泛应用景嘉微自主研发了一系列GPU芯片，包括JM54系列、JM72系其产品性能达到了国际上同类型主流高端处理器的水平，具有较强的并行计算能力和较高的能效数据来源：证券研究 01AIGC拉动AI算力需求，AIn针对不同技术路径，国内厂商均已有所布局图29：CPU+FPGA：国内巨头纷纷布局CPU+FPGA的混合异构加速AI计算表2：ASIC：国内ASIC厂商实力雄厚，积极追赶国外芯片巨头22132221寒武纪U37-X8222商赛灵思收22132221寒武纪U37-X8222全球科技巨头纷纷布局云端FPGA生态，国内包括腾讯云、阿里云均在2017年推出了基于FPGA的服务，百度大脑也使用了FPGA芯片 n实现专用算法“硬件优化”，ASIC路线在AI领域的长期成长性值得期待图30：ASIC路线在AI领域的长期成长性值得期待FPGA方案及ASIC方案成本曲线存在差异FPGA方案及ASIC方案成本曲线存在差异ASIC无法重新编程前期投入成本较高n人类跟计算机的能力维度各有优势，让计算机学习和模拟人类的解决问题的方法是各类算法的起点图31：理解人类的学习机制，有助于让人工智能来有效复刻这种能力机制度度图32：让计算机模仿人类来解决问题具备理论上的可行性 nAI所能处理的这些任务背后的根本任务只有两类，就是分类与回归人类大脑每日处理的其实也是分类与回归问题。比如我们会思考晚上吃烧烤还是火锅，会选择出门穿哪件衣服，这些都可看做是分类问题；在称重上秤前我们会先估计自己多重，约会时会预计对方几点到达，这些都可看做是回归问题。图33：分类和回归是人工智能所处理任务的主要类别例如预测一封邮件是否是垃圾邮件、预测照片中的人是男性还是女性还是偏中性？这种结果只有两个值或者多个值的问体重的值可以有无限多个，有的人60kg，有的是分类与回归。n分类任务：有二分类和多分类在棋盘上可以落子的个数是有限的，所以每一步阿尔法Go要做的就是根据当前已落子信息，预测出落子在每个可落子位置的胜率，然后选取胜率最高的位置进行落子即可；自动驾驶车辆上装有多个摄像头和传感器来时刻监视车辆四周的环境信息，可根据这些环境的图像信息让它选择在每种情况下方向盘转动多少角度、油门或刹车踩多深来实现车辆的自动行驶。图34：棋牌类是多分类任务的场景案例之一图35：自动驾驶也是一种多分类任务数据来源：广汽数据来源：百度数据来源：广汽n以网约车出行预测以及股价预测来说明回归任务。回归任务和分类任务并非严格区分。图36：网约车出行流量预测是一种回归任务图37：股价预测也是典型的回归任务数据来源：百度地图根据相应程序可以预测股价趋势，可看做回归问题数据来源：微软n从人工智能大的子领域来看，常用的算法类型有专家系统、传统机器学习与深度学习。图38：AI核心算法主要分为三大类利用以往知识与经验制定规则通过训练集，不断识别特征，不断建模，最后形成有效的模型，这个过程就叫“机器学习”！无论使用什么算法，使用什么样的数据，最根本的思路都逃不出上面的3步。模拟人脑神经元进行学习与预测，通常不具有可解释性基于该知识基于该知识，计算机就知道要给病人n早期AI根据设定的规则，让电脑去执行预测。这种早期算法也叫做“专家系统”。就可以大大节约人们在垃圾邮件中浪费的时间。传统的方法是制定规则，比如一篇文章中大量出现“免费”“特价”“发财”“代理”“稳赢”等等关键词，我们就把它定义为垃圾邮件，根据设定n实现专家系统要解决两个问题：一是如何表示知识，二是如何利用知识解决问题是打喷嚏和发烧，人类的医生会基于打喷嚏和发烧这些表现，判断病人可能是感冒了，而治疗的常用药物是阿司匹林，因此医生会告诉病人：吃几片阿斯匹林。这个过程就是人类的推理过程。图39：用IF语句来举例理解专家系统通过“感冒”，在知识库中继续查找，发现下面的知识开阿司匹林数据来源：证券研究n但在实践过程中，有些任务本身的规则很难定义。一个典型的例子就是图像识别。在图像识别领域中，一个最基础的问题就是分辨这个图像是什么。举例来说，告诉你一张图像不是猫就是图40：识别图像的工作极大提升了传统算法的难度图41：因为图像的细节特征太多，编写规则来进行判断的难度极大数据来源：AI有温度微信公众号数据来源：AI有温度微信公众号n案例任务：收集鸢尾花花萼的长度与宽度，来判断它具体属于哪一品种(由于可视化与易推导的需求，此处将数据维度降到2维或3维来说明传统机器学习的原理。而现实中的数据通常是具有多种特征的，比如鸢尾花的数据集原本有4个特征，其实我们应该在一个4维空间对数据进行切分)。图42：传统的机器学习主要运用可解释的数学公式进行推导预测n传统机器学习同样可以运用到图像领域图43：利用机器学习来处理像素点可以实现图像识别图44：传统机器学习的工作流程如下所示数据来源：雷锋网数据来源：华为云官网(各种账户的数目)n监督学习需要有明确的目标，很清楚自己想要什么结果。比如：按照“既定规则”来分类、预测某个具体的值…步骤2：收集已知数据为了找出公式f，需要先收集大量的已知数据，这些数据必须包含一个人的5种数据和他的信用状态（把信用状态转化为分数）。把数据分成几个部分，一部分用来训练，一部分用来测试和验证。当我们想知道一个新用户的信用状况时，只需要收集到他的这5种数据，套进公式f计法论”法论”先把部分已知“问题和答案”首先找出个人信用的影响因素，从逻辑上讲一个人的体重跟他的信用应该没有关系，而财富总额貌似跟信用有关，所以根据判断，找出了下面5个影响因素：付款记录、账户总金额、信用记录跨度(自开户以来的信用记录、特定类型账户开户以来的信用记录…)、新账户(近期开户数目、特定类型账户的开户比例…)、信用类别有了这些数据，通过机器学习，就能”猜测”出这5种数据和信用分数的关系。这个关系就是公式f。然后再用验证数据和测试数据来验证一下这个公式是否OK。主流的监督学习算法种类较多Adaboost目的就是支持向量机把分类问题转化从训练数据中学习一决策树是一种简单但广泛使用望使用一个超平面拟合数通过搜索K个最相似的个强分类器。练数据构建决策树，对未逻辑回归是用于处理因例的输出变量，对新数它从信息处理角度进行抽象建立某进行抽象建立某问题，常见的是二分类，统计学分类方法。它通过预测一个给定的元组属于一个特定类的概率，来进行分类。朴素贝叶斯分类法假定一个属性值在给定类的影响独立于其他属性的——类条件独立性。或二项分布问题，也可统计学分类方法。它通过预测一个给定的元组属于一个特定类的概率，来进行分类。朴素贝叶斯分类法假定一个属性值在给定类的影响独立于其他属性的——类条件独立性。或二项分布问题，也可方法。的分支而实现分层学习，分割的标准是最大化每一次分离的信息增益。这种分支结构让回归树很自然地学习到非线性关系。神经K邻近Adaboosting神经K邻近Adaboosting网络朴素贝叶斯决策树SVM逻辑回归线性回归分类任务数据来源：证券研究分类任务数据来源：证券研究监督学习是一种目的明确的训练方式，你知道得到的是什么；而无监督学习则是没有明确目的的训练方式，你无法提前知道结果是什么。监督学习需要给数据打标签；而无监督学习不需要给数据打标签。监督学习由于目标明确，所以可以衡量效果；而无监督学习几Ⓖ无法量化效果如何。图47：举例说明无监督学习通过无监督学习，可以快速把行为进行分类，虽然不知道这些分类意味着什么，但是通过这种分类，可以快速排出正常的用户，更有针对性的对异常行为进行深入分析。用户细分对于广告平台很有意义，不仅把用户按照性别、年龄、地理位置等维度进行用户细分，还可以通过用户行为对用户进行分类。比如大家在淘宝、天猫、京东上逛的时候，总些商品就是无监督学习通过聚类来推荐出来的。类用户最”喜欢”的商品。强化学习算法的思路非常简单，以游戏为例，如果在游戏中采取某种策略可以取得较高的得分，那么就进一步「强化」这种策略，以期继续取得较好的结果。这种策略与日常生活中的各种「绩效奖励」非常类似。强化学习和监督学习、无监督学习最大的不同就是不需要大量的“数据喂养”。而是通过自己不停的尝试来学会某些技能。放弃了模型学习，在效率上不如后者，但是这种方式更加容易实现，也容易在真实场景下调整到很好的状态。所以免模型学习方法更受欢迎，得到更加对环境有提前的认知，可以提前考虑规划，但是缺点是如果模型跟真实世界不一致，那么在实际使用n深度学习的概念源于人工神经网络的研究，但是并不完全等于传统神经网络，可以看做神经网络的升级版本根据李开复在《人工智能》内容，以识别图片中的汉字为例来解释深度学习：水流，从入口灌进水管网络。字出口“流出”的水最多。求深度学习大致就是这么一个用人类的数学知识与计算机算求数据来源：easyai官网，证券研究54 n机器学习与深度学习有着明显的异同点在数据准备和预处理方面，两者是很相似的。他们都可能对数据进行一些操作：数据清洗、数据标签、归一化、去噪、降维。核心区别：传统机器学习的特征提取主要依赖人工，针对特定简单任务的时候人工提取特征会简单有效，但是并不能通用；深度学习的特征提取并不依靠人工，而是机器自动提取的。这也是为什么都说深度学习的可解释性很差，因为有时候深度学习虽然能有好的表现，但是我们并不知道他的原理是什么。传统机器学习深度学习传统机器学习和深度学习的核心区别传统机器学习与深传统机器学习和深度学习的核心区别特征提取选择分类器数据预处理特征提取选择分类器设计模型数据预处理设计模型数据来源：证券研究从结果来看，深度学习的表现非常好，他的学习能力非常强。深度学习的神经网络层数很多，宽度很广，理论上可以映射到任意函数，所以能解决很复杂的问题。深度学习高度依赖数据，数据量越大，他的表现就越好。在图像识别、面部识别、NLP等部分任务甚至已经超过了人类的表现。同时还可以通过调参进一步提高他的上限。例如TensorFlow、Pytorch深度学习需要大量的数据很大量的算力，所以成本很高。深度学习对算力要求很高，普通的CPU已经无法满足深度学习的要求。主流的算力都是使用GPU和TPU。深度学习的模型设计非常复杂，需要投入大量的人力物力和时间来开发新的算法和模型。大部分人只能使用现成的模型。由

人人文库> 全部分类> 行业资料 > 各类标准

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

算力是人工智能的基础设施算法是人工智能的灵魂（培训）

文档简介

温馨提示

最新文档

评论

算力是人工智能的基础设施算法是人工智能的灵魂（培训）

文档简介

温馨提示

最新文档

评论

相关文档