版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Computility第5章
算力2035王红梅知识目标:掌握算力的概念,理解通用计算算力、超级计算算力、智能计算算力等,并初步认识算力网络。能力目标:能描述出各种算力技术在我们现实生活中的应用,并能根据应用能进行算力的初级部署。素养目标:逐步建立算力意识和算力思维。5.15.25.35.4算力那些事算力概述通用算力超算算力目录CONTENTS5.55.6智算算力拓展:算力网络5.15.25.35.4算力那些事算力概述通用算力超算算力目录CONTENTS5.55.6智算算力拓展:算力网络
小智同学游戏被卡啦!
小智同学偶尔喜欢通过电脑游戏来放松身心。一天小智安装了最新款的网红游戏。然而游戏进行了一会儿之后,小智发现游戏画面粗糙,而且卡顿。
小智舍友的电脑是新买的,花的钱多、配置较高,游戏就比较顺畅。小智在羡慕的同时就在想:花钱多、配置高解决的是什么问题呢?
而实际上,这是个算力问题。
网络直播、天气预报、语音助手、地图导航、大模型等。讨论:除了游戏,你还知道哪些场景可能需要算力支撑?
那么,什么是算力?算力是如何产生的?它又是如何促进人工智能技术的发展?下面我们来一一学习。ArtificialIntelligenceandFuture人工智能与未来2035主讲:王红梅Computility第5章
算力2035王红梅5.15.25.35.4算力那些事算力概述通用算力超算算力目录CONTENTS5.55.6智算算力拓展:算力网络5.2.1算力的概念5.2.2算力的单位5.2.3算力的分类5.2.4算力和我们的关系5.2.1算力概念所谓算力,简单来讲就是计算能力。“在计算机科学中”,指的是处理数据的能力,是计算机硬件和软件配合共同执行某种计算需求的能力。算力的大小代表着对数据处理能力的强弱。5.2.1算力概念
随着技术的发展,算力往往源于芯片,芯片逐渐成为了算力的代名词。芯片通过基础软硬件的有效组织,最终释放到终端应用上,比如手机、计算机、超级计算机、自动驾驶汽车等各种硬件设备中。支持AI系统常用的硬件有:1、CPUs(CentralProcessingUnits):目标用于通用处理任务;2、GPUs
(GraphicsProcessingUnits):设计目标初期图形图像渲染,后期用于并行计算,深度学习的标配。3、FPGAs(FieldProgram-mableGateArrays,现场可编程门阵列)4、ASICs(Application-SpecificIntegratedCircuits应用特定集成电路)等。5.2.1算力概念:AI算力硬件支撑1、高度并行化(HighlyParallel);2、多线程化(Multithreaded)。5.2.1算力概念:AI算力软件支撑串行问题并行问题场景再现:食堂买饭,假定一个窗口每分钟可以给2个人打饭。一个食堂,一个窗口,25000人。全部同学购买完饭需要多久?2个食堂,每个食堂都有三层,每层50窗口,25000人。全部同学购买完饭需要多久?25000/2/60/24=8.68天25000/2/(2*3*50)=41.67分钟你算一算,需要多久?1、高度并行化串行问题并行问题1、高度并行化2.多线程问题
程序能高度并行化执行,源于能把一个任务划分为多个子任务。每个子任务称为一个线程。这些线程可以并发执行,每个线程独立运行,共享程序中的数据资源。类似生成车间的流水线作业2.多线程问题串行问题(一个线程)并行问题(300个线程)一个食堂,一个窗口,25000人。2个食堂,每个食堂都有三层,每层50窗口,25000人。
程序能高度并行化执行,源于能把一个任务划分为多个子任务。每个子任务称为一个线程。这些线程可以并发执行,每个线程独立运行,共享程序中的数据资源。5.2.2算力的单位
算力既然是一种计算能力,那么这种能力是否可以衡量??小智用电脑打游戏卡顿,而同样的游戏在同学新购置的高配置电脑上不卡顿,就说明算力是可以衡量的,只不过“高配置、不卡顿”的说法是定性的衡量,我们可能更希望有更准确的衡量方法,那就是定量衡量,这就用到算力的单位。
5.2.2算力的单位
算力的大小指每秒能运算多少次。基本单位:次数/秒。在实际中常用的单位有OPS(OperationsPerSecond)和FLOPS(FloatingPointOperationsPerSecond)。
5.2.2算力的单位由于OPS和FLOPS单位太小,而现在的计算能力发展很快,我们实际中往往采用更大的衍生单位,常用的单位如表所示。
单位含义衍生单位OPS表示每秒可以执行的运算次数。MOPS:每秒百万次运算GOPS:每秒十亿次运算TOPS:每秒万亿次运算POPS:每秒千万亿次运算EOPS:每秒百亿亿次运算FLOPS表示每秒所执行的浮点运算次数。MFLOPS:每秒百万次浮点运算GFLOPS:每秒十亿次浮点运算TFLOPS:每秒万亿次浮点运算PFLOPS:每秒千万亿次浮点运算EFLOPS:每秒百亿亿次运算5.2.2算力的单位
算力这单位,到底是多大呢?1GFlops计算机系统一秒计算的工作量,人类要32年才能完成。MFLOPSGFLOPSTFLOPSPFLOPSEFLOPS计算速度的鸿沟5.2.2算力的单位OPS和FLOPS两个单位的常见应用场景
单位应用场景OPS(1)通用计算:对于不需要高精度浮点运算的应用。(2)嵌入式系统:在资源有限时,可以评估系统的综合处理能力。(3)数据库操作:查询和数据处理通常涉及整数运算和逻辑运算。FLOPS(1)科学计算:需要高精度浮点运算的场景。(2)深度学习:神经网络训练和推理过程中需要进行大量的浮点运算。(3)图形渲染:3D图形渲染中的光线追踪、阴影计算等需要浮点运算来模拟真实世界。
算力服务于社会的各种计算需求,而社会的需求是存在差异的,既有来自消费领域的(追剧、网购、打车等),也有来自行业领域的(工业制造、交通物流、金融证券、教育医疗等),还有来自城市治理领域的(智慧城市、一证通、城市大脑)等。根据应用场景和计算特性,把算力分成三部分:通用计算算力(通用算力)、超级计算算力(超算算力)、智能计算算力(智算算力)。5.2.3算力的分类5.2.3算力的分类算力的分类通用算力超算算力智算算力一般指基于CPU的计算能力,用于基础通用计算,如日常办公、财务管理、在线购物等;通常指基于超级计算机等高性能计算集群产生的计算能力,主要用于大规模科学研究和工程计算;通常由GPU、FPGA、ASIC等芯片提供的计算能力,用于人工智能和机器学习任务。
2023世界人工智能大会,中国工程院院士高文说:“什么时候我们的算力超过美国,我们的GDP就超过美国了。”5.2.4算力和我们的关系?5.2.4算力和我们的关系?2024年3月,黄仁勋回母校斯坦福大学参加论坛,在论坛中提到:未来10年算力将再提高100万倍,AI将成为一个国家的“主权”。5.2.4算力和我们的关系?学生1:等等,前三次工业革命都是啥?2023年9月,任正非说,我们即将进入第四次工业革命,基础就是大算力。学生2:百度会用吗?百度一下不就知道了。5.2.4算力和我们的关系?大家是否感到最近几年,国产动画在崛起,《哪吒2》,《白蛇》,《流浪地球》等,可了解背后的算力支持?在《流浪地球2》,每个画面需要7-8小时来生成,一部电影在贵阳生成了2年,靠的是算力。5.2.4算力和我们的关系?最近购买电脑的同学们,是不是发现显卡都在涨价呀!关键还没货!!!!!醒醒:因为整个世界都需要算力,又不是整个世界都需要你!ArtificialIntelligenceandFuture人工智能与未来2035主讲:王红梅Computility第5章
算力2035王红梅5.15.25.35.4算力那些事算力概述通用算力超算算力目录CONTENTS5.55.6智算算力拓展:算力网络5.3.1通用算力的概念5.3.2通用算力如何产生5.3.3通用算力的发展5.3.4云计算
二战爆发后,军事需求大大刺激了算力的发展。人类在1946年发明了电子计算机。计算机的演变过程中,微型化、便携性的各种技术诞生了个人电脑,它包括台式计算机、笔记本电脑、平板电脑、智能手机等。5.3.1通用算力的概念
通用算力,主要指台式机、笔记本、平板电脑、智能手机等主要靠CPU输出算力的设备展现的算力。5.3.1通用算力的概念为什么CPU输出的算力称为通用算力呢?这是因为CPU的设计目标是通用性,即能够处理各种不同类型的任务,而不是专门针对某一种特定任务,更像一个全才。早期的人工智能应用也依靠CPU提供算力服务。5.3.1通用算力的概念还是要归结到两个问题:冯·诺依曼架构有哪几部分组成,各个部分如何协调工作?影响其性能的运算(算力)是如何产生的?讨论:面对以下问题,你如何解决?依据或理由是什么?(1)要购买一台电脑,在预算固定的情况下,在购买大硬盘,大内存和高性能CPU之间如何权衡?(2)如果是台旧电脑,打游戏比较慢,想提升性能,如何选择更新配件?
既然今天广泛使用的数字电子计算机都是从冯·诺依曼架构发展而来的,所以探讨算力产生,还是需要从冯·诺依曼架构开始。
5.3.2通用算力如何产生?通用算力如何产生?1.计算机求解问题的过程2.计算机指令3.计算机程序计算机的计算过程与我们到饭店就餐过程相似,5.3.2通用算力如何产生?1.计算机求解问题的过程冯·诺依曼架构由控制器、运算器、存储器、输入设备和输出设备构成。5.3.2通用算力如何产生?1.计算机求解问题的过程运算器
控制器输出设备输入设备存储器读程序读数据写数据图中实线表示数据流,虚线表示命令流冯·诺依曼架构由控制器、运算器、存储器、输入设备和输出设备构成。5.3.2通用算力如何产生?1.计算机求解问题的过程运算器
控制器输出设备输入设备存储器待解问题算法+数据读程序读数据写数据计算机求解实际问题时,首先需要对问题进行分析,可以得到算法和数据;进一步表示为程序,然后通过输入设备输入计算机,计算机自动执行程序进行问题求解;最后输出结果。图中实线表示数据流,虚线表示命令流程序冯·诺依曼架构由控制器、运算器、存储器、输入设备和输出设备构成。5.3.2通用算力如何产生?1.计算机求解问题的过程(1)输入设备的功能是把程序变成二进制数存入存储器,如图中①。(2)计算机执行程序时,先由控制器从存储器读取程序,如图中②。图中实线表示数据流,虚线表示命令流控制器输入设备存储器待解问题算法+数据读程序①②程序冯·诺依曼架构由控制器、运算器、存储器、输入设备和输出设备构成。5.3.2通用算力如何产生?1.计算机求解问题的过程(3)然后根据程序的要求向功能部件(比如运算器)发命令,如图中③。(4)运算器得到命令后从存储器读取数据,如图中④,并进行运算,如图中⑤。图中实线表示数据流,虚线表示命令流控制器输入设备存储器待解问题算法+数据读程序①②运算器
③读数据④
⑤程序冯·诺依曼架构由控制器、运算器、存储器、输入设备和输出设备构成。5.3.2通用算力如何产生?1.计算机求解问题的过程(5)运算器的计算结果一般还要写入存储器,如图中⑥,(6)如需输出,控制器会命令存储器把数据交给输出设备,如图中⑦。图中实线表示数据流,虚线表示命令流运算器
控制器输入设备存储器待解问题算法+数据读程序读数据写数据①②③④
⑥输出设备⑦⑤程序举例编写文档并进行打印控制器运算器我们日常说的CPU(中央处理器)包含控制器和运算器。CPU5.3.2通用算力如何产生?1.计算机求解问题的过程控制器运算器实际上中央处理器,除控制器和运算器外,为提升效率,还有小容量的寄存器,寄存器CPU通用寄存器程序计数器指令寄存器存储要运算的数据存储CPU需执行的下一条指令在内存中的地址存储当前正在执行的指令相当于提前排队不是有存储器吗?为啥还在这里要用寄存器存数据和指令?5.3.2通用算力如何产生?1.计算机求解问题的过程内部存储器存储器外部存储器内部存储器也就是内存,常用来存储从外存中读取的数据和程序。外部存储器也就是外存,常用来存储永久性的数据。在讨论算力和结构的时候,存储器一般指内存我这更懵了,外存,内存和寄存器,怎么这么多用来存储的,难道是不差钱!5.3.2通用算力如何产生?1.计算机求解问题的过程哈哈哈!错错错,恰恰是差钱!我这更懵了,外存,内存和寄存器,怎么这么多用来存储的,难道是不差钱!外存内存寄存器CPU速度越来越快价格越来越高5.3.2通用算力如何产生?1.计算机求解问题的过程讲个商城柜台卖品、储物间和仓库的故事高档商场,费用很高展示在柜台的是正在出售的商品。商店的储物间费用就低一点,存储的是下一个要出售的商品。仓库很大,距离远,价格低,但没有关系,存放的是大量库存。寄存器内存外存5.3.2通用算力如何产生?1.计算机求解问题的过程结合前面的知识,大家是不是就知道了,当预算一定,想购买一台电脑时,需要在CPU,内存和外存等之间权衡。5.3.2通用算力如何产生?1.计算机求解问题的过程讨论,游戏加载一般都需要时间,对吗?问问大家,游戏加载的是什么?
实际上游戏的加载是把存储在外存(硬盘)的上的数据,传输到内存中的。比如场景、人物模型、皮肤纹理等。为什么要加载,不加载直接在硬盘上读不可以吗?内存(16GB),读写速度是17纳秒硬盘(2TGB),读写速度是50微秒1微秒=1000纳秒相差3000倍约会时等10分钟20.83天寄存器的速度更快,是内存速度的100倍。
此时你是否明白,对于游戏有点卡的旧电脑,是不是可以采用直接升级内存容量的办法快速提升性能。5.3.2通用算力如何产生?1.计算机求解问题的过程5.3.2通用算力如何产生?2.计算机指令
讨论了计算机问题求解过程,可控制器得到程序以后是怎么知道程序的功能的呢?这就要理解计算机指令了。
计算机指令就是能指挥计算机完成一定动作的命令,分为操作码和地址码两部分。操作码
地址码指定指令的功能,如加法、乘法等指定被操作的数据的地址5.3.2通用算力如何产生?2.计算机指令
操作码
地址码指定指令的功能,如加法、乘法等指定被操作的数据的地址如在餐厅上餐中有:“给01号桌上盘红烧肉”,其实这也是一个指令:其中“上盘红烧肉”相当于操作码;“01桌”相当于地址码。5.3.2通用算力如何产生?2.计算机指令
我们日常使用的计算机之所以能完成多种功能,是因为我们的计算机中有很多的指令。
一种计算机中所包含的全部计算机指令称为计算机指令系统。
每台计算机都有自己的指令系统,由CPU生产厂家在制作CPU时植入CPU的控制器中。5.3.2通用算力如何产生?3.计算机程序
计算机程序与计算机指令有非常紧密的关系。程序是对指令的调用,也就是说,我们在编写一个在某计算机上运行的程序时,我们对这台计算机的指令系统是熟悉的,根据解决问题的需要从指令系统中挑选出功能符合的指令进行排列组合就得到解决问题的程序。系统
指令Windows系统printmacOS系统lpLinux系统lp或lpr打印
5.3.2通用算力如何产生?3.计算机程序
假如程序和数据已经存入存储器中,下面我们分析一下程序是如何自动执行?因为程序和数据都是二进制数,为区分,存储器被分成了程序区和数据区,程序区保存程序,数据区保存数据。指令1指令2指令3...程序区数据1...数据区控制器
存储器命令产生部件译码器指令系统程序计数器运算器⑤5.3.2通用算力如何产生?3.计算机程序
假如程序和数据已经存入存储器中,下面我们分析一下程序是如何自动执行(1)取指令CPU中的程序计数器中保存着程序入口地址,如图中①所示。指令1指令2指令3...程序区数据1...数据区控制器
存储器命令产生部件译码器指令系统程序计数器运算器⑤①②通过该入口地址找到存储器中第一条指令,就是指令1,并进行读取,如图中②所示。5.3.2通用算力如何产生?3.计算机程序
假如程序和数据已经存入存储器中,下面我们分析一下程序是如何自动执行(2)译码译码就是分析指令结构,理解指令的含义。并把理解结果送给命令产生部件如图中③所示。指令1指令2指令3...程序区数据1...数据区控制器
存储器命令产生部件译码器指令系统程序计数器运算器①②③④命令发生器向有关功能部件(比如运算器)发出操作命令如图中④所示。5.3.2通用算力如何产生?3.计算机程序
假如程序和数据已经存入存储器中,下面我们分析一下程序是如何自动执行(3)执行功能部件得到操作命令后就开始一系列动作,这就是执行指令。如果是运算指令就由运算器进行相关运算,如图中⑤所示。如果是打印输出指令,则由打印机打印出来。指令1指令2指令3...程序区数据1...数据区控制器
存储器命令产生部件译码器指令系统程序计数器运算器⑤①②③④5.3.2通用算力如何产生?3.计算机程序
假如程序和数据已经存入存储器中,下面我们分析一下程序是如何自动执行当这条指令执行结束后,计算机的一次运算完成,我们说的算力单位的一次运算就是指这么一个完整的过程。指令1指令2指令3...程序区数据1...数据区控制器
存储器命令产生部件译码器指令系统程序计数器运算器⑤①②③④取指令-》分析指令-》运行指令5.3.2通用算力如何产生?3.计算机程序
当然,这条指令执行结束后,程序计数器会自动加1,得到下一条指令地址。然后重复取读取、分析指令、运行指令的过程,直到程序中的所有指令被执行完毕。5.3.2通用算力如何产生?3.计算机程序
计算机的所有工作都是在执行程序。计算机执行程序的核心就是执行指令。
所以计算机算力强弱直接由执行指令的快慢决定。因此,人们常用单位时间内执行指令的条数作为算力大小的度量单位,如算力单位OPS和FLOPS。5.3.3通用算力的发展自有CPU芯片以来,沿着摩尔定律预示的规律发展,集成度不断翻倍、主频不断提升、晶体管数量快速增加。但制作CPU芯片赖以生存的半导体加工技术也似乎到达了极限。计算机科学家又发明了并行处理技术来加速CPU的算力。输入设备输出出备控制器运算器存储器CPU输入设备输出出备控制器运算器指令CPU数据冯·诺依曼结构哈弗结构5.3.3通用算力的发展1.并行架构哈弗架构指令存储器和数据存储器是物理上分开的,使用不同的总线进行数据传输。输入设备输出出备控制器运算器指令CPU数据哈弗结构哈佛架构的指令存储器和数据存储器分开,有各自“独立的”指令总线和数据总线,可独立编址和访问。可提升性能。尽管哈佛架构在性能上具有优势,特别是在对执行速度和并行处理能力要求高的应用中表现出色,但其复杂性和成本较高,使得它在通用计算系统中的应用相对有限。5.3.3通用算力的发展1.并行架构在冯·诺依曼架构中程序存储在内存中,程序指令按照顺序串行一条条的执行。如果可以同时执行多条指令,让指令并行计算,那么将极大的提升CPU的性能。按照这种思路,通过在单个芯片上集成多个CPU核心,使得处理器能够同时处理多个任务,从而提高整体性能。5.3.3通用算力的发展2.多核处理器除了双核处理器,后面还产生了4核、8核等多核处理器。5.3.3通用算力的发展2.多核处理器并行传输方式
串行传输方式到底选并行,还是选串行呢?有没有其它更好的方式可选择呢?
随着互联网的蓬勃发展,催生了很多的互联网公司。这些公司购买了大量的服务器,建设了机房,为用户提供服务。例如邮箱服务、音视频下载服务、网页访问服务等。所有这些服务,其实也就是算力服务。
服务器通过互联网为网民提供各种算力服务,那么到底什么是服务器呢?5.3.4云计算服务器与个人计算机的主要区别在于,个人计算机一般供一个人使用,而服务器对外提供服务,可以很多人一起使用,而且能够并行处理多人请求,再者,服务器会安装很多个CPU,甚至是集群性质的。它每天24小时工作,全年无休。5.3.4云计算5.3.4云计算
另一方面,一台计算机的算力是有限的,在互联网技术的基础上采用分布式计算,可以把零散的算力资源汇聚、打包,从而实现为一个更高性能更低成本的算力。云计算就属于这种情况。你可以想象我们的食堂与个人做饭问题5.3.4云计算Cloudservices用户用户用户用户用户可以多种形式享受云服务云属性:算力形态不定算力地点不定算力来源不知云计算之所以得到广泛应用,主要原因是它可以提供廉价算力。为什么云计算可以提供廉价算力?归纳起来有以下几个原因:(1)云计算规模效应降低了存储、网络和管理成本。(2)云计算远程服务的特征可以把服务器集群部署进行优化,从而降低成本。(3)云计算的高伸缩性,能够平衡资源使用高峰和谷底,能够极大提高资源利用率。5.3.4云计算你可以想象我们的食堂与个人做饭问题云计算如今的的服务模式主要包括以下三种提供基础的计算资源,如服务器、存储和网络。用户可以像管理自己的物理资源一样管理这些虚拟资源。基础设施即服务(IaaS)在IaaS的基础上,提供开发、测试和部署应用程序的平台。用户可以在这个平台上构建、运行和管理自己的应用程序,而无需担心底层基础设施的复杂性。平台即服务(PaaS)在PaaS的基础上,提供完整的应用程序。用户可以通过互联网直接访问和使用这些应用程序,而无需在自己的计算机上安装和配置。软件即服务(SaaS)5.3.4云计算云计算的场景服务模式给你块地,自己种菜把菜种好,收获菜把菜加工为食品,直接食用类比种菜做饭云计算数据中心是云计算中负责存储、处理和交换数据信息的核心。它将计算资源、存储资源和网络资源等通过虚拟化技术进行高度整合,并通过互联网向用户提供按需、易扩展的服务。人们可以通过各种终端,享受到云计算数据中心提供的云服务。
5.3.4云计算云计算数据中心常常以提供云服务的形式来提供算力。全球云服务主要参与者包括亚马逊、微软、谷歌、IBM等。国内阿里云市场规模位居第一,市场份额达40.2%;
亚马逊位居第二,市场份额达16.9%。
其次是华为云、腾讯云等。5.3.4云计算
除上面提到的个人PC和云计算外,有一类计算机一直在默默的提高性能和算力帮助人类进行大型的科学计算任务,比如天气预报、地球物理、石油勘探、生物医药科学、物理仿真模拟等。那么这些场景的计算机是什么样的呢?
超级计算机的概念呼之欲出。ArtificialIntelligenceandFuture人工智能与未来2035主讲:王红梅Computility第5章
算力2035王红梅5.15.25.35.4算力那些事算力概述通用算力超算算力目录CONTENTS5.55.6智算算力拓展:算力网络讨论:当说到“超级计算机“的时候你怎么去理解这个“超级”呢?在你的认知中,有哪些和“超级”有关的事情呢?描述某个同学学习超级好描述某人超级有钱描述...下面给大家分享一个和超级有关的故事。相传印度舍罕国王打算重赏国际象棋的发明人——大臣西萨·班·达依尔。国王:你说吧,你想要什么都可以说西萨:我想要的是...国王:你尽管说西萨:这个8*8的棋盘,第一格放1粒麦子,第二格放2粒麦子,第三格放4粒麦子,以后每格麦子的数量是前面的翻倍即可。国王:就这点要求,好的好的。124你是国王你会答应西萨的请求吗?国王最终给西萨这些麦子了吗?12420+21+22+...+264粒麦子,约2000亿吨。以现在的水平,差不多是300年全球麦子的产量之和。指数问题。是个超级问题。延伸一下,我们要讲的超级计算机,其算力和普通计算机比,是按指数倍数来算。1GFlops=109Flops1TFlops=1012Flops1PFlops=1015Flops1EFlops=1018Flops5.4.1超算的概念5.4.2超算的分类5.4.3超算的内部结构5.4.4中国的超算能力5.4.5超算中心
计算机终端的算力,足够我们日常生活、学习、娱乐了。
但是有些领域,比如天气预报、天体物理模拟、航空航天、地震预报、石油天然气等勘探、CAE仿真计算、生命科学等,计算量非常大,需要超强算力,必须超级计算。这听起来好像离我们有点远,和我们关系不大?5.4.1超算的概念
天气预报怎么做到呢?
得益于超级计算机每12分钟实时刷新未来6小时的气象变化数据,并且准确预测未来15天以上气象变化情况。
讨论:假如你要出门6小时,对于是否带伞的问题有点纠结,你通常都怎么做?5.4.1超算的概念不同于传统计算机,超级计算机简称超算,适用于高性能大型主机系统,具有强大的计算能力、高级别的计算精度,能够以极快速度处理海量数据集和进行复杂计算。5.4.1超算的概念超级计算机体积也是超级大的5.4.1超算的概念2024年
世界第一名的超级计算机Frontier超级计算机占地面积约372平方米5.4.1超算的概念对应于不同的用途,各种超级计算机采用的技术架构、系统设计、性能评测标准都不一样。为了能有一个统一的标准来衡量超级计算机性能指标,1993年成立了国际TOP500组织。该组织每半年对世界上各个超级计算机用Linpack程序进行一次基准测试,将排名前500的系统在世界TOP500排行榜网站上公布。TOP500代表着世界上前500台运行速度最快的超级计算机。任何单位和组织的超级计算机要想进入TOP500名单,必须运行一个标准的HPC性能测试程序并将测试结果提交给TOP500组织。5.4.1超算的概念2024年TOP500排行榜名次计算机速度(Flops)部署地1Frontier1.2E美国橡树岭国家实验室2Aurora1.0E美国伊利诺伊州的阿贡国家实验室3Eagle561P微软Azure云平台4Fugaku442P日本神户理研计算科学研究中心5LUMI379P芬兰CSCEuroHPC中心横向看:亚欧美洲都有5.4.1超算的概念纵向看:你追我赶,互相超越图表2:2010-2024年全球超级计算机性能TOP500榜单排名第一变化情况时间超级计算机名称研制者国家2010.11-2011.06天河-1国防科技大学中国2011.06-2012.06京(超级计算机)理化学研究所日本2012.06-2012.11蓝色基因/QIBM美国2012.11-2013.06TitanCray美国2013.06-2016.06天河-2国防科技大学中国2016.06-2017.11神威·太湖之光国家并行计算机工程技术研究中心中国2018.06-2019.11SummitIBM美国2020.06-2021.11SupercomputerFugaku富士通日本2022.06-2023.06FrontierHPE美国2023.06-2024.06FrontierHPE美国5.4.1超算的概念你可能比较好奇,最近几年的TOP500排行榜没有了中国的身影,为什么呢?实际上,中国的超算成就是举世瞩目的,中国在2021年以前的全球超级计算机排名中,曾8次位居榜单第一,但是我们在2021年宣布,不再参加Top500的HPL基准测试。5.4.1超算的概念为什么不参加,同学们可以查查资料来谈论和分享。5.4.2超算的分类
根据超级计算机规模和用途不同,可分为通用超级计算机和专用超级计算机。通用的超级计算机是多数,服务于军事、医药、气象、金融等众多领域。(1)神威·太湖之光(2)前沿超级计算机(Frontier)专用超算只能高效地处理同一类型问题。(1)国际“象棋高手”“深蓝”(2)日本的“地球模拟器”;(3)纽约的安腾超级计算机:分子动力学模拟。比超算Frontier还要快上50倍以上。超级计算机本质上有单个计算机构成单个计算机超级计算机5.4.3超算的内部结构
超级计算机由众多计算节点组成(一个节点相当于一台计算机)超级集群。每个节点配有多个CPU等处理器,节点之间用高速网络互联,共享存储器。各个计算节点在操作系统管理下可以实现大规模并行计算,从而完成复杂艰巨的计算任务。5.4.3超算的内部结构天河二号拥有16000个计算机节点,每个节点配备2个处理器和3个协处理器。天河2号上运行的是国防科技大学开发的麒麟操作系统。算力达到了5.49亿亿FLOPS。5.4.3超算的内部结构
回望1980年代,中国的高性能计算机完全依赖进口,受限于国外技术封锁。
典型的案例就是中石油采购的IBM超级计算机,被安置在一个玻璃房子里,使用受美国全程监控,启动密码和机房钥匙都在美国人手里,成果还要美国审查。
这个事件被称为中国在级超级计算机领域的“玻璃房”事件,也是中国在超级计算机领域受到的超级侮辱事件之一。5.4.4中国的超算能力
后来,我国科学家发愤图强,于1983年12月发布了银河1号超级计算机。随后,又发布了银河2号到银河4号,形成银河超级计算机系列。应用银河超级计算机,我国成为世界上少数几个能发布5-7天中期数值天气预报的国家之一。银河系列后来又升级为“天河”系列,2010年,天河一号A成为中国第一个全球运行速度最快的超级计算机。5.4.4中国的超算能力
神威超级计算机的研制团队坚持国产化道路,厚积薄发,于2016年6月成功研制出世界上最快的超级计算机“神威太湖之光”,这台超级计算机落户在位于无锡的中国国家超级计算机中心。5.4.4中国的超算能力
神威太湖之光,在2016至2017年间,它连续四次蝉联世界Top500排行榜超级计算机冠军。5.4.4中国的超算能力中国的超级计算经过几十年发展,拥有了银河、天河、神威、曙光系列,由落后发展为世界领先。5.4.4中国的超算能力
什么是超算中心,超算中心和超级计算机有什么关系呢?超算中心,即超级计算中心,是指部署有超级计算机的机构。5.4.5超算中心大家都知道哪些超算中心?你是否亲自使用过超算中心的算力,赶快来评论区说说吧。
自2009年,科技部开始批准建立超级计算中心。截至2024年,科学技术部批准建立的国家超级计算中心有11个:国家超级计算天津中心、国家超级计算广州中心、国家超级计算深圳中心、国家超级计算长沙中心、国家超级计算济南中心、国家超级计算无锡中心,国家超级计算郑州中心、国家超级计算昆山中心、国家超级计算西安中心、国家超级计算成都中心、国家超级计算太原中心。另外还有中新重庆国际超算中心、文昌航天超算中心、乌镇之光超算中心等,天河一号和三号在天津,神威太湖之光在无锡。
5.4.5超算中心5.4.5超算中心11个国家级超算中心和3个地方超算中心国家超级计算郑州中心坐落在郑州高新区,由郑州大学负责建设、管理、运行和服务工作。郑州中心配备”中科曙光”新一代高性能计算机,峰值计算能力为100PFlops,存储容量为100PB。
5.4.5超算中心在国内,当你有超算需求的时候,该怎么办呢?是花费几个亿美金买一套吗?这些超算中心的计算资源是可以租用的。对学生和老师有时候还有免费资源可提供。讨论:请搜索一下,目前最快的超级计算机是谁?为执行什么程序设计的?造价是多少?2024年全球超级计算机排名第一如下:Frontier,橡树岭国家实验室,美国能源部运营。1、安装在74个19英寸(48厘米)机柜中2、每个机柜安装了64个服务器3、该套系统包括9,472个CPU和37,888个GPU,这意味着该机器共有8730112个内核4、功率为22,703千瓦5、该系统配备水冷系统散热,其水冷系统拥有四个大功率水泵,每分钟可推动超过25吨水在机器周围流动6、造价为6亿美元ArtificialIntelligenceandFuture人工智能与未来2035主讲:王红梅Computility第5章
算力2035王红梅5.15.25.35.4算力那些事算力概述通用算力超算算力目录CONTENTS5.55.6智算算力拓展:算力网络讨论:已经学习了超算算力,云计算,为什么又会出现一种智能计算算力呢?会不是是跟风?根据OpenAI在2018年发布的报告,自2012年以来AI训练任务所运用的算力每3—4个月就会翻一番;2012—2018年,AI算力需求增长了30万倍。
5.5.1智能算力的概念从我国2019-2026年算力规模及预测来看,需求仍呈指数级不断增加。
但是另一方面,CPU的性能增长已经碰到了瓶颈,摩尔定律逐渐失效。因此科学家开始寻求各种新的芯片给计算机进行加速。5.5.1智算算力概念
人工智能技术需要进行大量的矩阵运算、并行运算,而CPU的特性使其无法满足这种算力需求,因此,出现各种专用加速芯片。
把专门任务交给专门芯片去处理,各司其职,各尽其能。
所以超算中心和云数据中心也在增加智能芯片以应对人工智能技术对算力的需求。5.5.1智算算力概念
智算算力是指专门用于人工智能和机器学习任务的计算能力,以GPU(GraphicsProcessingUnit,图形处理器)算力为核心算力,融合利用CPU、FPGA(Field-ProgrammableGateArray,现场可编程门阵列)、ASIC(ApplicationSpecificIntegratedCircuit,专用集成电路)等加速芯片5.5.1智算算力概念早期的GPU是协助CPU进行3D图像处理的加速硬件,GPU的编程性能比较有限。2006年英伟达与超微半导体公司分别推出了CUDA(ComputerUnifiedDeviceArchitecture,统一计算架构)编程环境和CTM(ClosetotheMetal)编程环境;开发人员可以直接编写程序从而可以更好的用于数值计算。5.5.2人工智能算力芯片1.GPUGPU为何比CPU具有更强的智能计算能力呢?我们可从设计目标、内部架构、适用任务三方面与CPU进行对比分析。5.5.2人工智能算力芯片1.GPU(1)设计目标
5.5.2人工智能算力芯片1.GPUCPUGPU运行复杂程度高,针对各种不同的数据行,其在逻辑判断后有大量的分支跳转和中断。
重在对大量趋同计算的并行处理,运行复杂度低,擅长处理类型统一的、无相关性的大规模数据。(2)内部架构对比GPU和CPU在结构上的差异,CPU大部分为控制器和寄存器,而GPU拥有更多的运算器用于数据处理,这样的结构适合对密集型数据进行并行处理,使得GPU的运行速度相较于CPU提升几十倍乃至上千倍。5.5.2人工智能算力芯片1.GPUCPUGPU(3)适用任务CPU适合运行数据结构不规则、逻辑复杂的串行程序。GPU适合处理数据耦合度低、高度并行化的计算任务。GPU尤其是擅长人工智能大模型的训练和推理中大量存在的矩阵运算。5.5.2人工智能算力芯片1.GPUCPUGPU架构特点串行处理的大师并行处理的王者功能定位系统控制与通用计算图形渲染与高性能计算性能表现单核强,综合性能高并行处理,吞吐量惊人应用场景通用计算:如办公、网络购物、编程开发等。图形渲染:游戏、动画电影、虚拟现实等需要高质量图形输出的场景。目前GPU的产品份额主要由英伟达(Nvidia)占有,他们生产的GPU加速芯片常见的型号有A100、H100、A800、H800、H20等系列。目前在GPU领域也出现了一些我国的自主品牌产品,如:华为公司的昇腾系列、寒武纪公司的思元系列、壁仞科技公司的壁砺系列等。5.5.2人工智能算力芯片1.GPUinter公司1968AMD公司19691993年多媒体技术发展需要,促使NVIDIA公司诞生,生产显卡两雄长期争霸AI时代独领风骚5.5.2人工智能算力芯片1.GPU5.5.2人工智能算力芯片1.GPUGPU虽然在人工智能算力芯片中占据主导地位,但是GPU芯片也存在一些缺陷。主要体现以下三方面:第一,当前GPU芯片供不应求,导致GPU芯片价格居高不下。第二,GPU芯片能耗较大,大规模部署电力成本较高。第三,GPU在延迟敏感、需要快速响应的人工智能应用领域,如自动驾驶、实时语音识别等,表现欠佳。因此,在智能算力芯片方面,需要FPGA和ASIC芯片来弥补GPU芯片的缺陷。5.5.2人工智能算力芯片
2.FPGAFPGA(Field-ProgrammableGateArray),即现场可编程门阵列,用户可以通过烧入FPGA配置文件来定义这些门电路以及存储器之间的连线实现编程。FPGA在出厂时是万能芯片,有大量的门电路组成,用户可根据自身需求,用硬件描述语言对FPGA的硬件电路进行设计。FPGA可同时进行数据并行和任务并行计算,在处理特定应用时有更加明显的效率。应用于自动驾驶,航空航天等领域。5.5.2人工智能算力芯片
3.ASICASIC(Application-SpecificIntegratedCircuit)芯片是专门为了特定应用而定制的集成电路,与通用处理器CPU不同,ASIC芯片针对具体任务进行了优化,不能执行其他任务。ASIC的特点是高性能、低成本、尺寸紧凑和低功耗。ASIC芯片的发展势头强劲。例如谷歌的TPU(Tensorprocessingunit)(张量处理芯片)是谷歌专为AI定制设计的ASIC,其针对大模型的训练和推理进行了优化。5.5.2人工智能算力芯片GPUFPGAASIC芯片架构叠加大量计算单元和高速内存、逻辑控制单元简单具备可重构数字门电路和存储器、根据应用定制电路结构可根据特定领域应用和特定算法定制擅长领域3D图像处理、密集型并行计算算法更新频繁或者市场规模小的专用领域市场需求量大的专用领域优点计算能力强、通用性强、开发周期短、难度小、风险低功能可修改、高性能、功耗远低于GPU、一次性成本低专业性强、性能高于FPGA、功耗低、量产成本低缺点价格贵、功耗高编程门槛高、量产成本高开发周期长、难度大、风险高、一次性成本高三种AI芯片特征对比5.5.2人工智能算力芯片5.5.2人工智能算力芯片当你有上述需求时,可以考虑一下国货产品讨论:1、英伟达的股票市值是多少?2、一块最先进的英伟达GPU价值多少?3、时代造英雄,黄仁勋是如何成功的?
在数据中心领域,网络协议处理、数据安全、存储管理、虚拟化等是频繁需要执行的任务。这些任务在数据中心中至关重要,但同时也是大量消耗算力资源的工作。
发明了数据处理器(DataProcessingUnit,DPU),来分担CPU这部分的负担。5.5.2人工智能算力芯片DPU正如NVIDIACEO(首席执行官)黄仁勋在NVIDIAGTC(GPU技术大会)上所讲,DPU将和GPU、CPU一样成为未来计算架构的三大基石之一。5.5.2人工智能算力芯片DPU探讨完了CPU、GPU和DPU你猜下一个是?PU,A、B、C、D、E、……、Z?PUTPU(
TensorProcessingUnit,张量处理单元)
TPU是一种专门为机器学习设计的处理器芯片,TPU用在阿法狗上,取得了很好的效果。
在深度学习的世界里,张量(多维数组)无处不在。TPU内置大量矩阵运算单元,使其能够并行处理大量的矩阵运算,大大提高计算效率。TPU在大模型训练方面有独特优势。
5.5.2人工智能算力芯片TPUNPU(Neural-networkProcessingUnit,神经网络处理单元)
是一种人工智能专用芯片,在神经网络计算方面有独特优势。5.5.2人工智能算力芯片NPU学习了各种人工智能计算芯片之后,我们来看这些芯片通过异构并行组成的人工智能服务器(以下简称AI服务器)。基于运行的处理器架构来区分,并行计算也分为同构并行与异构并行。例如,多核CPU是同构并行,“CPU+GPU”的多处理器则是典型的异构并行。5.5.3智算中心
所谓的异构计算,就是CPU、GPU、FPGA、ASIC等各种使用不同类型指令集、不同体系架构的计算单元,组成一个混合的系统,执行并行和分布式计算的特殊方式。
当前异构计算的计算资源类型越来越多元,典型的计算资源包括CPU、GPU、FPGA、ASIC等。5.5.3智算中心由于单个AI服务器算力有限,工程人员将大量的AI服务器通常构成一个大规模计算集群,称为AI集群。5.5.3智算中心
近年来,还涌现出了一批人工智能超级计算机。华为2023年发布了Atlas900超级计算机,它采用了最先进的集群模式,通过将多台计算机互联互通,形成一个大规模的超级计算机集群。Atlas900的AI训练集群通过1024颗昇腾910AI处理器进行协同工作,实现了极高的计算性能和效率。2023年,NVIDIA(英伟达)正式发布了全新的GH200GraceHopper超级芯片和拥有256个GH200超级芯片的NVIDIADGXGH200超级计算机。DGXGH200是“巨型GPU”5.5.3智算中心
智算算力正是以AI芯片、AI服务器、AI集群和AI超级计算机做为载体,最终集成于智算中心,通过智算中心这个算力工厂源源不断的输出智算算力。
而在AI芯片、AI服务器集成为AI集群和AI超级计算机的过程中,网络的传输能力也是一个不容忽视的重要因素,中国的AI芯片比起NVIDIA等的AI芯片目前还不具有优势,但在众卡集成中,卡与卡之间的大量数据需要在短时间内进行传输和处理,我国以华为的5G通信技术为基础的网络通信技术有绝对优势,正好满足了这一需求。这也是在很多场景中,我国虽然在AI芯片上被卡脖子,但仍可出“奇迹”的一个原因之一。5.5.3智算中心名企名事:华为和世界上的科学家们现在我们所使用的5G通信技术,其标准源于2008年土耳其埃达尔·阿勒坎(Arikan)教授的一篇数学论文。其实,华为不仅仅是一个企业,更是一个科学家云集的研发中心。华为创始人任正非说:“华为的成功靠的是背后七百多个数学家,八百多个物理学家,一百二十多个化学家,还有六千多位专门在从事基础研究的专家,以及六万多研发工程师的功劳”。数据中心、智算中心和超算中心有什么区别?云计算中心、超算中心、智算中心对比5.5.4三种中心对比云计算中心超算中心智算中心技术体系基于CPU芯片的服务器提供
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年度计算机四级通关题库附参考答案详解【突破训练】
- 2024-2025学年广东茂名农林科技职业学院单招数学预测复习及1套完整答案详解
- 2024-2025学年度烟草职业技能鉴定考试黑钻押题含完整答案详解(必刷)
- 某纸业生产流程管理准则
- 2024-2025学年度监理工程师检测卷附参考答案详解【综合卷】
- 某麻纺厂产品包装规定
- 老年医学科阿尔茨海默护理方案
- 老年医学科:老年抑郁症心理治疗方案
- 前列腺增生手术后护理方案
- 2026辽宁丹东市北宸商务科技有限责任公司面向社会招聘1人备考题库及完整答案详解1套
- 出水井施工方案(3篇)
- 健康照护师操作测试考核试卷含答案
- 2026湖南省卫生健康委直属事业单位招聘185人考试参考试题及答案解析
- 航空航天及设备制造标准化操作规程手册
- 【2025年】裁剪工岗位职业技能资格考试联系题库-含答案
- 西藏自治区工程建设项目审批(核准,备案)全流程事项清单
- 工艺纪律检查培训课件
- 黑便血便课件
- 中药知识丹参
- 物流运输管理课件
- 2026危险品押运员模拟考试试题及答案
评论
0/150
提交评论