版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能通识(理工科)北京科技大学主要内容计算机体系结构计算机的硬件组成以GPU为中心的计算架构数据中心与算力网络计算机体系结构概念和发展计算机体系结构目标是提高计算机系统的整体性能,降低功耗、节省成本。计算机体系结构的发展历程大致经历四个阶段:第一阶段是20世纪40年代末到60年代中期,计算机系统的硬件发展很快,通用硬件已经比较成熟,但是缺少通用软件。第二阶段是从20世纪60年代中期到70年代中期,集成电路制造工艺水平不断提高,计算能力和处理速度更快,体积和能耗更低。1965年,Intel公司的创始人戈登·摩尔提出了“摩尔定律”,同样面积的半导体芯片上集成的电子元器件数目,每隔18-24个月翻一番,其计算能力也将提升一倍。软件开发还处于“软件作坊”的形式,从而导致了第一次“软件危机”,诞生了“软件工程学”的学科,推动了软件技术的进步。计算机体系结构概念和发展第三阶段是从20世纪70年代中期到80年代中期,微处理器得到了快速发展,出现了以微处理器为核心产品的个人计算机,而随之不断发展壮大的是代表着计算机硬件的因特尔公司和代表着计算机系统软件的微软公司,形成Wintel联盟的生态。第四阶段从20世纪80年代中期开始,一直持续到现在,计算机的硬件系统和软件系统都得到了显著发展。特别是Client/Server和Browser/Server架构的分布式计算模型,允许不同位置和不同类型的计算机协同工作,标志着计算机体系结构从集中式到分布式计算的转变。同时,C++、C#、Java等面向对象编程语言的诞生,软件设计模式的大量应用,有效解决了代码可复用性、可扩展性和可维护性等问题。新型计算架构双核CPU,通过在单个芯片上集成两个独立的计算内核来实现并行处理,使得CPU能够同时执行多个指令,提升了整体计算性能。多核并行处理技术,GPU(GraphicsProcessingUnits,图形处理单元),内部集成了数以千计的计算核心。GPU不仅擅长处理图形图像数据,还能胜任机器学习、人工智能等密集型计算任务,特别在计算机视觉、自然语言处理、大模型、区块链、密码学等前沿领域。图灵机和冯诺依曼体系冯.诺依曼体系结构特点:①存储程序的概念②指令和数据均以二进制形式存储和处理③五大功能部件
电子计算机之父冯.诺依曼(JohnvonNeumann,1903~1957)主要贡献:
提出“存储程序”概念,奠定了现代计算机体系结构和工作原理冯诺依曼体系结构CPU输入设备内存储器输出设备运算器控制器数据流指令流控制流以存储器为中心的计算机组成结构CPU(CentralProcessingUnit)冯诺依曼体系结构(1)运算器(ArithmeticLogicUnit,ALU):算术逻辑单元负责执行所有的算术运算(如加减乘除)和逻辑运算(如与、或、非等)。(2)控制器(ControlUnit,CU):控制单元负责从内存中取出指令、解码并控制计算机的各个部分执行操作。(3)存储器(Memory):指内存,用于存储程序和数据。(4)输入设备(InputDevices),用于接收外部数据或指令,常见的输入设备有键盘、鼠标、扫描仪等。(5)输出设备(OutputDevices),用于显示或传送计算结果,常见的输出设备有显示器、打印机、扬声器等。冯诺依曼体系-运算器运算器:进行算术运算和逻辑运算的部件。数据寄存器ALU累加器ArithmeticandLogicUnit算术运算:
+-×÷逻辑运算:
AND,OR,NOT数据寄存器冯诺依曼体系-控制器控制器:指挥中心,指挥各部件协调的工作。控制器程序计数器PC指令寄存器IR指令译码器ID操作控制器根据译码器的译码结果,产生出实现该指令的全部动作的控制信号。存放将要被执行的指令地址,有自动加1的功能。存放当前要执行的指令代码,等待处理。识别和翻译指令CPU的主要性能指标(1)频率主频:CPU内核工作的时钟频率,MHZ,GHZ。一般来讲,CPU的主频越高,CPU的运算速度就越快。外频:CPU与外部主板上各部件(如内存条)交换数据和指令的工作时钟频率。一般为33MHz、100MHz、133MHz、200MHz等.倍频:通过提高倍频,CPU可以在较低的外频下达到更高的工作频率,增强计算能力。主频=外频*倍频。(2)字长
CPU每次可处理的二进制数的位数。
字长直接影响CPU数据处理能力和计算精度。字长越长,CPU处理数据的速度和能力越强。
现代计算机的字长普遍为32位或64位。字长为64位的CPU每次能处理64位二进制数据,超过该位数的数据则需多轮操作。00101011字节Byte76543210位bitCPU的主要性能指标多核CPU在一枚CPU中集成两个或多个完整的计算引擎5*4*3*2的计算发挥并行计算的优势核并不是越多越好:某些情况下分割运算,实现并行的难度更大CPU的架构CPU架构:指设计和实现CPU的硬件和其操作机制的整体结构。它定义了计算机如何执行指令,如何处理数据和控制流程架构应用指令集优点缺点x86由Intel和AMD等公司采用,广泛应用于个人电脑、服务器等领域CISC复杂指令集计算机兼容性强,支持大量的软件和操作系统指令集复杂,功耗相对较高ARM由苹果、高通、三星、英伟达、博通、华为等公司采用,主要应用于嵌入式设备、移动设备(如智能手机、平板电脑)和一些低功耗服务器RISC精简指令集计算机低功耗、性能出色,支持大量的嵌入式系统和移动设备与x86系统相比,软件兼容性较差CPU架构x86架构CISC(ComplexInstructionSetComputing)复杂指令集著名厂商:Intel,AMD酷睿、志强、AMD锐龙等处理器ARM架构RISC(ReducedInstructionSetComputing)精简指令集著名厂商:ARM(设计厂商)ARM处理器体积小、低功耗、低成本、高性能应用于手机、平板、汽车芯片等嵌入式设备,如海思麒麟芯片MULa,bMOVAX,aMOVBX,bMULAX,BXSTRa,AXa=a*b我国自主研制CPU的发展2002年中国科学院计算所自主研发的第一款通用高性能微处理器“龙芯1号”成功问世,标志着我国CPU自主研发的新纪元。此后,龙芯系列不断更新迭代,推出了龙芯2号、龙芯3号等,显著提升了我国自主CPU的性能和性价比。除了龙芯系列,飞腾、鲲鹏、海光、兆芯、申威等国内厂商也在自主CPU研发领域取得了显著成果。内存单元的结构每个存储单元由1字节(8bit)组成,存储地址的位数与内存容量相关10110110存储内容10110001存储地址缓冲寄存器地址总线数据总线地址译码器读写控制电路读写命令10110010101100111011010010110101……CPU可直接访问的存储器;用于存储正在运行的程序或数据。采用大规模集成电路技术制成的半导体存储器,快、小、轻。内存性能指标:容量,存取速度。内存储器随机访问存储器RAM动态RAMDRAM静态RAMSRAM只读存储器ROMRandomAccessMemory保存的信息在计算机断电后就会消失,又称为易失性存储器1可读可写2易失性内存(也称为主存储器)ReadOnlyMemory一般情况下,ROM中的信息是固化的又称为非易失性存储器,如BIOS1只读2非易失性Cache通常所说的内存容量指的是RAM,RAM是内存性能的决定性因素。冯诺依曼体系-瓶颈CPU和内存之间的速度差异在冯·诺依曼架构中,CPU的处理速度和传统内存的访问速度差异会导致CPU等待内存,即CPU的计算能力无法充分发挥,因为它必须等待内存的读写操作。处理器速度较快:现代CPU设计通常包括多个核心和高频时钟,能够每秒执行数十亿个指令,但需要从内存中获取数据或指令。内存速度较慢:内存的访问速度远低于CPU的运算速度,尤其在数据量大的时候,内存访问的延迟会显著影响整体计算性能。静态RAM(Cache)高速缓存器(Cache,简称缓存)是为了解决CPU和内存存储速度不匹配的问题,它介于内存和CPU之间,位置可以在CPU芯片内部,也可以在CPU芯片的外部。Cache的存取速度比内存快,但价格昂贵,能够以接近CPU的速度向CPU提供程序指令和数据。内存CPUSRAM(Cache)主板DRAM静态RAM(Cache)高速缓冲存储技术基于程序执行的局部性原理(程序的执行在一段时间内总是集中在程序代码的一个小范围内),因此,当CPU读取内存中某一地址的指令时,计算机就自动地将该地址相近的一段代码从内存传送到Cache中。静态RAM(Cache)内存CPU核心1CPU核心2L1二级缓存三级缓存L3二级缓存L1L1L1CPU核心3二级缓存L1L1CPU核心4二级缓存L1L1主板DRAML1:Level1,存取速度最快L2:Level2L3:Level3,容量最大只读存储器ROMROM(Read-OnlyMemory):非易失性存储器,用于存储永久性数据,如计算机系统的引导程序(BIOS/UEFI)完成自检。与RAM不同,ROM即使在断电的情况下也能保留数据。现代ROM以FlashMemory(闪存)为主FlashMemory:更先进的非易失性存储技术,广泛应用于现代设备中,支持电子擦除和编程,具有更高的存储密度和更快的操作速度。广泛用于U盘、SSD(固态硬盘)、智能手机、数码相机、游戏机等设备内存性能指标容量:内存的存储空间大小,通常以GB为单位,现代计算机通常配置8GB到64GB甚至更大的RAM带宽:内存的数据传输速率,通常以GB/s为单位。带宽越大,内存在处理大量数据时的效率越高。延迟:指从发出请求到数据实际传输的时间,通常为几十到几百纳秒之间(CPU的单个时钟周期通常在几纳秒到十几纳秒之间)存储设备层次结构速度差异,具体可体现为纳秒(ns)、微秒(μs)、毫秒(ms)到秒(s)的量级跨度!关于访问速度,CPUGHz,约1ns;内存,约100ns.内存速度是硬盘的大约一百万倍。内存对硬盘:硬盘Register存储设备层次结构外存储器外存储器也称为辅助存储器,简称外存、辅存,只能和内存储器交换信息,不能被计算机系统的其他部件直接访问。外存储器的存储容量大,能够长期保存数据,但存取速度较慢,一般用来存放大量暂时不用的数据和程序,需要时,可以成批地和内存储器进行信息交换。常用的外存储器有机械硬盘、固态硬盘、U盘、光盘、移动硬盘、磁带等。
输入和输出设备输入设备输出设备显卡显卡(GraphicsCard),又称为显示适配器,是连接显示器和计算机主板的关键组件。显卡承担输出显示图形的任务,同时显卡有图像处理能力,用于渲染图像、视频和动画所需的密集计算;可协助CPU工作,提升系统整体运行速度。GPU(GraphicsProcessingUnit,图形处理单元):显卡的处理器,显卡的“心脏”。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,执行复杂的数学和几何计算,这些计算是图形渲染所必需的,某些最快速的GPU集成的晶体管数甚至超过了普通CPU。计算机的主要电路系统芯片组扩展槽接口主板及插卡的直流电源供电接插件……主板台式机的主板CPU插槽内存插槽PCI插槽AGP插槽总线是计算机各部件之间传送信息的公共信息通道,以多根线路构成的导线束方式,并行传输。按照传输的信息内容不同分为数据总线DB(DataBus)、地址总线AB(AddressBus)和控制总线CB(ControlBus)。总线宽度:数据总线一般和字长的位数相同;地址总线的宽度决定了CPU的寻址范围。总线中央处理器CPU输入设备输入接口存储器RAMROM输出接口数据总线DB地址总线AB控制总线CB输出设备主频=外频*倍频字长:CPU每次可处理的二进制数的位数系统总线DBCBAB连接五大功能部件CPU与主板之间使用外频同步运行数据总线宽度与字长相同决定了寻址内存的大小35倍倍频决定CPU常态运行的频率底线,睿频依托倍频,随负载动态提升倍数以定性能上限,二者共同构成“基础+弹性”的CPU频率调节体系。输入设备:键盘、鼠标、扫描仪等输出设备:显示器、打印机、绘图仪等外存:机械硬盘、固态硬盘、光盘、U盘等
外部设备硬件运算器控制器主机内存CPU随机存储器(RAM)只读存储器(ROM)1.2计算机系统的硬件组成外存储器程序和数据从外存成批传送到内存指令1指令2......指令k......指令n数据1数据2......数据m程序数据内储存器CPU逐条执行指令,按照指令要求完成对数据的运算和处理将处理结果成批传送到外存以长久保存CPU从内存中逐条读取指令及相关数据将指令处理结果送回内存保存外存储器(简称外存或辅存)存取速度慢成本低、容量大不与CPU直接连接,先传送到内存,然后才能被CPU使用属于非易失性存储器,用于长久存放系统中几乎所有的消息内存储器(简称内存或主存)存取速度快成本高、容量相对较小直接与CPU连接,CPU对内存中可直接进行读、写操作属于易失性存储器(volatile),用于临时存放正在运行的程序和数据内存与外存的关系冯诺依曼体系-工作过程基本步骤:取指令、分析指令、执行指令开始指令指令指令指令结束指令程序的执行取出指令分析指令执行指令从内存某地址取出要执行的指令把取出的指令送指令译码器,译出对应操作向相关部件发送控制命令,完成操作译码器ID操作控制器地址寄存器AR累加器数据寄存器数据寄存器程序计数器PC指令寄存器IR数据寄存器DRCPUALUCPU模型机译码器ID操作控制器地址寄存器AR累加器数据寄存器数据寄存器程序计数器PC指令寄存器IR数据寄存器DRCPUALU存储器地址指令或数据内容20213031CLAADD[30]000006①③④地址总线数据总线②⑤000020000020000021CLACLA000000译码器ID操作控制器地址寄存器AR累加器数据寄存器程序计数器PC指令寄存器IR数据寄存器DRCPUALU①④②000021000022000021000000ADD[30]ADD[30]数据寄存器存储器地址指令或数据内容20213031CLAADD[30]000006③地址总线数据总线译码器ID操作控制器地址寄存器AR累加器数据寄存器程序计数器PC指令寄存器IR数据寄存器DRCPUALU000021000022ADD[30]ADD[30]000000①③④000030000006000006+000006数据寄存器存储器地址指令或数据内容20213031CLAADD[30]000006地址总线数据总线000006②显卡:计算机中的一种重要硬件组件,主要负责图形处理和视频输出任务。与CPU不同,专门设计用来加速图像渲染、视频解码和计算密集型的并行处理任务。显卡的主要组成GPU(
GraphicsProcessingUnit,图像处理单元):显卡的核心部分,负责实际的图形处理工作。现代GPU通常由数千个小型计算单元组成,可以并行处理大量的图形数据。显存:显卡中用于存储图形数据的高速内存,包括纹理、渲染缓冲区等。显存的大小和带宽直接影响显卡的性能,尤其在处理高分辨率图形和复杂场景时。1.3AI时代的算力需求-GPU显卡的应用领域游戏:现代游戏尤其是3D游戏需要强大的显卡支持,显卡负责渲染复杂的游戏画面和特效。视频编辑和图形设计:显卡被广泛应用于专业的图形设计、视频剪辑和渲染软件,如AdobePremierePro、AutodeskMaya等,加速图形渲染。虚拟现实(VR)和增强现实(AR):VR和AR应用要求显卡能够实时渲染高质量的3D图像。科学计算与人工智能:随着GPU计算能力的提升,显卡在深度学习、人工智能、科学研究(如分子建模、天气预报等)中的应用越来越广泛。NVIDIA的CUDA技术使得GPU能够加速并行计算任务。GPU与CPUCPU需要很强的通用性来
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025 高中信息技术数据与计算之数据可视化的平行堆积图设计课件
- 2026年钠离子电池在用户侧储能场景加速渗透应用前景
- 2026年压电陶瓷在汽车发动机爆震监测中的国产化突破路径
- 2026年证券集体诉讼先行赔付特别代表人诉讼机制指南
- 2026年数据资产质押贷款创新模式与估值方法
- 2026年四川实施人工智能“一号创新工程”与成渝协同推进路径
- 医患沟通中的诚信与透明课件
- 2026年电能占终端能源消费比重每年提升1%路径
- 2026年龙头企业开放应用场景带动中小企业协同攻关机制
- 2026浙江丽水市第二人民医院第一批引进高层次人才14人备考题库含完整答案详解(夺冠系列)
- MOOC 概率论与数理统计-中国矿业大学 中国大学慕课答案
- (2024年)气胸完整课件
- 工程项目合作方案计划书
- 高炉基本操作制度
- 安徽中元化工集团有限公司2万吨每年二氯异氰尿酸钠资源综合利用联产2万吨每年三氯异氰尿酸项目环境影响报告书
- 《国际共产主义运动史》课程教学大纲
- YY/T 1836-2021呼吸道病毒多重核酸检测试剂盒
- 安全经验分享-办公室职业病
- GB/T 32291-2015高压超高压安全阀离线校验与评定
- 外科学课件:第七章-重症监测治疗与复苏
- 团队与团队凝聚力打造课件
评论
0/150
提交评论