存储管理 CPU究竟需要多大缓存

上传人：n*** IP属地：河南上传时间：2020-04-06 格式：PPT 页数：56 大小：3MB 积分：15 举报 版权申诉

已阅读5页，还剩51页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

CPU究竟需要多大缓存缓存的前世今生 CPU性能的影响因素频率架构工艺缓存大缓存对于大会战作用很大 CPU缓存 CPU缓存 CacheMemory 是位于CPU与内存之间的规模较小的但速度很高的临时存储器它通常由SRAM 静态随机存储器组成用来存放那些被CPU频繁使用的数据以便使CPU不必依赖于速度较慢的DRAM 动态随机存储器不过限于它的昂贵成本一般容量比内存要小 SRAM结构简图 DRAM结构简图缓存的设计思路是用少量的速度较快的SRAM作为CPU与DRAM存储系统之间的缓冲区起初是在芯片的外部到了80486时期这部分SRAM被集成到了芯片内因此又叫片内Cache 片内Cache即是今天的一级缓存这部分缓存的容量是很少的 486芯片内只有8KB 到了奔腾高档芯片就升级到了16KB PowerPC可达32KB 后来Pentium微处理器改进片内Cache 采用数据和双通道Cache技术非常灵活方便极大地提高了微处理器的性能 CPU产品的档次不只是可以按主频的高低划分还可以按照缓存量的不同而区分开来而且即使两款处理器的其他参数完全一致只缓存量略有出入那么这两款处理器的售价可以相差很多缓存的容量目前一般都以MB计量不同的处理器型号缓存量差别不小有的拥有1MB二级缓存而有些则可以高达12MB 而售价却差了好几倍最高可以差十几倍那么缓存对处理器的售价影响可见一斑同时也说明缓存对处理器的性能影响很大缓存工作原理当CPU要读取一个数据时首先会从缓存中查找如果找到就立即读取并送给CPU处理如果没有找到就从速度相对慢得多的内存中读取并送给CPU处理同时把这个数据所在的数据块调入缓存中可以使得以后对整块数据的读取都从缓存中进行不必再调用内存 AMDVS Intel 一般AMD的处理器相比Intel拥有更少的缓存比如速龙64X25000 缓存量为2X128KB 2X512KB 1 256MB定位在同档次的Intel奔腾E5200的缓存量只二级缓存就达到了2MBIntel的处理器性能相对更依赖缓存 1MB二级缓存的处理器要比同样架构的具有2MB二级缓存的处理器性能差很多为什么Intel的处理器更依赖缓存呢这主要在于Intel与AMD的缓存逻辑结构设计有关一般CPU读取的数据包括指令中有80 来自一级缓存对于AMD来说一二三级缓存都是用来存储CPU将要处理器的数据的因此在一级缓存中未找到命中的数据可以去二级缓存甚至三级缓存里去找而Intel的结构不是这样的 Intel一级缓存采用数据代码指令追踪缓存架构数据代码指令追踪缓存架构不直接存储CPU可以直接用的数据而且存储该部分数据的地址而这部分数据则被存储在二级缓存甚至三级缓存里这样CPU可以根据一级缓存的地址目录来在缓存里面快速找到所需要的数据因此理论上讲对于Intel处理器二级缓存和三级缓存容量越大越好一级缓存一般CPU中的一级缓存容量都很少即使是售价高昂的六核酷睿i7 980X 一级缓存也只有2X6X32KB 384KB 还不到512KB既然都是最高端的旗舰了那么为什么CPU厂商不多给这些CPU多设计些一级缓存呢前面提到了一级缓存是集成在芯片内部的因此就要占用一定的晶体管这对于核心面积有限的处理器来说更多的缓存意味着要提供更多的地方来添加这些晶体管其次更重要的是一级缓存的速度极快达几十GB S 二级缓存一般为几GB S 一级缓存比二级缓存要快一个数量级所以售价很昂贵这就极大的限制了它的容量最后缓存是处理器中的发热大户设计太大容量所带来的发热量是很可观的那么如何应对这种情况呢 CPU厂商想出的一个办法就是给缓存分级也就是引入二级缓存通俗来讲二级缓存即便是一级缓存的缓冲主要用来存储那些CPU处理时用到的一级缓存无法存储的数据三级缓存相对二级缓存也类似这样采用缓存分级可以很好的解决延时问题而且效果不亚于增加一级缓存容量成本也比较低二级缓存酷睿2系列处理器的二级缓存容量从1MB到2MB 3MB 4MB再到6MB 8MB 12MB可以说让人眼花缭乱那么为何二级缓存到了12MB就没有再增加了呢首先二级缓存属于SRAM 静态RAM 成本虽然相比一级缓存有所降低但仍然意味着较大的成本其次 SRAM虽然有着相比DRAM更高的性能但是却有它的缺点即集成度不如后者高换句话说相同容量的DRAM内存可以设计得体积较小而SRAM就需要很大的体积这对于空间寸土寸金房价高昂的CPU来说显然不能设计太大容量最后前面已经提到了给缓存分级采用多级组织可以有效降低延时提高cache的命中率三级缓存二级缓存在达到了12MB后就没有再有增加而且在增加L3缓存后容量有所降低但是处理器的性能非但没有降低反而有了更大的提升那么这又是怎么一回事呢三级缓存可以看做是二级缓存的缓冲器使用较快速的储存装置直接从较慢的内存中读取数据并进行拷贝这对于有效得降低内存的延迟大有好处粉红色部分即为三级缓存最早的L3缓存被应用在AMD发布的K6 III处理器上当时的L3缓存受限于制造工艺并没有被集成进芯片内部而是集成在主板上在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器接着就是P4EE和至强MP 酷睿i7二级缓存核心独享为什么酷睿i7的二级缓存反而随着三级缓存的采用而减少了呢仔细观察酷睿i系列处理器的架构即可发现酷睿i7处理器的二级缓存不再是采用酷睿2处理器的共享设计而是每颗核心具有自己独立的二级缓存这样就没有必要设计那么大容量的公用资源区而这一任务则交给了高达12MB的三级缓存而且三级缓存和内存一样容量越大成本越低这样将公用数据资源的任务交给L3缓存不仅同样解决了延时同时也有效降低了成本 Intel的酷睿i系列处理器在Intel的酷睿i系列处理器中三级缓存容量继续延续了酷睿2时代L2缓存容量百花齐放的局面酷睿i3 530具有4MB三级缓存酷睿i5 750具备8MB三级缓存酷睿i7 980X具有12MB三级缓存三级缓存容量随核心数的增加而增加可以简单理解为越多的核心可以应对更大的数据量处理因此更大的三级缓存就很有必要了三级缓存对处理器的性能影响到底有多大实际上三级缓存的速度相比二级缓存要慢很多但是三级缓存对于大数据量处理的贡献是很大的尤其是在一些较依赖缓存运算量较大的游戏中表现明显而且三级缓存在服务器处理器中的作用也更为明显缓存的权衡一般来讲缓存容量越大对处理器的性能提升越好但是除了前面所说的成本发热量限制等因素外缓存容量并不能纯粹的保持越大越好在实际应用中 CPU处理的数据中大多数都是0KB 128KB大小的数据 128KB 256KB的数据约有10 256KB 512KB的数据有5 512KB 1MB的数据仅有3 左右因此这对于CPU来说二级缓存容量从0KB增加到256KB对CPU性能的提高几乎是直线性的增加到512KB对CPU性能的提高就要小一些而从512KB增加到1MB 大多数情况下普通用户就很难体会到CPU性能有多大提高了经过实际测试桌面级处理器的三级缓存从2MB增加到6MB只带来大约5 的性能提升再增加带来的性能提升就更不明显了这从在多数测试中酷睿i3 530处理器都性能直追酷睿i5 750上可以看出来而且相比羿龙II四核处理器 AMD羿龙II六核处理器似乎只是增加了1MB的二级缓存三级缓存容量仍然保持在了6MB 这样合理的控制缓存容量不仅没有降低多少处理器的性能还能更好的控制处理器的成本这对于应对竞争激烈的最高形式价格战是非常有利的总结处理器的制造工艺不断进步处理器架构也不断更新缓存在处理器中将会有何种形式的调整恐怕只有两大处理器巨头的技术工程师知道了不过缓存作为CPU和内存间的缓冲器的作用在内存的速度赶上处理器速度之前是很难发生改变的 IntelCPU 笔记本电脑移动核心I3I5I7区别i3双核模拟四核心即四线程无睿频 i5双核模拟四核心即四线程除睿频技术外其他技术规格与i3相同 i7四核模拟八核心即八线程功耗大性能强 I3 i5的性能差距比i5 i7的性能差距小台式电脑Corei3i5i7区别i5 基于Nehalem架构的四核处理器采用整合内存控制器三级缓存模式 L3达到8MB 支持TurboBoost等技术 i5和i7 Bloomfield 的主要区别在于总线不采用QPI 采用的是成熟的DMI DirectMediaInterface 并且只支持双通道的DDR3内存结构上采用LGA1156接口 i7采用的是LGA1366 i5有睿频技术可以在一定情况下超频 i3可看作是Corei5的进一步精简版或阉割版 i3最大的特点是整合GPU 图形处理器即i3由CPU GPU两个核心封装而成由于整合的GPU性能有限用户想获得更好的3D性能可以外加显卡显示核心部分的制作工艺仍会是45nm I3和i5区别最大之处是i3没有睿频技术认识Clarkdale 模组化设计再建新功 CPU中塞进GPU Clarkdale是CPU史上首款整合有GPU的处理器同时也是首款采用32nm制程技术的CPU 具有开创性的历史意义在2010年1月8日英特尔正式发布了Clarkdale核心的处理器这样它与之前上市的Bloomfield核心和Lynnfied核心处理器组成了全新的Core 酷睿处理器家族即Corei7 i5 i3系列处理器形成一个完整的高中低产品线 Corei7以英特尔桌面旗舰处理器的身份统领高端消费市场 Corei5则是中端桌面处理器的领军人物 Corei3定位于Core家族入门处理器在Core品牌之后还有经典的Pentium品牌主导普通应用 Celeron系列提供入门级的解决方案 Atom处理器则是为上网本和手持设备量身定造 Clarkdale 首款32nm制程CPU 英特尔的 Tick Tock 战略众所周知制程技术微架构交替更新比如说在2008年将CPU制程技术升级到了45nm 在2009年将微架构升级到了Nehalem 在2010年伊始英特尔就非常精准地将制程提升到了32nm Clarkdale乘此东风成为首款采用32nm制程技术的处理器每两年更新一次硅制程技术 ticks 同时每两年更新一次架构 tocks Clarkdale 首款整合GPU的CPUAMD在收购ATI后首先提出了CPU与GPU融合的概念然而一直停留在纸上谈兵的阶段英特尔后发却先至发布了首款整合GPU图形单元的处理器Clarkdale Clarkdale处理器只是简单的将GPU和CPU封装在一起并没有真正达到融合一颗CPU里其实有两颗芯这样双芯独立并存的方式可能是未来很长一段时间内的主流 Clarkdale中的CPU核心是采用的32nm制程技术而GPU核心还是采用的45nm制程两个核心采用MCP Multi ChipPackage 的方式封装在一起 45nm制程的Lynnfield Corei7 800 i5 700系列处理器核心大小为296mm2 晶体管数为7 74亿个而32nm制程的Clarkdale处理器中CPUDie大小为81mm2 不含GPUDie 晶体管数为3 82亿个除了制程上的影响外 CPUDie不再包含内存控制器和PCI E控制器再加上核心和L3Cache只有Lynnfield的一半使得CPUDie的大小和晶体管数急剧减少对于GPUDie来说其大小为114mm2 晶体管数为1 77亿个 DMI DirectMediaInterface Clarkdale内核结构认识Clarkdale Core系列处理器家谱 Clarkdale平台架构英特尔对Core处理器的定位 Bloomfield核心的Corei7将是发烧级玩家的选择他们需要非常强劲的处理器性能可以灵活搭配独立显卡可以组建三通道内存一台运算速度飞快的电脑是他们追寻的理想 Lynnfield核心的Corei7 i5以替代现在的Core2Quad为已任它所面对的用户更注意性能与价格间的平衡性能不可低价格不可高鱼与熊掌并非不可得兼整合有GPU的Clarkdale核心处理器Corei5 i3将取代Core2Duo 它面向于高清HTPC市场和普通日常应用这部分用户不需要很高性能的CPU 也不需要很强游戏性能的显卡低功耗和高整合度是很多消费者的理想选择 Clarkdale整合的GPU强化了高清视频与音频输出品质如支持xvYCC标准支持DolbyTrueHD和DTS HDMA无损音频输出能够让它在HTPC市场大展身手尤其是两款Corei3处理器价格控制在千元以下受众面更广总结 Clarkdale开创CPU新纪元 32nm 处理器制程技术迈进一大步首次实现CPU整合GPU 3I 平台初具雏形 Intel五年规划从45nm到22nm从Nehalem到Haswell Westmere Nehalem微架构的改良版Clarkdale核心处理器采用的是Westmere微架构 Westmere实际上是脱胎于大名鼎鼎的Nehalem微架构并作了少少的增强设计可以看作是Nehalem的改良版 Westmere微架构最主要的改进在于增加了AES指令集SandyBridge Nehalem的继任者也是其工艺升级版从45nm进化到32nm SandyBridge将有八核心版本二级缓存仍为512KB 但三级缓存将扩容至16MB SandyBridge最大的亮点是将引入高级矢量扩展指令集简称 AVX 其重要性堪比1999年PentiumIII引入SSE Intel宣称用AVX取代SSE执行矩阵乘法等特定应用时可带来大约90 的性能提升 Haswell 第三代酷睿处理器有关SandyBridge的工艺升级版IVYBridge和架构升级版Haswell 22nm 具体架构情况不知预计Haswell会普遍使用八核心设计缓存架构会全面升级节能技术也会有很大改进预计将于2012年上半年正式亮相英特尔架构自1989年起英特尔就一直有条不紊地遵循着其称为 Tick Tock模式的新产品创新节奏即每隔一年交替推出新一代的先进制程技术和处理器微体系架构随着时间的推移我们逐渐看到了这二者在处理器整体性能表现中所起到的作用已远远超出了处理器主频和缓存技术 P5与P6架构奔腾采用P5架构这被证明是伟大的创举在英特尔的发展历史中第一代奔腾绝对是具有里程碑意义的产品这一品牌甚至沿用至今尽管第一代奔腾60的综合表现很一般甚至不比486强多少但是当主频优势体现出来之后此时所表现出来的威力令人震惊奔腾75 奔腾100及133 经典的产品一度称雄业界奔腾II 英特尔采用了专利保护的P6架构 P6架构与奔腾的P5架构最大的不同在于以前集成在主板上的二级缓存被移植到了处理器内从而大大地加快了数据读取和命中率提高了性能 NetBurst架构Netburst微架构是P6微架构的后继者第一个使用这架构的是Willamette核心于2000年推出 Willamette是第一代奔腾IV处理器所用的核心而全部的奔腾IV处理器都是使用Netburst微架构 2001年推出的Foster 至强处理器也是使用本架构同时基于奔腾IV的赛扬赛扬D 以及双核心的奔腾D 奔腾ExtremeEdition都是使用本架构 NetBurst微架构将频率提升超过了40 虽然IPC值较低但由于频率的增加弥补了不足性能频率 IPC 并且为最终用户提供了更高的整体性能和P6微架构一样英特尔NetBurst微架构凭借无序推测执行尽管分支预测算法相当精确但也不可能100 正确为了使由于分支误预测而引起的损失降到最低并使IPC均值最大化采用扩展深度流水线技术的IntelNetBurst微架构极大地减小了分支预测错误的数量并提供了从这些错误恢复的快速方法为了能使误预测引起的损失最小英特尔NetBurst微架构实现了高级动态执行引擎和一个执行跟踪缓存超流水线技术使得流水线的深度相比P6微处理器体系结构的提高了一倍不过在后来的实际应用中表明提高流水线长度之后会令执行效率大幅度降低弥补这个问题的办法只能是再次提高主频和增加二级缓存容量不过由于当时处理器工艺制成的限制导致处理器的主频的可提升空间越来越小与此同时巨大的缓存容量也是一个负担这不仅提高了成本也令发热量骤升这一点使得英特尔必须要及时地对处理器微架做出新的根本性地调整 Core微架构 2006年推出了具有革新意义的Core微架构抛弃了主频至上的处理器研发思路1 流水线效率大幅度提升2 全新的整数与浮点单元3 数据预读机制与缓存结构 Core架构的缓存系统令人印象深刻双核心Core架构的二级缓存容量高达4MB 且两个核心共享访问延迟仅12到14个时钟周期每个核心还拥有32KB的一级指令缓存和一级数据缓存访问延迟仅仅3个时钟周期 Nehalem微架构经历Core微架构的辉煌之后于2008年末推出了新的Nehalem微架构基本是建立在Core微架构的骨架上外加增添了SMT 3层Cache TLB和分支预测的等级化 IMC QPI和支持DDR3等技术比起从Pentium4的NetBurst架构到Core微架构的较大变化来说从Core微架构到Nehalem微架构的基本核心部分的变化则要小一些 1 QPI总线技术2 IMC整合内存控制器3 SMT 同步多线程 SimultaneousMulti Threading SMT 技术又重新回归到了Nehalem架构 4 全新设计的缓存体系 Nehalem的每个核心有一个私有的通用型L2 是8路联合的256KB 访问速度相当快与Core

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

存储管理 CPU究竟需要多大缓存

文档简介

温馨提示

最新文档

评论

存储管理 CPU究竟需要多大缓存

文档简介

温馨提示

最新文档

评论

相关文档