计算机组成原理第三章多层次的存贮器.ppt

上传人：油*** IP属地：浙江上传时间：2020-03-22 格式：PPT 页数：162 大小：6.60MB 积分：35 举报 版权申诉

已阅读5页，还剩157页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第三章多层次的存储器 3 1存储器概述3 2SRAM存储器3 3DRAM存储器3 4只读存储器和闪速存储器3 5并行存储器3 6Cache存储器3 7虚拟存储器3 8奔腾系列机的虚存组织 1 3 1存储器概述一个存储元可以存放一位二进制代码这个二进制代码位是存储器中最小的存储单位存储位元若干个存储位元组成一个存储单元许多存储单元组成一个存储器 3 1存储器概述 3 一存储器分类 1 按存储介质分类 1 半导体存储器 2 磁表面存储器 3 磁芯存储器 4 光盘存储器易失 TTL MOS 磁头载磁体硬磁材料环状元件激光磁光材料 4 1 存取时间与物理地址无关随机访问顺序存取存储器磁带 2 按存取方式分类 2 存取时间与物理地址有关串行访问随机存储器只读存储器直接存取存储器磁盘在程序的执行过程中可读可写在程序的执行过程中只读 5 磁盘磁带光盘高速缓冲存储器 Cache FlashMemory 存储器 3 按在计算机中的作用分类 3 1存储器概述二存储器分级结构1 目前存储器的特点是速度快的存储器价格贵容量小价格低的存储器速度慢容量大在计算机存储器体系结构设计时我们希望存储器系统的性能高价格低那么在存储器系统设计时应当在存储器容量速度和价格方面的因素作折中考虑建立了分层次的存储器体系结构如下图所示 6 3 1 2存储器分级结构 2 分级结构高速缓冲存储器简称cache 它是计算机系统中的一个高速小容量半导体存储器主存储器简称主存是计算机系统的主要存储器用来存放计算机运行期间的大量程序和数据外存储器简称外存它是大容量辅助存储器 7 3 1 2存储器分级结构分层存储器系统之间的连接关系 8 3 1 3主存储器的技术指标字存储单元存放一个机器字的存储单元相应的单元地址叫字地址字节存储单元存放一个字节的单元相应的地址称为字节地址存储容量指一个存储器中可以容纳的存储单元总数存储容量越大能存储的信息就越多 9 10 存取时间又称存储器访问时间指一次读操作命令发出到该操作完成将数据读出到数据总线上所经历的时间通常取写操作时间等于读操作时间故称为存储器存取时间存储周期指连续启动两次读操作所需间隔的最小时间通常存储周期略大于存取时间其时间单位为ns 存储器带宽单位时间里存储器所存取的信息量通常以位秒或字节秒做度量单位 3 2SRAM存储器主存内部存储器是半导体存储器根据信息存储的机理不同可以分为两类静态读写存储器 SRAM 存取速度快存储容量不如DRAM大动态读写存储器 DRAM 容量大存取速度慢一些 11 12 1 主存的基本组成 13 2 主存和CPU的联系 14 芯片容量 3 半导体存储芯片的基本结构 1K 4位 16K 1位 8K 8位 10 4 14 1 13 8 15 片选线读写控制线低电平写高电平读允许读允许写 R W 16 存储芯片片选线的作用用16K 1位的存储芯片组成64K 8位的存储器 32片 17 2 半导体存储芯片的译码驱动方式 1 单译码方式 18 N位地址寻址2n个存储单元2 2n 2根译码线 0n 01 02 03 10 12 13 1n n0 n1 n2 nn Y地址译码 X地址译码 2 双译码方式 3 2SRAM存储器一基本的静态存储元阵列1 存储位元2 三组信号线地址线数据线控制线 19 3 2SRAM存储器二基本的SRAM逻辑结构SRAM芯大多采用双译码方式以便组织更大的存储容量采用了二级译码将地址分成x向 y向两部分如图所示 20 3 2SRAM存储器读与写的互锁逻辑控制信号中CS是片选信号 CS有效时低电平门G1 G2均被打开 OE为读出使能信号 OE有效时低电平门G2开启当写命令WE 1时高电平门G1关闭存储器进行读操作写操作时 WE 0 门G1开启门G2关闭注意门G1和G2是互锁的一个开启时另一个必定关闭这样保证了读时不写写时不读 21 2114引脚图 1Kx4 地址线数据线读写控制线片选线电源线地线 22 3 2SRAM存储器三存储器的读写周期读周期读出时间taq读周期时间trc写周期写周期时间twc写时间twd存取周期读周期时间trc 写时间twd 23 24 例1 图3 5 a 是SRA的写入时序图其中R W是读写命令控制线当R W线为低电平时存储器按给定地址把数据线上的数据写入存储器请指出图3 5 a 写入时序中的错误并画出正确的写入时序图 25 解点击上图 3 3DRAM存储器 3 3 1DRAM存储位元的记忆原理SRAM存储器的存储位元是一个触发器它具有两个稳定的状态而DRAM存储器的存储位元是由一个MOS晶体管和电容器组成的记忆电路 26 单管DRAM存储器原理 27 T1 X地址译码线 C 电容用于存储电荷有电荷代表1 否则代表0 I O Y地址译码线 T2 DRAM刷新相关概念 DRAM靠电容电荷存储信息电容电荷容易泄漏需定期补充电荷以保持信息不变补充电荷的过程称为刷新过程读出是破坏性的泄漏完毕之前如不能补充电荷存储信息发生丢失信息存储到信息泄漏完毕之间必须完成刷新过程称为最大刷新周期从上一次对存储器刷新结束到下一次对整个存储器刷新结束所需要的时间称为刷新周期刷新一块芯片所需的刷新周期数由芯片矩阵的行数决定 28 3 3DRAM存储器 29 1 MOS管做为开关使用而所存储的信息1或0则是由电容器上的电荷量来体现当电容器充满电荷时代表存储了1 当电容器放电没有电荷时代表存储了0 2 图 a 表示写1到存储位元此时输出缓冲器关闭刷新缓冲器关闭输入缓冲器打开 R W为低输入数据DIN 1送到存储元位线上而行选线为高打开MOS管于是位线上的高电平给电容器充电表示存储了1 3 图 b 表示写0到存储位元此时输出缓冲器和刷新缓冲器关闭输入缓冲器打开输入数据DIN 0送到存储元位线上行选线为高打开MOS管于是电容上的电荷通过MOS管和位线放电表示存储了0 4 图 c 表示从存储位元读出1 输入缓冲器和刷新缓冲器关闭输出缓冲器读放打开 R W为高行选线为高打开MOS管电容上所存储的1送到位线上通过输出缓冲器读出放大器发送到DOUT 即DOUT 1 5 图 d 表示 c 读出1后存储位元重写1 由于 c 中读出1是破坏性读出必须恢复存储位元中原存的1 此时输入缓冲器关闭刷新缓冲器打开输出缓冲器读放打开 DOUT 1经刷新缓冲器送到位线上再经MOS管写到电容上注意输入缓冲器与输出缓冲器总是互锁的这是因为读操作和写操作是互斥的不会同时发生 DRAM刷新 DRAM靠电容电荷存储信息电容电荷容易泄漏需定期补充电荷以保持信息不变补充电荷的过程称为刷新过程读出是破坏性的泄漏完毕之前如不能补充电荷存储信息发生丢失信息存储到信息泄漏完毕之间必须完成刷新过程称为最大刷新周期从上一次对存储器刷新结束到下一次对整个存储器刷新结束所需要的时间称为刷新周期刷新一块芯片所需的刷新周期数由芯片矩阵的行数决定 30 3 3 2DRAM芯片的逻辑结构下面我们通过一个例子来看一下动态存储器的逻辑结构如图图 a 示出1M 4位DRAM芯片的管脚图其中有两个电源脚两个地线脚为了对称还有一个空脚 NC 图 b 是该芯片的逻辑结构图 31 32 与SRAM不同的是 1 增加了行地址锁存器和列地址锁存器由于DRAM存储器容量很大地址线宽度相应要增加这势必增加芯片地址线的管脚数目为避免这种情况采取的办法是分时传送地址码若地址总线宽度为10位先传送地址码A0 A9 由行选通信号RAS打入到行地址锁存器然后传送地址码A10 A19 由列选通信号CRS打入到列地址锁存器芯片内部两部分合起来地址线宽度达20位存储容量为1M 4位 33 与SRAM不同的是 2 增加了刷新计数器和相应的控制电路 DRAM读出后必须刷新而未读写的存储元也要定期刷新而且要按行刷新所以刷新计数器的长度等于行地址锁存器刷新操作与读写操作是交替进行的所以通过2选1多路开关来提供刷新行地址或正常读写的行地址 3 3 3读写周期刷新周期读周期写周期的定义是从行选通信号RAS下降沿开始到下一个RAS信号的下降沿为止的时间也就是连续两个读周期的时间间隔通常为控制方便读周期和写周期时间相等 34 3 3DRAM存储器刷新周期 DRAM存储位元是基于电容器上的电荷量存储这个电荷量随着时间和温度而减少因此必须定期地刷新以保持它们原来记忆的正确信息刷新操作有两种刷新方式集中式刷新分散式刷新异步式刷新 35 集中刷新方式 36 2ms内集中安排所有刷新周期用在实时要求不高的场合分散刷新方式 37 各刷新周期分散安排在存取周期中用在低速系统中异步刷新方式 38 各刷新周期分散安排在2ms内每隔一段时间刷新一行每隔15 5微秒提一次刷新请求刷新一行 2毫秒内刷新完所有行用在大多数计算机中 2ms 128行 15 5微秒 3 3DRAM存储器 3 3 4 存储器容量的扩充给定的芯片字长位数较短不满足设计要求的存储器字长此时需要用多片给定芯片扩展字长位数三组信号线中地址线和控制线公用而数据线单独分开连接 d 设计要求的存储器容量选择芯片存储器容量例2 利用1M 4位的SRAM芯片设计一个存储容量为1M 8位的SRAM存储器解所需芯片数量 1M 8 1M 4 2片 39 3 3DRAM存储器 40 例存贮器的位扩展用2114存储芯片组成1K 8位的存储器 1 位数扩展 41 用2114存储芯片组成1K 8位的存储器 2片 2 字存储容量扩展给定的芯片存储容量较小字数少不满足设计要求的总存储容量此时需要用多片给定芯片来扩展字数三组信号组中给定芯片的地址总线和数据总线公用控制总线中R W公用使能端EN不能公用它由地址总线的高位段译码来决定片选信号所需芯片数仍由 d 设计要求的存储器容量选择芯片存储器容量决定例3 利用1M 8位的DRAM芯片设计2M 8位的DRAM存储器解所需芯片数d 2M 8 1M 8 2 片 42 举例用1K 8位存储芯片组成2K 8位的存储器 43 用1K 8位存储芯片组成2K 8位的存储器 2片主存储器与CPU的连接 44 D0 D1 WEACS2K 2D0D1 举例 2Kx2 2Kx8 字长位扩展 DBUS 2Kx2 2Kx8 45 A10 0 D1D0 D7D6 D5D4 D3D2 字数字扩展 ABUS 8Kx8 32Kx8 46 A14 13 A12 0 WEACS8K 8D WEACS8K 8D WEACS8K 8D WEACS8K 8D 综合扩展8Kx8 32Kx32 47 11 2 4译码 10 01 00 A14 13 A12 0 A12 0 OE MREQ R W CPU D31 D0 D31 D0 D31 D0 D31 D0 D31 D0 WEACS8Kx84片D WEACS8Kx84片D WEACS8Kx84片D WEACS8Kx84片D 各芯片地址范围 48 8位 8K 8K 8K 8K 1 2 3 4 D7D6 D1D0 3 3DRAM存储器 3 存储器模块条存储器通常以插槽用模块条形式供应市场这种模块条常称为内存条它们是在一个条状形的小印制电路板上用一定数量的存储器芯片组成一个存储容量固定的存储模块如图所示内存条有30脚 72脚 100脚 144脚 168脚等多种形式 30脚内存条设计成8位数据线存储容量从256KB 32MB 72脚内存条设计成32位数据总线100脚以上内存条既用于32位数据总线又用于64位数据总线存储容量从4MB 512MB 49 六高级的DRAM结构1 FPMDRAM 快速页模式动态存储器它是根据程序的局部性原理来实现的 50 2 CDRAM带高速缓冲存储器 cache 的动态存储器它是在通常的DRAM芯片内又集成了一个小容量的SRAM 从而使DRAM芯片的性能得到显著改进如图所示出1M 4位CDRAM芯片的结构框图其中SRAM为512 4位 51 52 3 3DRAM存储器 SDRAM同步型动态存储器计算机系统中的CPU使用的是系统时钟 SDRAM的操作要求与系统时钟相同步在系统时钟的控制下从CPU获得地址数据和控制信息换句话说它与CPU的数据交换同步于外部的系统时钟信号并且以CPU 存储器总线的最高速度运行而不需要插入等待状态其原理和时序关系见下一页图和动画 53 54 3 3DRAM存储器例4 CDRAM内存条组成实例一片CDRAM的容量为1M 4位 8片这样的芯片可组成1M 32位4MB的存储模块其组成如下图所示 55 56 3 3DRAM存储器七 DRAM主存读写的正确性校验DRAM通常用做主存储器其读写操作的正确性与可靠性至关重要为此除了正常的数据位宽度还增加了附加位用于读写操作正确性校验增加的附加位也要同数据位一起写入DRAM中保存其原理如图所示 57 3 4只读存储器和闪速存储器一只读存储器ROM叫做只读存储器顾名思义只读的意思是在它工作时只能读出不能写入然而其中存储的原始数据必须在它工作以前写入只读存储器由于工作可靠保密性强在计算机系统中得到广泛的应用主要有两类掩模ROM 掩模ROM实际上是一个存储内容固定的ROM 由生产厂家提供产品可编程ROM 用户后写入内容有些可以多次写入一次性编程的PROM多次编程的EPROM和E2PROM 58 3 4只读存储器和闪速存储器 1 掩模ROM掩模ROM的阵列结构和存储元 59 3 4只读存储器和闪速存储器掩模ROM的逻辑符号和内部逻辑框图 60 2 可编程ROMPROM 61 一次编程 3 4只读存储器和闪速存储器 3 可编程ROMEPROM叫做光擦除可编程可读存储器它的存储内容可以根据需要写入当需要更新时将原存储内容抹去再写入新的内容 62 这种EPROM出厂时为全 1 状态使用者可根据需要写 0 EPROM允许多次重写抹去时用40W紫外灯相距2cm 照射几分钟即可 EPROM 63 高压写入紫外线光照擦除编程器 64 紫外线擦除器 65 3 4只读存储器和闪速存储器 E2PROM存储元EEPROM 叫做电擦除可编程只读存储器其存储元是一个具有两个栅极的NMOS管如图 a 和 b 所示 G1是控制栅它是一个浮栅无引出线 G2是抹去栅它有引出线在G1栅和漏极D之间有一小面积的氧化层其厚度极薄可产生隧道效应如图 c 所示当G2栅加20V正脉冲P1时通过隧道效应电子由衬底注入到G1浮栅相当于存储了 1 利用此方法可将存储器抹成全 1 状态 66 3 4只读存储器和闪速存储器这种存储器在出厂时存储内容为全 1 状态使用时可根据要求把某些存储元写 0 写 0 电路如图 d 所示漏极D加20V正脉冲P2 G2栅接地浮栅上电子通过隧道返回衬底相当于写E2PROM读出时的电路如图 e 所示这时G2栅加3V电压若G1栅有电子积累 T2管不能导通相当于存 1 若G1栅无电子积累 T2管导通相当于存 0 67 3 4只读存储器和闪速存储器 4 闪速存储器FLASH存储器也翻译成闪速存储器它是高密度非失易失性的读写存储器高密度意味着它具有巨大比特数目的存储容量非易失性意味着存放的数据在没有电源的情况下可以长期保存总之它既有RAM的优点又有ROM的优点称得上是存储技术划时代的进展 68 闪速存储器FlashMemory 在不加电的情况下可长期保持存储的信息本质上属于EEPROM 既有ROM的特点又有很高的存取速度而且易于擦除和重写功耗很小存放BIOS 升级方便 69 3 4只读存储器和闪速存储器 FLASH存储元在EPROM存储元基础上发展起来的由此可以看出创新与继承的关系如右图所示为闪速存储器中的存储元由单个MOS晶体管组成除漏极D和源极S外还有一个控制栅和浮空栅 70 3 4只读存储器和闪速存储器 0 状态当控制栅加上足够的正电压时浮空栅将储存许多电子带负电这意味着浮空栅上有很多负电荷这种情况我们定义存储元处于0状态 1 状态如果控制栅不加正电压浮空栅则只有少许电子或不带电荷这种情况我们定义为存储元处于1状态浮空栅上的电荷量决定了读取操作时加在栅极上的控制电压能否开启MOS管并产生从漏极D到源极S的电流 71 3 4只读存储器和闪速存储器编程操作实际上是写操作所有存储元的原始状态均处 1 状态这是因为擦除操作时控制栅不加正电压编程操作的目的是为存储元的浮空栅补充电子从而使存储元改写成 0 状态如果某存储元仍保持 1 状态则控制栅就不加正电压如图 a 表示编程操作时存储元写0 写1的情况实际上编程时只写0 不写1 因为存储元擦除后原始状态全为1 要写0 就是要在控制栅C上加正电压一旦存储元被编程存储的数据可保持100年之久而无需外电源 72 3 4只读存储器和闪速存储器读取操作控制栅加上正电压浮空栅上的负电荷量将决定是否可以开启MOS晶体管如果存储元原存1 可认为浮空栅不带负电控制栅上的正电压足以开启晶体管如果存储元原存0 可认为浮空栅带负电控制栅上的正电压不足以克服浮动栅上的负电量晶体管不能开启导通当MOS晶体管开启导通时电源VD提供从漏极D到源极S的电流读出电路检测到有电流表示存储元中存1 若读出电路检测到无电流表示存储元中存0 如图 b 所示 73 3 4只读存储器和闪速存储器擦除操作所有的存储元中浮空栅上的负电荷要全部洩放出去为此晶体管源极S加上正电压这与编程操作正好相反见图 c 所示源极S上的正电压吸收浮空栅中的电子从而使全部存储元变成1状态 74 3 4只读存储器和闪速存储器 FLASH存储器的阵列结构FLASH存储器的简化阵列结构如右图所示在某一时间只有一条行选择线被激活读操作时假定某个存储元原存1 那么晶体管导通与它所在位线接通有电流通过位线所经过的负载上产生一个电压降这个电压降送到比较器的一个输入端与另一端输入的参照电压做比较比较器输出一个标志为逻辑1的电平如果某个存储元原先存0 那么晶体管不导通位线上没有电流比较器输出端则产生一个标志为逻辑0的电平 75 例4某计算机的主存地址空间中从地址0 x0000到3FFF为ROM存储区域从0 x4000到0 x5FFF为保留地址区域暂时不用从0 x6000到0 xFFFF为RAM地址区域 RAM的控制信号为CS 和WE CPU的地址线为A15 A0 数据线为8位的线路D7 D0 控制信号有读写控制R W 和访存请求MREQ 要求 1 如果ROM和RAM存储器芯片都采用8K 1的芯片试画出存储器与CPU的连接图 2 如果ROM存储器芯片采用8K 8的芯片 RAM存储器芯片采用4K 8的芯片试画出连接图 3 如果ROM存储器芯片采用16K 8的芯片 RAM存储器芯片采用4K 8的芯片试画出连接图 76 解 8KB的存储区域可以用8片存储器芯片构成一组实现 8K 1的存储器芯片的地址线需要13条即A12 0 0 x0000到0 x3FFF为ROM存储区域从0 x4000到0 x5FFF为保留地址区域暂时不用从0 x6000到0 xFFFF为RAM地址区域 CPU访问0 0 xFFFF的地址空间需要地址线16根为A15 A0 数据线为8位的线路D7 D0 77 78 0 x0000 0 x3FFF16K 8ROM 0 x4000 0 x5FFF8K 8RESERVED 0 x6000 0 xFFFF40K 8RAM 1 ROM和RAM采用8K 1的芯片 79 A15 13 A12 0 80 A15 13 A12 0 WEACS8Kx81片ROMD WEACS8Kx81片ROMD 2 RAM采用4K 8位的芯片 81 A15 13 A12 0 D7 D0 D7 D0 D7 D0 3 ROM采用16K 8位的芯片 WEACS16Kx81片ROMD A13 0 1 3 5并行存储器由于CPU和主存储器之间在速度上是不匹配的这种情况便成为限制高速计算机设计的主要问题为了提高CPU和主存之间的数据传输率除了主存采用更高速的技术来缩短读出时间外还可以采用并行技术的存储器 82 3 5并行存储器解决途径多个存储器并行工作并行访问和交叉访问设置各种缓冲器通用寄存器采用分层的存储系统Cache 第6节虚拟存储系统第9章 83 3 5并行存储器一双端口存储器1 双端口存储器的逻辑结构双端口存储器由于同一个存储器具有两组相互独立的读写控制电路而得名由于进行并行的独立操作因而是一种高速工作的存储器在科研和工程中非常有用 84 双端口存储器具有两组相互独立的读写控制线路的存储器两组读写控制线路可以并行操作当两个端口地址不相同无冲突可以并行存取端口地址相同发生读写冲突无法并行存取 85 存储体 A0 10 L D0 15 L BUSYL R WL A0 10 R D0 15 R BUSYR R WR 86 双端口存储器IDT7133的逻辑框图如下图 3 5并行存储器 2 无冲突读写控制当两个端口的地址不相同时在两个端口上进行读写操作一定不会发生冲突当任一端口被选中驱动时就可对整个存储器进行存取每一个端口都有自己的片选控制 CE 和输出驱动控制 OE 读操作时端口的OE 低电平有效打开输出驱动器由存储矩阵读出的数据就出现在I O线上 3 有冲突读写控制当两个端口同时存取存储器同一存储单元时便发生读写冲突为解决此问题特设置了BUSY标志在这种情况下片上的判断逻辑可以决定对哪个端口优先进行读写操作而对另一个被延迟的端口置BUSY标志 BUSY变为低电平即暂时关闭此端口 87 3 5并行存储器 4 有冲突读写控制判断方法 1 如果地址匹配且在CE之前有效片上的控制逻辑在CEL和CER之间进行判断来选择端口 CE判断 2 如果CE在地址匹配之前变低片上的控制逻辑在左右地址间进行判断来选择端口地址有效判断无论采用哪种判断方式延迟端口的BUSY标志都将置位而关闭此端口而当允许存取的端口完成操作时延迟端口BUSY标志才进行复位而打开此端口 88 3 5 1双端口存储器 89 3 5并行存储器二多模块交叉存储器一个由若干个模块组成的主存储器是线性编址的这些地址在各模块中如何安排有两种方式一种是顺序方式一种是交叉方式 90 3 5并行存储器假设有n个存储体每个存储体的容量为m个存储单元顺序方式 91 3 5并行存储器 1 顺序方式例 M0 M3共四个模块则每个模块8个字顺序方式 M0 0 7M1 8 15M2 16 23M3 24 315位地址组织如下 XXXXX高位选模块低位选块内地址特点某个模块进行存取时其他模块不工作优点是某一模块出现故障时其他模块可以照常工作通过增添模块来扩充存储器容量比较方便缺点是各模块串行工作存储器的带宽受到了限制 92 3 5并行存储器 2 交叉方式可以实现多模块流水式并行存取 93 3 5并行存储器例 M0 M3共四个模块则每个模块8个字交叉方式 M0 0 4 除以4余数为0M1 1 5 除以4余数为1M2 2 6 除以4余数为2M3 3 7 除以4余数为35位地址组织如下 XXXXX高位选块内地址低位选模块特点连续地址分布在相邻的不同模块内同一个模块内的地址都是不连续的优点是对连续字的成块传送可实现多模块流水式并行存取大大提高存储器的带宽使用场合为成批数据读取 94 3 5并行存储器 3 多模块交叉存储器的基本结构右图为四模块交叉存储器结构框图主存被分成4个相互独立容量相同的模块M0 M1 M2 M3 每个模块都有自己的读写控制电路地址寄存器和数据寄存器各自以等同的方式与CPU传送信息在理想情况下如果程序段或数据块都是连续地在主存中存取那么将大大提高主存的访问速度 95 3 5并行存储器存储器周期T 总线传送周期存储器的交叉模块数为m 取启动间隔为m T m为交叉存取度整个存储器的存取速度有望提高n倍连续读出m个字的时间为采用顺序方式存贮器时 96 t1 T m 1 97 低位交叉的特点在不改变存取周期的前提下增加存储器的带宽启动存储体0 启动存储体1 启动存储体2 启动存储体3 例5设存储器容量为32字字长64位模块数m 4 分别用顺序方式和交叉方式进行组织存储周期T 200ns 数据总线宽度为64位总线传送周期 50ns 若连续读出4个字问顺序存储器和交叉存储器的带宽各是多少 98 解顺序存储器和交叉存储器连续读出m 4个字的信息总量都是 q 64b 4 256b顺序存储器和交叉存储器连续读出4个字所需的时间分别是 t2 mT 4 200ns 800ns 8 10 7st1 T m 1 200ns 3 50ns 350ns 3 5 10 7s顺序存储器和交叉存储器的带宽分别是 W2 q t2 256b 8 10 7 s 320Mb sW1 q t1 256b 3 5 10 7 s 730Mb s 99 二模块交叉存储器举例 100 二模块交叉存储器举例 101 程序局部性程序局部性的实质是程序在某段时间内仅需要访问内存很小一部分空间 102 3 6Cache存储器 3 6Cache存储器 1 基本原理 1 功能解决CPU和主存之间的速度不匹配问题一般采用高速的SRAM构成 CPU和主存之间的速度差别很大采用两级或多级Cache系统早期的一级Cache在CPU内二级在主板上现在的CPU内带L1Cahe和L2Cahe全由硬件调度对用户透明 103 3 6Cache存储器 104 105 Cache的读写操作读 4 3 3 6Cache存储器 2 cache基本原理地址映射如需访问的数据在cache中存放在什么地方替换策略 Cache满了以后如何处理写一致性如何保证cache与memory的一致性数据查找如何判断一个数据在cache中性能评价 106 3 6Cache存储器 2 cache基本原理地址映射替换策略写一致性性能评价 107 3 6Cache存储器 cache基本原理小结 cache是介于CPU和主存M之间的小容量存储器但存取速度比主存快主存容量配置几百MB的情况下 cache的典型值是几百KB cache能高速地向CPU提供指令和数据从而加快了程序的执行速度从功能上看它是主存的缓冲存储器由高速的SRAM组成为追求高速包括管理在内的全部功能由硬件实现因而对程序员是透明的 108 3 6Cache存储器 cache基本原理小结 Cache的设计依据 CPU这次访问过的数据下次有很大的可能也是访问附近的数据 CPU与Cache之间的数据传送是以字为单位主存与Cache之间的数据传送是以块为单位CPU读主存时便把地址同时送给Cache和主存 Cache控制逻辑依据地址判断此字是否在Cache中若在此字立即传送给CPU 否则则用主存读周期把此字从主存读出送到CPU 与此同时把含有这个字的整个数据块从主存读出送到cache中 109 3 6Cache存储器 3 Cache的命中率从CPU来看增加一个cache的目的就是在性能上使主存的平均读出时间尽可能接近cache的读出时间为了达到这个目的在所有的存储器访问中由cache满足CPU需要的部分应占很高的比例即cache的命中率应接近于1 由于程序访问的局部性实现这个目标是可能的 110 3 6Cache存储器在一个程序执行期间设Nc表示cache完成存取的总次数 Nm表示主存完成存取的总次数 h定义为命中率则有h Nc Nc Nm 若tc表示命中时的cache访问时间 tm表示未命中时的主存访问时间 1 h表示未命中率则cache 主存系统的平均访问时间ta为 111 我们追求的目标是以较小的硬件代价使cache 主存系统的平均访问时间ta越接近tc越好 ta h tc 1 h tm 3 6Cache存储器设r tm tc表示主存慢于cache的倍率 e表示访问效率则有e tc ta tc h tc 1 h tm 1 h 1 h r 1 r 1 r h 由表达式看出为提高访问效率命中率h越接近1越好 r值以5 10为宜不宜太大命中率h与程序的行为 cache的容量组织方式块的大小有关 112 例6CPU执行一段程序时 cache完成存取的次数为1900次主存完成存取的次数为100次已知cache存取周期为50ns 主存存取周期为250ns 求cache 主存系统的效率和平均访问时间 113 公式 114 命中率Cache 主存系统的平均访问时间访问效率Cache与内存的速度比例6解 h Nc Nc Nm 1900 1900 100 0 95r tm tc 250ns 50ns 5e 1 r 1 r h 1 5 1 5 0 95 83 3 ta tc e 50ns 0 833 60ns 115 3 6 2主存与cache的地址映射 116 第0块第0块第1块第n 1块 L0 L1 Lm 1 Cache 主存如何进行地址映射 3 6 2主存与Cache的地址映射无论选择那种映射方式都要把主存和cache划分为同样大小的块选择哪种映射方式要考虑硬件是否容易实现地址变换的速度是否快主存空间的利用率是否高主存装入一块时发生冲突的概率以下我们介绍三种映射方法 117 一全相联的映射方式映射方法多对多主存内容可以拷贝到任意行地址变换标记实际上构成了一个目录表 118 Cache的数据块行用Li表示 i 0 1 2 m 1 共有m 2r行主存的数据块快 Bj表示 j 0 1 2 n 1 共有n 2s块行和快等大小由k 2w个连续的字组成字 CPU访问存贮器时可存取的最小单位一全相联的映射方式 1 将地址分为两部分块号和字地址在内存块写入Cache时同时写入块号标记 2 CPU给出访问地址后也将地址分为两部分块号和字地址比较电路块号与Cache表中的标记进行比较相同表示命中访问相应单元如果没有命中访问内存 CPU直接访问内存并将被访问内存的相对应块写入Cache 119 Cache全相联映射 120 第0块第0块第1块 L0 L1 Lm 1 Cache 主存主存中任何一块均可定位于Cache中的任意一块可提高命中率但是硬件开销增加一全相联的映射方式 121 cache全相联映射地址变换 122 块号比较快存主存主存地址未命中块表命中块内地址一全相联的映射方式 3 特点优点冲突概率小 Cache的利用高缺点比较器难实现需要一个访问速度很快代价高的相联存储器4 应用场合适用于小容量的Cache 123 二直接映射方式 1 映射方法多对一 Cache的行号i和主存的块号j有如下关系 i jmodm m为Cache的总行数主存第j块内容拷贝到Cache的i行例 cache为8行主存为256块则cache的L0行中允许放的主存快为B0 B8 B248 如果第一次B0在cache中下次访问B8 则不管cache其他位置的内容访问情况都会引起块内容的替换 124 Cache直接相联映射 125 第0块第0块第0区第1块 Cache 主存第1区第2区主存分割成若干个与cache大小相同的区Cache块号i 共m块主存块号j i jmodm 二直接映射方式 2 基本原理利用行号选择相应行把行标记与CPU访问地址进行比较相同表示命中访问Cache 如果没有命中访问内存并将相应块写入Cache 126 二直接映射方式 3 特点优点比较电路少m倍线路所以硬件实现简单缺点冲突概率高抖动 4 应用场合适合大容量Cache 127 三组相联映射方式前两者的组合Cache分组组间采用直接映射方式组内采用全相联的映射方式Cache分组U组 V行映射方法q jmodu主存第j块内容拷贝到Cache的q组中的某行地址变换 128 Cache组相联映射 129 第0块第0组 Cache 主存第1组组0 组1 第0区第2组第3组第1区 Cache分u组每组v块 q jmodu 3 组相联映射方式分析比全相联容易实现冲突低v 1 则为直接相联映射方式u 1 则为全相联映射方式v的取值一般比较小一般是2的幂称之为v路组相联cache 130 131 例7直接映射方式的内存地址格式如下所示 8位14位2位若主存地址用十六进制表示为BBBBBB 用十六进制格式表示直接映射方式Cache的标记行字地址的值解 BBBBBB 16 101110111011101110111011标记s r 10111011 BB 16行r 10111011101110 2EEE 16字地址W 11 3 16 132 例8一个组相联Cache由64个行组成每组4行每块128字请表示内存地址的格式解块大小行大小 2w个字 27 w 764个行组成每组4行 16个组 d 4主存贮器包含4K个块 s 12标记大小 s d 12 4 8主存地址长度s w 19 8位4位7位 133 例9一个处理器字长1B 块大小16B Cache容量64KB Cache采用全相联映射对内存地址 B0010 给出相应的标记和字号解块大小行大小 16 w 4主存容量1MB s w 20 s 16 16位4位对于内存地址 B0010 16 10110000000000010000 2对应的标记s 1011000000000001 字地址w 0000 3 6 3替换策略 LFU 最不经常使用被访问的行计数器增加1 换值小的行不能反映近期cache的访问情况 LRU 近期最少使用被访问的行计数器置0 其他的计数器增加1 换值大的行符合cache的工作原理 134 Cache最不经常使用算法 LFU 135 22 11 22 19 11 16 4 载入载入命中载入命中载入替换 t 220 110 111 160 221 190 4 22 命中 222 Cache近期最久未使用算法 LRU 136 22 11 22 19 7 16 4 3 载入载入命中载入载入替换替换替换 t 220 110 70 160 220 190 40 30 3 6 3替换策略随机替换随机替换策略实际上是不要什么算法从特定的行位置中随机地选取一行换出即可这种策略在硬件上容易实现且速度也比前两种策略快缺点是随意换出的数据很可能马上又要使用从而降低命中率和cache工作效率但这个不足随着cache容量增大而减小随机替换策略的功效只是稍逊于前两种策略 137 3 6 4写操作策略由于cache的内容只是主存部分内容的拷贝它应当与主存内容保持一致而CPU对cache的写入更改了cache的内容如何与主存内容保持一致可选用如下三种写操作策略写回法换出时对行的修改位进行判断决定是写回还是舍掉全写法写命中时 Cache与内存一起写写一次法与写回法一致但是第一次Cache命中时采用全写法 138 Cache全相联映射写命中 139 第0块第0块第1块 2 3 4 5 6 7 8 9 126 3 9 5 Cache 主存 126 比较器命中输入输出寄存器输入输出寄存器全写法 writethrough 写回法 writeback 126 Cache全相联映射写失效 140 第0块第0块第1块 2 3 4 5 6 7 8 9 1 3 9 5 Cache 主存 126 比较器未命中输入输出寄存器 126 WTWAWTNWA 141 Cache的改进 1 增加Cache的级数片载片内 Cache 片外Cache 2 统一缓存和分立缓存指令Cache 数据Cache 与主存结构有关与指令执行的控制方式有关是否流水 Pentium8K指令Cache8K数据Cache PowerPC62032K指令Cache32K数据Cache 3 6 5PentiumPC的Cache 基本原理见下图 142 3 6 5PentiumPC的Cache 1 主要包括四个部分取指译码单元顺序从L2cache中取程序指令将它们译成一系列的微指令并存入L1指令cache中乱序执行逻辑依据数据相关性和资源可用性调度微指令的执行因而微指令可按不同于所取机器指令流的顺序被调度执行执行单元它执行微指令从L1数据cache中取所需数据并在寄存器组中暂存运算结果存储器子系统这部分包括L2cache L3cache和系统总线未命中时使用系统总线访问主存系统总线还用于访

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

计算机组成原理第三章多层次的存贮器.ppt

文档简介

温馨提示

最新文档

评论

计算机组成原理第三章 多层次的存贮器.ppt

文档简介

温馨提示

最新文档

评论

相关文档

计算机组成原理第三章多层次的存贮器.ppt