第5章存储系统.ppt

上传人：油*** IP属地：浙江上传时间：2020-03-22 格式：PPT 页数：142 大小：3.25MB 积分：35 举报 版权申诉

已阅读5页，还剩137页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第五章存储系统 5 1存储器的分类与性能评价 5 2存储系统的层次结构 5 3半导体存储器 5 6虚拟存储器 5 4主存储器 5 5高速缓冲存储器一存储器分类 1 按存储介质分类 1 半导体存储器 2 磁表面存储器 3 磁芯存储器 4 光盘存储器易失 TTL MOS 磁头载磁体硬磁材料环状元件激光磁光材料 5 1存储器的分类与性能评价 1 存取时间与物理地址无关随机访问顺序存取存储器磁带 2 按存取方式分类 2 存取时间与物理地址有关串行访问随机存储器只读存储器直接存取存储器磁盘在程序的执行过程中可读可写在程序的执行过程中只读磁盘磁带光盘高速缓冲存储器 Cache FlashMemory 存储器 3 按在计算机中的作用分类 1 存储容量存放二进制信息的数量存储容量存储单元个数存储字长按字字节数按字节编址目前计算机的存储容量大多以字节数来表示地址线数目为n 存储容量 2nB 2 存取速度一般采用两种参数描述a 存取时间 TA 指从CPU给出有效地址启动一次存取读写操作到该操作完成所需的时间读写分别为TAR TAW b 存取周期 Tmc 指连续两次存储器操作之间的最小时间间隔略大于TA 二存储器的性能评价 3 带宽每秒从存储器进出的最大信息量存取周期反映存储器的带宽例 TMC 100ns8位数据带宽为1 100ns 8b 80Mb s 提高存储器的带宽的途径a 缩短存取周期指制造工艺方面 TTL为10ns MOS为100nsb 增加储字长c 增加存储体 4 成本也称价格一般有两个指标存储系统总的拥有成本和每存储位的成本前者指构成整个计算机存储系统的所有存储器件及相关设备的购买总成本后者等于存储芯片的容量位除以存储芯片的价格 5 2存储系统的层次结构一存储器访问的局部性原理经过对处理器访问主存储器情况的统计发现无论是取指令还是存取数据处理器访问的存储单元趋向于聚集在一个相对较小的连续存储单元区域内这种现象称为存储器访问的局部性原理访问局部性表现为时间局部性和空间局部性时间局部性是指将要访问的信息就是现在正在访问的信息空间局部性是指将要用到的信息就在正使用的信息旁边二层次结构的存储系统用户对存储系统的要求一般是相同的容量大速度快价格低在现有存储器工艺技术水平下上述要求无法满足容量大的存储器在速度上通常要比容量小的存储器慢速度快的存储器在价格上通常要比速度慢的存储器贵为了解决这种问题选用生产与运行成本不同的存储容量不同的读写速度不同的多种存储介质按一定的层次结构组织成一个统一的存储器系统使每种介质都处于不同的地位发挥不同的作用充分发挥各自在速度容量成本方面的优势从而综合达到最优性能价格比即把这样一个存储器组织作为一个整体看具有容量大速度快位价低的综合指标这样一个存储整体称为存储系统高小快存储器三个主要特性的关系 1 通用寄存器组处于CPU内部为执行指令方便而设通常由几个十几个几十个寄存器组成各种机器不等其速度最快容量最小位价最高但由于容量太小并不被看成是独立的存储级 2 主存是存储系统的核心是计算机自动高速运行程序必不可少的功能部件是计算机传统的五大部件之一因此计算机对主存的要求是比较高的但在目前的存储技术水平下主存只能做到容量比较大速度比较快位价适中仍然远远满足不了CPU运行程序的要求 3 高速缓存 Cache 为平滑主存与CPU之间的速度之差加速CPU访存的速度在性能较好的计算机中主存与CPU之间增加一个缓冲存储器其容量比通用寄存器组大得多比主存小得多速度接近CPU 位价介于寄存器与主存之间Cache与主存一起构成内存寄存器 Cache 主存由不同指标的半导体存储器实现 4 辅助存储器外部存储器为了存放大量备用的程序和数据在主机之外设置了一级辅助存储器其容量比主存大得多速度比主存慢得多但位价也便宜得多辅存通常由磁表面存储器实现目前大多数计算机使用磁盘但由于磁盘的容量实际上也有限因此有些系统使用磁带等速度更低容量更大磁带等设备带盘可换容量可无限延伸的磁表面存储器作为硬盘的后备由于辅存与主机的连接方式和I O设备相同因此主机通常以I O管理方式管理外存三缓存主存层次和主存辅存层次虚拟存储器虚地址逻辑地址实地址物理地址主存储器速度容量 1 Cache 主存层次根据程序运行的局部性原理可以在计算机运行程序时通过合理的调度将当前使用最多的一小段程序和数据放在Cache中使CPU大部分时间访问高速缓存Cache 只有个别的指令或数据从缓存中读不到需要到主存去取这样从整体运行的效果分析 CPU访存速度接近于Cache的速度而寻址空间和位价却接近于主存 2 主存辅存层次为了更好地对主存辅存统一调度目前广泛采用虚拟存储技术即将主存与辅存的一部份通过软硬结合的技术组成虚拟存储器程序员可使用这个比主存实际空间大得多的虚拟地址空间编程当程序运行时再由软硬件自动完成虚拟地址空间与主存实际物理空间的转换这个转换操作对于程序员来说是透明的因此从程序员的角度看他所使用的存储器其容量和位价接近于辅存而速度接近于主存各级存储器存放的信息必须能够满足两个基本原则 1 一致性原则同一个信息在各级存储器中必须保持相同的值 2 包含性原则处在内层更靠近CPU 存储器中的信息一定包含在各外层的存储器中通过采用层次结构结合软硬件技术从整个存储系统来看就达到了速度快容量大位价低的优化效果 5 3半导体存储器根据存储的信息是否可以读写半导体存储器分为随机访问半导体存储器 RAM 和只读半导体存储器 ROM 1 半导体存储芯片的基本结构芯片容量 1K 4位 16K 1位 10 4 14 1 2 半导体存储芯片的译码驱动方式 1 线选法单译码方式线选法的特点 a 译码结构简单速度快但器材用量大 n根地址线需2n套驱动器当容量较大时导致成本太高仅适合于高速小容量存储器 b 并行输入输出数据I O 按多位字节组织 2 重合法双译码方式 0 0 重合法的特点 a 与线选法相比大大减少了译码输出线根数则器材用量也大大减少有效地降低了存储器的成本适用于大容量存储芯片b 数据位I O 按位组织 5 3 1随机访问半导体存储器RAM 1 SRAM 一 SRAM的分类 SRAM采用的开关元件有两种双极型 MOS型驱动能力强开关速度快存取周期短速度快成本高功耗大 MOS管的逻辑符号如下图所示当控制端W为高电位时 MOS管导通即R点与VCC同电位二静态RAM SRAM 1 静态RAM基本电路 A 触发器非端 A触发器原端 T1 T4 T1 T2 T3 T4 T5 T6 X 行地址选位线A 位线 A Vcc MOS六管静态存储单元 A 静态RAM基本电路的读操作静态RAM基本电路的写操作 2 静态RAM芯片举例 Intel2114外特性存储容量1K 4位 3 静态RAM读时序 4 静态RAM 2114 写时序 1 动态RAM基本单元电路三动态RAM DRAM 读出与原存信息相反读出时数据线有电流为 1 写入与输入信息相同写入时CS充电为 1 放电为 0 T 无电流有电流 2 动态RAM芯片举例三管动态RAM芯片 Intel1103 读读写控制电路三管动态RAM芯片 Intel1103 写三管动态RAM芯片 Intel1103 写三管动态RAM芯片 Intel1103 写三管动态RAM芯片 Intel1103 写三管动态RAM芯片 Intel1103 写三管动态RAM芯片 Intel1103 写三管动态RAM芯片 Intel1103 写读写控制电路三管动态RAM芯片 Intel1103 写读写控制电路三管动态RAM芯片 Intel1103 写读写控制电路 2 单管DRAM芯片2116 16K 1位 4 2 DOUT 4116芯片结构 2116 16K 1位芯片读原理 63 0 0 0 2116 16K 1位芯片写原理 63 0 3 动态RAM时序行列地址分开传送写时序数据DOUT有效数据DIN有效读时序注意由于DRAM芯片容量较大导致地址引脚数大幅度增加造成制作困难为此将地址分为行列地址两部分分时使用同一组地址引脚输入输入时间分别由信号控制因此DRAM芯片地址引脚数将减少一半这同样意味着 DRAM芯片每增加一根地址引脚相当于行列地址各增加一位共增加了两位地址将允许片容量扩大4倍 4 动态RAM刷新为什么要使用刷新破坏性读出电容漏电再生读操作后被读单元的内容被清为零必须把刚读出的内容立即写回去通常称其为再生它影响存储器的工作频率在再生结束前不能开始下一次读读放大器同时又是再生放大器利用双稳态结构在读出过程中建立起稳态然后该稳态再自动写回存储单元刷新与常规读写操作不同为了节省时间通常不是按字逐个单元处理而是每次刷新内部存储矩阵的一行即为连接在同一行上所有存储元的电容补充一次能量因此刷新周期只送行地址不送列地址 I O电路不打开数据线无输出相当于一次内部读操作死时间率为32 4000 100 0 8 死区为0 5 s 32 16 s 以32 32矩阵为例存取周期为0 5 s tC tM tR 无死区分散刷新存取周期为1 s 存取周期为0 5 s 0 5 s 以128 128矩阵为例分散刷新与集中刷新相结合异步刷新例对于128 128的存储芯片存取周期为0 5 s 将刷新安排在指令译码阶段不会出现死区死区为0 5 s 若每隔15 6 s刷新一行 2ms内刷新128行而且每行每隔2ms刷新一次若每隔2ms集中刷新一次死区为64 s 在最大刷新时间间隔内对芯片内的全部存储元逐行轮流刷新一遍刷新周期平均分散在最大刷新间隔中三种刷新定时方式的特点集中刷新正常工作期间DRAM可达全效率但刷新期间CPU不能访存例中为16 s 形成访存死区分散刷新消除了访存死区但使CPU访存周期延长一倍例中 1 s 另外存在多余的刷新操作集中与分散相结合结合集中分散刷新的优点既克服了死时间又没有多余的刷新操作 DRAM工作效率达到最高是一种理想的刷新方式得到广泛应用但这种方式控制较复杂需要较多的存储器外围电路支持刷新地址计数器刷新定时器访存仲裁逻辑等 3 动态RAM和静态RAM的比较存储原理集成度芯片引脚功耗价格速度刷新 5 3 2只读存储器 ROM 1 掩膜ROM MROM 行列选择线交叉处有MOS管为 1 行列选择线交叉处无MOS管为 0 优点是可靠性高位密度高访问周期短缺点是设计制造成本高只适合成熟产品 2 PROM 一次性编程特点出厂时为通用形式用户可通过加高压大电流的方法一次结构破坏性写入信息写入的内容为永久的 3 EPROM 多次性编程 1 浮动栅雪崩注入型MOS电路 FAMOS 紫外线全部擦洗 2 2716EPROM的逻辑图和引脚 4 EEPROM 电可擦除可编程只读存储器特点擦除和编程均可联机进行更加方便电可擦写局部擦写全部擦写 5 FlashMemory 快擦型存储器又称闪存电子盘特点擦除和写入速度更快 1M位的芯片擦写时间小于5 s 与EEPROM不同的是只能整体擦或分区擦由于闪速存储器具有非电易失性且读取速度与DRAM接近写入速度与硬盘接近因此目前逐渐用来替代软硬盘称为半导体盘具有无机械运动抗震性好可靠性高等优点发展前景看好系统程序区存放的是不需要改动也不允许改动的系统程序所以这部分存储空间应用ROM来实现系统程序工作区是系统程序在工作时写入并读出临时数据的所以这部分存储空间应用RAM来实现用户程序区存放的是用户的程序与数据这些信息是可读可改写的所以这部分存储空间也应用RAM来实现主存储器由RAM和ROM芯片组成 5 4主存储器一存储器的扩展 1 存储器容量的扩展将mK n位的芯片扩展成MK N位的存储系统 m存储字n存储字长即m M 则所需芯片数为N n 用2片1K 4位存储芯片组成1K 8位的存储器 2 字扩展增加存储字的数量用2片1K 8位存储芯片组成2K 8位的存储器 n N 则需芯片数为M m 3 字位扩展用8片1K 4位存储芯片组成4K 8位的存储器 2 存储器与CPU的连接地址线的连接地址总线的低位可直接与各存储芯片的地址引脚相连高位和片选译码器输入端相连数据线的连接存储器的数据引出线与数据总线按位连通即可读写线的连接存储器的WE线与控制总线中的读写命令线连通即可对ROM没有WE 片选线的连接 CPU控制总线中的MREQ 访存请求信号与片选译码器使能输入端相连片外地址作为译码器输入端译码器输出端形成片选信号合理选用芯片通常ROM存放系统程序 RAM存放用户程序连接到片外地址线一般连接到芯片的片选控制端片选信号CS CE 的形成 74LS138译码器简介 74LS138的功能表真值表 CPU对主存的读写操作1 读操作 CPU从指定的存储单元取出信息的过程 1 CPU将地址信号发送到地址总线 2 CPU发出读命令 3 读出信息经数据总线送至CPU2 写操作 CPU将要写入的信息存入指定的存储单元 1 CPU将地址信号发送到地址总线 2 CPU将要写入的数据发送到数据总线 3 CPU发出写命令 4 等待信息经数据总线送至CPU 例5 1设CPU有16根地址线 8根数据线并用作为访存信号低电平有效用作为读写控制信号高电平为读低电平为写现在有下列存储芯片 1K 4位RAM 4K 8位RAM 8K 8位RAM 2K 8位ROM 4K 8位ROM 8K 8位ROM及74LS138译码器和各种门电路画出CPU与存储器的连接图要求 1 主存地址空间分配 6000H 67FFH为系统程序区 6800H 6BFFH为用户程序区 2 合理选用上述存储芯片说明各选几片 3 详细画出存储芯片的片选逻辑图例5 1解 1 写出对应的二进制地址码 2 确定芯片的数量及类型 A15A14A13A11A10 A7 A4A3 A0 3 分配地址线 A10 A0接2K 8位ROM的地址线 A9 A0接1K 4位RAM的地址线 4 确定片选信号例5 1CPU与存储器的连接图例5 2设CPU共有16根地址线 8根数据线并用 MREQ 低电平有效作访存控制信号 R W作读写命令信号高电平为读低电评为写现有下列存储芯片 ROM 2KX8位 4KX4位 8KX8位 RAM 1KX4位 2KX8位 4KX8位及74138译码器和其他门电路门电路自定试从上述规格中选用合适芯片画出CPU和存储芯片的连接图要求 1 最小4K地址为系统程序区 4096 16383地址范围为用户程序区 2 指出选用的存储芯片类型及数量 3 详细画出片选逻辑 1 写出对应的二进制地址码 A15A14A13A12A11A10A9A8A7A6A5A4A3A2A1A0 解 2 确定芯片的数量及类型解 3 分配地址线 A15A14A13A12A11A10A9A8A7A6A5A4A3A2A1A0 4 确定片选信号全译码方法选中内存单元片选信号形成方法全译码和部分译码全部地址总线参加译码低位地址总线作为片内地址高位地址总线全部作为片外地址特点是地址唯一一个存储单元只对应一个存储器地址有两种情况需采用全译码 1 实际使用的存储空间与CPU可访问的最大存储空间相同 2 实际使用的存储空间小与CPU可访问的最大存储空间而对实际空间的地址范围有严格的要求系统总线 A12 A13 A14 A15 A16 A17 A18 全译码举例部分译码法选用地址总线高位地址的一部分而不是全部进行译码产生片选信号特点存在地址重叠问题例使得被选中的存储器芯片占有2组不同地址范围由于A18不参与译码 F0000H F1FFFHB0000H B1FFFH A B C E3 A15 A16 A17 A18 A19 A0 A14 D0 D7 由两片27256EPROM和两片62256SRAM构成一个8位存储器系统如下图所示例5 3CPU有20根地址线 8根数据线 MEMR和MEMW为访存控制信号 1 图中采用何种译码方式形成存储器的片选信号 2 图中各存储芯片的地址范围为多少 3 图中还有多大的地址空间可以用于存储器扩展 1 由于CPU的20根地址线完全用上故为全译码方式 2 3 220 32K 32K 32K 32K 896K故还剩余896K存储空间可以扩展 272561 A19A18A17A16A15A14 A0 272562 622561 622562 88000H 8FFFFH 98000H 9FFFFH A8000H AFFFFH B8000H BFFFFH 二提高访存速度的措施采用高速器件调整主存结构调整主存结构并行存储器和信息按边界对齐存储技术并行存储器在一个存储器访问周期能并行访问到多个存储字的存储器能有效地提高存储器的带宽并行存储器主要有 1 多体交叉存储器时间并行单体多字并行存储器低位交叉编址多体并行存储器 2 双端口存储器空间并行二提高访存速度的措施单体多字系统前提条件 1 指令和数据在存储体内连续存放2 硬件配置上支持在一个存取周期内从一个地址取出4条指令再逐条将指令送给CPU去执行即每隔四分之一存取周期主存向CPU送一条指令现在一次取出的是4W位即带宽增大了4倍故提高速度把存储器的存储字字长增加n倍单体多字系统单体多字并行存储器访问冲突概率大访问冲突主要来自以下几个方面 1 取指令冲突转移指令 2 读操作数冲突所需要的操作数不一定在一个存储字中 3 写数据冲突凑齐n个数据字后才能作为一个存储字 4 读写冲突读出的数据和写入的数据处于一个存储字采用多体模块组成的存储器它们能并行工作又能交叉工作多体并行系统每个模块有相同的容量存取速度均有各自都有独立的特点 1 带宽增大nW倍 2 并行工作 3 有利于单字操作并行工作即可同时访问N个模块同时启动同时读出完全并行地工作高位交叉顺序编址同一存储体的地址空间连续不利于并行处理容易发生访存冲突两个连续访存地址指向同一存储体特点 b 低位交叉各个体轮流编址同一存储体内地址不连续以N为模同高位交叉编址相比较访存冲突小由于程序是连续存放的容易形成并行工作局面特点交叉访问的时间关系在不改变存取周期的前提下增加存储器的带宽启动存储体0 启动存储体1 启动存储体2 启动存储体3 设四体低位交叉存储器存取周期为T 总线传输周期为为实现流水线方式存取应满足T 4 连续读取4个字所需的时间为T 4 1 例设有四个模块组成的四体存储器结构每个体的存储字长为32位存取周期为200ns 假设数据总线宽度为32位总线传输周期为50ns 试求顺序存储和交叉存储的存储器带宽解顺序存储连续读出4个字的时间 200 4 800ns交叉存储连续读出4个字的时间 200 50 4 1 350ns顺序存储器的带宽 32 4 800 10 9 16 107bps交叉存储器的带宽 32 4 350 10 9 37 107bps A0 0 访问偶地址存储体BHE 0访问奇地址存储体A0 0 BHE 0 同时访问16位存储体多体并行系统举例 5 4在8086系统中由两片2764EPROM和两片6264SRAM构成的一个16位存储器系统如图所示其中2764和6264均为8K 8位的存储芯片 1 图中采用何种译码方式形成存储器芯片的片选信号 2 图中各存储芯片的地址范围为多少 3 系统还有多大的地址空间可以用于存储器扩展解 1 全译码方式 2 6264 1 的地址范围是98000H 9BFFEH中的偶地址6264 2 的地址范围是98001H 9BFFFH中的奇地址2764 1 的地址范围是9C000H 9FFFEH中的偶地址2764 1 的地址范围是9C000H 9FFFFH中的奇地址 3 系统用于存储器扩展的地址空间为1M 4 8K 992K 低位交叉访问存储器举例二维数组的无冲突访问要求对存放在并行存储器中的二维数组按行按列按对角线按反对角线访问均能实现无冲突访问 0号体 1号体 2号体 3号体 0 1 2 3 体内地址按列访问冲突低位交叉访问存储器举例二维数组的无冲突访问要求对存放在并行存储器中的二维数组按行按列按对角线按反对角线访问均能实现无冲突访问 0号体 1号体 2号体 3号体 0 1 2 3 体内地址按对角线和反对角线访问冲突低位交叉访问存储器举例二维数组的无冲突访问要求对存放在并行存储器中的二维数组按行按列按对角线按反对角线访问均能实现无冲突访问 0号体 1号体 2号体 3号体 0 1 2 3 体内地址二维数组错位存储按行列对角线和反对角线访问无冲突 4号体二提高访存速度的措施 3 双口RAM具有两套独立的读写控制逻辑的RAM 它具有两个独立的端口左端口和右端口它们分别具有各自的地址总线数据总线和控制总线可以对存储器中任何地址单元中的数据进行独立的存取操作当两个端口的访存地址不同时这两个访问可以同时进行否则发生访问冲突这时就由片内仲裁逻辑决定哪个端口先进行访问双端口RAM常作为流水线处理器的计算机主存储器在多机系统中常采用双端口RAM甚至多端口RAM 实现多处理器对主存储器的共享二提高访存速度的措施二提高访存速度的措施 2 双口RAM举例二提高访存速度的措施双端口存储器IDT7133的逻辑框图二提高访存速度的措施 2 信息按边界对齐存储例某计算机存储器按字节编址采用小端次序存放数据假定编译器规定int和short型数据长度分别为32位和16位并且数据按边界对齐存储有C语言程序段如下 strut inta charb shortc record record a 273 若record变量首地址为0 xC008 则地址0 xC008中的内容及record c的地址分别为多少二提高访存速度的措施 5 5高速缓冲存储器一概述1 问题的提出解决CPU与I O的访存冲突解决高性能与低价位的矛盾 1 依据 CPU访存的局部性原理2 目的用小容量的SRAM与大容量的DRAM构成一个性能近似于SRAM价格相当于DRAM的存储系统 2 Cache的工作原理 1 主存和缓存的编址主存和缓存分成若干块块的大小相同 B为块长 2 命中与未命中 M C 主存块调入缓存主存块与缓存块建立了对应关系用标记记录与某缓存块建立了对应关系的主存块号主存块与缓存块未建立对应关系主存块未调入缓存 3 Cache的命中率 CPU欲访问的信息在Cache中的比率命中率与Cache的容量与块长有关一般每块可取4 8个字块长取一个存取周期内从主存调出的信息长度 4 Cache 主存系统的效率效率e与命中率有关设Cache命中率为h 访问Cache的时间为tc 访问主存的时间为tm 1 Cache的内容与主存之间的映象关系 2 如何实现地址的转换将访问的主存地址转换成Cache地址 3 访问Cache未命中时若Cache没有满如何调入Cache Cache满时块如何替换 4 Cache的一致性问题即块的更新策略 3 实现Cache的功能要解决的问题 4 Cache的基本结构由CPU完成二地址映像和变换地址映象为了把信息放到Cache中必须应用某种函数把主存地址映象到Cache 称作地址映象地址变换在信息按照这种映象关系装入Cache后执行程序时应将主存地址变换成Cache地址这个变换过程叫做地址变换基本地址映象方式直接映象全相联映象组相联映象等 1 直接映像 a 直接映射示意图 1 直接映像 b 直接映像cache的检索过程 1 直接映像每个缓存块i可以和若干个主存块对应每个主存块j只能和一个缓存块对应 i jmodC 主存字块标记t m c的由来因主存中会有很多块映射到Cache中的同一块到底是多少块呢主存中共计有2t个块都可以映射到Cache中的某一块 M 2m 主存总块数 C 2c Cache总块数 2m c 2t 标记比较不够灵活 Cache利用率低易发生冲突硬件实现简单成本低特点某一个时刻只能有主存中的这2t中的一块映射到Cache中的这一块计算比较是用硬件来完成的速度较快 Cache的所有这些个标记被存放到CAM 相联存储器内例5 5 设主存的容量是256KB Cache的容量是2KB 每个块的大小为16B问主存和Cache各有多少个块主存和Cache地址各有多少位主存中第135块在直接映象方式下映象到Cache的哪一块直接映象方式下主存地址分为哪几段每段各有多少位解主存256K 16 256 1024 16 16384块Cache2K 16 128块主存log2256K 18 所以主存地址有18位Cachelog22K 11 所以cache地址有11位 j imod2c 135mod128 7 主存地址格式块内地址 log216 4位Cache字块地址 log2128 7位主存字块标记主存地址长度 cache地址长度 18 11 7位 774 练习设一个Cache中有8个块访问主存进行读操作的块地址序列为10110 11010 10110 11010 10000 00100 10000 10010 求每次访问时Cache的内容 a 全相联映射示意图 2 全相联映像 b 全相联cache的检索过程相联存储器 CAM 查找地址寄存器译码选择线路读出数据寄存器相联存储器M N 屏蔽字检索字 010 字相符 2 全相联映像主存中的任一块可以映象到缓存中的任一块主存共有2m个块此2m个块均可以映射到Cache中的任一块故Cache 标记位应为m位标记位为 m t c位访问Cache时需与全部Cache块的标记进行比较查找时间长优点更灵活 Cache利用率高命中率高特点缺点硬件电路复杂成本高实际中较少使用某一主存块j按模Q映射到缓存的第i组中的任一块 i jmodQ 3 组相联映像则C 2c QR 2q 2r 2q r c q r 内存共分为M个块 M 2m Cache分为Q组 Q 2q Cache每组包括R块 R 2r Cache分为C个块 C 2c 例5 6假设主存容量为512K 16位 Cache容量为4096 16位块长为4个16位的字访存地址为字地址 1 在直接映象方式下设计主存的地址格式 2 在全相联映象方式下设计主存的地址格式 3 在二路组相联映象方式下设计主存的地址格式 4 若主存容量为512K 32位块长不变在四路组相联映象方式下设计主存的地址格式解 cache的容量为4096 所以cache字地址为log24096 12位块长为4 所以字块内地址为2位 cache块共有4096 4 1024块块号占10位主存地址为log2512K 19位 1 直接映象方式下主存字块标记为19 12 7位主存地址格式为 2 全相联方式下主存字块标记为19 2 17位其格式为 3 在二路组相联的条件下一组内有2块 cache共分为1024 2 512组所以组地址为9 主存字块标记为19 9 2 8位其格式为 7102 172 892 4 若主存容量为512K 32位访问地址为字地址16位则主存地址位log2512K 32 16 20位在四路组相联的条件下一组内有4块 cache共分为1024 4 256组所以组地址为8 主存字块标记为20 8 2 8位其格式为 1082 例5 7假设主存容量为16MB Cache容量为8KB 每字块8个字每字32位设计一个四路组相连映像的Cache组织要求 1 设计主存的地址格式 2 设Cache的初态为空 CPU依次从主存第0 1 2 99号单元读出100个字主存一次读出一个字并重复按此次序读10次问命中率是多少 3 若Cache的速度是主存的5倍试问有Cache和无Cache相比速度约提高多少倍 4 系统效率为多少解 1 主存地址格式为 2 命中率H 100 10 13 100 10 0 987 3 设Cache存取周期为t 主存存取周期为5t 则速度提高倍数为 1365 5t 1000 5t 13 t 1000 13 1 3 75 4 效率e t 0 987t 5t 1 0 987 100 95 三替换算法替换算法的目标是使Cache获得最高的命中率就是让Cache中总是保持着使用频率高的数据从而使访问Cache的成功率最高1 先进先出法这种算法是把最早进入Cache中的信息块给替换掉由于这种算法只考虑了历史情况并没有反映出信息的使用情况所以其命中率并不高其原因是最先进来的信息块或许就是经常要用的块反而被替换掉了 2 近期最少使用算法这种算法是把近期使用最少的信息块替换掉这就要求随时记录Cache中各块的使用情况以便确定哪个字块是最近期最少使用的由于近期使用少未必是将来使用最少的所以这种算法的命中率比有所提高但并不最理想 3 随机法随机的确定被替换的块实现起来比较简单例5 8 设一个容量为4个块的全相联Cache 分别采用FIFO和LRU替换算法假定访问的主存地址块号序列为2 11 2 9 7 6 4 3 画出每次访问后Cache中的内容变化情况解访问顺序12345678地址块号211297643块分配情况 FIFO 操作状态调进调进命中调进调进替换替换替换 123 2 2 2 2 2 6 6 6 11 11 11 11 11 4 4 9 9 9 9 3 7 7 7 7 124 访问顺序12345678地址块号211297643块分配情况近期最少使用 LRU 操作状态调进调进命中调进调进替换替换替换 2 2 2 2 2 2 4 4 11 11 11 11 6 6 6 9 9 9 9 3 7 7 7 7 四 Cache的读写操作 1 读 2 写入策略由于Cache内容只是内存的一部分内容拷贝它应当与主存内容保持一致而CPU对Cache的写入更改了Cache中的内容如何保持内存与Cache内容的一致性有以下几种策略 1 全写法写穿法当写Cache命中时 CPU对主存和Cache同时进行写操作可较好的维护Cache与内存的一致性当写Cache未命中时 CPU只直接写入内存特点可适当保持内存与Cache的一致性由于对主存的访问频繁故在一定程度上降低了Cache的高速缓冲功能 2 写回法当CPU写Cache命中时只修改Cache中的内容而不立即写入主存只有当该块被换出到内存时才写回主存当CPU写Cache未命中时将此块拷贝到Cache中进行修改而主存的写操作统一留到该块被换出时才进行特点写操作都是在Cache完成的只是在需要换出时才写回主存减少了CPU访问主存的次数因Cache的速度快于内存的速度故效率较高存在内存和Cache不一致隐患一般来讲直接映象常用在 A 小容

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第5章存储系统.ppt

文档简介

温馨提示

最新文档

评论

第5章 存储系统.ppt

文档简介

温馨提示

最新文档

评论

相关文档

第5章存储系统.ppt