第4章存贮体系

上传人：n*** IP属地：河南上传时间：2020-04-19 格式：PPT 页数：100 大小：1.32MB 积分：15 举报 版权申诉

已阅读5页，还剩95页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 第4章存贮体系现代计算机系统以存储器为中心在计算机执行程序的整个过程中存储器是各种信息存储和交换的中心本章主要内容存储体系的基本概念并行主存系统的组成虚拟存储器和Cache存储器工作原理虚实地址的映像和变换替换算法及其实现影响性能的因素分析及有关软件功能分配中的一些问题了解主存保护的方式本章重点段页式和页式虚拟存储器的原理页式虚拟存储器的地址映像 LRU FIFO OPT替换算法页面替换过程模拟 LRU替换算法对页地址流的堆栈处理模拟及性能分析 Cache存储器的直接和组相连地址映像用LRU替换算法进行块替换的硬件实现及替换过程模拟 Cache存储器的性能分析 2 4 1存贮体系的形成与性能4 2虚拟存贮器4 3高速缓冲存贮器 Cache 4 4主存保护第4章存贮体系 3 4 1存贮体系的形成与性能本节主要内容领会发展存储体系的必要性及存储体系的两个分支了解并行主存系统的各种组织方式掌握并行主存系统的极限频宽和实际频宽的关系与计算领会通过使用并行主存的计算机组成技术提高主存频宽的可能性局限性以及发展存储体系的必要性了解有关存储体系的性能参数及相关结论 4 4 1 1发展存储体系的必要性一计算机对存贮系统的要求是高速度大容量低价格1 容量存贮器容量 SM W L mW为存贮体的字长位或字节 L为每个存贮体的字数m为并行工作的存贮体的数量 2 速度访问时间TA 存贮器从接到访存读申请到信息被读出到数据总线上所需的时间存储周期TM 是连续启动一个存贮体所需要的时间一般TM TA 频宽Bm 存储器每秒传递的位数或字节数传送速率分为最大频宽和实际频宽最大频宽Bm是存储器连续访问时提供的频宽单体Bm W TM多体Bm W m TM 5 3 价格包括存储体及外围电路的价格可用每位存储器价格表示这三者之间的关系是矛盾的二发展存储体系的必要性1 单一工艺不能同时满足容量速度价格的要求而由不同工艺存储器组成的存储器系统逻辑上又不是一个整体如主存和辅存 2 由并行和重叠技术组成并行主存系统可以提高主存频宽但都不能更理想地改善存储器性能 6 4 1 2并行主存系统频宽的分析主存系统的结构包括单体单字存储器单体多字存储器多体单字存储器多体多字存储器单体单字存储器一次访问一个存储器字存储器字与CPU字相同 Bm W TM要提高主存频宽Bm 在同样器件条件下同样的TM 要提高字长W 图单体单字存贮器 7 单体多字存储器主存在一个存储周期内可读出多个CPU字Bm k W TM要提高主存频宽Bm 在同样器件条件下同样的TM 要提高字长W 多字应顺序读图单体多字 k 4 存贮器 8 多体单字存储器多个存储体每个存储体一个存储字 Bm m W TM字在主存中按模m交叉编址分低位交叉高位交叉多字可以不是顺序的无体冲突即可图多体 m 4 交叉存贮器 9 在低位交叉中 Mj体的编址模式为 m i ji 0 l 1j 0 m 1i 存储单元在存储体中的坐标m 存储体数l 单体单元数表模4低位交叉编址 m 4 j 0 1 2 3 图4个分体分时启动的时间关系 10 多体多字存储器多个存储体每个存储体有多个存储字 Bm m k W TM 并行主存系统能并行读出多个CPU字的单体多字多体单字多体多字的交叉访问主存系统通称为并行主存系统通过保持每位价格不变的情况下使得主存的频宽得到较大的提高结论提高模m能提高Bm但并不理想原因在于 1 总线并联负载过重产生延迟 2 数据顺序性不好转移指令等影响系统效率 11 转移指令对频宽影响的分析项目通过一个模型分析转移指令对频宽的影响目的说明单纯靠提高模m来提高并行主存系统的频宽Bm是有限的结论必须从系统结构上改进采用存储体系内容 m个分体处理机发出一串访存地址A1 A2 Aq组成一个申请队列在每一个存储周期之前这个队列被扫描并从头截取A1 Ak个地址作为申请序列截取原则 A1 Ak中没有2个或2个以上地址处在同一个分体中取满足条件的最长序列 A1 Ak可能不是顺序编址只要没有分体冲突即可 k是随机变量且k m 系统效率取决于k的平均值 12 设P k 为申请序列长度为k的概率 k的平均值为每个存储周期访问的平均字数 P k 与程序密切相关转移指令影响最大转移成功后续指令全作废转移概率给定指令的下条指令地址为非顺序地址的概率代入 13 用数学归纳法化简若 0 则B m 为多体交叉存储等比级数若 1 则B 1 相当于单体单字图m个分体并行存取的B f 曲线如果 0 3时 m 4 8 16的差别不大 m取值再大对系统效率也无法带来多大的好处为降低转移概率就要求在程序中尽量减少使用转移类指令 14 4 1 3存储体系的形成与分支存储体系有多种存储层次对程序设计者而言各层次是一个逻辑的整体各层次之间的信息交换由辅助软硬件自动完成 1 主存辅存存储层次虚存存储器程序员对应虚地址程序地址虚存容量实际主存为物理地址主存容量对虚拟存储系统应用程序员可用机器指令的地址码对整个程序统一编码就像拥有对应地址码宽度的虚拟存储空间一样而实际存储空间比它要小得多用这种指令地址码给出的地址称为虚地址即虚拟主存地址而实际主存的地址称为实际主存地址物理地址实地址目前指令地址码可达24 32位地址线宽度这样实存空间可达16M 4G 图主存辅存存贮层次 15 2 Cache 主存存储层次主存容量不够引出虚拟存储器主存速度不够引出高速缓冲存储器 cache 解决CPU与主存的速度问题 3个方法在CPU中增设寄存器采用多体交叉并行存储器采用cache存储器图Cache 主存存贮层次 16 3 多级存储层次 CPU产生一个连续的逻辑地址流这些地址以某种方式分布于各个存储层次并被变换到Mi的物理地址若i 1 则地址必须逐级变换再送到CPU能直接访问的M1 一旦信息不在M1中程序应挂起因为Mi M1的定位及信息传送速度慢当然若M1是Cache时例外图多级存贮层次 17 4 程序具有局部性存储层次构成的主要依据时间上的局部性最近的未来要用到的信息可能是现在正使用的信息因为程序存在循环空间上的局部性最近的未来要用到的信息可能与现在使用的信息在程序空间上是邻近的因为程序是顺序存访的 18 4 1 4存储体系的性能参数 1 命中率 CPU产生的逻辑地址能在第一级存储器中访问到命中的概率 R1 在M1中命中的次数R2 未调到M1中的次数命中率H与地址流预判算法容量有关 M1 M2 一级二级 19 2 等效访问时间TA TA H TA1 1 H TA2 TAi为CPU访问Mi中的信息所需时间希望TA TA1 访问效率e TA1 TA希望e 1设访问时间比r TA2 TA1则 e 1时 r大即二级存储速度差异大要求H高 e 1时 r小即二即存储速度差异小降低H的要求图对于不同的r 命中率H与访问效率e的关系 20 4 2虚拟存贮器虚拟存储器是主存辅存存储层次的进一步发展和完善主要是为了克服高速的主存容量满足不了要求而提出来的它依据的原理是访问的局部性原理虚拟存储器又称虚拟存储系统或虚拟存储体系是1961年提出来的它由主存储器和联机工作的外部存储器共同组成 21 1 虚拟存储器概念由主存辅存存储层次辅助硬件和操作系统存储管理软件组成的一种存储体系 2 虚拟存储器与cache存储器的区别 CPU Cache 主存直接访问通道 3 虚拟存储器的主要问题 1 地址映像2 地址变换3 替换算法 22 4 2 1不同的虚拟存储管理方式虚拟存储器管理方式按存储映象算法有段式页式和段页式三种1 段式管理将主存按段分配基本思想 1 把程序在逻辑上分解成相对独立的段模块 2 每个段都从0开始相对编址 3 以段为单位在主存辅存之间调度 4 设置段基址该段在主存中的起始地址则段基址段内相对位移物理地址段表每道程序一个存放该程序各段装入主存的状况信息段表本身也是一个段一般常驻内存段表基址寄存器只有一组存放各道程序的段表的有关信息如表长表起始地址 23 图段式管理的定位映象机构及其地址的变换过程段式管理过程如图所示优点分块编址可并行编程缩短编程时间便于多道程序信息共享如字程序容易实现段保护缺点段大小不定主存贮器的利用率比较低查表速度慢在主存中的起点随意给主存分配带来困难应建立一个主存管理指明整个主存的使用情况哪个区域已被占用被谁用哪个区域是空闲的 0段 1段 2段 3段 4段 5段 6段 0 0 0 3k 1 0 0 0 0 1k 1 2k 1 1k 1 2k 1 3k 1 4k 1 A道程序的程序空间 A 4 1 5k 多用户虚拟地址程序号段号段内位移 0 1 N 1 7 A a 段表长度段表基地址段表基址寄存器主存中最多可有N道程序 0 1 2 3 4 5 0 5k 1k 1 0 1 0 1 0 1k 3k 2k a 6 0 段名段号起始地址装入位段长访问方式 0段 4段 2段 0 1k 5k 1k 2k 3k 实主存空间 A道程序的段表 1 2 2 5k 3 24 实主存空间的分配和回收为了对实主存的空间进行分配和回收段式存贮器需要为操作系统配备一个实主存空间管理表进行存贮管理它包括占用区域表和可用区域表两部分在分配主存空间时可采用首先分配法和最佳分配法来进行首先分配法顺序扫描可用区域表当找到第一个不小于要调入段长度的可用区时就立即进行分配最佳分配法先扫描全部可用区域表然后寻找一个可用区进行分配使之分配后段间可用区零头最小 25 图4 12段式存贮分配算法 26 2 页式存贮管理方式基本思想 1 将主存空间和程序空间都机械等分成大小相同的页面 2 让程序的起点必须处在主存中某一个页面位置的起点上 3 任一主存单元的地址np由实页号nv和页内位移nr两个字段组成用户程序空间中的每一个虚地址由虚页号字段Nv 和页内位移字段Nr组成页表每道程序一个页表用来表示各虚页是否已经调入主存页表基址寄存器只有一组存放各道程序的页表的有关信息如表长表起始页 27 图页式管理的定位映象机构及其地址的变换过程 28 优点 1 主存贮器的利用率比较高 2 页表相对比较简单 3 地址映象和变换的速度比较快 4 对辅存的管理比较容易缺点 1 程序的模块化性能不好 2 页表很长需要占用很多的存贮空间 29 3 段页式管理段式和页式相结合基本思想 1 主存等分成固定大小的页 2 虚存中的程序按模块分段每个段又分成与主存页面大小相同的页 3 每道程序通过一个段表和相应的页表进行定位 2次查表多用户虚地址段表基址寄存器段表页表页内位移段页式与段式主要差别之一段的起点不是任意的要位于主存中页的起点在虚存中每访问一次主存都要进行一次虚地址实地址的转换页表段表用于存储地址映像关系实现地址变换面向用户程序空间虚地址每道程序有一个 30 图段页式管理的定位映象机构及其地址的变换过程段页式管理的优缺点结合了页式与段式管理的优点段页式增加了地址变换的时间因为需要两次访存查段表和页表所以必须加快段页式管理查表的速度 31 例1 IBM370系统采用段页式管理主存地址24位指令地址码长32位虚地址格式为虚地址每个用户的虚存空间为224 16M 页 4K 用户数 256 用户页数 4K 每个用户虚存空间有一个段表格式如下页表长度页表起点 0 3 4 7 8 28 29 31 30 P I 每个页表占一行 4个字节页表第一个单元的实地址为21位右边加3个零形成24位主存地址 P保护位 P 1为只读 I状态位 I 1此段不正常不能用每段有一个页表格式如下对应页面号在主存的页面位置应是12位实页面地址形成24位地址 I装入位 I 1已装入该道程序的段表起始地址存放在CPU中的一个控制寄存器中即段表基址寄存器 8 8 4 12 4 21 32 例2 VAX 11采用页式管理地址码长32位字节编址每页29 512字节 222 4M虚页 9 22 31 每个用户有231 2G的虚存空间 1位程序号例3 Intel80386 8086 8088没有虚拟存储器功能 80386以上才有 80386有存储管理部件MMU 由分段部件和分页部件组成 80386有两种操作方式 1 实地址方式与8086兼容支持1M实存空间每段216 64K 2 虚地址方式保护方式虚存空间246 64T 实存空间232 4G 1页4K 33 4 2 2页式虚拟存贮器构成 1 地址的映象和变换多用户虚地址与主存实地址的组成地址的映象是将每个虚存单元按某种规则算法装入定位于实存即建立多用户虚地址Ns与实主存地址np之间的对应关系地址的变换在执行时多用户虚地址Ns如何变换成对应的实地址np 实页冲突多个虚页想进入同一个实页图虚实地址对应关系及空间的压缩 34 图全相联映象全相连映象每道程序的任何虚页可以映象装入到任何实页位置如图页表法用页表作为是一种全相连映象方式地址映象方式的选择应尽量降低实页冲突的概率减少辅助地址映象的表硬件降低成本便于实现并使地址变换速度要快虚存空间往往远远大于实存空间因此虚拟存贮器都采用全相联的映象规则 35 问题虚存空间对应2u个用户程序主存最多运行N个用户每个程序的页表有2Nv 行主存有2nv个实页 N道程序的所有页表共有N 2Nv 行而装入位为1的有2nv行因此有N 2Nv 2nv行的实页号字段无用降低页表的空间利用率解决办法 1 辅存地址替换法页表中装入位为0的行的实页号字段存放辅存地址目的调页时实现虚页号辅存地址的变换要求辅存地址实存地址长度相差不多 2 相联目录表法压缩页表只存放装入位为1 已装入主存的虚页与实页的对应关系该表最多为2nv行采用按内容访问的相联存储器不用设置装入位但2nv行也很多一般不直接用目录表法 36 按地址访问的随机存储器在一个存储周期里只能按给出的一个地址访问器存储单元按内容访问的相联存储器在一个存储周期里能将给定的内容同时与存储器全部单元的数据相比较进行相联查找图4 18目录表法 37 问题如何解决页面失效虚页未装入主存解决办法从辅存调页 1 辅存按信息块编址块的大小等于页面的大小辅存的地址格式为 2 建立外页表存放每道程序用户虚页号与辅存地址的对应关系实现外部地址变换原先用于内部地址变换的页表可称为内页表外页表每行对应一个虚页每行中有装入位字段表示对应的信息块是否已有海量存储器如磁带装入磁盘为1表示装入而为0时则需要重新装入外页表的内容是在程序装入辅存时填好的 3 外页表放在辅存中当某道程序初始运行时把外页表的内容复制到内页表辅存地址暂时占用实页号字段当虚页装入主存后改为实页号 4 辅存调页速度慢当发生页面失效需要辅存调页时采取程序换道方式提高处理机效率 5 可用软件方法实现查外页表由多用户虚地址到辅存地址的变换节省硬件成本 38 图虚地址到辅存实地址的变换 39 2 替换算法页面失效当处理机要用到的指令或数据不在主存时产生页面失效虚存大主存小主存满时进行辅存调页产生实页冲突要替换替换算法选择主存中哪个页作为被替换的页替换算法确定依据 1 主存命中率高 2 算法便于实现 3 辅助软硬件成本低常用替换算法随机算法 Random RAND 先进先出算法 First InFirst Out FIFO 近期最少使用算法 LeastrecentlyUsed LRU 近期最久未用过算法 LRU 优先替换算法 OptionalOPT 堆栈型替换算法页面失效频率算法 PFF 40 1 随机 RAND 算法方法用随机数产生被替换页的页号实现产生随机数特点简单易实现没有历史信息不反映程序局部性命中率低不用 41 2 先进先出 FIFO 算法方法选择最先调入主存的页面作为被替换的页面主存页面表记录主存所有实页的使用情况为主存管理而设计的表整个主存只有一个页表针对用户程序空间主存页面表针对主存空间实现 1 在主存页面表中分配一个时间进度计数器字段 2 当某页调入主存时该页的计数器清0 其它页的计数器都加1 3 计数器值最大的页是最先进入主存的将被替换特点利用历史信息但不反映程序的局部性最先进入的页可能是现在经常使用的页图4 20主存页面表 42 例设有一道程序有1至5共5页执行时的页地址流即执行时依次用到的程序页页号为 2 3 2 1 5 2 4 5 3 2 5 2 若分配给该道程序的主存有3页用FIFO替换算法对这3页的使用和替换过程用图示表示如下图FIFO替换算法对页地址流的替换过程 43 3 近期最少使用 LRU 算法方法近期最少访问的页面作为被替换的页实现 1 在主存页面表中分配一个访问次数计数器字段和一个时间进度计数器字段 2 某页面被访问时页访问次数计数器加1 时间进度计数器清0 其他页时间进度计数器加1 某页调入主存时该页的时间进度计数器清0 访问次数计数器清0 其它页的时间进度计数器加1 3 时间进度计数器 N N为近期的界限值时访问次数计数器的最小的页将被替换特点反映历史信息和程序局部性但计数器需要很长实现困难不用用其变形近期最久未用过算法 44 4 近期最久未用过 LRU 算法方法选择出近期最久未被用过的页面作为被替换的页实现 1 在主存页面表中分配一个使用位初始为0 2 某页被访问时使用位由硬件置1 3 发生页面失效时a 若占用位不全为1 则进行辅存调页 b 若占用为全为1 则进行页面替换此处的研究对象 4 使用位为0的页将被替换 5 若使用位全为1 则采用以下使用位修改方法 a 随机周期法当使用位全为1时由硬件自动将它们清0 b 定期扫描法另配一个未使用过计数器 Hs 定期扫描每隔 t时间使用位若使用位为0 则未使用过计数器加1 使用位保持0 若使用位为1 则使用位和未使用过计数器清0 这样未使用过计数器值最大的页是最久未使用过的将被替换使用位只反映一个 t内的页面使用情况而Hs则反映了多个 t内的页面使用情况特点计数器硬件较少主存页面表可用软硬件实现修改根据历史预测未来 45 对于LRU算法用一个使用位和未使用过计数器 Hs 来实现每隔 t扫视所有的使用位为0的使其的Hs位加1 为1的则置Hs为0 同时置使用位为0 当需要替换时查找Hs的最大值则是要替换出去的页 t 使用位为1 则由1变为0 Hs清零使用位为0 Hs加1 注意使用位反映的是 t时间间隔内的使用情况而Hs反映的则是近期最少使用的情况 46 5 优化 OPT 算法方法根据未来实际使用情况将未来的近期里不用的页替换出去实现 1 确定要替换的时刻t 2 找出主存中每个页将来要用到的时刻ti 3 ti t最大的页将被替换特点命中率高但难于实现必须运行一遍才能知道未来的时刻ti 是理想算法用于评价其它替换算法页地址流程序页号序列 47 图4 213种替换算法对同一页地址流的替换过程例用页地址流模拟替换过程 48 图4 22命中率与页地址流有关命中率与页地址流有关 49 图4 23FIFO法的实页数增加命中率反而有可能下降命中率与主存页面数相关 50 若对主存页数n取不同值都模拟一遍工作量太大因此提出堆栈技术分析模型 6 堆栈型替换算法是指一类算法采用这种分配算法分配给程序的主存页面数越多虚页装入到主存中的机会也越多因此命中率也可能越高至少不应该下降 51 定义对任意一个程序的页地址流若替换算法满足下列条件则该算法属于堆栈型的替换算法式中 n 分配给该页地址流的主存页面数实页数 Lt 在t时间点以前出现的不同页的页数 Bt n 在t时间点主存分配n个实页的前提下主存中虚页的不同页面的页面号集合说明 LRU OPT算法是堆栈型算法 FIFO不是因为在前面的例子中 B7 3 1 2 5 而B7 4 2 3 4 5 所以B7 3 不包含于B7 4 不满足条件 52 堆栈算法的实现 1 建立一个堆栈S 根据堆栈算法的包含性必有式中 St 在t时间点 Lt个不同页面号在堆栈中的有序集合 St 1 栈顶 St 2 次栈顶 2 页地址流A在时间t点的At页面是否命中看St 1的前n个项是否有At 有则命中堆栈型算法只需对页地址流模拟一次即可求得在不同主存页数n时的命中率即H n 模拟一次可得到St 1 St Lt 为确定系统给该程序分配主存页数提供依据 St 1 St 2 St 3 53 LRU算法堆栈调整过程刚访问过的页号放在栈顶最久未访问过的放在栈底 1 设t时间点要访问的页号为At 若At不属于堆栈则At放在栈顶其余各项下移 2 若At属于堆栈则取出该页放在栈顶其余各页下移 3 确定主存分配的页面数n 下移一位 St 1 1 St 1 m At 图1 下移一位不动 St 1 1 St 1 k St 1 m 堆栈型算法的特点 1 一次模拟就可求得不同主存页数的命中率对某一页地址流而言 2 命中率随主存页数的增加而单调上升 54 图4 24使用LRU法对页地址流进行堆栈处理 55 由图4 24的St可确定对应这个页地址流和主存页数n取不同值时的命中率只要对不同的n值当At St 1 则命中当则不命中例如对n 4 其S5 5 1 2 3 因为A6 2 S5 所以命中但对n 2 其S5 5 1 因为所以不命中这样就可算出各个n值的命中率H 如下所示 56 7 页面失效频率算法 PFF 一种动态算法对LRU算法的改进基于主存页数n增加 H单调上升方法根据各道程序运行中的主存页面失效率由操作系统动态调节分给各道程序的实页数实现当主存页面失效率 X 某个值时增加改道程序的主存页数当主存页面失效率 Y 某个值时减少改道程序的主存页数特点提高整个系统的主存命中率提高整个系统的主存利用率 3 虚拟存贮器工作的全过程 58 虚拟存储器工作过程访问主存多用户虚地址主存地址页面失效程序换道辅存调页辅存调页多用户虚地址辅存地址辅存缺页海量存储器调入装入主存 I O处理机控制辅存地址主存地址查内页表查外页表主存页面表替换算法 59 4 2 3页式虚拟存贮器实现中的问题 1 页面失效的处理页面失效不能看作是一般的中断应作为一种故障立即响应页面失效要程序换道故应保存现场及恢复现场采用后援寄存器预判技术等正确选择替换算法避免指令跨页存放的页来回调度进进出出颠簸正确选择分配给每道程序的页面数以及每页的大小 60 2 提高虚拟存贮器等效访问速度的措施缩短访主存的时间等效访问速度公式TA HTA1 TA2 1 H 一方面要求能有很高的主存命中率另一方面要求能有尽可能短的访主存时间在段式或页式虚拟存储器中要访问主存储器必须先查找段表或页表在段页式虚拟存储器中既要查找段表也要查找页表这样主存储器的访问速度将降低2至3倍因此要从加快内部地址变换的角度来提高性能 61 a快表与慢表方法由于在一段时间内对页表的访问只是局限在少数几个存储字内这样可以把经常访问的页面地址存放在一个小容量的高速存储器中称为快表将原先存放全部虚实地址映象关系的表称为慢表快表是满表的一部分快表与慢表同时查找在快表中找着则慢表结束快表中没找着则慢表继续找同时把此页调入快表按一定的算法可是由于快表的容量比较小命中率低如果提高快表的容量则它的查表速度会下降 62 图4 26经快表与慢表实现内部地址变换 63 图4 27减少快表的相联比较位数省掉用户号增加用户位由于上述快表的比较位数较多而且在一段时间内总是对应于同一个任务或同一个用户它们的u值是不变的所以可以让参加比较的位数少一些以加快时间 64 b快表不采用相连存储器而采用按地址访问的存储器查找的信息可以使用顺序查找法对分查找法散列查找法对于快表来说就是要把多用户虚页号Nv变换成快表地址A 函数关系是 A H Nv 65 图4 28经散列实现快表为什么还需Nv 66 注意虚拟存储器中的多用户虚地址的位数是固定的以页式为例说明 IBM370 168计算机的虚拟存储器虚地址共长48位页面大小为4K 每道程序最多允许有4K个页面最多允许有16M个用户用户号位占24位在一段时间内最多允许有6个用户所以IBM370 168采用如下方法实现快表多用户u虚页号Nv 页内位移Nr 67 图4 29IBM370 168虚拟存贮器的快表在快表的每个地址单元A中存放多个不同的虚页号与实页号的映象关系 68 总结提高虚拟存储器等效访问速度的措施虚地址至主存地址的变换靠内页表内页表容量大一般存放在主存中每次访问主存都要多一次访问内页表为缩短内部地址变换时间可采用2种方法 a 用小容量快速随机存储器或寄存器来存放页表 b 增设快表由硬件构成按内容访问是页表的一部分保存当前正在使用的虚实地址映像关系快表的命中率和查表速度有矛盾命中率高要求容量大查表速度慢散列方法让内容与存放该内容的地址建立某种散列函数关系散列函数表换由硬件实现快表由按地址访问的高速存储器构成容量比按内容访问的相联存储器构成的快表的容量大散列冲突虚地址经散列函数变换后得到一个单元地址可该地址单元的内容却不是该虚地址对应的实页号即出现一对多的情况 69 4 3高速缓冲存贮器 Cache Cache 弥补主存速度在CPU与主存之间设置的高速小容量存储器构成Cache 主存存储层次速度是Cache的容量是主存的 70 4 3 1基本结构 Cache和主存等分成相同大小的块访Cache时间是访主存时间的1 4 1 10 主存与辅存速度之比是1 1000 71 Cache结构特点 Cache操作分两部分查表地址变换和访问Cache二者时间基本相近 50ns 但可以重叠流水进行 Cache尽量靠近CPU 减小延迟发挥Cache高速性为解决Cache块失效在CPU与主存之间设有直接通路一般Cache块的大小等于在一个主存周期内主存所能访问到的字数因此有Cache的主存系统都采用多体交叉存储器如IBM370 主存模4交叉每个分体8个字节宽所以Cache每块32字节 72 4 3 2地址的映象与变换地址映象将每个主存块按什么规则装入Cache中地址变换将主存地址变换成Cache地址块冲突主存块要进入Cache中的位置已被其它主存块占用要用替换算法全相联直接组相联常用映像方法 73 1 全相联映象和变换地址映象在主存中的任何一个块均可以装入到Cache中的任何一个块位置上图4 33全相联映象规则 74 图4 34全相联映象的地址变换过程地址变换目录表相联比较用硬件实现优点块冲突概率低缺点目录表相联存储器大成本越高查表速度慢 75 2 直接映象及其变换主存和Cache都机械等分成相同大小的块后再将主存空间按物理Cache大小等分成区地址映象主存中第i块只能唯一映象到Cache中第imod2ncb Cache的块个数块位置上图4 35直接映象规则 76 图4 36直接映象的地址变换过程地址变换硬件实现主存地址中直接产生Cache地址标志表中比较区号标志表存储器按地址访问优点省硬件速度快并行工作缺点块冲突率高 77 3 组相联映象及其变换地址映象组间直接映象组内各块全相联映象实现方法整个Cache为一个区主存按Cache大小分成若干个区区内等分若干组组内等分若干块每块由若干个字组成主存地址字段为区号组号组内块号块内地址当组相联映象的组内块数等于Cache的总块数时就成了全象联映象当组内只有一个块时就成了直接地址映像所以全相联映象和直接映象是组相联映象的两种极端地址变换每组一个目录表组号直接使用区号块号相联比较硬件实现组间直接组内块号全相联 79 图4 37组相联映象规则 80 图4 38组相联地址变换示意图 81 图4 39组相联地址变换的一种实现方式采用一个按地址访问与按内容访问混合的存储器实现单体多字并行存储器步骤 1 由q从2q中选出一个单元同时读出2s个字 2 分别通过2S套外比较电路与主存地址的nd s 进行比较 3 将其中相符的s取出拼加上q和nmr组成Cache地址nc 4 若都不符合发生块实效 82 图4 40组相联映象的另一种方案图4 41组相联另一种方案的地址变换过程 83 4 3 3替换算法的实现特点 1 发生Cache块冲突时要用替换算法进行替换 2 可采用与虚存一样的算法 FIFO LRU 3 Cache调块是微秒级不用程序换道算法用硬件实现 2种替换算法 1 堆栈法2 比较对法堆栈法 LRU算法硬件实现之一 LRU算法是堆栈型替换算法栈顶是最近被访问过的页号依次访问时间变久栈底是近期最久未访问的页号 1 全相联映象堆栈大不适合用硬件实现方法设置一个堆栈堆栈行数 Cache块总数硬件实现实现 a刚访问过的Cache块号与堆栈中的块号相联比较 b不想符此块号入栈顶其它下移一项 c相符从栈中取出放入栈顶此块号到栈顶的部分下移一项 d栈不满时发生块失效按b做 e栈满后发生块失效栈底的块号被替换 84 图4 43全相联映象LRU法经堆栈实现需要有相联比较功能 2 组相联映象堆栈小适合用LRU硬件实现方法一组一个堆栈堆栈行数组内块数堆栈法需要硬件有相联比较的功能速度低成本高 85 2ncb行 ncb位全相联映象组间直接组内全相联共有2q个堆栈 2s行 Nd S位 86 2 比较对法 LRU算法硬件实现之二只用一般的门触发器来实现LRU替换算法方法各块两两组和每对接到一个触发器用触发器状态表示两块被访问的远近次序再经门电路就可找到被替换的块实现例如有A B C三块 C为最久未被访问过则可能的情况是ABC BAC TAB为 1 表示A比B更近被访问过 TAB为 0 表示B比A更近被访问过因此比较对触发器与门 87 分析一下此方法实现时的一些情况 88 4 3 4Cache的写入策略和取算法1 写入策略Cache的地址变换和替换算法是全硬件实现的 Cache对应用程序员系统程序员是透明的 Cache对CPUM之间的信息交换是透明的 Cache中的内容是主存中一小部分内容的副本应与主存保持一致但当发生写入操作时主存与Cache内容一致性就成为问题写入操作包括写Cache和写主存主存可由CPU 通道 I O处理机写入这就要采用一定的写入策略来解决 89 1 写入Cache命中时解决主存内容跟踪问题a写回法 CPU只写入Cache 替换时才能把Cache内容送回主存然后调新块需要增加修改位 b写直达法同时写入Cache和主存单机系统一般采用写回法节省成本多机系统多采用写直达法防止出错 2 Cache写不命中时是否把写入主存的数据块取到Cache a不按写分配法只写主存不调入Cache b按写分配法写主存同时调入Cache 多机系统在写入时要保证各CPU的Cache与主存的一致性采用播写法控制共享信息和目录表 90 2 Cache的取算法块调度策略如何取块可提高命中率按块取进法一般采用方法 Cache块失效时调块 2 预取算法方法在访问主存第i块时预取第i 1块何时取进该块有两种方法 a恒预取只要访问主存第i块不论Cache是否命中均预取第i 1块 b不命中时预取访问主存第i块在Cache中不命中时预取主存中第i 1块预取块大小不宜超过256字节预取命中率与块大小预取开销有关块太小预取效果不明显 91 4 4主存保护 1存储区域的保护 1 不能侵犯别的用户的区域方法有界限寄存器页表保护键式保护 2 保护自己的区域不受侵犯保护操作系统方法有环式保护 2访问方式的保护由于对信息有读写执行的使用方式可以把他们结合实现访问方式的保护 92 对主存信息的使用可

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第4章存贮体系

文档简介

温馨提示

最新文档

评论

第4章 存贮体系

文档简介

温馨提示

最新文档

评论

相关文档

第4章存贮体系