第四章__主存储器

上传人：m*** IP属地：河南上传时间：2020-04-07 格式：PPT 页数：69 大小：1.04MB 积分：15 举报 版权申诉

已阅读5页，还剩64页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

计算机组成原理第4章主存储器 1 存储器容量扩展位扩展字扩展字位扩展2 存储控制集中刷新分散刷新异步刷新3 存储校验线路 4 8半导体存储器的组成与控制复习一 RAM存储器芯片总结RAM存储器芯片有多种型号每一RAM存储器芯片具有地址线Ai 引脚数与存储芯片的单元数有关数据线Di 引脚数与存储芯片的字长有关电源线地线复习二例1 某RAM芯片其存储容量为16K 8位问 1 该芯片引出线的最小数目应为多少 2 存储器芯片的地址范围是什么解 1 16K 214 所以地址线14根字长8位所以数据线8根 14 8 1 1 1 1 26 地址线数据线片选读写电源线地线 2 存储器芯片的地址范围为0000H 3FFFH 存储器芯片的地址范围地址线从全 0 到全 1 的所有编码复习三 SRAM芯片2114 1K 4位外特性地址端 A9 A0 入数据端 D3 D0 入出控制端片选CS 0选中芯片 1未选中芯片写使能WE 0写 1读电源地 1 存储器容量扩展位扩展扩展每个存储单元的位数扩展宽度字扩展扩展存储单元的个数扩展长度字位扩展两者的综合扩展宽度和长度假设扩展同种芯片则需要的芯片总片数总容量容量片位扩展字扩展字位扩展 1 存储器容量扩展位扩展例2使用8K 1位RAM芯片组成8K 8位的存储器画出逻辑框图分析芯片位数小于存储器所要求的位数需进行位扩展 8个芯片的关系是平等的同时工作并联的对应的地址一一相连详细的连接见下图 I O I O I O I O I O I O 8K 1位RAM芯片组成8K 8位的存储器 I O 8K 1I O 位扩展总结当构成内存的存储芯片的字长内存单元的字长时就要进行位扩展使每个单元的字长满足要求位扩展方法将每片的地址线片选CS 读写控制线并联数据线分别引出位扩展特点存储器的单元数不变位数增加 1 存储器容量扩展字扩展例3使用16K 8位的RAM芯片组成一个64K 8位的存储器分析芯片的字数不够需进行字扩展共需芯片数目是64K 16K 4 将4片RAM的地址线数据线读写线一一对应并联出现地址线不够问题如何解决可以用高2位地址作为选片端详细的连接见下图 16K 8位的RAM芯片组成一个64K 8位的存储器地址端地址端地址端地址端 10 字扩展总结特点地址空间的扩展芯片每个单元中的字长满足但单元数不满足扩展原则每个芯片的地址线数据线读写控制线并联仅片选端分别引出以实现每个芯片占据不同的地址范围 1 存储器容量扩展字位扩展实际存储器往往需要在字向位向两个方向同时扩展一个存储器的容量为M N位若使用L K位的存储芯片则该存储器共需的芯片个数为需解决芯片的选用地址分配与片选逻辑信号线的连接要求 1 确定整个存储器所需的芯片数及芯片的分组情况 2 确定存储器及每组芯片的地址范围 3 说明地址线的分配方法并画出存储器的结构图 2114 1K 4 SRAM芯片组成容量为4K 8的存储器例4 用2114 1K 4 SRAM芯片组成容量为4K 8的存储器 2114 1K 4 SRAM芯片组成容量为4K 8的存储器 1 计算芯片数先扩展位数再扩展单元数 2片1K 4 1K 8 4组1K 8 4K 8 8片分析整个存储器所需要芯片数 4 8 1 4 8片 2114 1K 4 SRAM芯片组成容量为4K 8的存储器存储器寻址逻辑 2 地址分配与片选逻辑芯片内的寻址系统二级译码芯片外的地址分配与片选逻辑为芯片分配哪几位地址以便寻找片内的存储单元由哪几位地址形成芯片选择逻辑以便寻找芯片存储空间分配 4KB存储器在16位地址空间 64KB 中占据任意连续区间 2114 1K 4 SRAM芯片组成容量为4K 8的存储器 A11A10A9 A0 000 0 001 1 011 1 101 1 010 0 100 0 110 0 111 1 片选芯片地址需12位地址寻址 4KB A11 A0 2114芯片为1K 4位片内寻址需要10根地址线为A0 A9 低位地址分配给芯片高位地址形成片选逻辑芯片芯片地址片选信号片选逻辑 1K 1K 1K 1K A9 A0 A9 A0 A9 A0 A9 A0 CS0 CS1 CS2 CS3 A11A10 A11A10 A11A10 A11A10 整个存储器的地址范围 000H FFFH 共分为4组每组的地址范围为第一组 000H 3FFH第二组 400H 7FFH第三组 800H BFFH第四组 C00H FFFH 2114 1K 4 SRAM芯片组成容量为4K 8的存储器 2114 1K 4 SRAM芯片组成容量为4K 8的存储器 3 连接方式 1 扩展位数 2 扩展单元数 3 连接控制线 4 形成片选逻辑电路例5 某半导体存储器总容量4K 8位其中固化区2K字节选用EPROM芯片2716 2K 8位工作区2K字节选用SRAM芯片2114 1K 4 片地址总线A15 A0 低双向数据总线D7 D0 低 2K 81K 41K 41K 41K 4 0000 07FF 0800 0BFF 0C00 0FFF 确定芯片 1块2716 4块2114 如图组织逻辑地址位扩展就是并联多个芯片的地址线可以视为多组8位芯片字扩展就是确定片选信号根据地址线总宽度和地址分配情况确定片选信号产生逻辑芯片1 A11芯片2 A11 A10芯片3 A11 A10 1K 8 1K 8 设计目标 4K 8的地址空间片选信号的产生逻辑寻找地址空间的特征值4K空间需12位地址 A15 A12不用芯片1 0000 07FF A10 A0全部占用为地址信号 A11始终为0 此空间外地址的A11必为1 故片选逻辑为 A11芯片2 0800 0BFF A9 A0全部占用为地址信号 A11始终为1 A10始终为0 故片选逻辑为A11 A10芯片3 0C00 0FFF A9 A0全部占用为地址信号 A11始终为1 A10始终为1 故片选逻辑为A11 A10 字扩展片选逻辑具有排他性确保同一时刻只有一个芯片在工作设计结果芯片1使用11位地址A10 A0 A11用于片选芯片2 3都使用并联的10位地址A9 A0 并将A11 A10用于片选 0000 07FF 0800 0BFF 0C00 0FFF 2716 2114 2114 2114 2114 D7 4 D3 0 R W CS0 CS1 CS2 A11 A11 A10 A11 A10 A10 0 A9 0 A9 0 地址芯片级存储器逻辑图应表示出所用存储芯片各芯片的地址线片选逻辑注意芯片的片选信号一般是 CS 即低电平有效设计往往先从逻辑命题真写出逻辑式数据线数据总线是双向总线数据通路宽度8位 ROM芯片数据为单向输出 RAM芯片为双向连接 2114每片4位分别连到数据线D7 D4和D3 D0 两组拼接为8位读写控制R W 2716没有R W输入端 R W信号只送至RAM芯片2114 思考题用8K 8位的ROM芯片和8K 4位的RAM芯片组成存储器按字节编址其中RAM的地址为2000H 7FFFH ROM的地址为C000H FFFFH 画出此存储器组成结构图及与CPU的连接图解题提示思考题 1 计算容量和芯片数高位地址A15A14A13为001 011 RAM的容量为8K 3 24K 需要8K 4位的RAM芯片6片 RAM区地址范围展开为0010000000000000 0111111111111111 RAM单个芯片的容量为8K 213 0111111111111111 0010000000000000 ROM区末地址首地址 FFFFH C000H 3FFFH所以ROM的容量为214 16K 需要8K 8位的ROM芯片2片高位地址A15A14A13为110 111 ROM的地址范围展开为 1111111111111111 1100000000000000 CS7A15A14A13 0011 1 思考题 A15A14A13A12 A0 0010 0 1101 1 1100 0 低位地址分配给芯片高位地址形成片选逻辑选用3 8译码器 74LS138 40KB需16位地址寻址 RAM A15 A0 ROM 片选信号片选逻辑存储系统的层次结构 CACHE 主存内存辅存外存根据各种存储器的存储容量存取速度和价格比的不同将它们按照一定的体系结构组织起来使所放的程序和数据按照一定的层次分布在各种存储器中主存和高速缓存之间的关系 Cache引入为解决CPU和主存之间的速度差距提高整机的运算速度在CPU和主存之间插入的由高速电子器件组成的容量不大但速度很快的存储器 Cache特点存取速度快容量小存储控制和管理由硬件实现Cache工作原理程序访问的局部性在较短时间内由程序产生的地址往往集中在存储器逻辑地址空间的很小范围内数据分布不如指令明显但对数组的访问及工作单元的选择可使存储地址相对集中 CPU与Cache之间的数据交换是以字为单位而Cache与主存之间的数据交换是以块为单位一个块是由若干字组成是定长的主存与辅存之间的关系主存半导体存储器组成优速度快缺容量受限单位成本高断电丢失信息辅存光盘磁盘优容量大信息长久保存单位成本低缺存取速度慢CPU正在运行的程序和数据存放在主存暂时不用的程序和数据存放在辅存辅存只与主存进行数据交换 Cache是为弥补主存速度的不足在CPU和主存之间设置的高速小容量的缓冲存储器组成小容量的SRAM和高速缓存控制器组成功能将CPU当前快要用到的部分数据块由主存复制到容量小速度快的SRAM中由SRAM向CPU直接提供它所需要的数据高速缓冲存储器 Cache 为了使CPU不至因为等待存储器读写操作的完成而无事可做可以采取一些加速CPU和存储器之间有效传输的特殊措施实现的途径有主存储器采用更高速的技术来缩短存储器的读出时间或加长存储器的字长采用并行操作的双端口存储器在CPU和主存储器之间插入一个高速缓冲存储器 cache 以缩短读出时间在每个存储器周期中存取几个字高速缓冲存储器 Cache Cache存储器的基本原理 1 cache的功能解决CPU和主存之间速度不匹配而采用的一项重要技术从功能上看它是主存的缓冲存储器由高速的SRAM组成当前随着半导体器件集成度的进一步提高 cache已放入到CPU中其工作速度接近于CPU的速度从而能组成两级以上的cache系统中央处理器 cache CPU Cache 主存外存 M1 M2 M3 CPU存储器系统的关系 cache的基本原理把Cache和主存都分成相同大小的块每一块由若干个字或字节组成在Cache中每一块外加有一个标记指明它是主存的哪一块的副本所以该标记的内容相当于主存中块的编号每当给出一主存地址进行访问时必须通过地址映像变换机构将主存地址变换成Cache地址去访问Cache本体若访问字所在的块不在Cache中不命中则产生Cache失效需要从主存把包含该字的一块信息通过多字宽通路调入Cache 同时将被访问的字送往CPU 如Cache已装满就需要按所选择的替换算法进行替换并修改地址映像表中有关的地址映像关系和Cache各块使用状态标志等信息 cache的命中率设NC表示Cache完成存取的总次数 Nm表示主存完成存取的总次数 h定义为命中率则有 h NC NC Nm 1 h则表示未命中率若tc表示命中时的Cache访问时间 tm表示未命中时的主存访问时间则Cache 主存系统的平均访问时间ta为或若平均访问时间ta为 ta h tc 1 h tm设r tm tc表示主存慢于Cache的倍率 e表示访问效率则有 e tc ta tc h tc 1 h tm 1 h 1 h r 1 r 1 r h 为提高访问效率命中率h越接近1越好 r值以5 10为宜不宜太大命中率h与程序的行为 cache的容量组织方式块的大小有关例 CPU执行一段程序时 Cache完成存取的次数为1900次主存完成存取的次数为100次已知Cache存取周期为50ns 主存存取周期为250ns 求Cache 主存系统的效率和平均访问时间解 h NC NC Nm 1900 1900 100 0 95r tm tc 250ns 50ns 5e 1 r 1 r h 1 5 1 5 0 95 83 3 ta tc e 50ns 0 833 60ns 或ta h tc 1 h tc tm 0 95 50 1 0 95 50 250 47 5 15 62 5ns Cache基本结构主存2n个单元分成M块每块B个字节 Cache也分成同样大小的块 Cache的每一个块有一个标记指示它是主存哪一块的副本 n m b M 2m B 2b cache与主存的一致性问题如何保持一致性问题有两种写入方式第一种方式是暂时只向cache存储器写入并用标志加以注明直到经过修改的字块被从cache中替换出来时才一次写入主存第二种方式是每次写入cache存储器时也同时写入主存使cache和主存保持一致第一种方式称为标志交换 flag swap 方式只有写标志置位的字块才有必要最后从cache存储器一次写回主存所以又称其为写回法特点写操作速度快但因在此以前主存中的字块未经随时修改而可能失效第二种方式称为通过式写 write through 又称写直达法特点实现简单且能随时保持主存数据的正确性但是有可能要增加多次不必要的向主存的写入向cache存储器某一单元写入多少次也要向主存相应单元写入多少次另有一种写操作方法是当被修改的单元根本就不在cache存储器时写操作直接对主存进行而不写入cache存储器为了说明标记是否有效每个标记至少还应设置一个有效位主存与cache的地址映射为了把信息从主存复制到Cache 必须应用某种规则或方法把主存地址定位到Cache中称作地址映像在信息按照这种映像关系采用硬件方法实现装入Cache后执行程序时应将主存地址变换成Cache地址这个变换过程叫做地址变换地址的映像和变换是密切相关的基本地址映像方式有直接映像全相联映像和组相联映像等 Cache的工作速度数倍于主存全部功能由硬件实现由于转换速度快软件人员丝毫未感到Cache的存在这种特性称为Cache的透明性 1 直接映像在直接映像方式中主存和Cache中字块的对应关系如图7 3所示直接映像函数可定义为 j imod2c其中j是Cache的字块号 i是主存的字块号主存中有2m个块字块大小为2b字 Cache中有同样大小的2c个块在这种映像方式中主存的第0块第2c块第2c 1块只能映像到cache的第0块而主存的第1块第2c 1块第2c 1十1块只能映像到Cache 的第1块直接映像的优点是实现简单只需利用主存地址按某些字段直接判断即可确定所需字块是否已在Cache存储器中直接映像方式的缺点是不够灵活即主存的2t个字块只能对应唯一的Cache存储器字块因此即使Cache存储器别的许多地址空着也不能占用这使得cache存储空间得不到充分利用并降低了命中率例如某机主存为1MB 划分2048块每块512B 共分0 127组每组16块 Cache为8KB 划分16块每块512B 解 Cache容量为8KB 8KB 213 所以Cache地址为13位块的大小为512B 所以块内地址为9位块地址为4位共16个块主存容量为1MB 1MB 220 所以主存地址为20位块的大小为512B 所以块内地址为9位块地址为4位块标记为7位 Cache的每一块在块表中有一项 Cache的块地址为4位所以块表的单元数为24 块表中存放的是块标记由于块标记为7位所以块的字长为7位故快表的容量为24字 7位 2 全相联映像全相联映像方式是最灵活但成本最高的一种方式如图7 4所示它允许主存中的每一个字块映像到cache存储器的任何一个字块位置上也允许从确实已被占满的Cache存储器中替换出任何一个旧字块这是一个理想的方案实际上由于它的成本太高而不能采用标记位数从t位增加到t c位与直接映像相比使Cache标记容量加大主要问题是在访问Cache时需要和Cache的全部标记进行比较才能判断出所访主存地址的内容是否已在Cache中由于Cache速度要求高所以全部比较操作都要用硬件实现所需逻辑电路甚多以致无法用于Cache中例如某机主存为1MB 划分2048块每块512B Cache为8KB 划分16块每页512B 解 Cache容量为8KB 8KB 213 所以Cache地址为13位块的大小为512B 所以块内地址为9位块地址为4位共16个块主存容量为1MB 1MB 220 所以主存地址为20位块的大小为512B 所以块内地址为9位块地址为11位共211 2048个块 Cache的每一块在块表中有一项 Cache的块地址为4位所以块表的单元数为24 块表中存放的是块标记由于块标记为11位所以块的字长为11位故快表的容量为24字 11位 3 组相联映像组相联映像方式是直接映像和全相联映像方式的一种折衷方案组相联映像Cache组织如图7 5所示组相联映像方式的性能与复杂性介于直接映像与全相联映像两种方式之间当r 0时它就成为直接映像方式当r c时就是全相联映像方式 Cache的命中率除了与地址映像的方式有关外还与cache的容量有关 cache容量大则命中率就高但达到一定容量后命中率的提高就不明显了例如某机主存为1MB 划分2048块每块512B 共分0 255组每组8块 Cache为8KB 划分16块每块512B 共为8组每组2块解 Cache容量为8KB 8KB 213 所以Cache地址为13位共为8组所以组号为3位每组包含2个存储块所以组内块号为1位主存容量为1MB 1MB 220 所以主存地址为20位主存组号为20 13 7位例如某机主存为1MB 划分2048块每块512B 共分0 255组每组8块 Cache为8KB 划分16块每块512B 共为8组每组2块访存时根据主存地址的中间4位找到Cache页并将其标记与主存页标记进行比较判断是否是主存中的副本即访问是否命中图中由主存组号和组内块号组成标记替换算法当新的主存字块需要调入cache存储器而它的可用位置又已被占满时就产生替换算法问题两种替换算法先进先出 FIFO 算法近期最少使用 LRU 算法先进先出 FIFO 算法总是把一组中最先装入cache的块替换出去它不需要随时记录各个字块的使用情况所以实现容易开销小但不能正确反映程序的局部性近期最少使用 LRU 算法是把一组中近期最少使用的字块替换出去这种替换算法需随时记录cache中各个块的使用情况以便确定哪个块是近期最少使用的字块 LRU替换算法的平均命中率比FIFO要高并且当分组容量加大时能提高LRU替换算法的命中率 LRU是最常使用的一种算法其设计思想是把组中各块的使用情况记录在一张表上另一种随机替换法 RAND 这种算法不考虑使用情况在组内随机选择一块来替换其性能比根据使用情况的替换算法要差些多层次cache存储器 1 指令Cache和数据Cache开始实现Cache时是将指令和数据存放在同一Cache中的后来随着计算机技术的发展和处理速度的加快存取数据的操作经常会与取指令的操作发生冲突从而延迟了指令的读取发展的趋势是将指令Cache和数据Cache分开而成为两个相互独立的Cache 2 多层次Cache结构当芯片集成度提高后可以将更多的电路集成在一个微处理器芯片中于是近年来新设计的快速微处理器芯片都将Cache集成在片内片内cache的读取速度要比片外Cache快得多 Pentium微处理器的片内包含有8KB数据Cache和8KB指令Cache Cache行的长度为32B 采用两路组相联组织片内Cache的容量受芯片集成度的限制一般在几十KB以内因此命中率比大容量cache低于是推出了二级Cache方案其中第一级Cache L1 在处理器芯片内部第二级Cache L2 在片外其容量可从几十KB到几百KB 采用SRAM存储器两级cache之间一般有专用总线相连 Pentium微处理器支持片外的第二级Cache 其容量为256KB或512KB 也是采用两路组相连方案 3 cache的一致性问题虚拟存储器虚拟存储器的基本概念页式虚拟存储器段页式虚拟存储器虚拟存储器工作的全过程虚拟存储器举例 1 什么是虚拟存储器虚拟存储器只是一个容量非常大的存储器的逻辑模型不是任何实际的物理存储器它借助于磁盘等辅助存储器来扩大主存容量使之为更大或更多的程序所使用虚拟存储器指的是主存外存层次它以透明的方式给用户提供了一个比实际主存空间大得多的程序地址空间此时程序的逻辑地址称为虚拟地址虚地址程序的逻辑地址空间称为虚拟地址空间从原理上看主存外存层次和cache 主存层次有很多相似之处它们采用的地址变换及映射方法和替换策略从原理上看是相同的且都基于程序局部性原理它们遵循的原则又是把程序中最近常用的部分驻留在高速的存储器中一旦这部分变得不常用了把它们送回到低速的存储器中这种换人换出是由硬件或操作系统完成的对用户是透明的力图使存储系统的性能接近高速存储器价格接近低速存储器 2 主存外存层次的基本信息传送单位主存外存层次的基本信息传送单位可采用几种不同的方案段页或段页段是利用程序的模块化性质按照程序的逻辑结构划分成的多个相对独立部分段是利用程序的模块化性质按照程序的逻辑结构划分成的多

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第四章__主存储器

文档简介

温馨提示

最新文档

评论

第四章__主存储器

文档简介

温馨提示

最新文档

评论

相关文档