




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机组成原理,PrinciplesofComputerOrganization,广义双语教学课程,青岛理工大学校级精品课程,2,第七章存储系统,存储系统的层次结构,高速缓冲存储器Cache,MemorySystem,复习,3,评价存储器性能的主要依据是容量,速度,价格。,主存储器容量SM=Wlm,=存储器字长每个存储器的字数并行工作的存储器个数,设计存储系统的主要目标是:在尽可能低的价格下提供尽可能高的速度及尽可能大的存储容量。,存储层次MemoryHierarchy,存储体系(存储层次)是从系统结构上,通过软硬结合,把不同速度的存储器统一成一个整体。,使得从整体来看,其速度接近于最快最贵的存储器,容量却是慢速的存储器的,每位价格也接近于廉价慢速的存储器。,4,解决主存容量不足的方法是:,用存储层次的方法把高速度小容量的主存和低速度大容量的辅存统一成一个整体,形成的存储层次(主存-辅存层次)能够具有辅存的容量,接近于主存的等效速度和辅存的每位成本,使用户可以按比主存大得多的虚拟存储空间编制程序。,解决主存与CPU速度差距的方法:,在CPU中设置通用寄存器,多模块交叉存储器,存储层次的方法,存储层次的方法是在CPU和主存之间设置高速缓冲存储器,构成Cache-主存层次。,Cache-主存层次的效果,从CPU看,有了一个接近于CPU速度的高速的主存储器,但每位价格却是接近于慢速的主存的。,5,存储体系的评价,设二级存储层次由高速度小容量的M1和低速度大容量的M2组成。,1.存储层次的每位平均价格,Two-LevelMemories,6,2命中率HitRatio,存储层次的命中率H定义为由CPU产生的逻辑地址能在M1访问到(命中Hit)的概率。,H=命中次数/访存总次数。,若逻辑地址流中能在M1访问到的次数为R1,不能在M1访问到(在M2中还未调到M1)的次数为R2,则命中率,3.访问存储层次的平均访问时间,TA=HTA1+(1H)TA2,TA2是在M1未命中的代价。,7,主存储器,存储器的访问方式,随机存取RandomAccess,磁盘存储器,直接存取DirectAccess,磁带存储器,顺序存取SequentialAccess,相联存储器,相联存取AssociativeAccess,8,Cache-主存层次,Cache是位于CPU与主存之间的一个高速小容量的存储器。,Cache一般采用和CPU相同的半导体工艺制成,在物理位置上尽量靠近CPU,而不在主存模块中,最好在处理器芯片内。其速度与CPU的速度相匹配。Cache的管理全部用硬件实现。,TA=HTA1+(1H)TA2=,Cache-主存层次的平均访问时间为,HTC+(1H)(TM+TC),主存-Cache地址映射变换(MappingFunction):直接映射,相联映射(全相联),组相联映射。,常用的Cache替换算法有:LRU,FIFO,LFU,Random。,TA=HTA1+(1H)TA2=,HTC+(1H)TM,原理上,Cache-主存层次有两种工作方式:,方式1.CPU对Cache和主存都有直接访问路径。,方式2.CPU只直接访问Cache,不直接访问主存。,Cache既是Cache-主存层次中的一层,也是一个旁路存储器。,CPU发出的地址同时访问Cache和主存。如果Cache命中,则放弃对主存的访问。如果Cache不命中,则从主存读出。,当CPU需要访问存储器时,先检查Cache,此时,地址不出现在地址总线上。如果Cache不命中,才通过总线访问主存。,标准的二级存储层次。,TA=HTC+(1H)(TM),TA=HTC+(1H)(TM+TC),10,(1)直接映射DirectMapping,主存的每一块只能映射到Cache的一个特定的行。,若Cache有m行,每行n字,主存有2S块,则直接映射可表示为,Cache的行号i=主存的块号j(Modulom),11,设m=2r,n=2W,若Cache有m行,每行n字,主存有2S块,,主存地址(S+w位),Cache地址(r+w位),Cache的内容,S-r=8位,r=14位,w=2位,主存容量16MB,按字节编址,Cache容量64KB,每行4个字节。,主存地址(S+w位),选中1行,选中行内1个字,Cache地址(r+w位),CPU访存时,用主存地址中间的r=14位作为Cache行地址,选中1行Cache。把该行的Tag与主存地址中的高8位Tag比较。,若相同,则命中,用主存地址最低2位作为字地址取出1个字节数据。,若不命中,则22位地址S用于从主存中取出1个块(4字节)数据至Cache。,例如:,13,(2)相联映射AssociativeMapping,(全相联映射FullyAssociativeMapping),主存的任何块都能映象到Cache的任何行。,把主存行地址作为标志项和数据一道存入Cache。该标志项唯一地识别主存的一块。为了确定1个块是否在Cache中,Cache的控制逻辑必须同时检查每一行的标志项是否相符。,例:主存容量16MB,Cache容量64KB,16K行,每行4个字节。,主存地址,14,主存的任一块j只能映象到Cache的组i。块j可映射到组i中任一行。,(3)组相联映射Set-associativeMapping,组相联映射是对直接映射和全相联映射技术的折中,避免了二者的缺点。组间是直接映象,组内各行间是全相联映象。,设Cache有m行,主存分成与Cache行同样大小的2S块,每块n字。,Cache分成v组,每组k行。m=vk,v=2d,Cache的组号i=主存块号j(Modulov),主存容量16MB,Cache容量64KB,每行4个字节,2路组相联。,Cache行数=16K行,K=2,v=8K=2d,主存地址(S+w位),Cache地址(d+w位),CPU访存时,用主存地址中间的d=13位作为Cache组地址,选中1组Cache。把该组的2行的Tag同时与主存地址中的高9位Tag比较。,若某行的Tag与主存地址中的Tag相符合,则命中,用主存地址最低2位作为字地址从该行中取出1个字节数据。,若不命中,则用22位地址S从主存中取出1个块(4字节)数据至Cache。,16,73设某流水线计算机有一个指令和数据合一的Cache,已知Cache的读/写时间为10nS,主存的读/写时间为100nS,取指的命中率为98%,数据的命中率为95%,在执行程序时,约有1/5指令需要存/取一个操作数。为简化起见,假设指令流水线在任何时候都不阻塞。问设置Cache后与无Cache比较,计算机的运算速度可提高多少倍?,解一:,无Cache,执行5条指令的时间T1=(5+1)100=600nS,有Cache,执行5条指令的时间,T2=(100.98+(100+10)0.02)5+100.95+(100+10)0.05,=60+15=75nS,速度提高倍数=T1/T2=600/75=8倍,执行5条指令,共有6次访存。,17,73设某流水线计算机有一个指令和数据合一的Cache,已知Cache的读/写时间为10nS,主存的读/写时间为100nS,取指的命中率为98%,数据的命中率为95%,在执行程序时,约有1/5指令需要存/取一个操作数。为简化起见,假设指令流水线在任何时候都不阻塞。问设置Cache后与无Cache比较,计算机的运算速度可提高多少倍?,解二:,平均每5次取指令有1次存取操作数,所以,平均命中率HA=(0.985+0.95)/6=0.975,TA=0.97510+0.025(100+10)=9.75+2.75=12.5nS,速度提高倍数=T1/T2=100/12.5=8倍,18,Cache的读/写时间为10nS,主存的读/写时间为100nS,取指的命中率为98%,数据的命中率为95%,在执行程序时,约有1/5指令需要存/取一个操作数。假设指令流水线在任何时候都不阻塞。74接上题,如果采用哈佛结构(分开的指令Cache和数据Cache),运算速度可提高多少倍?,解:,采用哈佛结构可以并行访问指令Cache和数据Cache。如果指令Cache和数据Cache的命中率仍然和上题一样。在5次取指令中,有4次的命中率为0.98,有1次取指令的同时有存取操作数,命中率应该按0.95。,平均命中率HA=(0.984+0.95)/5=0.974,TA=0.97410+0.026(100+10),=9.74+2.86=12.6nS,速度提高倍数=TM/TA=120/12.6=9.524倍,19,75设某计算机的Cache采用四路组相联映象,已知Cache容量为16KB,主存容量为2MB,每个字块有8个字,每个字有32位。请回答:(1)主存地址多少位(按字节编址),各字段如何划分(各需多少位)?,解:,(1),主存按字节编址,容量2MB,每个可寻址单元的容量为1个字节。,2M=221,主存地址为21位。,Cache容量16KB,,每个字是32bit=4B,每行8个字,字地址3位,字节地址2位,Cache的总字数=16KB/4B=4K字,Cache的行数=41024/8=512行,(四路组相联)Cache的组数=512/4=128组组地址7位,地址结构:,20,(2)设Cache起始为空,CPU从主存单元0,1,100,依次读出101个字(主存一次读出1个字),并重复按此次序读11次,问命中率为多少?若Cache速度是主存的5倍,问采用Cache与无Cache比较速度提高多少倍?,75,解:,(2)分析Cache-主存映象关系:,主存的第i块映象到Cache的第i组(每组4行)。,主存的0100单元在012块中。,程序运行时,读0单元不命中,将第0块(8个字)装入Cache的0组。接下去读17单元都命中。读8单元不命中,将第1块(8个字)装入Cache的1组。这样,一直到读100单元,总共有13次不命中。,由于Cache有128组,所以Cache不满,在这个过程中不发生替换。,装入Cache的101个字在以后的重复访问中全部命中。,21,命中率H=命中次数/访存的总次数,75,H=(1110113)/(11101)=1098/1111=0.9883,TA=HTC+(1H)(TM+TC),TA/TM=1/5+(1H)=0.2+0.0117=0.2117,=TC+(1H)TM,TC=TM/5,TA=TM/5+(1H)TM,采用Cache速度提高倍数=TM/TA=1/0.2117=4.72倍,(2)若Cache速度是主存的5倍,问采用Cache与无Cache比较速度提高多少倍?,解:,22,第8章辅助存储器AuxiliaryMemory/ExternalMemory,辅助存储器的种类与技术指标磁盘存储器,复习,23,主存用来存放需立即使用的程序和数据,要求存取速度快。,辅存用于存放当前不需要立即使用的信息,在需要时与主存成批交换数据,是主存的后备和补充。,保存在辅存上的程序和数据必须首先装入主存,然后才能被CPU使用。,辅存的特点是容量大,成本低和非易失性。,24,辅助存储器的种类,硬磁盘存储器,软磁盘存储器,磁带存储器,电子盘(固态盘),IC卡,只读光盘CD-ROM,可写一次的光盘WORM,可擦除重写的光盘CD-RW盘,25,硬磁盘存储器、软磁盘存储器和磁带存储器都属于磁表面存储器,都是利用磁记录技术保存和读写信息的。,硬磁盘存储器在工作时,磁头与磁盘是非接触的,无磨损。,磁表面存储器,磁盘存储器常用的磁记录方式有:调频制FM和改进调频制MFM。,磁带存储器常用的磁记录方式有:调相制PM和成组编码GCR。,目前大量应用的温盘(WinchesterDisk)是一种可移动磁头固定盘片的硬磁盘存储器。,磁盘存储器属于直接存取存储器Direct-AccessStorage。,磁带存储器属于顺序存取存储器Sequential-AccessStorage。,26,磁道Track是存储在介质表面上的信息的磁化轨迹。,磁盘上的磁道是一系列同心圆组成的记录轨迹。,多个存储面处于同一半径的磁道组成圆柱面Cylinder。,相邻2条磁道中心线间的距离称为道距。,磁盘上最外圈的磁道是第0道。,磁盘格式化就是在磁盘上形成磁道和扇区的过程。,磁盘存储器的数据按存储面、圆柱面(磁道)和扇区组织,扇区是磁盘的最小可寻址单位。,磁盘地址由磁盘机号,磁头号(存储面/记录面号),磁道号(柱面号),扇区号组成。,磁盘采用CAV(恒角速度)伺服ConstantAngularVelocityServo,磁带存储器的磁道是平行于磁带长度方向的直线。,27,辅助存储器(磁表面存储器和光盘存储器)的主要技术指标:,1存储密度RecordingDensity,单位长度或单位面积磁层表面所存储的二进制信息量。,磁盘存储器的存储密度分位密度和道密度。,磁盘沿盘半径方向单位长度的磁道数称为道密度TrackDensity,单位是道/英寸TPI(TrackPerinch),或道/毫米TPM。,单位长度磁道能记录的二进制代码的位数称为磁盘存储器的位密度Track-recordingDensity,单位是位/英寸bpi(bitsperinch)或位/毫米bpm。,磁带存储器的存储密度一般用位密度表示。,28,2存储容量,能存储的二进制信息总量。用Byte和bit表示。,磁盘存储器的容量分格式化容量和非格式化容量。,非格式化容量是磁记录表面可以利用的磁化单元总数。,格式化容量FormattedCapacity是指按某种特定的记录格式所能存储信息的总量(可用)。,格式化容量约为非格式化容量的6070%。,磁道的(非格式化)存储容量=最内层的磁道长度内层位密度,磁盘组的存储容量=每个磁道的存储容量柱面数存储面数,磁道的(格式化)存储容量=扇区容量每磁道扇区数,29,3寻址时间,磁盘存储器的寻址时间,寻址时间包括两部分:,一是磁头寻找目标磁道所需要的寻道时间SeekTime(找道时间);,二是找到磁道以后,磁头等待所需要读写的区段旋转到它的下方所需要的等待时间RotationalLatency。,平均寻址时间Ta=平均寻道时间+平均等待时间,读写1个记录块的时间=寻道时间+等待时间+读写时间,30,4数据传输率DataTransferRate,数据传输率是磁表面存储器在单位时间内与主机之间传送数据的位数或字节数。,磁盘的数据传输率=磁道的存储容量每秒转速,(内部数据传输率),31,76设某计算机采用直接映象Cache,已知容量为4096B。(1)若CPU依次从主存单元0,1,99和4096,4097,4195交替取指令,循环执行10次,问命中率为多少?(2)如Cache存取时间为10ns,主存存取时间为100ns,Cache命中率为95%,求平均存取时间。,(1)主存地址0和4096,1和4097,99和4195分别映象到Cache的同一个地址单元。,解:,因此,该程序运行时,每个地址在Cache都不命中,H=0。,(2)TA=HTC+(1H)(TM+TC)=0.9510+(10.95)(100+10)=9.5+5.5=15nS,32,测验5,请写好自己的姓名、学号、班级,33,一、(共35分)设磁盘组有6个盘片,存储区域内直径22cm,外直径33cm,道密度40道/cm,内层位密度400位/cm,转速3600转/分。共有多少存储面可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 街道消防安全事件的应急预案
- 表设备采购招标文件
- 江苏省南通市海安高级中学2024-2025学年高一下学期6月阶段检测地理试卷(含答案)
- 河北省石家庄市第四十中学2024-2025学年七年级下学期期中生物试题(含答案)
- 财务会计子系统的解决方案(一)
- 2025年广东省深圳市育才二中中考英语三模试卷(含答案)
- 幼儿心理学教案得力文库
- 2024-2025学年下学期高二生物人教版期末必刷常考题之种群及其动态
- 2024-2025学年下学期高一生物沪科版期末必刷常考题之基因重组造成变异的多样性
- 建筑施工特种作业-建筑起重机械安装拆卸工(施工升降机)真题库-4
- 2025年山东省烟台市中考真题数学试题【含答案解析】
- 2025年山东将军烟草新材料科技有限公司招聘笔试冲刺题(带答案解析)
- 2025年高考真题-语文(全国一卷) 无答案
- 兵团开放大学2025年春季《公共关系学》终结考试答案
- 2025年中考语文押题作文范文10篇
- 拆迁名额转让协议书
- 2025年初中学业水平考试地理试卷(地理学科核心素养)含答案解析
- 《重大电力安全隐患判定标准(试行)》解读与培训
- 《人工智能基础与应用》课件-实训任务18 构建智能体
- 人工智能笔试题及答案
- 《老年人运动认知风险综合征健康管理中国专家共识2025》解读
评论
0/150
提交评论