计算机组成原理复习第章ppt课件.ppt_第1页
计算机组成原理复习第章ppt课件.ppt_第2页
计算机组成原理复习第章ppt课件.ppt_第3页
计算机组成原理复习第章ppt课件.ppt_第4页
计算机组成原理复习第章ppt课件.ppt_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机组成原理 PrinciplesofComputerOrganization 广义双语教学课程 校级精品课程 1 第七章存储系统 存储系统的层次结构 高速缓冲存储器Cache MemorySystem 复习 2 评价存储器性能的主要依据是容量 速度 价格 主存储器容量SM W l m 存储器字长 每个存储器的字数 并行工作的存储器个数 设计存储系统的主要目标是 在尽可能低的价格下提供尽可能高的速度及尽可能大的存储容量 存储层次MemoryHierarchy 存储体系 存储层次 是从系统结构上 通过软硬结合 把不同速度的存储器统一成一个整体 使得从整体来看 其速度接近于最快最贵的存储器 容量却是慢速的存储器的 每位价格也接近于廉价慢速的存储器 3 解决主存容量不足的方法是 用存储层次的方法把高速度小容量的主存和低速度大容量的辅存统一成一个整体 形成的存储层次 主存 辅存层次 能够具有辅存的容量 接近于主存的等效速度和辅存的每位成本 使用户可以按比主存大得多的虚拟存储空间编制程序 解决主存与CPU速度差距的方法 在CPU中设置通用寄存器 多模块交叉存储器 存储层次的方法 存储层次的方法是在CPU和主存之间设置高速缓冲存储器 构成Cache 主存层次 Cache 主存层次的效果 从CPU看 有了一个接近于CPU速度的高速的主存储器 但每位价格却是接近于慢速的主存的 4 存储体系的评价 设二级存储层次由高速度小容量的M1和低速度大容量的M2组成 1 存储层次的每位平均价格 Two LevelMemories 5 2 命中率HitRatio 存储层次的命中率H定义为由CPU产生的逻辑地址能在M1访问到 命中Hit 的概率 H 命中次数 访存总次数 若逻辑地址流中能在M1访问到的次数为R1 不能在M1访问到 在M2中还未调到M1 的次数为R2 则命中率 3 访问存储层次的平均访问时间 TA H TA1 1 H TA2 TA2是在M1未命中的代价 6 主存储器 存储器的访问方式 随机存取RandomAccess 磁盘存储器 直接存取DirectAccess 磁带存储器 顺序存取SequentialAccess 相联存储器 相联存取AssociativeAccess 7 Cache 主存层次 Cache是位于CPU与主存之间的一个高速小容量的存储器 Cache一般采用和CPU相同的半导体工艺制成 在物理位置上尽量靠近CPU 而不在主存模块中 最好在处理器芯片内 其速度与CPU的速度相匹配 Cache的管理全部用硬件实现 TA H TA1 1 H TA2 Cache 主存层次的平均访问时间为 H TC 1 H TM TC 主存 Cache地址映射变换 MappingFunction 直接映射 相联映射 全相联 组相联映射 常用的Cache替换算法有 LRU FIFO LFU Random TA H TA1 1 H TA2 H TC 1 H TM 8 原理上 Cache 主存层次有两种工作方式 方式1 CPU对Cache和主存都有直接访问路径 方式2 CPU只直接访问Cache 不直接访问主存 Cache既是Cache 主存层次中的一层 也是一个旁路存储器 CPU发出的地址同时访问Cache和主存 如果Cache命中 则放弃对主存的访问 如果Cache不命中 则从主存读出 当CPU需要访问存储器时 先检查Cache 此时 地址不出现在地址总线上 如果Cache不命中 才通过总线访问主存 标准的二级存储层次 TA H TC 1 H TM TA H TC 1 H TM TC 9 1 直接映射DirectMapping 主存的每一块只能映射到Cache的一个特定的行 若Cache有m行 每行n字 主存有2S块 则直接映射可表示为 Cache的行号i 主存的块号j Modulom 10 设m 2r n 2W 若Cache有m行 每行n字 主存有2S块 主存地址 S w位 Cache地址 r w位 Cache的内容 11 S r 8位 r 14位 w 2位 主存容量16MB 按字节编址 Cache容量64KB 每行4个字节 主存地址 S w位 选中1行 选中行内1个字 Cache地址 r w位 CPU访存时 用主存地址中间的r 14位作为Cache行地址 选中1行Cache 把该行的Tag与主存地址中的高8位Tag比较 若相同 则命中 用主存地址最低2位作为字地址取出1个字节数据 若不命中 则22位地址S用于从主存中取出1个块 4字节 数据至Cache 例如 12 2 相联映射AssociativeMapping 全相联映射FullyAssociativeMapping 主存的任何块都能映象到Cache的任何行 把主存行地址作为标志项和数据一道存入Cache 该标志项唯一地识别主存的一块 为了确定1个块是否在Cache中 Cache的控制逻辑必须同时检查每一行的标志项是否相符 例 主存容量16MB Cache容量64KB 16K行 每行4个字节 主存地址 13 主存的任一块j只能映象到Cache的组i 块j可映射到组i中任一行 3 组相联映射Set associativeMapping 组相联映射是对直接映射和全相联映射技术的折中 避免了二者的缺点 组间是直接映象 组内各行间是全相联映象 设Cache有m行 主存分成与Cache行同样大小的2S块 每块n字 Cache分成v组 每组k行 m v k v 2d Cache的组号i 主存块号j Modulov 14 主存容量16MB Cache容量64KB 每行4个字节 2路组相联 Cache行数 16K行 K 2 v 8K 2d 主存地址 S w位 Cache地址 d w位 CPU访存时 用主存地址中间的d 13位作为Cache组地址 选中1组Cache 把该组的2行的Tag同时与主存地址中的高9位Tag比较 若某行的Tag与主存地址中的Tag相符合 则命中 用主存地址最低2位作为字地址从该行中取出1个字节数据 若不命中 则用22位地址S从主存中取出1个块 4字节 数据至Cache 15 7 3设某流水线计算机有一个指令和数据合一的Cache 已知Cache的读 写时间为10nS 主存的读 写时间为100nS 取指的命中率为98 数据的命中率为95 在执行程序时 约有1 5指令需要存 取一个操作数 为简化起见 假设指令流水线在任何时候都不阻塞 问设置Cache后与无Cache比较 计算机的运算速度可提高多少倍 解一 无Cache 执行5条指令的时间T1 5 1 100 600nS 有Cache 执行5条指令的时间 T2 10 0 98 100 10 0 02 5 10 0 95 100 10 0 05 60 15 75nS 速度提高倍数 T1 T2 600 75 8倍 执行5条指令 共有6次访存 16 7 3设某流水线计算机有一个指令和数据合一的Cache 已知Cache的读 写时间为10nS 主存的读 写时间为100nS 取指的命中率为98 数据的命中率为95 在执行程序时 约有1 5指令需要存 取一个操作数 为简化起见 假设指令流水线在任何时候都不阻塞 问设置Cache后与无Cache比较 计算机的运算速度可提高多少倍 解二 平均每5次取指令有1次存取操作数 所以 平均命中率HA 0 98 5 0 95 6 0 975 TA 0 975 10 0 025 100 10 9 75 2 75 12 5nS 速度提高倍数 T1 T2 100 12 5 8倍 17 Cache的读 写时间为10nS 主存的读 写时间为100nS 取指的命中率为98 数据的命中率为95 在执行程序时 约有1 5指令需要存 取一个操作数 假设指令流水线在任何时候都不阻塞 7 4接上题 如果采用哈佛结构 分开的指令Cache和数据Cache 运算速度可提高多少倍 解 采用哈佛结构可以并行访问指令Cache和数据Cache 如果指令Cache和数据Cache的命中率仍然和上题一样 在5次取指令中 有4次的命中率为0 98 有1次取指令的同时有存取操作数 命中率应该按0 95 平均命中率HA 0 98 4 0 95 5 0 974 TA 0 974 10 0 026 100 10 9 74 2 86 12 6nS 速度提高倍数 TM TA 120 12 6 9 524倍 18 7 5设某计算机的Cache采用四路组相联映象 已知Cache容量为16KB 主存容量为2MB 每个字块有8个字 每个字有32位 请回答 1 主存地址多少位 按字节编址 各字段如何划分 各需多少位 解 1 主存按字节编址 容量2MB 每个可寻址单元的容量为1个字节 2M 221 主存地址为21位 Cache容量16KB 每个字是32bit 4B 每行8个字 字地址3位 字节地址2位 Cache的总字数 16KB 4B 4K字 Cache的行数 4 1024 8 512行 四路组相联 Cache的组数 512 4 128组 组地址7位 地址结构 19 2 设Cache起始为空 CPU从主存单元0 1 100 依次读出101个字 主存一次读出1个字 并重复按此次序读11次 问命中率为多少 若Cache速度是主存的5倍 问采用Cache与无Cache比较速度提高多少倍 7 5 解 2 分析Cache 主存映象关系 主存的第i块映象到Cache的第i组 每组4行 主存的0 100单元在0 12块中 程序运行时 读0单元不命中 将第0块 8个字 装入Cache的0组 接下去读1 7单元都命中 读8单元不命中 将第1块 8个字 装入Cache的1组 这样 一直到读100单元 总共有13次不命中 由于Cache有128组 所以Cache不满 在这个过程中不发生替换 装入Cache的101个字在以后的重复访问中全部命中 20 命中率H 命中次数 访存的总次数 7 5 H 11 101 13 11 101 1098 1111 0 9883 TA H TC 1 H TM TC TA TM 1 5 1 H 0 2 0 0117 0 2117 TC 1 H TM TC TM 5 TA TM 5 1 H TM 采用Cache速度提高倍数 TM TA 1 0 2117 4 72倍 2 若Cache速度是主存的5倍 问采用Cache与无Cache比较速度提高多少倍 解 21 第8章辅助存储器AuxiliaryMemory ExternalMemory 辅助存储器的种类与技术指标磁盘存储器 复习 22 主存用来存放需立即使用的程序和数据 要求存取速度快 辅存用于存放当前不需要立即使用的信息 在需要时与主存成批交换数据 是主存的后备和补充 保存在辅存上的程序和数据必须首先装入主存 然后才能被CPU使用 辅存的特点是容量大 成本低和非易失性 23 辅助存储器的种类 硬磁盘存储器 软磁盘存储器 磁带存储器 电子盘 固态盘 IC卡 只读光盘CD ROM 可写一次的光盘WORM 可擦除重写的光盘CD RW盘 24 硬磁盘存储器 软磁盘存储器和磁带存储器都属于磁表面存储器 都是利用磁记录技术保存和读写信息的 硬磁盘存储器在工作时 磁头与磁盘是非接触的 无磨损 磁表面存储器 磁盘存储器常用的磁记录方式有 调频制FM和改进调频制MFM 磁带存储器常用的磁记录方式有 调相制PM和成组编码GCR 目前大量应用的温盘 WinchesterDisk 是一种可移动磁头固定盘片的硬磁盘存储器 磁盘存储器属于直接存取存储器Direct AccessStorage 磁带存储器属于顺序存取存储器Sequential AccessStorage 25 磁道Track是存储在介质表面上的信息的磁化轨迹 磁盘上的磁道是一系列同心圆组成的记录轨迹 多个存储面处于同一半径的磁道组成圆柱面Cylinder 相邻2条磁道中心线间的距离称为道距 磁盘上最外圈的磁道是第0道 磁盘格式化就是在磁盘上形成磁道和扇区的过程 磁盘存储器的数据按存储面 圆柱面 磁道 和扇区组织 扇区是磁盘的最小可寻址单位 磁盘地址由磁盘机号 磁头号 存储面 记录面号 磁道号 柱面号 扇区号组成 磁盘采用CAV 恒角速度 伺服ConstantAngularVelocityServo 磁带存储器的磁道是平行于磁带长度方向的直线 26 辅助存储器 磁表面存储器和光盘存储器 的主要技术指标 1 存储密度RecordingDensity 单位长度或单位面积磁层表面所存储的二进制信息量 磁盘存储器的存储密度分位密度和道密度 磁盘沿盘半径方向单位长度的磁道数称为道密度TrackDensity 单位是道 英寸TPI TrackPerinch 或道 毫米TPM 单位长度磁道能记录的二进制代码的位数称为磁盘存储器的位密度Track recordingDensity 单位是位 英寸bpi bitsperinch 或位 毫米bpm 磁带存储器的存储密度一般用位密度表示 27 2 存储容量 能存储的二进制信息总量 用Byte和bit表示 磁盘存储器的容量分格式化容量和非格式化容量 非格式化容量是磁记录表面可以利用的磁化单元总数 格式化容量FormattedCapacity是指按某种特定的记录格式所能存储信息的总量 可用 格式化容量约为非格式化容量的60 70 磁道的 非格式化 存储容量 最内层的磁道长度 内层位密度 磁盘组的存储容量 每个磁道的存储容量 柱面数 存储面数 磁道的 格式化 存储容量 扇区容量 每磁道扇区数 28 3 寻址时间 磁盘存储器的寻址时间 寻址时间包括两部分 一是磁头寻找目标磁道所需要的寻道时间SeekTime 找道时间 二是找到磁道以后 磁头等待所需要读写的区段旋转到它的下方所需要的等待时间RotationalLatency 平均寻址时间Ta 平均寻道时间 平均等待时间 读写1个记录块的时间 寻道时间 等待时间 读写时间 29 4 数据传输率DataTransferRate 数据传输率是磁表面存储器在单位时间内与主机之间传送数据的位数或字节数 磁盘的数据传输率 磁道的存储容量 每秒转速 内部数据传输率 30 7 6设某计算机采用直接映象Cache 已知容量为4096B 1 若CPU依次从主存单元0 1 99和4096 4097 4195交替取指令 循环执行10次 问命中率为多少 2 如Cache存取时间为10ns 主存存取时间为100ns Cache命中率为95 求平均存取时间 1 主存地址0和4096 1和4097 99和4195分别映象到Cache的同一个地址单元 解 因此 该程序运行时 每个地址在Cache都不命中 H 0 2 TA H TC 1 H TM TC 0 95 10 1 0 95 100 10 9 5 5 5 15nS 31 测验5 请写好自己的姓名 学号 班级 32 一 共35分 设磁盘组有6个盘片 存储区域内直径22cm 外直径33cm 道密度40道 cm 内层位密度400位 cm 转速3600转 分 共有多少存储面可用 共有多少柱面 盘组总存储容量是多少 数据传输率是多少 二 共

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论