




文档简介
第四章 存储系统习题课第四章 存储系统习题课 前四章 小结前四章 小结 从使用者从使用者 程序员视角理解计算机硬件系统设计 从设计者 程序员视角理解计算机硬件系统设计 从设计者 硬件设计的视角理解程序执行硬件设计的视角理解程序执行 主讲老师 主讲老师 刘景宁刘景宁 公用邮箱 公用邮箱 ccshust 密码密码 办公室 武汉国家光电实验室办公室 武汉国家光电实验室F306 冯丹实验室网站 冯丹实验室网站 计算机组成原理新书课件计算机组成原理新书课件 课程的参考书目 课程的参考书目 1 美美 DAVID A PATTERSON JOHN L HENNESSY 计算机组 成与设计硬件 计算机组 成与设计硬件 软件接口软件接口 原书第原书第4版版 机械工业出版社机械工业出版社 2 美美 RANDAL E BRYANT DAVID O HALLARON 深入理解 计算机系统 深入理解 计算机系统 修订版 修订版 08年度畅销榜年度畅销榜TOP50 中国电力出版社中国电力出版社 3 唐朔飞唐朔飞 计算机组成原理计算机组成原理 第第2版版 高等教育出版社高等教育出版社 4 袁春风袁春风 计算机组成与系统结构计算机组成与系统结构 清华大学出版社清华大学出版社2011 03 5 徐爱萍徐爱萍 计算机组成原理考研指导计算机组成原理考研指导清华大学出版社清华大学出版社2003 01 课件课件 评分标准 12 年 评分标准 12 年 平时成绩 出勤率 随机抽查 作业 平时成绩 出勤率 随机抽查 作业 10 10 平均値3次 平均値3次 课堂提问课堂提问 随堂测试随堂测试 动脑筋挑战题动脑筋挑战题 10 10 实验成绩 实验成绩 运算器 存储器 时序电路 实验室开放 运算器 存储器 时序电路 实验室开放 15 课外实践大作业 15 课外实践大作业 2个 每章习题后或协商自选 2个 每章习题后或协商自选 30 30 期末考试 期末考试 55 55 请假 请假 特殊情况特殊情况不能来上课和不能来上课和不能按时完成老师布置任务不能按时完成老师布置任务的 要及时请假 请假条需要 的 要及时请假 请假条需要辅导员签字辅导员签字 强调 强调 学期末不接受学生补交作业 允许延迟一次 学期末不接受补做实验的要求 学期末不接受学生补交作业 允许延迟一次 学期末不接受补做实验的要求 关于重修生 必须随堂交作业 随堂做实验 否则没有相应成绩关于重修生 必须随堂交作业 随堂做实验 否则没有相应成绩 第一章 计算机系统概述第一章 计算机系统概述 计算机硬件系统计算机硬件系统的组成框图及各部件的主要功能的组成框图及各部件的主要功能 计算机工作的主要过程 计算机工作的主要过程 P8 图图1 4 控制器产生控制信号的依据 指令控制器产生控制信号的依据 指令 状态寄存器和时序状态寄存器和时序 图图1 3 性能指标性能指标 数据的宽度数据的宽度 位 字节 字位 字节 字 不一定等于字长不一定等于字长 k K M G 有不同含义有不同含义 数据的存储排列数据的存储排列 大端方式 用大端方式 用MSB存放的地址表示数据的地址存放的地址表示数据的地址 小端方式 用小端方式 用LSB存放的地址表示数据的地址存放的地址表示数据的地址 按边界对齐可减少访存次数按边界对齐可减少访存次数 数据的纠错和检错数据的纠错和检错 奇偶校验 适应于单字节长数据的校验奇偶校验 适应于单字节长数据的校验 海明校验 分组海明校验 分组 各组内奇偶校验各组内奇偶校验 用于内存储器数据校验用于内存储器数据校验 循环冗余校验 用在通信和外存中 适合大批量数据校验循环冗余校验 用在通信和外存中 适合大批量数据校验 第二讲 计算机性能评价第二讲 计算机性能评价 衡量计算机性能的基本指标衡量计算机性能的基本指标 响应时间 响应时间 response time 执行时间 执行时间 execution Time 等待时间 等待时间 latency throughput 吞吐量 吞吐量 带宽 带宽 bandwidth 计算机性能测量计算机性能测量 指令执行速度 指令执行速度 MIPS MFLOPS 基准程序 基准程序 Benchmark 表示表示每秒执行每秒执行多少多少百万条指令百万条指令 定点数运算定点数运算 f CPI MIPS 10 6 时钟周期时间 时钟周期时间 IC IC CPI IC ICCPI i n 1i i ii 每秒执行每秒执行百万百万浮点操作浮点操作次数次数 是基于 是基于 操作操作而非而非指令指令 MFLOPS 程序中的程序中的浮点运算次数浮点运算次数 执行时间 执行时间 106 CPU时间的公式 时间的公式 CPU时间时间 程序中所有指令的时钟周期数之和 时钟周期时间长度程序中所有指令的时钟周期数之和 时钟周期时间长度 程序中所有指令的时钟周期数之和程序中所有指令的时钟周期数之和 时钟频率时钟频率 CPI IC 时钟周期长度 时钟周期长度 题 假定某计算机1题 假定某计算机1和计算机2和计算机2以不同的方式实现了相同的指令集 该指令集中 共有A B C D E类指令 机器1和机器2的时钟周期为800MHZ和1600MHZ 各类指令在两机器上的CPI如表所示 以不同的方式实现了相同的指令集 该指令集中 共有A B C D E类指令 机器1和机器2的时钟周期为800MHZ和1600MHZ 各类指令在两机器上的CPI如表所示 ABCDE M1的CPI ABCDE M1的CPI1 112234 M2的CPI 12234 M2的CPI2 22245622456 求 求 1 问两机器的1 问两机器的峰值峰值MIPS各为多少 2 假定某P程序的指令序列中5类指令具有完全相同的指令条数 问在两台机 器运行该程序的 MIPS各为多少 2 假定某P程序的指令序列中5类指令具有完全相同的指令条数 问在两台机 器运行该程序的平均时钟周期数CPI平均时钟周期数CPI各是多少 在哪问该程序在哪一台机器上 运行更快 各是多少 在哪问该程序在哪一台机器上 运行更快 快快多少 多少 6 CPI 10 时 钟 频 率 800 1 800MIPS 800 1 800MIPS 2 因P程序的指令序列中5类指令具有完全相同的指令条数均占1 5 M1的 CPI 2 因P程序的指令序列中5类指令具有完全相同的指令条数均占1 5 M1的 CPI1 1 1 2 2 3 4 1 2 2 3 4 5 2 4 5 2 4 M2的CPI为 CPIM2的CPI为 CPI2 2 2 2 4 5 6 5 2 2 4 5 6 5 3 83 8 因频 率不同 不能说明程序P在M1上更快 CPU时间 CPI 指令条数 CPU时钟周期 假设程序P执行指令数为N 则程序P在M1上执行时间 因频 率不同 不能说明程序P在M1上更快 CPU时间 CPI 指令条数 CPU时钟周期 假设程序P执行指令数为N 则程序P在M1上执行时间T1 T1 2 42 4 N 1 0 8 N 1 0 8 3 0N ns3 0N ns 则程序P在M2上执行时间为则程序P在M2上执行时间为T2 T2 3 83 8 N 1 1 6 2 375N ns N 1 1 6 2 375N ns 说明程序P在M2上更快 平均每条指令快0 625ns 解 说明程序P在M2上更快 平均每条指令快0 625ns 解 1 提示计算峰值 提示计算峰值MIPS应该选择应该选择CPI最少的指令 故可以机器 最少的指令 故可以机器1中选择一端全部由中选择一端全部由A类指令组成的程序 其为峰值 类指令组成的程序 其为峰值MIPS 机器机器2中选择一端全部由中选择一端全部由A类和类和B类指令组成的程序 其为峰值 类指令组成的程序 其为峰值MIPS 6 CPI 10 时 钟 频 率 1600 2 800MIPS 第二章 计算机中数据的表示法第二章 计算机中数据的表示法 计算机内部编码后的计算机内部编码后的数数称为称为机器数机器数 其 其值值称为称为真值真值 定义数值数据有三个要素 定义数值数据有三个要素 进制 小数点进制 小数点 定点定点 浮点浮点 编码 编码 机器码机器码 定点数编码 定点数编码 原码 补码 移码原码 补码 移码 定点整数 表示整数或浮点数中指数定点整数 表示整数或浮点数中指数 阶码阶码 定点小数 表示浮点数中的尾数定点小数 表示浮点数中的尾数 整数的表示整数的表示 无符号数 正整数 用来表示地址等 带符号整数 用补码表示无符号数 正整数 用来表示地址等 带符号整数 用补码表示 浮点数的表示浮点数的表示 符号 指数符号 指数 阶阶 定点整数 尾数定点整数 尾数 定点小数定点小数 浮点数的范围浮点数的范围 不可表示的区域 正上溢 正下溢 负上溢 负下溢 与阶码位数有关不可表示的区域 正上溢 正下溢 负上溢 负下溢 与阶码位数有关 浮点数的精度浮点数的精度 与尾数的位数和是否规格化有关 规格化操作 左规 右规与尾数的位数和是否规格化有关 规格化操作 左规 右规 浮点数的表示 浮点数的表示 IEEE754标准 标准 单精度单精度SP float 和双精度和双精度DP double 规格化数规格化数 SP 阶码 阶码1 254 尾数最高位隐含为 尾数最高位隐含为1 零零 阶为全阶为全0 尾为全 尾为全0 阶为全阶为全1 尾为全 尾为全0 NaN 阶为全阶为全1 尾为非 尾为非0 非规格化数非规格化数 阶为全阶为全0 尾为非 尾为非0 十进制数的表示 十进制数的表示 用用ASCII码 码 BCD码表示码表示 第一讲 数值数据的表示第一讲 数值数据的表示 第二讲小结第二讲小结 非数值数据的表示非数值数据的表示 逻辑数据用来表示真逻辑数据用来表示真 假 或假 或 N位位串 按位运算位位串 按位运算 西文字符 用西文字符 用ASCII 码表示码表示 汉字 汉字输入码 汉字内码 汉字字模码汉字 汉字输入码 汉字内码 汉字字模码 数据的宽度数据的宽度 位 字节 字 位 字节 字 k K M G 有不同的含义有不同的含义 数据的存储排列数据的存储排列 大端方式 用大端方式 用MSB存放的地址 表示数据的地址存放的地址 表示数据的地址 小端方式 用小端方式 用LSB存放的 地址 表示数据的地址存放的 地址 表示数据的地址 按边界对齐可减少访存次数按边界对齐可减少访存次数 数据的纠错和检错数据的纠错和检错 奇偶校验 适应于一字节长数据的校验奇偶校验 适应于一字节长数据的校验 海明校验 分组 各组内用奇偶校验 用于内存储器数据的校验海明校验 分组 各组内用奇偶校验 用于内存储器数据的校验 循环冗余校验 用在通信和外存中 适合于大批量数据的校验循环冗余校验 用在通信和外存中 适合于大批量数据的校验 非数值数据表示及 数据的宽度 存储排列 纠非数值数据表示及 数据的宽度 存储排列 纠 检错检错 第三章 运算方法与运算器第三章 运算方法与运算器 定点数的加 减运算 用变形补码 与溢出判断定点数的加 减运算 用变形补码 与溢出判断 定点数原码 补码定点数原码 补码一位乘法一位乘法运算 运算 原码 补码原码 补码 不恢复余数除法不恢复余数除法运算运算 先行进位电路先行进位电路CLA74182原理 利用原理 利用74182及及74181电路 构造 电路 构造多级先行进位电路多级先行进位电路 必须掌握必须掌握浮点数补码浮点数补码的的加减运算 对阶 尾数运算 加减运算 对阶 尾数运算 结果结果结果 结果 规格化 上溢规格化 上溢规格化 上溢规格化 上溢 下溢处理 下溢处理 下溢处理 舍入处理下溢处理 舍入处理 浮点数的精度问题浮点数的精度问题 中间结果加保护位 舍入位 和粘滞位 中间结果加保护位 舍入位 和粘滞位 最终进行舍入 有四种舍入方式 最终进行舍入 有四种舍入方式 最近最近 中间值强迫为偶数中间值强迫为偶数 方向 方向 方向 方向 0方向方向 默认为默认为 最近最近 舍入方式舍入方式 习题必须做 习题必须做 熟练掌握熟练掌握 第三章总结 第三章总结 1 定点数运算 由定点数运算 由ALU 移位器实现各种定点运算移位器实现各种定点运算 移位运算移位运算 逻辑移位 对无符号数进行 左 右 边补逻辑移位 对无符号数进行 左 右 边补0 低 高 位移出 低 高 位移出 算术移位 对带符号整数进行 移位前后符号位不变 编码不同 方式不同 算术移位 对带符号整数进行 移位前后符号位不变 编码不同 方式不同 循环移位 最左 右 边位移到最低 高 位 其他位左 右 移一位 循环移位 最左 右 边位移到最低 高 位 其他位左 右 移一位 扩展运算扩展运算 零扩展 对无符号整数进行高位补零扩展 对无符号整数进行高位补0 符号扩展 对补码整数在高位直接补符号符号扩展 对补码整数在高位直接补符号 加减运算加减运算 补码加补码加 减运算 用于整数加减运算 用于整数加 减运算 符号位和数值位一起运算 减法用加法实 现 同号相加时 若结果的符号不同于加数的符号 则会发生溢出 减运算 符号位和数值位一起运算 减法用加法实 现 同号相加时 若结果的符号不同于加数的符号 则会发生溢出 原码加原码加 减运算 用于浮点数尾数加减运算 用于浮点数尾数加 减运算 符号位和数值位分开运算 同号相 加 异号相减 加法直接加 减法用加负数补码实现 减运算 符号位和数值位分开运算 同号相 加 异号相减 加法直接加 减法用加负数补码实现 乘法运算 用加法和右移实现 乘法运算 用加法和右移实现 补码乘法 用于整数乘法运算 符号位和数值位一起运算 采用补码乘法 用于整数乘法运算 符号位和数值位一起运算 采用Booth算法 算法 原码乘法 用于浮点数尾数乘法运算 符号位和数值位分开运算 数值部分用 无符号数乘法实现 原码乘法 用于浮点数尾数乘法运算 符号位和数值位分开运算 数值部分用 无符号数乘法实现 除法运算 用加除法运算 用加 减法和左移实现 减法和左移实现 补码除法 用于整数除法运算 符号位和数值位一起运算 补码除法 用于整数除法运算 符号位和数值位一起运算 原码除法 用于浮点数尾数除法运算 符号位和数值位分开运算 数值部分用 无符号数除法实现 原码除法 用于浮点数尾数除法运算 符号位和数值位分开运算 数值部分用 无符号数除法实现 第三章总结 第三章总结 2 浮点数运算 由多个浮点数运算 由多个ALU 移位器实现移位器实现 加减运算加减运算 对阶 尾数相加减 规格化处理 舍入 判断溢出对阶 尾数相加减 规格化处理 舍入 判断溢出 乘除运算乘除运算 尾数用定点原码乘尾数用定点原码乘 除运算实现 阶码用定点数加除运算实现 阶码用定点数加 减运算实现 减运算实现 溢出判断溢出判断 当结果发生阶码上溢时 结果发生溢出 发生阶码下溢时 结果为当结果发生阶码上溢时 结果发生溢出 发生阶码下溢时 结果为0 精确表示运算结果精确表示运算结果 中间结果增设保护位 舍入位 粘位中间结果增设保护位 舍入位 粘位 最终结果舍入方式 就近舍入最终结果舍入方式 就近舍入 正向舍入正向舍入 负向舍入负向舍入 截去四种方式 截去四种方式 ALU的实现的实现 算术逻辑单元算术逻辑单元ALU 实现基本的加减运算和逻辑运算 实现基本的加减运算和逻辑运算 溢出的判断方法溢出的判断方法 加法运算是所有定点和浮点运算 加加法运算是所有定点和浮点运算 加 减减 乘乘 除 的基础 加法速度至关重要除 的基础 加法速度至关重要 进位方式是影响加法速度的重要因素进位方式是影响加法速度的重要因素 并行进位方式能加快加法速度并行进位方式能加快加法速度 通过通过 进位生成进位生成 和和 进位传递进位传递 函数来使各进位独立 并行产生函数来使各进位独立 并行产生 C语言程序中涉及的运算语言程序中涉及的运算 算术运算算术运算 最基本的运算 最基本的运算 无符号数 带符号整数 浮点数的运算无符号数 带符号整数 浮点数的运算 按位运算按位运算 用途用途 对一个位串对一个位串实现实现 掩码掩码 mask 操作或相应的其他处理 主要用于对多媒体数据 操作或相应的其他处理 主要用于对多媒体数据或控制信息或控制信息进行处理 进行处理 操作操作 按位或 按位或 按位与 按位与 unsigned short usi si int i si unsingned ui usi si 12345 CF C7 usi 53191 CF C7 i 12345 FF FF CF C7 ui 53191 00 00 CF C7 例例2 在大端机上执行后 在大端机上执行后 i和和j是否相等 是否相等 int i 53191 short si short i int j si 不相等 不相等 i 53191 00 00 CF C7 si 12345 CF C7 j 12345 FF FF CF C7 原因 对原因 对i截断时发生了截断时发生了 溢 出 溢 出 即 即 53191截断为截断为16位 数时 无法正确表示 位 数时 无法正确表示 第四章 小结1 第四章 小结1 主存储器主存储器 存储器的分类存储器的分类 按存取方式分 按存取方式分 随机 顺序 直接 相联随机 顺序 直接 相联 按存储介质分 半导体 磁表面 激光盘按存储介质分 半导体 磁表面 激光盘 按信息可更改性 可读可写 只读按信息可更改性 可读可写 只读 按断电后可否保存 易失 非易失按断电后可否保存 易失 非易失 按功能按功能 容量容量 速度分 寄存器速度分 寄存器 Cache 主存主存 内存内存 辅存辅存 外存外存 存储器的扩展 存储器的扩展 字扩展 位扩展 字位同时扩展 地址范围的分析 字扩展 位扩展 字位同时扩展 地址范围的分析 非连续地址范围的存储器扩展 非连续地址范围的存储器扩展 ROM和和RAM混合存储器扩展混合存储器扩展 动态存储器的刷新动态存储器的刷新 刷新是按行进行的 刷新地址有刷新计数确定 三种刷新方式 刷新是按行进行的 刷新地址有刷新计数确定 三种刷新方式 集中 分散 异步集中 分散 异步 多体交叉编址存储器多体交叉编址存储器 连续编址 连续编址 按高位地址划分模块按高位地址划分模块 交叉编址 交叉编址 按低位地址划分模块按低位地址划分模块 信息的存储 传送 处理单位的含义信息的存储 传送 处理单位的含义 记忆单元记忆单元 编址单位编址单位 存储单位 寻址单位存储单位 寻址单位 传输单位传输单位 机器字长机器字长 第四章 小结第四章 小结2 高速缓冲存储器高速缓冲存储器Cache 存储体系 三级体系结构 存储体系 三级体系结构 速度从快到慢 容量从小到大 价格从贵到便宜 按与 速度从快到慢 容量从小到大 价格从贵到便宜 按与 CPU连接的距离由近到远的顺序 构成的分层次结构为 寄存器 连接的距离由近到远的顺序 构成的分层次结构为 寄存器 Cache 主存 磁盘 主存 磁盘 光盘 磁带 光盘 磁带 Cache工作原理工作原理 程序访问局部化特性 时间局部性 空间局部性 程序访问局部化特性 时间局部性 空间局部性 Cache和主存之间的映射方式和主存之间的映射方式 直接映射 直接映射 地址地址 标志标志 cache行索引行索引 块内地址块内地址 全相联映射 全相联映射 地址地址 标志标志 块内地址块内地址 组相联映射组相联映射 组间直接映射 组内全映射组间直接映射 组内全映射 地址地址 标志标志 cache组索引组索引 块内地址块内地址 cache的命中率计算的命中率计算 具有具有Cache机制的机制的CPU的基本访问主存过程的基本访问主存过程 Cache的写策略 替换策略的写策略 替换策略 Write Back 和和Write Through 第四章 小结第四章 小结3 虚拟存储器 虚拟存储器 虚拟存储器的基本概念虚拟存储器的基本概念 按需调用按需调用 虚拟地址空间虚拟地址空间 虚拟存储器方式虚拟存储器方式 三种方式 页式 段式 段页式三种方式 页式 段式 段页式 虚拟地址虚拟地址 物理地址的转换物理地址的转换 页表 快页表页表 快页表TLB 慢页表 慢页表 缺页处理缺页处理 替换策略替换策略 存储保护存储保护 存储区域越界检查存储区域越界检查 存取权限检查存取权限检查 磁盘的工作原理磁盘的工作原理 把经常要查的页表项放到把经常要查的页表项放到Cache 中 这种在中 这种在Cache中的页表项组 成的页表称为 中的页表项组 成的页表称为快表快表TLB Translation Lookaside Buffer 举例 举例 CPU和主存的连接和主存的连接 CPU地址线地址线A15 A0 数据线 数据线D7 D0 WR为读为读 写信号 写信号 MREQ为访存请求信号 为访存请求信号 0000H 3FFFH为系统程 序区 为系统程 序区 4000H FFFFH为用户程序区 用为用户程序区 用8K 4位位ROM芯片和芯片和16K 8位位RAM芯片构成该存储器 要求说明地 址译码方案 并将 芯片构成该存储器 要求说明地 址译码方案 并将ROM芯片 芯片 RAM芯片与芯片与CPU连接 解 连接 解 因为因为0000H 3FFFH为系统程序区 为系统程序区 ROM区高两位总是区高两位总是00 低 低14位为全译码 位为全译码 ROM区大小为 区大小为 214 8位位 16K 8位位 16KB ROM芯片数为 芯片数为 16K 8位位 8K 4位位 2 2 8 字方向扩展 字方向扩展2倍 位方向扩展倍 位方向扩展2倍倍 ROM芯片内地址位数为芯片内地址位数为13位 连到位 连到CPU低低13位地址线位地址线A12 A0 因为因为4000H FFFFH为用户程序区 为用户程序区 RAM区高两位是区高两位是01 10 11 低 低14位为全译码 位为全译码 RAM区大小为 区大小为 3 214 8位位 3 16K 8位位 48KB RAM芯片数为 芯片数为 48K 8位位 16K 8位位 3 1 3 字方向上扩展 字方向上扩展3倍 位方向上不扩展 倍 位方向上不扩展 RAM芯片内地址位数为芯片内地址位数为14位 连到位 连到CPU低低14位地址线位地址线A13 A0 片选信号CS是哪一个 片选信号CS是哪一个 问题 为什么问题 为什么WR不 连到 不 连到ROM芯片上 芯片上 ROM芯片的片选信号 由最高三位确定 芯片的片选信号 由最高三位确定 RAM芯片的片选信 号由最高两位确定 芯片的片选信 号由最高两位确定 因为因为ROM芯片只能 读 不能写 只要选中 就是读 无需读写信号 芯片只能 读 不能写 只要选中 就是读 无需读写信号 问题 问题 MREQ信号 的作用是什么 信号 的作用是什么 为有效为有效 低电平低电平 时 表示选中主存读写 时 表示选中主存读写 问题 是交叉还是 连续编址方案 问题 是交叉还是 连续编址方案 高位地址译码作为 片选信号 故是连 续编址 高位地址译码作为 片选信号 故是连 续编址 000001 01X 11X 举例 举例 128MB的的DRAM存储器存储器 同一同一行 列地 址为 行 列地 址为 i j 上的上的8 个芯片上单元个芯片上单元 总容量总容量128 MB 由由8片片DRAM芯片构成芯片构成 每片每片 16Mx8 bits 行地址 列地址各行地址 列地址各12位位 为什么呢 为什么呢 每每1行共行共4096列列 8位位 列列 选中某一行并读出之后再 由列地址选择其中的一列 选中某一行并读出之后再 由列地址选择其中的一列 8个二进位个二进位 送出送出 存储控制器存储控制器 行地址行地址i 列地址列地址j DRAM 7 DRAM 0 03178151623243263394047485556 bits 0 7 bits 8 15 bits 16 23 bits 24 31 bits 32 39 bits 40 47 bits 48 55 bits 56 63 最多读最多读64位位 03178151623243263394047485556 主存储器地址主存储器地址 A 处的处的64 bit数据数据 地址地址A 4096行行 问题 地址范围 问题 地址范围 存储器地址位数存储器地址位数27位 片内地址位 片内地址24位 与高 位 与高24位存储器地址相同 范围 位存储器地址相同 范围 000000 FFFFFFH 低3位地址的作用是什么 低3位地址的作用是什么 确定8个字节中的哪个 用来进行片选 确定8个字节中的哪个 用来进行片选 问题 芯片 内地址是否 连续 问题 芯片 内地址是否 连续 不连续 是交叉编 址方式 可同时读 写所有芯 片 不连续 是交叉编 址方式 可同时读 写所有芯 片 问题 如果 高位地址用 作片选 则 情况如何 问题 如果 高位地址用 作片选 则 情况如何 连续编址 不可同时读 写多个芯片 连续编址 不可同时读 写多个芯片 动脑筋题 动脑筋题 用用2K 8的芯片设计一个的芯片设计一个8k 16的存储器 要求 的存储器 要求 既可访问一个字既可访问一个字16位 也能访问奇字节 或偶字节 先设计将 位 也能访问奇字节 或偶字节 先设计将2k 8扩展成扩展成2k 16的模块 模块地址的模块 模块地址A11 A1 例 例 B 0访问访问8位 数 位 数 字节寻址控制字节寻址控制 选中偶存储体选中偶存储体 A0 0 CS1 0 选中奇存储体 选中奇存储体 A0 1 CS2 0 例 增加字寻址控制例 增加字寻址控制 B 1 选中奇偶双个存储体选中奇偶双个存储体 DBUS 16 位位 2K 8位位 1CS 偶存储体偶存储体 2K 8位位 2CS 奇存储体奇存储体 A11 A1 88 需需4个这样存储体个这样存储体 动脑筋挑战题动脑筋挑战题 09年年 一种解题思路 一种解题思路 增加字寻址控制增加字寻址控制B位 位 选中单个选中单个 奇 偶奇 偶 双个存储体 双个存储体 这个例子中的这个例子中的B 选的并不好 可 有更好的思路 选的并不好 可 有更好的思路 注意 存储器字节编址和寻址单位注意 存储器字节编址和寻址单位 存储单位 存储单位 题 题 用用2K 8的芯片设计一个的芯片设计一个8k 16的存储器 当 的存储器 当 B 1时访问时访问16位数 位数 B 0时访问时访问8位数 位数 解 解 由于存储器要能按由于存储器要能按字节寻址字节寻址 访问访问8位位数据 数据 又要能够又要能够2字节字节为一个为一个寻 址单位访问 寻 址单位访问 地址最低地址最低A0 位位 0 访问访问16位位数据数据 即 即 8 2k 8 214 8 213 16 所以存储器 所以存储器总地址线为总地址线为14根根 数据线为 数据线为16根 根 字寻址 双字节 先设计将 字寻址 双字节 先设计将2k 8扩展成扩展成2k 16的模块的模块 内部地址内部地址A11 A1 A0 0 字节寻址字节寻址 选中偶存储 体 选中偶存储 体BA0 00 选中奇存储 体 选中奇存储 体BA0 01 字寻址字寻址BA0 10 不访问不访问BA0 11 DBUS 16 位位 2K 8位位 1CS 偶存储体偶存储体 2K 8位位 2CS 奇存储体奇存储体 A11 A1 88 单个体单个体 字节编址字节编址 需用低地址部分需用低地址部分A0参与选存储体 双体 参与选存储体 双体 字寻址字寻址 最低的地址一定最低的地址一定A0 0 09年动脑筋题年动脑筋题 需需4个这样存储体构成总容量个这样存储体构成总容量8k 16存储器存储器 设计方案的真值表设计方案的真值表 输入输入 B A0 输出说明输出输出说明输出 C D 1 0访问访问16位数位数1 1 1 1不访问不访问0 0 0 0访问偶存储体访问偶存储体1 0 0 1访问奇存储体访问奇存储体0 1 由真值表得 由真值表得 0 0ABD AC 再再扩展扩展8K 16的存储器需的存储器需4个模块个模块 用用2 4译码器译码器Y0 Y3 片选表达式片选表达式 38261402 37251301 YDCSYDCSYDCSYDCS YCCSYCCSYCCSYCCS 先先设计将设计将2k 8扩展成扩展成2k 16的模块 的模块 2k模块地址模块地址A11 A1 字节寻址字节寻址 BA0 00 选中偶存储体选中偶存储体C 1 BA0 01 选中奇存储体选中奇存储体D 1 字寻址字寻址BA0 10 CD 11 09方案方案1 偶存储体偶存储体奇存储体奇存储体 BA0 11 CD 00不访问不访问 存储器结构图及存储器结构图及CPU的连接示意图 的连接示意图 38261402 37251301 YDCSYDCSYDCSYDCS YCCSYCCSYCCSYCCS MREQ R W CPU D D 1515 D D 0 0 A11 A1 A0 A13 A12 译码器 译码器 输出高有效输出高有效 OE B 1 1 AC 存储器结构图及存储器结构图及CPU的连接示意图 的连接示意图 字寻址 字寻址 B 1 A 0 恒入恒入0 译码器仅输出译码器仅输出Y0 Y2 Y4 Y6同时选两模块同时选两模块 字节寻址 字节寻址 B 0 可依译码器输出分别选中可依译码器输出分别选中8个模块个模块 A0 0偶 A0 1奇 A2 A1 A0 字节寻址 字节寻址 B 0封锁与门封锁与门 由译码器输出分别选中由译码器输出分别选中8个模块 个模块 2K 82K 8 88 2K 82K 8 88 2K 82K 8 88 MREQ R W CPU D D 1515 D D 0 0 A11 A1 B A13 A12 A0 4CS 2CS1CS3CS6CS5CS 0CS 7CS 2K 82K 8 88 译码器 输出高高有效 OE Y0 Y1 Y2 Y3 Y4 Y5 Y6 Y7 交叉编址 交叉编址 按低位地址划分模块按低位地址划分模块 内存内存 第四章 存储系统习题课第四章 存储系统习题课 cache映射映射 直接 组相联全相联接 直接 组相联全相联接 例例1 设某机内存容量为设某机内存容量为16MB Cache的容量的容量16KB 每行块每行块8个字个字 每个字每个字4 字节 共字节 共32B 设计一个 设计一个四路四路组相联映射 即组相联映射 即Cache内每组包含内每组包含4 行字块行字块 的的Cache组织方式组织方式 要求要求 1 画出主存地址字段中各字段的位数画出主存地址字段中各字段的位数 2 设设Cache的初态为空的初态为空 CPU依次从主存第依次从主存第0 1 2 99号读出号读出100个字 个字 主存一次读出一个字主存一次读出一个字 并重复此次序并重复此次序读读8轮轮 问命中率为多少问命中率为多少 3 若若Cache的速度是主存速度的速度是主存速度6倍倍 问有问有Cache和无和无Cache相比相比 存储系 统的速度提高了多少倍 解 存储系 统的速度提高了多少倍 解 1 块大小块大小 8 32位位 32B 块内地址块内地址5位位 8 4B 32B Cache行数行数 16KB 8 4B 512行行 Cache的组数的组数为为 512行行 4行行 128组组 组地址组地址 索引为索引为 7位位 标记为 标记为 24 5 7 12位位 主存主存16MB 24位地址 位地址 标记标记 12位位 主存地址主存地址24位位 块内址块内址5位位 组索引组索引7位位 四路四路组相联组相联 Cache每组每组4行行 有有128组组 主存地址主存地址24位表示位表示 三要素 块内地址位数 三要素 块内地址位数 组索引位数组索引位数 标签位数 标签位数 主存区号 标签 组号 索引 块内地址 主存块号S位 wr 位 f 主存字块主存字块标记标记 组地址组地址索引索引 块字内地址块字内地址 12位位7位位5位位 画出画出Cache16KB 的基本结构的基本结构 每行每行 块块 大小为大小为 8 32位位 32B 块内地址块内地址5位位 8 4B 32B Cache行数行数 16KB 8 4B 512行行 Cache的组数为的组数为 512 4 128组组 组地址组地址 索引为索引为 7位位 主存主存16MB标记为标记为 24 5 7 12位位 解解 1 画出主存画出主存16MB地址字段中各字段的位数地址字段中各字段的位数 组内行地址组内行地址 组地址组地址索引索引 块内字地址块内字地址 2位位7位位5位位 0组组 tag 127组组 tag 按按组地址组地址索引索引Cache组 比较该组中的 组 比较该组中的4行的所有行的所有标记标记 判某行命中否判某行命中否 四路四路组相联组相联 Cache每组每组4行行 组相联方式1 低位交叉寻址 按组号索引按组号索引 主存区大小 cache组数128组 主存的每块 可以放cache的固定组中4行的任意行 组相联映射1 主存区号主存区号 按 组 相 联 映 射 方 式 按 组 相 联 映 射 方 式 1 的 映 射 关 系 的 映 射 关 系 4路组相联 路组相联 1组组4行行 cache128组组 100个字个字 主存与 主存与 chcae传输单位传输单位是是8 字字 第第13次次就可将主 存 就可将主 存100字读入字读入cache 的的13个组里个组里 Z0 0 7字字 8 15字字 Z1 16 23字字 Z2 24 31字字 Z3 96 103字字 Z12 1016 1023 Z127 cache 0 7字字 8 15 16 23 24 31 32 39 40 47 48 55 56 63 64 71 72 79 80 87 88 95 96 103 K0 K1 K2 K3 K4 K12 主存主存 初始状态为空 初始状态为空 每块 第 每块 第1个个字不命中字不命中 后面后面7个 个 字均命中字均命中 主存与主存与chcae 传输单位是传输单位是8字字 总 总100号单元共对应号单元共对应13块块 第第一一轮访问轮访问13次次不命中不命中 后后七七轮访问均命中轮访问均命中 读读8轮轮 命中率为 命中率为 100 8 13 8 100 98 375 8轮轮 主存区号主存区号块字内地址块字内地址 10位位 7位索引位索引5位位 画出画出Cache16KB 的基本结构的基本结构 每行每行 块块 大小为大小为 8 32位位 32B 块内地址块内地址5位位 8 4B 32B Cache行数行数 16KB 8 4B 512行行 Cache的组数为的组数为 512 4 128组组 组地址组地址 索引为索引为 7位位 主存主存16MB标记为标记为 24 5 19位位 解解 1 画出主存画出主存16MB地址字段中各字段的位数地址字段中各字段的位数 组内行组内行组地址组地址块内字地址块内字地址 7位位2位位 5位位 0组组 127组组 主存字块标记主存字块标记 块地址块地址s位位24 5 19位位 组内行组内行组地址组地址 2位位 组相联映射2 四路组相联 四路组相联 Cache每组每组4行字块行字块 组相联方式2 高位交叉寻址 按组号索引按组号索引 主存的区大小 cache行数128组 4行 主存每块可以 放cache的指定组4行中任意行 0 7 8 15 16 23 24 31 32 39 40 47 48 55 56 63 64 71 72 79 80 87 88 95 96 103 32 39 40 47 48 55 56 63 64 71 72 79 80 87 88 95 96 103 104 111 112 119 120 127 C0 C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 Z1 Z2 Z3 主存 主存100个单元只需分个单元只需分13 块 组相联方式块 组相联方式2来说有来说有4 组就可调度完组就可调度完 而而Cache有 有 128组组 因此因此 访问主存前访问主存前100 号单元不会发生页面调度号单元不会发生页面调度 Z127 K0 K1 K2 K3 K4 K13 初始状态为空 初始状态为空 每块第一个 字不命中 每块第一个 字不命中 后面后面7个字均命中 个字均命中 主存与主存与chcae传输单位是传输单位是8字字 总 总100号单元共对应号单元共对应13块块 第一轮访问第一轮访问13次不命中次不命中 后七轮访问均命中后七轮访问均命中 读读8轮轮 命中率为 命中率为 100 8 13 8 100 98 375 按 组 相 联 映 射 方 式 按 组 相 联 映 射 方 式 2 的 映 射 关 系 的 映 射 关 系 Cache128组组 每组含每组含4行字块行字块 主存按 主存按cache总行数划分区 按组号索引总行数划分区 按组号索引 0 7 8 15 16 23 24 31 Z0 主存主存 组相联方式2 高位交叉存储 按组号索引按组号索引 主存的区大小 cache行数128 4 块 主存每块可以放cache的 指定组4行中任意行 C511行行 解 解 3 由题意由题意 设主存存取周期为设主存存取周期为6t Cache的存取周期为的存取周期为t 没有没有Cache的访问时间为 主存的访问时间为 主存100个单元读个单元读8轮轮 800次次 Tnc 800 6t 4800t 则有则有Cache的访问时间为的访问时间为 Tc 13 6t 800 13 t 865t 则采用则采用Cache后的访问速度是没有后的访问速度是没有Cache访问速度的访问速度的5 5倍 倍 4800t 865t 提高的倍数为提高的倍数为5 5 1 4 5倍倍 3 若若Cache的速度是主存速度的的速度是主存速度的6倍倍 问有问有Cache和无和无Cache相 比 相 比 存储系统的速度提高了多少倍 存储系统的速度提高了多少倍 100字字 主存与主存与chcae传输单位是传输单位是8字字 需需13次次就将主存就将主存100字读入字读入cache 第第1轮轮13次次不在不在cache中以后中以后7轮轮都在都在 2 命中率为 命中率为 100 8 13 100 8 98 375 Cache命中率命中率h 命中次数命中次数与与总次数之比总次数之比 8轮轮共共800次访问仅次访问仅第第1轮轮13次次不在不在cache中以后中以后7轮轮都在都在 举例举例2 假定计算机系统有一个容量为假定计算机系统有一个容量为32Kx16位的主存位的主存 字编址字编址每字 每字 16位位 有一个有一个4K字的字的4路组相联路组相联Cache 主存和 主存和Cache之间 的数据交换 之间 的数据交换块的大小为块的大小为64字字 假定 假定Cache开始为空 处理器 顺序地从存储单元 开始为空 处理器 顺序地从存储单元0 1 4351中取数 一共重复中取数 一共重复10轮轮 设 设Cache比主存快比主存快10倍 采用倍 采用LRU算法算法 试分析 试分析Cache的结 构和主存地址的划分 说明采用 的结 构和主存地址的划分 说明采用Cache后速度提高了多少 后速度提高了多少 答 假定行块大小答 假定行块大小64字字 主存按字编址主存按字编址 每字每字16位位 Cache 4K字字 212字字 16组组 x 4行行 组组 x 64 字字 行行 24 22 26 主存 主存 32K字字 215字字 512块块 x 64字字 块块 29 26 主存地址划分为 主存地址划分为 4352 64 68次次 所以处理器访问过程是对前 所以处理器访问过程是对前68次次连续访问连续访问10轮轮 每次取出每次取出64字的数据块 字的数据块 每块只有第一字未命中每块只有第一字未命中 其余都命中其余都命中 24 212字字 22 26 字号字号 标签标签组号索引组号索引 6位4位5位 S位块号S位块号9位 W位 块内 地址 举例举例 第第0组 第 组 第1组 第 组 第2组 第 组 第3组 第 组 第4组组 第第15组组 第第0 行行第第1 行行第第2 行行第第3 行行 0 64 48 1 65 49 2 66 50 3 67 51 4 15 16 0 64 17 1 65 18 2 66 19 3 67 20 31 32 16 33 17 34 18 35 19 36 47 48 32 49 33 50 34 51 35 52 63 LRU算法 算法 新调入新调入的和的和命中行命中行的的计数计数为为0 其他其他行加行加1 最大者最大者调出调出 第一轮第一轮循环循环68次次 每次每次64块块 每块只有第一字未命中每块只有第一字未命中 其余都命中其余都命中 以后以后9轮轮循环循环 有有20块的第一字未命中块的第一字未命中 其余都命中其余都命中 所以所以 命中率命中率H为为 43520 68 9x20 43520 99 43 例例3 假定主存和假定主存和Cache之间采用之间采用直接映射方式直接映射方式 行块大小为行块大小为16B Cache 的数据区容量为的数据区容量为64KB 主存地址为主存地址为32位位 按字节编址 计算机字长 按字节编址 计算机字长 32位 要求 说明主存地址如何划分 访存过程的硬件实现位 要求 说明主存地址如何划分 访存过程的硬件实现 并计算 并计算 Cache有多少行 容量多大 有多少行 容量多大 1 计算机字长计算机字长32位位 按字节编址按字节编址 每块大小为每块大小为16B 每块每块4字字 每字每字4字节字节 每块大小为每块大小为16B共需共需4位位 3 0 因为因为一块包含一块包含4个字个字 故需故需2位表示选择一块 内的哪个字 而一个字又包含 位表示选择一块 内的哪个字 而一个字又包含4个字节个字节32位 故又用位 故又用2位表示哪个字节位表示哪个字节 Cache直接映射直接映射分成的行数 分成的行数 64KB 16B 4096行行 则用于则用于索引索引Cache行的位数行的位数为为12根根 15 4 则 则标签字段标签字段Tag的位数为 表示主存的不同区 的位数为 表示主存的不同区 32 12 2 2 16位位 硬件访问过程如下图所示硬件访问过程如下图所示 先先cache索引 再比较索引 再比较Tag 行号行号行内地址行内地址 15 4 3 015 4 3 0 Cache 地址地址 行号索引行号索引 块内地址块内地址标签标签 32 1615 4 3 032 1615 4 3 0 S位S位W位W位 r位 主存 地址 主存 地址 主存主存32位位 缓存缓存16位位 16位为比较的位为比较的标签标签 主存主存32位位 最高最高16位标签位标签 最低最低4块内地址块内地址 中间中间12位做位做cache行索引行索引 课后看 3 Cache 分成的行数 分成的行数 64KB 16B 4096行 行 Cache的容量 的容量 4096行 行 1 16 128 位位 580Kbits 1位位 是否修改的标志位 是否修改的标志位v 16位位 标签 比较标记 字段 标签 比较标记 字段 128位位 每行 每行 块块 大小为大小为16B 16 8 128位位 2 访存过程的硬件实现 直接映射的组织结构 访存过程的硬件实现 直接映射的组织结构 主存区号 标记 区内行块号 索引 块内地址 主存块号S位 wr 位 f 缓存缓存4096行行 12位做位做行索引行索引 主存主存最高最高16位标签位
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数字藏品市场2025年投资策略与案例分析报告
- 数字艺术革命:2025年在线艺术拍卖平台技术创新与应用前景报告
- 石菖蒲高效繁育技术-洞察及研究
- 数字孪生赋能智能仓储物流:2025年行业应用案例分析报告
- 数字孪生赋能2025年航空航天发动机智能监控报告
- 建筑方案设计属于什么专利
- 滨江百联食品安全培训课件
- 托儿所建筑方案设计
- 校庆活动策划方案范本大全
- 丰收节活动策划方案油茶
- 绿色算力新质生产力
- 2024法律职业资格(客观题)真题含答案
- 《蓝海集团企业战略》课件
- 中国美术史课件
- 高一下学期《学生宿舍卫生和内务》主题班会课件
- 学好普通话课件
- 新雨香沁项目外墙清洗高处坠落应急预案
- 食品防护知识培训
- 2025年北京中考英语阅读考纲外高频词汇(复习必背)
- 中华民族共同体概论知到课后答案智慧树章节测试答案2025年春丽水学院
- 胖东来超市收银培训
评论
0/150
提交评论