




免费预览已结束,剩余38页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机组成与体系结构 从性能角度出发认识计算机 COMPUTER 前言 QIANYAN 经典计算机体系结构概念的实质是计算机系统中软硬件界面的确定 其界面之上的是软件的功能 界面之下的是硬件和固件的功能 广义 现代 的计算机体系结的构概念 它除了包括经典的计算机体系结构的概念范畴 指令集结构 还包括计算机组成和计算机实现的内容 计算机的演变和性能 01 计算机的发展历史主要由提高处理器速度 减小部件尺寸 增大存储容量 加快I O能力和速度来表征 计算机的演变和性能 计算机系统设计的一个关键问题是在各元器件之间的性能平衡 以便在一个领域内所获得的性能增益不被另一领域的滞后所妨碍 特别是 处理器速度的提高远超出存储器存储速度的提高 因此 包括高速缓存技术 从存储器到处理器的更宽的数据路径和更智能的存储芯片等多种技术 用来补偿这种平衡的失调 计算机功能和互连的顶层视图 02 计算机功能和互连的顶层视图 指令周期的组成如下 概述 首先取指令 随后取零个或多个操作数 再后存零个或多个操作数 最后是中断检查 若中断允许 计算机系统的主要部件 处理器 主存 I O模块 为了交换数据和控制信号 需要进行互连 最流行的互连方式是使用多条线组成的共享系统总线 在当今系统中 通常采用层次式总线来改善性能 总线的设计要素包括 仲裁 以集中式或分布式控制来裁决是否允许把型号发送到总线上 时序 总线上的信号是与中央时钟同步 还是基于最近传送事件的异步传送 和宽度 地址线条数和数据线条数 03 Cache存储器 计算机的存储器被组织成层次结构 Cache存储器 最顶层 最靠近处理器的一层 是处理器内的寄存器 接下来是一级或多级的高速缓存 当使用多级cache时 它们分别标记为L1 L2等 再往下的是主存 它通常由动态随机存储器DRAM构成 所有这些都被认为是系统内部的存储器 存储层次继续划分外部存储器 下一层通常是固定硬盘 再往下的是可装卸的存储设备 如光盘 磁带机等 Cache存储器 沿着存储器层次结构自顶向下 存储器成本也逐层下降 其容量在变大 而存取时间在边长 只使用最快的存储器当然好 但是它也是最昂贵的 因此我们通过使用更多较慢的存储器 以便达到存取时间与成本之间的均衡 其中的技巧是 在存储器中恰当地组织程序和数据 使需要存取的数据通常在较快的存储器中 通常 处理器将要访问的主存位置极有可能是刚被访问过的或其临近的位置 所以cache会自动保存一些来自近期被使用过的DRAM字的副本 地址本身 或地址的一部分就是索引 索引的思维 如果cache设计得合理 那么大多数时候处理器所需要的存储器数据便已经在cache中 04 内部存储器 动态RAM DRAM 静态RAM SRAM 内部存储器 半导体随机存取存储器 静态RAM SRAM 存取速度快 价格更昂贵 并且集成度较低 一般用于cache存储器 动态RAM DRAM 存取速度慢 价格更低廉 并且集成度较高 一般用于主存储器 两种基本形式 为了补偿DRAM相对较低的速度 现已推出几种先进的DRAM组织 使用最普遍的两种是同步DRAM和总线式DRAM RambusDRAM 两者都使用系统时钟以支持数据块传送 存储器系统中通常都使用纠错技术 这包括添加一些与原数据位成函数关系的冗余位来构成纠错码 如果出现错误位 纠错码会检测并通常能纠正该错误位 05 外部存储器 磁盘至今仍然是最重要的外部存储器 外部存储器 从个人计算机到大型机 乃至超级计算机 都广泛使用活动式磁盘和固定式磁盘 硬盘 磁盘至今仍然是最重要的外部存储器 为了实现更高的性能和更好的可用性 服务器以及更大的系统使用RAID磁盘技术 RAID使用了多个磁盘座位数据存储设备的并行阵列的一系列技术 并具有内在冗余性来弥补磁盘故障 06 输入 输出 计算机系统的I O体系结构是系统与外部世界的接口 输入 输出 I O体系结构 这种体系结构提供了一种控制计算机与外部世界交互的系统化方式 并向操作系统提供有效地管理I O行为的必要信息 输入 输出 编程式I O ProgrammedI O 技术 即在请求I O操作的程序的直接和连续的控制下所发生的I O操作 3种基本的I O技术 中断驱动式I O Interrupt driverI O 技术 即程序发出I O命令后继续执行 直到被I O硬件中断 通知它I O操作完成 直接存储器存取 DMA 技术 即一个专门的I O处理器接管I O操作的控制 在I O设备与存储器之间直接传送大量数据 除了处理器和一组存储器模块外 计算机系统的第三个关键部件是一组输入 输出模块 每个模块连接到系统总线或中央交换器 并且控制一个或多个外围设备 一个I O模块不是简单地将设备连接到系统总线的一组机械连接器 而是包含了执行设备与系统总线之间通信功能的逻辑 输入 输出 为什么不把外设直接连接到系统总线上 原因如下 各种外设的操作方法是不同的 将控制一定范围的外设的必要逻辑合并到某个处理器内是不现实的外设的数据传送速度一般比存储器或处理器慢得多 因此 使用高速的系统总线直接与外设通信是不切实际的另一方面 某些外设的数据传送速率比存储器或处理器要快 同样 若不适当管理 则速度失配将导致无效外设使用的数据格式和字长度通常与处理器不同 因此I O模块是必须的 它有两大主要功能 通过系统总线或中央交换器与处理器和存储器连接通过专用数据线与一个或多个外设连接 07 操作系统支持 操作系统是控制程序在处理器上执行和管理该处理器资源的软件 操作系统支持 进程调度 存储管理 操作系统 操作系统最重要的功能之一是进程或任务的调度 操作系统决定在给定时间内运行哪个进程 一般情况下 硬件不断中断运行进程 使操作系统做出新的调度裁决 从而使处理器时间被几个进程公平分配 所有处理器都或多或少具备这种能力 如虚拟存储器管理硬件和进程管理硬件 这些硬件包括专用寄存器 缓冲器以及完成基础资源管理任务的电路 处理器硬件的支持 操作系统支持 操作系统的另一个重要功能是存储管理 大多数当代操作系统都包含虚拟存储器的功能 虚拟存储器有两个优点 进程在主存中运行时不需要将程序的全部指令和数据一次性地装入主存 程序可用的总存储空间可以大大超过系统的实际主存容量 虽然存储管理是用软件完成的 但操作系统依赖于处理器中的硬件支持 包括分页管理硬件和分段管理硬件 08 计算机算术 数的表示方法 二进制格式 基本算术运算 加减乘除 计算机算术 计算机算数涉及的两个基本方面是数的表示方法 二进制格式 和基本算术运算 加减乘除 的算法 这两个方面既适用于整数算术 也适用于浮点算术 大多数处理器都实现了IEEE754标准 用于浮点表示和浮点运算 IEEE754定义了32位和64位两种浮点数格式 09 指令集 特征和功能 计算机指令最重要的元素是操作码 opcode 指令集 特征和功能 opcode 计算机指令最重要的元素是操作码 opcode 它指明将完成的操作 源和目的操作数的引用方式 并通常隐式指明下一条指令的来源 opcode 操作码指定的操作 一般可有如下类型 算术和逻辑运算 在两个寄存器 寄存器和存储器或存储器两个位置之间传送数据 输入 输出 控制 opcode 操作数引用方式指定如何寻找被操作数据的寄存器或存储器的位置 数据类型可以是地址 数值 字符或逻辑数据 指令集 特征和功能 各类处理器中的一个普遍的体系结构是栈stack的使用 栈对程序员是可见的或是不可见的 栈用于管理过程的调用和返回 也可用来提供另一种寻址存储器的方式 栈的基本操作是PUSH和POP 以及在栈顶部一或两个位置上完成的操作 一般来说 栈都实现为从高地址向低地址增长 字节可以寻址的处理器可分为大端 bigendian 小端 littleendian 双端 bi endian 这几类 如果多字节的数值是以最高有效字节存于最低地址值的字节来顺序存储 则称为大端 如果它们是以最低有效字节存于最低地址值的字节来顺序存储 则称为小端 既支持大端又支持小端的处理器是双端处理器 延迟符 10 指令集 寻址和指令 寻址方式和指令格式 指令集 寻址和指令 操作数引用 指令 二是指令中含有对操作数地址的引用 单各种指令集使用类型广泛的寻址方式 这包括直接寻址 操作数地址在指令的地址字段中 间接寻址 地址字段指向一个存储位置 此位置含有操作数地址 寄存器寻址 寄存器间接寻址 以及各种形式的偏移寻址 寄存器值加上地址值产生操作数地址 指令格式定义了指令中字段的布局 指令格式设计是一件非常复杂的事情 要考虑到诸多因素 如指令长度是定长还是变长 指派给操作码和每个操作数引用的位数 以及如何确定寻址方式等 11 CPU结构和功能 处理器包括用户可见的寄存器和控制 状态寄存器 CPU结构和功能 用户可见寄存器是指 用户使用机器指令显式或隐式可访问的寄存器 它们可以是通用寄存器 也可以是用于定点或浮点数 地址 变址和段指针这样的专用寄存器 控制和状态寄存器用于控制CPU的操作 一个明显的例子是程序计数器 另一重要的例子是程序状态字 PSW PSW包含各种状态和条件位 例如反映最近一次算术运算结果的标志位 中断允许位和指示CPU当前运行于特权模式下还是用户模式下的状态位 延迟符 CPU结构和功能 处理器采用指令流水方式来加速指令的执行 从本质上讲 流水是将指令周期分解成几个连续出现的阶段 如取指令 译码指令 确定操作数地址 取操作数 执行指令和写结果操作数 指令向前移动通过这些段 就像车间的一条装配线一样 于是 不同的指令能同时在各个段上工作 不过 转移和指令间相关性的出现 使流水线的设计和使用变得复杂了 1 2 3 4 12 精简指令集计算机 RISC 精简指令集计算机 对设计新型处理器体系结构来说 高级语言程序行为的研究具有指导意义 成果之一就是产生了精简指令集计算机 RISC 程序中赋值语句占最大份额 这暗示着简单的数据传送应当优化 程序中还是许多IF和LOOP语句 意味着基本的顺序控制机制需要进行优化 以便有效地使用流水技术 操作数引用样式的研究表明 在寄存器中保持适当数量的操作数会有助于性能的提高 精简指令集计算机 RISC的简单指令集便于有效的流水化 因为每条指令只有少数几种操作 并且这些操作是比较容易确定的 RISC指令集体系结构自身也有助于实施延迟分支 delayedbranch 技术 这种技术将分支指令和其他指令重排从而提高流水线效率 RISC机器的关键特征 13 超标量处理器 指令级并行性和超标量处理器 超标量处理器 每条流水线由多个段 stage 组成 因此每条流水线能同时处理多条指令 多流水线引入了新一级并行性 允许同时处理多个指令流 超标量处理器是一种使用多条相互独立的指令流水线的处理器 超标量处理器利用了所谓的指令级并行性 instruction levelparallelism 指令级并行性指的是程序中的指令可以并行执行 超标量处理器一次取多条指令 然后试图找出几条彼此不相关因而能够并行执行的指令 如果一条指令的输入取决于前面指令的输出 则这条指令不能同时 更不能先于前面指令完成执行 一旦这种相关性被确认 处理器可以以不同于原来代码的顺序发射和完成指令 通过使用更多的寄存器 或对原代码中的寄存器引用换名 处理器可取消某些不必要的相关性 纯RISC处理器经常使用延迟分支来最大限度地利用指令流水线 然而 这种方法不太适用于超标量处理器 大多数超标量机器使用了传统的分支预测法来提高流水线效率 超标量处理器 超标量设计紧跟RISC体系结构的脚步 虽然RISC机器的精简指令集体系结构自身已倾向于应用超标量技术 但超标量方法既能用于RISC也能用于CISC体系结构 超标量实现的处理器结构是指 在这样的结构中 包括整数和浮点运算 装载 保存以及条件分支之类的普通指令 能通水启动并独立执行 这种实现引出了涉及指令流水线的几个复杂问题 14 控制器操作 一条指令的执行涉及一系列的统称为周期的子步骤 控制器操作 处理器的控制器完成两项任务 1 它使得处理器以正在运行的程序所确定的次序来执行微操作 2 它产生引起微操作执行的控制信号 一条指令的执行涉及一系列的统称为周期的子步骤 例如 一条指令的执行可由取指 间接寻址 执行和中断周期组成 每个周期又是由一系列更基本的操作 称为微操作 组成 一个单一的微操作可以完成寄存器间的一次传送 寄存器与外部总线的一次传送 或一个简单的ALU操作 控制器产生的控制信号引起逻辑门的打开与管理 从而导致寄存器数据的传送和ALU的操作 一种控制器的实现技术是硬布线技术 采用此技术实现的控制器是一个组合电路 当前机器指令支配的输出逻辑信号被转换为一组输出控制信号 15 并行处理 cache一致性协议 并行处理 延迟符 16 多核计算机 一个计算机芯片
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 支付宝理赔申请书
- 化学实验安全操作规范教案
- 农村综合开发金融服务协议
- 乡镇应急办地质灾害监测员招聘笔试经典考题含答案
- 2025年边检站口岸限定区域警戒员招聘笔试题库附答案
- 八年级作文玩魔方600字7篇
- 高中现代文阅读难点突破教学教案
- 清明节的作文200字(7篇)
- 我与地坛之间:散文鉴赏与写作技能提升教案
- 农业种植区灌溉设施共享合同
- 2023年宁波市慈溪市人民法院招聘编外人员考试真题及答案
- 高速公路服务区升级转型商业计划书
- 数学原来这么有趣
- 常见行政案件笔录模版
- 手术室甲状腺切除术手术配合护理查房
- 国家电网电力中级职称考试题
- 数据库设计规范说明
- 建设工程消防验收评定规则
- 肾内科临床技术操作规范2022版
- 2023年中国工商银行软件开发中心春季校园招聘500人笔试模拟试题及答案解析
- 地质勘查钻探岩矿心管理通则
评论
0/150
提交评论