计算机体系结构-王强华_第1页
计算机体系结构-王强华_第2页
计算机体系结构-王强华_第3页
计算机体系结构-王强华_第4页
计算机体系结构-王强华_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机系统的体系结构王强华第一章 计算机系统结构的基础知识q 计算机系统的多级层次结构关键概念: 机器、虚拟机器。 翻译、解释。 操作系统机器。 硬联控制、微程序 控制、固件。 透明性。q 软件和硬件在逻辑功能上具有等效性具有相同功能的计算机系 统,其软、硬件功能分配 比例可以在很宽的范围内 变化。q 计算机系统结构 1964年G.M.Amdahl在介绍IBM360系统时提出:计算机系统结构是从程序员所看到的计算机属性,即程序员编写出能在机器上正确运行的程序所必须了解的概念性结构和功能特性。 系统结构是对计算机系统中各级界面的划分、定义及其上下功能的分配。 系统结构设计主要研究界面的属性的透明

2、性的取舍。 计算机系统结构(体系结构)指的是传统机器级的系统结构。 计算机系统结构研究的是软、硬件之间的功能分配以及对传统机器级界面的确定。q 计算机组成、实现 计算机组成指的是计算机系统结构的逻辑实现,包括机器级内部的数据流、控制流的组成以及逻辑设计等。 它着眼于机器级内各事件的排序方式与控制机构、各部件的功能及各部件间的联系。 计算机实现指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,器件、模块、插件、底板的划分与连接,专用器件的设计,微组装技术,信号传输,电源、冷却及整机装配技术等。 它着眼于器件技术和微组装技术,其中,器件技术在实现技术中起着主导作用。

3、q IBM370系列q IBM370系列q 计算机系统结构、组成、实现的关系 三者互不相同,但又相互影响。 计算机系统结构学科实际上包括了系统结构和组成两个方面的内容。 研究的是软、硬件的功能分配以及如何更好、更合理地实现分配给硬件的功能。 代表从程序设计者、计算机设计者两个不同角度看到的计算机系统结构。q 软硬件取舍的基本原则 系统有高的性能价格比。 尽可能不要过多或不合理地限制各种组成、实现技术的采用。 进一步缩短高级语言与机器语言、操作系统与计算机系统结构之间的语义差距。q 计算机系统的性能评测 峰值性能理想情况下计算机系统可获得的最高理论性能值。 持续性能实际性能,有算术平均、调和平均

4、和几何平均三种表示。 MIPS每秒百万条指令数。 MFLOPS每秒百万次浮点运算。q 计算机系统的定量设计原理 Huffman压缩原理:加速处理高概率事件远比加速处理低概率事件对性能提高要显著。 Admal定律:系统加速比定义为系统改进后的性能誉未改进时的性能的比值。 Admal定律表明了性能提高量的递减规律。 程序的局部性原理:时间局部性、空间局部性。q 计算机系统的设计思路 由上往下适合于专用机设计。 由下往上60-70年代以前的通用机设计思想。 由中间往两边合理的软、硬件功能分配。q 软件、应用、器件对系统结构的影响 软件的可移植性。 实现软件移植的基本技术:统一高级语言、采用系列机、模

5、拟与仿真。 向上(下)兼容、向前(后)兼容。 系列机软件必须保证向后兼容,力争向上兼容。q 系统结构中的并行性发展 并行性 可以同时进行运算或操作的特性,包括同时性、并发性两重含义。 并行性的等级: 1. 从执行程序的角度:指令内部,指令之间,任务或进程之间,作业或程序之间。 2. 从处理数据的角度:位串字串,位并字串,位片串字并,全并行。 3. 从信息加工步骤与阶段的角度:存储器操作并行,处理器操作步骤并行,处理器操作并行,指令、任务、作业并行。 并行性开发的途径:时间重叠,资源重复,资源共享。 3T性能目标 1TFLOPS计算能力、1TB主存容量、1TBps I/O带宽。 并行处理计算机结

6、构:流水线计算机、阵列处理机、多处理机、数据流计算机。 多机系统:多处理机系统、多计算机系统。 多处理机系统:同构性多处理机系统、异构型多处理机系统。 多机系统的耦合度:反映多机系统中各机器之间物理连接的紧密度和交叉作用能力的强弱,可分为最低耦合、松散耦合、紧密耦合。q 计算机系统的分类 弗林分类法:1966年,弗林提出按指令流和数据流的多倍性分类。 多倍性是指在系统性能瓶颈部件上处于同一执行阶段的指令或数据的最大可能个数。分为SISD、SIMD、MISD、MIMD四大类。第二章 数据标识、寻址方式与指令系统q 数据表示 指的是能由机器硬件直接识别和引用的数据类型。 同数据结构的关系:数据结构

7、和数据表示是软、硬件的交界面。 同运算器及运算指令的关系:决定了运算器的结构及运算指令的设置。 简单数据表示:定点数、二十进制数、变址操作、串操作等。q 高级数据表示 自定义数据表示:标志符数据表示、数据描述符数据表示。 标志符数据表示: 能够简化指令、提供类型安全环境。 数据描述符数据表示: 与数据分开存放,用于描述 数组、向量、记录等。经描述符存取操作数,及二维阵列的描述: 向量数组数据表示:有向量数据表示的处理机就是向量处理机。 引入向量数据表示的主要目的是为了便于实现向量运算的并行性。 堆栈数据表示:有堆栈数据表示的机器就称为堆栈机器。 堆栈机器与通用寄存器型机器的主要区别在于堆栈指令

8、、堆栈存储的位置等。 引入数据表示的原则:效率、通用性、利用率。q 浮点数尾数基值大小和下溢处理方法的选择 浮点数的一般格式: 浮点数的特性:只能表示出数轴上分散于正、负两个区间上的离散值; 浮点数表示的值:rm阶值 X 尾数值; 阶码决定了数的范围,为数决定了数的精度; 当尾数右移一个rm进制数位时,为保持数不变,阶码才增1; 浮点数尾数的下溢处理方法:截断法、舍入法、恒置1法、查表舍入法。q 寻址方式 指指令按什么方式寻找(或访问)所需的操作数。 指明方式:占用操作码的某些位; 在地址码部分设置专门的寻址方式位字段。 程序的定位技术:逻辑地址、物理地址。 逻辑地址空间至物理地址空间的变换:

9、静态重定位、动态重定位。按整数边界存储:字长、主存宽度(数据通路宽度)、最小寻址单位。q 指令系统的设计和优化 指令系统的设计主要包括功能、格式方面的设计。 指令操作码的优化:信息源的熵、平均码长、信息冗余量、Huffman编码。q 扩展操作编码:码点扩展法、扩展位扩展法。q 指令字格式的优化q 指令系统的发展和改进 CISC和RISC。 按CISC方向发展:面向目标程序、面向高级语言、面向操作系统的优化实现。 q 按RISC方向发展: 设计RISC的基本原则。 重叠寄存器窗口技术。 延迟转移技术。第三章 总线、中断与输入输出系统q 输入输出系统概述 经历了3个阶段对应着3种方式:程序控制I/

10、O(程序查询、中断驱动)、直接存储器访问(DMA)、I/O处理机方式(通道、外围处理机PPU)。 输入输出设备分外存和传输设备两大类。q 总线设计 总线分类:半双工、全双工; 芯片级、板级(局部总线)、系统级; 专用总线、非专用总线。q 总线的控制方式:集中式控制、分布式控制。 集中式:串行链接、定时查询、独立请求。q 总线的通信技术 同步通信 异步通信:单向控制通信(源控、目控)、双向控制通信(非互锁、互锁)。q 数据宽度与总线线数q 中断系统 中断的分类和分级。 中断的响应优先级、处理次序: 响应优先级由硬件排队器固定,处理次序可通过屏蔽字灵活改变。q 中断系统的软硬功能分配: 指中断处理

11、程序软件和中断响应硬件的功能分配。 中断系统的功能包括中断请求的保存和清除、优先级的确定、中断断点及现场的保存、对中断请求的分析和处理以及终端返回等。q 通道处理机 通道处理机是IBM首先提出来的一种I/O处理机方式。 通道处理机的输入输出过程:q 通道类型:选择通道高速外设,不定长宽度; 字节多路通道低速外设,单子交叉 数组(块)多路通道高速外设,定长宽度,块交叉q 通道流量分析 通道流量单位时间内通道传送的字节数。极限流量、实际最大流量。 I/O系统的极限流量、实际最大流量所有通道流量之和。 极限流量 实际最大流量 通道的响应优先级第五章 重叠、流水和向量流水处理机q 向量的流水处理与向量

12、流水处理机q 向量的流水处理方式 使向量运算能充分发挥出流水效能的处理方式。 例:计算 D=A*(B+C) 其中A、B、C、D是有N个元素的向量。 横向(水平)处理方式。 纵向(垂直)处理方式。 分组纵横处理方式。 向量横向处理是向量的处理方式,但不是向量的流水处理方式,而向量纵向处 理和分组纵横处理是向量的处理方式,也是向量的流水处理方式q 向量流水处理机的结构 向量处理机的指令系统: 分类:V = OP V、S=OP V、V = V OP V、V = S OP V 等。 其中V代表向量, S代表标量,OP代表操作。 另外还有:比较、压缩、归并、传送等特殊操作的向量指令。 指令格式: 向量处

13、理机的结构举例:CRAY-1 面向寄存器 - 寄存器型向量流水处理机。 CRAY-1 的4种向量指令:q 提高向量流水处理性能的技术 1.多个流水线功能部件并行与链接 每个 Vi 组都有独立的输入、输出总线与各功能部件连接; Vi 组在同一时钟周期内可接受一个结果分量并为下次操作再提供一个源分量; 只要不出现 Vi 冲突和功能部件冲突,各 Vi 和功能部件之间都能并行工作。 Vi 冲突指并行工作的向量指令的源向量或结果向量使用了相同的Vi 。CRAY-1 向量处理的一个显著特点是只要不出现功能部件使用冲突和源向量寄存器使用冲突,通过链接机构可使有数据相关的向量指令仍能大部分时间并行执行。只有前

14、一条指令的第一个结果分量送入结果向量寄存器组的那一个时钟周期为允许链接时间。如果后一条指令要链接,则必须提前一拍从指令字寄存器中流出,一旦错过这个时间就无法进行链接,只有等到前一条向量指令全部执行完毕,释放出向量寄存器组资源后才能执行后面的指令。 2.条件语句和稀疏矩阵的加速处理 CRAY-1 采用向量屏蔽技术,用向量屏蔽寄存器 VM 来控制让向量中哪些元素 不参与运算。VM 的每一位对应于向量寄存器的每一个分量。 3.向量递归操作的加速处理 每个向量寄存器组 Vi 都有一个分量计数器,指向下一次要用到的分量。向量处理机为能发挥出向量处理的高性能,还必须开发相应的向量化编译程序,使之通过检测存

15、在于循环中的并行性,改用相应的向量指令来取代、消除循环。 第六章 阵列处理机和相联处理机q 阵列处理机的原理阵列机是将大量重复设置的处理单元(PE)按一定方式互连成阵列,在单一控制单元(CU)控制下,对各自所分配的不同数据并行执行同一指令规定的操作,是操作级并行的SIMD计算机。按存储器的组织方式,分为:分布式存储器阵列机、共享式存储器阵列机。SC管理处理机,用于管理系统资源,完成系统维护、输入输出、用户程序汇编及向量化编译、作业调度、存储分配、设备管理、文件管理等。 q 阵列处理机的特点 阵列处理机采用资源重复,而不是时间重叠的并行性技术,利用并行性中的同 时性,而不是并发性。 互联网络是阵列处理机的核心,其结构限定了阵列处理机可用的解题算法,也 会对系统的性能产生显著的影响。 阵列处理机是一种专用计算机,它是以一定数量的专门算法为背景,其结构与 采用的并行算法紧密联系。 阵列处理机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论