计算机系统结构第1章_第1页
计算机系统结构第1章_第2页
计算机系统结构第1章_第3页
计算机系统结构第1章_第4页
计算机系统结构第1章_第5页
已阅读5页,还剩45页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机系统结构主讲任国林1一、课程目标1、计算机系统结构的研究掌握计算机系统结构基本概念、组成及相关设计原理;掌握计算机系统结构各组成部分的相关技术、分析及设计方法;了解计算机系统设计的基本方法。2、计算机并行处理技术的研究流水线技术分析及设计;互连网络技术研究;并行处理机技术研究;多处理机技术研究。2二、课程主线在掌握系统结构组成基础上,研究各组成部分软、硬件功能分配,及分配给硬件的功能的实现技术。研究并行处理技术在Pentium系列微型机中的应用,进一步掌握并行处理机和多处理机所采用技术的基础。三、参考教材1、《计算机系统结构》,张晨曦等,高等教育出版社2、《计算机系统结构》,郑纬民等,清华大学出版社,第二版3、《并行计算机系统结构》,白中英等,科学出版社4、《小型计算机体系结构教程》,傅麒麟等,北京希望电子出版社3第一章系统结构设计基础4第0节概述1、计算机换代与系统结构(1)计算机器件的发展速度、性能、可靠性、集成度等均大幅度提高,成本降低成为换代标记。(2)系统结构的改进系统性能的提高,很多时候与系统结构密不可分,故系统结构的发展也成为换代标记之一。系统效率=min(器件速度)*min(系统结构效率)例:1965~1975,器件速度提高10倍,系统效率提高100倍,系统结构效率提高100/10=10倍。52、系统评价问题评价内容:性能、性能/价格评价时间:设计过程中、设计完成后评价方法:分析、模拟和测量方法评价原则:定性原则、定量原则定性原则:根据系统的设计方法、采用技术进行数学的分析、评价。定量原则:通过测试程序及大量模拟数据进行分析、评价。定量原则比定性原则精确,定性原则比定量原则更具有指导性。63、系统结构课程主题①从系统设计者角度,分析和评价系统性能/价格掌握影响系统性能/价格的关键—系统结构②在分析和评价的基础上,进行系统结构的设计掌握系统结构的内容及影响性能的因素系统结构基本内容的设计性能/价格优化—系统结构性能改进及并行处理系统结构的分析、设计和优化是本课程的重点。7第一节系统结构基本概念一、计算机系统层次结构应用语言级高级语言级汇编语言级操作系统级传统机器级微程序机器级电子线路L5虚拟机L4虚拟机L3虚拟机L2虚拟机翻译(应用程序包)翻译(编译程序)翻译(汇编程序)软硬件交界面物理机器解释硬件直接执行硬件固件系统软件虚拟机器实际机器应用软件部分解释

思考:为何操作系统在层次结构中处于如此位置?

8二、计算机系统设计思路1、由上向下方法适合于专用机的设计,从应用到实现级,周期几年。2、由下向上方法适合于通用机的设计,从最新硬件到应用级,周期较长。

缺点:当应用对象或范围变化时,效率急剧下降。

原因:软、硬件脱节,不能利用最新的软件技术。

前提:硬件不能改变。

缺点:易形成软、硬脱节,软件不能获得最新硬件的支持,结果软件繁杂、效率低。93、从中间开始方法从软、硬件交界面开始设计。要求:首先进行软、硬件功能分配,同时考虑硬件能为软件提供什么支持。

优点:避免了软、硬件脱节,设计周期短,有利于优化设计。

缺点:对设计人员要求较高,要求具有有效的软件设计环境和开发工具,便于分析、评价和设计。

此方法引发了计算机系统结构的研究,并很快占有主导地位。10三、计算机系统结构概念

基本定义:程序员所看到的计算机的属性,即概念性结构和功能特性。

思考:程序员的种类及对系统结构概念的影响?1、计算机系统结构(1)精确定义机器语言程序员或编译程序编写者所看到的计算机的属性。

思考1:怎样理解概念性结构?系统的软、硬件功能界面

思考2:怎样理解功能特性?界面上的功能如何分配(2)含义系统结构实际上是研究计算机系统中软、硬件之间的界面定义,以及其上下的功能分配。11(3)相关基本概念

a.软、硬件功能在逻辑上是等价的。某一功能既可用软件实现,也可用硬件实现。方法不同,性能、灵活性、成本有所不同。

b.软、硬件功能分配可在很宽的范围内变化。由性能与成本、可扩展性等因素决定。

c.透明性分析方法。是进行软、硬件取舍的一种基本方法。(4)计算机系统结构内容指令系统、数据表示、寻址方式,寄存器组织;存储系统;中断机构、I/O系统;机器工作状态定义和切换、信息保护。122、计算机组成

定义:计算机系统的设计人员看到的基本属性,是系统结构的逻辑实现。

包含内容:数据通路宽度、专用部件设计、各种OS共享程度、功能部件并行度、控制机构组成方式、排队与缓冲技术、预估与预判技术、可靠性技术等。

计算机组成研究目标:主要是如何合理地逻辑实现分配给硬件的功能。(是组成原理课程主要研究的内容)3、计算机实现主要研究器件技术与微组装技术。(是数字电路等课程主要研究的内容)134、三者之间关系1:n1:n

系统结构-----计算机组成-----物理实现例如:

系统结构计算机组成实现乘法功能是否有乘法指令乘法器/加法+移位物理实现主存系统容量、编址方式速度、措施器件、电路三者关系对系统结构设计的要求:①系统结构设计不要对组成、实现技术的采用与发展有过多或不合理的限制;②计算机组成与实现是可以折衷权衡的;③三者的内容不同时期会有所变化。14四、系统结构的设计步骤1、需求分析在应用环境、所用语言种类及特性、对OS特殊要求、所用外设特性、技术经济指标、市场分析等方面。2、需求说明

主要包括设计准则、功能说明、器件性能说明等。3、概念性设计

进行软、硬件功能分析,确定机器级界面。4.具体设计机器级界面各方面的确切定义,可考虑几种方案。5、反复进行优化设计及评价15第二节计算机系统设计准则一、大概率事件优先原则

基本思想:对大概率事件赋予它优先的处理权和资源使用权,以获得全局的最优结果。

该原则是系统设计中最重要和最常用的原则。二、阿姆达尔(Amdahl)定律

定义:系统中对某部件采用某种更快执行方式,所获得的系统性能的改变程度,取决于这种方式被使用的频率,或所占总执行时间的比例。

其中,fe为改进部分所占百分比,re为改进部分性能提高倍数16

例:

fe=0.4,re=10;

则Sp=1.56;Sp和fe的关系如下图:0.00.51.0feSp10015结果:若改善某部件性能后,系统性能急剧提高,则该部件为“系统瓶颈”。

应用:可使用该定律查找“系统瓶颈”。17三、程序访问局部性原理程序执行中呈现出频繁重复使用那些最近已使用过的数据和指令的规律。

特点:反映在时间局部性和空间局部性上。时间局部性:近期被访问的信息,可能马上被访问;

应用:层次存储体系设计。空间局部性:与被访问地址相邻的地址上的信息可能会一起被访问。18四、软、硬件取舍原则①现有软硬件条件下,系统有高的系统性能/价格;②尽量不限制计算机组成和实现技术;③把如何为编译和操作系统的实现提供好的支持放在首位。后续内容引子:如何认为一个计算机系统是好的系统?如何公正地评价一个系统的性能?如何看一个系统的可扩展性?19第三节计算机系统结构分类一、按“流”分类弗林分类法:按指令流和数据流的多倍性分类。

类型:SISD,SIMD,MISD,MIMD四种类型。(见下页)

缺点:对流水线处理机分类不明确。从MIMD到SISD性能逐步下降。转下页转下二页20CUISPUMMISISSISDSIMDCUISPU1MM1PUn…MMm…DS1DSnISMIMDCU1PU1MM1PUn…MMm…DS1DSnIS1CUnISnIS1ISn…MISDCU1PU1MM1PUn…MMm…DSDSIS1CUnISnIS1ISn…回上页21二、按“并行级”和“流水线”分类

汉德勒分类法:

在三个层次上按并行程度及流水线处理程度分类。

层次:PCU(处理器或宏流水)K级

ALU(算逻部件或指令流水)D级

BLC(位级电路或操作流水)W级

描述:

T(C)=〈K×K’,D×D’,W×W’〉K为PCU数、K’为可组成流水的PCU数,

D为每个PCU中ALU数、D’为可组成流水的ALU数,

W为ALU或PE字长,W’为所有ALU或单PE流水线段数。设计目标:各层次的数值越大越好。22

冯氏分类法:按照系统的最大并行程度进行分类。三、按“最大并行度”分类

最大并行度:单位时间内能处理的最大二进制位数。即:Pm=位片宽×字宽类型:字串位串(SISD)、字并位串(SIMD)、

字串位并(SIMD)、字并位并(MIMD)。位片宽字宽SISD(早期机器)SIMD(阵列机)SIMD(并行处理机)MIMD(多处理机)1mn1m’n’设计目标:最大并行度的数值越大越好。23四、按控制方式分类

类型:(4种)

控制流方式:顺序执行(冯·诺依曼型)

数据流方式:操作数到位即可运算,无序执行↓

规约方式:驱动方式与数据流相反,无序执行↑

匹配方式:非数值型应用,主要对象为符号。设计目标:对不同类型结构,并行程度越大越好。24五、按系统结构风格分类

系统结构风格:

一些合理的、已有确切说明的特征、特性。

类型:

面向堆栈型、面向寄存器型、面向对象型等。25第四节计算机性能评价一、衡量计算机性能的主要标准

计算机性能:正确性、可靠性和工作能力。

工作能力指标:

处理能力—单位时间内能处理的信息量(速度)。

响应能力—响应时间、周转时间、排队时间。

利用率—T时间内,各部分被使用时间t与T的比值。261、系统处理能力

通常用MIPS和MFLOPS、吞吐率等指标来反映系统(CPU)的处理能力。(1)MIPS(每秒百万次指令)

MIPS中,指令指所有类型指令。

特点:MIPS只适宜于评估标量机;

MIPS不能精确反映处理能力。表示:用相对MIPS进行表示。

相对MIPS指相对参照机而言的MIPS:

通常用VAX-11/780机处理能力为1MIPS。27(2)MFLOPS(每秒百万次浮点运算)

特点:对浮点运算而言,MFLOPS比MIPS更精确;

MFLOPS比较适宜于评估向量计算机;

MIPS和MFLOPS与测试程序中指令比例有很大关系。不同运算类型间关联方法:通过正则化方法关联不同的操作。

MFLOPS与MIPS关系:1MFLOPS≈3MIPS。(3)吞吐率指单位时间内处理作业的数量。主要用于评价并行计算机的处理速度。282、系统响应能力

响应时间一般只考虑CPU时间(用户CPU时间+系统CPU时间),进一步只衡量用户CPU时间。(1)用户CPU时间

TCPU=IN×CPI×TC。

影响用户CPU时间因素:

时钟周期(取决于硬件及组成)、

每条指令需TC数(与组成及指令系统有关)、

程序指令数(与指令系统及编译技术有关)。特征:

系统响应能力反映了系统的软、硬件性能。

不能仅用计算机主频衡量系统性能。29例:A机执行的程序中有20%转移指令(2TC),转移指令都需要一条比较指令(1TC)配合,其他指令1TC。B机中转移指令包含比较指令,但TC比A机慢15%。A机、B机哪个工作速度快?

A机:TCPUA=INA×(0.2×2+0.2×1+0.6×1)×TCA

=1.2

INA×TCA

B机:TCPUB=0.8INA×((0.2/0.8)×2+(1-0.2/0.8)×1)×1.15TCA

=1.15

INA×TCA

结果:B机比A机工作速度快。

注意:不能仅按主频衡量系统性能。30(2)平均CPI其中,n:指令种类数,CPIi:第I种指令的CPI思考:如何提高系统性能?减小平均CPI↓减小频繁使用(Ii/IN较大)指令的CPI↑大概率事件优先原则的应用313、利用率

T时间内,各部件被使用时间t与T的比值。

特点:

不直接表示系统性能,与前两种指标有密切关系;

对系统性能或结构改进与优化起着至关重要的作用。

例:对CPU、主存、I/O通道、I/O设备的优化等。

方法:利用阿姆达尔定律和程序访问局部性原理改进来提高部件利用率。32二、性能评价技术1、分析技术

方法:在一定假设条件下,找出计算机系统参数与性能指标参数之间某种函数关系,按其工作负载的驱动条件列出方程,用数学方法求解。

特点:具有理论的严密性,节约人力和物力。

数学工具:用排队论模型进行分析。

发展:从脱离实际的假设发展到近似求解。

近似求解算法—聚合法、均值分析法、扩散法等。应用:可应用于设计中系统的评价。332、模拟技术

包含内容及步骤:

按被评价系统的运行特性建立系统模型;

按系统可能有的工作负载特性建立工作负载模型;

用语言编写模拟程序,模仿被评价系统的运行;

设计模拟实验,依照评价目标,选择与目标有关因素,得出实验值,再进行统计、分析。

特点:可解决分析技术中不能数学建模情况的评价。

应用:可应用于设计中或实际应用中的系统;

可与分析技术相结合,构成一个混合系统。

注意:分析和模拟技术最后均需要通过测量技术验证。343、测量技术方法:通过基准测试程序对系统进行实际评价。

基准测试程序层次:有实际应用程序、核心程序、合成测试程序三个层次。应用:只能对已投入使用的系统进行测量,通常采用不同层次的基准测试程序评估。

思考1:如何保证某程序评估结果的准确性?多次测量

思考2:如何让评估结果最接近实际性能?多组、多级别程序

思考3:如何用多个评估结果衡量系统性能?分析和统计35三、评价结果的统计与比较技术1、算术性能平均值基准测试程序处理机XYZB120(1.00)10(0.50)40(2.00)B240(1.00)80(2.00)20(0.50)Am

(1.00)(1.25)(1.25)基准测试程序处理机XYZB120(2.00)10(1.00)40(4.00)B240(0.50)80(1.00)20(0.25)Am

(1.25)(1.00)(2.13)

特性:选择不同的参考机,Am结论不同。362、几何性能平均值基准测试程序处理机XYZB120(1.00)10(0.50)40(2.00)B240(1.00)80(2.00)20(0.50)Gm

(1.00)(1.00)(1.00)基准测试程序处理机XYZB120(2.00)10(1.00)40(4.00)B240(0.50)80(1.00)20(0.25)Gm

(1.00)(1.00)(1.00)

特性:Gm性能与参考计算机性能无关。

依据:Gm(Xi)/Gm(Yi)=Gm(Xi/Yi)373、调和性能平均值

特性:最接近CPU的实际性能。

依据:Hm与所有测试程序时间总和成反比38四、多机系统性能评价

除采用单机的评价方法外,还需测试下列性能。1、性能加速比

其中:P问题大小,n处理机数,h为通信开销。

注意:为避免失真,T(p,1)应选择最优串行算法。2、性能可扩放性

定义:系统性能加速比随PE数增加而增长的比例。

S=f(n)

影响因素:

PE数,时钟频率,问题大小,求解时间等。39第五节计算机系统结构发展一、冯·诺依曼机组系统结构的演变1、组成

由运算器、控制器、存储器、I/O设备组成。2、特点采用存储程序原理指令串行执行,由控制器控制存储器按地址访问,是顺序的一维线性空间使用机器语言,数据以二进制表示单处理机结构,以运算器为中心403、缺点两个瓶颈:CPU—存储器,指令串行执行机器语言与高级语言间语义差别较大复杂数据结构必须经过映像后存放4、改进

方法:改良方法、革命方法。

改良方法:

程序运行中不允许被修改

采用先行控制、流水线等方法,开发并行性

采用多体交叉存储器,增加存储带宽

增加新的数据表示,进一步支持高级语言

以存储器为核心,使I/O设备和CPU可并行工作

革命方法:数据流、规约、匹配计算机41二、软件、应用和器件对系统结构的影响1、软件对系统结构发展的影响主要体现在软件可移植性问题。(1)系列机通过统一或扩展机器语言来实现软件可移植性。

影响1:系列机思想使得新的组成与实现技术很快得到应用,大量兼容产品出现,推动了系统结构发展。

兼容机:具有相同系统结构或对原系统结构进行扩充,不同组成或实现技术。思考:兼容机性能一定比品牌机差?42

软件兼容种类:向上/下、向前/后兼容。时间机器档次当前机器向上兼容向下兼容高低向后兼容向前兼容

系列机要求:保证向后兼容,力争向上兼容。

影响2:为保持软件兼容性,系列机要求系统结构基本不变,又限制了系统结构的发展。43(2)模拟与仿真

模拟:用机器语言解释实现软件移植。同时模拟机器语言、存储系统、I/O系统、控制台操作及形成虚拟操作系统。

仿真:用微程序直接解释另一种指令系统。同时还需解释操作系统、I/O系统的操作。差别:解释语言(机器语言/微程序)、

解释程序存放位置(控存/主存)、是否有硬件参与方面。44(3)统一高级语言存在一定的困难,争取汇编语言或机器语言的统一。发展:导致开放系统(具有可移植性、交互操作性)的出现,用硬件抽象层技术适应不同的硬件平台。

软件是促使计算机系统结构发展最重要的因素。452、应用对系统结构发展的影响

应用要求:高速度、大容量、大吞吐率

应用场合:巨、大、中、小、微型机巨、大型机趋势:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论