版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系w 引言引言w 计算机系统结构的定义计算机系统结构的定义w 计算机系统的设计技术计算机系统的设计技术w 计算机系统的评价标准计算机系统的评价标准w 计算机系统结构的发展计算机系统结构的发展w 计算机系统的分类计算机系统的分类computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容 自第一台电子计算机问世已经半个多世自第一台电子计算机问世已经半个多世纪了,它已经历了五次更新换代:纪了,它已经历了五次更新换代: 第一代计算机(第一代计算机(19451954)
2、第二代计算机(第二代计算机(19551964) 第三代计算机(第三代计算机(19651974) 第四代计算机(第四代计算机(19751991) 第五代计算机(第五代计算机(1992现在)现在)computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容引言 将电子管和继电器存储器用绝缘导线互连起将电子管和继电器存储器用绝缘导线互连起来,单个来,单个cpu,cpu用程序计数器和累加器顺序用程序计数器和累加器顺序完成定点运算,采用机器语言或汇编语言,用完成定点运算,采用机器语言或汇编语言,用cpu程序控制程序控制i/o。代表性系统有:。代表性系统有:joh
3、n von neumann、arthur burks和和herman goldstine于于1946年在普林斯顿大学研制成功的年在普林斯顿大学研制成功的ias计算机;计算机;宾夕法尼亚大学莫尔学院于宾夕法尼亚大学莫尔学院于1950年制成的年制成的eniac;ibm于于1953年制造的年制造的ibm701计算机。计算机。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容引言 采用分立式晶体三极管、二极管和铁氧采用分立式晶体三极管、二极管和铁氧体的磁芯,用印刷电路将它们互连起来。采体的磁芯,用印刷电路将它们互连起来。采用了变址寄存器、浮点运算、多
4、路存储器和用了变址寄存器、浮点运算、多路存储器和i/o处理机。采用有编译程序的高级语言、处理机。采用有编译程序的高级语言、子程序库、批处理监控程序。代表性系统有:子程序库、批处理监控程序。代表性系统有:1959年制成的年制成的univac larc、60年代的年代的cdc1604和和1962年制成的年制成的ibm7030。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容引言 采用小规模或中规模集成电路和多层印采用小规模或中规模集成电路和多层印刷电路。微程序控制在这一代开始普及。采刷电路。微程序控制在这一代开始普及。采用了流水线、高速缓存和先
5、行处理机。软件用了流水线、高速缓存和先行处理机。软件方面采用多道程序设计和分时操作系统。代方面采用多道程序设计和分时操作系统。代表性系统有:表性系统有:ibm 360/370系列、系列、cdc 6600/7600系列、系列、texas仪表公司的仪表公司的asc和和digital equipment公司的公司的pdp-8系列。系列。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容引言 采用大规模或超大规模集成电路和半导采用大规模或超大规模集成电路和半导体存储器,出现了用共享存储器、分布式存体存储器,出现了用共享存储器、分布式存储器或向量硬件选
6、择的不同结构的并行计算储器或向量硬件选择的不同结构的并行计算机,开发了用于并行处理的多处理操作系统、机,开发了用于并行处理的多处理操作系统、专用语言和编译器,同时产生了用于并行处专用语言和编译器,同时产生了用于并行处理或分布处理的软件工具和环境。代表性系理或分布处理的软件工具和环境。代表性系统有:统有:vax9000、crayx-mp、ibm 3090vf和和bbntc-2000等。等。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容引言 采用采用vlsi工艺更加完善的高密度、高工艺更加完善的高密度、高速度处理机和存储器芯片。它最重要特点是
7、速度处理机和存储器芯片。它最重要特点是进行大规模并行处理,采用可扩展的和容许进行大规模并行处理,采用可扩展的和容许时延的系统结构。代表性系统有:时延的系统结构。代表性系统有:fujitsu的的vpp500、cray research的的mpp、thinking machines公司的公司的cm-5、intel超超级计算机系统级计算机系统paragon、sgi的的 origin 2000和和sun公司的公司的1000服务器。服务器。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容 从计算机的发展过程,我们可以看出:从计算机的发展过程,我们可以
8、看出:计算机系统性能的不断提高主要靠计算机系统性能的不断提高主要靠和和。 如何最合理地利用新器件,最大限度地如何最合理地利用新器件,最大限度地发挥其潜力,设计并构成综合性能指标最佳发挥其潜力,设计并构成综合性能指标最佳的计算机系统,单纯依靠器件变革是不能解的计算机系统,单纯依靠器件变革是不能解决的,还要靠计算机系统结构上的改进。决的,还要靠计算机系统结构上的改进。4 之 1computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系 以微处理器为例(以微处理器为例(图示图示)。在)。在20世纪世纪80年代年代中期以前,性能的提高主要是工艺技术驱动的,中期以前,
9、性能的提高主要是工艺技术驱动的,平均以每年平均以每年25%的速度提高。此后到的速度提高。此后到2002年,性年,性能的提高主要得益于工艺技术和先进的系统结构能的提高主要得益于工艺技术和先进的系统结构设计思想,该增长率达到了设计思想,该增长率达到了52%。2002年后,由年后,由于在电源、可用的指令级并行和存储器长时延等于在电源、可用的指令级并行和存储器长时延等限制,使单处理器性能的提升减缓到限制,使单处理器性能的提升减缓到22%。本章内容4 之 24 之 3computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容 本课程的目的是:本课程的目的是:
10、让我们赶快开始吧!4 之 4computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容 计算机系统的层次结构计算机系统的层次结构 计算机系统结构的概念计算机系统结构的概念 计算机组成的概念计算机组成的概念 计算机实现的概念计算机实现的概念computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义应用语言级应用语言级高级语言级高级语言级汇编语言级汇编语言级操作系统级操作系统级传统机器级传统机器级微程序机器级微程序机器级电子线路电子线路l5虚拟机虚拟机l4虚拟机虚拟机l3虚拟机虚拟机l2虚拟机虚拟机翻译(应
11、用程序包)翻译(应用程序包)翻译(编译程序)翻译(编译程序)翻译(汇编程序)翻译(汇编程序)软硬件交界面软硬件交界面物理机器物理机器解释解释硬件直接执行硬件直接执行硬件硬件固件固件系统系统软件软件虚拟机器虚拟机器实际机器实际机器应用应用软件软件部分解释部分解释11 之 1computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义层次结构图应用语言应用语言应用程序应用程序用户用户信息处理信息处理11 之 2computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义层次结构图高级语言高级语言解释或编译解
12、释或编译高级语言高级语言程序员程序员运行程序运行程序11 之 3computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义层次结构图汇编语言汇编语言汇编程序汇编程序汇编语言汇编语言程序员程序员运行程序运行程序11 之 4computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义层次结构图传统机器级指令传统机器级指令操作系统级指令操作系统级指令操作系统操作系统操作员操作员系统资源系统资源11 之 5computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定
13、义层次结构图机器指令机器指令系统系统cpu机器语言机器语言程序员程序员机器程序机器程序11 之 6computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义层次结构图微指令系统微指令系统微程序控制微程序控制逻辑逻辑设计员设计员寄存器寄存器传送门传送门11 之 7computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义层次结构图硬操作时序硬操作时序硬联逻辑硬联逻辑硬件维护硬件维护员员/设计员设计员逻辑线路逻辑线路内核内核11 之 8computer architecturev3同济大学.电子与信息工
14、程学院.计算机科学与技术系 是指能执行和存储程序的算法和数据结是指能执行和存储程序的算法和数据结构的集合体。构的集合体。是指算法和数据结构的是指算法和数据结构的实现方法,可以硬件实现方法,可以硬件/固件固件/软件实现。我们将由软软件实现。我们将由软件实现的机器称为件实现的机器称为,将由硬件,将由硬件/固件实现固件实现的机器称为的机器称为。本章内容定义11 之 9 从计算机系统的某一层使用者的角度看,从计算机系统的某一层使用者的角度看,只需通过该层的语言就可以使用机器,而不必只需通过该层的语言就可以使用机器,而不必关心其下层的机器是如何工作和如何实现各自关心其下层的机器是如何工作和如何实现各自功
15、能的,这一性质称为功能的,这一性质称为。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义v 系统是由硬件和软件组成的系统是由硬件和软件组成的v 软、硬件功能在逻辑上是等价的软、硬件功能在逻辑上是等价的v 软件和硬件的分界面是动态变化的软件和硬件的分界面是动态变化的 提高解题速度提高解题速度 减少存储量减少存储量 硬件成本高硬件成本高 降低硬件利用率、系统灵降低硬件利用率、系统灵活性和适应性活性和适应性 降低硬件造价降低硬件造价 提高系统灵活性和适应性提高系统灵活性和适应性 降低解题速度降低解题速度 增加系统存储量增加系统存储量 增加软件
16、设计费增加软件设计费硬件软件过去现在将来时间硬件比率100%0%11 之 10computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义 有利于正确地理解计算机系统的工作,有利于正确地理解计算机系统的工作,明确软件、硬件和固件在计算机系统中明确软件、硬件和固件在计算机系统中的地位和作用;的地位和作用; 有利于理解各种语言的实质及其实现;有利于理解各种语言的实质及其实现; 有利于探索虚拟机器新的实现方法,设有利于探索虚拟机器新的实现方法,设计新的计算机系统。计新的计算机系统。11 之 11computer architecturev3同济大学.电子
17、与信息工程学院.计算机科学与技术系本章内容定义 “计算机系统结构计算机系统结构”的含义仍有多种说的含义仍有多种说法,并无统一的定义,下面介绍两种:法,并无统一的定义,下面介绍两种: 定义一定义一 定义二定义二4 之 1computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义概念(amdahl, 1964)v 是指计算机系统中所有部件之间的逻辑连接结构。是指计算机系统中所有部件之间的逻辑连接结构。 主要是指计算机系统的如下功能:数据表示、寻址方主要是指计算机系统的如下功能:数据表示、寻址方式、寄存器组织、指令系统、存储系统、中断机构、式、寄存器组
18、织、指令系统、存储系统、中断机构、i/oi/o结构等。结构等。哎!未指明程序员的级别4 之 2computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义概念 即:计算机系统结构主要研即:计算机系统结构主要研究软硬件功能分配和对软硬件界面的确定。究软硬件功能分配和对软硬件界面的确定。明确多了!传统机器级嘛!4 之 3computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系指硬件能直接识指硬件能直接识别和处理的数据类型和格式别和处理的数据类型和格式等等包括最小寻址单包括最小寻址单位、寻址方式的种类、表示位、寻址方
19、式的种类、表示和地址计算等和地址计算等包括操作数寄包括操作数寄存器、变址寄存器、控制寄存器、变址寄存器、控制寄存器和某些专用寄存器的定存器和某些专用寄存器的定义、数量和使用约定义、数量和使用约定包括机器指令的包括机器指令的操作类型和格式,指令间的操作类型和格式,指令间的排序方式和控制机构等排序方式和控制机构等包括最小编址单包括最小编址单位、编址方式、主存容量、位、编址方式、主存容量、最大可编址空间等最大可编址空间等 包括中断类型、包括中断类型、中断分级、中断处理程序的中断分级、中断处理程序的功能和入口地址等功能和入口地址等 包括包括i/o的连接的连接/访问方式、数据的访问方式、数据的源和目的、
20、数据传送量、操源和目的、数据传送量、操作的结束和出错指示等作的结束和出错指示等 包括保护方式、包括保护方式、硬件对信息保护的支持硬件对信息保护的支持本章内容定义概念4 之 4computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义数据通路宽度数据通路宽度专用部件的设置专用部件的设置各种操作对部件的共享程度各种操作对部件的共享程度功能部件的并行度功能部件的并行度控制机构的组成方式控制机构的组成方式缓冲和排队缓冲和排队容错技术容错技术预测和评估预测和评估computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本
21、章内容定义专用芯片(专用芯片(asic)的设计)的设计处理机、处理机、cache和主存的物理结构和主存的物理结构器件、模块、插件和底板的逻辑划分和连接器件、模块、插件和底板的逻辑划分和连接信号传输信号传输电源与冷却电源与冷却微组装和整机组装技术微组装和整机组装技术computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容定义 计算机系统结构计算机系统结构研究计算机系统的软、硬件功能研究计算机系统的软、硬件功能分配和软、硬件界面的确定;计算机组成是计算机系分配和软、硬件界面的确定;计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理统结构
22、的逻辑实现;计算机实现是计算机组成的物理实现。实现。 具有相同系统结构的计算机可以因为速度等因素具有相同系统结构的计算机可以因为速度等因素的要求而采用不同的组成;一种计算机的组成可以采的要求而采用不同的组成;一种计算机的组成可以采用多种不同的计算机实现。用多种不同的计算机实现。 系统结构、组成和实现所包含的具体内容随不同系统结构、组成和实现所包含的具体内容随不同时期及不同的计算机系统会有不同,而且随着技术、时期及不同的计算机系统会有不同,而且随着技术、器件和应用的发展,三者之间的界限越来越模糊。器件和应用的发展,三者之间的界限越来越模糊。computer architecturev3同济大学.
23、电子与信息工程学院.计算机科学与技术系w 计算机系统设计者的任务计算机系统设计者的任务w 计算机系统的设计方法计算机系统的设计方法w 计算机系统的设计步骤计算机系统的设计步骤w 计算机系统设计的定量准则计算机系统设计的定量准则本章内容computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术 即:计算机即:计算机设计者必须设计出一台既能满足功能要求,又能设计者必须设计出一台既能满足功能要求,又能达到价格和性能目标的计算机。达到价格和性能目标的计算机。 主要任务有:主要任务有:确定用户要求确定用户要求优化设计优化设计设计出符合今后发展方向的系统
24、结构设计出符合今后发展方向的系统结构computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术任务 确定用户对计算机系统的功能、价格和确定用户对计算机系统的功能、价格和性能的要求。性能的要求。 例如:具体的功能要求参见例如:具体的功能要求参见后表后表。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术任务 最优设计方案的选择通常依赖于价格和性能最优设计方案的选择通常依赖于价格和性能(后面介绍)。设计者在处理价格和性能之间的(后面介绍)。设计者在处理价格和性能之间的关系时通常有三种不同
25、的方法:关系时通常有三种不同的方法: 例如:超级计算机。例如:超级计算机。 例如:嵌入式系统。例如:嵌入式系统。 例如:大多数的例如:大多数的pc、工作站、服务器。、工作站、服务器。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术任务 一个成功的系统结构应该能经得住软、一个成功的系统结构应该能经得住软、硬件技术的发展和应用的变化,因此设计者硬件技术的发展和应用的变化,因此设计者必须特别注意计算机应用和计算机技术的发必须特别注意计算机应用和计算机技术的发展趋势,这样才能延长一种机器的使用寿命。展趋势,这样才能延长一种机器的使用寿命。
26、computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术w 由上而下法由上而下法w 由下而上法由下而上法w 由中间向两头法由中间向两头法computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术设计方法确定应用的基本特性确定应用的基本特性设计或选择面向该应用的高级语言设计或选择面向该应用的高级语言设计适用于所选高级语言编译的中间语言设计适用于所选高级语言编译的中间语言设计面向该应用的操作系统设计面向该应用的操作系统设计面向所用编译器和操作系统的机器语言设计面向所用编译器和操作系统的机器语言
27、设计面向机器语言的微指令及其硬件实现设计面向机器语言的微指令及其硬件实现适用于面向某一应用的专用机的设计适用于面向某一应用的专用机的设计设计周期较长(需若干年)设计周期较长(需若干年)由于技术发展很快,因此难以真正面向用户优化实现由于技术发展很快,因此难以真正面向用户优化实现computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术设计方法不考虑应用,参照现有机器特点设计微程序机器级不考虑应用,参照现有机器特点设计微程序机器级和传统机器级和传统机器级选择面向不同应用的多种操作系统和编译器选择面向不同应用的多种操作系统和编译器20世纪世纪607
28、0年代较多采用的通用机的设计方法年代较多采用的通用机的设计方法因硬件不可更改,所以软件设计被动因硬件不可更改,所以软件设计被动系统的某些性能指标不确切,如传统机器级的系统的某些性能指标不确切,如传统机器级的“每每秒运算次数秒运算次数”computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术设计方法确定软、硬件界面确定软、硬件界面软件设计人员设计软件,硬件设计人员设计硬件软件设计人员设计软件,硬件设计人员设计硬件(同时)(同时)20世纪世纪60年代末开始采用的通用机设计方法年代末开始采用的通用机设计方法设计周期短设计周期短交互式设计,便于提高
29、系统性能交互式设计,便于提高系统性能要求设计人员具有软件、硬件、器件和应用等方面要求设计人员具有软件、硬件、器件和应用等方面的知识的知识需要完善的硬件系统模拟环境和软件设计环境需要完善的硬件系统模拟环境和软件设计环境computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系系统应用环境:实时处理、系统应用环境:实时处理、事务处理、科学计算、远事务处理、科学计算、远程处理程处理所用语言的种类和特性所用语言的种类和特性对操作系统的特殊要求对操作系统的特殊要求所用外设的特性所用外设的特性技术经济分析技术经济分析市场分析市场分析设计准则设计准则功能说明功能说明 器件
30、性能说明器件性能说明 确定机器级界面确定机器级界面 定义机器级界面的内容,定义机器级界面的内容,可提供多种方案可提供多种方案 提高系统的性能价格比提高系统的性能价格比本章内容设计技术computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术w 加快经常性事件的速度加快经常性事件的速度w cpu性能公式性能公式w 局部性原理局部性原理 w 利用并行性利用并行性computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则 。这是。这是计算机设计中最重要也最广泛采用的设计准计算机设计中最重要
31、也最广泛采用的设计准则。则。 :加法运算中的溢出和不溢出;中:加法运算中的溢出和不溢出;中断处理中的常规性保护现场和特殊性保护现断处理中的常规性保护现场和特殊性保护现场。场。4 之 1computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则 计算机系统中某一部件由于采用某种更计算机系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例执行方式的使用频率或占总执行时间的比例有关。有关。 4 之 2computer architecturev3同济大
32、学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则整个系统的加速比整个系统的加速比改进前整个任务的执行时间改进前整个任务的执行时间改进后整个任务的执行时间改进后整个任务的执行时间增强比例增强比例 增强增强加速比加速比时间改进后改进部分的执行时间改进前改进部分的执行时间改进前整个任务的执行可改进部分占用的时间eesf4 之 3computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则假设某测试程序中假设某测试程序中fp指令执行时间占指令执行时间占50%,fpsqr指令占指令占20%,用改进,用改进fpsqr指令速度为原来
33、的指令速度为原来的10倍倍和改进和改进fp指令速度为原来的指令速度为原来的2倍,哪种方案更好?倍,哪种方案更好?:fe=0.2, se=10 ,根据,根据amdahl定律,加速定律,加速比为:比为: :fe=0.5, se=2 ,根据,根据amdahl定律,加速比定律,加速比为:为: :33.175.0125 .0)5 .01(1ns22.182.01102 .0)2 .01(1ns4 之 4computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则w 公式一公式一w 公式二公式二w 公式三公式三6 之 1computer archi
34、tecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则cpu性能公式 一个程序的一个程序的cpu时间可以通过下式表达:时间可以通过下式表达: 或: 简单明了,没有什么实用价值 6 之 2computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则cpu性能公式 一个程序的一个程序的cpu时间可以通过下式表达:时间可以通过下式表达: 其中:其中:为一个程序的指令总数,为一个程序的指令总数,为执行一为执行一条指令所需的平均时钟周期数。条指令所需的平均时钟周期数。 cpu时间与3个因素有关:时钟周期长度、i
35、c和cpi6 之 3computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则cpu性能公式 一个程序的一个程序的cpu时间可以通过下式表达:时间可以通过下式表达: 其中:其中:为指令为指令i在一个程序中的执行次数,在一个程序中的执行次数,n为为指令总数,指令总数,为执行指令为执行指令i所需的平均时所需的平均时钟周期数。钟周期数。 6 之 4computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则假设某测试程序中假设某测试程序中fp指令(包括指令(包括fpsqr)的执行频)
36、的执行频度为度为25%,fp指令的平均指令的平均cpi=4.0,其它指令的平均,其它指令的平均cpi=1.33; fpsqr指令的执行频度为指令的执行频度为2%, fpsqr指令的平均指令的平均cpi=20。假设有两种设计方案:一种是。假设有两种设计方案:一种是将将fpsqr的的cpi减为减为2,另一种是将所有,另一种是将所有fp的的cpi减减为为2.5,试利用,试利用cpu性能公式比较这两种设计方案。性能公式比较这两种设计方案。原系统的原系统的cpi为:为:0 . 2%75*33. 1%254)(1niiiicicpicpi原系统6 之 5computer architecturev3同济大
37、学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则:将:将fpsqr的的cpi减为减为2:将所有:将所有fp的的cpi减为减为2.5或或:64. 1)220(%20 . 2%21)(新老原系统方案fpsqrfpsqrcpicpicpicpi625. 1)5 . 24(%250 . 2%252)(新老原系统方案fpfpcpicpicpicpi625. 1%255 . 2%7533. 1)(12niiiicicpicpi方案6 之 6computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则 程序执行中呈现出频繁重复使用那
38、些最近已程序执行中呈现出频繁重复使用那些最近已使用过的数据和指令的规律。这反映在使用过的数据和指令的规律。这反映在时间局部时间局部性性和和空间局部性空间局部性上。上。 近期被访问的信息,可能马上被访问。近期被访问的信息,可能马上被访问。 与被访问地址相邻的地址上的信息可能会一起与被访问地址相邻的地址上的信息可能会一起被访问。被访问。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则w 并行性的概念并行性的概念w 并行性的实现并行性的实现w 并行性的等级并行性的等级w 并行性的发展并行性的发展computer architect
39、urev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则利用并行性 我们将问题中具有可以同时进我们将问题中具有可以同时进行运算或操作的特性称为并行性。行运算或操作的特性称为并行性。并行性实际上包含并行性实际上包含和和两重含义:两重含义: 是指两个或多个事件在同一时是指两个或多个事件在同一时刻发生,例如:流水。刻发生,例如:流水。 是指两个或多个事件在同一时是指两个或多个事件在同一时间间隔内发生,例如:分时操作。间间隔内发生,例如:分时操作。abct1dt2computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量
40、准则利用并行性w 时间重叠时间重叠w 资源重复资源重复w 资源共享资源共享computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则利用并行性并行性的实现 让多个处理过程在时间上相让多个处理过程在时间上相互错开,轮流重叠地使用同一互错开,轮流重叠地使用同一套硬件设备的各个部分,以加套硬件设备的各个部分,以加快硬件周转而提高速度。快硬件周转而提高速度。 指令流水线。指令流水线。 不需要增加硬件设备就可以不需要增加硬件设备就可以提高计算机系统的性能价格比。提高计算机系统的性能价格比。t取指取指分析分析执行执行(a) 指令流水线指令流水线k
41、kkk+1k+1k+1k+2k+2k+2部件部件执行执行分析分析取指取指t2t 3t 4t 5t(b) 时空图时空图computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则利用并行性并行性的实现 通过重复设置资源(硬件、软件、信息、时间)通过重复设置资源(硬件、软件、信息、时间)来提高可靠性或性能来提高可靠性或性能。 n模冗余结构模冗余结构提高可靠性;多值存储器提高可靠性;多值存储器提提高信息存储密度;多处理机高信息存储密度;多处理机提高速度和可靠性。提高速度和可靠性。 需要增加资源才能大幅度提高计算机系统的性需要增加资源才能大幅度
42、提高计算机系统的性能。能。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则利用并行性并行性的实现 利用软件的方法让多个用户按一定的时间顺序利用软件的方法让多个用户按一定的时间顺序轮流地使用同一套资源,轮流地使用同一套资源,以提高其利用率,从而以提高其利用率,从而提高整个系统的性能。提高整个系统的性能。 多道程序分时系统多道程序分时系统 。 不需要增加硬件设备就可以提高计算机系统的不需要增加硬件设备就可以提高计算机系统的性能价格比性能价格比 。computer architecturev3同济大学.电子与信息工程学院.计算机科
43、学与技术系本章内容设计技术定量准则利用并行性 从不同的角度看,等级的划分也不一样:从不同的角度看,等级的划分也不一样: 从计算机系统中执行程序的角度看从计算机系统中执行程序的角度看 从计算机系统中处理数据的角度看从计算机系统中处理数据的角度看 从计算机信息加工的各个步骤和阶段看从计算机信息加工的各个步骤和阶段看computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则利用并行性并行性的等级 一条指令内部各个微操作之间的并行。一条指令内部各个微操作之间的并行。多条指令的并行执行。多条指令的并行执行。 多个任务或程序段的并行执行。多个任务
44、或程序段的并行执行。 多个作业或多道程序的并行。多个作业或多道程序的并行。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则利用并行性并行性的等级 同时只对一个字的一位进行处理,这通常是同时只对一个字的一位进行处理,这通常是指传统的串行单处理机,没有并行性。指传统的串行单处理机,没有并行性。 同时对一个字的全部位进行处理,这通常是同时对一个字的全部位进行处理,这通常是指传统的并行单处理机,开始出现并行性。指传统的并行单处理机,开始出现并行性。 同时对许多字的同一位(位片)进行处理,同时对许多字的同一位(位片)进行处理,开始进行
45、并行处理领域。开始进行并行处理领域。 同时对许多字的全部或部分进行处理。同时对许多字的全部或部分进行处理。10110111101100010010110010101110010位片字computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则利用并行性并行性的等级 例如,相联处理机。例如,相联处理机。 例如,流水线处理机。例如,流水线处理机。 例如,并行处理机。例如,并行处理机。 例如,多处理机。例如,多处理机。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则利用并行
46、性w 单处理机系统内并行性的发展单处理机系统内并行性的发展w 多计算机系统及其向并行处理系统的发展多计算机系统及其向并行处理系统的发展computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则利用并行性并行性的发展w 把一个任务按功能分割为若干个相互联系的子任务把一个任务按功能分割为若干个相互联系的子任务,然后然后将每一个子任务分配给某个专门的部件处理。目的是使所将每一个子任务分配给某个专门的部件处理。目的是使所有部件同时处于全面忙碌工作的状态。例如:指令流水线。有部件同时处于全面忙碌工作的状态。例如:指令流水线。w 例如:多体存储器
47、、多操作部件、并行处理机等。例如:多体存储器、多操作部件、并行处理机等。w 例如:多道程序和分时系统例如:多道程序和分时系统computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容设计技术定量准则利用并行性并行性的发展 多台计算机通过通道多台计算机通过通道/通信线路实现互连,共享通信线路实现互连,共享某些外设,以较低频带在某些外设,以较低频带在文件文件/数据集级别上相互作数据集级别上相互作用。系统功能被划分成多用。系统功能被划分成多个专门功能,然后将它们个专门功能,然后将它们分散给各个专用处理机。分散给各个专用处理机。专用处理机可具有不同的专用处理
48、机可具有不同的体系结构。目标是构成体系结构。目标是构成。 通过总线通过总线/ /高速互连网络高速互连网络互连多台计算机,共享主存,互连多台计算机,共享主存,以较高速率在数据以较高速率在数据/ /任务集上任务集上相互作用。支持进程和程序相互作用。支持进程和程序的并行处理。各处理机具有的并行处理。各处理机具有相同的功能。目标是构成相同的功能。目标是构成。w 地理上分散的多台计算地理上分散的多台计算机通过计算机通信网实现互机通过计算机通信网实现互连,共享资源。目标是构成连,共享资源。目标是构成。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容w
49、成本成本w 性能性能computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准 成本是指生产一个计算机系统所需的费用,成本是指生产一个计算机系统所需的费用,包括软、硬件的费用。影响因素:时间、产量、包括软、硬件的费用。影响因素:时间、产量、商品化。商品化。w 价格是指一个计算机系统销售时的金额。以价格是指一个计算机系统销售时的金额。以一个价值一个价值$1000的的pc为例(为例(图图)来介绍价格的构)来介绍价格的构成:成:标价元件成本直接成本毛利平均折扣2 之 1是指与生产一件产品直是指与生产一件产品直接有关的成本,包括劳动力成本、接有关的成
50、本,包括劳动力成本、保证金(在保质期间系统在用户那保证金(在保质期间系统在用户那边失灵时的更换或维修费用)等。边失灵时的更换或维修费用)等。是指与生产一是指与生产一件产品间接有关的成本,包括公司件产品间接有关的成本,包括公司的研发费用、营销费用、设备维护的研发费用、营销费用、设备维护费用、场地租金、财务成本、税前费用、场地租金、财务成本、税前利润和税。利润和税。 2 之 2computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准w 性能标准性能标准w 基准测试程序基准测试程序 w 性能比较性能比较computer architecturev
51、3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能 衡量计算机性能的唯一永久而且可靠的衡量计算机性能的唯一永久而且可靠的标准是:标准是:。下面介绍几。下面介绍几种较流行的替代标准及其不足:种较流行的替代标准及其不足:w mipsw mflopsw 选择程序评价性能选择程序评价性能computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能性能标准 mips(每秒百万条指令数)定义为:(每秒百万条指令数)定义为: 程序的执行时间为:程序的执行时间为:主要缺点:主要缺点: 不同指令的速度差别很大不同指令的速度差别很大 指令使
52、用频度差别很大指令使用频度差别很大 有相当多的非功能性指令有相当多的非功能性指令遗憾啊!computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能性能标准 mflops(每秒百万次浮点操作次数)定义为:(每秒百万次浮点操作次数)定义为: mflops只能衡量机器浮点操作的性能,而不能体现只能衡量机器浮点操作的性能,而不能体现机器的整体性能。机器的整体性能。主要缺点:主要缺点: 依赖于浮点运算集依赖于浮点运算集 依赖于浮点操作类型依赖于浮点操作类型可惜!computer architecturev3同济大学.电子与信息工程学院.计算机科学与
53、技术系本章内容评价标准性能性能标准 主要有主要有5类测试程序(以测量准确程度递减的类测试程序(以测量准确程度递减的次序排列):次序排列): 真实程序真实程序 改造改造/ /模拟程序模拟程序 核心测试程序核心测试程序 玩具基准测试程序玩具基准测试程序 综合基准测试程序综合基准测试程序computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能性能标准选择程序评价性能 使用真实程序进行测试。使用真实程序进行测试。 c编译程序、编译程序、word等字处理程序、等字处理程序、photoshop等应用程序。等应用程序。 会因程序依赖于具体的操作系统或
54、编译器而产会因程序依赖于具体的操作系统或编译器而产生移植问题。生移植问题。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能性能标准选择程序评价性能解决可移植问题解决可移植问题侧重于系统性能的某一特定方面侧重于系统性能的某一特定方面w 能再现桌面系统中可能出现的相互影响的行能再现桌面系统中可能出现的相互影响的行为,或模拟服务器系统中可能出现的复杂的多用为,或模拟服务器系统中可能出现的复杂的多用户交互。户交互。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能性能标准选
55、择程序评价性能 从真实程序中提取出的一些小而关键的程序段从真实程序中提取出的一些小而关键的程序段进行测试。进行测试。 livermore loops和和linpack等。等。 将计算机中各项特性的性能分离出来,以解释将计算机中各项特性的性能分离出来,以解释运行真实程序时性能有差异的原因。运行真实程序时性能有差异的原因。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能性能标准选择程序评价性能 选择通常只有选择通常只有10100行的代码、用户在测试之行的代码、用户在测试之前都已经知道运行结果的程序进行测试。前都已经知道运行结果的程序
56、进行测试。 puzzle、快速排序等。、快速排序等。 用于测试某种特定指标。用于测试某种特定指标。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能性能标准选择程序评价性能 人工合成出来的测试程序。为了使测试程序的人工合成出来的测试程序。为了使测试程序的行为和表现尽可能接近于真实的应用程序,一般行为和表现尽可能接近于真实的应用程序,一般先对大量的应用程序中的操作进行统计,得到各先对大量的应用程序中的操作进行统计,得到各种操作的比例,然后再按这个比例编制测试程序。种操作的比例,然后再按这个比例编制测试程序。 whetstone和和d
57、hrystone。computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能 把应用程序中用得最频繁的那部分核心程序把应用程序中用得最频繁的那部分核心程序作为评价计算机性能的标准程序。称为基准测试作为评价计算机性能的标准程序。称为基准测试程序程序 (benchmark)。w 用于桌面机的用于桌面机的benchmarksw 用于服务器的用于服务器的benchmarksw 用于嵌入式计算机的用于嵌入式计算机的benchmarkscomputer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能基
58、准测试程序 桌面机应具有的主要特性:桌面机应具有的主要特性:。spec()是常用的)是常用的benchmarks ,这些,这些benchmarks可分为两大类:可分为两大类:和和。 spec cpu2000(表表,测试实例测试实例)。)。 specviewperf和和specapc。7 之 1computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能基准测试程序 用于桌面机的benchmarks spec(system performance evaluation cooperative)是由)是由30个左右世界知
59、名计算机大厂商所支个左右世界知名计算机大厂商所支持的非盈利的合作组织,包括:持的非盈利的合作组织,包括:ibm、at&t、bull、compaq、cdc、dg、dec、fujitsu、hp、intel、mips、motolola、sgi、sun、unisys等;等;。 spec发展过程为:发展过程为:spec89spec92spec95spec2000spec20067 之 212个整数程序用于cint2000测试14个浮点程序用于cfp2000测试7 之 3computer architecturev3同济大学.电子与信息工程学院.计算机科学与技术系本章内容评价标准性能基准测试程序
60、用于桌面机的benchmarksw 测试对象测试对象w 测试结果测试结果spec cint2000的测试结果的测试结果spec cfp2000的测试结果的测试结果7 之 4 每一个桌面系统都配有一个每一个桌面系统都配有一个cpu、512mb sdram(如果支持则带如果支持则带ecc校验)、大约校验)、大约20gb的硬盘、一个快速的硬盘、一个快速的图形系统和一个的图形系统和一个10/100mbps以太网连接。以太网连接。7 之 5性能最好 性价比最好 7个桌面计算机的个桌面计算机的spec cint2000测试结果测试结果7 之 6性能最好 性价比最好 7个桌面计算机的个桌面计算机的spec cfp2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026福建三明大田县总医院选聘城区分院工作人员的8人备考题库附答案详解(基础题)
- 2026福建漳州市龙海区公益性岗位招聘1人备考题库带答案详解(研优卷)
- 2026福建福州商贸职业中专学校招聘教师5人备考题库附参考答案详解(培优)
- 2026湖北事业单位联考黄冈市市直招聘51人备考题库及1套完整答案详解
- 2026年智能语音控制系统项目公司成立分析报告
- 2026浙江省财务开发有限责任公司招聘备考题库及答案详解一套
- 2026甘肃武威古浪县公益性岗位工作人员招聘8人备考题库附参考答案详解(满分必刷)
- 2026第一季度重庆医科大学附属大学城医院考核招聘高层次和紧缺人才17人备考题库附答案详解(巩固)
- “梦想靠岸”招商银行乌鲁木齐分行2026春季校园招聘备考题库及答案详解(网校专用)
- 2026湖南郴州林邑中学春季招聘代课教师1人备考题库含答案详解
- “无废医院”建设指引
- 篮球比赛应急预案及措施
- 2025-2030卫星互联网星座组网进度与地面终端兼容性报告
- 医院功能科年终总结
- 医院科室整改前后对比
- 2024年QC课题(提升办案现场执法效率)专卖监督管理科
- 青光眼病人的健康宣教
- 海外机械设备管理制度
- 弘扬教育家精神:新时代教师的使命与担当
- 向银行申请减免利息还本金申请书样板
- 电站水毁修复工程施工组织设计
评论
0/150
提交评论