chap1-计算机体系结构的基本概念.ppt_第1页
chap1-计算机体系结构的基本概念.ppt_第2页
chap1-计算机体系结构的基本概念.ppt_第3页
chap1-计算机体系结构的基本概念.ppt_第4页
chap1-计算机体系结构的基本概念.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息工程学院 2019年9月,1.2 计算机体系结构的概念,信息工程学院 2019年9月,一个计算机体系结构,从产生到消亡,大致 需要1520年的时间。,1.3 计算机体系结构的发展,1.3.5 体系结构的生命周期,信息工程学院 2019年9月,信息工程学院 2019年9月,1.4 定量分析技术基础,1.4.1 计算机性能的评测, 执行时间:从事件开始到结束之间的时间,也称为响应时间。 (计算机完成某一任务所花费的全部时间) 吞吐率:在单位时间内所能完成的任务量,也称为流量。,相同点:都认为能够以最短时间完成指定任务的 计算机就是最快的。 不同点:执行时间针对单任务,而吞吐率针对多任务。,第一章 计算机体系结构的基本概念,响应时间与性能成反比,上式变成 n = = =,例: 假设两台计算机为X和Y,“X比Y快”的意思是 对于给定任务,X的响应时间比Y少。 X比Y快n倍: = n,信息工程学院 2019年9月, CPU时间 CPU工作的时间,不包含I/O等待时间及运行 其它程序的时间。 CPU速度 MIPS:每秒钟执行的指令数量(百万条/秒) MFLOPS:每秒钟执行的浮点运算操作次数(百万次浮点操作/秒),用户CPU时间 系统CPU时间,1.4 定量分析技术基础,信息工程学院 2019年9月,1.4.2 性能设计和评测的基本原则,三条基本原则和方法:,1. 大概率事件优先的原则(以经常性事件为重点) 对于大概率事件(最常见的事件),赋予 它优先的处理权和资源使用权,以获得全局的 最优结果。 只加速(优化)那些使用频率高的部件 用尽可能少的代价提高整个计算机性能,1.4 定量分析技术基础,信息工程学院 2019年9月,2. Amdahl定律 加快某部件执行速度所获得的系统性能 加速比,受限于该部件在系统中所占的比重。,1.4 定量分析技术基础,(1) 加速比,系统加速比依赖于两个因素: 可改进比例:可改进部分在原系统计算时间中所占的 比例,它总是小于等于的。 例如: 一个需运行60秒的程序中有20秒的运算 可以加速,那么该比例就是20/60。,系统加速比 = =,信息工程学院 2019年9月,部件加速比:可改进部分改进以后的性能提高, 一般情况下它是大于的 。 例如: 系统改进后执行程序,其中可改进部分花 费2秒的时间,而改进前该部分需花费5秒, 则性能提高为5/2,加速比=2.5。,1.4 定量分析技术基础,总执行时间改进后=(1-可改进比例)总执行时间改进前 + = (1-可改进比例) + 总执行时间改进前,总执行时间改进后 = 不可改进部分的执行时间 + 可改进部分改进后的执行时间,系统加速比为改进前与改进后总执行时间之比: 系统加速比 = =,信息工程学院 2019年9月,(2) Amdahl定律:性能递减规则 如果仅仅对计算机中的一部分做性能改 进,则改进越多,系统获得的效果越小。 推论:如果只针对整个任务的一部分(fe)进行 优化,那么所获得的加速比不大于1/(1-fe)。 (3) 一个“好”的计算机系统:具有高性价比的计 算机系统是一个平衡的系统,而不是看它 使用的某些部件的性能 。,1.4 定量分析技术基础,信息工程学院 2019年9月,3. 程序的局部性原理 程序在执行时所访问地址的分布不是随机的,而是 相对地簇聚;这种簇聚包括指令和数据两部分。 90/10法则,90%时间执行10%的代码。 - 程序往往重复使用它刚刚使用过的数据和指令 程序的时间局部性:程序即将用到的信息很 可能就是目前正在使用的信息。 程序的空间局部性:程序即将用到的信息很可能与目前 正在使用的信息在空间上相邻或者临近。,1.4 定量分析技术基础,信息工程学院 2019年9月,1.4 定量分析技术基础,例1:计算机执行某测试程序,其中含有大量浮点数据的处理操作,同时已知FPSQR操作时间占整个测试程序执行时间的20%,而FP操作占整个执行时间的50%。为提高性能可以采用两种方案: (1)采用硬件实现求浮点数平方根(FPSQR)的操作,可以使该操作的速度提高10倍; (2)提高所有浮点数据操作(FP)的速度,使其加快2倍。 现比较两种方案,按两种情况求出其加速比(Sp):,改善浮点数据操作的方案更好一些,信息工程学院 2019年9月,1.4 定量分析技术基础,例2:若考虑将系统中某一功能的处理时间由60s加快为6s,但该功能的处理使用时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少? 由题可知:fe=0.4,re=60/6=10,则可得:Sp=1.56 若以Sp作纵坐标, fe作横坐标,则对不同的re,可画出Sp=f(fe)的函数。,0.0 0.5 1.0 fe,由图中曲线可知,为使系统能获得较高性能加速比,则功能性能可增强部分必须占有较大的比例;否则,增强该功能就没有多大意义。,信息工程学院 2019年9月,1.4.3 CPU的性能 1. 将程序执行的时间进行分解 (1) 计算机工作的时钟频率 计算机系统中与实现技术和工艺有关的因素。 单位是MHz(f)。 (2) 总时钟周期数,程序执行的CPU时间 :,CPU时间 = 总时钟周期数 / 时钟频率,1.4 定量分析技术基础,信息工程学院 2019年9月,2. “指令时钟数”CPI(Cycles Per Instruction) 一个与计算机体系结构有关的参数。,CPI = 总时钟周期数 / IC,3. 程序执行的CPU时间可以写成 总CPU时间 = CPI IC / 时钟频率, 时钟频率:反映了计算机实现技术、生产工艺 和计算机组织。,IC:程序执行过程中所处理的指令数。,1.4 定量分析技术基础,信息工程学院 2019年9月, CPI:反映了计算机实现技术、计算机指令集 的结构和计算机组织。 IC:反映了计算机指令集的结构和编译技术。,1.4 定量分析技术基础,信息工程学院 2019年9月,假设:计算机系统有n种指令; CPIi :第i种指令的处理时间; ICi :在程序中第i种指令出现的次数; 则程序执行时间为 CPU时间 = (CPIi ICi) / 时钟频率 CPI = (CPIi ICi) / IC = (CPIi ICi / IC) 其中:(ICi / IC)反映了第i种指令在程序中所占的 比例。,i=1,i=1,i=1,n,n,n,1.4 定量分析技术基础,4. 对CPU性能公式进行进一步细化 (该讲这儿了0310),信息工程学院 2019年9月,例1.3(书上p9) 假设我们考虑条件分支指令的两种不同设计方法如下:,(1) CPUA:通过比较指令设置条件码,然后测试条 件码进行分支。 CPUB:在分支指令中包括比较过程,在两种CPU中,条件分支指令都占用2个时钟周 期而所有其它指令占用1个时钟周期,对于CPUA,执 行的指令中分支指令占20%;由于每个分支指令之前 都需要有比较指令,因此比较指令也占20%。由于CPUA,1.4 定量分析技术基础,信息工程学院 2019年9月,在分支时不需要比较,因此假设它的时钟周期时间 比CPUB快1.25倍。哪一个CPU更快?如果CPUA的时钟 周期时间仅仅比CPUB快1.1倍,哪一个CPU更快呢?,解:我们不考虑所有系统问题,所以可用CPU性能公式。占用2个时钟周期的分支指令占总指令的20%,剩下的指令占用1个时钟周期。所以 CPIA = 0.2 2 + 0.80 1 = 1.2 则CPU性能为: 总CPU时间A = IC 1.2 时钟周期A,1.4 定量分析技术基础,信息工程学院 2019年9月,根据假设,有: 时钟周期B = 1.25 时钟周期A 在CPUB中没有独立的比较指令,所以CPUB的程序量为CPUA的80%,分支指令的比例为: 20%/80% = 25% 这些分支指令占用2个时钟周期,而剩下的75%的指令占用1个时钟周期,因此: CPIB = 0.25 2 + 0.75 1 = 1.25 因为CPUB不执行比较,故: ICB = 0.8 ICA,1.4 定量分析技术基础,信息工程学院 2019年9月,因此CPUB性能为: 总CPU时间B = ICB CPIB 时钟周期B = 0.8 ICA 1.25 (1.25 时钟周期A) = 1.25 ICA 时钟周期A 总CPU时间A = ICA 1.2 时钟周期A 在这些假设之下,尽管CPUB执行指令条数较少,CPUA因为有着更短的时钟周期,所以比CPUB快。,1.4 定量分析技术基础,信息工程学院 2019年9月,如果CPUA的时钟周期时间仅仅比CPUB快1.1倍,则 时钟周期B = 1.10 时钟周期A CPUB的性能为: 总CPU时间B = ICB CPIB 时钟周期B = 0.8 ICA 1.25 (1.10 时钟周期A) = 1.10 ICA 时钟周期A 总CPU时间A = ICA 1.2 时钟周期A 因此CPUB由于执行更少指令条数,比CPUA运行更快。,1.4 定量分析技术基础,信息工程学院 2019年9月,1.4.4 性能测试程序,1.目前常用的测试程序可以分为五类: (按测试可靠性由高至低的顺序列出) (1) 实际应用程序 (2) 修正的(或者脚本化)应用程序 (3) 核心测试程序 (3) 小测试程序 (4) 合成测试程序,1.4 定量分析技术基础,信息工程学院 2019年9月,2. 测试程序组件 选择一组各个方面有代表性的测试程序, 组成一个通用测试程序集合。 最大优点: 避免了独立测试程序存在的片面性,尽 可能全面地测试了一个计算机系统的性能。 最常见的测试程序组件是基于UNIX的SPEC 主要版本包括SPEC89、SPEC92、 SPEC95和SPEC2000等。,1.4 定量分析技术基础,信息工程学院 2019年9月,SPEC不同版本所包含测试程序的演化过程,信息工程学院 2019年9月,信息工程学院 2019年9月,SPEC CPU2000测试程序组件中的程序,信息工程学院 2019年9月,信息工程学院 2019年9月, SPEC2000测试程序组件,除了含有测试CPU的 SPEC CPU2000,还包括其他一系列测试程序组 件:,SPECviewperf 用于测试图形系统支持OpenGL库的性能 SPECapc 测试图形密集型应用的性能 SPECSFS 基于NFS文件系统的文件服务器测试程 SPECWeb Web服务器测试程序,1.4 定量分析技术基础,信息工程学院 2019年9月, TPC测试程序组件 事务处理(Transaction-processing,TP) 测试程序主要测试在线事务处理系统的性能。 核心内容:数据库访问和相关的信息决策能力。,TPC-A TPC-C 模拟一个复杂队列环境。 TPC-H 一个特别的决策支持模型,其队列执 行时间特别长。,1.4 定量分析技术基础,信息工程学院 2019年9月,TPC-R 模拟面向一组标准队列的商业决策支持 系统,涉及到DBMS的优化。 TPC-W 基于Web的商业事务处理活动。,面向事务处理的测试程序组件主要用于测试服 务器的性能。,1.4 定量分析技术基础,信息工程学院 2019年9月,PCMark04 包括中央处理器测试组、内存测试组、图 形芯片测试组、硬盘测试组等。 Business Winstone 2004 主要用于测试计算机系统商业应用的综合 性能。 Multimedia Content Creation Winstone 2004 主要用于测试计算机系统多媒体应用的综 合性能。,1.4 定量分析技术基础, 基于Windows系列操作系统平台的测试组件,信息工程学院 2019年9月,SiSoft Sandra Pro 2004 拥有超过30种以上的分析与测试模组, 主要包括有CPU、存储器、I/O接口(如SCSI、 APM/ACPI、网络等)、I/O设备(如CD- ROM/DVD、鼠标、键盘、打印机等)、主板等。,1.4 定量分析技术基础,信息工程学院 2019年9月,3DMark03 主要测试显卡性能和DirectX的性能。 Prime95 用来估计分布式计算程序的通信情况, 可使计算机高负荷运转,所以也用来测试计 算机的稳定性。 SuperPi/SuperE 计算圆周率/自然指数e的软件,通常 用来测试CPU的稳定性。, 一些专门的性能指标测试程序,1.4 定量分析技术基础,信息工程学院 2019年9月,1.5 计算机体系结构中并行性的发展,1.5.1 并行性概念 1. 并行性 在同一时刻或是同一时间间隔内完成两种或两种以上性质相同或不相同的工作。 只要时间上互相重叠,就存在并行性。,第一章 计算机体系结构的基本概念,信息工程学院 2019年9月, 同时性 两个或多个事件在同一时刻发生的并行性。 并发性 两个或多个事件在在同一时间间隔内发生 的并行性。,1.5 计算机体系结构中并行性的发展,信息工程学院 2019年9月,2. 计算机系统中的并行性有不同的等级, 指令内部并行:指令内部的微操作之间的并行。 指令级并行:并行执行两条或多条指令。 线程级并行:并发执行多个线程,通常是以一个 进程内控制派生的多个线程为调度单 位。,(1) 从执行程序的角度看,并行性等级从低到 高可分为,1.5 计算机体系结构中并行性的发展,信息工程学院 2019年9月, 任务级或过程级并行:并行执行两个或多个过 程或任务(程序段)。 作业或程序级并行:在多个作业或程序间的并行。,1.5 计算机体系结构中并行性的发展,信息工程学院 2019年9月,(2) 从处理数据的角度,并行性等级从低到高可以 分为, 字串位串: 同时只对一个字的一位进行处理。 字串位并:同时对一个字的全部位进行处理, 不同字之间是串行的。 字并位串:同时对许多字的同一位(称位片)进 行处理。 全并行: 同时对许多字的全部或部分位进行处理。,1.5 计算机体系结构中并行性的发展,信息工程学院 2019年9月,1.5.2 提高并行性的技术途径,1. 三种途径 (1) 时间重叠 多个处理过程在时间上相互错开,轮 流重叠地使用同一套硬件设备的各个部分, 以加快硬件周转而赢得速度。,1.5 计算机体系结构中并行性的发展,信息工程学院 2019年9月,(3) 资源共享 这是一种软件方法,它使多个任务按一定 时间顺序轮流使用同一套硬件设备。,1.5 计算机体系结构中并行性的发展,(2) 资源重复 根据“以数量取胜”的原则,通过重复地 设置资源,尤其是硬件资源,以大幅度提高计 算机系统的性能。,信息工程学院 2019年9月,2. 单机系统中并行性的发展,(1) 在发展高性能单处理机过程中,起着主导 作用的是时间重叠这个途径。 实现时间重叠的基础:部件功能专用化。 把一件工作按功能分割为若干相互联系的部分; 把每一部分指定给专门的部件完成; 然后按时间重叠原则把各部分执行过程在时间 上重叠起来,使所有部件依次分工完成一组同样 的工作。,1.5 计算机体系结构中并行性的发展,信息工程学院 2019年9月,例如 对于解释指令的五个过程,就分别需要五个专用的部件,即取指令部件(IF)、指令译码部件(ID)、指令执行部件(EX)、访问存储器部件(M)和写结果部件(WB)。,信息工程学院 2019年9月,先行控制 指令流水线,操作流水线 向量处理机 异构型(非对称型)多处理机系统,由多个不同类型、至少担负不同功能的处理机组成,按照作业要求的顺序,利用时间重叠原理,依次对它们的多个任务进行加工,各自完成规定的功能动作。,1.5 计算机体系结构中并行性的发展,信息工程学院 2019年9月,部件冗余 多操作部件,多存储体 并行处理机,相联处理机 同构型(对称型)多处理机系统,(2) 在单处理机中,资源重复的运用已经普遍起来。,由多个同类型,至少担负同等功能的处理机组成,同时处理同一作业中能并行执行的多个任务。,1.5 计算机体系结构中并行性的发展,信息工程学院 2019年9月,(3) 资源共享 实质:用单处理机模拟多处理机的功能,形成所谓 虚拟机的概念。,多道程序,分时系统 多终端,远程终端 智能终端 分布处理系统,把若干个具有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论