版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.5 定量分析技术基础1.5.1计算机性能的评测
◆
响应时间:从事件开始到结束之间的时间, 也称为执行时间。(计算机完成某一任务所花费的全部时间)◆
流量:在单位时间内所能完成的工作量。
相同点:都认为能够以最短时间完成指定任务的 计算机就是最快的。不同点:响应时间针对单任务,而流量针对多任务。
第一章计算机体系结构的基本概念响应时间与性能成反比,上式变成n=
=
=1.假设两台计算机为X和Y,“X比Y快”的意思是
对于给定任务,X的响应时间比Y少。
X比Y快n倍:=n
用户CPU时间系统CPU时间
2.CPU时间
CPU工作的时间,不包含I/O等待时间及运行其它程序的时间。1.5定量分析技术基础1.5.2测试程序1.目前常用的测试程序可以分为五类:
(按测试可靠性由高至低的顺序列出)
(1)实际应用程序(2)修正的(或者脚本化)应用程序(3)核心测试程序(3)小测试程序(4)合成测试程序1.5定量分析技术基础2.测试程序组件
选择一组各个方面有代表性的测试程序,组成一个通用测试程序集合。
最大优点:
避免了独立测试程序存在的片面性,尽可能全面地测试了一个计算机系统的性能。
◆
最常见的测试程序组件是基于UNIX的SPEC
主要版本包括SPEC89、SPEC92、SPEC95和SPEC2000等。1.5定量分析技术基础测试程序程序类型SPEC89SPEC92SPEC95SPEC2000gcc整数采用修正修正修正espresso整数采用修正舍弃
li整数采用修正修正舍弃eqntott整数采用舍弃
spice浮点采用修正舍弃
doduc浮点采用
舍弃
nasa7浮点采用
舍弃
fpppp浮点采用
修正舍弃matrix300浮点采用舍弃
tomcatv浮点采用
修正舍弃compress整数
采用修正舍弃sc整数
采用舍弃
mdljdp2浮点
采用舍弃
wave5浮点
采用修正舍弃ora浮点
采用舍弃
mdljsp2浮点
采用舍弃
alvinn浮点
采用舍弃
ear浮点
采用舍弃
表1.7 SPEC不同版本所包含测试程序的演化过程swm256(akaswim)浮点
采用修正修正su2cor浮点
采用修正舍弃hydro2d浮点
采用修正舍弃go整数
采用舍弃m88ksim整数
采用舍弃ijpeg整数
采用舍弃perl整数
采用修正vortex整数
采用修正mgrid浮点
采用修正applu浮点
采用舍弃apsi浮点
采用修正turb3d浮点
采用舍弃表1.8 SPECCPU2000测试程序组件中的程序
测试程序程序类型源码类型说明gzip整数C使用Lempel-Ziv的压缩算法vpr整数CFPGA布局布线gcc整数C使用GNUC编译器生成优化的机器代码mcf整数C公交调度的组合优化crafty整数C下棋程序parser整数C英语句法分析eon整数C++一种图形学中的光线跟踪算法perlmbk整数C四个输入脚本的Perlgap整数C一个群论算法包vortex整数C一个面向对象的数据库系统bzip2整数C一种块分类压缩算法twolf整数CTimberwolf:一种用于VLSI布局布线的模拟退火算法wupwise浮点F77量子色动力学的格群论模型swim浮点F77使用有限差分方程求解浅水方程mgrid浮点F77三维场上的多栅格解算机apply浮点F77抛物线和椭圆偏微分方程解算器mesa浮点C三维图形库galgel浮点F90流体动力学计算art浮点C使用神经网络对温度图进行图像识别equake浮点C地震波传播模拟facerec浮点C使用小波和图形匹配进行面像识别ammp浮点C一种水中蛋白质的分子动力学模拟lucas浮点F90进行Mersenne素数的基本测试fma3d浮点F90采用有限元方法的撞击模拟sixtrack浮点F77设计高能加速器的模拟器apsi浮点F77大气污染的气象学方法模拟
◆
SPEC2000测试程序组件,除了含有测试CPU的
SPECCPU2000,还包括其他一系列测试程序组 件:
SPECviewperf
用于测试图形系统支持OpenGL库的性能
SPECapc
测试图形密集型应用的性能
SPECSFS
基于NFS文件系统的文件服务器测试程
SPECWeb
Web服务器测试程序1.5定量分析技术基础◆
TPC测试程序组件
事务处理(Transaction-processing,TP)
测试程序主要测试在线事务处理系统的性能。
核心内容:数据库访问和相关的信息决策能力。
TPC-A
TPC-C
模拟一个复杂队列环境。
TPC-H
一个特别的决策支持模型,其队列执
行时间特别长。1.5定量分析技术基础
TPC-R
模拟面向一组标准队列的商业决策支持
系统,涉及到DBMS的优化。
TPC-W
基于Web的商业事务处理活动。面向事务处理的测试程序组件主要用于测试服务器的性能。◆测试基于Microsoft公司的Windows系列操 作系统平台的测试组件1.5定量分析技术基础
PCMark04
包括中央处理器测试组、内存测试组、图形芯片测试组、硬盘测试组等。
BusinessWinstone2004
主要用于测试计算机系统商业应用的综合性能。
MultimediaContentCreationWinstone2004
主要用于测试计算机系统多媒体应用的综 合性能。1.5定量分析技术基础
SiSoftSandraPro2004
拥有超过30种以上的分析与测试模组,主要包括有CPU、存储器、I/O接口(如SCSI、APM/ACPI、网络等)、I/O设备(如CD-ROM/DVD、鼠标、键盘、打印机等)、主板等。1.5定量分析技术基础3DMark03
主要测试显卡性能和DirectX的性能。
Prime95
用来估计分布式计算程序的通信情况,可使计算机高负荷运转,所以也用来测试计算机的稳定性。
SuperPi/SuperE
计算圆周率π/自然指数e的软件,通常用来测试CPU的稳定性。◆一些专门的性能指标测试程序
1.5定量分析技术基础1.5.3性能设计和评测的基本原则
三条基本原则和方法:1.大概率事件优先的原则对于大概率事件(最常见的事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。2.
Amdahl定律
加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。1.5定量分析技术基础(1)加速比
系统加速比依赖于两个因素:
可改进比例:可改进部分在原系统计算时间中所占的
比例,它总是小于等于1的。
例如:一个需运行60秒的程序中有20秒的运算
可以加速,那么该比例就是20/60。系统加速比==
部件加速比:可改进部分改进以后的性能提高,
一般情况下它是大于1的。例如:系统改进后执行程序,其中可改进部分花费2秒的时间,而改进前该部分需花费5秒,则性能提高为5/2。1.5定量分析技术基础总执行时间改进后=(1-可改进比例)总执行时间改进前
+=[(1-可改进比例)+]总执行时间改进前
总执行时间改进后=不可改进部分的执行时间+
可改进部分改进后的执行时间系统加速比为改进前与改进后总执行时间之比:系统加速比=
=
(2)Amdahl定律:性能递减规则如果仅仅对计算机中的一部分做性能改进,则改进越多,系统获得的效果越小。
推论:如果只针对整个任务的一部分进行优化,那么所获得的加速比不大于1/(1-fe)。(3)一个“好”的计算机系统:具有高性价比的计算机系统是一个带宽平衡的系统,而不是看它使用的某些部件的性能。1.5定量分析技术基础3.程序的局部性原理
程序在执行时所访问地址的分布不是随机的,而是相对地簇聚;这种簇聚包括指令和数据两部分。
◆
程序的时间局部性:程序即将用到的信息很可能就是目前正在使用的信息。
◆
程序的空间局部性:程序即将用到的信息很可能与目前正在使用的信息在空间上相邻或者临近。1.5定量分析技术基础1.5.4CPU的性能1.将程序执行的时间进行分解
(1)计算机工作的时钟频率计算机系统中与实现技术和工艺有关的因素。单位是MHz(f)。(2)总时钟周期数
程序执行的cpu时间:CPU时间=总时钟周期数/时钟频率
1.5定量分析技术基础2.“指令时钟数”CPI(CyclesPerInstruction)
一个与计算机体系结构有关的参数。CPI=总时钟周期数/IC
3.程序执行的CPU时间可以写成
总CPU时间=CPIIC/时钟频率
◆
时钟频率:反映了计算机实现技术、生产工艺 和计算机组织。
IC:程序执行过程中所处理的指令数。1.5定量分析技术基础◆
CPI:反映了计算机实现技术、计算机指令集 的结构和计算机组织。◆
IC:反映了计算机指令集的结构和编译技术。1.5定量分析技术基础假设:计算机系统有n种指令;
CPIi:第i种指令的处理时间;
ICi:在程序中第i种指令出现的次数;则程序执行时间为CPU时间=
(CPIi
ICi)/时钟频率CPI=
(CPIi
ICi)/IC=
(CPIi
ICi/IC)其中:(ICi/IC)反映了第i种指令在程序中所占的比例。i=1i=1i=1nnn1.5定量分析技术基础4.对CPU性能公式进行进一步细化例1.1假设我们考虑条件分支指令的两种不同设计方法如下:(1)CPUA:通过比较指令设置条件码,然后测试条
件码进行分支。
CPUB:在分支指令中包括比较过程在两种CPU中,条件分支指令都占用2个时钟周期而所有其它指令占用1个时钟周期,对于CPUA,执行的指令中分支指令占20%;由于每个分支指令之前都需要有比较指令,因此比较指令也占20%。由于CPUA1.5定量分析技术基础在分支时不需要比较,因此假设它的时钟周期时间比CPUB快1.25倍。哪一个CPU更快?如果CPUA的时钟周期时间仅仅比CPUB快1.1倍,哪一个CPU更快呢?
解:我们不考虑所有系统问题,所以可用CPU性能公式。占用2个时钟周期的分支指令占总指令的20%,剩下的指令占用1个时钟周期。所以
CPIA=0.22+0.801=1.2则CPU性能为:
总CPU时间A=IC1.2
时钟周期A1.5定量分析技术基础根据假设,有:
时钟周期B=1.25
时钟周期A在CPUB中没有独立的比较指令,所以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 协调性功能训练
- 2025事业单位招聘考试公共基础知识题库附答案详解(满分必刷)
- 焊接实训总结报告
- 电子签到入场形式介绍
- 新版光伏产业技能竞赛理论试题库及答案
- 手术中患者宣教
- 《指南录后序》课件
- 2025版转移性癌症常见症状及护理护航
- 2025年护理学基础知识考试试题库及答案(共610题)
- 肾内科慢性肾脏病进展监测
- 2025年秋沪科版八年级数学上册 第12章 函数与一次函数 综合测试卷(含答案)
- 2025年中小学生安全知识知识竞赛试题库及答案
- 2025年执业药师《中药学综合知识与技能》考试真题及答案解析
- 打印机基础知识课件
- 2025年广西公需真题卷及答案
- 医院拔牙后的护理常规
- 隐蔽工程报验管理办法
- 矿井电子围栏管理制度
- 产品批次追溯管理制度
- 甲亢教学课件
- 呼吸系统体格检查规范
评论
0/150
提交评论