版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§3计算机系统的软硬取舍、性能评测及定量设计原理软、硬取舍的基本原则计算机系统的性能评测
计算机系统的设计原则计算机系统设计者的主要任务计算机系统的设计思路
计算机系统的设计步骤控制流程的三种实现方法
全硬件、软硬件结合、全软件逻辑上等价硬件实现:速度快、成本高;灵活性差、占用内存少软件实现:速度慢、复制费用低;灵活性好、占用内存多、易设计、可改性强、适应性强、设计周期短;理论上:由两种极端实现方法全硬件机器:操作系统、高级语言、应用等硬件只有1位加法和分支操作,其他都用软件关键问题:性能与价格的关系发展趋势硬件实现的比例越来越高硬件所占的成本越来越低软硬件实现的优缺点项目软件硬件速度慢快系统灵活性、适应性强弱成本低高计算机系统的软、硬件功能分配发展不可编程目前计算机最少硬件软件硬件软硬件比例计算机系统的软、硬件成本变化七十年代硬件软件成本年代软硬取舍的基本原则很高的性能价格比
设:D为研制设计费用,M为重复生产费用
h为硬件,s为软件。
则:设C:该功能在软件实现时许重新设计的次数;
R:存储介质上出现的次数;
V:生产的台数;
则硬件的费用:
软件的费用:
软硬取舍的基本原则(续)则只有:将上述带入:可见:只有在C和R的值较大时,才成立。由于:则:因为:C<100
所以V值越大,上式成立。即产量大。
软硬取舍的基本原则(续)考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不合理地限制各种组成、实现技术的采用;
不能仅从“硬”的角度去考虑如何便于应用组成技术的成果和发挥器件技术的进展,还应从“软”的角度把为编译和操作系统的实现,以至高级语言程序的设计提供更多更好的硬件支持放在首位;
软硬取舍的基本原则(续)考虑用户的应用领域:专用—硬件设计周期长的硬件不宜采用常用的功能尽量采用硬件实现实现功能的成本性能比(或价格性能比)要低尽量采用新技术实现超前设计举例1:某一计算机用于商业外贸的事务处理,有大量的字符串操作。由于这种事务处理很普遍,有较大的市场,故而设计人员决定在下一代此类计算机的CPU中加入字符串操作的功能。经测试应用软件调查发现,字符串操作的使用占整个程序运行时间的50%,而增加此功能如用软件(如微程序)实现,则快5倍,增加CPU成本1/5倍;如果用硬件实现,则快100倍,CPU成本增加到5倍。问设计人员提出增加此功能是否恰当?是否用软件还是硬件?设CPU成本占整机成本的1/3。硬件实现软件实现举例2:如果上例中,字符串操作功能的使用时间占整个程序运行时间的90%,则情况如何?硬件实现软件实现计算机系统的性能评价时钟频率指令执行速度平均速度核心程序法峰值速度时钟频率运算速度是表示处理机性能的主要指标,有多种表示处理机运算速度的方法,哪一种表示方法更加合理?时钟频率(处理机主频)只能用于同一类型、同一配置的处理机,相对比较Pentium43.2GHZ比Pentium41.6GHZ快一倍?Pentium42.4GHZ比Pentium41.6GHZ快50%?实际运算速度还与Cache、内存、IO、被执行程序等均有关指令的执行速度一种经典的表示运算速度的方法MIPS(MillionInstructionsPerSecond),GIPS,TIPS其中:Fz为处理机的工作主频
CPI(CyclesPerInstruction)为每条指令所需的平均时钟周期数
IPC(InstructionPerCycle)为每个时钟周期平均执行的指令条数
例1:计算PentiumIV3GHz处理机的速度解:由于PentiumIV3GHz处理机的
IPC=4(或CPI=0.25)
Fz=3000MHzMIPSPentiumIV3G=Fz×IPC=
3000×4=12000MIPS=12GIPS
峰值速度秒120亿次/秒,实际速度约50亿次/秒主要优点:直观、方便。目前经常使用主要缺点:(1)不同指令的执行速度差别很大
(2)指令使用频度差别很大
(3)有相当多的非功能性指令计算机系统的评测性能指标体现在时间和空间峰值性能:在理想情况下计算机系统可获得的最高理论性能值,它不能反映出系统的实际性能实际性能(持续性能):只是峰值性能的5%-30%平均速度算术性能平均值:调和性能平均值:几何性能平均值:加权算术平均值:加权调和平均值:加权几何平均值:加权方法静态指令使用频度:在程序中直接统计动态指令使用频度:在程序执行过程中统计吉普森(Gibson)法:加减法:50%,乘法:15%,除法:5%,程序控制:15%,其他:15%CPU性能公式CPU的性能取决于三个要素:①时钟频率f(或时钟周期t);②每条指令所花的时钟周期数CPI;③指令条数IC一个程序所花的CPU时间(T)可以用两种方式来表示:CPU时间(T)=CPU时钟周期数(CPI×IC)*时钟周期长(t)每条指令的平均时钟周期数:计算CPU的程序时间:IC(InstructionCounter):程序执行的总指令条数CPI(CyclesPerInstruction):平均每条指令的时钟周期Fc:主时钟频率假设系统共有n种指令,第i种指令在程序中出现的次数为Ii,这样:MIPS(MillionInstructionPerSecond)MFLOPS(MillionFloatingPointPerSecond)核心程序法定点测试程序:Dhrystone用C语言编写,100条语句。包括:各种赋值语句,数据类型和数据区,控制语句,过程调用和参数传送,整数运算和逻辑操作等。VAX-11/780的测试结果为每秒1757,即1VAXMIPS=1757Dhrystones/Second浮点测试程序:Linpack用FORTRAN编写,主要是浮点加法和浮点乘法,用MFLOPS(MillionFloatingPointOperationsPerSecond)表示,GFLOPS、TFLOPS1.2.4SPECStandardPerformanceEvaluationCooperative
由30个左右世界知名计算机大厂商所支持的非盈利性国际合作组织,包括:IBM、AT&T、BULL、Compaq、CDC、DG、DEC、Fujitsu、HP、Intel、MIPS、Motolola、SGI、SUN、Unisys等1989年10月宣布SPEC1.0,程序量超过15万行,包含4个定点程序和6个浮点程序,测试结果用SPECint’89和SPECfp’89表示。1992年增加到有6个定点程序和14个浮点程序,测试结果用SPECint’92和SPECfp’92表示1995年推出SPECint’95和SPECfp’95SPEC2000,12个定点程序、14个浮点程序目前:CPU,Graphics/Workstation,MPI/OMP,JavaClient/Server,Mail
Server,NetworkFileSystem,Power,SIP,SOA,Virtualization,WebServers评测方法采用实际的应用程序测试如:C语言的编译程序Spice:SimulationProgramwithIntegratedCircuitEmphasis,是一种用于电路描述与仿真的语言与仿真器软件,用于检测电路的连接和功能的完整性,以及用于预测电路的行为。主要用于模拟电路和混合信号电路的仿真。采用核心程序测试从实际程序中抽出关键部分组合而成合成测试程序人为写的核心程序,规模小,结果预知综合基准测试程序峰值速度峰值指令速度:MIPS、GIPS、TIPS
浮点峰值速度:MFLOPS、GFLOPS、TFLOPS例5:一个由256台计算机组成的Cluster系统,每台计算机由4个PentiumIV3GHz的CPU组成,计算这个Cluster系统的浮点峰值速度。解:PentiumIV3GHz,有4条浮点流水线,浮点峰值速度为:3×4=12GFLOPSCluster的浮点峰值速度=3×4×256×4=
12.288GFLOPS即每秒12万亿次计算机系统的定量设计原理
哈夫曼压缩原理Amdahl定律程序访问的局部性规律哈夫曼压缩原理尽可能加速高概率事件远比加速处理概率很低的事件对性能提高要显著。只加速使用频率高的部件Makethecommoncasefast例如:CPU中的加法,溢出情况。这是计算机设计中最重要也最广泛采用的设计准则。使经常性事件的处理速度加快能明显提高整个系统的性能。Amdahl定律系统对某一部件采用某种更快执行方式所能获得的系统性能改进程序,取决于这种执行方式被使用的频率,或所占总执行时间的比例。Amdahl定律(续)定义了加速比的大小Amdahl加速比(续)Amdahl例1.1假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知:fe=0.4,re=10,根据Amdahl定律Amdahl例1.2
采用哪种实现技术来求浮点数平方根FPSQR的操作对系统的性能影响较大。假设FPSQR操作占整个测试程序执行时间的20%。一种实现方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。另一种实现方法是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50%。请比较这两种设计方案。Amdahl例1.2解:分别计算出这两种设计方案所能得到的加速比:CPU性能公式CPU的性能取决于三个要素:①时钟频率f(或时钟周期t);②每条指令所花的时钟周期数CPI;③指令条数IC一个程序所花的CPU时间(T)可以用两种方式来表示:CPU时间(T)=CPU时钟周期数(CPI×IC)*时钟周期长(t)每条指令的平均时钟周期数:例1.3
如果FP操作的比例为25%,FP操作的平均CPI=4.0,其它指令的平均CPI为1.33,FPSQR操作的比例为2%,FPSQR的CPI为20。假设有两种设计方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。试利用CPU性能公式比较这两种设计方案哪一个更好(只改变CPI而时钟频率和指令条数保持不变)。例1.3的解答解:原系统的CPI=25%×4+75%×1.33=2方案1(使FPSQR操作的CPI为2)系统
CPI=CPI原-2%×(20-2)=2-2%×18=1.64方案2(提高所有FP指令的处理速度)系统
CPI=CPI原-25%×(4-2)=2-25%×2=1.5我们也可以根据以下公式计算出方案2系统的CPICPI=75%×1.33+25%×2=1.5显然,提高所有FP指令处理速度的方案要比提高FPSQR处理速度的方案要好。方案2的加速比=2/1.5=1.33程序访问的局部性规律局部性分时间上的局部性和空间上的局部性时间局部性:程序中近期被访问的信息项很可能马上将被再次访问。空间局部性:指那些在访问地址上相邻近的信息项很可能会被一起访问。存储器体系的构成就是以访问的局部性原理为基础的。计算机系统设计者的主要任务
满足用户对功能上的要求以及相应的价格性能要求满足功能要求的基础上,进行优化设计设计应能适应日后的发展趋势硬件与软件的发展硬件:晶体管数:
增加25%/年,
三年一倍DRAM的密度:60%/年,二年三倍访存周期:减少33%/十年硬盘密度:增加25%/年访问时间:减少33%/十年
软件:
程序空间:
1.5~2位/年地址:0.5~1位/年
计算机系统设计思路由上往下(Top-down)由下往上(Bottom-up)由中间开始(Middle-out)由上往下(Top-down)设计过程:由上向下面向应用的数学模型面向应用的高级语言面向这种应用的操作系统面向操作系统和高级语言的机器语言面向机器语言的微指令系统和硬件实现应用场合:专用计算机的设计(早期计算机的设计)特点:对于所面向的应用领域,性能和性能价格比很高,应用对象变了,难以适应。随着通用计算机价格降低,目前已经很少采用第一步:确定这一级的基本特性第二步:设计或选择面向
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 应对疾病:病人的心理适应与成长
- 护理查房课件:基础理论与操作指南
- 妇产科护理:孕期与产后护理
- 灌区供水工岗前实操知识技能考核试卷含答案
- 纹版连接工岗前核心考核试卷含答案
- 细纱机操作工风险识别竞赛考核试卷含答案
- 照明工岗前安全宣贯考核试卷含答案
- 露天采矿工安全专项强化考核试卷含答案
- 纺织品缝纫工持续改进竞赛考核试卷含答案
- 电缆卷绕车司机岗前安全知识竞赛考核试卷含答案
- 公共卫生执业医师实践技能考试试题及答案
- 特种设备安全管理2026版
- 足球场场地排水施工方案
- DB11∕T 1444-2025 城市轨道交通隧道工程注浆技术规程
- 雨课堂学堂在线学堂云《生物大数据(福建农林大学 )》单元测试考核答案
- 专题11 环境与发展(讲义全国适用)(原卷版)
- 高精度加工设备的误差动态补偿技术研究
- 纵隔神经源性肿瘤影像表现
- 2025乐山国企考试真题及答案
- 全国预防接种技能竞赛实践操作训练题库及答案
- 预制梁架设安全培训课件
评论
0/150
提交评论