




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3计算机系统的软硬取舍 性能评测及定量设计原理 软 硬取舍的基本原则计算机系统的性能评测计算机系统的设计原则计算机系统的设计思路计算机系统的设计步骤 控制流程的三种实现方法 全硬件 软硬件结合 全软件逻辑上等价硬件实现 速度快 成本高 灵活性差 占用内存少软件实现 速度慢 复制费用低 灵活性好 占用内存多 易设计 可改性强 适应性强 设计周期短 理论上 由两种极端实现方法全硬件机器 操作系统 高级语言 应用等硬件只有1位加法和分支操作 其他都用软件关键问题 性能与价格的关系发展趋势硬件实现的比例越来越高硬件所占的成本越来越低 软硬件实现的优缺点 计算机系统的软 硬件功能分配 发展 不可编程 目前计算机 最少硬件 软件 硬件 软硬件比例 计算机系统的软 硬件成本变化 软硬取舍的基本原则 很高的性能价格比设 D为研制设计费用 M为重复生产费用h为硬件 s为软件 则 设C 该功能在软件实现时许重新设计的次数 R 存储介质上出现的次数 V 生产的台数 则硬件的费用 软件的费用 软硬取舍的基本原则 续 则只有 将上述带入 可见 只有在C和R的值较大时 才成立 由于 则 因为 C 100所以V值越大 上式成立 即产量大 软硬取舍的基本原则 续 考虑到准备采用和可能采用的组成技术 使它尽可能不要过多或不合理地限制各种组成 实现技术的采用 不能仅从 硬 的角度去考虑如何便于应用组成技术的成果和发挥器件技术的进展 还应从 软 的角度把为编译和操作系统的实现 以至高级语言程序的设计提供更多更好的硬件支持放在首位 软硬取舍的基本原则 续 考虑用户的应用领域 专用 硬件设计周期长的硬件不宜采用常用的功能尽量采用硬件实现实现功能的成本性能比 或价格性能比 要低尽量采用新技术实现超前设计 举例1 某一计算机用于商业外贸的事务处理 有大量的字符串操作 由于这种事务处理很普遍 有较大的市场 故而设计人员决定在下一代此类计算机的CPU中加入字符串操作的功能 经测试应用软件调查发现 字符串操作的使用占整个程序运行时间的50 而增加此功能如用软件 如微程序 实现 则快5倍 增加CPU成本1 5倍 如果用硬件实现 则快100倍 CPU成本增加到5倍 问设计人员提出增加此功能是否恰当 是否用软件还是硬件 设CPU成本占整机成本的1 3 硬件实现 软件实现 举例2 如果上例中 字符串操作功能的使用时间占整个程序运行时间的90 则情况如何 硬件实现 软件实现 计算机性能评测 计算机性能 ComputerPerformance 是指计算机的工作速度 是程序执行时间的倒数不仅与计算机系统结构有关 而且与算法和程序有关计算机性能评价与测试是一个正在研究和发展的研究方向 它与计算机计算机系统结构 计算机算法和计算机程序构成新兴的计算科学 ComputationalSCiences 的四大支柱 性能评测的作用 改进系统结构设计 提高机器性能促进软硬件结合 合理划分功能优化 结构 算法 应用 实现最佳组合了解各类计算机适宜的应用领域 提高使用效率 性能评测的分级 机器级性能评测CPU 存储器的基本性能指标 并行计算机的计算与通信开销 机器的成本 性能价格比等算法级性能评测并行算法的可扩放性 Scalability 程序级性能评测基准测试程序 计算机系统的性能评价 时钟频率指令执行速度平均速度核心程序法峰值速度 时钟频率 运算速度是表示处理机性能的主要指标 有多种表示处理机运算速度的方法 哪一种表示方法更加合理 时钟频率 处理机主频 只能用于同一类型 同一配置的处理机 相对比较Pentium43 2GHZ比Pentium41 6GHZ快一倍 Pentium42 4GHZ比Pentium41 6GHZ快50 实际运算速度还与Cache 内存 IO 被执行程序等均有关 指令的执行速度 一种经典的表示运算速度的方法MIPS MillionInstructionsPerSecond GIPS TIPS其中 Fz为处理机的工作主频CPI CyclesPerInstruction 为每条指令所需的平均时钟周期数IPC InstructionPerCycle 为每个时钟周期平均执行的指令条数 例1 计算PentiumIV3GHz处理机的速度 解 由于PentiumIV3GHz处理机的IPC 4 或CPI 0 25 Fz 3000MHzMIPSPentiumIV3G Fz IPC 3000 4 12000MIPS 12GIPS峰值速度秒120亿次 秒 实际速度约50亿次 秒主要优点 直观 方便 目前经常使用主要缺点 1 不同指令的执行速度差别很大 2 指令使用频度差别很大 3 有相当多的非功能性指令 计算机系统的评测 性能指标体现在时间和空间峰值性能 在理想情况下计算机系统可获得的最高理论性能值 它不能反映出系统的实际性能实际性能 持续性能 只是峰值性能的5 30 平均速度 算术性能平均值 调和性能平均值 几何性能平均值 加权算术平均值 加权调和平均值 加权几何平均值 加权方法静态指令使用频度 在程序中直接统计动态指令使用频度 在程序执行过程中统计吉普森 Gibson 法 加减法 50 乘法 15 除法 5 程序控制 15 其他 15 CPU性能公式 CPU的性能取决于三个要素 时钟频率f 或时钟周期t 每条指令所花的时钟周期数CPI 指令条数IC一个程序所花的CPU时间 T 可以用两种方式来表示 CPU时间 T CPU时钟周期数 CPI IC 时钟周期长 t 每条指令的平均时钟周期数 计算CPU的程序时间 IC InstructionCounter 程序执行的总指令条数CPI CyclesPerInstruction 平均每条指令的时钟周期Fc 主时钟频率 假设系统共有n种指令 第i种指令在程序中出现的次数为Ii 这样 MIPS MillionInstructionPerSecond MFLOPS MillionFloatingPointPerSecond 核心程序法 定点测试程序 Dhrystone用C语言编写 100条语句 包括 各种赋值语句 数据类型和数据区 控制语句 过程调用和参数传送 整数运算和逻辑操作等 VAX 11 780的测试结果为每秒1757 即1VAXMIPS 1757Dhrystones Second浮点测试程序 Linpack用FORTRAN编写 主要是浮点加法和浮点乘法 用MFLOPS MillionFloatingPointOperationsPerSecond 表示 GFLOPS TFLOPS1 2 4 SPECStandardPerformanceEvaluationCooperative 由30个左右世界知名计算机大厂商所支持的非盈利性国际合作组织 包括 IBM AT T BULL Compaq CDC DG DEC Fujitsu HP Intel MIPS Motolola SGI SUN Unisys等 1989年10月宣布SPEC1 0 程序量超过15万行 包含4个定点程序和6个浮点程序 测试结果用SPECint 89和SPECfp 89表示 1992年增加到有6个定点程序和14个浮点程序 测试结果用SPECint 92和SPECfp 92表示1995年推出SPECint 95和SPECfp 95SPEC2000 12个定点程序 14个浮点程序目前 CPU Graphics Workstation MPI OMP JavaClient Server MailServer NetworkFileSystem Power SIP SOA Virtualization WebServers 评测方法 采用实际的应用程序测试如 C语言的编译程序Spice SimulationProgramwithIntegratedCircuitEmphasis 是一种用于电路描述与仿真的语言与仿真器软件 用于检测电路的连接和功能的完整性 以及用于预测电路的行为 主要用于模拟电路和混合信号电路的仿真 采用核心程序测试从实际程序中抽出关键部分组合而成合成测试程序人为写的核心程序 规模小 结果预知综合基准测试程序 峰值速度 峰值指令速度 MIPS GIPS TIPS 浮点峰值速度 MFLOPS GFLOPS TFLOPS例5 一个由256台计算机组成的Cluster系统 每台计算机由4个PentiumIV3GHz的CPU组成 计算这个Cluster系统的浮点峰值速度 解 PentiumIV3GHz 有4条浮点流水线 浮点峰值速度为 3 4 12GFLOPSCluster的浮点峰值速度 3 4 256 12 288GFLOPS即每秒12万亿次 计算机系统的定量设计原理 哈夫曼压缩原理Amdahl定律程序访问的局部性规律 哈夫曼压缩原理 尽可能加速高概率事件远比加速处理概率很低的事件对性能提高要显著 只加速使用频率高的部件 Makethecommoncasefast例如 CPU中的加法 溢出情况 这是计算机设计中最重要也最广泛采用的设计准则 使经常性事件的处理速度加快能明显提高整个系统的性能 Amdahl定律 系统对某一部件采用某种更快执行方式所能获得的系统性能改进程序 取决于这种执行方式被使用的频率 或所占总执行时间的比例 Amdahl定律 续 定义了加速比的大小 Amdahl加速比 续 Amdahl例1 1 假设将某系统的某一部件的处理速度加快到10倍 但该部件的原处理时间仅为整个运行时间的40 则采用加快措施后能使整个系统的性能提高多少 解 由题意可知 fe 0 4 re 10 根据Amdahl定律 Amdahl例1 2 采用哪种实现技术来求浮点数平方根FPSQR的操作对系统的性能影响较大 假设FPSQR操作占整个测试程序执行时间的20 一种实现方法是采用FPSQR硬件 使FPSQR操作的速度加快到10倍 另一种实现方法是使所有浮点数据指令的速度加快 使FP指令的速度加快到2倍 还假设FP指令占整个执行时间的50 请比较这两种设计方案 Amdahl例1 2 解 分别计算出这两种设计方案所能得到的加速比 CPU性能公式 CPU的性能取决于三个要素 时钟频率f 或时钟周期t 每条指令所花的时钟周期数CPI 指令条数IC一个程序所花的CPU时间 T 可以用两种方式来表示 CPU时间 T CPU时钟周期数 CPI IC 时钟周期长 t 每条指令的平均时钟周期数 例1 3 如果FP操作的比例为25 FP操作的平均CPI 4 0 其它指令的平均CPI为1 33 FPSQR操作的比例为2 FPSQR的CPI为20 假设有两种设计方案 分别把FPSQR操作的CPI和所有FP操作的CPI减为2 试利用CPU性能公式比较这两种设计方案哪一个更好 只改变CPI而时钟频率和指令条数保持不变 例1 3的解答 解 原系统的CPI 25 4 75 1 33 2方案1 使FPSQR操作的CPI为2 系统CPI CPI原 2 20 2 2 2 18 1 64方案2 提高所有FP指令的处理速度 系统CPI CPI原 25 4 2 2 25 2 1 5我们也可以根据以下公式计算出方案2系统的CPICPI 75 1 33 25 2 1 5显然 提高所有FP指令处理速度的方案要比提高FPSQR处理速度的方案要好 方案2的加速比 2 1 5 1 33 程序访问的局部性规律 局部性分时间上的局部性和空间上的局部性时间局部性 程序中近期被访问的信息项很可能马上将被再次访问 空间局部性 指那些在访问地址上相邻近的信息项很可能会被一起访问 存储器体系的构成就是以访问的局部性原理为基础的 计算机系统设计者的主要任务 满足用户对功能上的要求以及相应的价格性能要求满足功能要求的基础上 进行优化设计设计应能适应日后的发展趋势 硬件与软件的发展 硬件 晶体管数 增加25 年 三年一倍DRAM的密度 60 年 二年三倍访存周期 减少33 十年硬盘密度 增加25 年访问时间 减少33 十年软件 程序空间 1 5 2位 年地址 0 5 1位 年 计算机系统设计思路 由上往下 Top down 由下往上 Bottom up 由中间开始 Middle out 由上往下 Top down 设计过程 由上向下面向应用的数学模型面向应用的高级语言面向这种应用的操作系统面向操作系统和高级语言的机器语言面向机器语言的微指令系统和硬件实现应用场合 专用计算机的设计 早期计算机的设计 特点 对于所面向的应用领域 性能和性能价格比很高 应用对象变了 难以适应 随着通用计算机价格降低 目前已经很少采用 由下往上 Bottom up 设计过程 根据当时的器件水平 设计微程序机器级和传统机器级 根据不同的应用领域设计多种操作系统 汇编语言 高级语言编译器等 最后设计面向应用的虚拟机器级 应用场合 在计算机早期设计中 60 70年代 广为采用特点 容易使软件和硬件脱节软件被动 某些性能指标不确切整个计算机系统的效率降低 由下往上设计 由中间开始 Middle out 设计过程 首先定义软硬件的分界面 包括 指令系统 存储系统 输入输出系统 中断系统 硬件对操作系统和编译系统的支持等然后各个层次分别进行设计 软件设计人员设计操作系统 高级语言 汇编语言 应用出现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安全员考试安全生产安全应急预案题库及答案
- 2025年地铁安全员应急处理模拟题及答案
- 2025年建筑施工三类人员C证考试重点题库
- 2025年气象观测员中级面试模拟题及答案解析选
- 课件《关雎》教学课件
- 2025年政府会计准则制度预测题及解析资料
- 2025年土耳其国家电投招聘笔试全真模拟题及答案
- 2025年宠物训导师笔试重点复习题
- 2025年采购员招考笔试重点突破指南
- 2025年农村财务管理实操题及答案集
- 企业信息化项目建设进度和成果汇报课件
- 高等数学期末试卷及答案
- 从0开始跨境电商-第三章-阿里巴巴国际站入门-OK
- 新能源电站远程监控系统建设方案
- 《紫藤萝瀑布》《丁香结》《好一朵木槿花》
- 2023柔性棚洞防护结构技术规程
- 河流地貌的发育 - 侵蚀地貌
- 离网光伏发电系统详解
- 广告文案写作(第二版)全套教学课件
- 《国家电网公司电力安全工作规程(配电部分)》
- 金融学黄达ppt课件9.金融市场
评论
0/150
提交评论