版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,高等计算机系统结构 主讲 任国林,2,一、课程目标 1.并行性理论的研究 并行计算机系统结构与系统模型; 通信系统模型及编程模型; 并行计算机性能评价方法; 可扩展性原理及方法。,2.并行技术和可扩展系统结构的研究 微处理器并行技术; 分布式存储器和时延容忍技术; 互连网络技术; 可扩展多处理器。,3,二、参考教材 1、并行计算机系统结构,David E.Culler等著,李晓明等译,机械工业出版社,2003.1 2、可扩展并行计算技术、结构与编程,黄铠、徐志伟著,陆鑫达等译,机械工业出版社,2000.5 3、计算机系统结构(第二版),郑纬民、汤志忠著,清华大学出版社,1998.9 4、高
2、等计算机系统结构,黄铠著,王鼎兴等译,清华大学出版社,2001.11 5、计算机系统结构一种定量的方法(第二版),John L. Hennessy等著,郑纬民等译,清华大学出版社,2002.8,4,第一章 并行计算机系统结构概述,5,第一节 计算机系统结构概念,一、计算机系统结构概念,1、计算机系统层次结构,6,2、计算机系统设计方法,(1)由上向下 从软件到硬件,适合专用机的设计。,(2)由下向上 从硬件到软件,适合通用机的设计。 两种方法结果:形成软、硬脱节。,(3)从中间开始 从软、硬件交界面开始设计。 要求不断进行优化设计交互、评价的工具和方法。,7,3、系统结构定义,精确定义:机器语
3、言程序员、编译程序编写者所看到的计算机的结构和功能特性。,系统结构含义:实际上是研究计算机系统中软、硬件之间的界面定义及其上下的功能分配。,基本定义:程序员所看到的计算机的属性。,系统结构、计算机组成、物理实现三者关系: 1 : n 1 : n 系统结构 - 计算机组成 - 物理实现,8,3、系统结构包含内容,数据表示、寻址方式、指令系统、 寄存器组织、 存储系统、 中断机构、I/O结构、 机器工作状态定义和切换、信息保护;,计算机组成包含内容(不属于系统结构内容): 数据通路宽度、专用部件设计、各种OS共享程度、功能部件并行度、控制机构组成方式、排队与缓冲技术、预估与预判技术、可靠性技术等。
4、,9,4、计算机系统结构设计,系统结构设计步骤: a.需求分析-主要在应用环境、所用语言的种类及特性、对OS的特殊要求、所用外设特性、技术经济指标、市场分析等方面; b.需求说明-主要包括设计准则、功能说明、器件性能说明等; c.概念性设计-进行软、硬件功能分析,确定机器级界面; d.具体设计-机器级界面各方面的确切定义,可考虑几种方案; e.优化-反复进行优化设计及性能评价。,10,5、并行体系结构 并行计算机是一组相互通信、相互协作以快速求解大型问题的处理单元。,并行体系结构:由宏体系结构、微体系结构两部分组成。 微体系结构:围绕处理器及它的壳; 宏体系结构:并行计算机系统的整体结构。,并
5、行体系结构研究重点: 并行性:算法、通信、互连 存储系统:速度、数据一致性 可扩展性:性能评价、加速比,11,二、计算机系统结构分类,1、Flynn分类法 思路:按指令流和数据流的多倍性进行分类。,类型:SISD,SIMD,MISD,MIMD四种。 从MIMD到SISD性能逐步下降。 缺点:对流水线处理机的分类不明确。,12,2、Handler分类法 思路:在系统中三个层次上按并行程度及流水线处理程度分类。 层次:PCU(处理控制器器或宏流水) K级 ALU(算逻部件或指令流水) D级 BLC(位级电路或操作流水) W级,分类: T(C) =K K,D D,W W K为PCU数、K为可组成流水
6、的PCU数, D为每个PCU中ALU数、D为可组成流水的ALU数, W为ALU或PE字长,W为所有ALU或单PE流水线段数。 各层次的数值越大越好。,13,3、冯氏分类法 思路:按照系统的最大并行程度进行分类。 最大并行度:单位时间内能处理的最大二进制位数。 即: Pm=位片宽字宽,最大并行度的数值越大越好。,14,4、按控制方式分类 类型:(4种) 控制流方式:顺序执行(冯诺依曼型) 数据流方式:操作数到位即可运算,无序执行 规约方式: 驱动方式与数据流相反,无序执行 匹配方式: 非数值型应用,主要对象为符号。,对不同类型结构,并行程度越大越好。,15,三、影响计算机系统结构发展因素,1、软
7、件对系统结构发展的影响,(1)系列机 思想:具有相同系统结构或对原系统结构进行扩充,不同组成或实现技术,来实现软件可移植性。 影响一:使得新的组成与实现技术很快得到应用,大量的兼容产品出现,推动了系统结构的发展。,软件兼容种类: 向上/向下兼容、 向前/向后兼容。,系列机要求: 保证向后兼容, 力争向上兼容。,16,影响二:为保持软件兼容性,系列机要求系统结构基本不变,又限制了系统结构的发展。,(2)模拟与仿真,模拟:用机器语言解释实现软件移植。同时模拟机器语言、存储系统、I/O系统、控制台操作及形成虚拟操作系统。,仿真:用微程序直接解释另一种指令系统。同时还需解释操作系统、I/O系统的操作。
8、,异同:解释程序存放位置、是否有硬件参与方面异。 除指令系统外,要解释操作系统、存储系统、I/O系统等方面同。,17,(3)统一高级语言方法 存在一定的困难,争取汇编语言或机器语言的统一。 导致开放系统(具有可移植性、交互操作性)的出现,用硬件抽象层技术适应不同的硬件平台。,2、应用对系统结构发展的影响 应用要求:高速度、大容量、大吞吐率,大、巨型机趋势:研究新系统结构、组成技术,并推广,向通用结构发展; 中、小、微型机趋势:保持价格基本不变,提高性能;保持性能基本不变,降低价格。,18,3、技术对系统结构发展的影响 器件的性能、使用方法改变、影响系统结构及组成方法。 器件发展过程:通用片现场
9、片半用户片用户片。,影响:器件的发展推动系统结构与组成技术的发展,同样系统结构的发展要求器件不断发展。 原因: 新结构的使用,取决于器件发展能否提供可能; 器件性能/价格提高,使新结构、组成下移速度更快; 器件的发展,推动算法、语言的发展; 器件的发展,改变了逻辑设计方法。,19,第二节 系统设计的定量原理,一、大概率事件优先原则,基本思想:对大概率事件赋予它优先的处理权和资源使用权,以获得全局的最优结果。 该原则是系统设计中最重要和最常用的原则。,二、Amdahl定律,基本思想:系统中对某部件采用某种更快执行方式,所获得的系统性能的改变程度,取决于这种方式被使用的频率,或所占总执行时间的比例
10、。,应用:使用该定律可改善“系统瓶颈”性能。,20,例:某功能处理时间为系统原来时间的40%,将其处理速度加快10倍后,整个系统性能提高多少?,已知:fe=0.4,re=10,利用Amdahl定律,则 Sp=1.56,re=10时Sp和fe的关系如下图:,结论:改善某部件性能后,系统性能急剧提高,则该部件为“系统瓶颈”。,21,三、程序访问的局部性原理,基本思想:程序执行中呈现出频繁重复使用那些最近已使用过的数据和指令的规律,规律指时间局部性和空间局部性。,时间局部性: 近期被访问的信息,可能马上被访问; 空间局部性: 与被访问地址相邻的地址上的信息可能会一起被访问。,应用:层次存储体系设计。
11、,四、软硬件取舍原则,1.在现有软硬件条件下,所选方法使系统有高的性能/价格; 2.所选方法尽量不限制计算机组成和实现技术; 3.进行选择时,把如何为编译和操作系统的实现提供好的支持放在首位。,22,第三节 计算机系统性能评价,一、计算机系统性能指标,计算机性能:正确性、可靠性和工作能力。 评价性能:仅指工作能力。 性能分为峰值性能和持续性能,着重评价持续性能。,工作能力指标: 处理能力单位时间内能处理的信息量(吞吐率); 响应能力响应时间、周转时间、排队时间; 利用率T时间内,某部分被使用时间t与T的比值。,23,二、系统处理能力,1、MIPS指标 指令除包含运算指令外,还包含取数、存数、转
12、移等指令在内。 MIPS反映处理能力不够精确(问题-指令功能等)。 MIPS只适宜于评估标量机。,评价方法:相对MIPS-指相对参照机而言的MIPS:,通常用VAX-11/780机处理能力为1MIPS。,24,2、MFLOPS指标 能够精确反映处理能力(问题-浮点运算)。 MIPS比较适宜于评估向量处理机。,不同操作难度处理: 通过正则化方法关联不同的操作。,MIPS与MFLOPS关系: 1MFLOPS3MIPS。,25,3、吞吐率指标 定义:单位时间内能处理的作业数。 应用:用于表示并行计算机的并行处理能力的速度。 对单处理器系统,吞吐率=1/执行时间。,提高吞吐率指标方法: 流水化:使多个
13、作业流水处理; 并行处理:进行作业分配,给每个PE分配一个作业。,26,三、系统响应能力 响应能力:主要指系统响应时间(输入输出时间)。,对单机系统而言,通过响应时间表示。 响应时间:一般只考虑CPU时间(用户CPU时间+系统CPU时间),进一步只衡量用户CPU时间。 T=Tuseful+Tdatalocal,对多处理机而言,通过执行时间表示。 执行时间:需要考虑CPU时间(用户CPU时间)和通信时间。 T=Tuseful(n)+Tdatalocal+Th = Tuseful/n+Tdatalocal+(Tsynch+Tdataremote+Toverhead),27,1、用户CPU时间 TC
14、PU=INCPITC= IN(p+m k)TC,影响用户CPU时间的因素:,28,2、平均CPI,n:指令种类数, CPIi:第i种指令的CPI, Ii:第i种指令使用的数量,如何提高系统性能?,减小平均CPI, 减小频繁使用(Ii/IN较大) 指令的CPIi, 大概率事件优先原则的应用,29,例: A机执行的程序中有20%转移指令(2TC),转移指令都需要一条比较指令(1TC)配合,其他指令1TC。B机中转移指令包含比较指令,但TC比A机慢15%。A机、B机哪个工作速度快?,A机:TCPUA=INA(0.2 2+0.2 1+0.6 1)TCA =1.2 INA TCA,B机:TCPUB=0.
15、8INA(0.2/0.8) 2+(1- 0.2/0.8) 1) 1.15TCA =1.15 INA TCA,结果:B机比A机工作速度快。,注意:不能仅按主频衡量系统性能。,30,四、利用率 不直接表示系统性能指标,与前两种指标有密切关系。 对系统性能或结构改进与优化起着至关重要的作用。,例:流水线的采用; Cache的作用; I/O通道的设计。 (定量设计相关原理),31,五、可扩展性 通过性能可伸缩性评价并行处理能力。,h:通信时间,P:问题规模,n处理器数量。,衡量方法: 测量不同n时的加速比,构成性能可伸缩性曲线。,性能可伸缩性: 系统性能加速比随处理器数n增加而线性增长, 即 S=kn
16、。,影响因素: 结构、处理器数量、问题规模、存储系统等。,32,六、性能评价与比较,1、评价技术,(1)分析技术 思路:在一定假设条件下,计算机系统参数与性能指标参数之间存在着某种函数关系,按其工作负载的驱动条件列出方程,用数学方法求解。,发展:从脱离实际的假设发展到近似求解。,近似求解算法:聚合法、均值分析法、扩散法等。,33,(2)模拟技术 思路:建立模拟器,模拟系统性能模型和工作负载模型,对运行后的数据进行统计分析。,方法: 按被评价系统的运行特性建立系统模型; 按系统可能有的工作负载特性建立工作负载模型; 用语言编写模拟程序,模仿被评价系统的运行; 设计模拟实验,依照评价目标,选择与目
17、标有关因素,得出实验值,再进行统计、分析。,34,(3)测量技术 思路:通常采用基准测试程序评估。,基准测试程序:分为宏基准测试程序和微基准测试程序。 宏基准测试程序:测量系统总体性能, 如实际应用程序等; 微基准测试程序:测量系统某一方面的分离性能, 如核心程序、合成测试程序等。 单处理机系统和并行计算机系统的基准测试程序不同。,性能测试方法:,选择多组基准测试程序进行测试; 对同一基准测试程序进行多次测试结果后求平均。,35,2、测试结果的统计与比较,目的:对多个系统的相同的多种基准测试程序的测试结果,比较不同系统的优劣。,方法:算术平均、几何平均、调和平均。,(1)算术平均方法,特性:选择不同的参考机,Am结论不同。,36,(2)几何平均方法,特性:Gm性能与参考计算机性能无关。 依据-Gm(Xi)/Gm(Yi)=Gm(Xi/Yi),37,(3)调和平均方法,特性:Hm最接近CPU的实际性能。 依据-Hm与所有测试程序时间总和成反比关系,38,第四节 系统结构中并行性的发展,一、并行性概念 并行性包括同时性(时刻)和并发性(时段)两个方面。,实现方法: 时间重叠、资源重复、资源共享。,39,二、系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026学年辽宁省鞍山市四年级数学期末模考专项特训题详细参考解析详细答案和解析
- 2025年城市交通诱导系统与智能停车系统融合可行性研究报告
- 门禁系统集成第三方应用接入标准
- 2026年化妆品行业生物材料创新报告
- 2026年学校春季食品安全知识培训会
- 2026年运营公司招聘笔试模拟题
- 2026年高速公路设计面试仿真题集
- 2026年国外知识产权保护法
- 2026年仓储管理师初级模拟考试
- 2026年事业单位考试仿真题及答案
- 2024年广西建设职业技术学院聘用人员招聘考试真题
- 2024年浙江省杭州拱墅小升初分班考科学试卷(含答案)
- 《思想道德与法治》课件-第一节 人生观是对人生的总的看法
- DBJ04-T282-2025 《行道树栽植技术规程》
- 2025年湖南省高二学业水平合格考试政治试卷试题(含答案详解)
- 鲁班工坊管理制度
- 心理调适提升学习状态主题班会
- 2024年7月1日实施新版医疗器械采购、收货、验收、贮存、销售、出库、运输和售后服务工作程序
- DLT 572-2021 电力变压器运行规程
- 概率论与数理统计(天津理工大学)智慧树知到期末考试答案2024年
- 电梯安装工操作培训教材
评论
0/150
提交评论