




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、文档编码 : CP3G2M2B5W6 HQ6B4N5C4U5 ZZ2G1U9K10T91,运算机高性能进展受益于: 学习好资料 欢迎下载 1 电路技术的进展; 2 运算机体系结构技术的进展; 其次章 2 ,层次结构:运算机系统可以按语言的功能划分为多级层次结构,每一层以不同 1,依据 cpu 内部储备单元类型对指令集结构进行分类,一般可分为堆栈型指令集 结构,累加器型指令集结构和通用寄存器型指令集结构; 的语言为特点;第六级:应用语言虚拟机 -第五级:高级语言虚拟机 - 第四级: 汇编语言虚拟机 -第三级:操作系统虚拟机 -其次级:机器语言 传统机器级 - 2,通用寄存器型指令集机进一步细分为
2、 3 种类型: 第一级:微程序机器级; 3,运算机体系结构:程序员所看到的运算机的属性,即概括性结构与功能特性; 4 ,透亮性:在运算机技术中,对原先存在的事物或属性,从某一角度来看又似乎 不存在的概念称为透亮性; 5, Amdahl 提出的体系结构是指机器语言级程序员所观看的运算机属性; 寄存器 - 寄存器型( R-R),寄存器 - 储备器型( R-M ),储备器 -寄存器型; 3,寻址方式:( 1)寄存器寻址: 例:ADD R4, R3 含义:RegsR4-RegsR4+RegsR3 ( 2)立刻值寻址:例: ADD R4, 3 含义: RegsR4-RegsR4+3 ( 3)偏移寻址:例
3、: ADD R4, 100R1 含义: RegsR4+Mem100+RegsR1 ( 4)寄存器间接寻址: 例:ADD R4, R1 含义:RegsR4-RegsR4+MemRegsR1 6,经典运算机体系结构概念的实质 3 是运算机系统中软,硬件界面的确定,也就是 ( 5 ) 索 引 寻 址 : 例 : ADD R3, R1+R2 含 义 : 指令集的设计,该界面之上由软件的功能实现,界面之下由硬件和固件的功能来实 现; 7,运算机组织是运算机系统的规律实现;运算机实现是运算机系统的物理实现; 8,运算机体系结构,运算机组织,运算机实现的区分和联系? 答:一种体系结构可以有多种组成,一种组成
4、可以有多种物理实现,体系结构包括 对组织与实现的争辩; 9 ,系列机:是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的 机器; 10,软件兼容:即同一个软件可以不加修改地运行于系统结构相同的各机器,而且 它们所获得的结果一样,差别只在于运行时间的不同; 11,兼容机:不同厂家生产的,具有相同体系结构的运算机; 12,向后兼容是软件兼容的根本特点,也是系列机的根本特点; RegsR3-RegsR3+MemRegsR1+RegsR2 ( 6 ) 直 接 寻 址 或 绝 对 寻 址 : 例 : ADD R1, 1001 含 义 : RegsR1-RegsR1+Mem1001 ( 7 )
5、存 储 器 间 接 寻 址 : 例 : ADD R1,aR3 含 义 : RegsR1-RegsR1+MemMemRegsR3 ( 8)自增寻址:例: ADD R1, R2+ 含义: RegsR1-RegsR1+MemRegs ( 9)自减寻址 ( 10)缩放寻址 4,指令集结构的功能设计: 指令集结构中操作的分类 操作类型 实例 ( 1)算术与规律运算 整数的算术和规律运算:加,减,与,或等 13,当今运算机领域市场可划分为:服务器,桌面系统,嵌入式运算 三大领域; ( 2)数据传输 LOAD/STORE 14,摩尔定律:集成电路密度大约每两年翻一番; ( 3)把握 分支,跳转,过程调用和返
6、回,自陷等 15,定量分析技术基础( 1 )性能的评测: ( a)响应时间:从大事开头到终止之间 ( 4)系统 操作系统调用,虚拟储备器治理; 的时间;运算机完成某一任务所花费的全部时间; ( b)流量:单位时间内所完成的 ( 5)浮点 浮点加,减等操作 工作量;( c)假定两台运算机 x, y; x 比 y 快意思为:对于给定任务, x 的响应时 ( 6)十进制 十进制加,十进制乘,十进制到字符的转换 间比 y 少; x 的性能是 y 的几倍是指: 响应时间 x / 响应时间 y = n ,响应时间与性能 成反比; ( 7)字符串 字符串移动,比较 ( 8)图形 像素操作,压缩操作 16,大
7、致率大事优先原就: (基本思想)对于大致率大事(最常见的大事) ,赐予它 5,复杂指令机( CISC ):是指强化指令功能,实现软件功能向硬件功能转移,基于 这种指令集结构而设计实现的运算机系统; CISC 指令集存在的缺点: 优先的处理权和资源使用权,以获得全局的最优结果; 17, Amdahl 定律:加快某部件执行速度所获得的系统性能加速比,受限于该部件 在系统中所占的重要性; 系统加速比 =总执行时间 (改进前) /总执行时间 (改进后) ( 1) 在这种指令系统中,各种指令的使用频率相差悬殊; = 18, Amdahl 定律推论:假如仅仅对运算机中的一部分做性能改进,就改进越多, 系统
8、获得的成效越小;假如只针对整个任务的一部分进行优化,那么多获得的加速 比不大于 1 /( 1-可改进比例) ; ( 2) CISC 指令集结构的复杂性带来了运算机体系结构的复杂性,这不仅增 加了研制时间和成本,而且仍简洁造成设计错误; ( 3) CISC 指令集结构的复杂性给 VLSI 设计带来了很大负担,不利于单片 集成; 19, cpu 性能: Cpu 时间 =总时钟周期数 /时钟频率 Cpi = 总时钟周期数 / ic ( 4) 在 CISC 指令集结构中,很多复杂指令需要很复杂的操作, 因而运行速 ( cpi :平均每条指令的时钟周期数; ic:执行过程当中的指令条数; ) 度慢; (
9、 5) 在 CISC 指令集结构中,由于各条指令功能的不均衡, 不利于接受先进 Cpu 性能公式: 总 cpu 时间 = cpi ic / 时钟频率 其中: cpi反映了运算机实现技术, 运算机指令集的结构和运算机组织; Ic 反映了运算机指令集的结构和编程技术;时 的运算机体系结构技术(如流水技术)来提高系统的性能; 钟频率:反映了运算机实现技术,生产工艺和运算机组织; 20,并行性:是指在同一时刻或是同一时间间隔内完成两种或两种以上性质相同或 6, 20 世纪 80 岁月进展起来的精简指令集运算机:其目的是尽可能地降低指令集 结 构的复杂性,以达到简化实现,提高性能的目的,也是当今指令集结
10、构功能设计的 不相同工作; 一个主要趋势; 第 1 页,共 3 页其设计时遵循的原就: 学习好资料 欢迎下载 面指令的执行结果,这种相关称为数据相关; ( 1) 选取使用频率最高的指令,并补充一些最有用的指令; 21 ,把握相关:由条件分支指令,转子程序指令,中断等引起的相关; ( 2) 每条指令的功能尽可能简洁,并在一个机器周期内完成; 22 ,三种数据相关:限度后写相关,先写后读相关,写写相关; ( 3) 全部指令长度均相同; ( 4) 只有 LOAD 和 STORE 操作指令才拜望储备器,其它指令操作均在寄 存器之间进行; 第四章 ( 5) 以简洁有效的方式支持高级语言; 1,指令级并行
11、:当指令之间不存在相关时,它们在流水线中时可以重叠起来并行 7,操作数类型:整数(定点) ,浮点,十进制,字符,字符串,向量,堆栈等; 执行的,这种指令序列中存在的潜在并行性称为指令级并行; 8 ,操作数类型的表示有两种方法: ( 1)由操作码的编码指定; ( 2 )数据可以附上 2,在开发循环级并行的各种技术中,最基本的技术有:指令调度技术,循环开放 由硬件说明的标记,由这些标记指定操作数的类型,从而挑选适当运算; 技术和换名技术; 9,操作数类型大小有:字节( 8),半字( 16b),单字( 32b),双字( 64b) 第五章(储备系统) 第三章 1,储备系统定义:两个或两个以上速度,容量
12、和价格各不相同的储备器用硬件, 1 ,流水线技术:是指将一个重复的时序过程,分解为如干个子过程,而每一个子 软件或软件与硬件相结合的方法连接起来成为一个储备系统; 这个储备器系统对应 过程都可有效地在其专用功能段上与其它子过程同时执行; 2,流水线分类: ( 1)按功能的多少来分:单功能流水线,多功能流水线; 用程序员时透亮的,并且,以应用程序员看,它是一个储备器,这个储备器的速度 接近最快的那个储备器,储备容量与容量最大的那个储备器相等,单位容量的价格 ( 2)按同一时间内各段之间的连接方式来分:静态流水线,动态流水线 接近最廉价的那个储备器; 2,储备系统分为两类: ( 1) Cache
13、储备系统:由 Cache 与主储备器构成,目的是提 高储备器速度; ( 2 )虚拟储备系统:由主储备器和硬盘构成,目的是扩大储备器容 量; ( 3)按流水线的级别来分: 部件级流水线 (运算操作流水线) ,处理机级流水线 (指 令流水线) ,处理机间流水线(宏流水线) ( 4)按各个流水段之间是否有反馈回路来分:线性流水线,非线性流水线 ( 5)按数据表示分:标量流水处理机,向量流水处理机 3 ,先行把握器处理机结构:包括三个独立的把握器和四个缓冲栈;其中三个把握 器为:储备把握器,指令把握器,运算把握器;四个缓冲栈:先行指令缓冲栈,线 性读数缓冲栈,现行操作栈,后行写数栈; 3,储备系统的价
14、格: C =( C1S1+C2S2 )/( S1+S2) 4,储备系统的速度:表示方法:拜望周期,存取周期,储备周期,存取时间等; 5,命中率定义:在 M1 储备器中拜望到的概率 u = N1 / N1+N2 N1 是对储备器 M1 的拜望次数, N2 是对 M2 储备器的拜望次数; 4,吞吐率:是指单位时间内流水线所完成的任务数或输出结果的数量; TP = n / Tk 6,拜望效率: 实际吞吐率小于最大吞吐率 Tk = k+n-1 t T1 15,加速比:是指流水线的速度与等功能非流水线的速度之比( s); e = T1/T = = = f ( u, T2/T1 ) 效率:是指流水线的设备
15、利用率( E ); uT1+1-uT2 u+1-u T2/T1 6,如流水线各段的时间相等:吞吐率: TP=n/k+n-1 t TPmax=1/ t 7,接受预取技术提高命中率 .(方法) 如各段执行时间不相等时,完成几个任务: TP=n / ti + n-1max t1, t2 tk 7,加速比和使用效率的关系: E = s/m 或 S = mE 不命中时, 把 M2 储备器中相邻多个单元组成的一个数据块取出来送入 M1 储备器 8 ,效率和吞吐率的关系: E = TP t0 或 TP = E/ t 中 .u = u+-n1 / n 其中 u是接受预取技术之后的命中率; u 是原先的命中率;
16、 11,效率: E = n 个任务占用的时空区 / k 个流水段的总的时空区 = T0 / K Tk n 为数据块大小与数据重复使用次数的乘积; E = n/k+n-1 S = k n /k+n-1 TP = n / k+n-1 t 8,加速内部地址变换方法: ( 1 )目录表:用一个小容量高速储备器存放页表; ( 2) 12,单功能流水栈:是指只能完成一种固定功能的流水栈; 13,多功能流水栈:流水栈的各段通过不同连接实现不同功能; 14,非线性流水线调度:任务时要找出一个最小的循环周期,依据个周期向流水线 输入新任务,流水线的各个功能段都不会发生冲突,而且流水线的吞吐率和效率最 高; 15
17、,非线性流水线:某些流水段之间有反馈回路或前馈回路; 16,启动距离:连续输入连个任务之间的时间间隔; 17,流水线冲突:几个任务争用同一个流水段; 快慢表:快表,慢表构成一个两级储备系统; ( 3)散列函数:把相联拜望变成接地 址拜望; 9,页面替换算法: ( 1)随机算法( RAND);( 2)先进先出算法( FIFO );3近期 最少使用算法( LFV );( 4)最久没有使用算法 ( LRV);( 5)最优替换算法 ( OPT ); 10, “颠簸 ”现象:一个页面刚被调出主储备器,又要被调入; 11,堆栈型替换算法:对任意一个程序的页地址流作两次主存页面数支配,分别分 配 m 个主存
18、页面和 n 个主存页面,并且 mn;假如在任何时刻 t,主存页面数集合 Bt 都中意关系: Btm Btn就这类算法成为堆栈型替换算法; 12 , Cache 地址映像方法: ( 1)全相联映像; (2 )直接映像; 3 组相联映像; 18,禁止向量:预约表中每一行任意两个 “ x”之间距离的集合; 19,冲突向量: C = Cm Cm- 1 C2其C1中 m 时禁止向量中的最大值 20,数据相关:在执行本条指令的过程中,假如用到的指令,操作数,变量等是前 ( 4)位挑选组相联映像; ( 5)段相联映像; 13 , Cache 储备替换算法: ( 1)轮换法( 2) LRV 算法( 3 )比较
19、对法( 4)堆栈法; 第 2 页,共 3 页14,单处理机的 Cache 一样性: 学习好资料 欢迎下载 ( 2)通道处理机执行 CPU 为它组织 过治理程序组织一个通道程序,并启动通道; 包括写直达法: 写通过法, CPU 的数据写入 Cache 时,同时页写入主存 的通道程序, 完成指定的数据 I/O 工作; 通道处理机执行通道程序是与 CPU 执行用 仍有写回法: 抵触修改法, CPU 的数据只写入 Cache,不写入主存,仅当替换时才 户程序并行的; ( 3 )通道程序终止后向 CPU 发中断恳求, CPU 响应某个中断恳求 把修改过的 Cache 块写回主存 后,其次次进入操作系统,
20、调用治理程序对 I/O 中断恳求进行处理; 二者优缺点比较: ( 1) 牢靠性:写直达法优于写回法; 第七章(多处理机) ( 2) 与主存的通讯量,写回法少于写直达法; 1, Cache 一样性协议: ( 1)目录协议和兼听协议; ( 2)横向分为:写作废协议和写 ( 3) 把握的复杂性,写直达法比写回法简洁; 更新协议; ( 3)纵向分为:单处理协议和单数据流协议; ( 4) 硬件实现的代价,写回法比写直达法好; 2,并行运算机体系结构的分类:单指令流单数据流( SISD ),单指令流多数据流 15,多处理机的一样性: (1 )目录协议 ( 2)兼听协议 ( SIMD ),多指令流单数据流(
21、 MISD )和多指令流多数据流( MIMD );第六章(输入 /输出系统) 1,衡量 I/O 系统的性能指标主要有响应时间和牢靠性; 3,目录协议分为三类:全映射目录,有限目录,链式目录; 4,链式目录:通过爱惜一个目录指针链来跟踪共享数据拷贝; 2,磁盘的数据传输率分为外部传输率和内部传输率; 思想: 当 p1 读 x 时, 储备器送 x 到 cachel,同时写 cachel 的一个链终止指针 ct 在存 3,外部传输率(突发数据传输率) :运算机通过磁盘接口从硬盘的缓存中将数据读 储器也储存一个指向 cachel 的指针,到 p2 读 x 时,储备器就储存一个指cachel2 出,发给
22、相应的把握器的速度; 向 的指针,到某一处理机需要写 x 时,他必需沿整个目录连发送一个数据无敌信息, 4,内部传输率(连续传输率) :硬盘将数据从盘片上读取出,交给硬盘上的缓冲存 在收到全部处理机的回答信号后,储备器才给该处理机写答应权 储器的速度; 5,反映储备外设牢靠性能的参数有牢靠性,可用性和可信性; 6,牢靠性衡量标准用:平均无故障时间; 7,可用性衡量标准用:平均失效间隔时间; 8,总线:总线时各子系统之间共享的通信链路,具有低成本和多样性这两个优点; 9 ,总线的主要缺点:它必需独占使用,造成了设备信息交换的瓶颈,从而限制了 系统中总的 I/O 吞吐量; 到 cachel 中的数
23、据块需要替换时, 要把该 cache 从目录链中删除, 有如下解决方法; ( 1) 把 cachei+1 的指针指向 cachei+1 ,在 cachel 中存放新数据块 2 使 cachel 及在链中位子其后的全部 cachel 中的单元 x 无效( 3)使用双向链,在 替换时不再需要遍历整个链,但指针增加了一倍, ,一样性协议更加完 美 优点 :b 不限制共享数据块的拷贝数目又保持了可扩展性, 指针的长度已处理机数目 的对属关系增长, cache 的每个数据块的指针数目与处理机的数目无关 10,分别事务总线:在有多个设备时,可用通过打包技术来提高总线带宽,这样每 次 I/O 操作就不必在整个传输过程中都占有总线,其基本思想时将总线事务分成请 求和应答两部分, 这样总线就可以在某个总线事务的恳求和应答间的闲暇时间间隔 内被其它总线事务使用; (又称流水总线,悬挂总线,包交换总线) 缺点 :链式目录的复杂成都超过了前两种目录 5 定义:互联网络;是将对称式系统或分布式系统中的节点可能似乎处理器,储备 模块或者其它设备,它们通过互联网络进行信息交换,在拓扑上,互联网络为输入 和输出两组节点之间供应一组互联或映像 11,把握外部设备的输入 /输出方式分为:直接传送,程序查询,中断, DMA ,通 6( 1)节点数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电商平台客服外包与电商运营策略合作合同
- 集成化管理建筑塑料管材采购与施工安装合同
- 2025年小学教师教案检查总结模版
- 2023年人教版四年级语文上册期中检测卷及答案1
- 2023年全国“安全生产月”《安全知识》答题活动考试题库(含答案)
- 潍坊护理职业学院《信息技术基础与应用》2023-2024学年第二学期期末试卷
- 上海海事大学《微积分上》2023-2024学年第二学期期末试卷
- 创建节水型企业的工作总结模版
- 山东省枣庄市台儿庄区2024-2025学年初三第二学期期末练习生物试题试卷含解析
- 四川电子机械职业技术学院《科技论文写作》2023-2024学年第二学期期末试卷
- 铲车装载机知识培训课件
- 2025年辽宁省葫芦岛市绥中县中考一模语文试题含答案
- 家政经理培训课件
- 2024-2025学年高一下学期期中考试化学试卷
- 四川省南充市高级中学2024-2025学年高二下学期期中考试 化学(含答案)
- 国际教育规划合同8篇
- 整装定制合同协议
- 产品研发项目管理制度
- 2025年全国中学生汉字听写大会比赛题库及解析(共八套)
- 关于临期商品的处理管理办法
- 新能源全面入市是构建新型电力系统的重要支撑-136号文政策解读
评论
0/150
提交评论