




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章计算机架构的基本概念1 .计算机系统结构的经典定义程序员所看到的计算机属性,即概念结构和功能特性。2 .透明性在计算机技术中,把这种本来存在的东西和属性,从某种角度来看就不存在的概念称为透明性。3 .系列机同一制造商生产的具有相同系统结构但具有不同结构和实现的一系列不同型号的计算机。4 .常见的计算机系统结构分类法有弗林分类法、手机分类法两种弗林分类法把计算机系统的结构分为四种单命令流单流(SISD )单指令流多流(SIMD )多命令流数据流(MISD )多个命令流多个流(MIMD )5.改进的程序的总执行时间系统的加速比是改善前和改善后的总执行时间之比6 .在CPI (周期性指令) :指令下执行的平均时钟周期数CPI=执行程序所需的时钟周期数/IC7 .存储过程原理的基点:命令驱动8 .冯诺伊曼结构的主要特征1 .以运算器为中心。2 .在内存中,命令被视为与数据同等。指令可以和数据同样地运算,也就是说,可以修改由指令构成的程序。3 .存储器是按地址访问、按顺序线性编辑地址的一维结构,各单元的位数是固定的。4 .命令的执行是顺序的5 .指令由操作码和地址代码组成。6 .指令和数据都由二进制代码表示,采用二进制运算。9 .软件的可移植性软件可以从一台计算机迁移到另一台计算机,并在没有更改或很小的更改下正常工作。 不同只是实行时间的不同。 我们说这两台计算机是软件兼容的.实现可移植性的常用方法:采用系列机、模拟和模拟、统一高级语言。软件兼容性:上(下)兼容性:用某一阶段的机器制作的程序,不修改就能在比它高(低)阶段的机器上运行。前(后)互换性:在某个时期投入市场的某种形式的机器制作的程序,可以在之前(后)投入市场的机器上执行。向后兼容性是系列机的基本特征。兼容机:不同公司制造商生产的具有相同系统结构的计算机。10 .并行性:计算机系统在同一时刻或同一时间间隔进行多个运算或操作。同时性:两个以上的事件同时发生。同时性:多个事件在同一时间间隔发生。从数据处理的观点来看,并行性的级别大致分为低级别和高级别1 .字符串位串:一次只处理一个单词的一位。最基本的串行处理方式,没有并行性。2 .字符串位并行:同时处理一个字的所有位,不同字之间是串联的。并行性开始出现。3 .字并行位串:同时处理多个字的同一位(称为位片)。具有很高的并行性。4 .全并行:同时处理多个字的所有比特或部分比特。最高水平的并行性。从执行程序的角度来看,并行性的级别可以分为低级别和高级别1 .命令内部并行:单一命令中各微操作间的并行。2 .指令级并行:并行执行两个或多个指令。3 .线程级并行:并行执行多个线程。通常,在一个进程中派生的多个线程作为调度单位。4 .任务层或流程层并行:并行执行两个或多个流程或任务(段)以子例程或进程为调度单位.5 .作业或程序级并行:并行运行两个或多个作业或程序。提高并行性的技术方法:1 .时间重合引入时间因素以在时间上错开多个处理过程,交替使用同一硬件装置的各部分以加快硬件旋转并获得速度。2 .资源重复引入空间因素以数取胜。 通过反复设定硬件资源,大幅度提高计算机系统的性能。3 .资源共享这是一种软件方法,允许多个任务按一定顺序使用同一硬件设备。第二章计算机指令集结构1. CPU用于存储操作数的存储器单元的主要类型是堆栈、累加器、通用寄存器组2 .通用寄存器型指令集结构进一步细分为3种寄存器-寄存器型(RR型)寄存器-内存型(RM型)内存-内存类型(毫米型)3 .指令集结构的设计主要考虑速度、成本和灵活性三个因素指令集的基本要求:完整性、规则性、效率、兼容性RISC机器设计遵循的原则1 .指令根数少,很简单。 只选择常用的命令,然后添加最有用的命令。2 .采用简单统一的命令形式,减少地址方式的指令语长都是32位或64位。3 .指令的执行在一个机器周期内完成。 (采用管线机构)只有load和store指令可以访问内存,其他指令的操作在寄存器之间进行。(采用加载-存储结构)5 .大部分指令都是通过硬链接逻辑实现的。6 .强调编译器的作用,生成最适合高级语言程序的代码。7、活用流水技术提高性能。5 .指令由两部分组成:操作码、地址码命令集的三种编码形式:可变长度编码形式、定长编码形式、混合编码形式第三章输油管技术1 .流水线技术:将反复的过程分解为几个子过程,每个子过程都用专用的功能部件来实现。 通过使多个处理过程在时间上交错并顺序地通过每个功能段,可以与每个子过程中的其它子过程并行地进行。管线中的每个子进程及其功能部件称为管线的类或段,段和段相互连接以形成管线。 管线的段数称为管线的深度。通过时间:从第一个任务进入管线到结果流出所需要的时间。排出时间:从最后一个任务进入管线到结果流出所需要的时间。2 .分类1 .单功能线和多功能线单功能管线:只能完成固定功能的管线。多功能管线:管线的各段可以进行不同的连接以实现不同的功能。2 .静态管线和动态管线静态管线:多功能管线的每个段只能在同一时间内以相同功能的连接方式工作。动态管线:多功能管线的每个段可以同时以不同的方式连接,并同时执行多个功能。3 .零件级、处理器级及处理器间管线部件级管线(运算操作管线):通过将处理器的算术逻辑运算部件分段,可以用流水方式进行各种类型的运算操作。处理器级的管线(指令管线):将指令的解释执行过程如流水一样处理。 将一个指令的执行过程分解为多个子进程,每个子进程是用独立的功能部件执行的。处理器间管线(宏管线) :两个或多个处理器串联连接以处理同一流,从而使每个处理器完成整个任务的一部分。4 .线性管线和非线性管线线性管线:管线的各级串联连接,没有反馈回路。 数据通过管线的各段时,每段最多只能流一次。非线性管线:管线除了串行连接外,还具有反馈回路。5 .顺序线和不顺序线序列流水线:流水线输出侧任务流出的顺序与输入侧任务流入的顺序完全相同。 各任务在管线的各段按顺序流动。不同流水线:流水线输出侧任务流出的顺序可能与输入侧任务流入的顺序不同,在允许后进入流水线的任务先完成(从输出侧流出)。6 .标量处理机和矢量流水处理机标量处理器:处理器没有矢量数据表示和矢量指令,只对标量数据进行流水处理。向量流水处理机:具有向量数据的表现和向量命令的处理机。3 .吞吐量百分比:在单位时间内完成管线的任务数或输出结果数。解决管线瓶颈问题的通用方法:将瓶颈段细化并重复地设置瓶颈段。加速比:完成相同任务,不使用管线的时间与使用管线的时间之比。效率:管线中设备的实际使用时间和运行时间的比率,即管线设备的利用率。当管线的每一时间相等时,管线的效率与吞吐量率成比例。Tk=(k n-1) tE=TPt t=T通过/m (m表示级数)管线的效率是管线的实际加速比s与其最大加速比k的比。从时空图来看,效率是n个任务占有的时空面积与k个分段的总时空面积之比。4 .一个命令的执行过程分为以下五个周期1 .取得指令周期(IF )PSPS。PC的值加4。 (假设每个指令占用4个字节)2 .指令解码/读寄存器周期(ID )解密。通过IR的寄存器编号访问通用寄存器群,读取必要的操作数。3 .执行/有效地址计算周期(EX )根据指令而不同的动作:内存访问指令: ALU将指定的寄存器的内容和偏移相加,形成访问的有效地址。寄存器-寄存器ALU指令: ALU按照操作码指定的操作,对从通用寄存器组读取的数据进行运算。寄存器-即时数ALU指令: ALU通过操作码指定的操作数计算从通用寄存器群读取的第一操作数和即时数。分支命令: ALU将偏移量加到PC值上,形成传输目的地地址。 同时,判断在前一周期读取的操作数,判断分支是否成功。4内存访问/分支完成周期(MEM )此周期中处理的命令只有load、store和分支命令。 其他类型的指令在这个循环中什么都不做。load命令和store命令load命令:用上一个周期计算的有效地址从内存中读取相应的数据。store命令:将指定的数据写入该有效地址表示的存储单元。分支命令分支“成功”后,将转发地址发送到PC。分支指令的执行完成。5 .写回周期(WB )ALU运算指令和load指令以该周期将结果数据写入通用寄存器组。ALU运算指令:结果数据来自ALU。load指令:结果数据来自内存系统。5 .相关:两个命令之间有某种依赖关系。关联有三种:数据关联(也称为照片数据关联)、名称关联、控制关联数据关联具有传递性,反映了数据流关系如果两个指令使用相同的名称,并且其间没有数据流,则认为两个指令具有相关联的名称。反相关:命令j写的名字和命令I读的名字相同的话,命令I和j被称为反相关。指令j写的名字=指令I读的名字输出关联:如果命令j和命令I写相同的名称,则命令I和j称为输出关联。指令j写的名字=指令I写的名字更名技术:通过变更命令中的操作数的名称来解除名称关系。前提:寄存器足够了。控制关联是指基于分支命令的关联。管线冲突是指在具体管线中,由于其关联存在,命令流中的下一命令不能以规定的时钟周期执行。6 .管线碰撞分为三种类型结构冲突:硬件资源不满足重复执行指令的要求而发生的冲突。数据冲突:在管线上重复执行指令时,由于需要前一指令的执行结果而发生的冲突。控制冲突:管线遇到了分支指令和更改PC值的其他指令的冲突。数据冲突如下:写入后的读取冲突(RAW )在I被写入之前,j先去读。 j读的内容错了。 对应于数据相关写入后的写入冲突(WAW )在I写入之前j写入。 最后写入的结果是I。 错了! 对应于输出相关读写冲突(WAR )在I读之前j写。 I读的内容错了! 根据反相关。方向性技术:在某个命令生成计算结果之前,其他命令并不实际上需要计算结果,如果可以从生成计算结果的地方直接发送到其他命令需要的地方,就可以避免停止。插入管线联动机构“暂停”。作用:检测数据冲突,停止管线直到冲突消失。编译器解决数据冲突使编译器重新组织指令的顺序来消除冲突的技术称为指令调度或流水线调度。抑制冲突处理分支指令的最简单的方法是“冻结”或“排出”行。分支命令引起的延迟称为分支延迟。减少分支延迟的方法:分支预测失败允许分支命令后的命令继续流过管线,好像什么都没有发生。当分支失败确定后,分支指令被视为普通指令,管线正常流动。确定分支成功后,管线将分支命令之后取出的所有命令转换为空操作,按分支目的地重新提取并执行命令。确保处理器的状态不变,直到分支结果出来,在一次推测的时候,处理器就能恢复到原来的状态。预测分歧的成功假定分支转发成功,从分支目的地地址接收命令执行。发挥作用前题:知道分支地址后,再知道分支是否成功。上述五段管线中,这种方法没有任何好处。推迟分支主要思想:逻辑上“延长”分支指令的执行时间。 延迟分支被认为由原来的分支指令和多个延迟时隙构成,且无论分支是否成功,都依次执行延迟时隙的指令。分支延迟指令的调度任务:在延迟槽中加入有用的指令。编译程序完成。 能否带来好处取决于编译器是否有用的命令被调度到延迟槽中。三种调度方法:传统的调度、从目标的调度、从失败的调度微软公司检测到RAW冲突的情况下,管线联动机构必须在管线中插入停顿,使现在IF段和ID段中的命令不前进。分支命令的条件测试和分支目的地地址计算在EX段完成,PC的修改在MEM段完成。矢量处理机在流水线处理器中,设置矢量数据的表现和与其对应的矢量指令,称为矢量处理器。没有矢量数据的表现和与之相对应的矢量指令的流水线处理器称为标量处理器。处理方法:1 .横(水平)处理方式向量计算是按行从左到右横向进行的。组成循环程序进行处理。 I数据关联: n次功能切换: 2N次不适合矢量处理器的并行处理。2 .纵(垂直)处理方式向量计算是从上向下纵向进行的,就像列一样。2个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 夫妻共同财产分割与离婚协议执行咨询合同
- 婚姻关系解除后的房产、股权等财产分割合同范本
- 企业员工竞业禁止与供应链管理秘密保密合同
- 离婚时财产分割保障的婚前财产协议书
- 虚假合同冲抵公司借款的债权债务转移协议
- 2025综合托管服务合同模板
- 离婚双方财产分割与子女抚养权规定合同
- 高级离婚财产分割及子女安置方案合同模板
- 企业人员岗位责任协议及考核标准
- 动态环境下的种子填充-洞察及研究
- 2025年民航维修考试题库及答案
- GB/T 32066-2024煤基费托合成液体石蜡
- 人工智能机器学习课件
- GB/T 6441-1986企业职工伤亡事故分类
- 第一章 电渣冶金
- GB/T 12719-2021矿区水文地质工程地质勘查规范
- 剖宫产术后护理常规
- 老年康复理论知识考核试题及答案
- 第3章-信息可视化设计的流程课件
- 实验数据的误差分析课件
- 供水管网爆管事故应急抢修全新预案修订
评论
0/150
提交评论