计算机体系结构知识点汇总_第1页
计算机体系结构知识点汇总_第2页
计算机体系结构知识点汇总_第3页
计算机体系结构知识点汇总_第4页
计算机体系结构知识点汇总_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章计算机体系结构的基本概念1 .计算机系统结构的经典定义程序员所看到的计算机属性,即概念性结构和功能特性。2 .透明度在计算机技术中,这种本来就存在的东西和属性,从某个角度来看就不存在的概念叫做透明性。3 .系列机同一厂家生产的具有相同系统结构,但具有不同结构和实现的一系列不同型号的计算机。4 .常见的计算机系统结构分类法有弗林分类法、冯分类法两种弗林分类法将计算机系统的结构分为四类单命令流(SISD )单指令流多流(SIMD )多指令流数据流(MISD )多指令流多流(MIMD )5.改进的方案总执行时间系统的加速比是改善前和改善后的总执行时间之比6 .对CPI (循环移位) :指令执行的平均时钟周期数CPI=执行程序所需的时钟周期数/IC7 .存储过程原理的基本要点:命令驱动8 .冯诺依曼结构的主要特点1 .以运算器为中心。2 .在内存中,命令与数据同等对待。指令可以和数据一样运算,也就是说可以修改由指令构成的程序。3 .存储器是用地址进行存取,按顺序线性编辑地址的一维结构,各单元的位数是固定的。4 .命令的执行是顺序的5 .命令由操作码和地址代码组成。6 .指令和数据都用二进制代码表示,采用二进制运算。9 .软件的可移植性软件可以从一台计算机迁移到另一台计算机,只需进行任何修改或稍微修改即可正常工作。 不同只不过是执行时间的不同。 我们说这两台电脑是软件兼容的。实现可移植性的一般方法:采用系列功能,仿真和仿真,统一高级语言。软件兼容性:上(下)互换性:某一阶段机器制作的程序可以在比其高(低)阶段的机器中执行,而不进行修改。前(后)互换性:在某个时期投入市场的某种形式的机器制作的程序,可以在之前(后)投入市场的机器上执行。向后兼容是系列机的基本特征。兼容机:不同公司制造商生产的具有相同系统结构的计算机。10 .并行性:计算机系统在同一时刻或同一时间间隔进行多个运算或操作。并发性:两起以上事件同时发生。并发性:多个事件以相同的时间间隔发生。从数据处理的角度来看,并行性的级别可以从低级别大致分为高级别1 .字符串位串:一次只处理一个单词的1位。最基本的串行处理方案没有并行性。2 .字符串位并行:同时处理一个字符的所有位,不同字符之间串行。并行性开始显现。3 .字并行位串:同时处理多个字的同一位(称为位片)。具有很高的并行性。4 .全并行:同时处理多个字的全比特或部分比特。最高级别的并行性。从运行程序的角度来看,并行性的级别从低级别分为高级别1 .命令内部并列:单一命令中各微操作间的并列。2 .指令级并行:并行执行两个以上的指令。3 .线程级并行:并行运行多个线程。通常,将在一个进程内派生的多个线程作为调度单位。4 .任务或流程级别并行:并行运行两个或多个流程或任务(段)以子程序或过程为调度单位。5 .作业或程序级别并行:并行运行两个或多个作业或程序。提高并行性的技术方法:1 .时间重叠导入时间因素以及时间偏移多个处理过程和交替使用同一硬件装置的各个部分加速硬件旋转并获得速度。二.资源重叠引入空间因素以数取胜。 通过重复配置硬件资源,大幅提高计算机系统的性能。3 .资源共享这是一种软件方法,允许多个任务按顺序使用相同的硬件设备。第二章计算机指令集结构1. CPU用于存储操作数的存储单元的主要类型为堆栈、存储器、通用寄存器组2 .通用寄存器型指令集结构进一步细分为3种寄存器-寄存器型(RR型)寄存器-存储器型(RM型)内存-内存类型(MM型)3 .指令集结构的设计主要考虑速度、成本和灵活性三个因素指令集的基本要求:完整性、规则性、效率和兼容性RISC机器设计遵循的原则1 .指令根数少,简单。 仅选择最常用的命令,然后添加最有用的命令。2 .采用简单统一的指令形式,减少地址方式的指令字长均为32位或64位。3 .指令的执行在一个机器周期内完成。 (采用流水线机构)只有load和store指令可以访问存储器,其他指令的操作在寄存器之间进行。(采用load-store结构)5 .大多数指令都是通过硬链路逻辑实现的。6 .强调编译器的作用,为高级语言程序生成最佳代码。7 .运用流水技术提高性能。5 .指令由两部分组成:操作码、地址代码指令集的三种编码形式:可变长度编码形式、定长编码形式、混合编码形式第三章流水线技术1 .流水线技术:将反复过程分解为几个子过程,每个子过程由专用功能部件实现。 在时间偏移多个处理过程之后通过每个功能段,这使得每个子过程与其它子过程并行。管线中的每个子工艺及其功能部件称为管线类或段,段和段相互连接以形成管线。 管线的段数称为管线的深度。通过时间:从第一个任务进入管线到结果流出所需的时间。排放时间:从最后一个任务进入管线到结果流出所需的时间。2 .分类1 .单功能生产线和多功能生产线单功能管线:只能完成固定功能的管线。多功能管线:管线的每个段可以具有不同的连接以实现不同的功能。2 .静态管线和动态管线静态流水线:多功能流水线的各段只能在同一时间内以相同功能的连接方式工作。动态管线:多功能管线的各段可以同时以不同的方式连接,并且可以同时运行多个功能。3 .部件级、处理器级及处理器间流水线零件级流水线(运算操作流水线):通过分段处理器的算术逻辑运算零件,可以用流水方式进行各种类型的运算操作。处理器级流水线(指令流水线):指令的解释执行过程如流水一样处理。 一个指令的执行过程被分解为若干个子过程,每个子过程在独立的功能部件上执行。处理器间流水线(宏流水线) :两个以上处理器串联连接,处理同一流,各处理器完成整个任务的一部分。4 .线性管线和非线性管线线性管线:管线的各段串联连接,没有反馈回路。 数据通过管线的各段时,每段最多只流过1次。非线性管线:管线除了具有串行连接外,还具有反馈回路。5 .顺序线和顺序线顺序管线:管线输出侧任务流出的顺序与输入侧任务流入的顺序完全相同。 每个任务在管线的每个段按顺序流动。不按顺序流水线:流出流水线输出侧任务的顺序可能与流入输入侧任务的顺序不同,允许后进入流水线的任务先完成(从输出侧流出)。6 .标量处理机和矢量流水处理机标量处理器:处理器没有矢量数据表示和矢量指令,只对标量数据进行流水处理。矢量流水处理机:具有矢量数据的表现和矢量指令的处理机。3 .吞吐量百分比:在单位时间内完成管线的任务数或输出结果数。一种解决流水线瓶颈问题的通用方法:包括细分瓶颈段并重复设置瓶颈段。加速比:完成相同任务且不使用管线的时间与使用管线的时间之比。效率:流水线中设备的实际使用时间与运行时间的总比率,即流水线设备的利用率。如果管线的每个时间相等,则管线的效率与吞吐量比例。Tk=(k n-1) tE=TPt t=T通过/m (m表示级数)流水线的效率是流水线的实际加速比s与其最大加速比k之比。从时空图来看,效率是n个任务占有的时空面积与k个段的总时空面积之比。4 .一个指令的执行过程分为以下五个周期:1 .取得指令周期(IF )IR MemPC。PC的值加4。 (假设每个指令占用4字节)2 .指令解码/读取寄存器周期(ID )解密。通过IR的寄存器编号访问通用寄存器组,读取必要的操作数。3 .执行/有效地址计算周期(EX )根据命令而不同的动作:存储器访问指令: ALU将指定寄存器的内容和偏移相加,形成用于访问的有效地址。寄存器-寄存器ALU指令: ALU按照操作码指定的操作,运算从通用寄存器组读取的数据。寄存器-即时数ALU指令: ALU用操作码指定的操作数运算从通用寄存器组读取的第一操作数和即时数。分支命令: ALU将偏移量加到PC值中,形成转送目的地地址。 同时,判断在前一周期读取的操作数,判断分支是否成功。4存储器访问/分支完成周期(MEM )此周期只处理load、store和分支命令。 其他类型的命令在此循环中不会执行任何操作。load和store命令load指令:按照上一周期计算出的有效地址,从存储器读取相应的数据。store命令:将指定的数据写入该有效地址所表示的存储单元。分支命令分支“成功”后,将转发地址发送到PC。分支指令的执行完成。5 .重写周期(WB )ALU运算指令和load指令以该周期将结果数据写入通用寄存器组。ALU运算指令:结果数据来自ALU。load指令:结果数据来自存储系统。5 .相关:两个命令之间有某种依赖关系。关联有3种:数据关联(也称为照片数据关联)、名称关联、控制关联数据关联具有传递性,反映了数据的流动关系如果两个指令使用相同的名称,并且两个指令之间没有数据流,则假定两个指令具有相关联的名称。反相关:命令j写的名字和命令I读的名字相同的话,命令I和j被称为反相关。指令j写的名字=指令I读的名字输出关系:命令j和命令I写入相同的名称时,命令I和j称为输出关系。命令j写的名字=命令I写的名字重命名技术:通过重命名命令中的操作数来解除名称关系。前提:寄存器足够了。控制关系是指通过分支命令进行的关系。流水线冲突是指在具体流水线中不能由于相关存在而在指定的时钟周期内执行指令流的下一个指令。6 .管线冲突有三种类型:结构冲突:硬件资源不能满足重复执行指令的要求而发生的冲突。数据冲突:在管线中重复执行指令时,需要执行上一个指令的结果而发生的冲突。控制冲突:管线遇到变更分支指令和PC值的其他指令的冲突。数据冲突包括:写入后读取冲突(RAW )在I写之前,j先去读。 j读的内容错了。 与数据相关对应写入后的写入冲突(WAW )在I写之前j写。 最后写入的结果是I。 错了! 与输出相关对应读后写冲突(WAR )在I读前由j写。 I读的内容错了! 通过反相关。定向技术:直到某个指令生成计算结果为止,其他指令并不实际需要计算结果,只要能够从生成计算结果的地方直接发送到需要其他指令的地方,就能够避免停止。插入管线联动机构、“暂停”。作用:检测数据冲突,停止管线直到冲突消失。编译器解决数据冲突使编译器重新组织指令顺序以消除冲突的技术称为指令调度或管线调度。控制冲突处理分支指令的最简单方法是“冻结”或“排放”线。分支命令引起的延迟被称为分支延迟。如何减少分支延迟:分支预测失败允许分歧命令后的命令继续流通管线,好像没有发生什么事情。分支失败确定后,分支命令被视为普通命令,流水线正常流动。当分支确定成功时,流水线将分支命令后取出的所有命令转换为空操作,按分支目标重新取出命令并执行。保证处理器的状态在出现分支结果之前不会改变,使处理器能够在一次推测时恢复到原来的状态。预测分歧的成功假设分支转发成功,从分支目的地地址接收到指令执行。发挥作用的前题:先知道分支地址,然后知道分支是否成功。在上述五段管线中,该方法没有任何好处。推迟分歧主要思想:逻辑上“延长”分支指令的执行时间。 延迟分支被认为是由原来的分支指令和多个延迟时隙构成,不管分支是否成功,都按顺序执行延迟时隙的指令。调度分支延迟指令任务:在延迟时隙中放入有用的命令。编译程序完成。 是否带来好处取决于编译器是否有用的命令安排在延迟时隙中。三种调度方法:传统调度、目标调度和失败调度MIPS公司检测到RAW冲突时,流水线联动机构必须在流水线上插入停顿,以防止当前IF段和ID段中的命令进行。分支指令的条件测试和分支地址计算在EX段完成,PC的修正在MEM段完成。矢量处理机在流水线处理器中,设置向量数据的表示及其对应的向量指令,称为向量处理器。没有矢量数据的表现和对应矢量指令的流水线处理器称为标量处理器。处理方法:1 .横向(水平)处理方式矢量计算按行从左到右横向进行。组成循环程序进行处理。 I数据相关: n次功能切换:2N次不适合矢量处理器的并行处理。2 .纵向(垂直)处理方式矢量计算像列一样从上到下纵向进行。2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论