计算机系统结构-02325 自考 笔记_第1页
计算机系统结构-02325 自考 笔记_第2页
计算机系统结构-02325 自考 笔记_第3页
计算机系统结构-02325 自考 笔记_第4页
计算机系统结构-02325 自考 笔记_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1章概论1-计算机系统的层次结构 应用语言机器级(翻译) 高级语言。(翻译) 滙编语言机器级-(翻译) 操作系统机器级-(解释) 传统机器语言机器级。(解释) 微程序机器级(执行)2.机器被定义为存储和执行相应语言程序的三尝和筮据涅故的集合体。3-只有二进制机器指令,方可直接被硬件识别和执行。计算机结构确定计算机系统中各级界面,界面之上是软件的功能,界面之下是硬件 与固件实现功能。从使用语言的角度 一台由软、硬件组成的通用计算机系统可以被看成是按缨划分 的多层机器级组成的层次结构。计机机系统结构的属性包括(不用背,理解,选择題多)硬件能直接识别和处理的数据类型及格式等的数据表示最小可寻址单位

2、,寻址种类、地址计等的寻址方式通用/专用寄存器的设置、数量、字长、使用约定等的寄器沮织二进制或滙编指令的操作类型、格式、排序方式 控制机等的指令系统。主存的最小址单位、编址方式、容量、最大可编址空间等的存储系统组织中断分类与分级、中断处理程序功能及入口地址等的中断机构。系统机器级的管态和用户态的定义与切换输入/输出设备的连接、使用方式、流量 操作结束、出错有示等的机器级I/O结 构系统各部分的信息保护方式和保护机构等属性。计算机组成是物理机器级内客观事件的排序方式与控制机构,各部件的功能以及各 部件之间的知。计算机组成指的是计算机系统结构的典实现,包括机器级内部的数据流和控制流 的组成以及逻辑

3、设计等。计算机实现的是计算机组成的物里实现。包括等处理机 王瓦部件的物理结构。计算机组成设计要确定的方面,一般应包括数据通路宽度。系统程序员透明专用部件的设置各种操作对部件共享程度功能部件的并行度控制机构的组成方式缓冲和排队技术预估、预判技术可靠性技术计算机实现的设计着眼于器件技术和微组装技术。其中,器件技术起主导作用。U-计算机系统设计的主要任务包括系统结构、组成和实现的设计。软件功能可以用皿或隹完成,硬件的功能也可以用软件或拟完成,只是它们在 性能、价格、实现的难易程度上是不同的。计算机系统的定量设计原理包括,哈夫曼压缩原理、Amdahl定律、程序访问的局部 性定律。哈夫曼压缩原理是尽可能

4、加速处理高概率的事件远比处理概率很低的事件对性能的 提嵐要显著。15- Amdahl定律,改进效果好的高性能系统应是一个各部分性能为能平衡得到提高的系 统,不能只是其中某个功能部件性能的提高。程序访问的局部性包括了时间上和空间上的两个局部性。应用软件对功能的确定起主要作用。一个复杂的大程序可以分解成多个逻辑上相对独立的模块,这些模块可以是主程序、 子程序、过程也可以数据块。系统结构设计时实现这种指令系统,以足其应用需求。(不用背,理解,选择題多)要弄清其应用领域是专用的还是通用的。要弄清软件兼容是放在级层次。要弄清对操作系统有何种要求要如何保证有高的标准化程度。计算机系统的设计方法包括了由上往

5、下、由下往上、由中间开始。较好方法是鱼虫 间开始。从中间开始设计是选择从层次结构的主要软、硬界面开始设计,即在充机器语言机 级与操作系统机器级之间进行合理的软硬件功能分配。实现软件移植的技术包括一统-高级语言、采用系列机、模拟和仿真。实现软件移植技术,系列机软件必须保证构后兼容,力争向前兼容。简述软件移植中统一高级语言概念及困难点(*背)由于高级语言面向题目和算法,与机器的具体结构关糸不大,如果能统一一种可满足 各种应用需要的通用高级语言,这种高级语言编写的应用软件就可以移植于不同的机 器。目前高级语言有上百种,并没有真正通用的语言有以下几方面原因。不同用途要求语言的语法、语义结构不同人们对语

6、言的基本结构看法不一即使用一种高级语言在不同厂家的机器也不能完全通用受习惯势力阻挠,人们不愿意抛弃惯用的语言统一高级语言有助于节约软件研制的人力、物力和费用,加快人员的培养都有重要的 意义。如ADA,JAVA - C,C+等语言出现都是朝此方向发展的重要进展。简述软件移植中采用系列机途径的办法及优点(*背) 方法:在软、硬界面上设定好一种系统结构-软件设计者按照此设计软件、硬件设计 者根据机器速度、性能、价格的不同,选择不同器件硬件和组成、实现技术、硏制 并提供不同档次的机器优点:较好地解决了软件环境要求相对稳定和硬件、器件技术迅速发展的矛盾,软件 环境要求相对稳定就可不断积累、丰富、完善软件

7、,使软件产量、质量不断提高-同 时又能不断采用新的器件和硬件技术,使之短期内即可提供新的性能不断提高机器。系列机软件兼容的要求(*背)机器语语程序及编译程序都不加修改通用于系列内各档机,则各档机器是软件兼 容。软件兼容包括向上(下)兼容和向前(后)兼容同一系列内的机器应做到上兼容系列机软件必须保证向后兼容,力争向前兼容简述系列机思想对计算机发展的意义和系列机软兼容的要求简述系列机思想对计算 机发展的意义。(*背)系列机可以较快地解决软件设计环境要求相对稳定和硬件、器件、组成等技术在迅 速发展的矛盾。软件可以丰富积累,使软件产量,质量不断提升器件、硬件和组成又能不断更新,便之短期内就能提供出性能

8、良好,价格更便宜的 新机器,有力地促进计机的发展。系列机软件兼容基本要求是必须保证实现软件的向后兼容,力争做到向上兼容。模拟是用机器语言程序解释,其解释程序存储于I*中(&扱机)。仿真是用微程序 解释,其解释程序存储与控制存储器中(微程序)。以软件为主实现的机器称为虚拟机器。简述模拟和仿真差别(*背)模拟和仿真的主要区别于解释用的语言仿真是用微程序解释,其释程序存储于控制存储器中模拟是用机器语言解释,其解释程序存储于主存中。简述模拟和仿真的选择频繁使用的易于仿真机器指令宜用仿底可以提高速度很少使用 难以仿真的指令及I/O操作宜用模拟。即使两种机器系统差别不大,往往要需用模拟来完成机器的映像。应

9、用仿真(模疑)实现软件移植,除了仿真(模疑)目标机的指令系统夕卜,还要仿真其在 储体系、I/O系统和控制台的操作。综合简述目前软件移植方法及特性。统一高级语言可以解决结构相同或完全不同的机器间的软件移植从长远看的是方 向,但目前难以解决,只能做到相对统一。系列机是当前最普遍采用办法,但只能实现同一系统间内的软件兼容,但兼容的约 束会阻碍系统结构取得突破性进展。模拟灵活可实现不同系统间的软件移積,但结构差异太大时,效率、速度会急剧 下降。仿真在速度上损失小,但不灵活,只能在差别不大的系统之间使用,否则效率也会 过低且难以仿真,需与模拟结合才行。简述应用的发展对系统结构的影响不同的应用对计算机系统

10、结构的设计提出了不同的要求应用需求是促使计算机系统结构发展的最根本的动力一些特殊领域:需要高性能的系结构。计算机应用可归纳为向上升级的4类,它们是数据处理、信息处理 知识込理、智 能处理。器件的发展改变逻辑设计以前用的是硬件逻辑设计主要,将逻辑化简,减少门的个数等,以节省功耗、降低成 本、提高速度。但对于VLSI(超大型集成电路)来说,这样做反而使设计周期延长,组 成实现不规整,故障诊断困难,机器产量低。应改用为主要的是应用诸如微滙编、微 高级语言,计算机辅助设计等软件方法来设计。器件的发展对系统结构的影响(背书口诀:二功能二材料一技术)器件集成度的提高,使器件的速度迅速提高,机器主频和速度也

11、有数量级的提高。 k功餘器件可靠性有数量级的提高,保证流水技术的实现,(劝約高速、廉价的半导体存储器的出现,使解题速度得以迅速提高的高速缓冲存储器和虚拟存储器的概念真正实现。E材糊现场型PROM器,使微程序技术得以实现-(材糊高速相联存储器的实现,促进相联处理机这种结构的发展 推动矢量机 数组机 数据库机的发展。(g器件的功能和使用方法发生了很大变化,由早先使用非用户片、发展到现场片和用 户片,它影响着结构和组成技术的发展。非用户片是不能改变器件内部功能,现场片是用户可根据雳要可改变器件内部功能。 里地是专门按用户要求生产的高集成度的VLSI器件。完全按用户要求设计的用户片 也称为全用户片。并

12、行性包含同时性和并发性二重含意。并行性开发由低至高(执行程序)指令内部- 指令之间- 任务进程之间- 操作系统程序之间并行性从处理数据由低至高位串字符串. 位并字符串 位片串字并 全并行并行性等级由低至高存储器操作并行-处理器操作步骤-处理器操作并行-指令、任务、作业并行各种脱机処理系统是最氏耦合糸统。多台计算机通过通道和通信线路实现,为燮 耦合系统或间接翘合系统。多台计算机经总线或高速开笑互连,共享主存,称为瞿 耦合系统或直接耦合系统。Flynn(弗林)分类,SISD,SIMD,MISD,MIMD。I是指令流,D是数据流。并行性开发途径时间重叠,空间車叠,资源重覆(资源共享)。简述提高计算机

13、器系统并行性技术的三个途径(*背)时间重叠是在并行性概念中引入时间因素,让多个处理过袒在时间上相互错开,轮 流使用同一套硬件设备的各个部分以加快硬件旳周转来赢得速度。资源重叠是在并行性概念中引入空间因素,通过重复设置硬件资源来提高可靠性或 性能。资源共享是用软件方法,让多个用户按一定的时间顺序轮流使用同一套资源来提高 资源利用率从而提高系统性能。简述软、硬件功能分配比例对计算机系统性能的影响简述计算机功能分别用硬件实 现和软件实现的优点和缺点。(*背)提高件功能的比例可提高解题速度,减少程所需的存储空间,但会增加硬件成本、 降低硬件的利用率,降低计算机系统的灵活性和适应性。提高软件功能的比例可

14、降低硬件成本,提高系统的灵活性、适应性,但解题速度会 下降,软件设计费用和所需的存储器用量增加。简述软硬件取舍原则(*背)应考虑在现有硬件、器件的条件下-系统要有高的性能价格比主要从现实现费用、 速度和其它性能要求来综合考虑。要考虑到准备采用和可能采用的组成技术,使之尽可能不要过多或不合理地限制各 种组成、实现技术的采用。不能从硬”的角度考虑如何使于应用组成技术的成果和便于发挥器件技术的进展, 还要从软”的角度把如何为编译和操作系统的实现以及为高级语言的设计提供更多、 更好的硬件支持放在首位。甚么时透明性,对计算机系结构下列哪些是透明的。浮点数据表示;字符串运算指令;阵列运算部件;通道是采用结

15、合型还是独立型;访问方 式保护;数据总线宽度:Cache存储器:存储器的最小编址单位;存储器的模M交叉存取, 串行、重叠还是流水控制方式。客观存在的事物或属性,从某个角度去看去看不到,称这些事物和属性对它是透明的。对于计算机系统结构透明的有:数据总线宽度、阵列运算部件,通道是采用结合型还是独 立型,Cache存储器,存储器的模M交叉存取串行、重叠还是流水控制方式。机器语言程序员透明是一指令缓冲器、时标发生器、乘法器、主存地址寄存器、先 行逬位键、移位器。对系统和应用程序员透明系统程序员应用程序员Cache存储器 指令缓冲寄存器 浮点数下溢处理精度损失Cache存储器 指令缓冲寄存器 浮点数下溢

16、处理精度损失虚拟存储器 程序状态字 啓动I/O指令数据通路宽度不透明执庁指令第2章数据表示、寻址方式与指令系统计算机的运算类指令和运算器结构主要是按计算机有甚么样的数据表示来确定的。数据表示指的是能由计算机硬件直接取和弓匿L的数据类型。表现在它有对这种类 型的数据进行操作指令和运算部件。高级数据表示包括:自定义数据表示(标志符,描述符),虫量.、题组.、。简述引入数据表示的原则(*)看系统的效率是否有显著提高,包括实现时间和存空间是否有显著减少,实现时间 是否减少又主要看主存和处理机之间传递的信息量是不减少看引入这种数据表示后,其通用性和利用率是否提高。如果只对某种数据结构的实 现效率高,而对

17、其化数据结构的实现效率低(,或应用较少将导致性价比下降。简述标志符和描述符的差别。(*背)标志符是和个数据相连的,合存在一个存储单元中,描述单个数据的类型特征。数据描述符则是与数据分开存放,用于描述所要访问的数据是整块的还是单个的, 访问数据块或数据元素所要的地址以及其他信息。简述标志符数据表示的主要优点缺点(*背) 优点简化指令系统、程序设和编译程序便于实现一致性校验能由硬件自动变换数据类型支持数据库糸统的实现与数据类型无美的要求为软件调试程应用软件开发提供了支持 缺点每个数据字因增设标志符,会増加程序占的主存空间采用标志符会降底执行遞度7-简述指令字格式优化措施(*背)采用扩展操作码,并根

18、指令的频度Pi的分布状况选择合适的编码方式,以缩操作 码的平均长度采用多种寻址方式,以缩地址码的长度,并在有的地址长度内提供更多的地址信息。采用0,1,2,3等多种地址制,以增强指令的功能在同种地址制内再采用多种地址形式,让每种地址字段可以有多种长度,且让长操 作码与短操作码进行组配。在维持指令字在存储器中按整数边界存储的前提下,使用多种不同的指令字长度。简述堆栈计算机的概念及其特点有堆栈数据表示的机器称为推栈机器有高速寄存器组成的硬件推栈,使堆栈的访问速度是寄存器,容量是主存的有力地支持高级语语程序的编译有力地支持子程序的嵌套和递归调用。寻址方式可分:面向寄存器、面向堆栈、面向主存(I/O)

19、。寻址在指令中一般有两种不同的指明方式,一种方式是占用操作码中某些位来指明。 另一种方式是在业址殴部分专门设置寻址方式位字段指明。相对,第二种较灵活、操 作码短,但需要专门N址方式位字段。11-程员编程用的地址。辑地址,程序在主存中实际地址是物理蜒。指令系统的设计包括指令的之隹和指令的足L的设计,指令是由操作码和地址码 两部分组成。程序在定位主存中的技术包括,静态再定位、动态再定位和.专实地址映象表,其中 动态再定位包括一基址寻址和变址寻址。基址寻址是逻辑地址空间到物理址空间变换 的支持。变址寻址是对诸如矢量、数组等数据块运算的支持,以使于实现程序循环。信息在存储器中按整数边界存储对保证访问速

20、度是必要的。但会造成存储空间的某些 浪费。is.存儲器三大指标,谿最、jBE.、圈.。存储器分别有单体单字单体多字,多体单体,交叉存储器的并行计机。输入/输出系统的3种控制方式为程序控制I/O、直接存诸器访问(DMA)、I/O处理机18-浮点数基值公式(*背)阶值:P进位:rm带进制m位:mz = 7n/log2诵可表示最小尾数可表示最大尾数1TX 琨“最大阶值2P-1可表示最小值咪X琮1可表示最大值舟PT)X(1 -琮勺可表示的尾数个数灌1 X (板- 1)rn可表示阶的个数2P可表示数的个数rjn浮点尾数下溢处理方法截断法、舍入法 恒置1”尾、査表舍人法(ROM)。4种下溢处理方法比较和应

21、用场合截断法,实现简单、不增加硬件、不需要处理时间,误差非常大,现在很少用舍入法,实现简单、增加硬件很少、处理慢,误较小,中低速寸算机和要求精度尽可 以少的场合恒置”1”法,实现简单、不需要增加硬件、不需要处理时间,误差最大,多用在中、高 速计算机查表法,实现较难,硬件量大、处理时间比舍入法快,误差最小浮点数下溢处理精度损失对盏歪程序和鱼国程序设计者都是透明的。简述査表舍入法(*背)ROM表共需2,单元,地址用k位二进制码表示,每个存储单元字长k-1位。当存储器k位地址码之高大k-1位为全”1”时,对应单元内容k-l住全1”其余情况按k位二进制地址码最底位为0”舍弃,为1”进1来填k-1位内容

22、。浮点数表示当阶值位数一定时,不会受到尾数进制影响的是幽壬。尾数采用甚么进制会影响到数的可表示迎.、箜度及数在数轴上分布的离散程度。正尾数小数点后第个Rm进制数位不为迫的数称为规格化正尾数。指令系统的改进是以王删改原有指令系统前提的,通过增加少量强功能新指令代替 常用指令串。指令系统设计和优化工具包括哈夫曼码,优化的扩展操作码。指令类型一般分非特权梨和特权型 非特权给卫阻程序员,特权给*程序员使 用。编译程序设计者要求指令系统应设计的具有基本原则(*背)规整性对称性独立性和全能能正交性可组合性可扩充性在机器指令系统的设计 发展和改进上,有&匹和旦里两种。CISC面向优化包括,面向目标程序,面向

23、高级语言、面向操作系统 最好记图)串行链接所有部件都经公共的”总线请求”向总线控制器发出使用总线的申请只要当”总线忙”信号未建立时,总线请求”才被总线控制器响应,送出总线可用”信号, 它串行地通过每个部件。如部件收到总线可用”信号,并发出过”总线请求”时,则停止传送总线可用”给下个 部件。该部件建立总线忙,并去除”总线请求,即该部件获得了使用总线的权利之后即 可准备数据的传送,在传送期间,维持”总线忙”完成传送,去除总线忙”。定时查询总线上每个部件通过”总线请求”线发出请求,若总线处于空闲,”总线忙”信号未建立, 则总线控制收到请求后,让计数器开始计数,定时查询部件以倘定是谁发的请求。当查询线

24、上计数值与发出请求的部件号一致时,该部件就建立总线忙 使计数器停 止计数,也即控制器中止査询定时査询计数,去除该部件的总线请求,让该部件获 得总线使用权,准备传送数据,直至该部件完成传送为止,去除”总线忙”信号。独立请求当部件请求使用总线时,送”总线请求”信号到控制器。只要总线闲着,总线控制器就可以根据某种算法对同时传送来的多个请求进行仲裁, 以确定哪个部件可使用总线,并立即通过相应的”总线准许送回该部件信号,去除请 求,建立”总线已被分配”解释三种集中式总线控制请求方式的优点与缺点。(*背)串行笹接优点用于解决总线控制分配的控制线的线数少,只需要3根,且不取决于部件的数量部件的增减容易,只需

25、简单地把它连在总线上或从总上去掉可,可扩充好由于逻辑简单,容易通过重复设置提高可靠性。缺点对总线可用及其有关电路的失效敏感如部件i不能正确传送”总线可用由于优先级是线连固定,不能由程序改变,不灵活 如果高优先级部件频繁使用总 线,则离总线控制器远的部件就难以得到用总线权利。定时查询优点因计数器初值、部件号均可由程序制定优次序用程序控制,灵活性强不会因某个部件失效而影响其他部件对总线的使用,可靠性高。缺点控制线的线数较多,需要2 + flog2 N根可以共总线部件数受限数受限于定时查询线的线数扩展性差控制较复杂总线分配速度取决于计数信号的频率和部件数独立请求优点总线分配速度快,所有部件的总线请求

26、同时送到总线控制器,不用查询控制器可以使用程序可控的预定方式,自适应方式,循环方式或它们混合方式,灵 活决定下一个使用总线的部件。能方便地隔离失效部件的请求。缺点(1)控制线数量大控制N个必须有2N+1根控制线,而且总控制器要复杂很多。数据寛度有_蛭、定长块、可变长块和单字加可变长块等之分单字宽度适合于输入机、打印机等低速设备。定长块宽度适合于磁盘等高速设备可变块宽度适合于高优先级的中高速磁带、磁盘等设备。输入/输出系统的发展经历了 3个阶段,即程序控制I/O、直接存储器访问(DMA)及 I/O处理机方找。根据通道数据传送期中信息传送方式的不同,可分为字节多路、数组汝路和选择3 类通道。字节多

27、路通道适用于连接大量的像光电机等字符类低速设备。数据多路通道适合于连接多台磁盘等高速设备。选择通道适合于连接优先级高的磁盘等高速设备。数据宽度为可变度块。简述字节多路通道数据传送方式(*背)字节多路通道每选择好一台设备后,设备与通道只传送一个字节就释放总线,通道以 字节交叉的方式轮流为多台低速设备服务。某台设备要想传送n个字节,就需经n次 申请使用通道总线才行。数据多路通道的数据传送方式(*背)数组多路通道在每选择好一台设备后,要连续传送完固定K个字节的成组数据后,才 能释放总线,通道再去选择下一台设备,再传送该设备的K个字节,如此,以成组方 式轮流交叉地为多台高速设备服务。某台设备要想传送N

28、个字节,就需要先后经过 N/K次申请使用通道总线才行。简述选择通道数据传送方式(*背)选择通道每选择一台设备,就让该设备独占通道,将n个字节全部传送完后,才释放 通道总线,去选择下一台设备,再传送它的全部字节数据,因此,每设备为传送n个 字节数据只需一次申请使用通道总线。通道流量,又称吞吐量。Ts设备选择时间、Td传送一个字节所用的时间 n每台设备传送的字节数、K数组多路通 道传输的一个数据块中包含的字节数。通道最大流量的公式为:(*背)字节多路通道Rg 耿=矗数据多路通fmax-Block =选择通道扁心应=士24.简述通道功能接收CPU发来的I/O指令、并根据指令要求选择指定的外设与通道相

29、连接执行通道程序给出外设中要进行读/写操作的数据所在的地址给出主缓冲区的首地址控制外设的主存缓冲区之间的数据传送的长度对传送数据个数进行计数判断传送完 毕。指定传送工作结速吋要进行的操作检查外设的工作状态是否正常在数据传输过程中完成必要的格式变换第4章存储体系1-虚拟存储器解决主存无法足要求的性能指标是0,cache解决是夔.。Cache存储器就是在CPU和主存之间增设_1速.、小容量、每位价格高的Cache、用 辅助硬件将Cache和主存构成整体。Cache存储器对亙国程序员和曇1程序员是透明。为了提高Cache的命中率,Cache的预取算法有恒预取法和不命中时预取。为了存储系统有效工作,C

30、PU要用到某个地址的内容时,希望放在最近以及最快的地 方,因此要求具有预知未来被访问的地址。这种预知未来是基于计算机程序具有地 性,包括时间上的局部性和空乳上的局部性。CPU访问Ml (最近及最快的位置)的命中概率,命中率H与程序的地址流、所采用 的地址预判算法及容量都有很大关系。H越接近1越好。7-根据存储映像算法的不同,可有多种不同的存储管理方式的虚拟存储器,其中主要有 段式 页式和段页式3种。将程序分割成若干段或页,用相应的映像表指明该程序的某段或某页是否已装入迪.。虚拟存储器的页式管理是把至産空间和也五空间机械等分成固定大小的页,按页顺 序编号。并不对豈既程序员透明。程序状态字对亟星程

31、序员是透明,对長程序员是不透明。简述段式管理方式的特性(背书口诀:独一共)段式中每个段独立,有利于程序员灵活实现段的链接、段的扩大、缩小和修改,而不 影响到其它的段。每段只包含一种类型的对象,如过程或是数组堆栈、标量等集合,易于针对其特定 类型实现保护把共享的程序或数据单独构成一个段,从而易于实现多个用户、进程对共享段的管理虚拟存储器的页式管理是把主存空间和程序空间机械等分成固定大小的页,按页顺 序编号。页式虚拟存储器是釆用页式存储和管理的主存-辅存存储层次。主存中的每一个页 面位置应可对应多个虚页能对应多个虚页与采用的映像方式有关。映像分别有全 相联映像、相联目录表法。相联目录表法,简称目录

32、表法。把页表压缩户只存放已装入主存的那些虚页(b)与实页 (nv)位置的对应关糸,该表最多为金行。按内容访问相联的不同于按地址方问的厕 存储器。替换算法的确定要看主存是否有高的命屮率,也要看算法是否便于虫现.,辅助软、 硬件成本是否低。页面替换算法包括-随机算法,先进先出(FIFO)、近期最少使用算法 (LRU) 页面失效的处理是要访问的虚页不在实际主存中时 就会发生页面失效。提高虚拟存储器等有效访问速度的措施(理解,公式为主再延申)1)存储层次的等效访问时间,TA=HT1+(1-H)T2 - T1为主存访问时间 T2为辅存访时 间,H为命中率。2)要提高存储层次等效访问速度,可采取措施有I)

33、当等效访问时间远大于主存访问周期时,可采取提高主存命中率的方法ii)当主存命中率H已经很高时,可提高主存的访问速度,以降低T1iii)加快内部地址映像和变换,如采用快-慢表层次,増大快表命中率等。程序地址流、替换算法以及分配给程序的宪些不同都会影响命中率。Cache的映像与变换有全相联映像、直接职像,组相联映像。简述Cache存储器地址映像,地址变换的概念以及映像规则的选择要求(*背)地址映像就是将每个主存块按某种规则装入Cache中地址变换就是每次访问Cache时怎样将主存地址变换成Cache地址映像规则的选择要求除弓看所用的地址映像和变换硬件是否提高、价格低和实现 方便外,还要看块冲突概率

34、是否底 Cache空间利用率是否高。简述Cache三种映像的优缺点(*背)全相联:Cache全相联映象是主存中任意块都可以映像装入Cache中的任意一块位置的 地址映像优点:块冲突率最底,只有当Cache全部装水廿中月人才可能出现冲突 Cache的空间 利用率最高缺点:要构成容为2%项的相联存储器的代价太大,Cache容量很大时,其查表的速度 很难提高直接映像:把主存空间按Cache大小等分成区,每区内的各块只能按位置一一对应到 cache的相应块上优点:节省所需的硬件,只需容量较小的按地址访问的区号标志表存器器和少量外比 电路,成本很低缺点:cache的块冲突概率很高。组相联映像:组相联是全

35、相联与直接映像结合,将Cache和主存空间都分为组,指的 是各组之间直接映像,而组内各块之间是全相联映像。优点:冲突概率比全相联大,但比直接映像小很多。因大大降底冲突率,也同时提高 了 Cache空间的利用率。成本比全相联低很多,性能也接近全相联。缺点:因对主存和Cache进行分组,对于分组大小 组内块数大小的选择很重要,可 能会导致成本越高,査表速度越慢。解决cache存储器的透明性分析和解决办法,一般可有写:回法和写直达法两种。写回法和写直达法(*背)写回法:在CPU写操作,信息写入cache,仅当需要替换时,才将改写过的cache块先 写回主存,然后再调入新块。写直法:利用cache存储

36、器在处理机和主存之间的直接通路,每当处理机写入cache的 时时,也通过此通路写入主存。Cache取算方式,适当选择好Cache的容星、块的大小、组相联的组数和组内块&.,可保证有较高命中率。Cache存儲器的性能方式,主要看命中率的高低,而命中率与块的大小、块的总数, 采用组相联时组的大小,替换算法和地址流的簇聚性等有关。Cache的速度和容暈 都影响命中率。三级存储体系包括以下三种,物理地址Cache,Cache-:齐和壬存-辅存两个独立的 存储层次组成。虚地址Cache为Cache-主存-辅存直接构成三级存储层次形式。全 Cache - Cache-辅住的存储体系,尚不成熟。第5章标量处

37、理机1.解释一条机器指令的微操作可归并成虫損全、剑L和也任三部分。 顺序解释是指各指令之间顺序串行地进行,优点是控制简单,转入下条指令的指 回易于控制。执行K与分析K+1重叠(指令只拆分为分析和执行),这种指令分析部件和指令执行任 何时候都只有相邻中两条指令在重叠解释的方式为一次重叠”。优点比顺序执行时治 少,功能部件的利用率明显提高。主存空间数相关是相邻两条指令之间出现对主存同单元要求的先写而后读的关联。 只推后分析K+1的读0通用寄存器组相矣的处理,推后分析K+1和设置相矣专用通路,是解决重叠方式相 关处理的两种基本方法。前者是以降底速度为代价,使设备基本上不增加。简述指令重叠解释的概念及

38、实现重叠解释必须满足的要求(*背)指令的重叠解释是解释第K条指令的操作完成前,就可以开始解释第K+1条指令。指令重叠解释必须满足的要求1)要解决访主存的冲突2)要解决分析与执行操作的并行3)要解决分析与执行操作控制上的同步4)要解决指令间各种相关処理。在流水线中,无论是发生数相关,还是指令相关,或者会使地出错,或者会使建 查效率显著下降,必须加以正确处理。按流水功能的多少可以分为单功能流水线和多功能流水线。按多功能流水线的各段 是否允许同时用于多种连接流水又可分为静态流水线和动态流水线。静态流水线在 某一时间内只能按 M 功能连接流水。动态流水线的各功能段在同一时间内可按至 恒L运算或功能连接

39、。静态流水线和动态流水线分别(理解就可)(1)静态流水线在某一时间内各段只能按一种功能连接流水、只有等流水线全部流空, 才能切换成另一种功能连接流水。当一串相同运算的指令时-才可有效发挥静态流水 效能。在静态流计算机中,要求程序员编制出的程序应尽可能调整成有更多相同运算 的指令串,以提高其流水的效能。(2)动态流水线的各功能段在同一时间内可按不同运算或功能连接。对吞吐率和设备利 用率提高。但控制复杂,成本高。从计算机所具的数据表示角度,可认把流水线处理机分为标量流水机和矢量流水机。Amdahl 470V/6,IBM 360/91都是标量流水机。皿4是矢量流水机。IBM360/91解决流水控制的

40、途径在各寄存器中设置忙位标志来判断是否相关当寄存器正在使用时置该寄存器的忙 位标志为T,当寄存器被释放,其忙位标志清为0”,访问寄存器时先看忙位标志 如果为1表示相矣设置多条流水线让它们并行工作同时在分布各流水线的出入端上分别设置若干保 存站来缓冲存放信息-一口相关采用异步方式流动。通过分布设置的站号来控制相关专用通路的连接。相关专用通路采用总线方式,相关后通过更改站号来实现不同相关专用通路的连接,从统水线中各功能段之间是否有反馈回路的角度,可以把流水城分为线性流水线和 非线性流水线。标量流水处理机处理性能有吞吐量、加速比、堂室 。吞吐量:命=冲島f m是指令有的子过程数量n是功能部件加速比:

41、Sp=M效率:广啰矢量流水处理机采用技术是时间重叠。(因为指令是拆分,利月时间重叠同吋并发性 进行)重叠机器处理这些局部性相关的方法有两种。一种是推后后续指令对相关单元的谟, 直至在先的指令写入完成,另一种是设置相矣直接通路,将运算结果经相关直接通路 直接送入所需部件。全局性相关指的是已进入流水线的转移指令和其后续指令之间相关。处理办法有:使用猜测法加快和提前形成条件码采取延返转移加快短循环程序的处理任务在流水线中流动顺序的安排和控制可以有两种方式,一种是让任务流出流水线的 顺序保持与流入流水线的顺序一致,称为顺序流动方式或同步流动方式,另一种是 让流出流水线的任务顺序可以和流入流水线的顺序不

42、同,称异步流动方式。流水处理级可分为車级。部件级,处理机级,系统级。构成部件内的各个子部件间 的流水称为部件级流水。构成计算机的多个处理机之间的流水称为系统级流水,又 称宏流水,处理机的各部件之间的流水则称为处理机级流水。RISC与起后,出现了提高指令级并行的高性能超级处理机,代表性例子有超标量处理 机、超字於指令处理机(VUW)、超流水线处理机、超标量超潦量处理机。简述上述四种超级处理机差别。(有空就背)超标量処理机是利用资源重覆-设置多个执行部件寄存器端口。超长指令字处理机结构是将水平型微码和超标量处理两者相结合。指令字长可长达 数百位,多功能部件并发工作,共享大容量寄存器堆,其优点是每条

43、指令所需拍数比 超标量処理机少,指令译码容易,开发标量操作间的随机并行性更方便从而可使指 令级并行性较高。超流水栈是着重开发时间并行,在公共的硬件上采用较短的时钟周期深度流水提 高速度,需使用高速的时钟机制来实现。(开发时间的并行性)超标量超流水处理机是超标量流水线与超流水线处理机的结合。第6章矢量处理机矢量处理机包括J81业理.,矢暈纵向处理和矢量分组纵横処理既是矢量的处理方式, 也是矢量的流水処理方式。典型机型CRAY-1。CRAY-1提供仓个单功能部件是整数加、逻辑运算、移位、浮点加、浮点乘和浮点迭代 求倒数,其流水经过的时间分别为旦、2、4、互、Z和乌拍,每拍为&3代。访 存流水线建立

44、时间为互拍。访寄存器时间为丄拍。CRAY-1矢量处理机的一个显著特点是只要不出功能部件使用冲突和源矢量寄存器使 用冲突。求矢量D=Ax(B+C),矢量为浮点数,各矢量元素个数均为N,参照CRAY 一 1方式分解为3条矢量指令:(DV3 一存储器;访存取A送入V,寄存器组V2Vo+Vl ; B+CKV4*-V2xV3 : KXAD当采用下列3种方式工作时,各需多少拍才能得到全部结果?、和串行执行。22+3N和并行执行后,再执行。15+2N采用链接技术。16+N阵列处理机分两种不同的基本构形,一种是采用分布式存储器,另一种是集中式共 享存储器。分布式阵列机典型机型有I山AC IV。为了高速有效地处

45、理玉眞数据,分布式存储器阵列处理机要求能把数据合理地预分配 到各个处理单元的局部存储器中。阵列机所采用的技术是资源東复。利用的是并行性中的同时性,而不是并发性。阵列机是SIMD。求矢量累加=終。4),在SISD计算机FORTRAN程序,S=0,0DO 101=0,1510 S=S+A(I)需16次加法。现在阵列机递归算法,只需log216=4加法,即可同时求得前1个、前2 个、.、前16个元素之和。设原始数据A(i)分别存放在PE.的a单元,其中0,i S15。请写出阵列机上用成对递归相加求累计和的并行算法步骤。(背,会变有i和K数值)置全部PEi为活跃状态*0i15置全部日A(i)从PE,的

46、a单元读到相应PEi的累加寄存器RGA中 0i0i15将全部PE的(RGRJ经过互联网络各右传送2K步距*0!15令 j=2K-l置PEo-PEj为不活跃状态处理活跃状态的所有PE,执行RGA:=RGAi+(RGRj) J i 15K:=K+1(10偌K4则转回(4)置全部P&活跃状态*0i 0 i 是开发并行性中的并发性。多处理机的基本概念和要解决的技术问题在硬件结构上,它的多个处理机要用多个指令部件分别控制,通过共享主存或机间 互连网络实现异步通信在算法上,不限于矢量、数组处理,还要挖掘和实现更多通用算法中隐含的并行性在糸统管理上,要更多地依靠操作系统等软件手段,有效地解决资源分析和管理,

47、 特别是任务分配、处理机调度进程的同步和通信等问题-多处理系统中,要较好地解决动态的资源分配和任务调度,让各处理机的逾尽可能 均衡,并要防止疝,。多处理机的硬件结构分紧耦合和松耦合。紧耦合多处理机(一般用到)是通过共享主存实现处理机通信的,其通信速率受限于主 存频寛,紧翘合构型分处理机自带专用Cache和处理机不带专用Cache。松耦合不同处理机间或者通过通道互连实现通信,以共享某些外围设备,或者过 消息传送系统来交换信息。松耦合多处理机可分为层次型、非层次型两种不同的构 形。松耦合多处理机的每台处理机都有一个容量较大的局部存储器,用于存儲经常用的指 令和数据,以减少紧耦合系统中存在的访主存冲

48、突。松耦合多处理机适合做粗粒度 的并行计算。多理机互连形式険括一总线形式、环形互连形式、交叉开矣形式、多端口存储器形 式、蠕虫穿洞寻律网络、开尖枢纽结构形式。12-多处理机的主存一般都采用由多个模块构成的并行存储器“为减少访问主存冲突,采 用的方式一般是:并行多体交叉主存系统。多处理机的cache的一致性问题的解决办法(*背)解决进程迁移引起的多cache不致性,禁止进程迁移或者证挂起时靠硬件方法,将 改写过的信息块强制写回主存相应位置。以硬件为基础实现多cache的一致性-监视cache协议法和目录表法以软件为基础实现多cache的一致性,不把一些公用的可写数据存入cache中。并行算法按运

49、算基本对象,并行算法可分为数值型的和非数值型两类。并行算法按并行进程间的操作顺序不同,并行算法又分为同步型、异步型和独立型 3种。并行算法根据各处理机算任务的大小不同,并行算法又分为细粒度、中粒度和粗粒 度3种.细粒度并行算法一般指矢量或循环级的并行(小,尽量小通信)中粒度并行算法一般指较大的循环级并行,并确保这种并行的好処可以补偿因并行带来 的额外开销。粗粒度并行算法一般是指子任务级的并行。(大,复杂计算)简述任务粒度的大小对多处理机性能和效率的影响(*背)任务粒度过小,辅助开销大,系统效率低任务粒度过大、并行度低,性能不会太高要合理选择任务粒度大小、并使其尽可能均匀,还要采取措施减少辅助开

50、销以保 证系统性能随処理机数目的增大能有较提高多处理机操作系统分别有主从型、各自独立型和浮动型简述多处理机主从型操作系统的优缺点(有空就背)优点:结构比较简单整个管理程只在一个处理机上运行,一般都不必是可再入的, 只有一个处理机访问执行表,简化了管理控制的实现。缺点:对主处理机的可靠性要求较高,整个系统鼬不够灵活,如果主处理机负荷过 重,影响整个系统性能。主要应用在异构型多处理机上简述多处理机各自独立型操作系统的优缺点(有空就背)优点:很适合分布处理的模块化结构的特点,减少对大型控制专用机的需求。某个处理机发生故阵,不会引起整个系统瘫痪,有较高的可靠性。每台处理机都有其专用控制表格,使访问系统表格的冲突较少。同时控制逬程和用户进制一起进行调度能取得较高的系统效率 缺点:实现复杂。仍有一些共享表格,会增加共享表格的访问冲突,导致进程调度复杂某台处理机故障、要恢复和重新执行未完成工作困难要操作员干预整个系统的输人/输出结构的变换処理机负荷平衡比较困难各处理机的局部存储器都要放管理程序副本,降底存储器的利用率。 主要应用在松耦合処理机。简述多处理机浮动型操作系统的优缺点(有空就背)优点资源可以较好地做到负荷平衡I/O中断可交由某段时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论