计算机系统结构(习题补充例题与练习)ppt课件_第1页
计算机系统结构(习题补充例题与练习)ppt课件_第2页
计算机系统结构(习题补充例题与练习)ppt课件_第3页
计算机系统结构(习题补充例题与练习)ppt课件_第4页
计算机系统结构(习题补充例题与练习)ppt课件_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1v存在的问题存在的问题v大多数同窗较仔细,少数不太仔细、有抄袭景象大多数同窗较仔细,少数不太仔细、有抄袭景象v关于参考答案,要知其然,更要知其所以然关于参考答案,要知其然,更要知其所以然v第第5、7两题两题v了解透明性的含义了解透明性的含义v掌握计算机系统构造、组成、实现研讨的范围,掌握计算机系统构造、组成、实现研讨的范围,P6、7v凡编写机器言语和汇编言语要用到的数据表示、指凡编写机器言语和汇编言语要用到的数据表示、指令系统、存放器令系统、存放器对计算机系统构造都是不透明的对计算机系统构造都是不透明的v凡是只影响系统速度和价钱的逻辑实现计算机组成凡是只影响系统速度和价钱的逻辑实现计算机组成

2、和物理实现计算机实现对系统构造都是透明的和物理实现计算机实现对系统构造都是透明的2v第第5题:哪些对计算机系统构造是透明的题:哪些对计算机系统构造是透明的v存储器的模存储器的模m交叉存取:目的加快存储器速度,透明交叉存取:目的加快存储器速度,透明v浮点数据表示:硬件可直接识别的数据类型,不透明浮点数据表示:硬件可直接识别的数据类型,不透明vI/O是通道方式还是处置机方式:是通道方式还是处置机方式:I/O方式选择属于系统构造,方式选择属于系统构造,不透明不透明v阵列运算部件多个一样运算部件阵列陈列:加快运算速度,阵列运算部件多个一样运算部件阵列陈列:加快运算速度,透明透明v数据总线宽度:只影响数

3、据传输速度,不影响功能,透明数据总线宽度:只影响数据传输速度,不影响功能,透明v通道类型结合、独立:功能一样、速度不同,透明通道类型结合、独立:功能一样、速度不同,透明v访问方式维护:属于系统构造,不透明访问方式维护:属于系统构造,不透明v程序性中断:属于系统构造,不透明程序性中断:属于系统构造,不透明v控制方式串行、流水等:仅影响速度,透明控制方式串行、流水等:仅影响速度,透明v堆栈指令:指令系统属于系统构造,不透明堆栈指令:指令系统属于系统构造,不透明v存储器最小编址单位:属于系统构造,不透明存储器最小编址单位:属于系统构造,不透明vCache存储器:为了提高存储系统速度,组原课中细讲的,

4、透存储器:为了提高存储系统速度,组原课中细讲的,透明明3v第第5题:从机器汇编言语看哪些是透明的题:从机器汇编言语看哪些是透明的v指令地址存放器:指的是程序计数器指令地址存放器:指的是程序计数器PC,80X86中为中为IP,相,相对转移指令中用到,不透明对转移指令中用到,不透明v指令缓冲器:缓冲和排队技术属于计算机组成,透明指令缓冲器:缓冲和排队技术属于计算机组成,透明v时标发生器:产生系统时钟,汇编言语不能控制的详细硬件,时标发生器:产生系统时钟,汇编言语不能控制的详细硬件,透明透明v条件码存放器:存放转移条件,也叫程序外形字条件码存放器:存放转移条件,也叫程序外形字PSW,是条,是条件转移

5、指令的测试条件,不透明件转移指令的测试条件,不透明v乘法器:汇编言语不能控制的详细硬件,透明乘法器:汇编言语不能控制的详细硬件,透明v主存地址存放器:也称存储器地址存放器主存地址存放器:也称存储器地址存放器MAR,透明,透明v磁盘外设:磁盘外设:I/O指令可直接对其操作经过端口号,不透明指令可直接对其操作经过端口号,不透明v先行进位链:提高加法器运算速度的,组原和数字逻辑中学到,先行进位链:提高加法器运算速度的,组原和数字逻辑中学到,汇编言语不能控制的详细硬件,透明汇编言语不能控制的详细硬件,透明v通用存放器、中断存放器中断呼应、优先级、屏蔽等:程通用存放器、中断存放器中断呼应、优先级、屏蔽等

6、:程序中要用到,不透明序中要用到,不透明4v第8题v掌握三个公式11()iniiniiiNNCPIICPICPIIII661010NcEIfMIPSTCPIv第第11题题v优化之后各类指令所占比例,优化之后各类指令所占比例,ALU指令的减少也导致总指令指令的减少也导致总指令数减少数减少v优化后算术运算指令所占比例优化后算术运算指令所占比例v从从MIPS之比得出的结论:之比得出的结论:v减少减少ALU指令的比例会使速度变慢指令的比例会使速度变慢v减少运用频率高的指令会使速度变慢减少运用频率高的指令会使速度变慢v减少速度快的指令的比例会使速度变慢减少速度快的指令的比例会使速度变慢610MIPSIT

7、NE43% 0.521.527.39%1 43% 0.578.55niiilpL1iniippH12logvOPOP编码的目的编码的目的v平均长度短冗余小平均长度短冗余小v编码规整长度种类少编码规整长度种类少v最短平均长度信息源熵:最短平均长度信息源熵:v v信息冗余量信息冗余量v实际长度实际长度-H-H/ /实际长度实际长度vHuffmanHuffman编码编码v平均长度最短的方案平均长度最短的方案v编码不独一,但长度确定编码不独一,但长度确定v每次选择两个最小值节点每次选择两个最小值节点v v非叶子结点值相加非叶子结点值相加6v扩展编码扩展编码v等长、不等长等长、不等长vX-Y-ZX-Y-

8、Z、X/Y/ZX/Y/Zv短编码不能是长编码的前缀短编码不能是长编码的前缀v一定要用短编码表示频率高的指令一定要用短编码表示频率高的指令v变址位移量变址位移量v补码表示补码表示-2n-1-2n-12n-1-12n-1-1v指令类型指令类型vR-RR-R:速度快,给频率高的指令运用:速度快,给频率高的指令运用vM-MM-M7v第第3题题10条指令条指令v第第2问:要求问:要求OP平均长度最短,那么一定是平均长度最短,那么一定是Huffman编码画编码画Huffman树时要留意,确保每次选两个概率最小的,树时要留意,确保每次选两个概率最小的,2.7v第第3问:问: OP平均长度最短的扩展编码不一定

9、是等长扩展,平均长度最短的扩展编码不一定是等长扩展,终究哪种最短,要一个一个去试,此题可以试一下终究哪种最短,要一个一个去试,此题可以试一下2-5、2-4、3-4,结果结果2-5最短,最短,2.9v第第4问:问: OP平均长度最短的等长扩展编码,只需思索平均长度最短的等长扩展编码,只需思索2-41-2不可以、不可以、3-6太长,太长,2.92v第第5题三地址题三地址12条,单地址条,单地址254条,总长条,总长16位,每个地址位,每个地址4位位v4-8-12等长扩展,等长扩展,12/X/254v假设不思索单地址指令,那么二地址最多假设不思索单地址指令,那么二地址最多416=64条条v思索单地址

10、指令,每预留一个二地址指令码点,那么可以扩展思索单地址指令,每预留一个二地址指令码点,那么可以扩展16条单地址指令,要使单地址指令到达条单地址指令,要使单地址指令到达254条,那么应预留条,那么应预留254/16=15.9个二地址指令码点个二地址指令码点v因此,二地址最多可以设计因此,二地址最多可以设计64-16=48条条8v第第6题题9条指令,条指令,8位位R-R、16位位R-M两种两种指令字长指令字长v第第1问:问:OP平均长度最短的扩展编码,与第平均长度最短的扩展编码,与第3题类似,题类似,2-4、2-5比较后可知,比较后可知,2-5平均长度最短,平均长度最短,2.9v第第2问:为提高速

11、度,应将运用频率高的指令安排成问:为提高速度,应将运用频率高的指令安排成R-R型,为减少存储容量,应将运用频率高的指令安排型,为减少存储容量,应将运用频率高的指令安排成短成短OP2位,因此位,因此R编码占编码占3位,可以表示位,可以表示8个通用个通用存放器存放器v第第3、4问:通用存放器做变址存放器,那么变址位移问:通用存放器做变址存放器,那么变址位移量只能是量只能是5位位16位位-5位位OP-3位位R-3位位X,偏移范围,偏移范围-1615补码补码9v1、假设某机要求有:、假设某机要求有:3地址指令地址指令4条,单地址指令条,单地址指令255条,条,0地地址指令址指令16条。设指令字长为条。

12、设指令字长为12位,每个地址码为位,每个地址码为3位。问能否用位。问能否用扩展操作码为其编码?单地址指令为扩展操作码为其编码?单地址指令为254条呢?请阐明理由。条呢?请阐明理由。v3-9-12不等长扩展,不等长扩展, 4/255/16; 4/254/16v假设不思索假设不思索0地址指令,那么单地址最多地址指令,那么单地址最多426=256条条v思索思索0地址指令,每预留一个单地址指令码点,那么可以扩展地址指令,每预留一个单地址指令码点,那么可以扩展8条单地址指令,要使条单地址指令,要使0地址指令到达地址指令到达16条,那么应预留条,那么应预留16/8=2个个单地址指令码点单地址指令码点v因此

13、,单地址最多可以设计因此,单地址最多可以设计256-2=254条条v4/255/16v4/254/1610v2、某机指令字长为、某机指令字长为16位。设有单地址指令和双地址指令两类。位。设有单地址指令和双地址指令两类。假设每个地址字段均为假设每个地址字段均为6位,且双地址指令有位,且双地址指令有x条。问单地址指条。问单地址指令可以有多少条?令可以有多少条?v4-10扩展扩展v双地址指令剩余双地址指令剩余16-x个码点作扩展标志个码点作扩展标志v共可扩出单地址指令共可扩出单地址指令16-x26条条11v某处置机的指令字长为某处置机的指令字长为16位,有位,有2地址指令、地址指令、1地址地址指令和

14、指令和0地址指令地址指令3类,每个地址字段的长度均为类,每个地址字段的长度均为6位。位。v假设假设2地址指令有地址指令有15条,条,0地址指令和地址指令和1地址指令的条地址指令的条数根本相等,那么数根本相等,那么0地址指令和地址指令和1地址指令各有多少条?地址指令各有多少条?为为3类指令分配操作码。类指令分配操作码。v假设要求假设要求3类指令条数的比例为类指令条数的比例为1:9:9。那么。那么3类指类指令的条数各有多少条?为令的条数各有多少条?为3类指令分配操作码。类指令分配操作码。12v用于文字处置的某公用机,每个文字字符用4位十进制数0-9编码表示,空格用-表示,在对传送的文字符和空格进展

15、统计后,得出其出现的概率为:v假设上述数字和空格均用二进制编码,试设计二进制信息位平均长度最短的编码。v假设传送106个文字符号每个文字符号后均跟一个空格,按最短编码,共需传送多少个二进制位?v假设十进制数字和空格均用4位二进制码表示,共需传送多少个二进制位?-01234567890.20.170.060.080.110.080.050.080.130.030.01(文字)(文字)- (文字)(文字)- (文字)(文字)13v计算机中优化运用的操作码编码方法是计算机中优化运用的操作码编码方法是 vA、Huffman编码编码 B、ASCII码码vC、BCD码码 D、扩展编码、扩展编码v支持动态再

16、定位的寻址方式是支持动态再定位的寻址方式是 vA、基址寻址、基址寻址 B、间接寻址、间接寻址vC、变址寻址、变址寻址 D、间接寻址、间接寻址v变址寻址的主要作用是变址寻址的主要作用是 vA、支持程序的动态定位、支持程序的动态定位 B、支持访存地址的越界检查、支持访存地址的越界检查vC、支持向量、数组的运算寻址、支持向量、数组的运算寻址 D、支持、支持OS的进程调度的进程调度v对系统程序员不透明的是对系统程序员不透明的是 vA、Cache B、系列机各档不同的数据通路宽度、系列机各档不同的数据通路宽度vC、指令缓冲存放器、指令缓冲存放器 D、虚拟存储器、虚拟存储器14v对运用程序员不透明的是对运

17、用程序员不透明的是 vA、先行进位链、先行进位链 B、乘法器、乘法器vC、指令缓冲存放器、指令缓冲存放器 D、条件码存放器、条件码存放器v计算机系统构造不包括计算机系统构造不包括 vA、主存速度、主存速度 B、机器义务外形、机器义务外形vC、信息维护、信息维护 D、数据表示、数据表示v判别题判别题v系统能否设置浮点指令对计算机系统构造是透明的。系统能否设置浮点指令对计算机系统构造是透明的。v存储器采用单体单字,还是多体交叉存取,对系统构造设计应是透明的。存储器采用单体单字,还是多体交叉存取,对系统构造设计应是透明的。v系列机添加新型号时,为添加寻址灵敏性和缩短平均指令字长,由原等长系列机添加新

18、型号时,为添加寻址灵敏性和缩短平均指令字长,由原等长操作码改为有多种码长的扩展操作码。操作码改为有多种码长的扩展操作码。v对概率不等的事件用对概率不等的事件用Huffman编码,其详细编码不独一,但平均长度一定编码,其详细编码不独一,但平均长度一定是独一的,且是最短的。是独一的,且是最短的。15v4、直接利用公式:P51vTa= fi(HiTc+(1- Hi)Tm)+(1- fi)( HdTc+(1- Hd) Tm)=22.16nsvfi=20%、Tc=20ns、Tm=80ns、Hi=98%、Hd=96%v10、v页面失效的虚页号:装入位为0的虚页,1、2、5、6v由虚地址计算实地址:v虚地址

19、页面大小虚页号页内位移v由虚页号查页表得实页号v实地址=实页号页面大小页内位移v809610247928v310249284000v页面失效的无实地址虚页号虚页号 0 1 2 3 4 5 6 7实页号实页号 2 3 1 0 1 0 2 3装入位装入位 1 0 0 1 1 0 0 116v补充:某段页式虚拟存储器,虚地址由2位段号、2位页号和11位页内位移组成,主存容量32KB,每段可有访问方式维护,其页表和维护位如下表所示。v此地址空间中共有多少虚页v当程序中遇到以下情况时,由虚地址计算实地址,阐明哪个会发生段失效、页失效和维护失效。段号段号段段0段段1段段2段段3访问方式访问方式只读只读可读

20、可读/执行执行可读可读/写写/执行执行可读可读/写写虚页虚页0所在位置所在位置实页实页9在辅存上在辅存上页表不在内页表不在内存存实页实页14虚页虚页1所在位置所在位置实页实页3实页实页0实页实页1虚页虚页2所在位置所在位置在辅存上在辅存上实页实页15实页实页6虚页虚页3所在位置所在位置实页实页12实页实页8在辅存上在辅存上17方式方式段段页页页内位移页内位移取数取数011取数取数1112取数取数332047存数存数014存数存数212存数存数1014转移至此转移至此13100取数取数0250取数取数205转移至此转移至此3060l由主存容量为由主存容量为32KB,可知实地址:,可知实地址:实页

21、号(实页号(4) 页内位移(页内位移(11)l虚地址:虚地址:段号段号(2)页号页号(2)页内位移(页内位移(11)l页面大小:页面大小:211=2048Bl实地址计算方法同上实地址计算方法同上l页表不在主存内的段页表不在主存内的段2发生段失效发生段失效l页面在辅存上的发生页失效页面在辅存上的发生页失效l取数表示读,取出的数不能作为取数表示读,取出的数不能作为指令执行;只读单元不能写、执行;指令执行;只读单元不能写、执行;转移至此为执行,不能读、写,访转移至此为执行,不能读、写,访问不当的为维护方式失效问不当的为维护方式失效18方式方式段段页页页内位移页内位移段失效段失效页失效页失效实页号实页

22、号实地址实地址保护失效保护失效取数取数011无无无无36145无无取数取数1112无无无无010无无取数取数332047无无有有无无无无/存数存数014无无无无36148有有存数存数212有有/无无无无/存数存数1014无无有有无无无无/转移至此转移至此13100无无无无816484无无取数取数0250有有有有无无无无/取数取数205无无/无无无无/转移至此转移至此3060无无无无1428732有有19v第9题vA1+A2+ A3+A4+ A5+A6+ A7+A8+ A9+A10123456789123456789123456789123456789123456789123456789TP=9

23、/21t=3/7tSp=95/21=2.14E=95/215=42.9%81510152120v第10题:静态流水线vA1B1+A2B2+A3B3+A4B4+A5B5+A6B612345678910111234561234567891011789101112345678910111234567891011122请改为动态流水线练习请改为动态流水线练习12345621v第12题v动态流水线va1b1+a2b2+a3b3+a4b4+a5b5+a6b6+a7b7+a8b812345678一一 二二 三三 四四五五六六七七一一 二二 三三 四四五五六六七七一一 二二 三三 四四五五六六七七123456

24、781234567812345678一一 二二 三三 四四五五六六七七123请改为静态流水线练习请改为静态流水线练习12345622v第第14题题v制止向量延迟制止表制止向量延迟制止表=1,3,4,8v原始冲突向量原始冲突向量=10001101v外形转移图略外形转移图略v最大吞吐率的调度方案最大吞吐率的调度方案2,5,吞吐率,吞吐率=1/3.5v输入输入6个义务的实际吞吐率:个义务的实际吞吐率:6/9+2+5+2+5+2=6/25v补:有长度为补:有长度为8的向量的向量A和和B,分别画出在以下,分别画出在以下4中构造的处置器上求点积的中构造的处置器上求点积的时空图时空图v有一个乘法部件和一个加

25、法部件,不能同时义务,部件内部采用顺序方式,有一个乘法部件和一个加法部件,不能同时义务,部件内部采用顺序方式,完成一次加、乘需求完成一次加、乘需求5拍拍v同上,只是乘法器和加法器可以并行义务同上,只是乘法器和加法器可以并行义务v有一个乘、加双功能静态流水线,均由有一个乘、加双功能静态流水线,均由5段组成,每段段组成,每段1拍拍v有乘、加两条流水线,可并行义务,每段有乘、加两条流水线,可并行义务,每段1拍拍23v解v1v2(a1b1+a2b2)+a3b3)+a4b4)+a5b5)+a6b6)+a7b7)+a8b8加加乘乘54075加加乘乘54045243静态双功能流水线(a1b1+ a2b2)+

26、(a3b3+ a4b4)+(a5b5+ a6b6)+(a7b7 + a8b8)9101112131415910111213141591011121314159101112131415910111213141512345678123456781234567812345678123456781230254两条流水线可同时义务(a1b1+ a2b2)+ a7b7+ (a5b5+ a6b6)+(a3b3+ a4b4)+ a8b8910111213141591011121314159101112131415910111213141591011121314151 2 3 4 5 6 7 81 2 3 4

27、5 6 7 81 2 3 4 5 6 7 81 2 3 4 5 6 7 81 2 3 4 5 6 7 8122626v有一条静态加、乘多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2t,其他段为t,而且流水线的输出可以直接前往到输入端或暂存于相应的流水线存放器中,如今要在该流水线上计算 ,画出其时空图,并计算其吞吐率、加速比和效率。v有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2t,其他段为t,而且流水线的输出可以直接前往到输入端或暂存于相应的流水线存放器中,如今要在该流水线上计算 ,画出其时空图,并计算其吞吐

28、率、加速比和效率。41()iiiAB41iiiA B27v有一条动态多功能流水线由6段组成,其中1、4、5、6段组成乘法流水线,1、2、3、6段组成加法流水线,各流水段的时间均为50ns,假设流水线的输出可以直接前往到输入端,而且有足够的缓冲存放器,如今要用最快的方式在该流水线上计算 ,画出其时空图,并计算其吞吐率、加速比和效率。51iiiix y z28v有一5段流水线,各段执行时间均t,其商定表如下:v画出流水线义务调度的外形转移图v分别求出允许不等时间间隔的调度和等时间间隔的调度的两种最优调度战略,以及这两种调度战略的流水线最大吞吐率v假设延续输入10个义务,求这两种调度战略的实际吞吐率

29、和加速比 时间时间功能段功能段1234567S1S2S3S4S529v以下关于标量流水机的说法不正确的选项是以下关于标量流水机的说法不正确的选项是 vA、可对标量进展流水处置、可对标量进展流水处置 B、没有向量数据表示、没有向量数据表示vC、不能对向量数据进展运算、不能对向量数据进展运算 D、可以对向量、数组进展运、可以对向量、数组进展运算算v以下说法不正确的选项是以下说法不正确的选项是 vA、线性流水线是单功能流水线、线性流水线是单功能流水线 B、动态流水线是双功能、动态流水线是双功能流水线流水线vC、静态流水线是多功能流水线、静态流水线是多功能流水线 D、动态流水线只能是单、动态流水线只能

30、是单功能流水线功能流水线v静态流水线是指静态流水线是指 vA、只需一种功能的流水线、只需一种功能的流水线 B、可同时执行多种功能、可同时执行多种功能的流水线的流水线vC、同时只能完成一种功能的多功能流水线、同时只能完成一种功能的多功能流水线 D、功能不能改、功能不能改动的流水线动的流水线v非线性流水线是指非线性流水线是指 vA、一次运算中运用流水线的多个功能段、一次运算中运用流水线的多个功能段vB、一次运算中要多次运用流水线的某些功能段、一次运算中要多次运用流水线的某些功能段vC、流水线中某些功能段在各次运算中的作用不同、流水线中某些功能段在各次运算中的作用不同vD、流水线中的各个功能段在各种

31、运算中有不同的组合、流水线中的各个功能段在各种运算中有不同的组合30v与流水线最大吞吐率高低有关的是与流水线最大吞吐率高低有关的是 vA、各个子过程的时间、各个子过程的时间 B、最快子过程的时间、最快子过程的时间vC、最慢子过程的时间、最慢子过程的时间 D、最后子过程的时间、最后子过程的时间v在流水线中,全局相关是指在流水线中,全局相关是指 vA、先写后读相关、先写后读相关 B、先读后写相关、先读后写相关vC、指令相关、指令相关 D、由转移指令引起的相关、由转移指令引起的相关v流水机器对全局相关的处置不包括流水机器对全局相关的处置不包括 vA、猜测法、猜测法 B、提早构成条件码、提早构成条件码

32、vC、加快短循环程序的执行、加快短循环程序的执行 D、设置相关公用通路、设置相关公用通路vCRAY-1向量机要实现指令的链接,必需满足的条件是向量机要实现指令的链接,必需满足的条件是 vA、源向量一样,功能部件不冲突,有指令相关、源向量一样,功能部件不冲突,有指令相关vB、源向量不同,功能部件一样,无指令相关、源向量不同,功能部件一样,无指令相关vC、源向量、功能部件都不同,指令有先写后读相关、源向量、功能部件都不同,指令有先写后读相关vD、源向量、功能部件都不同,指令有先读后写相关、源向量、功能部件都不同,指令有先读后写相关31vCRAY-1机启动存储器、流水部件及存放器打入各需机启动存储器

33、、流水部件及存放器打入各需1拍,拍,“加加6拍、拍、“乘乘7拍、拍、“访存访存6拍,以下向量指令串中的向量长度拍,以下向量指令串中的向量长度均为均为N,那么指令串最短的执行时间是,那么指令串最短的执行时间是 拍拍v V3存储器存储器v V4V0+V1v V2V4*V3vA、N+19 B、N+18 C、N+17 D、N+16vCRAY-1的两条向量指令属于的两条向量指令属于 v V1V2+V3v V4V1*V5vA、没有功能部件冲突和源向量冲突,可以并行、没有功能部件冲突和源向量冲突,可以并行vB、没有功能部件冲突和源向量冲突,可以链接、没有功能部件冲突和源向量冲突,可以链接vC、没有源向量冲突

34、,可以交换顺序执行、没有源向量冲突,可以交换顺序执行vD、有向量存放器冲突,只能串行、有向量存放器冲突,只能串行32v4、32个处置器,编号个处置器,编号031,11号处置器与哪个相连号处置器与哪个相连vCube3:11D=01011B,00011B = 3D,3号号vPM2+3:11+23mod 32 = 19,19号号vPM2-4:11-24mod 32 = 27,27号号vShuffle:01011B循环左移一位循环左移一位=10110B=22D,22号号vButterfly:01011B最高位与最低位交换最高位与最低位交换=11010B=26D,26号号vShuffle(shuffle

35、): 01011B循环左移二位循环左移二位=01101B=13D,13号号vShuffle(Cube0 (PM2-1): 11-21mod 32 = 9D=01001B,再最低位取反得再最低位取反得01000B,最后循环左移一位得:,最后循环左移一位得:10000B=16D,16号号v7、256个个PE的的SIMD机器,采用全混洗互连函数,混洗机器,采用全混洗互连函数,混洗10次后,次后,197号号PE与哪个与哪个PE相连相连v197D=11000101B8位,由于共位,由于共256个个PEv循环右移循环右移10次相当于次相当于2次,由于共次,由于共8位为:位为:00010111B=23D,2

36、3号号33v18、32个处置器的5log232级STARAN网,当级控制信号为10110从右至左分别控制第0级至第4级时,17号处置器衔接哪个处置器v根据STARAN网作为交换网络的特点,某级控制信号为1,就实现了某个Cubei,因此此题实现Cube4+Cube2+Cube1功能v17D=10001B,第4、2、1位取反后为00111B=7D,7号v19、16个处置器,先8组2元交换、再4组4元交换,最后2组8元交换,写出互连函数v输入: 0 1 2 3 4 5 6 7 8 9 A B C D E Fv8组2元交换:1 0 3 2 5 4 7 6 9 8 B A D C F Ev4组4元交换:

37、2 3 0 1 6 7 4 5 A B 8 9 E F C Dv2组8元交换:5 4 7 6 1 0 3 2 D C F E 9 8 B A输出v可见实现了Cube2+Cube0v互连函数表达式:01230123)(PPPPPPPPCube34v补:补:N=16的的STARAN网在级控制下实现分组交换置换,假照网在级控制下实现分组交换置换,假照实现的分组交换置换是:首先是实现的分组交换置换是:首先是4组组4元交换,然后是元交换,然后是2组组8元交元交换,最后是换,最后是1组组16元交换,请写出网络实现的互连函数。元交换,请写出网络实现的互连函数。v0 1 2 3 4 5 6 7 8 9 A B

38、 C D E Fv3 2 1 0 7 6 5 4 B A 9 8 F E D Cv4 5 6 7 0 1 2 3 C D E F 8 9 A BvB A 9 8 F E D C 3 2 1 0 7 6 5 4 v(0 B)(1 A)(2 9)(3 8)(4 F)(5 E)(6 D)(7 C)vCube3+Cube1+Cube0v补:用一个补:用一个N=8的的3级级Omega网络衔接网络衔接8个处置机个处置机P0P7,假,假设设P6要把数据广播给要把数据广播给P0P4,假设,假设P3要把数据广播给要把数据广播给P5P7,能否同时实现广播要求,画出开关外形图。能否同时实现广播要求,画出开关外形图。

39、35v能能 0 0 2 2 1 1 3 3 4 4 6 6 5 5 7 7 0 0 2 2 1 1 3 3 4 4 6 6 5 5 7 7 0 0 4 4 1 1 5 5 2 2 6 6 3 3 7 7 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 I I J J K K L L 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 入入 端端 出出 端端 0 0 4 4 1 1 5 5 2 2 6 6 3 3 7 7 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 2 2 级级 1 1

40、 级级 0 0 级级 A A B B C C D D E E F F G G H H 36v补:对于采用级控制的补:对于采用级控制的3级立方体互连网络,当第级立方体互连网络,当第i级为直连外级为直连外形时,不能实现哪些节点之间的通讯?为什么?反之,当第形时,不能实现哪些节点之间的通讯?为什么?反之,当第i级级为交换外形呢?为交换外形呢?v由于第由于第i级为交换外形时,实现的是级为交换外形时,实现的是cubei互连函数,所以互连函数,所以v第第i级为直连外形时,不能实现第级为直连外形时,不能实现第i位取反的节点间的通讯位取反的节点间的通讯v第第i级为交换外形时,不能实现第级为交换外形时,不能实现

41、第i位不变的节点间的通讯位不变的节点间的通讯37v5、v13条指令全并行,条指令全并行,72拍乘法最慢:拍乘法最慢:1+7+1+63v21、2并行与并行与3链接,要求链接,要求1比比2早启动早启动1拍,否那么不能与拍,否那么不能与3链接,链接,v 80拍拍1+7+1+1+6+1+63v31、2并行,并行,3、4链接,链接,1、2和和3、4之间串行。之间串行。v 151拍拍1+6+1+63+1+6+1+1+7+1+63v41、2、3两级链接与两级链接与4串,串,v 166拍拍1+6+1+1+14+1+1+6+1+63+1+6+1+63v51、2并与并与3链接,要求链接,要求2比比1早启动早启动1

42、拍,否那么不能与拍,否那么不能与3链接,链接,v 151拍拍 1+7+1+1+6+1+63+1+6+1+63v61、2并,并,2与与3链接,链接,4与与3串行,串行,v 152拍拍1+6+1+1+7+1+63+1+7+1+63 38v8、参考例6.8v设平均数度为Ra,可向量化比例为x,那么有v要使Ra=6,那么x=83.3%v也可以直接利用amdhal定律, P19,fnew=x, rnew=10/2=5v要使Ra=6,那么Sp=6/2=3,那么x=83.3%xxxRa4510)1 (211011xxxSp8 . 0115/)1 (139v9、v设标量速度为Rs,平均速度为为Ra,可向量化比例为x,加速比为SP,那么有v要使SP=2,那么X=55.6%v也可以直接利用Aamdhal定律,P19,fnew=x, rnew=10 xRsxRsRsxRsxRsRsRaSp9101091010)1 (11011xxxSp9 . 01110/)1 (140v10、用本人学过的、用本人学过的C言语描画言语描画vfor(i=1;i=32;i+)v Ci=Ai+Bi;vlen=16vfor(i=1;i=5;i+)vv for(j=1;j=len:j+)v Cj=Cj+Cj+len;v len=len/2;v41vILLIAC 阵列处置机中,阵列处置机中,PE之间所用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论