南开21春学期《并行程序设计》在线作业-答案_第1页
南开21春学期《并行程序设计》在线作业-答案_第2页
南开21春学期《并行程序设计》在线作业-答案_第3页
南开21春学期《并行程序设计》在线作业-答案_第4页
南开21春学期《并行程序设计》在线作业-答案_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

21春学期(1709-2103)《并行程序设计》在线作业提示:南开大学课程学习已经开启,本套试卷是课程学习辅导资料,只作参考学习使用!!!一、单选题(共50道试题,共100分)1.在下列应用中,SIMD最不适合____。A.图像处理B.音频处理C.科学计算D.数据库查询[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D2.MPI默认点对点通信模式是____。A.阻塞的B.非阻塞的C.对等的D.主从的[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A3.对奇偶转置排序进行OpenMP并行化,第一种策略是直接对内层循环使用ompparallelfor指令,第二种策略是对外层循环使用ompparallel指令,对内层循环使用ompfor指令,后者相对于前者的优点是____。A.保持了数据依赖B.消除了大量线程创建、销毁开销C.有利于负载均衡D.减少了线程间交互[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B4.单程序多数据流模式是针对____架构的。A.SISDB.SIMDC.MISDD.MIMD[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D5.for(i=0;i<16;i+=1){L=A[i+0]–B[i+0];D=D+abs(L);},此循环____。A.可完全向量化B.不可向量化C.不确定D.可部分向量化[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D6.MPI原址收发各一条消息的API是_____。A.MPI_SendrecvB.MPI_SendC.MPI_RecvD.MPI_Sendrecv_Replace[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D7.SSE是____平台的SIMD架构。A.x86B.POWERC.SPARCD.ARM[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A8.以下超级计算机中,____不是SIMD架构。A.CDCSTAR-100B.757C.银河D.天河1号[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D9.对于搜索分解,下面哪个说法是错误的_____。A.所有子树搜索任务都必须全部完成B.工作量可能大于串行计算C.工作量可能小于串行计算D.可能产生超线性加速比[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A10.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。A.初始化B.第二个矩阵转置循环C.矩阵元素乘—加计算的循环D.结果输出[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C11.OpenMP默认采用____循环划分策略。A.静态B.固定C.动态D.自适应[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A12.为缓解存储和CPU之间的性能差距,常见的技术手段不包括____。A.利用cache降低访存延迟B.利用多线程隐藏访存延迟C.利用预取隐藏访存延迟D.采用大容量内存提高访问速度[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D13.在矩阵乘法之前将第二个矩阵转置,其作用不包括____。A.增大访存空间局部性B.减少运算次数C.优化SIMD访存D.以上皆错[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B14.MPI组通信操作不包括哪类____。A.通信B.同步C.点对点D.计算[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C15.OpenMP中指定多线程中只有主线程执行代码块的指令是____。A.ompsingleB.ompmasterC.ompslaveD.ompparallel[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B16.Pthread支持____。A.线程间同步B.发现数据依赖C.自动线程化D.自动任务分配[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A17.主线程创建了4个从线程然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序____。A.必然主线程前、从线程后B.必然从线程前、主线程后C.必然相互交织D.各种顺序皆有可能[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D18.AVX是____平台的SIMD架构。A.x86B.POWERC.SPARCD.ARM[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A19.控制流语句进行SIMD并行化很困难的原因是控制流语句导致____。A.连续数据执行不同指令B.连续数据执行相同指令C.同一数据执行不同指令D.同一数据执行相同指令[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A20.编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。A.2B.4C.8D.16[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B21.一个Neon寄存器最多存放____个双精度浮点数。A.2B.4C.8D.16[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A22.在共享内存架构编程中,线程间不能通过____进行通信A.全局变量B.局部变量C.静态变量D.全局堆中变量[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B23.CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为A.8MFlopsB.125MFlopsC.1GFlopsD.4GFlops[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A24.在128位的SIMD寄存器中,我们不能保存____。A.16个8位整数B.8个16位短整型C.4个32位整型D.16个字符的字符串[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D25.采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。A.按编号顺序依次从从进程接收结果B.按编号逆序依次从从进程接收结果C.按编号顺序、逆序交替从从进程接收结果D.使用MPI_ANY_SOURCE和MPI_ANY_TAG[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D26.两个矩阵相乘,当矩阵规模大于cache大小时,平凡算法的问题是____。A.第一个矩阵访存时间局部性差B.第一个矩阵访存空间局部性差C.第二个矩阵访存时间局部性差D.第二个矩阵访存空间局部性差[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D27.MPI_Send和MPI_recv是通过____区分消息。A.端口号B.消息名C.消息标签D.消息哈希[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C28.我国最近一次夺得全球超级计算机计算能力冠军的是____。A.天河1号B.天河1AC.天河2号D.神威.太湖之光[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D29.两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_____达到更高的cache命中率。A.时间局部性B.空间局部性C.计算局部性D.混合局部性[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A30.关于pthread_create函数,下列说法错误的是____。A.它返回是线程创建成功与否的错误码B.线程属性参数使用空指针表示使用默认参数C.它成功创建线程后立刻执行线程函数等待其结束后返回D.可通过它将参数传递给线程函数[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C31.下面矩阵运算中,哪个进行简单的数据并行效果不佳____。A.矩阵求和B.矩阵相乘C.矩阵向量相乘D.高斯消去[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D32.SSEintrinsics_mm_load_ss命令的功能是____。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐标量读取单精度浮点数D.未对齐标量读取单精度浮点数[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C33.关于并行代价,下面描述正确的是____。A.总是小于串行时间B.总是大于并行时间C.总是与并行时间渐进相等D.以上皆错[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D34.每个AVX寄存器宽度为____位。A.32B.64C.128D.256[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D35.SSE运算指令中未提供____指令。A.算术运算B.矩阵运算C.逻辑运算D.比较运算[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B36.记并行时间为T,串行时间为T',处理器数量为p,则额外开销应如何计算?A.T'-TB.T-T'C.pTD.pT-T'[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:D37.使用____无法直接实现“主线程等待4个从线程完成任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C38.指定线程间划分循环策略的OpenMP子句是____。A.sharedB.reductionC.scheduleD.nowait[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C39.下列哪项不是这门课程的目标?A.学会肯定能优化程序性能的方法B.学会用并行思维思考问题C.学会常用的并行编程工具D.理解软件到并行架构的映射[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A40.下面哪个问题相对而言更不适合进行数据并行____。A.求和B.排序C.向量加法D.矩阵乘法[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B41.下面哪种架构最适合数据并行____。A.SISDB.SIMDC.MISDD.MIMD[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B42.为防止编译器不支持OpenMP,应使用____实现OpenMP代码和普通代码的条件编译。A."#include"B."#pragmaompparallel"C."#ifdef_OPENMP"D."#define_OPENMP"[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C43.在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本____串行版本。A.肯定快于B.肯定慢于C.可能快于D.以上皆错[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B44.SSEintrinsics_mm_store_ss命令的功能是____。A.对齐向量存单精度浮点数B.未对齐向量存双精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存双精度浮点数[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C45.MPI基本原语不包括____。A.MPI_BarrierB.MPI_Comm_rankC.MPI_Comm_sizeD.MPI_Init[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A46.一个AVX寄存器最多存放____个整型数。A.2B.4C.8D.16[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C47.在使用信号量之前必须对其进行____。A.初始化B.加锁C.加1D.销毁[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A48.主线程通过____函数获取特定线程的返回结果。A.pthread_createB.pthr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论