实验三多核程序设计课程实验报告_第1页
实验三多核程序设计课程实验报告_第2页
实验三多核程序设计课程实验报告_第3页
实验三多核程序设计课程实验报告_第4页
实验三多核程序设计课程实验报告_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多核程序设计课程实验实验 3:基于 Cell 处理器的并行程序设计院系学院学号1103710504任课教师指导教师实验地点学院五楼机房实验时间2012-12-25实验课表现出勤、表现得分实验得分实验总分操作结果得分一、实验目的要求:需分析本次实验的基本目的,并综述你是如何实现这些目的的?基本目的:了解 CELL 体系结构;了解N-BODY 问题及其并行算法;运用 CELL 解决N-BODY 问题;搭建 CELL 模拟器环境,进行并发程序设计;实现方法:实验目的在指导书的理论知识阅读环节就已经了解完毕,都有很详细的介绍,通过阅读实验指导书,可以初步掌握 CELL 体系结构与编程模式;至于 PPE

2、 端程序分析,则需要按照指导书上的步骤一步一步进行,根据运行的结果来观察不同模式和数据对结果产生的影响,并进行分析,直至得出实验结果。二、实验内容该部分填写在实验过程中,你都完成了哪些工作。理论部分需要理解的知识:程序流程;主要数据结构;主要函数;PPE 端程序分析; SPE 端程序分析; 上机操作完成工作:模拟器环境搭建;CELL 应用程序目录结构;拷贝 CELL 程序源代码至虚拟机;模拟器运行;实验结果;三、实验结果实验结果。FAST 模式:天体数为 32,迭代次数为 10 SPE 线程数为 2:SPE 线程数为 4:SPE 线程数为 6: SPE 线程数为 8:CYCLE 模式:天体数为

3、 32,迭代次数为 10SPE 线程数为 2,天体数为 32:SPE 线程数为 2,天体数为 64:SPE 线程数为 2,天体数为 128: SPE 线程数为 4,天体数为 32:SPE 线程数为 4,天体数为 64:SPE 线程数为 4,天体数为 128: SPE 线程数为 6,天体数为 32: SPE 线程数为 6,天体数为 64: SPE 线程数为 6,天体数为 128: SPE 线程数为 8,天体数为 32: SPE 线程数为 8,天体数为 64: SPE 线程数为 8,天体数为 128:四、思考题思考题 1:FAST 模式下的功能测试:设天体数为 32,迭代次数为 10。测试在不同的

4、 SPE线程数(2, 4, 6, 8)下,截图说明究竟有多少SPE 确实在并发运行。答:SPE 线程数为 2:两个 SPE 确实在并发运行SPE 线程数为 4:四个 SPE 确实在并发运行SPE 线程数为 6:六个 SPE 确实在并发运行 SPE 线程数为 8:八个 SPE 确实在并发运行思考题 2:FAST 模式下的功能测试:修改天体数量,看达到多少天体数时会出现误差过大的情况(此时程序会出现 “Value for x should be %f but was found to be %f”)。并分析出现误差的原因。答:经过测试,控制天体数量的改变,观察达到多少天体数时会出现误差过大的情况,

5、最后发现当天体数为 74 时,会出现。误差原因:可能是SPE 通信。因为 N-BODY 的大体是:拆解天体的集合。其具体算法:比如在有 N 个 CPU 的情况下,可以将天体的集合划分为 N 个子集,每个 CPU只负责计算一个子集中的天体的受力及运动情况。这 N 个CPU 在计算时需要共些信息,如第 m 个子集在计算受力时,需要其他所有天体的空间位置信息。在具体的 CELL 环境下,使用 8 个 SPE 作为运算单元,用主存所有天体的位置信息,这样所有的 SPE 在计算子集的那集时就可以共享地其他天体的位置信息了。该问题拿到具体环境;来说:每个处理器中,core_bodies 对 buffer_

6、bodies 初始化。每个时间段,从 1 循环到 N,使得core_bodies 中的粒子,再从buffer_bodies 中计算其粒子对它的作用力,最后把buffer_bodies的内容给其左邻居。然而在等待单元的数据时,另一个单元数据进行计算的时间,就会产生一定的误差误差,其中包括两个可能性误差和一个同步性误差,天体数目越多,同步性误差可能性就会越大,导致实验结果确。思考题 3:CYCLE 模式下的性能测试:设天体数为 32,迭代次数为 10。测试在不同的SPE线程数(2, 4, 6, 8),以及不同天体数(32, 64, 128)下,程序的执行时间。答: SPE 线程数为 2,天体数为

7、32: SPE 线程数为 2,天体数为 64:SPE 线程数为 2,天体数为 128:SPE 线程数为 4,天体数为 32:SPE 线程数为 4,天体数为 64:SPE 线程数为 4,天体数为 128:SPE 线程数为 6,天体数为 32:SPE 线程数为 6,天体数为 64:SPE 线程数为 6,天体数为 128:SPE 线程数为 8,天体数为 32:SPE 线程数为 8,天体数为 64:SPE 线程数为 8,天体数为 128:由以上结果出:Cycle 模式的运行时间长于 fast 模式的运行时间.五、实验心得体会在这次实验之前,仅仅从课堂上学到的知识,使得 cell 显得很神秘,对于其并发处理的机制和效率我都不是很了解。这次试验中首先是实验指导书帮助我在理论上大致接触了 CELL 的体系结构,以及 N-BODY 问题及其并行算法。接着是在实验操作中,还是遇到了很多 ,比如对工具使用的不熟练,而且在误差存在的前提下对实验结果有了一定的怀疑,最后这些都通过与同学和老师交流得到了很好的解决。本次试验从中真正学习了如何应用 CELL 编程解决 N-BODY 问题,并通过在模拟器上运行 nbody 程序,理解了线程数对程序性能的影响。真正体验到了并行处理的效率以及其越加主流

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论