版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、深 圳 大 学实 验 报 告课程名称:并行计算实验名称:矩阵乘法的OpenMP实现及性能分析姓 名: 学 号:班 级: 实验日期:2011年10月21日、11月4日一.实验目的1) 用OpenMP实现最基本的数值算法“矩阵乘法”2) 掌握for编译制导语句3) 对并行程序进行简单的性能二.实验环境1) 硬件环境:32核CPU、32G内存计算机;2) 软件环境:Linux、Win2003、GCC、MPICH、VS2008;4) Windows登录方式:通过远程桌面连接192.168.150.197,用户名和初始密码都是自己的学号。三.实验内容1. 用OpenMP编写两个n阶的方阵a和b的相乘程序
2、,结果存放在方阵c中,其中乘法用for编译制导语句实现并行化操作,并调节for编译制导中schedule的参数,使得执行时间最短,写出代码。方阵a和b的初始值如下: 输入:方阵的阶n、并行域的线程数输出:c中所有元素之和、程序的执行时间提示:a,b,c的元素定义为int型,c中所有元素之各定义为long long型。Windows计时:用中的clock_t clock( void )函数得到当前程序执行的时间Linux计时:#include timeval start,end;gettimeofday(&start,NULL);gettimeofday(&end,NULL);coutexecu
3、tion time: (end.tv_sec-start.tv_sec)+(double)(end.tv_usec-start.tv_usec)/ seconds endl;答:在windows下使用Microsofe Visual Studio编程,源代码如下:#include #include #include #define NN 2000int aNNNN, bNNNN;long long cNNNN;void solve(int n, int num_thread)int i, j, t, k, time;clock_t startTime, endTime;long long su
4、m;omp_set_num_threads(num_thread);for(i=0;in;i+)/对矩阵a和矩阵b进行初始化t=i+1;for(j=0;jn;j+)aij=t+;bij=1;startTime=clock();sum=0;#pragma omp parallel shared(a,b,c) private(i,j,k)#pragma omp for schedule(dynamic)for(i=0;in;i+)for(j=0;jn;j+)cij=0;for(k=0;kn;k+)cij+=aik*bkj;for(i=0;in;i+)for(j=0;jn;j+) sum+=cij;
5、endTime=clock();time=endTime-startTime;printf(sum=%lld time=%dmsn,sum,time);int main()int n, num_thread;while(scanf(%d%d,&n,&num_thread)!=EOF)solve(n,num_thread);return 0;2. 分析矩阵相乘程序的执行时间、加速比和效率:方阵阶固定为1000,节点数分别取1、2、4、8、16和32时,为减少误差,每项实验进行5次,取平均值作为实验结果。答: 串行执行时程序的执行时间为:T = 15.062s加速比=顺序执行时间/并行执行时间效率
6、=加速比/节点数表1 不同节点数下程序的执行时间(秒) 节点数实验结果12481632第1次16.6408.1724.0782.1251.0930.594第2次16.4228.1564.1722.1411.0780.578第3次16.4068.2664.0782.1251.0940.563第4次16.7818.1724.0792.1091.0940.563第5次16.4228.1714.0782.1251.0930.578平均值16.53428.18744.09702.12501.09040.5752图1 不同节点数下程序的执行时间图2 不同节点数下程序的加速比图3 不同节点数下程序的效率执行
7、时间的分析:随着节点数的增加,程序的执行时间减少,大概可以从结果中得出,随着节点书的增加一倍,执行时间减少一半加速比的分析:随着节点数的增加,程序的加速比增加,大概可以从结果中得出,随着节点书的增加一倍,加速相应的增加接近一倍效率的分析:随着节点数的增加,程序的效率逐渐减少3. 分析矩阵相乘程序的问题规模与效率的关系:固定节点数为4,让方阵阶从200到1600之间变化,每隔100取一个值。(为了减少时间,每项实验可只执行1次)答:表2 相同节点数下不同问题规模程序的执行时间与效率方阵阶数并行执行时间串行执行时间效率2000.0150.0470.3000.0160.1091.4000.0630.2971.5000.1560.6571.6000.4061.641.7000.9073.5780.8001.6096.360.9002.57810.1090.10003.81214.8910.11005.3921.0320.9755112007.34428.7340.13009.68837
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年监理工程师《交通运输工程案例分析》考前必背笔记
- 第八单元 词语积累与词语解释 综合练习 统编版高中语文必修上册
- 2026年省级人力资源服务行业社会责任知识测试
- 2026年国有企业采购管理规范廉洁风险防控测试卷
- 2026年光伏帮扶电站收益分配与公益岗设置问答
- 2026年MBA提前面试商业案例分析与管理潜质题
- 2026年执法示范单位创建试题
- 2026年答题技巧大放送成绩提升利器
- 妇产科三基2026年妇产科学基础知识汇编
- 2026年妇联系统财务与项目资金管理规范试题
- 2026年全国《职业病防治法》宣传周:“守护职业健康共享幸福人生”
- 2026江苏省农村商业银行系统春季校园招聘备考题库及答案详解(易错题)
- 泸州市兴泸投资集团有限公司招聘笔试题库2026
- 电力监控应急预案(3篇)
- 门店会员绩效考核制度
- 成人高考高起专英语复习资料
- 湖北省宜昌市2026届高三下4月考数学试题含解析
- 财务部门工作流程手册
- T∕CAMDI 165-2025 液相色谱用于临床维生素A、维生素E、25-羟基维生素D2 D3检测通 用技术要求
- 2026年1月浙江省高考(首考)化学试题(含标准答案)
- 2026年广东省初中学业水平考试模拟(一) 英语
评论
0/150
提交评论