使用MATLAB并行计算功能提高多核系统性能_第1页
使用MATLAB并行计算功能提高多核系统性能_第2页
使用MATLAB并行计算功能提高多核系统性能_第3页
使用MATLAB并行计算功能提高多核系统性能_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、使用MATLAB并行计算功能提高多核系统性能2009-12-13 22:12:11|分类:matlab相关|标签:|字号大中小订阅maxNumCompThreads 命令由于处理器时钟频率的限制,增加核并不意味着是计算性能的提高。为了充分利用新的多核硬件在性能上的优势,软件的基层结构需要向并行计算转换。MATLAB并行计算工具箱就是这种需求的产物,它能很好地实现在多核系统上进行并行运算。文章以典型的数值计算问题为例描述如何使用基本的两种并行运算方式:线程和并行for循环。典型数值计算问题为了举例说明这两种方法,我们使用MATLAB测试一个有关Girko圆定律的假设。Girko圆定 律的内容是:

2、一个NxN的随机矩阵(它的元素服从正态分布)的特征值位于半径为的圆内。假设Girko圆 定律能被修改应用到奇异值上。这个假设是合理的因为奇异值是一个变换了的矩阵的特征值。首先我们用 MATLAB代码实现Girko圆定律的一个实例:N =1000;plot(eig(randn(N) / sqrt(N), .);这段代码运行后得到图1,图上每个点代表复平面上一个特征值。注意所有的特征值都位于半径为1,圆心在轴的原点的圆内,特别指出的是结果与Girko圆定律是一致的,特征值的幅值没有超过矩阵维数的平方根。图1大小为1000的随机矩阵的特征值在半径为sqrt(1000)的圆内为了将Girko定律应用到

3、奇异值分解上,我们用MATLAB生成随机矩阵,然后估算它们的奇异 值,看是否能基于数值计算阐明这个假设。我们用任意变量N计算max(svd(randn(N)的值,然后在结果 中寻找规律,而这个规律是可以用奇异值分解的理论解释的。通过下面的循环产生正规随机矩阵,并计算它们的奇异值:y = zeros(1000,1);for n = 1:1000y(n) = max(svd(randn(n);endplot(y);在单核计算机上运行这段循环代码时需要15分钟多的时间。为了减少计算时间,我们用线程和 并行for循环在多核计算机上运行这段循环代码,然后再来比较性能结果。使用线程线程是在多核计算机上进行

4、并行计算的软件解决方案,但是需要记住的一点是多线程和多核处理 器不是同一个概念。通常线程的数量和多核的数量一致时性能是最好的,但是也有线程比核少的情况。我 们将通过实验去确定对于我们的计算所需的最佳的线程的个数。运行上面的代码,并通过MATLAB界面属性窗口或者使用maxNumCompThreads()函数去调节 线程的个数。图2显示了不同线程数量对应的结果。除了时间,还有加速情况和并行效率。前者是多核执 行时间与单核执行时间的比率,理想地,我们期望在N个核上能达到N倍。后者是加速倍数与核的个数的 比率,理想地,我们期望能达到100%。线程个数运行循环所需时间加速倍数效率1902.61.001

5、00%2867.21.0452%3842.31.0735%4862.31.0526%图2不同线程数量对应的代码性能结果呈现混合型的特点。使用线程确实能提高计算的速度,但是在我们的例子,只有对svd()的 调用是被并行计算的。这是因为MATLAB所支持的线程是有限制的:用户不能决定代码的哪部分进行并行运算。一方面,我们使用多核在不改变代码的情况下加快了计算的速度。另一方面,当增加内核而并没 有减少执行时间时就意味着是对成本的浪费。这个时候,我们需要另一种并行运算方法。使用并行for循环Parfor循环,即并行for循环,在简单计算中有大量循环语句时是非常有用的。使用Parfor需要并行计算工具箱

6、的支持。图3是用Parfor语句和前面代码的对比。y = zeros(1000,1);y = zeros(1000,1);for n = 1:1000parfor n = 1:1000y(n) = max(svd(randn(n);y(n) = max(svd(randn(n);endendplot(y);plot(y);图3左边:原来的代码 右边:用parfor实现的循环语句就像maxNumCompThreads()命令可以控制多核方法的并行运算,matlabpool命令能够控制 parfor指令的并行行为。Matlabpool指令创建并行任务执行的环境,在此环境下并行for循环能够从MAT

7、LAB的命令提示符交互执行。Parfor循环在labs上执行,labs之间是能够交互的。像线程一样,labs在处理器核上执行,但 是labs的数量并不一定与核的数量相匹配。另不同于线程,labs互相之间是不共享存储单元的。所以,它 们能够运行在联网的独立的计算机上。但是,在我们的例子中我们仅需要知道并行运算工具箱使得parfor 有效地工作在一个多核系统上。每个核或本地worker能主导一个lab。问题自然就出现了:改变代码值得吗?在我们的例子中,改变代码是值得的因为下面的表格清楚 地表明了使用parfor的好处。Labs数量运行循环所需时间加速倍数效率1870.11.00100%2487.0

8、1.7989%3346.22.5183%4273.93.1779%图4不同的lab数量对应的代码性能从结果可以看出,对于此奇异值分解的计算,无论从加速情况还是效率,parfor的性能是优于多 线程的。不细究代码实现的细节,也有必要解释使用parfor带来的好处。例子中的代码最显著的特征是每个循环是独立的。独立性的特征使得parfor的应用很简单也很高效。使用parfor留给系统的唯一任务是分配循环任务到核执行并获取结果用于其他的运算。值得说明的一点是parfor在随机数产生的问题上。在parfor循环中使用诸如randn()函数产生的矩阵与for循环中使用类似函数产生的矩阵并不一致,因为par

9、for循环的是已经被预定了的。在绝大多情况下,这种差异完全是可以接受的。使用parfor有它的优点,但也有其局限性。例如,如果循环之间相互依赖,而且这种依赖能够通过代码分析得到,那么执行parfor循环就会得到错误的结果。如果这种依赖关系没有检测到,那么就会得到不正确的结果。下面的代码说明了这样的问题:total = 0;A = zeros(1000, 1);parfor i = 1:100total = total + i; % OK: this is .a known reduction operationA(i+1) = A(i) + 1; % error:loop iterations

10、 are dependentend利用parfor很容易计算total的表达式,但是对于第二个表达式,由于A(i+1)依赖于前一次循环得到 的A(i),所以用parfor计算会产生问题。让我们来更进一步地看看每次循环发生了什么:Iteration 1: i = 1A(2) = A(1) + 1 = 0 + 1 = 1Iteration 2: i = 2A(3) = A(2) + 1 = 1 + 1 = 2Iteration 3: i = 3A(4) = A(3) + 1 = 2 + 1 = 3通过以上分析我们可以用下面的parfor循环的代码得到跟前面同样结果的代码:parfor i = 1:10A(i+1) = i;end扩展并行计算MATLAB已经支持几种并行方法,其他的方法将逐渐在高版本中实现。我们相信未来计算机将有越来越多的核。总是没过几年核的个数就翻倍,也意味着计算能力的翻 倍。但是要利用好这种硬件的优势就需要正确的软件,而写正确的软件就需要正确的软件开发工具。MATLAB便旨在实现这种需求。源自 HYPER

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论