串行程序的并行化处理_第1页
串行程序的并行化处理_第2页
串行程序的并行化处理_第3页
串行程序的并行化处理_第4页
串行程序的并行化处理_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、串行程序的并行化处理        关键词:并行DAG数据依赖串行程序并行划分模型等价关系 论文摘要: 目前在并行计算研究领域中很大一部分工作是将串行程序并行化,本文根据题目的要求,在合理的假设下,首先发掘串行程序中存在的并行性,一个好的方法就是构造其对应的并行任务(DAG)图,论文分析了串行程序中存在的数据依赖关系,并以此为根据,提出了一种由现有的串行程序构造对应的并行任务(DAG)图的算法,然后再对剩下的串行程序分段,提出并行划分模型,基于这种模型提出了一种并行划分算法PDMA;并根据程序段的相关程度提出了一种

2、对PDMA进行改进的并行划分算法RPDMA。然后再通过一个串性程序的实例,运用此方案对其进行运算,最后对串行程序运算下的时间复杂度和进行此方案运算下的时间复杂度进行比较,得出此方案的优越。1.问题的重述并行计算是将一个计算任务分摊到多个处理器上并同时运行的计算方法。由于单个CPU的运行速度难以显著提高,所以计算机制造商试图将多个CPU联合起来使用。在计算机上早已采用专用的多处理器设计,台式机和笔记本电脑现在也已广泛地采用了双核或多核CPU。双核CPU从外部看起来是一个CPU,但是内部有两个运算核心,它们可以独立进行计算工作。在同时处理多个任务的时候,多核处理器可以地将不同的任务分配给不同的核心

3、。最容易被并行化的计算任务称为“易并行”的,它可以直观地立即分解成为多个独立的部分,并同时执行计算问题。要求:(1)运行一个以常规的串行代码写成的程序时,如何将计算任务拆分成多个部分并分解到多个核心上同时运行。(2)建立合理有效的模型,并依据模型对现成的串行算法进行处理。将能够使用双核心并行处理的部分分解开,并分配到两个核心上同时运行。以期达到比单核CPU处理更快速的目的。2.模型的假设1.忽略硬件及环境因素,假设每次执行时硬件条件和环境条件是完全一致的。2.对算法的时间复杂度并不考虑其精确度量,而只是关心其量级3.双核及多核CPU在运算时,互不干扰.4.设文中的算法最终得到的DAG图中消除了

4、原有的反依赖和输出依赖.3.问题分析由于单个CPU的运行速度难以显著提高,所以现在广泛采用了双核或多核CPU,如何将一个常规的串行程序分解成两部分,使之能够同时采用了双核或多核CPU,双核CUP内部的两个运算核心可以独立进行工作,并且希望能够充分发挥双核心的计算能力。首先我们根据任务之间存在的数据依赖以及控制依赖关系,将先发掘串行程序中存在的并行性,从而减少了直接将串行程序并行化的复杂度,也提高了效率。然后再针对剩下的串行程序进行并行化处理,从而使它的效率达到更理想的状态现在的问题是:()如何找到一个好的方法去发掘串行程序中的存在的并行性;()设计一种将串行程序并行划分的模型,再基于这个模型提

5、出一种并行划分算法4.建模前的准备4.1对于一个输入的串行程序, 我们首先发掘串行程序中存在的并行性构造其对应的并行任务DAG图. 构造DAG图的时候, 主要的一个问题就是发现任务之间的依赖关系. 本文首先对任务之间存在的一种依赖关系作一个简单的介绍.1.任务之间的数据依赖关系所谓数据依赖, 也就是在运行的多个执行过程同时访问相同的数据, 结合相关知识给出了下面的数据相关的形式化定义:在上面所列出的依赖中,流依赖也称为真数据相关是真实的数据流之间的流通过程,因此如果两个任务间存在流依赖是没有办法将这两个任务进行并行或改变两个任务的执行顺序的。反依赖和输出依赖也称作名字相关或冲突,他们实际上并没

6、有任何真实的数据流的关系,只是在要使用一个存储资源的过程中,由于被别的任务使用而造成的,他实际上也是资源依赖。通过重复设置资源或者使用其它的资源,便可以解决这些依赖,而不影响并行性的开发。4.2算法时间复杂度定义定义:如果一个问题的规模是n,解这一问题的某一算法所需要的时间为T(n),它是n的某一函数 T(n)称为这一算法的“时间复杂性”。例:Temp=I;i=j;j=temp;                  

7、以上三条单个语句的频度均为1,该程序段的执行时间是一个与问题规模n无关的常数。算法的时间复杂度为常数阶,记作T(n)=O(1)。如果算法的执行时间不随着问题规模n的增加而增长,即使算法中有上千条语句,其执行时间也不过是一个较大的常数。此类算法的时间复杂度是O(1)。算法的时间复杂度反映了程序执行时间随输入规模增长而增长的量级,在很大程度上能很好反映出算法的优劣与否。在实际应用中,我们一般都是使用渐近时间复杂度代替实际时间复杂度来进行算法效率分析。5.模型的建立与求解首先构造DAG图发掘串行程序中存在的并行性.然后对剩余的串行程序进行提出并行划分模型,基于这个模型提出了一种并行划分算法PDMA和

8、其改进了的并行划分算法RPDMA.最后,通过计算此方案的时间复杂度和串行运行下的时间复杂度,进行比较,得出了此方案的可行性.5.1:发掘串行程序中的存在的并行性如何发掘串行程序中存在的并行性,一个好的方法就是构造其对应的并行任务(DAG)图。本文分析了串行程序中存在的依赖关系,并以此为依据,提出了一种由现有的串行程序或者串行解决方案构造对应的并行任务数据依赖的(DAG)图的算法。算法的描述对给定的事务( ) (x)进行如下步骤来构造其DAG图。步骤1 如果 没有定义,则构造一个标记为的叶节点,并定义 为这个叶节点。如果,则转步骤2.1否则对 如果没有定义,则构造一个标记为 的叶子节点,同时定义

9、 为这个节点,转步骤2.2步骤2步骤2.1   如果实标记为常量的叶子节点,则转步骤2.3,否则转步骤3.2步骤.2  如果 都是标有常量的节点,则转步骤2.4,否则转步骤3.2。步骤2.3   对执行T,得到新的常量数据集P.如果NODE()是处理当前DAG图新构选出来的节点,则删除它如果NODE(p)没有定义,则构造一个用p做标记的叶节点记作n,并定义NODE(p)指向它转步骤4步骤2.4   对 执行T,得到新的常数p。如果NODE()( =1,2, n)是处理DAG图新构造出来的节点,则删除它。如果NODE(p)没有

10、定义,则构造一个用p做标记的叶节点记作n,并定义NODE(p)指向它转步骤4步骤3步骤3.1  检查DAG图是否已有一个节点,其唯一的前继为NODE()且其标记为如果没有,则构造该节点记作n转步骤4步骤3.检查DAG图是否已有一个节点,其前继分别为NODE( ),NODE() NODE( )且其标记为如果没有,则构造该节点记作n转步骤4步骤如果NODE(x)没有定义,则把x附加到节点n上,并令NODE(x)=n;否则先把n从NODE(x)=n转而处理下一个任务直到此任务集中的所有人物处理结束后,转步骤步骤将图中没有标记任务的节点删掉,就求得了任务DAG图。5.2:串行程序的进一步并行

11、化分:1并行划分模型假设,也就是说中N个元素,对于中的每一个P的子集,把中的程序段全部放在一台处理机上运行,根据 的定义知,每两台处理机上执行的程序段都不存在相关性,所以在程序运行的过程中,不需要任何的消息传递和相互等待,一直到各个处理机上的程序段执行完毕性质a保证了程序中的任何一个程序段不会被执行多于一次,性质b保证了程序中每一个程序段都可以被执行2并行划分算法PDMA及相关程度根据以上描述的并行划分模型,可以写出构造该模型的算法PDMA,PDMA的输入是一个串行程序G,输出是并行划分模型先给出算法中所使用的符号的定义,P为程序段集,其中每个元素为序中的一行代码;R为P上的关系 的值域算法描

12、述如下:a由G生成P:L1,L2,L;b生成R=(A,B)| A,BP,AB;c令  d取R中一个二元组r=(A,B),令R:=R-r,若A 或者B,那么,令 := UA,B( ),否则令:= UA,B;1         e若R 。则转d 实际上,大多数的串行程序根据算法PDMA划分所产生的并行划分模型的基为1,也就是说,大多数串行程序不能被划分成多个互不相关的程序段定义3  程序段的相关程度 ,若B A为真,则V(B A为1,否则为03基于降低相关程度的并行划分算法RPDMA实际上,串行程序

13、中各个序段相互之间存在着相关性,也就是说,串行程序G,通过算法PDMA产生的并行划分模, 的情况很少,即可以毫无相关地划分到多个处理机上并行执行的串行程序很少划相互之间存在一定的相关性显然,若可以使得各个分划之间的相关程度降低,那么,并行行的加速比就会提高因此,并行分划的问题转化为“如何将一个集合划分为几个分划,使得这些分划相互之间的相关性最少”基于此,提出了一个降低相关程度的并行划分算法RPDMARPDMA的主要思路是把划分后的程序段之间的相关程度转化成为各个节点之间的通信,而通信是并行处理的瓶颈RPDMA的目标是尽量降低各个节点之间的通信量。RPDMA对算法PDMA产生的基为1的并行划分模

14、型作进一步的划分它根据程序段的合以及它们相互之间的相关性生成一个带权图TEMP,图的节点是程序段,图的任意边AB的权是程序段A和B之间的相关程度,RPDMA首先找到TEMP中权最小的边mv,然后让每一条边的权都减去mv的权,也就是相关节点之间的通信量增加mv,如果产生的新图是非连通图,则表明串行程序可以划分为两个或两个以上的带有一定相关性的子程序;如果新图是连通图,那么再按照上述的方法进行划分,直到产生的新图为非连通图RPDMA的输入为串行程序G,输出为并行划分模型 先给出算法的符号定义:TEMP,TEMPO和RP是一个集合,集合中每个元素是一个三元组(A,B,v),A和B是G的程序段,v是A和B的相关程度算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论