(电子科学与技术专业论文)25维粒子模拟软件冷腔并行算法的研究.pdf_第1页
(电子科学与技术专业论文)25维粒子模拟软件冷腔并行算法的研究.pdf_第2页
(电子科学与技术专业论文)25维粒子模拟软件冷腔并行算法的研究.pdf_第3页
(电子科学与技术专业论文)25维粒子模拟软件冷腔并行算法的研究.pdf_第4页
(电子科学与技术专业论文)25维粒子模拟软件冷腔并行算法的研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(电子科学与技术专业论文)25维粒子模拟软件冷腔并行算法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

a b s t r a c t a b s t r a c t w ea l w a y sd oo u rb e s tt or e d u c ed i m e n s i o na tw h o l eh o gi nr e s p e c tt h a tt h e c a l c u l a t ea m o u n to fp a r t i c l e - s i m u l a t ec h a n g ew i t hd i m e n s i o nn u m b e rb yp o w e r i t sn o t n e c e s s a r yt o c a l c u l a t ee l e c t r i f e r o u sp a r t i c l e s sm o v e m e n tr e p e a t l yi fp l a s m am o v e c o n s i s t e n t l yo n o n ed i r e c t i o no na l lf o u r s , b u tc o n s i d e r e dp l a s m sa sas e r i e so fs o l i d - p o l e a tt h ed i r e c t i o n t h ec a l c u l a t et i m ew a ss a v e da tal a r g ed e g r e ef o rj u s tc o n s i d e r i n gt h e p o l e m o v e m e n to nt h eo t h e rt w od i r e c t i o n s ,i nt h i sw a y , t h e3 - d q u e s t i o n b e c o m et o2 d b a s e do nt h ep u r p o s e , t h i sp a p e rr e s e a r c ho nt h ed e s i g n so fp a r a l l e la l g o r i t h mo f c h i p i c 2 5 f i r s to fa l l ,t h ep a p e rr e s e a r c ho ne l e c t r o m a g n e t i cp a r t i c l ei nc e l ls i m u l a t i o ni n2 - d c a r t e s i a n 。a c c o r d i n gt ot h ec h a r a c t e r i s t i co fc h i p i c ,i ta n a l y s e sh o w t od e c o m p o u n d s i m u l a t e a r e aa n dt oc h a n g ef o rd a t a 。w i t ht h ei d e ao f “d i v i d e - a n d c o n q u e r ”,i c o m p l e t et h ep a r a l l e lw o r k ,a n dg o tt h ec o r r e c tr e s u l tt o g e t h e rw i t he f f i c i e n c y a n dt h e n ,i tr e s e a r c ho np a r a l l e ls i m u l a t i o ni n2 一dc y l i n d r i c a la n dp o l a rc o o r d i n a t e s y s t e m s ,a i ma tt h ed i f f e r e n c eb e t w e e nc y l i n d r i c a l p o l a ra n dc a r t e s i a n ,ik e e pm ye y e o nt h eb o u n d a r yp r o c e s st e c h n o l o g yi nc y l i n d r i c a la n dp o l a r w h i l ec o m p u t i n gt h e e l e c t r i cf i e l d so rm a g n e t i cf i e l d so fa 咖d ,i tj u s tn e e d st h en e a r e s tm a g n e t i cf i e l d so r e l e c t r i cf i e l d so ft h eg r i d 。is t i l la d o p tt h ei d e ao f “d i v i d e - a n d c o n q u e r t oc o m p l e t et h e p a r a l l e lw o r k ,a n dg o tt h ec o r r e c tr e s u l tt o g e t h e rw i me f f i c i e n c y f i n a l l yt h ep a r a l l e l w o r ki sc o m p l e t e df o rt i m e - b i a s e df d t dm o d u l ei n2 一d c a r t e s i a n ,c y l i n d r i c a la n dp o l a rc o o r d i n a t es y s t e m s t i m e - b i a s e dm o d u l ei so n eo ft h e m o s ti m p o r t a n tm o d u l e si nc h i p i cw h i c hi sak i n do ff d t dd e s i g n e df o rf i l t r a t i n g h i g n - f r e q u e n c yn o i s e ,i tc a nr e d u c et h ei n f l u e n c et h a th i g nf r e q u e n c ye f f e c to nc a l c u l a t e r e s u l ta tal a r g ed e g r e e t i m eb i a sa n dr e l a x a t i o ni t e r a t i o n sa r et w oi m p r o v e m e n ta b o u t f i e l d c a l c u l a t i n gt i m e - b i a s e dm o d u l eh a s t h ec a l c u l a t ea m o u 嫩o ft i m e - b i a s e di s 蠹 m o r et h a nt h a to fc e n t e r - d i f f e r e n c e , t i m e - b i a s e di st i m e - c o n s u m i n g t h i ss h o w st h a ti t i sm e a n i n g f u lf o ru st ob r i n g p a r a l l e li n t ot i m e b i a s e dm o d u l e ht h em o d u l eo ff d t d ,w eu s em a g n e t i cf i e l d sa tt h et i m e + 1 2 a t ) t oc o m p u t e t h ee l e c t r i cf i e l d sa tt h et i m e0 + a t ,b u ti nt h em o d u l eo ft i m e - b i a s e df d t d ,w e i i a b s t r a c t c o m p u t et h ee l e c t r i c f i e l d sa tt h et i m ew i t ht h em a g n e t i cf i e l d sa tt h et i m e ( t + 3 2 a t ) 、0 + 】2 f ) a n d 章一l 2 ) ,w es e tu pt h ev a l u e 穰l ,口2 ,口3 a c c o r d i n g t ot h ea f f e c tt h em a g n e t i cg i v e ,w ea n a l y s et h es t a b i l i t yc o n d i t i o n l a s t l y , t e s tt h ew o r kw i t hal a nc o m p o s e dw i t h6p c t h er e s u l ti n d i c a t et h a tt h e p a r a l l e la l g o r i t h mi sr i g h ta n dg o o ds p e e d u pa n de f f i d e n c ya r ea c q u i r e d k e y w o r d s :p a r a l l e la l g o r i t h m ,f d t d ,t i m e - b i a s e d ,e l e c t r o m a g n e t i cp a r t i c l ei n c e l l s i m u l a t i o n i i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书面使用过的材料e 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本入授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名: 第一章绪论 1 1 粒子模拟并行计算简介 1 1 1 粒子模拟简介 第一章绪论弟一早珀下匕 粒子模拟n 。2 1 的基本方法是对带电粒子的运动进行跟踪,粒子在外加电磁场和 自洽电磁场作用下运动,因而每个时间步长内都要计算大量粒子中每两个粒子之 间的相互作用及其产生的运动,计算量十分可观。粒子模拟的一般过程是给定初 始时刻粒子的位置和速度,用平均近似的方法求得空间各处的电荷密度和电流密 度分布,求解m a x w e l l 方程组得到空间各处的电场和磁场强度,由此,每个粒子所 受的力便可求得,从而下一时刻各个粒子的速度就可通过牛顿运动方程或相对论 运动方程解出,进而求得新时刻粒子的位置。如此循环求解,就可知道电磁场和每 个粒子的运动变化情况。所有关于场和粒子的基本量都可以用计算机存储起来, 任何宏观量和统计量都可以通过这些基本量求出。这对计算机的存储量要求很高, 因此,要真正在计算机上实现粒子模拟,还需作很多精细的考虑和处理。a d a m , e t a l 提出了多时标算法口1 ,使计算时间缩短了将近一半;w a l l a c e 提出了隐格式方 法,使时间步长大大增加。即使如此,很多复杂物理过程的模拟依然无法突破计 算机c p u 运算速度和内存存储量的瓶颈。 并行计算是解决粒子模拟中计算时间和存储量的最有效方法:第一,它可以 加快速度,即在更短的时间内解决相同的问题或在相同的时间内解决更多更复杂 的问题,特别是对一些新出现的巨大挑战问题,不使用并行计算是根本无法解决 的;第二,节省投入,并行计算可以以较低的投入完成串行计算才能够完成的任 务;第三,物理极限的约束,光速是不可逾越的速度极限,设备和材料也不可能 作得无限小,只有通过并行才能够不断提供速度。并行技术的应用可以解决计算 机c p u 速度和内存大小的瓶颈。粒子模拟软件的并行运算是一个大趋势。 1 1 2 并行计算简介h 卅 并行计算是伴随并行计算机的出现,在近3 0 年来迅速发展的- - i 7 交叉学科, 涵盖的内容非常广泛。从交叉学科的角度,并行计算可以定位为连接并行计算机 系统和实际应用问题之间的桥梁。 电子科技大学硕士学位论文 近年来,由于p c 计算机性能的提高和价格的不断降低以及快速光纤网络设备 的开发,由p c 计算机组成的分布内存式并行计算机系统已经得到了高速发展。尽 管如此,由于计算机之间频繁的大量数据交换,并行计算机系统中的硬件连接设 备仍然是并行计算效率的主要瓶颈。计算机软件的效率与物理模型和编程技术有 关,比如,时域有限差分方法就是一种天然的并行方法,电磁场的计算仅需要其 周围的信息,因此具有很高的并行效率。真正对并行计算方法起推动作用是m p i 库的出现。这种免费资源极大地降低了并行计算机软件的投资并缩短了并行软件 的开发周期。并行计算机已经广泛地应用于科学计算和实际工程问题。大规模并 行计算在国内外受到高度的重视,已成为研究科学与工程技术的一种崭新的手段 和方式。 为了成功开展并行计算,必须具备3 个基本条件: ( 1 ) 并行计算机。并行计算机至少包含两台或两台以上处理机,这些处理机 通过互联网络相互连接,相互通信。我的实验室拥有由两台工作站、一个服务器 和多台p c 机组成的并行计算机。 ( 2 ) 应用问题必须具有并行度。也就是说,应用可以分解为多个子任务,这 些子任务可以并行地执行。将一个应用分解为多个子任务的过程,称为并行算法 的设计。c h i p i c 粒子模拟软件采用的核心算法是时域有限差分算法( f d t d ) 。时域 有限差分算法采用分区域计算的并行思想,电磁场递推仅需要周围网格场的信息, 每个子区域内部电磁场的递推并不需要其他区域场的值。每完成一个递推步长, 交换边界的网格场信息,具备并行度。 ( 3 ) 并行编程。在并行计算机提供的并行编程环境上,具体实现并行算法, 编制并行程序并运行该程序,从而达到并行求解应用问题的目的。我们利用已有 的硬件设施搭建并行平台,并安装m p i c h ,并将m p i 系统执行命令的路径设置在用 户的省缺路径中。利用m p i c h 既可以在单台微机或工作站上建立m p i 程序的调试 环境,使用多个进程模拟运行m p i 并行程序,也可以在s m p 系统或机群环境上建 立实用的并行计算环境。 m p i c h 是最流行的基于网络并行计算环境的m p i 标准的具体实现,许多商用 m p i 软件均是在它的基础上,结合具体并行机的高性能特征而研制的。m p i c h 有 w i n d o w s 和u n i x l i n u x 版本,可以从官方网站免费下载,它们通常通过t c p i p 协 议运行。m p i 是在1 9 9 2 1 9 9 4 年开发出来的,它是基于消息传递的并行运算模式, 是关于消息传递的库函数的规范,而不是一门语言,它目前支持地语言有c 、c + + 和f o r t r a n 。很多公司和大学的实验室有m p i 的实现版本,它被广泛应用于各种并 2 第一章绪论 行计算机以及工作站集群。m p i 大约有2 1 0 个函数,但是在时域有限差分程序中, 通常只需要其中的十几个函数就可以满足需要。 实现并行计算有两条可供选择的路线:一是在现有串行算法基础上进行并行 化;二是直接从数学物理问题出发,面向并行系统研究并行计算方法。这里,我 们在现有串行f d t d 算法基础上通过区域分割技术进行并行化处理。 m p i 并行程序和串行程序没有很大的差别,它们通过对m p i 函数的调用来实现 特定的并行算法。一个m p i 并行程序主要由3 部分组成: ( 1 ) 进入并行环境:调用m p i i n i t 启动并行计算环境,包括在指定的计算结 点上启动构成并行程序的所有进程以及构建初始的m p i 通信环境和通信器 m p i _ c o m mw o r l d ,m p i c o m m s e l f 。 ( 2 ) 主体并行任务:这是并行程序的实质部分,所有需要并行完成的任务都 在这里进行。在这个部分中,实现并行算法在并行计算机上的执行过程。 ( 3 ) 退出并行环境:调用m p i f i n a l i z e 退出并行环境。一般来说,退出并行 计算环境后程序的运行也马上结束。 并行计算是相对于串行计算而言的,并行计算分为时间上的并行和空间上的 并行。时间上的并行就是指流水线技术,而空间上的并行则是指用多个处理器并 发的执行计算。本文讨论的并行指的是空间上的并行技术。 对于具体的应用问题,采用并行计算技术的主要目的在于两个方面: ( 1 ) 加快求解问题的速度。例如,给定某应用,在但处理器上,串行执行需 要2 个星期( 1 4 天) ,这个速度对一般的应用而言,是无法忍受的。于是,可以借 助并行计算,使用1 0 0 台处理器,加速5 0 倍,将执行时间缩短为6 7 2 小时。 ( 2 ) 提高求解问题的规模。例如,在单处理器上,受内存资源2 g b 的限制, 只能计算l o 万个网格,但是,当前数值模拟要求计算1 0 0 0 万个网格,于是,也 可以借助并行计算,使用1 0 0 个处理器,将问题求解规模线性地放大1 0 0 倍。本 文讨论的并行计算技术的目的主要是第一方面提高运算速度。 并行计算之所以必需,主要在于当前的单处理器性能不可能t , 网4 4 - 足大规模科学 与工程计算及商业应用的需求,并行计算是目前唯一能满足实际大规模计算需求 的支撑技术。例如,即使是当前较为先进的微处理器,其峰值性能也仅为6 0 亿次 s 。近2 年内,微处理器的峰值性能也不会超过1 0 0 亿次s 。并行计算之所以可 行,主要在于,并发性是物质世界的一种普遍属性,具有实际应用背景的计算问 题在许多情况下都可以分解为能并行计算的多个子任务。 电子科技大学硕士学位论文 1 1 3 并行算法性能参数简介口8 3 给定并行算法,采用并行程序设计平台,通过并行实现获得实际可运行的并 行程序后,一个重要的工作就是,在并行计算机上运行该程序,评价该程序的实 际性能,揭示性能瓶颈,指导程序的性能优化。性能评价和优化是设计高效率并 行程序必不可少的重要工作。评价并行程序的性能之前,必须清楚并行程序的执 行时间是由哪些部分组成的。众所周知,独享处理器资源时,串行程序的执行时 间近似等于程序指令执行花费的c p u 时间。但是,并行程序相对复杂,其执行时 间等于从并行程序开始执行,到所有进程执行完毕,墙上时钟走过的时间,也称 为墙上时间。对各个进程,墙上时间可进一步分解为计算c p u 时间、通信c p u 时 间、同步开销时间、同步导致的进程空闲时间。 并行算法的性能主要通过下列三个因素评价: 1 、计算时间( 时间复杂度) 2 、所需要的处理器个数( 处理器复杂度) 3 、所需要的机器模型 两个用于分析并行算法性能的量是加速比甲和效率刀,它们体现了在并行计算 机上运行并行算法求解实际问题所能获得的好处。 根据串行和并行执行时间定义的不同,加速比有五种不同的定义。相对加速 比,实际加速比,绝对加速比,渐进实际加速比,渐进相对加速比。这里我们采 用传统的定义,解释如下文: 设一个已知最好的串行算法的问题,其计算时间为疋。针对相同问题的并行 算法的计算时间为t 和处理器个数p 。我们定义 下丁 加速比甲= l ,效率r = 二l 。 j r p p 1 p 加速比最大不超过处理器个数,加速比越靠近处理器个数越好。效率表明所有处 理器的有效利用率,最大值为1 。 1 2 粒子模拟并行计算国内外发展现状 电磁粒子模拟是上世纪六十年代开始发展的研究带电粒子在电磁场中运动及 其相互作用的一种理论研究方法。1 9 6 2 年,d a w s o n 首次将p i c ( p a r t i c l e i n c e l l ) 方法推广到粒子模拟中,其基本思想是将空间划分成多个网格,电场和磁场按网 4 第一章绪论 格离散分布,带电粒子分布在网格中,受到网格点上场的作用而运动,而粒子的 空间分布又影响电场和磁场,这样形成一个不断迭代的过程。1 9 6 9 年,b i r d s a l l 提出用有限大小粒子云模型代替点粒子模型,避免了点粒子模型中过高的库仑碰 撞频率,并使实际需要的粒子数减少一个数量级。 在计算机运算速度快速提高的支持下,粒子模拟研究方法得到了迅猛的发展 并逐渐成熟起来。它通过直接对m a x w e l l 方程和带电粒子运动方程数值积分求解, 直接给出电磁场和带电粒子运动的物理图象。经过三十多年的快速发展和不断完 善,在微波电子学、等离子体电子学和相对论电子学研究领域,目前世界上有三 套电磁粒子模拟软件较为成功。它们是美国m r c 公司开发的m a g i c 软件,德国c s t 公司开发的m a f i a 软件以及俄国的k a r a t 软件哼1 。现在,这些软件正作为高技术产 品广泛应用于微波放大器、天线、传感器、光纤、激光、加速器组件、束传输、 脉冲功率、等离子体开关、微波等离子体加热、离子源、场发射器件、半导体器 件、波散射和耦合分析等的研究和器件设计中。 国内在通用性较强的大型粒子模拟软件编制方面起步较晚,主要是在“十五” 期间,开始投入通用电磁粒子模拟软件的研究和开发工作。最为重要的两个软件 项目为诬安交通大学的u n i p i c 和电子科技大学的c h i p i c 。目i i i u n i p i c 已经发布 了1 0 正式版,c h i p i c 已经发布了3 o 正式版。根据测试结果,都能正确模拟速 调管、返波管、虚阴极和m i l o 等一些重要的高功能微波器件,并且有基本的图形 界面输入和后处理程序。 另外,国内的一些高校和研究单位也对粒子模拟的并行计算进行了研究。国 防科技大学在2 0 0 1 年开发了激光钻孔问题的2 5 维粒子模拟并行程序,2 0 0 4 年开 发了激光和低密度等离子体薄靶相互作用问题的三维粒子模拟并行程序,并对计 算结果进行了验证和分析。 1 3 研究意义及主要工作 1 3 1 研究意义 c h ip ic 是一个高功率微波电磁粒子模拟软件,电磁场的数值计算模块是其核 心模块,提高电磁场计算速度对改善软件的运算能力和竞争力有着举足轻重的作 用,并行计算是粒子模拟的必然趋势。 粒子模拟计算量随维数呈幂次方( 指数) 变化,所以在粒子模拟中:总是尽量 把模拟问题处理成维数尽量低的模拟问题。如果粒子在某一方向上的运动( 包括 电子科技大学硕士学位论文 自洽场) 完全一致,就没有必要对这一方向的不同带电粒子的运动作重复计算, 而只要把它看成一系列在这一方向的固体柱。这样,就只要考虑这些柱在其他两 个方向上的运动,大大节省了计算时间,问题就成了二维运动问题。基于本目的, 本论文主要研究c h i p i c 软件2 5 维版本冷腔模拟并行算法。 1 3 2 论文的主要工作及章节构成 论文的主要工作是设计并实现二维直角坐标、柱坐标和极坐标下时域有限差 分算法的并行算法及二维时偏算法n 叫妇的并行算法,通过例子测试,证明了并行工 作的正确性和高效性。 本文共分为五章。第一章介绍粒子模拟并行算法的基础知识,包括粒子模拟 和并行计算基本概念和粒子模拟软件国内外发展现状;第二章讨论c h i p i c 软件2 5 维版本中二维直角坐标系并行算法的设计与实现,从麦克斯韦旋度方程入手,推 导出方程的f d t d 差分离散公式,再利用t e 波和t m 波之间的对偶关系,推导统一 适用于t e 波和t m 波情况的迭代关系式,采用适当的区域分解和数据交换技术, 根据“分而治之”的并行算法设计思想,完成并行算法设计,实现并行计算。第 三章讨论c h i p i c 软件2 5 维版本中柱坐标和极坐标系并行工作的展开,主要针对 柱坐标和极坐标中特殊点的特殊处理,设计出高效而准确的并行算法。第四章讨 论了二维时偏算法模块的并行实现。根据时偏算法在场方面做的两方面改进,分 析其稳定性条件,设计出边界处理方案,完成并行工作。第五章作了总结。 6 第二章c h i p i c 直角坐标系一f - - 维冷腔模拟的并行算法研究 第二章c p ic 直角坐标系下二维冷腔模拟的并行算法研究 c h i p i c 电磁场求解采用的核心算法是时域有限差分算法( f d t d ) ,具体的包括 中心差分算法、时偏算法等,时偏算法将在第四章讨论,这里只讨论直角坐标系 下中心差分算法的并行实现。 2 1c pic 二维直角坐标系下电磁场求解 本节从麦克斯韦旋度方程n 2 m 1 入手,推导出二维直角坐标系下符合c h i p i c 程 序运算要求的f d t d 差分离散公式,并介绍解的稳定性条件、初始条件和边界处理 技术。 2 1 1 差分格式的建立1 4 - 1 5 3 电磁场的变化满足麦克斯韦旋度方程 vx h :望+ 了 ( 2 1 ) 研 v 一e = 一警一瓦 悟2 ) 其中,e 是电场强度,d 为电通量密度,h 为磁场强度,b 为磁通量密度, 为电流密度,。为磁流密度。 各向同性线性介质中的本构关系为( 2 3 ) 式 d = 孑e - - - 6 r 占oe b = z h = ,ohi 一:仃e je 一 q 书) = 仃i i jm =omh 其中占表示介质电容量,占,表示相对电容量,s 。表示真空电容量,表示磁 7 电子科技大学硕士学位论文 导率,表示相对磁导率,。表示真空磁导率,仃表示介质电损耗,口。表示介 质磁损耗。 对于二维问题,设所有物理量均与z 坐标无关,即8 & = 0 ,于是由( 2 - 1 ) 、 ( 2 2 ) 式可得( 2 - 4 ) ( 2 - 9 ) 式 鲁一哆+ 警 4 , 叩。鲁= 一哆一警 浯5 , 鲁= 一嘭+ 警一等 浯6 , m 譬:一要一吒h x ( 2 - 7 ) 以孑一畜一吒x m 。等:等一吒髟( 2 - 8 ) 以oi 2 i 一吒爿y m 。譬:一等+ 冬1 皿 ( 2 - 9 ) r o _ 萨2 一i + 畜一盯m 爿z 2 9 ) 这六个偏微分方程是构成二维f d t d 算法的基础。显然,二维情况下电磁场的 直角分量可划分为独立的两组,即e ,q ,h :为一组,称为对于p :的t e 波,如 ( 2 4 ) ( 2 5 ) ( 2 9 ) 式;h ,h y ,疋为一组,称为对p :的t m 波,如( 2 6 ) ( 2 7 ) ( 2 - 8 ) 式。在f d t d 离散时,采用空间y e e 元胞,如图2 - 1 所示,每个磁场分量 由4 个电场分量环绕着;反过来,每个电场分量也由4 个磁场分量所环绕。为了 获得二阶精度,采用蛙跳格式,将场分量在时间上相差半个步长交替计算n6 | ,如 图2 - 2 所示。差分方程的求解过程就是电场分量和磁场分量的递推求解过程。通 过相差l 2 个时间步长的电场和磁场交替步进,可以实现时间上的推进。由图2 - 2 所示,已知秀的n 时刻和万的n + 1 2 时刻值,就能推出面的n + 1 时刻值。同理, 得到秀的n + l 时刻值后,结合已知一h 的n + 1 2 时刻值,可以得到万的n + 3 2 时刻佰。这种方式模拟了时间椎移,即物理量随时间的演化i 寸稗。二维f d t d 中一e 、 第二章c h i p i c 直角坐标系下二维冷腔模拟的并行算法研究 日各分量空间节点与时间步取值的整数和半整数如表2 1 所示,其中n 表示时间步 长的个数。 i 9 : 巴 e x : 盲;) _ 矿 r z专y p 。c z + 主,+ 互1 ,c z + t ,+ 圭, ( a ) t e 波 h。x t m 波的y e e 元胞 ( b ) t m 波 表2 - 1t e 波和t m 波的y e e 元胞中e 、h 各分量节点位置 分量取样 电磁场分量时间轴t 取样 x 坐标y 坐标 1 1 1 h z z + 一 : 一2 刀+ 一 22 i t e 波 e x z + 一 j 刀 2 i e y z j 七i ” 厶 e z z 1 以 11 t m 波 h x z ,+ 三 万+ 一 2 1 1 h y z + 一 )以+ 一 22 9 电子科技大学硕士学位论文 ,e 电磁场。 占 n + l 2n + 3 2 图2 - 2 电磁场求解的蛙跳过程 下面我们考虑( 2 - 4 ) ( 2 - 9 ) 式的差分离散。一个时变参量一般既与空间 坐标有关,也与时间变量有关。为了表示方便,把时间变量写在其代表符号的右 上角,并采用下面的简化表示方法: 令f ( x , y ,z ,t ) 代表e 或日在直角坐标系中某一分量,在时间和空间时域中的离 散取以下符号表示: f ( x ,y ,z ,t ) = f ( i a x ,j a y ,k a z ,n a t ) = f ”( f ,歹,尼) ( 2 1 0 ) 对f ( x ,y ,z ,t ) 关于时间和空间的一阶偏导数取中心差分近似,即 望( 兰! ! ! 三! ! ! i三! ( ! 二量:兰:! 二三:( ! 二墨:兰:竺3 锄 l x :心 a x 笪! 兰! 上! 三! ! ! l三! ( ! :三二圭:! 二三! ! :兰二量:1 3 a y i y :脚 a y 望! 兰! ! ! 三! 尘i三:( 2 兰:竺二圭二乏:( ! :兰:竺二圭 瑟 1 ) ,:脚 a z 翌业! 型l :! 虹生! 二:! 虹盟 a t i f :。f a t ( 2 - 1 1 ) 其中式( 2 - 1 1 ) 中第三式恒等于0 ,并用到平均近似法 e 气1o ,小型掣( 2 _ 1 2 ) 这样做是为了在离散式中只出现表2 1 所示的各个场分量节点。实际上这一 l o 第二章c h i p i c 直角坐标系一f - - 维冷腔模拟的并行算法研究 根据图2 - 1 的划分关系和表2 - 1 的对应关系,将( 2 4 ) ( 2 9 ) 式中六个 电磁场分量方程按照( 2 - 1 1 ) 和( 2 - 1 2 ) 式表示方法表示成时间和空间的差商形 式,可以得到c h i p i c 软件在直角坐标系下求解场f d t d 的差分格式。 以( 2 4 ) 式为例,二维中,z 专o o ,设观察点g ,y ) 为e ,的节点,即( f + l 2 ,j ) 以及时刻t = n a t ,有 氏煎一1 1 j ) :兰! :! :! ( ! 二墨:三二圭) 二兰! :! ! ( ! 二圭:兰二墨) 。2 一。3 , 一盯虫二垃生趔 烈气1 ,小幕小夕1 ) 。 日:+ 1 坨( z + j 1 ,+ 三) 一日:+ 1 坨( t + j 1 ,一三) 。兰矗士一o r 匈 考虑无电损耗和磁损耗,即仃= 仃。= 0 ,有 f q f + 1 i i ( 同理可得( 2 5 ) ( 2 9 ) 式的差分格式( 2 1 6 ) ( 2 2 0 ) ( 2 - 1 4 ) ( 2 - 1 5 ) ( 2 - 1 6 ) 得理整 l 一2 一 l 一2 + 日一 】一2 h、 + , 一矿 十 l 一2 ,、 _ + h r , 酬以 q 州 = r , 一2一砂。卜2。一缈 缸 一 + 1 2 + 1 2 一 肿: h一 、,一2 、12, + + 1 2 ,、 + n y , 】 、e i | r 、厂日、12,厂j_j + 0 一 p 上血 心缸 一y 一 , 髟 土气 q 一 电子科技大学硕士学位论文 6 r e n + 1 g ,) = 0 e ( f ,) 一吉r 古 h :+ 1 他( 歹+ 圭) 一日:“坨( ,一圭) + 吉r 去 日;+ 1 彪( z + j 1 , 一日y n + l 坨( z 一五1 ,歹) ( 2 - 1 7 ) h :+ t 1 2 ( “+ 三) 叫圳2 ( “+ 丢) 一去础1 缈。陋+ 1 ) 叫) 】( 2 - 1 8 ) 髟n + l 2 ( z + _ 1 小巧m ( z + - ,1 小去心1 缸,陋趔) 】 h n + l 2 ( z + j 1 ,歹+ 圭) = 日;。1 坨( z + j 1 ,+ 五1 ) + 去心1 缈m + _ ,1 川) 一f ( 1 ,切 一去心1 血m 川一三) 面+ 圭) 2 1 2 迭代关系式的建立 ( 2 - 1 9 ) ( 2 - 2 0 ) 在c h i p i c 中,不考虑磁性介质,即从= 1 ,并考虑无电损耗和磁损耗,即 o r = 仃。= 0 ,对于相对介质电容量i ,只考虑如下情形: 于是有 f 6 r 1 i :l0 1 0 001 i 2 0 l 0 ,j 。卜1 ) 屯( f + 1 ) + b f 封矿2 ”1 + 爿 + b 从封矽2 1 1 1 2 ( 2 - 2 1 ) ( 2 - 2 2 ) 第二章c h i p i c 直角坐堡墨! 三丝堡壁垡塑塑堑堑篁鲨竺塑一一二- 二一一 。:e ;“( 屯,+ 圭 = s ,:e ;( z ,- ,+ 三i _ ) 日:“,2 0 ,+ 圭) = 日:以心( z ,+ 丢) + ( 去,专) e ;o ,- ,+ ( 一去t 。专 。e :o ,歹+ 1 , 日,n + 1 1 2 ( z + 割州他( 气i ,j ) + ( 一去r 去) e ;g ,歹,+ ( 去z 去) 。e ;o + 1 , ( 2 2 3 ) 71 _ 三l ( 2 - 2 4 ) j 2 i ) 一五j ( 2 2 5 ) ( 2 - 2 6 ) 日:n + i 2 ( z + 圭,一,+ 圭 = 日;。1 佗( z + 圭,歹+ 互i ) 十( 三了t 专) e :( z + 去,j + _ ) + ( 一去r ,古) ,e ! ( f + 圭,) ( 2 2 7 ) + ( 一去t 去 e ;( z + ,歹+ 丢) + ( 去。r 去) ,e ;( ,+ 圭) 设变量烈y n , 刎分别表示x 、y 和z 方向的网格数,其中,z n = 1 。? 警銮 个大二、x :v , r n 的一维数组e 1 、e 2 、e 3 、h 1 、h 2 和i - 1 3 分别存储各网格点的电场 1 3 1l一2、 十 1 2 + l 一2 儿 + 1 2 厂一 卜 他 “ 他 日 卅1 卜厂旧 三缸劫 卜 : a i 一。一| ,l,l + 缸 出 一知一 ,_ 一 、, + 12、 - , 1 2 - 1 - ,一 办川l 刚暇 攫卜厂啊 三母爿凇一母岛 a 一 以 一 “ 一 一。 n z - 【一 矽一【,一1一,l,。、 一一 皇兰型垫奎堂堡主堂垡笙銮 跳) h e 卜1 ) 跳付o p r 2 e y ( “+ 乏i ) 硼付以+ j 1 ) h 2 ( i ,j ) h y i 歹) 删h h z ( i + 1 + 互1 ) ( 2 - 2 8 ) 丁足衔到以r 龙7 5 q 1 7 l 异大尔y - k , : e l ( i ,) = e 1 ( i ,j ) + ( 去半木专) 木h 3 g 功+ ( 一去术缸木专) 串日3 0 ,一, + 廿删+ b 舭卦删 , + 毋嘶,+ b 垃枣毋嘶叫 + b 舭廿删川+ l 蛐宰1 1 峨 h l ( i ,) = h 1 g ,) + ( 去木f 木专) 半去木e 3 0 + f ,一上水f 半士、1 水上半e 3 ( f ,+ 1 ) l z o缈s r 3 一 。 1 4 ( 2 - 2 9 ) ( 2 - 3 0 ) ( 2 - 3 1 ) ( 2 - 3 2 ) 第二章c h i p i c 直角坐标系下二维冷腔模拟的并行算法研究 瓦1 * e 3 ) + b 胁1 宰去幅力 q 弋3 h 3 ( i ,s ) - - m ( i ,) + ( 去木垃术古 串去宰e + ( 一瓦1 水垃木专 木击木e 幻, c 2 谢, + ( 一瓦1 木缸木去) 宰去宰e 2 ( f 扎,2 ) + ( 去宰出木去 木去木e 2 g 其中垃为时间步长,缸、少和z 分别为x 、y 和z 方向的网格步长。 在实际c h i p i c 软件的程序处理中n7 1 ,电场分量和磁场分量的计算式可以处理 成如下形式( 2 - 3 5 ) ( 2 4 0 ) : e l ( i ,j ) = e l ( i ,j ) + h 3 1 m 木h 3 ( i ,) + h 3 1 p 木h 3 ( i ,j 一1 ) e 2 ( i ,j ) = e 2 ( i ,) + h 3 2 p 水h 3 ( i ,j ) + h 3 2 m 木h 3 ( i l ,) e 3 ( i ,j ) = e 3 ( i ,歹) + h 3 1 p 幸h l ( i ,) + h 3 1 m 木h l ( i ,j 一1 ) + h 3 2 m 木h 2 ( i ,j ) + h 3 2 p 木h 2 ( i 一1 ,_ ,) h l ( i ,j ) = h l ( i ,j ) + e 3 1 p 木e 3 ( i ,j + 1 ) + e 3 1 m 书e 3 ( i ,j ) h 2 ( i ,j ) = h 2 ( i ,j ) + e 3 2 m 木e 3 ( i + l ,j ) + e 3 2 p 木e 3 ( i ,j ) h 3 ( i ,) = h 3 ( i ,j ) + e 1 3 m 术e 1 0 ,j + 1 ) + e 1 3 p 幸e l q ,j ) - i - e 2 3 p 毒e 2 ( i + 1 ,j f ) + e 2 3 m 宰e 2 ( i ,歹) 2 1 3 解的稳定性条件 ( 2 - 3 5 ) ( 2 - 3 6 ) ( 2 - 3 7 ) ( 2 - 3 8 ) ( 2 - 3 9 ) ( 2 - 4 0 ) 空间网格步长和时间步长必须满足时域有限差分的数值稳定条件,即满足关 系式( 2 4 1 ) : c a t 其中c 是模拟计算空间中电磁波的最大速度。 1 5 ( 2 - 4 1 ) 、_、,、 一r上缸 日 出 = 宰 力上鳓 2 , 一 、舵弋 电子科技大学硕士学位论文 2 1 4 边界条件的处理 由于使用的计算机硬件资源有限,所以必须定义一个封闭的模拟区域以控制 模拟中计算机的存储耗费。封闭模拟区域根据实际情况的不同有导体、介质,分 别对应不同的处理方法和差分格式。另外,器件一般都有电磁波的输出口,电磁 波通过输出口存在于无限空间。对于这种开放边界,采用的方法是在网格截断处 设置一种吸收边界条件,使传输到截断处的波被边界吸收而不产生反射,从而起 到模拟无限空间的目的。c h i p i c 采用的吸收边界条件为g e d n e y 提出的完全匹配层 ( p m l ) 。它将电、磁场分量在吸收边界区分裂,并能分别对各个分裂的场分量赋 以不同的损耗。这样一来,就能在f d t d 网格外边界得到一种非物理的吸收媒质。 2 1 5c pic 冷腔串行模拟流程 c h i p i c 的冷腔模拟流程分为以下几个阶段: 首先对输入文件进行解析,对模拟过程进行初始化。具体包括的工作有网格 划分,网格步长的设定和时间步长的设定;各网格点介电常数、导电率等变量的 设定;各网格面边界条件的设定及其它相关变量的设定。 其次按时间步长迭代计算电场和磁场值,加上边界条件的处理,构成整个按 时间递推的模拟过程。每个时间步长的处理过程按网格面的顺序进行电磁场的迭 代和边界条件的处理。 最后是数据的后处理,包括根据用户需要对相关的计算结果进行保存,输出 日志文件等。 整个处理的简易流程图如图2 4 所示。 1 6 第二章c h i p i c 直角坐标系一f z 维冷腔模拟的并行算法研究 图2 4c h i p i c 简易流程图 1 7 电子科技大学硕士学位论文 2 。2c h i p i c 二维直角坐标冷腔模拟并行算法设计与实现 在这里,我们需要澄清一个基本概念。我们把一完整的任务分为若干份,每 一份称为一个子区域。一个子区域被分配给一个处理器,每一个子区域的模拟称 为一个进程。m p i 面对的是进程而不是子区域或处理器,但通常我们并不严格区分 子区域和处理器,我们说子区域之间的信息交换或说处理器之间的信息交换具有 相同的意义。 2 2 1 模拟区域分解方法n 8 1 模拟区域的划分可以采用一维划分、二维划分和三维划分。目前,c h i p i c 采 用一维区域划分,如图2 - 5 所示。 原始区域分解区域 饿褫戮戮戮戮戮戮躺旒渊黪| 麓黼 雾1 | ,一,1 。、,一,i t l 二i 孽引篙77 霪溪 巍+ 。概;兢,。彩幺;,善。二锄,么越籀2 口旋眩么缎& 貔,么纛;i 。# 孩潼戮纰盘;麓l i ;锄。菇孱 原始区域分解区域 图2 5 区域一维划分示意图 2 2 2 数据交换

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论