高精度_CT_图像重建的并行运算实现_第1页
高精度_CT_图像重建的并行运算实现_第2页
高精度_CT_图像重建的并行运算实现_第3页
高精度_CT_图像重建的并行运算实现_第4页
高精度_CT_图像重建的并行运算实现_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高精度高精度 CT 图像重建的并行运算实现图像重建的并行运算实现 印胤,刘力,孙功星 (中国科学院高能物理研究所,北京 100039) 摘要摘要:为解决超大图像(20482048)的 FBP 与 OR-OSEM 图像重建,我们采用 PC 机群的并行处理技术。将图像重建算法改写为并行运算方式,按角度数均匀地分配计算任务 给各个 CPU。 本文并行运算结果表明: 图像重建速度与 CPU 的个数基本上成线性正比关系, 可提高近 25 倍(CPU 数为 25 时) 。超大图像的在线重建可采用 CPU 阵列机来高速实现, 这一技术对发展高精度 CT 具有重要的作用。 关键词关键词:并行运算 CT 图像重建 中图分类号中图分类号:TP39; TP317.4 文献标识码文献标识码:A 0引言引言 计算机断层成像技术(Computed Tomography, CT)广泛应用于人体组织成像、 工件无损断层检测等领域,大尺寸物体或较高空间分辨都会导致大的重建矩阵, 比如 10241024 或 20482048。如今CT重建最常用的算法是滤波反投影法 (Filtered Backprojection,FBP),常规医用CT的图像矩阵大小是 512512,采用 专用工作站重建时间约为 10 秒/层,但对上述高空间分辨的图像重建,由于其计 算量巨大为,其计算所耗时间在实际应用中很难被接受。同样的问题也存 在于迭代算法中。国内外已有人尝试用多CPU并行技术解决低分辨(图像大小 10241024) ,目前涉及并行运算的报道较少。本文在这方 面对使用多CPU并行计算FBP和一种改进的有序子集最大期望值迭代重建法 (Over-Relaxation ordered Subset Expectation Maximization, OR-OSEM)进行了有益 的尝试,并给出了模拟实验结果。结果证明利用并行运算可大大提高计算速度, 使在线重建成为可能。 1重建数据的生成重建数据的生成 图 1 是等角三代采样的 CT 扫描一个断层的示意图 Y D S max X FOV O R 图 1 一个断层的扇束扫描示意图 1 图中 FOV 是被测物一个断层所在有效扫描视野 (半径 R) , O 点为旋转中心, max 为最大扇束张角,D 为弧状探测器阵列,D 完全覆盖经过 FOV 的射线束; 采集方式可以是 X 光源与探测器 D 同时绕 O 点转动,也可以是被测物体转动。 可算出投影数据为: ),(mny= (1) ji jifmnjia),(),( 其中i , j = 1, 2, 3 N为图像像素指标;n = 1, 2, 3 K为扇束指标;m = 1, 2, 3 M 为探测器小条(bin)指标;代表第n扇束中第m条射线(落入第m个 bin)的投影测量值,f(i,j)为像素值,在CT中,即代表了密度分布。参数矩阵 元素为第(i,j)像素在第n扇束时对第m个bin的投影(衰减)贡献因 子,为表述方便,后文统一用代替。 ),(mny ),(mnjia ji a , 本文实验中取最大扇束张角 max ,其它参数为:N2048, K3600, M2048。所用仿真模型和算出相应的实验投影模拟数据,见图2: 15 (a) (b) (c) 图 2. (a) 仿真断层模型 (b) 模型局部放大(图(a)中白框区域) (c) 相应的模拟投影数据(横坐标是角度编号,纵坐标是探测器编号) 2 2重建算法的分析重建算法的分析 重建就是由投影数据反求出断层的密度分布。滤波反投影FBP重建的公式4 可写为: ),(jif= (2) nm ji a , ),(mnQ 其中Q是经斜坡滤波器(Ramp)滤波后的投影。 采用此公式重建的优点是有利 于引入各种校正算法,重建结果精确,缺点是计算量较大,所用参数数据量大。 利用参数间存在的对称关系,可减少存储量,并且参数的读入可在程序的初始化 阶段进行,所以并不影响实际反投影的时间。 对于高精度图像重建,巨大的角度数及图像矩阵往往造成计算量很大 (数量级) ,但FBP反投影过程中,3600个角度求和是相互独立的,这就 为使用并行运算创造了条件。 )( 3 NO OR-OSEM是在OSEM基础上引入了超松弛因子(Over-relaxation, OR), 起到加 快收敛的作用,其计算公式为5: += + 1 ),( ),( 1),(),( , , , 1 kk k kk s ji s Sn jiSnSn a mny mny azjifjif (3) 其中n为迭代次数;表示在第n次迭代时, 用第k个子集重建的图像; 表示将所有N个投影角度分为S个子集合;为第次迭代 后图像在投影线(n,m)的前投影值: k Sn f ,k s Sk, 2 , 1L=),( , mny k Sn n ),(),( , jifamny k k k Sn S jisn =。当时, 取常数初值,z为超松弛因子。由(3)式可以看出,在一次完整迭代过程中, 图像被更新S次,称为次子迭代。 0=n k Sn f , S OR-OSEM算式中反投影部分),(),( , jifamny k k k Sn S jisn =,及前投影部分 k k s Sn ji mny mny a ),( ),( , , 分别在一个子集内的各求和项相互独立, 同样可以用并行运算。 3实验条件及结果实验条件及结果 硬件环境描述:采用高能所计算中心自行研制的PC机群系统,该PC机群 由16个双CPU的节点组成,节点的CPU采用AMD公司生产的Athlon 3 MP-1800+,并配备512MB的DDR内存,节点机与服务器采用100Mbps的快速 以太网进行连接。系统运行RedHat 7.2操作系统,该版本的操作系统自带MPI (Message Passing Interface)并行编程环境。 首先, 采用FBP算法重建模型数据。 分别设置参与运算的CPU数量为1,2, 3,5,6,9,10,15,25;按角度数把计算任务平均分配到各个CPU上,得到 的反投影CPU时间见表1。 表 1. 不同 CPU 个数时,2048*2048 图像的 FBP 重建计算时间 CPU 数 1 2 3 5 6 9 10 15 25 时间 (s) 2582.84 1359.43 860.38517.80432.14288.07259.31 172.89 106.54 做出加速倍数与CPU个数之间关系的曲线,如图3: 图 3. 不同 CPU 个数重建时相对于单个 CPU 的加速倍数曲线 并行运算结果表明:图像重建速度与CPU的个数基本上成线性正比关系, 在本例中相对于单个CPU可提高近25倍(CPU数为25时) 。 本质上1个CPU与25个CPU重建的结果是一样的,结果如图4所示: (a) (b) 图 4. FBP 重建结果及局部放大图像 4 采用25个CPU,用OR-OSEM算法重建同样的图像。为使每一子集都有相同 的投影个数且为4的整数倍,这样对25个CPU而言,为最大限度利用CPU资源 并简化并行运算程序,子集个数的选定不是任意的。引入大于1的超松弛因子则 是在子集不能任意划分时提高重建速度的一种有效方法。 本次实验我们采用的子 集数为36(即每次子迭代每个CPU负责四个角度的前、反投影) ,超松弛因子z 1.5;迭代两次,时间为505秒,给出重建结果图像见图5。欲得到更好的迭代 图像,可采用更大的子集划分或更多的迭代次数,有关图像质量与子集个数、迭 代次数的关系,参见文献6。 (a) (b) 图 5. OR-OSEM 重建结果及局部放大 4讨论与总结讨论与总结 上述实验结果说明,图像重建领域中常用的FBP和OSEM/OR-OSEM方法 都可改写为并行运算方式并由多CPU阵列高速实现,并行计算特别适合于超大 图像重建的任务,可获得较好的加速效果。从本文FBP重建结果看,其加速比 近似等于所用CPU数。随着芯片和系统集成技术的不断发展,为多CPU并行计 算所需花费的硬件开销将不断减少,所以它将是高精度CT在线重建领域非常有 希望的一项技术,有着巨大的潜在应用前景。 参考文献参考文献 1Johnson CA, Sofer A,A Data-Parallel Algorithm for Tomographic Image RecontructionA, Proceedings of the 7th Symposium on the Frontiers of Massively Parallel Computation, IEEE Computer Society Press, 1999, P126 5 2 D W Shattuck,J Rapela etc,Internet2-based 3D PET Image Reconstruction Using a PC ClusterJ, Phys Med Biol, 2002,47:2785 3毛希平,图像重建技术在并行处理系统中的应用J,小型微型计算机系统, 2000,21(3):289 4Kak A C, Slaney M, Principles of Computerized Tomographic ImageM,New York: IEEE Press, 1988 5刘力,吴朝霞,赵书俊,具有超松弛因子的 OSEM 重建算法J,中国图像图形学报,2002, 7(8):814 6吴朝霞,刘力,柴新禹等,基于不同子集的 OSEM 快速迭代重建算法研究J,仪器仪表学 报,2002,23(4):408 High Spatial Resolution CT Image Reconstruction Using Parallel Computing YIN Yin,LIU Li, SUN Gong-xing (Institute of High Energy Physics, Chinese Academy of Sciences, Beijing 100039) Abstract: Using the PC cluster system with 16 dual CPU nodes, we accelerate the FBP and OR-OSEM reconstruction of high spatial resolution image (20482048) . Based on the number of projections, we rewrite the reconstruction algorithms into parallel format and dispatch the tasks to each CPU. By parallel computing, the speedup factor is roughly equal to the number of CPUs, which can be up to about 25 times when 25 CPUs used. This technique is very suitable for real-time high spatial resolution CT image reconstruction. Key words: parallel computing CT image reconstruction 基金项目:中国科学院创新基金(U-512) 作者简介: 印胤(1978-) ,男,毕业于北京工业大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论