多核处理器体系结构及并行程序设计课件_第1页
多核处理器体系结构及并行程序设计课件_第2页
多核处理器体系结构及并行程序设计课件_第3页
多核处理器体系结构及并行程序设计课件_第4页
多核处理器体系结构及并行程序设计课件_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多核处理器体系结构及并行程序设计1Outline多核处理器简介并行程序设计方法学(PCAM)科研及技术(天津大学SRDC及IBM技术中心)2

Outline多核处理器简介并行程序设计方法学(PCAM)科研及技术(天津大学SRDC及IBM技术中心)3

为什么要采用多核技术?5

最终目标:提升用户的体验摩尔定律——不断发展和改进处理器的性能最大限度地利用越来越多的晶体管实现最优的价值缩减处理时间,提高计算能力开发平台的新特性和新功能6

通过并行方式改进处理器的性能2005+Dual-andMulti-core2-waySMPsystem4Cores>4Threads2001Hyper-Threading2-waySMPsystem2Cores4Threads1995Multi-processing2-waySMPsystem2Cores2Threads7

几种不同的技术HT–HyperThreading:

2threadsrunningonthesameprocessorcore处理器上的某些资源会被共享使用相同的缓存和运算器DC–DualCore:

2executioncoresinthesameprocessorpackage共享系统总线与双处理器的性能相同DP/MP–Dual/Multi-Processing:

2ormoreprocessorsinthesamesystem只共享系统总线,独立缓存高性能,资源冲突少9

双核技术VS.超线程技术双核是真正意义上的双处理器不会发生资源冲突每个线程拥有自己的缓存、寄存器和运算器一个3.2GHzSmithfiled在性能上并非等同于3.2GHzP4withHT的2倍HT使处理器的性能至少提升了1/3双核的性能相当于2块non-HT处理器双核技术与HT技术在性能上的对比Ex1:两个floatingpoint线程(Smithfieldclient)每个线程拥有自己的FPU,没有资源冲突尽管性能上没有提升太多,但仍然优于HTEx2:一个integer线程与一个floatingpoint线程性能大幅度提升没有资源冲突10

Singlecore,WithHT(Eg.Pentium4ProcessorWithHT)IntegerandFloatingPointThreadsL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPoint2threadscanbeexecutedatthesametime(perprocessor)ifthey’renotcompetingforthesameexecutionresource11

Dualcore,WithoutHT(Eg.PentiumDProcessor)TwoFloatingPointThreadsL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPointL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPointEven2floatingpointthreadscanbeexecutedatthesametimenow(perprocessor)astherearemultiplefloatingpointexecutionunits13

Dualcore,WithHT(Eg.DualCorePentiumProcessorExtremeEdition)SupportsHTMultipleIntegerandFloatingPointThreadsL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPointL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLBFloatingPointWithdualcore&HTtogether,maximum#ofthreadsthatcanbeexecutedatatimeis4perprocessor14

多核技术与超线程技术的结合产量…多功能…功效Core0Core1FrontSideBusDualCorewithHyper-Threading4threads/socket

Core0Core1FrontSideBusDualCore2threads/socket

15

多核面临的困难如何计算软件授权?按CPU个数收取软件授权费用按芯片个数收取软件授权费用应用软件是否支持?如果应用程序是基于多处理器编写的如果应用程序是基于单处理器编写的双核发热大,散热是难题17

DualCore、SMP、Cluster

体系结构特性SMP(对称多处理机)Cluster(集群)DualCore处理器单一主机,多个处理器多台主机,有各自的处理器(一或多)单一主机,单一处理器,多个核心操作系统单一多个单一主要并行计算方式多进程,内存共享多进程,基于消息传递多线程18

Outline多核处理器简介并行程序设计方法学(PCAM)科研及技术(天津大学SRDC及IBM技术中心)19

PCAM设计方法学设计并行算法的四个阶段划分(Partitioning)通讯(Communication)组合(Agglomeration)映射(Mapping)划分:分解成小的任务,开拓并发性;通讯:确定诸任务间的数据交换,监测划分的合理性;组合:依据任务的局部性,组合成更大的任务;映射:将每个任务分配到处理器上,提高算法的性能。21

PCAM设计过程22

域分解划分的对象是数据,可以是算法的输入数据、中间处理数据和输出数据;将数据分解成大致相等的小数据片;划分时考虑数据上的相应操作;如果一个任务需要别的任务中的数据,则会产生任务间的通讯;23

功能分解划分的对象是计算,将计算划分为不同的任务,其出发点不同于域分解;划分后,研究不同任务所需的数据。如果这些数据不相交的,则划分是成功的;如果数据有相当的重叠,意味着要重新进行域分解和功能分解;功能分解是一种更深层次的分解。25

划分判据划分是否具有灵活性?划分是否避免了冗余计算和存储?划分任务尺寸是否大致相当?任务数与问题尺寸是否成比例?功能分解是一种更深层次的分解,是否合理?26

组合组合是由抽象到具体的过程,是将组合的任务能在一类并行机上有效的执行;合并小尺寸任务,减少任务数。如果任务数恰好等于处理器数,则也完成了映射过程;通过增加任务的粒度和重复计算,可以减少通讯成本;保持映射和扩展的灵活性,降低软件工程成本;29

组合判据增加粒度是否减少了通讯成本?重复计算是否已权衡了其得益?是否保持了灵活性和可扩放性?组合的任务数是否与问题尺寸成比例?是否保持了类似的计算和通讯?有没有减少并行执行的机会?30

映射每个任务要映射到具体的处理器,定位到运行机器上;任务数大于处理器数时,存在负载平衡和任务调度问题;映射的目标:减少算法的执行时间并发的任务不同的处理器任务之间存在高通讯的同一处理器映射实际是一种权衡,属于NP完全问题31

映射判据采用集中式负载平衡方案,是否存在通讯瓶颈?采用动态负载平衡方案,调度策略的成本如何?32

Outline多核处理器简介并行程序设计方法学(PCAM)科研及技术(天津大学SRDC及IBM技术中心)33

技术力量天津大学IBM新技术中心()共享大学研究(SUR)软件技术培训Lotus(协同工作)WebSphere(J2EE)Rational(应用程序设计与开发)DB2(数据库与商务智能)AIX/Linux(操作系统管理)Eclipse(程序开发,IDE设计)全球专业认证34

科研情况天津大学软件研究与开发中心()网格计算,分布式与并行计算可视化与图像处理虚拟现实数字艺术与动画真实感图形网络与信息安全智能Agent,语义网嵌入式系统35

LotusWorkplace产品家族LotusDomino(服务器,邮件及应用程序)LotusNotes(客户端)LotusDesigner(应用程序设计开发环境)LotusDocumentManager(文档管理)LotusWorkflow(工作流)LotusEnterp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论