并行计算与多核程序设计_第1页
并行计算与多核程序设计_第2页
并行计算与多核程序设计_第3页
并行计算与多核程序设计_第4页
并行计算与多核程序设计_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章多核软件工具介绍-web课件返回多核程序设计技术由于其推动来源是从芯片厂家开始,所有各芯片厂家都推出了一系列有效工具, 包括编译器、性能分析器、数学库以及线程相关的工具。本章节主要介绍英特尔多核芯片上的软件 工具。第1节C+编译器1.1编译器对多核的支持以下是英特尔C+编译器的主要功能与优点:支持英特尔多核心处理器以及现有的英特尔处理器与体系结构,针对最新英特尔处理器的 先进优化功能可以帮助产生出众的应用程序性能。与针对 IA-32 的 Microsoft Visual C+、Microsoft Visual C+ 6.0 代码以及 Microsoft Visual C+ .NET保持跨

2、体系结构的兼容性。针对最新英特尔处理器的先进优化功能可以帮助产生出众的应用程序性能。LinuxWindows作用-O0/Od禁止优化-g/Zi生成标记-O1/O1优化二进制代码-O2/O2优化速度(默认)-O3/O3优化数据缓存表1、普通优化开关作为插件嵌入针对IA-32的Microsoft Visual Studio*开发环境,并提供一个嵌入Micr osoft Visual Studio .NET 环境的预览插件。在IA-32上使用“英特尔C+编译器”可以控制堆栈,以便高效率地执行浮点(FP) 指令。对于包含许多常用中、小函数的程序,特别是循环内包含调用的程序,使用“过程间优化” (IPO

3、)可以极大地提高应用程序性能。通过更有效地使用指令调度与高速缓存,充分利用处理器微体系结构的优势。通过减少指 令缓存反覆、重新组织代码布局、缩减代码长度并降低分支预测失误,“档案导引优化”(PGO)可以更好地执行分支预测。使用“编译器代码覆盖工具”可以提高开发效率、减少缺陷及改善应用程序性能。支持采用处理器调度与“第三代数据流单指令多数据扩展指令集”(SIMD)的IA-32体系 结构,支持SSE、SSE2、SSE3指令,且能够使用自动矢量器对IA-32代码进行自动并行化处理, 最大限度发挥处理器的潜在能力。支持“英特尔扩展内存64位技术”(英特尔EM64T)。通过执行断定的指令从程序序列中完全

4、删除这些分支,从而形成更大的基本代码块,并消 除相关的预测失误所造成的损失。使用分支指令、推测以及软件管道技术,改善针对英特尔安腾2微体系结构的代码。支持OpenMP* API与自动并行功能,提供多线程应用程序支持。产生符合ANSI C/C+与ISO C/C+标准的软件。提供安全功能,通过执行堆栈帧运行时错误检查,减少缓冲区溢出安全攻击漏洞。支持英特尔调试器与线程诊断工具。英特尔C+编译器支持以下语言标准:ANSI/ISO 标准,用于 C 语言编译 (ISO/IEC 9899:1990)ANSI/ISO 标准 (ISO/IEC 14882:1998) 用于 C+ 语言OpenMP* 规范 2.

5、5 版英特尔C+编译器与其他常用工具保持兼容,可以集成到广泛使用的开发环境,并且同其他广 泛使用的编译器保持着特性源与二进制方面的兼容性,如图8.1、图8.2所示。它还集成了 Microsof t Visual Studio 2005、Visual Studio .NET* 2002/2003 以及 Visual Studio 98,并提供扩展 32 位 和64位多核英特尔处理器支持。HkCFoscftEnvir 2003 V*riain T. t 3080Copyri1907-2002 Bls cfgxoft C-orpark.tiQn All rights r*5trvedNecfoxc1

6、 NE7 rtatrork 】.】Vtxjqf 】.HCopy?-1 JiV lMS-2flO2 Elhtorpari-tion. All rights rts ttrv d7hks pfcduct is lieMd 14:Thrt*. CiMkv jIntel? Fhr噌Pril&iJIIme钠 H Vi41 W NET 6ffiffi-33S-iXXj(WT-1806 *曲 C4+ HFT69586-33S-0000007-18048ikstia 的PMS Ew Vim* Sgdig SET MF5Q-GSWAtilled PriuctsFrcdmcl utr par中。* i z &0黑

7、=1日 by flspyrid.1 1* 皿4 ant*rjik.tloiikl lr*tix:. Vnaulbori rtpre-duelion or da stnlxitiDii of lhi. prcrt*, or 皿留 4rlic f i t, ntyin i Intel(R) C+ Compiler 9.0 - Build Environment for IA-32 Applications,单击后出现如图 8.3 界面:图8.3英特尔C+编译器命令行界面原始编译用微软C+编译器编译将光盘内的code文件夹整个复制到硬盘,如E盘根目录,在上面的命令行界面输入如下命令跳 转到RayTr

8、ace2目录:cd E: codeCompilerSwitchesraytrace2sourceRayTrace2然后清理以前生成的文件:nmake /f raytrace2.mak clean编译文件:nmake /f raytrace2.mak CPP=cl.exe运行渲染图像程序:raytrace2 320 240Press g to begin the renderPress q to quit the application将屏幕上显示的运行时间记录下来。用英特尔C+编译器编译先清理以前生成的文件:nmake /f raytrace2.mak clean编译文件:nmake /f r

9、aytrace2.mak运行渲染图像程序:| raytrace2 320 240 Press g to begin the render Press q to quit the application将屏幕上显示的运行时间记录下来(2)高阶优化使用高阶优化编译开关(03)先清理以前生成的文件: nmake /f raytrace2.mak clean打开-O3开关编译文件: nmake /f raytrace2.mak CF=-O3”运行渲染图像程序: raytrace2 320 240 Press g to begin the render Press q to quit the appli

10、cation将屏幕上显示的运行时间记录下来(3)过程间优化使用过程间优化开关-Qipo)先清理以前生成的文件:nmake /f raytrace2.mak clean打开-O3开关编译文件:nmake /f raytrace2.mak CF=-Qipo LF=-Qipo”运行渲染图像程序:raytrace2 320 240Press g to begin the renderPress q to quit the application将屏幕上显示的运行时间记录下来。档案导引优化使用档案导引优化开关(Qprof_gen, -Qprof_use)先清理以前生成的文件:nmake /f raytr

11、ace2.mak clean编译产生档案导引优化二进制指令:nmake /f raytrace2.mak CF=-Qprof_gen -Qprof_dir .RayTrace2”运行渲染图像程序:raytrace2 320 240Press g to begin the renderPress q to quit the application将屏幕上显示的运行时间记录下来。注:因为要生成档案导引优化的记录信息,会消耗大量时间。使用刚才生成的档案导引优化信息再次编译: nmake /f raytrace2.mak clean nmake /f raytrace2.mak CF=-Qprof_u

12、se -Qprof_dir .RayTrace2”注: 可忽略“no.dpi information”提示。运行渲染图像程序:raytrace2 320 240Press g to begin the renderPress q to quit the application将屏幕上显示的运行时间记录下来。矢量化优化用矢量化开关优化-QxP)先清理以前生成的文件:nmake /f raytrace2.mak clean打开-O3开关编译文件:nmake /f raytrace2.mak CF=-QxP”运行渲染图像程序:raytrace2 320 240Press g to begin the renderPress q to quit the application将屏幕上显示的运行时间记录下来。综合优化使用上述所有优化开关(03, -QxP, IPO and PGO)先清理以前生成的文件:nmake /f raytrace2.mak clean打开-O3开关编译文件:nmake /f raytrace2.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论