




免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验二 厦门大学信息科学与技术学院多核课程实验手册郑灵翔 1 实验二实验二 Intel Parallel Composer 实验 实验 Windows 实验目的 1 掌握 Intel Parallel Composer 的特点和基本使用方法 2 掌握在 Windows 下如何使用 Intel Parallel Composer 提高程序性能 实验条件 硬件 1 Intel 多核处理器 2 大于 1G 内存 3 大于 20G 硬盘 软件 1 Intel Parallel Composer beta 1 0 或更高版本 2 熟练掌握 C C 语言 3 掌握 Microsoft Visual Studio 2005 的开发环境使用 4 性能优化和给予多核编程的基本概念 实验原理 1 Intel Parallel Composer 主要功能与特点主要功能与特点 英特尔 Parallel Composer 是英特尔 Parallel Studio 的三大组件之一 Microsoft Visual C 的开发人员能够使用它进行并行开发 该产品将编译器 函数库和 Microsoft Visual Studio 调试器的扩展融为一体 更轻松 更快速地支持串行和多线程的并行 Intel Parallel Composer 有以下一些特点 英特尔 C 完全兼容 Microsoft Visual C 支持最新的 OpenMP 技术 而且 提供语言扩展来支持并帮助简化伪代码添加并行能力的工作 英特尔 Parallel Debugger Extension 可以简化并行调试并确保线程的准确性 英特尔 线程构建模块和英特尔 集成性能基元可提供已经线程化的通用和应用 指定函数 从而支持开发人员迅速为应用程序添加并行能力 Intel Parallel Composer 包括以下的组件 英特尔 C 编译器 Intel C Compiler 英特尔 线程构建模块 Intel Threading Building Blocks 英特尔 集成性能基元 Intel Integrated Performance Primitives 英特尔 并行调试器扩展 Parallel Debugger Extension Intel c 编译器进行了更加底层的优化 可以充分的利用多核的资源 提高加速比 其主要功能与特点 支持 Intel 多核处理器以及现有的 Intel 处理器与体系结构 与针对 IA 32 的 Microsoft Visual C Microsoft Visual C 6 0 代码以及 Microsoft Visual C NET 保持跨体系结构的兼容性 针对最新的 Intel 处理器的强大的优化功能可以帮助产生更好的应用程序性能 作为插件嵌入针对 IA 32 的 Microsoft Visual Studio 开发环境 并提供一个嵌入 Microsoft Visual NET 环境的预览插件 实验二 厦门大学信息科学与技术学院多核课程实验手册郑灵翔 2 在 IA 32 上使用 Intel C 编译器 可以控制堆栈 以便高效率地执行浮点 FP 指令 对于包含许多常用的中 小函数程序 特别是循环内包含调用的程序 使用 过 程间优化 IPO 可以极大地提高应用程序的性能 通过更有效地进行指令调度与使用高速缓存 能够充分利用处理器微体系结构的 优势 通过减少指令缓存反复 重新组织代码布局 缩减代码长度并降低分支预 测失误 档案导引优化 PGO 可以更好地执行分支预测 使用 编译器代码覆盖工具 可以提高开发效率 减少缺陷及改善应用程序的性 能 支持采用处理器调度与 第三代数据流单指令多数据扩展指令集 SIMD 的 IA 32 体系结构 支持 SSE SSE2 SSE3 指令 能够使用自动矢量器对 IA 32 代 码进行自动并行化处理 最大限度发挥处理器的潜在性能 支持 Intel 扩展内存 64 位技术 Intel EM64T 通过执行断定的指令 从程序序列中完全删除分支 形成更大的基本代码块 从 而消除 相关的预测失误所带来的损失 使用分支指令 推测以及软件管道技术 改善针对英特尔 安腾 2 微体系结构的 代码 产生符合 ANSI C C 与 ISO C C 标准的软件 支持 OpenMP API 与自动并行功能 提供多线程应用程序支持 提供安全功能 通过执行堆栈帧运行时错误检查 减少缓冲区溢出的安全攻击漏 洞 在多核的平台上开发并行化的程序 必须合理地利用系统的资源 如与内核数目相匹配的线 程 内存的合理访问次序 最大化重用缓存 有时候用户使用 系统 低级的应用接口创建 管 理线程 很难保证是否程序处于最佳状态 Intel Thread Building Blocks TBB 很好地解决了上述问题 TBB 提供 C 模版库 用户不必关注线程 而专注任务本身 抽象层仅需很少的接口代码 在性能上毫不逊色 支持不同的多核平台 线程库的接口适合于跨平台的移植 Linux Windows Mac 支持的 C 编译器 Microsoft GNU and Intel Intel IPP 是一套跨平台的软件函数库 它提供了广泛的多媒体功能 音频解码器 例如 H263 MPEG 4 图像处理 JPEG 信号处理 语音压缩 例如 G723 GSM AMR 和加密机制 Intel IPP 包含各种的函数 用于进行向量与图像处理 颜色转 换 过滤 分屏 设置域值 变换 以及算术 统计 几何与图形运算 对于每个函数 Intel IPP 均支持多种数据类型和分布 同时保持了数据结构的最小化 它提供了丰富的 选项供用户在设计与优化应用程序时选用 不必再去编写特定代码 Intel IPP 针对大量的 Intel Microprocessor 微处理器 进行 包括多核处理器系列 采用一套跨平台结构的通用 API 使用者除了不需要担心平台兼容性的问题 更节省了开发成本以及研发时间 使用 者可以轻轻松松移植原有应用程序 其主要特点体现在 不再需要以 Hard Coding 方式针对特定的处理器进行优化 实验二 厦门大学信息科学与技术学院多核课程实验手册郑灵翔 3 提高应用程序的可靠性 节省时间 内置调度器选择优化处理 并根据处理器自动调度特定的运行时代码 在基于信号和图像的数据结构的特定约束方面 改善了应用程序的灵活性 Intel Parallel Debugger Extension 提供了对应用程序中共享数据和数据依赖关系的附加 了解和访问 这有助于缩短开发周期和及早发现可能造成严重运行问题的潜在数据访问冲 突 在安装英特尔 Parallel Composer 并启动 Visual Studio 后 可在应用程序利用单 指令多数据 SIMD 执行时使用英特尔 Parallel Debugger Extension 并可在并行化应 用程序使用 OpenMP 线程时获得对执行流和潜在运行冲突的额外了解 2 Intel Parallel Composer 使用使用 Intel Parallel Composer 集成在以下版本的 Microsoft Visual Studio IDE 中 Microsoft Visual Studio 2005 和 Microsoft Visual Studio 2008 使得程序员可以更好地进行并行编程 Intel Parallel Composer 使用步骤如下 一 测试基准比较程序 1 启动 vs2005 或者 2008 2 文件 打开项目 选择 ex1 pi pi sln 3 编译程序 如果出错则排查错误 确保程序正确运行 4 选择 生成 配置管理器 选择活动解决方案配置为 Release 项目 pi 的配置也为 Release 如下图 5 重新编译生成 Release 版本程序 运行 记录结果 作为基准比较程序 二 使用 Intel Parallel Composer 编译程序 1 如下图所示 选择 use inter c 编译器 实验二 厦门大学信息科学与技术学院多核课程实验手册郑灵翔 4 2 右击 pi 项目 属性 如下图 3 如下图中 选择配置为活动 Release 点击到选项 optimization 分别测试常规 General 下的优化选项和 intel specific 下的优化选项 重新编译运行 记录结果 与基准程序比较 写出测试结论 实验二 厦门大学信息科学与技术学院多核课程实验手册郑灵翔 5 3 Intel 编译器所提供的编译优化功能编译器所提供的编译优化功能 普通优化 Windows功能 Od禁止优化 Zi生成标记 O1优化二进制代码 O2优化速度 默认 O3优化数据缓存 过程间优化 Windows功能 Qip优化编译单个文件 Qipo通过内联函数优化交叉编译多个文件 自动并行优化 Windows功能 Qparallel对某些代码做自动并行优化 Qpar report n 记录优化过程 汇报结果 基于 CPU 的矢量化优化 Windows功能 QxW为 Pentium4 等支持 MMX SSE 和 SSE 指令的处理器做专门优化 Qxp为 Core 等支持 MMX SSE SSE2 实验二 厦门大学信息科学与技术学院多核课程实验手册郑灵翔 6 QaxP和 SSE3 指令的处理器做专门优 化 OpenMP 优化 Windows功能 Qopenmp打开 OpenMP 优化功能 Qopenmp report提供优化报告 错误 支持 Intel 线程检查器的编译 Windows功能 Qtcheck支持线程检查器检测线程 注 要使用此功能必须已经安装注 要使用此功能必须已经安装 Intel 线程检查器 线程检查器 内容与步骤 用 Intel Parallel Composer 优化计算 PI 的实验 1 使用 pi cpp 进行 visual c 编译 运行 并记录试验结果 2 使用 inter c 编译 运行 记录试验结果 3 比较 visual c 与 inter c 编译代码运行时间的差别 分析试验结果 4 使用不同的编译开关 例如 O3 Qxp IPO 和 PGO 等 用 inter c 编译 运行 记录分析试验结果 用 Intel Parallel Composer 优化计算矩阵乘法的实验 1 新建一个空的 VS 项目 并加入现有代码进行 visual c 编译 运行 并记录试验结 果 2 修改 multiply d 中的循环 对调 k 和 j 的循环顺序 进行 visual c 编译 运行 并
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 指南专业标准试题及答案
- 2026届安徽省合肥市普通高中学业水平选择性考试物理模拟检测试卷(五)
- 知识社群知识产业市场调查及技术创新
- 【高中语文】《论语》十二章+课件+统编版高二语文选择性必修上册
- 2024-2025学年山东省临沂市郯城县八年级(上)期末数学试卷(含答案)
- 建筑局部元素采集方案设计
- 加强校园维稳安全教育
- 山东省淄博市周村区第一中学2024-2025学年六年级下学期3月月考生物试题(含答案)
- 混凝土表面病害施工方案
- 虎年寒假实践活动方案策划
- 企业重污染天气应急预案
- 2025全国企业员工全面质量管理知识竞赛题库(含答案)
- 内分泌科进修总结课件
- 妊娠期贫血的诊断及治疗
- 2025年食安员、食品安全总监、主要负责人考试题及答案
- 污水处理厂运营管理及提升方案
- 骨科无痛病房护理课件
- 2025年国家司法考试《一卷》模拟题及答案(预测版)
- 机电设备安装安全管理体系及安全保证措施
- 心力衰竭生物标志物临床应用中国专家共识
- 金融科技对商业银行绩效影响研究-以XX银行为例
评论
0/150
提交评论