3-9-2-基于am57x的opencl加速性能测试说明_W_第1页
3-9-2-基于am57x的opencl加速性能测试说明_W_第2页
3-9-2-基于am57x的opencl加速性能测试说明_W_第3页
3-9-2-基于am57x的opencl加速性能测试说明_W_第4页
3-9-2-基于am57x的opencl加速性能测试说明_W_第5页
已阅读5页,还剩6页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于 AM57x 的 OpenCL 加速性能测试说明 Revision HistoryDraft DateRevision No.Description2018/04/28V1.11. 版本更新,内容勘误。 2016/12/12V1.01. 初始版本。 公司官网:销售邮箱:公司总机:020-8998-62801/9技术论坛:技术邮箱:技术热线:020-3893-9734目录1 实验说明32 例程编译33 例程测试43.1 禁用 OpenCL43.2 使能 OpenC

2、L53.3 测试结果对比7更多帮助9公司官网:销售邮箱:公司总机:020-8998-62802/9技术论坛:技术邮箱:技术热线:020-3893-97341 实验说明本例程测试功能:读取指定的图像数据,然后对图像进行灰度转换和 Canny 算法处理,计算处理过程所耗的时间,并将处理后的图像保存到当前目录下。 本例程主要是测试 OpenCL 是否对这两种算法有优化效果,分别从禁用 OpenCL 和使能 OpenCL 两种情况来计算处理图像数据所用的时间,将测试的结果与

3、官方提供的测试结果进行对比和验证。 例程源码路径:光盘“Demo/OpenCL/OpenCL_performance_test/src”可执行文件以及测试脚本路径:光盘“Demo/OpenCL/OpenCL_performance_test/bin”测试使用的图片路径:光盘“Demo/OpenCL/OpenCL_performance_test/data”2 例程编译将光盘资料“Demo/OpenCL/OpenCL_performance_test/src”例程源码拷贝到Ubuntu 任意目录,进入该源码目录执行以下命令对源码进行编译: Host#cd AM57xx/OpenCL_perfor

4、mance_test/src/Host#make SDK_INSTALL_PATH=/home/tronlong/ti-processor-sdk-linux-am57xx-evm-03.0 1.00.06图 1编译完成之后会在当前目录下生成可执行文件 canny,将其拷贝到开发板文件系统的 公司官网:销售邮箱:公司总机:020-8998-62803/9技术论坛:技术邮箱:技术热线:020-3893-9734“/home/root/”目录下。 将光盘资料“Demo/

5、OpenCL/OpenCL_performance_test”下的bin 文件夹以及data 文件夹拷贝到开发板文件系统的“/home/root/”目录下。bin 文件夹下包含 opencl_off.sh 和opencl_on.sh 测试脚本, data 文件夹下是两张大小 和格式不同的图片 文件TL5728_1080p.jpg 和 lena.png 。 图 23 例程测试以下分别从禁用 OpenCL 功能和使能 OpenCL 功能来进行对比测试,分别采用 data文件夹下的图片 TL5728_1080p.jpg 和 lena.png 来测试。 3.1 禁用 OpenCL执行以下命令进行测试,

6、先禁止运行 OpenCL 功能,然后清理缓存再进行测试,重复清理缓存和测试的步骤 5 次,如下图所示: Target#source bin/opencl_off.sh Target#sync; echo 3 /proc/sys/vm/drop_cachesTarget#./canny data/TL5728_1080p.jpg公司官网:销售邮箱:公司总机:020-8998-62804/9技术论坛:技术邮箱:技术热线:020-3893-9734图 3取以上 5 次测试

7、结果的平均值: BGR2GRAY tdiff=55.01ms Canny tdiff=95.50ms3.2 使能 OpenCL执行以下命令进行测试,先使能 OpenCL 功能,然后清理缓存再进行测试,重复清理缓存和测试的步骤 6 次,如下图所示: Target#source bin/opencl_on.sh Target#sync; echo 3 /proc/sys/vm/drop_cachesTarget#./canny data/TL5728_1080p.jpg公司官网:销售邮箱:公司总机:020-8998-62805/9技

8、术论坛:技术邮箱:技术热线:020-3893-9734图 4Please note that the first run, with OpenCL on, has additional delay of 1min, d如上一共测试了 6 次,每一次测试之前记得先将系统内核缓存清理干净,否则测试结果有误。因为第一次运行时,内核在 AM57xx 上编译,OpenCL 使能时会有额外的延迟,延迟时间大约为几十秒,所以第一次测试结果不作为参考。官方解释如下: ue to kernel compilation on AM57xx. This

9、 is constrained to first run only, if TI_OCL_公司官网:销售邮箱:公司总机:020-8998-62806/9技术论坛:技术邮箱:技术热线:020-3893-9734CACHE_KERNELS environemnt variable is set.由以上 6 次的测试结果,取最后 5 次测试结果的平均值: BGR2GRAY tdiff=185.38ms Canny tdiff=17.71ms3.3 测试结果对比 同理,按照

10、如上操作步骤在分别禁用 OpenCL 和使能 OpenCL 的情况下,计算处理lena.png 图片所用的时间,并对 5 次测试的数据取平均值。对比以上测试结果,如下表所示: 表 1测试算法 禁止 OpenCL使能 OpenCL作用率 TL5728_1080p.jpgBGR2GRAY55.01ms185.38ms0.297Canny95.50ms17.71ms5.392lena.pngBGR2GRAY42.38ms210.76ms0.201Canny55.40ms18.51ms2.993作用率=禁用 OpenCL 计算处理图像数据所用的时间/使能 OpenCL 计算处理图像数据所用的时间。 以

11、下是官方的测试数据: 图 5公司官网:销售邮箱:公司总机:020-8998-62807/9技术论坛:技术邮箱:技术热线:020-3893-9734BGR2GRAY 作用率=0.345Canny 作用率=1.690从测试结果可以看出来,本次测试与官方测试结论是一致的:OpenCL 对 BRG2GRAY 算法不但没有性能上的提升反而存在着 的效果;而对 Canny 算法则有着非常明显的提升效果,与官方的作用率进行对比,本次测试得出的作用率要大于官方提供的作用率数据,这与

12、待测试的图像文件有一定的关系。 官方提供的其他 OpenCL 内核的测试数据: 链接:/index.php/OpenCV图 6图 7图 8公司官网:销售邮箱:公司总机:020-8998-62808/9技术论坛:技术邮箱:技术热线:020-3893-9734更多帮助销售邮箱: 技术邮箱: 创龙总机:020-8998-6280技术热线:020-3893-9734创龙官网:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论