版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一种用于神经网络的算子融合方法及其相本公开涉及一种可用于神经网络的算子融所述输出块对应的所述当前算子的输入数据的间的中间数据的数据块尺寸;基于所述拆分尺及所述当前算子与待融合算子之间的中间数据2遍历所述神经网络对应的计算图中的算子,从所述计算基于所述输出块,映射得到与所述输出块对应的所述当前基于所述拆分尺寸、所述当前算子的输入数据的数据块基于所述输出块,映射得到与所述输出块对应的所述当前基于调整后的所述拆分尺寸、所述当前算子的输入可执行指令在被处理器执行时实施如权利要求1-5中选择单元,遍历所述神经网络对应的计算图中的算子,34题更加严重。内部存储和外部存储之间的数据传输延迟占据了程序执行时间中的一大部能力为1GFLOPS(GigaFloating-pointOperationsPerSecond每秒所执行的浮点运算次申请的发明人进一步统计了整个ResNet-18神经网络中每一层的计算能力与内存访问的比络中的1%。因此,内存访问目前是人工智能处理器执行神经网络过程中的一个严重的瓶5块尺寸、以及所述当前算子与待融合算子之间的中间数据的数据块尺寸之和大于一阈值,输入数据的数据块尺寸、以及所述当前算子与待融合算子之间的中间数据的数据块尺寸;[0017]本发明还涉及一种计算机可读存储介质,包括存储于其上的计算机可执行指令,的输入数据的数据块尺寸、以及所述当前算子与待融合算子之间的中间数据的数据块尺6[0030]图3示出了根据本申请一个实施例基于所述输出块映射得到与所述输出块对应的[0035]图8示出了根据本申请进行算子融合后内存访问量与未进行优化时的内存访问量[0036]图9示出了根据本申请进行算子融合后的神经网络加速与未进行优化时的神经网露中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,7络映射的计算图结构所表达的深度学习任务具体化成可以在CPU或者人工智能处理器执行8[0046]图1示出了根据本申请一个实施例的算子融合方法100。算子融合方法100可用于[0051]图2示出了待融合层的输出数据OD2,其例如为M*N维的数据。按照预设的拆分尺选择成使得所述待融合层L2的输出数据OD2能够被均匀地拆分成m*n份。但本申请不限于[0054]由于当前层L1和待融合层L2中的每一层所执行的数据变换处理都可以是预先设9据中间数据OD1中的数据块OD1(m,1)的数据块尺寸,并根据所述当前层L1所根据本申请的一个优选实施例,将所述待融合算子的输出数据拆分后的输出块的尺寸(即所述拆分尺寸),与所述当前算子的输入数据的数据块尺寸以及所述当前算子与待融合算[0062]图4示出了根据本申请一个优选实施例的算子融合方法200。下面参考图4进行详[0070]在实际应用中,以caffe为例所述神经处理网络具有多个处理层,处理层包括[0071]根据本申请的一个实施例,其中所述计算图中的算子之间的510或者它们的组合,其存储可配置处理单元以执行先前描述的过程中的全部或一些的编程指令504。这些指令可以包括例如用于使一个或多个处理器执行如下处理的一个或多个[0083]选择五种典型的神经网络模型来来评估本申请的方法,分别为VGG-19,请进行算子融合的情况下的内存访问量的降低以及执行时间的减器RRAM(ResistiveRandomAccessMemory)、动态随机存取存储器DRAM(DynamicRandom机存取存储器EDRAM(EnhancedDynamicRandomAccessMemory)、高带宽内存HBM(High-[0087]所述集成的单元/模块如果以软件程序模块的形式实现并作为独立的产品销售或上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形[0091]技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026 高中选择性必修《运动心理高级指导》课件
- 2026 七年级下册《统计气温变化》课件
- 机械制造工艺及夹具设计课件 7.箱体平面度加工以及孔系的加工
- 工作终结制度
- 纤维肌痛护理查房
- 第五章 第三节 定位方式与定位元件
- 第三章 第四节 钻、铰、镗孔加工
- 宾馆安保岗位责任制度
- 秋季润肺的梨类养生食谱
- 2026商洛市教师招聘笔试题及答案
- 2025-2026人教版高中地理选择性必修二期末综合检测练习卷(含解析)
- 产业链数字化全链条协同机制研究
- 2026年水利工程质量检测员网上继续教育考试题库200道完整版
- GB/Z 141-2025蓄电池和蓄电池组起动用铅酸蓄电池减少爆炸危险的装置性能检验的试验方法
- 校服代售合同范本
- 2026年河南交通职业技术学院单招职业适应性考试题库及参考答案详解
- 前瞻性队列研究的随访失访控制策略
- T-CI 1047-2025 低视力临床康复机构建设规范
- 中西医结合治疗慢性盆腔炎
- 2024年江苏省苏州市中考化学真题(解析版)
- 短文语法填空专练 人教版英语八年级下册
评论
0/150
提交评论