版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本公开提供了一种并行提取多个卷积窗中其中多组卷积窗包括第一组卷积窗和第二组卷使用多个数据处理单元并行地提取第一组卷积据处理单元并行地提取第二组卷积窗中的多个据提取的速度,由此提高了图像卷积的处理效2将图像划分成多组卷积窗,所述多组卷积窗包括第一组卷积窗和第二使用多个数据处理单元并行地提取所述第一组卷积窗中的多个卷积窗中的图像数据,其中使用多个数据处理单元并行地提取所述第一组卷积窗中的多个卷积窗中的所述图像数据包括:通过使用所述第一卷积窗提取第一三维图像数据,其中所述第一三维图像数据元并行地提取所述第一组卷积窗中的多个卷积窗中的所述图像数据包括:通过使用所述第道像素;将所述第二三维图像数据转换成包括按行排列的R×S×C个像素的第二一维图像提取所述第二组卷积窗中的多个卷积窗中的图从存储卷积核的数据的存储器获得所述第一卷积窗的所述卷述第二二维矩阵具有R×S×C列;及2.根据权利要求1所述的方法,其中所述多个数据处理单元包括第一数据处理单元和并行地提取所述第一组卷积窗中的多个卷积窗使用所述第二数据处理单元提取所述第二卷积窗3.根据权利要求2所述的方法,其中使用所述第一数据处理单元提取所述第一卷积窗提取所述第一卷积窗中的第一通道中的第一行图提取所述第一卷积窗中的所述第一通道中的第三行图4.根据权利要求3所述的方法,其中使用所述第一数据处理单元提取所述第一卷积窗提取所述第一卷积窗中的第二通道中的第一行图提取所述第一卷积窗中的所述第二通道中的第三行图36.根据权利要求5所述的方法,其中使用所述多个数据处理单元并行地转置所述第一使用所述多个数据处理单元中的第一数据处理单元转置所述第一分块中的第一列数使用所述多个数据处理单元中的第二数据处理单元转置所述第二分块中的第二列数卷积窗组划分模块,被配置为将图像划分成多组卷第一并行提取模块,被配置为使用多个数据处理单元并行地的多个卷积窗中的所述图像数据包括:通过使用所述第一卷积窗提取第一三维图像数据,数据转换成第一一维图像数据,其中所述第一一维图像数据包括按行排列的R×S×C个像像数据包括:通过使用所述第一卷积窗提取第二三维图像数据,其中所述第二三维图像数第二并行提取模块,被配置为响应于完成提取所述第一组卷积窗中所述多个数据处理单元并行地提取所述第二组卷积窗中的多个卷积窗中的图从存储卷积核的数据的存储器获得所述第一卷积窗的所述卷述第二二维矩阵具有R×S×C列;及9.根据权利要求8所述的装置,其中所述多个数据处理单元包括第一数据处理单元和第一数据提取模块,被配置为使用所述第一数据处理单元提4第二数据提取模块,被配置为使用所述第二数据处理单元提第二提取模块,被配置为提取所述第一卷积窗中的所述第一通道中的第二行图像数第三提取模块,被配置为提取所述第一卷积窗中的所述第一通道中的第三行图像数第二通道提取模块,被配置为响应于完成提取所述第一卷提取所述第一卷积窗中的第二通道中的第一行图提取所述第一卷积窗中的所述第二通道中的第三行图分块划分模块,被配置为以列为单位将矩阵划分成多个分块第一并行转置模块,被配置为使用所述多个数据处理单元并第二并行转置模块,被配置为响应于完成转置所述第一第一矩阵转置模块,被配置为使用所述多个数据处理单元第二矩阵转置模块,被配置为使用所述多个数据处理单元第二分块划分模块,被配置为基于所述多个数据处理单元的数存储装置,其用于存储一个或多个程序,所述一个或多个程序5[0003]CNN是一种包含卷积计算且具有深度结构的前馈神经网络,在计算机视觉特别是[0005]根据本公开的示例实施例,提供了一种并行提取多个卷积窗中的图像数据的方[0006]在本公开的第一方面中,提供了一种并行提取多个卷积窗中的图像数据的方[0007]在本公开的第二方面中,提供了一种并行提取多个卷积窗中的图像数据的装6机程序被处理器执行时实现根据本公开的实施例的各种方[0014]图2示出了根据本公开的实施例的并行提取多个卷积窗中的图像数据的方法的流[0015]图3示出了根据本公开的实施例的并行提取多个卷积窗中的图像数据的过程的示[0016]图4示出了根据本公开的实施例的用于并行处理数据的加速器设备的示例架构的[0019]图7示出了根据本公开的实施例的并行提取多个卷积窗中的图像数据的装置的框7加权的操作产生的新的像素值按照次序可以产生[0029]图2示出了根据本公开的实施例的并行提取多个卷积窗中的图像数据的方法200[0031]在框204,使用多个数据处理单元并行地提取第一组卷积窗中的多个卷积窗中的8[0034]图3示出了根据本公开的实施例的并行提取多个卷积窗中的图像数据的过程300[0035]图4示出了根据本公开的实施例的用于并行处理数据的加速器设备的示例架构所读取的数据下发到多个数据处理单元490。多个数据处理单元490根据控制单元450的控9数据处理单元490的一个示例性架构,其他具有多个数据处理单元的加速度设备也可以与本公开的实施例结合使用。示例中卷积窗口大小为3×3)。用于执行图像卷积的加速器设备包括多个数据处理单元首先提取第一通道中的第一行数据(各个数据处理单元都在并行地提取对应卷积窗中的第据处理单元521类似地提取卷积窗511的第二通道中的所有图像数据,提取卷积窗511的第以一个规模为C×R×S的三维卷积窗中的图像数据,经数据处理单元的提取之后在目标存储器上可以看作是长度为C×R×S的一维向量,假设图像510中总共提取出了N个卷积窗数理单元629会处理第P列(列P-1)中的元621将矩阵610中的第一列转置成矩阵630中的第一行,数据处理单元622将矩阵610中的第二列转置成矩阵630中的第二行,数据处理单元629将矩阵610中的第P列转置成矩阵630[0050]图7示出了根据本公开的实施例的并行提取多个卷积窗中的图像数据的装置700窗包括第一组卷积窗和第二组卷积窗。第一并行提取模块720被配置为使用多个数据处理单元并行地提取第一组卷积窗中的多个卷积窗中的图像数据。第二并行提取模块730被配可以执行参考本公开的实施例的方法和/或过程硬件开销。[0062]图8示出了可以用来实施本公开的实施例的示例设备800的示意性框图。应当理解,设备800可以为用于实现本公开所描述的并行提取多个卷积窗中的图像数据的装置700。如图所示,设备800包括中央处理单元(CPU)801,其可以根据被存储在只读存储器(ROM)802中的计算机程序指令或者从存储单元808加载到随机访问存储器(RAM)803中的计因特网的计算机网络和/或各种电信网络与其他设备交换信[0065]本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例[0066]用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个[0069]尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本公开的实施例,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 虚拟电厂市场机遇分析
- 2026年高职(税务筹划实训)方案设计阶段测试试题及答案
- 2026八年级道德与法治下册 法治公平要求
- 医学大学生职业规划书
- 告别小长假收心启新程
- 医学世界探秘-疾病诊治与专业成长
- 食品加工技术就业方向
- 稻谷市场深度洞察-洞悉市场动态把握商机
- 淀粉工艺再造未来-农业工业化与淀粉产业创新
- 未来环保工程创新探析-智能与绿色构筑环保新未来
- 雨课堂学堂在线学堂云《家庭教育学(青岛大学 )》单元测试考核答案
- NCCN急性淋巴细胞白血病临床实践指南解读(2025版)
- 2025年高考天津卷物理真题(解析版)
- REACH SVHC 251项高关注物质清单
- 2025届全国高考语文真题试卷(天津卷)附答案
- 心静脉导管、PICC、CVC管道维护考试题(含答案)
- 行政工作行政工作处理标准化流程
- 2024年甘肃省兰州市中考化学试题及参考答案
- 粮食行业消防安全培训课件
- 《汽车文化》电子课件
- 毕业设计(论文)-高速铁路(60+108+60)m预应力混凝土连续梁桥设计
评论
0/150
提交评论