CN112882984B 运算装置与数据处理方法 (威盛电子股份有限公司)_第1页
CN112882984B 运算装置与数据处理方法 (威盛电子股份有限公司)_第2页
CN112882984B 运算装置与数据处理方法 (威盛电子股份有限公司)_第3页
CN112882984B 运算装置与数据处理方法 (威盛电子股份有限公司)_第4页
CN112882984B 运算装置与数据处理方法 (威盛电子股份有限公司)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

US2018052708A1,2018.0US2018267878A1,2018.WO2018176238A1,2018.10据处理工作的至少一部分的数据处理会从该至器用于在无需该至少一通用处理器上所执行的少一通用处理器上所执行的该应用程序的介入2至少一通用处理器,用于执行一应用程序,其中一数据处理至少一辅助处理器,用于在无需该至少一通用处理器上所至少一特殊应用处理器,用于在无需该至少一通用处该至少一通用处理器上所执行的该应用程序通过调用一应用程序编程接口函数来卸其中该至少一特殊应用处理器用于处理具有一核心标识符的一2.如权利要求1所述的运算装置,其中该至少一辅助处理器上所执行的该控制流包含3.如权利要求1所述的运算装置,其中该至少一通用处理器与该至少一辅助处理器为至少一通用处理器核心,用于从该可编程电路取得该及触发具有该核心标识符的该核心函数来处理位于一对象储存装置且具有该对象标识符8.如权利要求1所述的运算装置,其中该至少一辅助处理器包含至少一通用处理器核一控制信道,耦接于该至少一特殊应用处理器的接脚与该至少至少一加速电路,用于从该网络处理电路接收一数据输入3一传输控制协议/因特网协议卸载引擎,用于处理该网络处理电路与一网络挂载装置至少一数据转换电路,用于处理该网络处理电路与该至少一加速电路之间的数据转一储存处理电路,用于与该至少一通用处理器核心进行通信并其中该至少一加速电路还用于通过该储存处理电路来传送该至少一加速电路的一数一储存处理电路,用于与该至少一通用处理器核心进行通信并至少一加速电路,用于从该储存处理电路接收一数据输入,16.如权利要求15所述的运算装置,其中该至少一加速电路还用于通过该储存处理电至少一数据转换电路,用于处理该储存处理电路与该至少一加速电路之间的数据转其中该至少一加速电路还用于通过该网络处理电路来传送该至少一加速电路的一数4通过至少一通用处理器来执行一应用程序,其中一数据处理工作的至在无需该至少一通用处理器上所执行的该应用程序的介入之下器来处理该数据处理的一控制流并通过至少一特殊应用处理器来处理该数据处理的一数通过该至少一通用处理器上所执行的该应用程序调用一应用程序编程接口函数来卸通过该至少一特殊应用处理器来处理具有一核心标识符的一核心函5器来将数据处理工作的至少一部分从至少一通用处理器卸载出来的数据处理方法与相关据接收,举例来说,固态硬盘(solid-statedrive,SSD)可连接至PCIe(PeripheralComponentInterconnectExpress)总线或SATA(SerialAdvancedTechnology入主机端的固态硬盘,而主机端的固态硬盘也可通过PCIe总线/SATA总线来将储存数据传处理器来将数据处理工作的至少一部分从至少一通用处理器卸载出来的数据处理方法与程序,其中一数据处理工作的至少一部分的数据处理会从该至少一通用处理器被卸载出[0007]本发明运算装置可具备网络子系统来链接至网络且可针对对象储存来执行相关6AmazonS3Select)来针对运算装置所连接的对象储存装置进行数据获取的相关数据处自行设计通用处理器核心所要执行的应用程序/程序代码以及现场可编程逻辑门阵列所要[0010]图3为本发明运算装置与采用加速卡的计算机系统之间的功能对应关系的示意[0011]图4为依据本发明一实施例的采用虚拟储存存储器技术来进行对象数据处理的运输出接口112而连接至计算机主机102。加速卡105可通过输入/输出接口112而连接至计算插槽上,例如,加速卡105可以是基于现场可编程逻辑门阵列(fieldprogrammablegate统100运行时,中央处理器106会先将储存装置104中待处理的储存数据搬移至系统存储器7106。另外,中央处理器106有可能需要先对储存装置104中待处理的储存数据进行格式转器106需要针对输入/输出堆栈(input/outputstack)的复数层(layer)进行处理,且基于冯诺伊曼架构(vonNeumannarchitecture),中央处理器106需要执行频繁的加载/储存因素影响而使得计算机系统100的整体数据处理效能无法受惠于加速卡105而有所大幅提通用处理器核心与现场可编程逻辑门阵列所构成)为异质处理器(heterogeneous核心可以是采用ARMCotex-A53来实现的应用处理器单元(applicationprocessorunit,APU),通用处理器核心212则可以是采用ARMCotex-R5来实现的实时处理器单元(real-运算装置与采用加速卡的计算机系统之间的功能对应关系的示意图。计算机系统300可以是传统的服务器,可通过中央处理器(未显示)来执行应用程序302、操作系统核心8系统306、驱动程序308与储存装置312的组合,以及加速电路334的功能会对应至加速卡程逻辑门阵列328(尤其是加速电路334)来将数据处理工作的至少一部分从应用处理器单在无需通用处理器202上所执行的应用程序APP的介入之下,处理该数据处理的一控制流202上所执行的应用程序APP可通过调用应用程序编程接口(applicationprogramminginterface,API)函数API_F来将该数据处理工作的至少一部分的该数据处理卸载至辅助处[0018]辅助处理器204的通用处理器核心212可加载并执行程序代码SW来执行与控制输系统214包含传输控制协议/因特网协议(transmissioncontrolprotocol/internetprotocol,TCP/IP)卸载引擎(offloadengine)222与网络处理电路(networkhandler)224。TCP/IP卸载引擎222用于处理网络处理电路224与网络挂载装置(network-attached责网络层的处理,因此通用处理器核心212也无需介入TCP/IP堆栈的处理。网络处理电路224用于与通用处理器核心212进行通信并控制电路232的个数可依据需求而定,例如每个加速电路232被设计来执行一个核心函数(kernelfunction),因此特殊应用处理器206可设置复数个加速电路232来分别执行不同9定数据格式,则数据转换电路234会用于处理网络处理电路224与加速电路232之间的数据理电路224可用于控制加速电路232与网络挂载装置10之间的[0021]储存子系统216包含储存处理电路(storagehandler)226与储存控制器(storage226接收一数据输入,以及根据该数据输入来处理该数据处理工作的至少一部分的该数据的预定数据格式,则数据转换电路236会用于处理储存处理电路226与加速电路232之间的会从该笔完整数据中获取出特定字段并传送至加速电路理电路234以及在加速电路232与数据处理电路226之间仅绘示一个数据处理电路236,然处理电路226之间可设置复数个数据处理电路236来分别进行不同的数据格式[0024]如上所述,通用处理器202可将该数据处理工作的至少一部分的该数据处理卸载少包含输入/输出堆栈的复数层的处理),而特殊应用处理器206则是负责该数据处理的数速电路232)的接脚与辅助处理器204(尤其是通用处理器核心212)的接脚之间,控制信道218可用于在特殊应用处理器206(尤其是加速电路232)与辅助处理器204(尤其是通用处理回储存装置20,由于数据在储存装置20与加速电路232的路径中完成处理而无需经过通用揭示的运算装置200也可应用于对象储存装置的序编程接口函数API_F来将该数据处理工作的至少一部分的该数据处理卸载至辅助处理器storage)中且具有一对象标识符(objectidentifier)的一对象,而应用程序编程接口函数API_F的参数可包含该核心标识符与该对象标识符,其中该对象储存装置可以是储存装置200,因此,运算装置200与储存装置20可整体视为运算型储存装置(computational含csd_stscsd_put(object_id,oput(object_id,object_data,buf_len)用于将具备对象标识符object_id的对象数据buf_len)用于利用具备核心标识符acc_id的加速电路232来处理具备对象标识符object_id的对象数据object_data并将相对应的运算结果写入至储存装置20,csd_stscsd_get(object_id,object_data,buf_len)用于将具备对象标识符object_id的对象数据object_data从储存装置20读取出来,以及csd_stscsd_get_acc(object_id,object_data,acc_id,buf_len)用于将从储存装置20所读取的具备对象标识符objedata送至具备核心标识符acc_id的加速电路232进行处理,并将相对应的运算结果传送出算装置200所实际采用的应用程序编程接口函数API_F也可依[0044]在另一对象储存应用中,网络挂载装置10可以是分布式对象储存系统中的客户即加速电路232)来处理位于一对象储存装置(亦即储存装置20)且具有该对象标识符的该运算装置200还可采用本发明的虚拟储存存储器(virtualstoragememory)技术,使得特殊应用处理器206(尤其是加速电路232)所使用的片上存储器(on-chipmemory)/嵌入式存储器(例如BlockRAM(BRAM)或UltraRAM(URAM))可等效视为具有像储存装置一样的大容识符的核心函数(亦即加速电路232)来处理位于一对象储存装置(亦即储存装置20)且具有路232)所使用的片上存储器/嵌入式存储器的容量,通过数据流方式来不断读取具有该对象标识符的该对象的连续数据至特殊应用处理器206(尤其是加速电路232)所使用的片上特殊应用处理器206(尤其是加速电路232)所使用的嵌入式存储器之间的数据搬移以及核心函数与应用程序APP之间的同步会由辅助处理器204的通用处理器核心212负责,因此通用处理器202所执行的应用程序APP完全无需介入储存装置20与特殊应用处理器206(尤其是加速电路232)所使用的片上存储器/嵌入式存储器之间的数据搬移以及核心函数与应用[0046]图4为依据本发明一实施例的采用虚拟储存存储器技术来进行对象数据处理的运的储存装置为对象储存装置412。多重处理系统芯片可划分为处理系统(processing应用处理器单元402(用于实现图2所示的通用处理器202)以及实时处理器单元404(用于实[0047]一开始时,应用处理器单元402会发送指令(例如应用程序编程接口函数)至实时实时处理器单元404决定具有该对象标识符的对象414的储存位置,并根据片上存储器408存装置412读取对象414中具有片上存储器408的容量大小的一笔数据并写入至片上存储器电路406会传送信息告知实时处理器单元404。接着,实时处理器单元404会判断针对对象410会从对象储存装置412读取对象414中具有片上存储器408的容量大小的下一笔数据并[0048]在图2所示的实施例中,可编程电路208同时包含网络子系统214与储存子系统器来从通用处理器卸载数据处理的电路架构[0049]图5为依据本发明一实施例的可编程电路的示意图。图2所示的运算装置200可修[0050]图6为依据本发明另一实施例的可编程电路的示意图。图2所示的运算装置200可修改为采用图6所示的可编程电路600,亦即可编程电路600可取代图2所示的可编程电路的对象储存服务(例如AmazonS3或其它云端储存服务),因而可基于来自网络的对象储存指令(例如AmazonS3Select)来针对运算装置所连接的对象储存装置进行数据获取的相存装置是分布式储存系统中的一部分(例如键值数据库的一部分),则从网络所接收NVMe/TCP指令可包含键值指令,本发明运算装置便可基于键值指令来对储存装置进行相关的键根据需求来自行设计通用处理器核心所要执行的应用程序/程序代码以及现场可编程逻辑门阵列所要具

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论