




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河南省瑞光印务股份有限公司提供DSP内核的演变首先,为什么及什么时候必须使用DSP?我们可以先从应用的角度进行探讨。举个例说,手机通常需要至少2个DSP引擎,一个用于通信工作,另一个用于应用处理。在通信方面,通话一端的语音信号经数字化和压缩(DSP的一个典型功能),被调制为一个无线信号(另一个DSP工作),再通过无线基础设施发送到通话另一端,然后执行解调解压(也是DSP的功能)。在手机的应用处理方面,载有视频、图片和音频信号的数据文件必须经过解碼,然后才会被发送到屏幕、扬声器和耳机,所有这些典型的DSP工作虽然本质上各不相同,但它们都是通信信道需要的工作。 随着无线通信的不断进步,为了追上4G无线信道上100Mbps的速度,DSP承担的工作也在大幅度演进。如此高位速率的调制和解调需要一些先进的算法,包括多天线(又称 MIMO)、多载波调制和QAM调制方案。而DSP引擎已作出相应发展,能够以多种方式满足这些要求,变成应用专用(或通信专用)DSP。 在其它DSP领域也经已出现类似的进展,譬如视频处理就是一例。近年来,屏幕分辨率已从VGA渐渐提高到Full HD高分辨率(1080p),而且为了处理这些更高的分辨率,并保持最低的位速率,市场也出现了多种视频标准。由于传统的DSP引擎已很难满足这些要求,各种不同的架构和设计理念应运而生,包括多核设计和SIMD(单指令,多数据)处理技术。在这里,DSP处理样演变为应用专用处理器,专门用于多媒体工作,同时保持其普遍性。下面将对这些方面进行详细的讨论。 处理DSP应用的不同方法在SoC中实现DSP功能性有好几种方法,而我们将主要介绍DSP的可编程设计和半可编程设计实现方案,包括中央处理单元(CPU)、微控制器单元(MCU),和DSP。至于完全采用硬件来执行算法的硬件线路方法,这里就不赘述了。 CPU的典型例子有Pentium和PowerPC处理器。这些超高性能的处理器本质上是通用处理器,时钟频率高达2GHz或更高。CPU用于个人电脑、工作站和笔记本电脑等系统,而通常不适合于嵌入式应用。它们能够处理信号处理工作,但由于频率频率极高,致使功耗也相当高,同时带来电池寿命方面的问题。此外,这类CPU成本非常高,所以不适用于大多数消费电子设备。 另一方面,MCU可被视为Pentium这类CPU的较慢较小版本。ARM和MIPS科技等公司都提供针对嵌入式应用的内核,它们主要适用于控制工作,能够运行Windows Mobile和Linux等操作系统。一般而言,MCU主要针对控制工作而设计,缺乏典型的DSP支持能力。不过,也有一些MCU具有DSP功能性专用扩展,这一点稍后再作介绍。 获得DSP功能性的第三种方法是纯粹DSP,它们非常适用于数学密集型工作和以资料为主的处理工作,而且专门为嵌入式应用而设计,可确保功耗及电路尺寸适合SoC芯片使用。这种纯粹DSP的典型例子有德州仪器的C55和C64、ADI的Blackfin以及CEVA的TeakLite和 CEVA-X DSP内核系列。 图1以X-Y坐标空间的形式描述了这些不同DSP解决方案的性能和灵活性。硬件线路加速器也在其中。此外,图中用不同的颜色标注出了每一种解决方案的功耗程度。图1 不同DSP解决方案的性能和灵活性MCU是完全可编程设计的通用处理器,故能够执行多种不同功能,适用于SoC中的不同应用。不过,因为MCU不是为DSP功能而设计,所以在这一方面无法获得高性能。 如果运行频率在1GHz到2GHz范围的话,CPU执行DSP功能的速度当然比MCU更快。但是,除非电池容量够大,否则在掌上型产品中几乎不可能采用CPU来执行DSP功能。而硬件线路引擎的DSP性能最高,功耗最低,而灵活性却大为逊色。 迄今为止,本地DSP在灵活性、性能和功耗三者之间的权衡折衷是最好的。随着不同DSP应用继续发展,嵌入式处理器也衍生出新的类型。下面将一一进行讨论。 DSP工作演变带动DSP处理器不断发展近年来,各种应用中的DSP要求有了显著的提高。例如,只要分析一下音频要求的演进,便会发现在极短时间内同时出现了多个进展,超过了DSP要求的5倍多。下面列出了家用音频应用设备中的一些新发展: 每通数据流的声道数目从2(立体声)增加到5.1(典型杜比数位设备),到7.1(典型蓝光光盘播放机);需要译码并混合的数据流数目从1(典型A/V接收器)增加到2(典型DVD用例)再到3(蓝光光盘用例);每通译码数据流的位速率从48Kbps(MP3)增加到24Mbps(DTS-HD MA); 音频转码器及后处理功能的复杂性增加。 当前的DSP面对视频应用及其提出的要求也存在类似情况,同样需要更高的解析度、更高的位速率和更复杂的视频标准,而相关的设计工具已不断推出。至于无线通信应用,只要分析从3G到4G无线标准的位速率演进,就可看出这一变化趋势,而且这种成长还不是线性而是指数级的。图2描绘出了三大DSP领域的技术进展。图2 三大DSP领域的技术进展为了满足对DSP能力的不断攀升的要求,三种基于处理器的方案中,每一种都在向不同的方向演变。 MCU供货商已尝试透过在其架构中增加一些DSP功能,以及利用专用DSP指令来扩展这些处理器的ISA,来满足不断增长的要求,而ARM Cortex-A8就是一典型例子。该组件的CPU连接了一个SIMD加速器(ARM NEON),不过有些供货商选择的方向稍有不同,他们允许程序设计人员利用自己的指令来扩展其MCU。在这两种情况中,DSP扩展都能够提供一个不错的系 统折衷来实现基本DSP功能。不过,对于中高阶处理要求,这种MCU解决方案就完全不可行,并会使产品开发和再用方面出现严重的缺陷。下一节我们将较详细地讨论这些缺陷。 CPU供货商已经明白,单纯靠提高处理器的运行速度是不足以满足不断增长的要求的。相对之下,多处理器架构提供了一种替代解决方案,可实现更高的指令级并行性(instruction-level- parallelism;ILP),但这种方法更难满足可携式设备的严格功率预算要求。面对其它要求更严苛的用例,CPU供货商干脆决定把精力集中自己的核心专业技术上,而把重负载的DSP应用让位给其它解决方案。譬如,CPU(或多核CPU)都不能有效地以1080p分辨率译码视频讯号,或运行LTE基频,于是这类工作便由市场专用DSP来解决。 市场专用DSP已成为DSP供货商的另类方案,以期满足高阶DSP处理要求。过去,通用DSP曾一度流行,为多个终端市场提供高阶的处理。这类DSP的可再用性和普遍性,使其在市场上非常普及,为不少开发商及合作伙伴所采纳。虽然通用DSP现在仍拥有某些市场,但更高阶领域则需要市场专用性更强的方案,也就是采用ISA来支持市场专用功能(如最新无线通信标准所需的44矩阵计算能力)。市场专用DSP能够更仔细地满足整个市场的要求,提供更多所需的能力,同时又不限制这种架构在该市场上不同解决方案中的可再用性(譬如能够有效用于LTE、WiMAX、HSPA+、EV-DO等的无线通信DSP)。图3在同一X-Y空间中描绘出了这些不断演进的DSP解决方案。图3 不断演进的DSP解决方案在MCU中增加DSP功能这是一个好办法吗?MCU供货商提升性能的其中一个方法,是提供可扩展架构的DSP指令。有些供货商提供带有预先定义DSP ISA扩展的MCU产品(如ARM NEON);也有一些供货商提供了一系列各种各样的DSP ISA扩展,供用户选择;另外一些供货商则允许获授权者自行开发DSP指令。在所有这些情况中,由于这些DSP ISA扩展由于并非处理器所固有,故不妨将之视作中央微控制器的附属加速器。 设计人员在考虑选用一个扩展MCU来实现先进DSP工作时,必须了解其缺点所在,例如下列的问题:除非设计人员小心设计内存存取,否则加入的功能单元(譬如MAC单元和加法器)可能无法运作。一般而言,在大型平坦内存模型上,MCU同一时间只能支持单个内存存取,而且还存在不同的数据故障限制。这与大多数基本DSP架构截然不同,并会很快降低任何DSP扩展 的附加价值。 MCU往往非常依赖带有特权模式(privilege mode)和虚拟储存支持的缓冲记忆架构,这是由于它们必须支持的控制功能的特性之故。另一方面,DMA在MCU中不会被频繁采用,因此可以把基本DMA作为一个外挂程序提供给MCU。在数据高度密集的DSP应用中,鉴于应用的实时特性,以及它对确定性处理的要求,先进的DMA是不可或缺的。所以与扩展MCU刚好相反,在处理器架构内,先进的DSP本身就支持DMA机制。 利用DSP指令来扩展MCU通常不会引起寻址机制的任何大的变化。因此,这种扩展MCU通常不支持DSP应用中非常典型的独特寻址模式(因其可预测的数据存取模式,如循环缓冲器和位反置)。 由于这种DSP扩展不是MCU的固有部分,它们便需要使用编译器内在函数来充分发挥这些DSP功能的作用。也就是说,简明的C代码不能轻易地编译为适合在这种DSP扩展上运行的最佳汇编代码。对于DSP处理器,这种编译器支持是需要嵌入到编译器-架构交互设计中的。 MCU一般不支持某些算法所需要的特殊DSP数据类型,例如是先进无线应用中常见的10位和12位部件。此外,MCU中的数字准确度通常限制在32位,而在某些应用则需要更大的动态范围,高至72位数据,包括保护位(guard bit)、饱和硬件和循环机制(rounding mechanisms)。这些一般都根据应用的特定要求,由市场专用DSP处理。 在这类扩展MCU中,可用并行性通常限制程序设计人员同时使用MCU及其DSP扩展。于是,即使拥有处理能力,MCU也可能无法以最佳方式来予以利用。 除此之外,扩展MCU虽然为程序设计人员提供了一组不同的DSP扩展供选择,甚至让程序设计人员能够利用自己的DSP指令集来扩展ISA,但还存在一个“非标准”的问题。这种“按需定制”的处理器设计乍看可能颇具吸引力,然而软件维护极其困难,因为设计人员必须不停地从一个架构向另一个架构移植代码,无法再用自己的代码。这也意味着因为某些指令和机制可能有别,由协力厂商软件供货商开发的代码未必运行在既有配置上。由于这已成为一个专有的处理器架构,MCU供货商将不能继续自己的发展蓝图。而另一方面,这种特定MCU配置的使用者(及开发者)则必须维持自己的处理器发展蓝图,以延续一个完整的产品发展蓝图。 结语随着无线通信和多媒体技术的不断进步,工程师面临的设计挑战变得越来越复杂。传统的DSP引擎,对许多需要通用DSP能力来实现未来提升的应用而言(譬如可携式多媒体设备),仍然是一种可行的解决方案。但一些更复杂的工作,如4G无线通信处理和高分辨率视频/音频处理,则需要一种新的市场专用方案。起源于CPU领域并且也流行于MCU领域的多核设计,是提升性能水平的方法之一,不过这同时也增加了功耗。一些MCU厂商提出的另一种方法是提供不同的DSP ISA扩展。另一方面,DSP厂商开始将新设计转为市场专用DSP。然而,这些替代解决方案的功能性的性能、灵活性和效率到底如何,仍然是一大关键问题。 如上所述
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专业知识测试试题及答案
- 尿毒症甲状旁腺术后护理
- 婴幼儿肛周脓肿护理查房
- 药剂师的述职报告
- 服装店长的培训
- 2025年智能可穿戴设备野生动物追踪生物传感技术创新报告
- 2025-2030钻石行业市场现状供需特点及投资价值规划分析研究报告
- 2025至2030中国电化学酒精测试设备行业发展趋势分析与未来投资战略咨询研究报告
- 体检中心护理培训
- 公司出纳工作汇报
- 化工厂实习安全培训课件
- 生物安全培训试题(答案)
- 陪玩团基本知识培训课件
- 2025年司法考试真题及答案
- 2025四川蜀道建筑科技有限公司招聘16人考试参考试题及答案解析
- 芯片研发流程管理办法
- 电子工程师知识培训课件
- 电子电子技术试题及答案
- 浙江省中考科学说理题训练及答题技巧
- 兵团连队职工考试试题及答案解析
- 五年级篮球培训课件
评论
0/150
提交评论