dsp --数字信号处理芯片的发展和应用_第1页
dsp --数字信号处理芯片的发展和应用_第2页
dsp --数字信号处理芯片的发展和应用_第3页
dsp --数字信号处理芯片的发展和应用_第4页
dsp --数字信号处理芯片的发展和应用_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 6 数字信号处理芯片的发展和应用数字信号处理芯片的发展和应用 关键词 数字信号处理 芯片 发展 应用 摘要 数字信号处理 DSP 系统由于受运算速度的限制 其实时性在相当的时间内远不如模拟信号 处理系统 从 80 年代至今的十多年中 DSP 芯片在运算速度 运算精度 制造工艺 芯片成本 体积 工作电压 重量和功耗方面取得了划时代的发展 开发工具和手段不断完善 DSP 芯片有着非常快的 运算速度 使许多基于 DSP 芯片的实时数字信号处理系统得以实现 目前 DSP 芯片已应用在通信 自动控制 航天航空及医疗领域 取得了相当的成果 在载人航天领域 基于 DSP 芯片的技术具有广 阔的应用前景 数字信号处理作为信号和信息处理的一个分支学科 已渗透到科学研究 技术开发 工业生产 国防和国民经济的各个领域 取得了丰硕的成果 对信号在时域及变换域的特性进行分析 处理 能 使我们对信号的特性和本质有更清楚的认识和理解 得到我们需要的信号形式 提高信息的利用程度 进而在更广和更深层次上获取信息 数字信号处理系统的优越性表现为 1 灵活性好 当处理方法和参 数发生变化时 处理系统只需通过改变软件设计以适应相应的变化 2 精度高 信号处理系统可以通过 A D 变换的位数 处理器的字长和适当的算法满足精度要求 3 可靠性好 处理系统受环境温度 湿度 噪声及电磁场的干扰所造成的影响较小 4 可大规模集成 随着半导体集成电路技术的发展 数字电路 的集成度可以作得很高 具有体积小 功耗小 产品一致性好等优点 然而 数字信号处理系统由于受到运算速度的限制 其实时性在相当长的时间内远不如模拟信号 处理系统 使得数字信号处理系统的应用受到了极大的限制和制约 自 70 年代末 80 年代初 DSP 数字 信号处理 芯片诞生以来 这种情况得到了极大的改善 DSP 芯片 也称数字信号处理器 是一种特别 适合进行数字信号处理运算的微处理器 DSP 芯片的出现和发展 促进数字信号处理技术的提高 许 多新系统 新算法应运而生 其应用领域不断拓展 目前 DSP 芯片已广泛应用于通信 自动控制 航天航空 军事 医疗等领域 DSP 芯片的发展 70 年代末 80 年代初 AMI 公司的 S2811 芯片 Intel 公司的 2902 芯片的诞生标志着 DSP 芯片的 开端 随着半导体集成电路的飞速发展 高速实时数字信号处理技术的要求和数字信号处理应用领域 的不断延伸 在 80 年代初至今的十几年中 DSP 芯片取得了划时代的发展 从运算速度看 MAC 乘 法并累加 时间已从 80 年代的 400 ns 降低到 40 ns 以下 数据处理能力提高了几十倍 MIPS 每秒执 行百万条指令 从 80 年代初的 5MIPS 增加到现在的 40 MIPS 以上 DSP 芯片内部关键部件乘法器从 80 年代初的占模片区的 40 左右下降到小于 5 片内 RAM 增加了一个数量级以上 从制造工艺看 80 年代初采用 4 m 的 NMOS 工艺而现在则采用亚微米 CMOS 工艺 DSP 芯片的引脚数目从 80 年代初 最多 64 个增加到现在的 200 个以上 引脚数量的增多使得芯片应用的灵活性增加 使外部存储器的扩 展和各个处理器间的通信更为方便 和早期的 DSP 芯片相比 现在的 DSP 芯片有浮点和定点两种数据 格式 浮点 DSP 芯片能进行浮点运算 使运算精度极大提高 DSP 芯片的成本 体积 工作电压 重 量和功耗较早期的 DSP 芯片有了很大程度的下降 在 DSP 开发系统方面 软件和硬件开发工具不断完 善 目前某些芯片具有相应的集成开发环境 它支持断点的设置和程序存储器 数据存储器和 DMA 的 访问及程序的单部运行和跟踪等 并可以采用高级语言编程 有些厂家和一些软件开发商为 DSP 应用 软件的开发准备了通用的函数库及各种算法子程序和各种接口程序 这使得应用软件开发更为方便 开发时间大大缩短 因而提高了产品开发的效率 目前各厂商生产的 DSP 芯片有 TI 公司的 TMS320 系列 AD 公司的 ADSP 系列 AT T 公司的 DSPX 系列 Motolora 公司的 MC 系列 Zoran 公司的 ZR 系列 Inmos 公司的 IMSA 系列 NEC 公司 的 PD 系列等 通用 DSP 芯片的特点 2 6 1 在一个周期内可完成一次乘法和一次累加 2 采用哈佛结构 程序和数据空间分开 可以同时访问指令和数据 3 片内有快速 RAM 通常可以通过独立的数据总线在两块中同时访问 4 具有低开销或无开销循环及跳转硬件支持 5 快速中断处理和硬件 I O 支持 6 具有在单周期内操作的多个硬件地址产生器 7 可以并行执行多个操作 8 支持流水线操作 取指 译码和执行等操作可以重叠进行 DSP 芯片的应用 随着 DSP 芯片性能的不断改善 用 DSP 芯片构造数字信号处理系统作信号的实时处理已成为当今 和未来数字信号处理技术发展的一个热点 随着各个 DSP 芯片生产厂家研制的投入 DSP 芯片的生产 技术不断更新 产量增大 成本和售价大幅度下降 这使得 DSP 芯片应用的范围不断扩大 现在 DSP 芯片的应用遍及电子学及与其相关的各个领域 典型应用 1 通用信号处理 卷积 相关 FFT Hilbert 变换 自适应滤波 谱分析 波形生成 等 2 通信 高速调制 解调器 编 译码器 自适应均衡器 仿真 蜂房网移动电话 回声 噪声对消 传真 电话会议 扩频通信 数据加密和压缩等 3 语音信号处理 语音识别 语音合成 文字变声 音 语音矢量编码等 4 图形图像信号处理 二 三维图形变换及处理 机器人视觉 电子地图 图 像增强与识别 图像压缩和传输 动画 桌面出版系统等 5 自动控制 机器人控制 发动机控制 自动驾驶 声控等 6 仪器仪表 函数发生 数据采集 航空风洞测试等 7 消费电子 数字电视 数字声乐合成 玩具与游戏 数字应答机等 在医学电子学方面的应用 如同其它数字图像处理一样 DSP 芯片已在医学图像处理 医学图像 重构等领域 如 CT 核磁成象技术等方面得到了广泛的应用 已取得了令人满意的效果 在助听 电 子耳涡等方面也取得了相当的进展 文献 1 2 国内 外也有关于脑电 心电 心音和肌电信号处 理方面基于 DSP 芯片系统的报道 文献 4 7 我们对 1996 年以前国外生物医学工程的部分核心期 刊 如 IEEE Transactions on Biomedical Engineering Computers and Biomedical Research 等核心期刊进行 检索 有关基于 DSP 芯片处理系统的报道很少 对国内生物医学工程的核心期刊 如 中国医疗器械 杂志 中国生物医学工程杂志 生物医学工程学杂志 和 中国生物医学工程学报 等刊物 进行检索 未见有关基于 DSP 芯片系统方面的报道 对我所的光盘数据库进行检索 未见有关在航天 医学方面应用的报告 我们认为在生理信号处理领域基于 DSP 芯片的技术可以解决我们在实际工作中遇到的某些问题 如当生理信号数据量很大 如脑电 肌电等 且处理算法相对复杂时 现有的微机在实时采样 处理 存 储和显示方面往往不能满足实际应用要求 而基于 DSP 芯片的高速处理单元和微机构成主从系统可以 较好地解决这类问题 载人航天领域中信号传输带宽的限制需要对生理数据进行实时压缩 大型实验中对庞大的数据进 行实时处理依赖于数字处理系统的构成 载人航天中对数据处理精度 可靠性要求以及功耗 工作电 压 体积 重量等方面的限制需要我们在构造处理系统中选择性能优良的芯片 我们认为将 DSP 技术 应用于载人航天领域具有十分重要的意义 结束语 以 DSP 芯片为核心构造的数字信号处理系统 可集数据采集 传输 存储和高速实时处理为一体 能充分体现数字信号处理系统的优越性 能很好地满足载人航天领域设备测量精度 可靠性 信道带 宽 功耗 工作电压和重量等方面的要求 目前 DSP 芯片正在向高性能 高集成化及低成本的方向 发展 各种各类通用及专用的新型 DSP 芯片在不断推出 应用技术和开发手段在不断完善 这样为实 时数字信号处理的应用 尤其是在载人航天领域中的应用提供了更为广阔的空间 我们有理由相信 DSP 芯片进一步的发展和应用将会对载人航天信号处理领域产生深远的影响 3 6 转贴于 中国论文下载中心 参考文献 1 李小华 李雪琳 徐俊荣 基于 DSP 的数字助听器的研究 95 年生物电子学 C 医学传感 器等联合学术会议文集 北京 1995 438 439 2 候 刚 徐俊荣 用于植入式多道电子耳涡的一种数字实时语音特征分析系统的研究 M 生 物医学工程前沿 合肥 中国科技大学出版社 1993 471 476 3 邱澄宇 何宏彬 用于心电信号数据压缩的数字信号处理器 M 生物医学工程前沿 合 肥 中国科技大学出版社 1993 463 466 4 Vijaya Krishna G Prasad SS Patil KM A New DSP Based Multichannel EMG Acquisition and Analysis System J Computers And Biomedical Reserch 1996 29 395 406 5 刘松强 数字信号处理系统及其应用 M 北京 清华大学出版社 1996 223 228 6 孙丽莎 沈民奋 基于高阶统计量的心音建模分析 C 第八届全国信号处理学组织委员会 联合学术论文集 北京 航空工业出版社 1997 280 283 转贴于 中国 4 6 基于基于 DSP 芯片的超光谱图像压缩技术芯片的超光谱图像压缩技术 摘摘 要要 基于 DSP 的超光谱图像压缩系统中 一方面需要寻找优秀的算法 另一方面需要结合 DSP 芯片的特点 选取合适设计方案 实现系统设 计的功能 本文结合目前现状 重点介绍了算法的设计 以及 DSP 芯片的选取方法 并讨论了如何有效地优化系统 关键词关键词 DSP 图像压缩 超光谱图像 1 引言引言 超光谱图像压缩技术是现代信息处理技术中一项尤为重要的技术 近几年来基于 DSP 的图像压缩技术成为业内焦点 然而 数据运算量大 处理数据突发性强是图像处理 系统中最大的特点 尤其是超光谱图像 每幅图像一般有着上百层的光谱信息 同时 一方面 现有的 JPEG JPEG2000 等一些标准算法并不适合超光谱图像压缩领域的要求 或者因为其算法的复杂度难于硬件实现等 另一方面 DSP 芯片的飞速发展 各芯片的性能有差异 完成的功能也不同 因此 算法的寻找与芯片的选择 是系统设计的关键 步骤 也是开发者十分关注的问题 2 系统的算法设计系统的算法设计 图像压缩算法中 主要包括脉码调制 量化法 预测编码 变换编码 矢量量化 子带编码等 在现有图像编码方法进一步发展的同时 一些新的具有重要发展前景的图像 编码方法如模型基图像编码方法 分形图像编码和神经网络方法等 取得了引人注目的进展并取得了不少研究成果 它们的显著特点是突破了常规编码技术所依据的信源编码 理论的框架 效果更好 2 1 系统对算法的要求系统对算法的要求 目前 流行的图像压缩方法众多 至于这些方法哪些更好或者哪些不好 还很难评价 而且各个算法的压缩效率也是与具体的图像数据和 DSP 芯片密切相关 无法下统一的 结论 但总的来说 在图像压缩技术中 大多是多种方法结合使用 很少有用单纯一种方法完成的 一般来说 压缩比越大 算法越复杂 实时压缩解压缩的困难程度越大 要求的硬件环境也越高 比如在可视电话中 若原图像格式采用 QCIF 176 144 则原始图像有 4 5Mb s 的数据量 若最后用 28 8kb S 的 MODEM 在 PSTN 上传输 则要提供 150 多倍的压缩 当然 由于算法的复杂度增大 还需付出大量的软件和硬件代价 对于不同的应用系统 算法有相应的要求 如遥感超光谱图像实时压缩系统中 一般要求是无损压缩 且芯片体积小 性能稳定等 而在视频图像压缩系统中 则要求较大 的压缩比 即使丢掉一些信息也是允许的 且芯片处理速度要快 能够达到系统实时性的要求 即使在确定的系统中 选择合适的算法也有着重要的意义 比如采用 ADI 公司 Blackfin533 系列 DSP 定点 DSP 当处理一幅大小为 720 576 的灰度图片时 采用改进后的 DCT 算法共耗时 252ms 如果采用传统的 DCT 变换方法 仅 DCT 变换耗时就达 到 330ms 可见 算法的选择对系统的性能有着非常重要的作用 2 2 算法的选取算法的选取 到 2007 年为止 基于 DSP 的图像压缩技术中 最常见的是变换编码和熵编码 前者通过变换 重新组织数据 使图像能量相对集中于较少的几个系数 而其他的系数值只 具有很小能量 这样通过抑制能量小的系数 即可实现数据压缩 压缩方法是有损还是无损也由变换编码中是否丢弃一些高频能量来决定 如小波变换和离散余弦变换等 后 者则是在编码过程中不丢失信息量 即要求保存信息熵 是根据消息出现概率的分布特性而进行的 是无损压缩编码 在超光谱图像压缩系统中 往往是要求无损或近无损 一般采用传统的预测编码 DPCM 方法 它不经过变换 直接探索像素与像素之间的相关性和波段与波段之间的相关性 一般在波段之间采用预测编码 波段内采用变换编码 去掉波段和像素之间的相关性 然后再采用熵编码 对于 DSP 硬件系统来说 最擅长的工作是算法简单的加法和移位运算 如果需要保持较高的编码效率 则要尽可能采用运算简单 避免乘法 查找和判断的算法 尽量保持 软硬件的流水线结构 因此 目前能在 DSP 平台实现的图像编码中 采用的算法大多具有这些特点 比如变换编码中的整数小波变换 乘法器占用很大的硬件资源 不利于芯片实现 但由于小波滤波器的系数是固定的 因此把乘法操作优化为移位寄存器和加法器操作 即 只存在简单的移位和加法操作 速度很快 占用内存少 非常利于硬件实现 而熵编码中的算术编码 2001 年就有人提出一种改进的 Q coder 算术编码算法 2 采用重整化方法 可以用来解决硬件实现中的进位翻转问题 采用移位加来代替原算法中的乘法 可以在硬件花费较少的情况下显著提高算法的编码效率 5 6 3 系统的芯片选择系统的芯片选择 在系统设计过程中 选择 DSP 芯片是非常重要的一个环节 只有选定了 DSP 芯片 才能进一步设计其外围电路及系统的其他电路 超光谱图像压缩系统中 DSP 芯片的选择 应考虑实际应用的需要而确定 第一 要确定采用哪个公司或哪个系列的芯片 DSP 的主要供应商有 TI ADI Motorola Lucent 和 Zilog 等 其中 TI 占有最大的市场份额 另外 ADI 公司也占有一定的市 场 与 TI 公司相比 ADI 公司的 DSP 芯片系统时钟一般不经分频直接使用 串行口带有硬件压扩 可从 8 位 EPROM 引导程序 可变成等待状态发生器等 由于工作时钟较高 的原因 TI 公司的 DSP 芯片在单芯片处理能力上优于 ADI 公司的产品 但是在多芯片集成处理上 ADI 公司的 DSP 芯片性能更好一些 其他如 ALTEAR 公司的产品也有着部分市 场 例如 APEX20K 系列的 APEX20K200EFC484 2X 器件 在 H 264 标准中 先对算术编码的结构做了改进 用查表代替了乘法操作 并采用流水线结构实现 它的算术编码 器的速度可以达到 0 2bit cycle 3 图像压缩领域中 我国市场上最常见的是 TI 公司的 C6000 系列芯片 尽管 C5000 系列芯片也可用于图像处理系统 但满足不了实时性的要求 比如在指令周期为 10ns 的 C5402 上对一个 1M 大小的二进制数据流进行算术编码 需 0 4s 4 若处理一副 512 512 8 的图像 最少需要 800 多秒 不能满足实际的应用 另外还有 C8x 系列多核 DSP 集成系 统等 但由于价格昂贵和开发复杂也将被淘汰 第二 确定选择定点或是浮点 DSP 系统采用的数据格式决定了它所处理信号的精度 动态范围和信噪比 且不同数据格式的易用性和开发难度也不一样 目前定点 DSP 品 种最多 处理速度为 20 2400MIPS 浮点 DSP 基本由 TI 公司和 ADI 公司垄断 处理速度为 40M 1GFLOPS 论文下载中心 浮点 DSP 和定点 DSP 相比 有以下几个方面的区别 首先 浮点运算 DSP 比定点运算 DSP 的动态范围要大很多 比如 对于处理 8bit pixel 的 灰度图来说 用 16bit 定点 DSP 即可 如果大于 16bit pixel 则需选用浮点 DSP 来捕捉更大的动态范围 其次 浮点 DSP 处理速度大大高于定点 DSP 这一优点在实现高精度复杂算法时尤为突出 比如做 JPEG 标准这样复杂的算法 一般采用浮点 DSP 2005 年有人使用 TI 的 C6711 芯片 实现了 JPEG 算法 尽管处理时间为 5 6 秒 但若充分发挥芯片的潜能 处理速度还可以得到大幅度改善 5 另外 浮点 DSP 的寻址空间比定点 DSP 大得多 这一方面为大型复杂算法提供了可能 另一方面也为高级汇编语言编译器 DSP 操作系统等高级工具软件的应用提供了条件 可以看出 浮点 DSP 的处理速度与精度 存储器的容量 编程的灵活性和方便性要好于定点 DSP 但在功耗 成本 体积上定点 DSP 有它显著的优势 且易于实现 稳定 性好 第三 其他因素 除了上面的因素外 超光谱图像压缩系统选择 DSP 芯片还需综合考虑片内资源 开发工具 芯片价格 封装形式 质量标准 供货情况 生命周期等 尤 其是对于芯片的体积 封装形式和生命周期等方面的要求 比一般的图像处理系统要高 目前采用最多的 也是压缩性能较好的是整数小波变换和算术编码 其改进的算法有着不错的效果 且能用定点 DSP 实现 如 TMS320C62x 和 C64x 尤其是对于整数小波 变换 几乎所有的 C6000 系列都可以实现 但是对于比较复杂和需要查表一类的算法 采用浮点的比较多 如 JPEG 和 JPEG2000 标准算法 Huffman 编码等等 则需要选用如 C67x 浮点 DSP 例如 对一幅大小 512 512 24 位真彩图作为标准测试图像 可选择 TMS320C6711DSP 浮点 DSP 若使用 JPEG2000 标准进行压缩 则优化后的压缩时 间约为 4 8s 解码时间约为 2 2s 压缩率为 20 倍 同时主观视觉效果良好 6 4 系统性能优化系统性能优化 系统的性能优化包括软件优化和硬件优化 在图像处理算法中 存在大量的循环操作 因此充分地利用软件流水线技术 能极大地提高程序的运行速度 还可以节约硬件成本 使系统变得简单 提高系统的稳定性 例如 在模板匹配算法中 对于模板大小为 32 16 匹配范围为 112 56 采用最小绝对差和判定法 SAD 进行逐点匹配 假设采用 TMS320C6203 芯片 所有的运算和操 作都串行执行 且耗时都只 1 个 CPU 时钟周期 则总共需要 512 5 3200 8192000 个 CPU 时钟周期 耗时 32ms 而进行软件优化后 处理速度提高了约 21 8 效果是十分明 显的 7 另外在 2006 年有人研究了去相关 内联函数 短整型数据用整型处理和软件流水技术 解决了软件效率问题 采用基于 DSP 核及其数据链路特征的优化方法 可以使 软件效率提高 5 15 倍 并把这些优化技术应用在基于 DSP6416 平台的实时图像压缩系统中 在输入数据率 82M byte s 110M byte s 输出码流 29M byte s 的条件下 使该系统 达到了实时处理的能力 该算法已在国家某重点项目中成功运用 硬件优化方面 需要考虑存储空间 充分利用快速存储器 尽量节省程序和数据的存储空间 一般把核心的代码和常用函数放在速度较快的内部 RAM 中 可以提高系统的速度 若数据放在速度较慢的片外存储空间 读取数据时便会造成 DSP 流水线的停顿 因此 可以利用 DMA 模块将待处理数据搬移到片内存储空间 可以大大提高处理性能 如 2006 年提出的一种采用乒乓缓存策略的二维整型提升小波的并行体系结构 用移位操作代替乘法操作 大大减少了算法的运算量 整个结构采用流水线设计 提高了硬件资源 的利用率和降低了算法的中间存储量 与原算法相比 速度提高了 15 倍 达到了每秒 85 帧 重构图像的峰值信噪比也达到了 42dB 以上 8 总之 系统优化的时候 要针对具体芯片的特点 把软件算法与硬件结构融合 才能大大提高系统的效率 以 C64x 为例 由于 C64x 具有双 16 位扩充功能 能在一个周期 内完成双 16 位乘法 加减法 比较 移位等操作 因此可以将短整

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论