基于TMS320C5409 图像压缩系统的实现(共12页)

上传人：2*** IP属地：湖北上传时间：2022-07-17 格式：DOC 页数：15 大小：2.72MB 积分：30 举报 版权申诉

已阅读5页，还剩10页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、DSP课程结课论文基于TMS320C28335 信号检测系统的实现学号：2014282120167姓名：熊正强专业：电子与通信工程指导老师：谭莹2014年12月基于(jy)TMS320C5409 图像压缩系统(xtng)的实现摘要(zhiyo)：该文基于DSP芯片的特点和JPEG图像压缩的原理，重点描述了一个基于TMS320VC5409 DSP芯片的图像压缩系统。其中对传统的JPEG算法的DCT变换和量化过程作了一些改进，使本系统压缩速度更快，在压缩率相同的情况下图像的质量更高。关键词：DSP；图像压缩；JPEG算法；快速DCT变换1引言随着多媒体和网络技术的发展和应用，数字图像大信息量

2、的特点使得图像压缩技术的要求也越来越高，因此，专用高速数字信息的处理技术成为发展的方向。其中，在硬件技术中，TI推出的C5000系列DSP将数字信号处理器的处理能力提高到了一个新的境界，使信号处理系统的研究重点又回到软件算法上。在压缩算法研究上，DCT，小波等多个算法因为其高可靠性和高效性也越来越受到青睐。2系统硬件设计2.1 TMS320C549作为主处理器可行性分析TMS320C5409是TI公司生产的新一代定点DSP芯片，时钟频率100MHz，性价比极高。采用围绕1组程序总线、3组数据总线和4组地址总线建立的改进型哈佛结构，取址和读数可同时进行。有独立的硬件乘法器，有利于实现优化卷积、数

3、字滤波、FFT，矩阵运算等算法中的大量重复乘法运算。具有循环寻址、位倒序等特殊指令，这些指令使FFT、卷积等运算中的寻址、排序及计算速度大大提高。有一组或多组独立的DMA总线，与CPU的程序、数据总线并行工作。还有独特的乘法指令和方便的立即数寻址方式。在本系统中，TMS320C5409作为主处理器，任务是实现JPEG压缩编码。文献4指出，以运算速度为100MHz的TMS320C5409作为主处理器，并以8X8的数据块作JPEG压缩编码时，所需要的机器周期为62Cycles，内存空间为6.3KB。如表2-1所示通过分析不难得到，当处理(chl)一帧大小为640*480的图像(t xin)时，作J

4、PEG压缩(y su)编码所需要的时间为：T=62*10(ns)*640*480=0.9866s当所处理的图像分辨率更小时，则压缩每帧所花的时间则更少，这对于应用在对实时性要求不是很高的场合是完全可行的。表 2- SEQ 表 * ARABIC 1 TMS320C54X性能和内存需要 TMS320C54x PerformanceTaskCycle/PixelPreprocessing22Interpolation410thers274：1：1Decimation JPEG &encoding62Total152TMS320C54x Memory requirementMemoryK bytePr

5、ogram1.7Data4.62.2硬件设计框图图21是基于TMS320C5409的图像处理系统的结构图。5409为中央处理器；SRAM为DSP片外扩展数据存储器；EPROM为脱机工作时的程序存储器，用于存储系统的引导程序和其他应用程序；A/D部分负责把转换为数字信号的图像存入帧存储器中地址译码、图像采集系统控制电路产生本系统各部分的地址译码信号，使之映射到不同的地址区域，并控制图像A/D芯片进行图像采集，这部分由CPLD实现控制；图像采集芯片的寄存器控制由51单片机完成。2.3存储空间的扩展方案经过模数转换的原始图像数据是非常大的，TMS320C5409的内部仅有32KW的随机存储器和16K

6、W的只读存储器不能满足需要，因此必须扩展存储器来存放原始图像数据和应用程序。我们考虑外接64KW的RAM和512KB的FLASH，RAM使用CYPRESS公司的CY7C1021V33，FLASH采用SST公司的SST39VF512。由于C5409的数据空间仅为64KW，因此采用内存页扩展技术。C5409的扩展输出口1Q和2Q作为扩展内存的页选择信号。用C5409的A15引脚和XF引脚通过3/8译码器来控制扩展存储器片选信号的产生，当A15=1。时选择片内RAM；当A15=1，XF=o时选择片外SRAM；当A15=1，XF=l时选择片外FLASH；存储器的扩展如图22所示。我们将外部扩展RAM的

7、64KW中的48KW用于存放原始图像数据，16KW用于存放压缩后的图像和程序以及暂存的数据。图 2-1 图像处理(t xin ch l)系统结构框图图 2-2 存储器扩展(kuzhn)示意图2.4 DSP芯片(xn pin)电源电路设计电源设计中需要考虑的主要(zhyo)问题是功率和散热问题。功率要求：电流的消耗主要取决于器件的激活度，即CPU的激活度，外设功耗主要取决于正在工作的外设及其速度，与CPU相比，外设功耗是比较小的。以TMS320C5409为例，其进行FFT运算时，需要的电源电流最大。因此在设计电源时，必须考虑在电源电流和实际需用电流之间留有一定裕量，因为峰值电流会更大，裕量至少是

8、20。C5409采用了双电源供电机制，其工作电压为3.3V和1.8V。其中，1.8V主要为DSP的内部逻辑提供电压，包括CPU和其它所有的外设逻辑。外部接口引脚采用3.3V电压。本系统中电源采用了TI公司的两路输出电源芯片TPS73HD318，它是一种双输出稳压器。输出电压一路3.3V、一路1.8V，每路电源的最大输出电流为750mA。3 JPEG图像压缩算法3.1 JPEG图像压缩图 3-1 JPEG图像压缩框图(kungt)传统(chuntng)的JPEG图像(t xin)压缩算法过程为(1)离散余弦变换(DCT)(2)量化(3)行程编码和烯编码(如图3-1)。其中二维DCT变换公式为：当

9、u，v=0，CU，CV= 否则CU，CV =1 (3-1)量化主要通过原始数据除以量化表得到。量化表值可以根据需要自定，其值规定了其所对应DCT系数的量化步长。编码根据直流和交流数据分别采取不同的编码方式。对DC系数，采用DCPM编码，前子块的DC系数被用来预测当前子块的DC系数进行差值无失真编码。对于AC系数，先按照Zig-Zag序列扫描，再进行游程编码。最后将所有码值进行熵编码，由此形成JPEG图像格式。3.2 JPEG算法的优化尽管JPEG基本系统能够对图像进行低压缩比压缩，但是DCT和IDCT在软件实现的过程中，是最耗费时问的运算，而且，由于没有考虑图像本身的频谱特性，JPEG量化表对

10、于所有图像压缩并不一定最优。采用快速DCT算法可提高软件的速度，增强软件的实时性。同时，根据图像本身的频谱特性，自适应改进JPEG推荐的量化表。3.2.1快速DCT算法如果将一幅图像(t xin)分成许多8*8的小块后直接(zhji)进行2D-DCT变换，运算量将会十分巨大。因此(ync)需要将8*8二维DCT变换转换成为两次8点的一维DCT的复合运算。具体做法是对每一个8*8块，先做列方向上的DCT，得到一个中问矩阵，再对该矩阵各行进行DCT。可以看到，8*8矩阵的2维DCT可以转换成16次一维8点DCT。目前，针对一维DCT运算，很多不同的DCT快速算法已经提出。其中LoeffIer算法6

11、需要的计算量最小。图3-2给出了Loeffler算法的流程图。Loeffler算法将8点的一维DCT运算分为4级运算，由于各级之间的输入输出的依存关系，4级操作必须串行进行，而各级内部的运算可并行处理。图3-3 三种运算因子流程图中有三种运算因子：蝶形因子、旋转因子和倍乘因子，分别如图3-3中的a，b，c所示。蝶形因子的运算关系为：O0=I0+I1O1=I0-I1需要2次加法完成；倍乘因子的输入输出关系比较简单：，只需1次乘法；旋转因子的运算关系为：需4次乘法2次加法完成。如果对其输入输出关系式做以下(yxi)变换：只需要(xyo)3次乘法(chngf)3次加法。其中和以及它们的和差都是已知

12、系数，通过查表获得。由此计算，可知，一个8点DCT的Loeffner算法共需要11次乘法29次加法。从DSP汇编语言编程的角度来看，一个代数运算应包括取操作数、运算、存操作数三个步骤。因此，该算法大约需要120条指令。C5409的运算能力很强，支持单周期加/减法和单周期乘法运算，并且能够在单周期完成两个16位数的加/减法运算，再加上DSP中有3组数据总线，因而可以利用长操作数(32位)进行长字运算。在长字指令中，给出的地址存取的总是高16位操作数，因而只需5条长字指令即可计算2个蝶形运算。加上采取其它的一些优化措施，大约90条指令完成Loeffler算法。虽然Loeffler算法运算量最小，但

13、是运用于本文系统并不是最优。因为该算法是为高级语言设计，没有利用汇编语言的特点和DSP硬件的特点。本文提出了基于DSP乘法累加单元的D(、T快速算法。DSP的乘法累加单元能在单周期内完成一次乘法和一次累加运算。如汇编指令(表31所示)运用于DCT运算，将大大简化程序的复杂度并减少计算的时间。表 3-1 C5409双操作数乘法累加指令指令表达式字数周期MAC Xmen，Ymen，Src，dstDst=Src+Xmen*YmenT=Xmen11MACRXmen，Ymen，Src，dstDstRnd(Src+Xmen*Ymen),T=Xmen11具体算法如下：利用(lyng)蝶形运算：S0=X(0)

14、+X(7) ; S7=x(0)-x(7)S1=X(1)+X(6) ; S6=x(1)-x(6)S2=X(Z)+X(5) ; S5=x(2)-x(5)S3=X(3)+X(4) ; S4=x(3)-x(4)展开(zhn ki)一维DCT公式(gngsh)：当K0 （3-2）经过化简合并后结果如下：y(0)=aS0+aSl+aS2+aS3y(2)=fS0+gSl-gS2-fS3y(4)=aS0-aSl-aS2+aS3y(6)=gS0-fS1+fS2-fS3y(1)=eS4+dS5+cS6+bS7y(3)=-dS4-bS5-eS6+cS7y(5) =cS4+eS5-bS6+dS7y(7) =-bS4

15、+cS5-dS6+eS7其中：从上面(shng min)表达式可以看出，y(o)-y(7)都是乘法(chngf)累加运算，而So-7可由x(O)x(7)经过(jnggu)蝶形运算得到，因此DCT算法由原来的四级运算变成两级，即第一级蝶形运算和第二级乘法累加运算，第一级蝶形运算共要10+414(10次计算操作和4次辅助操作)条指令第二级运算每个输出要4+1+1=6条指令(做4次乘法累加运算、1次读取操作和1次存储操作)，一共48条指令，这样计算一个8点DCT要62条指令。这样大大缩减了运算的时间，提高了CPU的工作效率，增强系统的实时性。3.2.2量化运算优化在JPEG图像压缩技术中，传统量化的

16、核心是量化表。所谓标量量化就是对8*8图像块的DCT变换系数使用量化表组逐个相除并四舍五入。JPEG推荐了色度与亮度两个最化表，它按照自然图像进行高频与低频部分压缩量的比率分配。但是如果图像信号频率分布不均，如高频分量很多或低频分量很多，这个量化表就不是最优的了。因此如果按照图像高频低频的具体情形对量化表调整，就可以在质量相同的情况下获得更高的压缩率，或者在压缩率相同的情况下获得更高的图像质量。本文提出的根据事实情况自适应量化方法，即量化阶段采用二次计算的方法，其算法过程主要为两步：(1)对变换后的图像系数进行自适应处理。(2)构造新的量化表。具体方法如下：首先求出亮度分量和两个色度分量在频率

17、域中所有8*8子块的63个交流系数绝对值的平均值P(u，v)，其中u，v=o7为位置信息。接下来求出63个交流系数平均值中的最大值，Z1(u，v)=MAXP1(u，v)，最后将63个交流系数平均值进行归一化处理，同时加入频率位置信息，分别得出亮度和色度量化表中63个交流分量的矫正系数，计算过程如式： (3-3)由此可以得到量化表的矫正式Qp1(u，v)=Q1(u，v)/X1(u，v)对JPEG量化表进行矫正，作为最终的量化表进行量化。将上述矫正后的量化表作为最终的量化表，对图像进行(jnxng)标准JPEG压缩(y su)形成完全符合JPEG格式的压缩文件。本算法的解码过程(guchng)与标

18、准JPEG解码过程完全相同，可以看出它也是标准JPEG编码过程的逆过程。4实验结果4.1快速DCT运算表 4-1三种算法比较Loeffler算法Loeffler算法用于DSP本文算法单周期指令条数1208862测试时间1243ns885ns628ns将本文提出的算法，Loeffler的DSP优化算法和纯Loeffler算法分别进行测试。结果如表4-1，我们可以看到本文算法较Loeffler的DSP优化算法大约节省了1/4的时间，较纯Loeffler算法大约节省了一半的时间，其效果是十分明显的。(5409时钟频率100M)4.2自适应量化表 4-2 同压缩比下峰值信噪比的比较Standard

19、JPEG MethodCompression rate PSNR/dBAdaptive quantization JPEGCompression rate PSNR/dB3.41934.925 6073.42235.411 5814.38934.968 2484.48333.417 5255.02731.913 2885.19032.361 5028.32128.730 9768.44629.916 54816.02221.996 01216.30923.425 712就自适应量化器进行了微机仿真。本文采用中等复杂度的标准图像作为测试图，与基本JPEG系统进行性能比较。(基于峰值信噪比(PSN

20、R)。只将JPEG标准方法中的量化表更改为322修正的量化表，就可以在同等压缩比下，提高恢复图像的质量。表42为不同压缩比下，采用JPEG量化表和自适应量化表两种方法的峰值信噪比的比较。从压缩比和峰值信噪比的对比结果可看出，自适应量化JPEG方法在压缩比略高于标准JPEG方法。5结论(jiln)本文(bnwn)以TI的TMS320VC5409作为开发平台，实现(shxin)了一种新的JPEG图像压缩系统。该系统的优点是提高了JPEG的运行速度，增强了图像的压缩率和质量，并且易于硬件实现。这一实现方案可应用于需要对视频图像进行实时采集、压缩及存储的绝大部分场合。参考文献1黎洪松，成实译JPEG静止数据压缩标准M北京：学苑出版社，19962林福宗图像文件格式(上)M北京：清华大学出版社。19963TMs320VC5409 Datasheet，DB/0L.Literature Number：SPRS082C；Texas Instruments;April 19994wi

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

基于TMS320C5409 图像压缩系统的实现(共12页)

文档简介

温馨提示

最新文档

评论

基于TMS320C5409 图像压缩系统的实现(共12页)

文档简介

温馨提示

最新文档

评论

相关文档