[硕士论文精品]离散余弦逆变换的硬件实现_第1页
[硕士论文精品]离散余弦逆变换的硬件实现_第2页
[硕士论文精品]离散余弦逆变换的硬件实现_第3页
[硕士论文精品]离散余弦逆变换的硬件实现_第4页
[硕士论文精品]离散余弦逆变换的硬件实现_第5页
已阅读5页,还剩51页未读 继续免费阅读

[硕士论文精品]离散余弦逆变换的硬件实现.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上海大学研究生毕业论文摘要图像压缩编解码技术是现代多媒体及通信领域中的关键技术之一。目前己出现了多种压缩技术并制定TH应的国际标准。离散余弦变换DISCRETECOSINETRANSFORMER,DCT及其逆变换INVERSEDISCRETECOSINETRANSFORMER,IDCT是许多图像编码国际标准的核心。离散余弦变换是解决压缩图像空间冗余度的主要方法,也是图像达到高压缩比所采用的重要方法之一。本文的研究即是针对离散余弦逆变换的硬件实现问题进行的,主要包括以下几个方面的工作首先介绍了视频压缩技术,并简述了视频编码的几个标准。阐述了离散余弦变换的研究现状,以及对离散余弦变换进行研究的意义。然后对离散余弦逆变换做了深入分析。给出了基于分布式算法DISTRIBUTEDARITHMETIC,OA的离散余弦逆变换结构,并对此结构进行了字长仿真。详细设计了离散余弦逆变换模块,给出了VHDL实现后的仿真波形图。最后,用FPGA开发板完成离散余弦逆变换的功能验证,并结合ASIC设讨乙的流程,采用上华O6UM的工艺库对离散余弦逆变换模块进行逻辑综合和自动布局布线,最终完成离散余弦逆变换的ASIC设计。关键字离散余弦逆变换,分布式算法,VLSI,FPGA上海大学研究生毕业论文ABSTRACTIMAGECOMPRESSIONENCODINGISONEOFTHEKEYTECHNIQUESINMODEMMULTIMEDIAANDCOMMUNICATIONFKLDAMONGKINDSOFCOMPRESSINGMETHODS,DISCRETECOSINETRANSFORMDCTISTHECOREOFMOSTINTERNATIONALIMAGECOMPRESSINGSTANDARDSDCTAREIMPORTANTMETHODSOFCOMPRESSINGTEMPORALREDUNDANCYTHISPAPERFOCUSESONTHEVLSIHARDWAREREALIZATIONOFDCTANDTHECONTENTSOFTHISPAPERARELISTEDASFOLLOWSFIRSTLY,THETECHIMQUESOFVIDEOCOMPRESSIONANDSOMESTANDARDSOFVIDEODECODERISREVIEWEDEXPATIATETHEACTUALITYRESEARCHOFIDCT,ANDTHESIGNIFICANCEOFREASEARCHONCTSECONDLY,DCTISSTUDIEDDEEPLYTHEDCTARCHITECTUREDEBASEDO1DISTRIBUTEDARITHMETICISPROVIDEDTHEWORDLENGTHISSIMULATED,THEDCTMODULEISDESIGNEDINDETAILANDTHEBLOCKDIAGRAMSANDWAVEFORMSIMULATIONDIAGRAMSAREPROVIDEDDCTISVERIFIEDINFPGADCTHARDW艇_ECIRCUITISSYNTHESIZEDOUT丽TLLAMBITOFCADENCEPLACEDANDROUTEDWITHSEOFCADENCEBYO6UMCOMSTECHNOLOGYINTHE1ASTSECTIONKEYWORDINVERSEDISCRETECOSINETRANSFORMER,DISTRIBUTEDARITHMETIC,VLSI,FPGA上海大学研究生毕业论文第一章绪论11视频压缩编码的技术概述111视频压缩的必要性人类接受的信息大约70O来自视觉【1】,因此它是人类最有效和最重要的信息获取形式。随着计算机技术、微电子技术、网络技术和信息处理技术的发展,在人类社会进入信息化时代的今天,图像信息的处理存储和传输在社会生活中的作用将越来越突出,人们对接受图像信息的要求也越来越迫切。已经可以断言,图像通信将是通信事业发展中面临的最大挑战,也是未来通信领域的市场热点之所在。和语音或文字信息相比,图像包含的信息量更大,更直观,更确切,因而具有更高的使用效率和更广泛的适应性。但是图像具有信息容量大的特点,这给视频图像的存储、传输等带来了很大的挑战。对于桌面数字化视频应用来说,视频压缩编解码技术起着关键性作用【2】。如果没有压缩,要想对一帧NTSC制式的彩色视频进行数字化传输的话视频图像数字化成720像素480线,每种色度中的每个像素用8位表示,每秒传输30帧,则要求信道的传输能力要达到248MBPS。同样,一帧HDTV的彩色视频图像,其分辨率为1920像素X1080线,每种色度中的每个像素用8位表示,每秒传输30帧,那么需要信道的传输速率为15GBPS。照这样的数据传输速率计算,在对图像不进行压缩的情况下,一张存储空间大约650M字节的CD盘只能够存储大约20秒钟的NTSC制式的视频图像或3秒钟的HDTV视频图像。目前CDROM设备的典型数据传输率约为150她S,那么要想从CD盘播放全运动NTSC质量的视频图像12MBPS用于播放视频信号,03MBPS用于播放立体声音频信号,必须对视频信号进行2001的压缩。经过2001的压缩后一张CD盘可以保存3400秒钟即大约1个小时的视频图像。IIDTV信号必须在6MHZ的信道该信道能够支持大约20MBPS的速率上播出,这样,要想播出HDTV信号,就需要进行751的压缩。因此,在保证一定的通信质量的前提下,设法压缩数字图像的数据量,从而压缩所需传输信道的频带宽度将是上海大学研究生毕业论文实现数字图像通信的一个关键问题。112视频压缩编码的基本方法视频压缩编码方法按照使用的图像帧可以分为帧内和帧间压缩编码两类。帧内INTRAFRAME压缩也称为空间压缩SPATIALCOMPRESSION。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似,压缩编码时可以采用以下静态图像压缩编码习技术,如PCM脉冲编码调制、预测编码、变换编码主成分变换或KL变换、离散余弦变换DCT等、统计编码HU岱MAN编码、算术编码、STMRMONFANO编码、行程编码等、矢量量化和子带编码等。由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。但在有些特殊的应用中,如要求能对所有的图像有随机存取的能力,必须使用帧内压缩方法,而不能使用帧间压缩方法。帧间INTERFRAME压缩编码是基于视频或动画的连续帧之间具有很大的相关性,即连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提高压缩量,增加压缩BB。帧间压缩也称为时间压缩TEMPORALCOMPRESSION,它通过比较时间轴上不同帧之间的数据进行压缩。帧差值FRAMEDIFFERENCING算法是种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。视频压缩编码方法按照算法原理来划分,主要有三类。一、无损LOSSLESS压缩编码无损压缩是指对使用压缩后的数据进行重构,解压缩后得到的数据与原来的数据完全相同。无损压缩又可称作冗余度压缩、嫡编码、信息保持编码等,它主要用于要求重构的信号与原始信号完全一致的场合,在多媒体技术中一般用于文本、数据的压缩。许多实用的无损压缩技术可以归结成一大类统计编码方法,它们在一些有损压缩方法中也经常被用到。例如,在医学图像的传输或存储中,由于有失真编码可能会影响到医学诊断的准确性,同样,法律上只能采用无损编码。熵编码就是一种无损编码,它是纯粹基于信号统计特性的一种编码技术,解码后能无失真地恢复原图像。常用的熵编码方法有霍夫曼HUFL胁AN编码和算2上海大学研究生毕业论文术编码。HUFFMAN编码是一种不等长最佳编码方法,即它的平均码长比相同概率分布的信源用其它任何一种有效编码方法得出的码长都短。算术编码的基本原理是任何一个数据序列均可表示成“0”或“L”之间的一个间隔,该间隔的位置与输入数据的概率分布有关。这种编码方法仅仅利用了图像中存在的冗余或相关性,而不考虑人眼的视觉特性,所以,采用无损编码,其编码压缩比通常不高。二、有损LOSSY压缩编码有损压缩是指使用压缩后的数据进行重构,解压缩后得到的数据与原来的数据有所不同,但不会让人对原始资料表达的信息造成误解。有损压缩是有失真编码,是不可逆压缩。以此为代价,在保证定的图像质量的情况下,有损编码能够得到很高的压缩比。有损压缩适用于重构信号不一定要和原始信号完全相同的场合。如图像、声音和动态视频等数据的压缩就可以采用有损压缩。有损压缩编码包括预测量化编码,变换编码和子带编码等。1、预测编码PREDICTIVECODING预测编码可以在一幅图像内进行桢内预测编码,、也可以在多幅图像之间进行帧间预测编码。预测编码基于图像信息的空间和时间的冗余特性,用相邻像素或图像块来预测当前像素或图像块的取值,然后再对预测误差进行量化和编码。预测编码的关键在于算法的选取,这与图像信号的概率分布有很大关系。2、变换编码TRANSFOIMCODING变换编码是消除图像信息结构相关冗余的一种更有效的方法。通过信号变换,使图像数据在变换域上最大限度地不相关。尽管图像变换本身并不带来数据压缩,但由于变换后系数之间的相关性明显降低,图像的大部分能量只集中在少数一些交换系数上,采用适当的量化和熵编码就可以有效地实现压缩编码,且可以利用人类视觉的生理和心理特点来得到较好的编码系统。对于变换方法的选择最好能与图像信号的特征匹配,此外还应失真要求、实现的难易和编码比特率等诸多方面综合考虑。对此,在实际编码工作中,常采用离散余弦变换DCTDISCRETECOSINETRANSFORM。3、子带编码SBCSUBBANDCODING。3上海大学研究生毕业论文子带编码利用M个带通滤波器把信号频带分解成若干个子带,对各个子带独立编码,然后再综合输出。子带变换编码技术其实是介于DPCM与DCT之间的变换编码,子带编码的突出优点是,经镜像滤波器组分解的各子带图像信号,在编码时,其噪声局限于本子带中,各子带信号可以按照不同图像质量的优先级传输。对于图像编码,子带编码的价值体现在客观质量高,主观效果好;编码率低的时候,没有变换编码的“方块效应”;复杂度不高,且适合并行处理;便于渐进编码,特别适合作为ATM传输或IP网络中的图像编码格式;适合于“多分辨率”设备与系统。有损压缩编码是根据人的生理和心理特性,当失真小于定的范围,通常都不会被察觉或影响很小。因而在一定失真范围内可以大大提高压缩比。三、混合编码在实际的系统中,选择上述几种编码技术的组合,可以在某一可接受图像质量下,得到较高的压缩比,有时称这种方法为混合编码。对于不同的应用通常有多种组合,用于实时电视信号压缩编码的一种成熟方案包括基于运动估值和运动补偿的差分脉冲编码调制,二维的离散余弦变换DCT,可以实现最佳不等长编码的HUFFMAN编码等。这个混合方案是当前提出的几种图像编码国际标准的基础。其中包括ISOIEC关于静止图像的编码标准JPEG,CCITT现ITU_T关于电视电话会议电视的视频编码标准H261和ISOIEC关于活动图像的编码标准MEPG1、MEPG一2、MEPG4。这些标准图像编码算法融合了各种性能优良的传统图像编码方法,是对传统编码技术的总结,代表了目前图像编码的发展水平。在本文中,我们主要是研究离散余弦变换的压缩方法。因为视频图像在空间上有很强的相关性,利用离散余弦变换技术可以有效地去除图像空间冗余,达到高压缩比,所以离散余弦变换方法已广泛应用于视频压缩国际标准,如H261N、H26351、MPEG一1141、MPEG2和HDTV中。12现有的视频编码标准及其介绍随着网络与多媒体日益广泛的应用,人们对媒体信息的消费需求不断地增长,统一的国际标准是多媒体信息和技术产品在全球范围内通用的必要基础。视上海大学研究生毕业论文频压缩编码经过四十多年,尤其是最近二十多年的发展,有些技术己十分成熟,其中以离散余弦变换DCT为代表的一类算法得到了广泛的应用和认可,并被采纳为国际标准。压缩方式很大程度上决定着图像的质量、压缩比、传输效率、传输速度等性能。随着多媒体技术的发展,相继推出了许多压缩编码标准,目前主要有JPEGEG2000、H261H263和MPEG系列等标准。上述标准中,除了3PEG2000是采用小波变换外,其它都是采用DCT变换,这是因为DCT变换可以使图像的大部分能量集中到直流和低频部分,这对于图像编码非常重要,而且DCT变换还有易于硬件并行实现的优点。1980年以来,国际标准化组织180、国际电工委员会IEC和国际电信联盟ITU下属的国际电报电话咨询委员会CCITT陆续完成了各种数据压缩与通信的标准和建议,如面向静止图像压缩的CCITTT81及ISO10918JPEG标准,在运动图像方面用于视频会议的CCITTH261PX64标准、用于可视电话的CCITTH263标准、用于VCD的IS011172MPEG一1及用于广播电视和DVD的ISOIEC13818MPEG一2标准以及适用于低传输速率MPEG一4和定义多媒体信息标准的MPEG7。下面就这些标准做一些简单介绍。121H261建议CCITT即后来的ITU第15研究组于1984年成立了“可视电话专家组”,经过3年的研究,提出了视频编解码器的H261建议草案,1990年7月通过了该建议。H261是用于会议电视的国际标准,既采用了帧内编码,又采用了帧间编码,因此它的压缩比大致是JPEG的三倍。H261标准用于音像业务的码率是P64KBPSPL,2,30。用于电视电话时PL或2,用于电视会议时P6。这种标准具有最小延迟实时对话的能力。ITUT在H281建议基础上进行了改进,于1995年提出了H263建议“甚低码率通信的视频编码”。I22MPBGI标准MPEGI制定于1992年,可适用于不同带宽的设备,如CD_R叫、VIDEOCD。它的目的是把221MBITS的NTSC图像压缩到12MBITS,压缩率为2001。这是图像压缩的工业认可标准。它可针对SIF标准分辨率对于NTSC制为5上海大学研究生毕业论文频压缩编码经过四十多年,尤其是最近二十多年的发展,有些技术己十分成熟,其中以离散余弦变换OCT为代表的一类算法得到了广泛的应用和认可,并被采纳为国际标准。压缩方式很大程度上决定着图像的质量、压缩比、传输效率、传输速度等性能。随着多媒体技术的发展,相继推出了许多压缩编码标准,目前主要有JPEGEG2000、H251H263和MPEG系列等标准。上述标准中,除了PEG2000是采用小波变换外,其它都是采用DCT变换,这是因为DCT变换可以使图像的大部分能量集中到直流和低频部分,这对于图像编码非常重要,而且DCT变换还有易于硬件并行实现的优点。1980年以来,国际标准化组织I0、国际电工委员会IEC和国际电信联盟ITU下属的国际电报电话咨询委员会CCITT陆续完成了各种数据压缩与通信的标准和建议,如面向静止图像压缩的CCITTT81及ISO10918PEG标准,在运动图像方面用于视频会议的CCITTH261PX64标准、用于可视电话的CCITTH263标准、用于VCD的ISOLLL72MPEGI及用于广播电视和DVD的ISOIEC13818MPEG一2标准以及适用于低传输速率BIPEG一4和定义多媒体信息标准的MPEG一7。下面就这些标准做一些简单介绍。I2IH261建议CCITT即后来的ITU第15研究组于1984年成立了“可视电话专家组”,经过3年的研究,提出了视频编解码器的H261建议草案,1990年7月通过了该建议。H261是用于会议电视的国际标准,既采用了帧内编码,又采用了帧间编码,因此它的压缩比大致是JPEG的三倍。H261标准用于音像业务的码率是P64KBPSPL,2,30。用于电视电话时PI或2,用于电视会议时P6。这种标准具有最小延迟实时对话的能力。ITUT在H261建议基础上进行了改进,于1995年提出了H263建议“甚低码率通信的视频编码”。I22IEEGI标准,MPEG一1制定于1992年,可适用于不同带宽的设备,如CDROM、VIDEOCD。它的目的是把221MBITS的NTSC图像压缩到12MBITS,压缩率为2001。这是图像压缩的工业认可标准。它可针对SIF标准分辨率对于NTSC制为这是图像压缩的工业认可标准。它可针对SIF标准分辨率对于NTSC制为一5一上海大学研究生毕业论文频压缩编码经过四十多年,尤其是最近二十多年的发展,有些技术己十分成熟,其中以离散余弦变换DCT为代表的一类算法得到了广泛的应用和认可,并被采纳为国际标准。压缩方式很大程度上决定着图像的质量、压缩比、传输效率、传输速度等性能。随着多媒体技术的发展,相继推出了许多压缩编码标准,目前主要有JPEGEG2000、H261H263和MPEG系列等标准。上述标准中,除了3PEG2000是采用小波变换外,其它都是采用DCT变换,这是因为DCT变换可以使图像的大部分能量集中到直流和低频部分,这对于图像编码非常重要,而且DCT变换还有易于硬件并行实现的优点。1980年以来,国际标准化组织180、国际电工委员会IEC和国际电信联盟ITU下属的国际电报电话咨询委员会CCITT陆续完成了各种数据压缩与通信的标准和建议,如面向静止图像压缩的CCITTT81及ISO10918JPEG标准,在运动图像方面用于视频会议的CCITTH261PX64标准、用于可视电话的CCITTH263标准、用于VCD的IS011172MPEG一1及用于广播电视和DVD的ISOIEC13818MPEG一2标准以及适用于低传输速率MPEG一4和定义多媒体信息标准的MPEG7。下面就这些标准做一些简单介绍。121H261建议CCITT即后来的ITU第15研究组于1984年成立了“可视电话专家组”,经过3年的研究,提出了视频编解码器的H261建议草案,1990年7月通过了该建议。H261是用于会议电视的国际标准,既采用了帧内编码,又采用了帧间编码,因此它的压缩比大致是JPEG的三倍。H261标准用于音像业务的码率是P64KBPSPL,2,30。用于电视电话时PL或2,用于电视会议时P6。这种标准具有最小延迟实时对话的能力。ITUT在H281建议基础上进行了改进,于1995年提出了H263建议“甚低码率通信的视频编码”。I22MPBGI标准MPEGI制定于1992年,可适用于不同带宽的设备,如CD_R叫、VIDEOCD。它的目的是把221MBITS的NTSC图像压缩到12MBITS,压缩率为2001。这是图像压缩的工业认可标准。它可针对SIF标准分辨率对于NTSC制为5上海大学研究生毕业论文352240;对于PAL制为352X288的图像进行压缩,传输速率为15MBITSS,每秒播放30帧,具有CD音质,质量级别基本与VHS广播级录像带相当。MPEG1的编码速率最高可达48MBITSS。应用MPEGL技术最成功的产品非VCD莫属了,VCD作为价格低廉的影像播放和存储设备,得到广泛的应用和普及。MPEGL也被用于数字电话网络上的视频传输,如非对称数字用户线路ADSL,视频点播VOD,以及教育网络等。123肝E广2标准MPEG一2【6】【7】制定于1994年,设计目标是高级工业标准的图像质量以及更高的传输率。MPE62所能提供的传输率在15粕一IOOMBS间,在NTSC制式下的分辨率可达720486。MPEG一2能够提供广播级的视像和CD级的音质。MPEG一2的音频编码可提供左右中及两个环绕声道,以及一个可选的低频增强声道LFE。MPEG一2的另一特点是,可提供一个较广范围的可变压缩比,以适应不同的画面质量、存储容量以及带宽的要求。归EG一2技术就是实现DVD的标准技术,现在DVD播放器也开始在家庭中普及起来了。除了作为DVD的指定标准外,MPEG一2还可用于为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频。MPEG一2是视频和音频信号数据压缩标准MOEGI的扩展,直接面向高数据率的广播格式,提供了有效的隔行视频信号编码算法,支持宽范围的比特率。124MPE64标准MPEG一4专家组成立于1993年。在1995年3月的FLORENCE会议上初步定义了一个音频验证模型,并于1996年1月在MUNICH会议上定义了第一个视频验证模型VERIFICATIONMODEL,VM,它提供了支持基于内容的视频表达环境。在JLLUNICH会议上曾公开征集有关综合数据编码技术,即适用于自然和合成数据的视频信息的编码技术。MPE64专家组自1993年7月开展工作以来,每隔3个月召开一次大会,总结前3个月的进展,部署下一阶段的工作。在两次大会期间,各个工作组ADHOC工作组还分别开展工作,有时也举行组内会议。会议后,会议文件将放在帅EG专用的FTP站点上,只有MPEG成员才有权限访问。会议期间6上海大学研究生毕业论文将有部分文件公开发布。MPEG4的另一进展体现在验证模型上,描述了编码和解码方法,主要用于软件模拟,以优化编解码的性能。1997年7月的会议后发布了VM80。MPEG征集到的技术建议经评估后,如认为可行,就会将其加到VM中。MPEG一4具有开放的编码系统,可以随时加入新的有效算法,为多媒体数据提供了更为广阔的平台,它定义一种格式、一种框架,而不是具体的算法。另外,MPEG7GISOIEC15938一般称为多媒体内容描述接口,侧重于媒体数据的信息编码表达,是一套可用于描述多种类型的多媒体信息的标准。MPEG一7目前己经实现了的应用包括数字图书馆、广播媒体选择、多媒体目录服务、多媒体编辑、远程教育、医疗服务、电子商务、家庭娱乐等,涉及教育、新闻工作、旅游、娱乐、地理信息系统、医疗应用商业、建筑等诸多领域。MPEG21H主要规定数字节目的网上实时交换协议。船EG一2L标准ISOIEC2100的正式名称是多媒体框架,其制订工作于2000年6月开始。MPEG21的重点是为从多媒体内容发布到消费所涉及的所有标准建立一个基础体系,支持连接全球网络的各种设备透明地访问各种多媒体资源。通过数字项的定义,IPEG21集成了MPEG系列的其它标准,因此MPEG21是建立在其它标准的基础之上的,它的出台可以将现有的标准统一起来,使消费者能自由使用音视频内容而不被的格式、编解码器、媒体数据类型之类的东西所干扰。13本文课题研究的意义、国内外研究情况及作者所完成的工作I31本文课题研究的意义随着微电子技术的发展,使用超大规模集成电路VLSI来制造图像编解码芯片已成为热门话题,从而促进了数字图像处理技术在更多领域中的广泛应用。但推广数字图像应用的最大的困难是直接表达数字图像需要巨大的数据量存储时占有容量大,在传输时占用信道宽。为了减少数据存储容量、降低传输带宽、缩短传输时间,数字图像的压缩编码就显得特别重要。目前的图像压缩标准,如JPEG、H26I建议、MPEGI、IIFPEG一2及最新的H263建议,其视频编解码均采用基于DCTIDCT变换运动补偿预测VLC编码的算法91。由于一幅图像中相邻像素有很高的相关性,因此可以采用数字信号处理技1上海大学研究生毕业论文术将图像信号进行压缩。典型的图像变换算法有离散余弦变换、小波变换等。在数字图像信号处理中应用最广泛的就是离散余弦变换,它在目前被认为是进行图像数据压缩的最佳方法。当要恢复原始图像信息时,就需要将压缩编码后的信息进行离散余弦逆变换IDCT。因此,IDC是视频解码的关键技术之一。IDCT是图像解码过程中计算量最大的部分,采用一种快速有效的IDCT实现方法对图像的解码尤为重要。在一些高速或实时场合,能否快速实现IDCT变换就成为关键技术。132国内外研究情况自NAHMED101、TNATARAJAN和KRRAO于1974年提出离散余弦变换概念以来,这种正交变换在图像处理、数据压缩等领域获得了广泛的应用。国内外很多高校和研究机构对DCTIDCT的算法进行了研究,提出了许多简化算法和结构。他们多采用流水线结构、增加线宽等方法来加快处理速度。国内的不少高校也有较多的研究,如上海交大图像通信研究所,对IDCT的硬件实现做了专门的技术报道,报道中就IDCT的几个关键问题做了分析和对策。当为IDCT实现选择算法时,主要考虑因素有乘法运算量、内在精度、结构的规则性等。在集成电路实现时乘法占用较大芯片面积,因此很多被提出的IDCT实现方法都强调减少乘法器数量。尽管如此,有时为了获得所需求的吞吐量,仍然需要较多乘法器。另外,一些算法虽然有较少的乘法运算量,但实现起来会导致不规则结构以及复杂的布线,这样可能要求较大的芯片面积和较长的设计时间。目前,有两种比较常用的IDCT算法;行列可分离的间接算法和使用多项式变换的直接算法。L、行列可分离的间接算法行列分离的IDCT算法,运算规律强,复杂度不高,经过精心设计后,在大规模集成电路VLSL中实现IDCT可以达到较高的性能。因此,现在绝大多数IDCT芯片都应用行列分离算法。由于二维DCTIDCT的正交可分解性,DCT和IDCT变换核是可分离的,所以二维IDCT变换可以分解成两次一维变换来实现。可以通过对输入的矩阵先做一维行变换,然后再做一维列变换来实现。即将NXN数据按行或列方向进8上海大学研究生毕业论文行N个LDIDCT计算。产生中间矩阵,然后对中间矩阵再按列或行方向进行N个2一DIDCT计算,最后得到2一DIDCT结果。因此,在考虑算法时,只需考虑LDIDCT的快速算法。2、使用多项式变换的直接算法由于间接算法的运算量要远远大于直接算法,所以直接算法也得到了比较多的应用。但实际上,直接算法过于复杂,并不适合于大规模集成电路的应用。因此,低运算复杂度的特性更有吸引力。最近,低运算复杂度和规律性成为2一DIDCT结构的主要研究方向。本文对行列可分离算法进行了深入研究。目前,2DIDCT主要采用WHCHEN的快速算法,此算法的核心思想是把2DIDCT变为IDIDCT,算法结构是行列分解,同时把88的矩阵变化为4X4的矩阵进行处理。在算法的乘法器设计上主要有两种设计方法L、硬连线乘法器2、基于分布式DISTRIBUTEDARITHMETIC,DA的查表式算法【11】【12】。总的说来,基本都能实现IDCT的实时处理功能。在此基础上我们应该找出一种速度快、又容易用硬件实现的算法,利用WHCHEN的快速算法结合改进的DA算法,提出规则的结构和模块化的思想,适合于VLSI电路实现的方法以达到HDTVMPHL的要求,这就是我所要做的课题。133论文的主要内容和作者所完成的工作本文先简要介绍了视频压缩编码的标准,并在此基础上重点阐述了视频压缩编解码的原理和压缩方法。再对视频压缩编码中关键模块离散余弦逆变换算法进行了深入分析,提出了基于分布式算法的离散余弦逆变换算法模型,并用现场可编程门阵列FPOA实现了离散余弦逆变换的硬件结构,经过功能验证后,用EDA软件综合、布局布线,最终完成离散余弦逆变换的ASICAPPLICAFIONSPECIFICINTEGRATEDCIRCUIT设计。本文作者参与了MPEG2视频解码器系统方案的论证和设计,并着重负责离散余弦逆变换模块的硬件实现方案的设计。论文章节安排如下第一章先简要介绍了视频压缩编解码的意义和基本的视频压缩方法,重点9上海大学研究生毕业论文提到本文要研究的离散余弦逆交换,接下来简单介绍了目前现有的几个重要视频编码标准,最后介绍了课题的研究意义和国内外研究现状以及作者的主要工作。第二章介绍了离散余弦逆交换算法原理,详细介绍了基于行列交换的离散余弦逆变换间接算法。第三章介绍了分布式算法的原理,然后详细介绍了基于分布式算法的离散余弦逆变换原理,以及采用其算法的WALLACETREE加法器的并行结构,最后给出了1DIDCT的结构框图。第四章主要介绍了离散余弦逆变换的误差分析,讨论了离散余弦逆变换误差产生的原因以及解决的方法,并对有限字长进行了仿真。第五章介绍了如何用FPGA开发板验证离散余弦逆变换的功能正确性,具体包括验证平台的设计、验证策略和具体的验证步骤。第六章先介绍了用EDA软件实现离散余弦逆变换芯片的具体流程,再在第五章的基础上,采用标准单元对离散余弦逆变换模块进行逻辑综合和自动布局布线,实现各个子模块的电路结构及其版图结构,最终完成离散余弦逆变换的ASIC设计。第七章论文总结与展望。10上海大学研究生毕业论文第二章离散余弦逆变换分析21离散余弦逆交换简介离散余弦逆变换DCT对具有GAUSEMARKER一1统计特性的信号有近似最优的去相关性的能力,是变换编码中最有效的变换。虽然离散余弦逆变换在压缩效率略逊于具有最好压缩能力的KL131141变化,但其结构简单,非常适合硬件实现。研究表明,直接设计的DCT快速算法将具有更高的效率。因此离散余弦逆变换在数字信号处理的许多领域得到了广泛的应用,特别是语音和图像的数据压缩中。应用的需要激发了人们对DCT快速算法的研究。在各种一维DCT1DDCT快速算法不断提出的同时,为了适应多维信号处理的需要,二维及多维DCT算法的研究也受到了人们的广泛重视。KAMMANGAR和RAO提出了一种将二维DCT2DDCT转化为一维变化的算法NASRABADI和KING、VETTERLI采用类似一维的方法,提出将二维DCT转化为二维DFT的实现算法CHO等通过输入输出下标映射的方法,将NN二维DCT用N个N点维DCT实现,乘法复杂性降低到行列法计算的一半HUANG和WU用类似的方法给出另一种将NN二维DCT用N个N点一维DCT实现的算法。除了上面所述的各种DCT算法,还有多种将DCT转换为其它变换进行计算的方法。DUHAME和GUILLEMOT利用快速多项式变换算法提出了另一种计算二维DCT的方法,TA等提出用快速离散RADON变换实现二维DCT。众所周知,1965年COOLEYTUKEY提出的快速傅立叶变换FFT算法开创了数字信号处理DSP的迅速发展,基本COOLEYTUKEYDFT算法的各种改进也导致了数字器件技术的发展,随后的二十多年里,各种DCF算法不断提出,如时域抽取DIT算法,频域抽取DIF算法、分裂基算法、基于其它变换DHT、D砰T等的算法,素因子算法等,这些算法主要是从减少算法的计算复杂度和简化算法结构着手来提高算法的实现效率。在各种己经存在的DCT算法中,大多数都是针对长度为2的幂的情况,而在实际应用中,对DCT长度的要求往往是多样的。当出现要求的变换长度非2的幂时,通常要采用数据加长的方法,先将被变换数据长度增加到某个2的幂,上海大学研究生毕业论文然后再利用已有算法进行变换,这样处理虽然可以利用现有算法实现变换,但是,由于数据长度的加长,无疑增加了计算量,从而降低了实现效率另一方面,由于数据的加长,必然使得变换产生边沿失真,虽然提出了一些克服减小失真的方法,但这种失真是固有的。如果直接使用数据长度的快速DCT算法,那么,将可以从更本上消除边缘失真。2DDCT是种可分离变换,因此,利用1DDCT快速算法,对二维分别进行变换即可实现2DDCT,这种方法称为行列分解法,由于其结构简单而被广泛采用。但是,行列法完全没有考虑二维情况下两个维之间的关系,因此所需要的运算量相对比较大。根据实际图像处理中太多采用分块变换的特点,对小尺寸DCT如88的需求最大,而实际系统中也是这部分占用处理时间最长一个基于DCT的图像编码、解码系统,如果采用行列法,用于DCT变换的时间约占系统中时间的23以上,因此在研究各种DCT快速算法的同时,为了适应实时信号处理的要求,获得更快的变换速度,人们也在寻找采用硬件并行处理的DCT实现方案。22离散余弦逆变换基本原理221二维离故余弦逆变换算法描述对于给定的输入块XM,N0一VALID画DATAXX二二GOR一一DOUT二二二二0XVALIDDATA二DONE厂图38IDCT变换时序图图38为与图37对应的IDCT变换时序图。为产生一个8X8的数据块,行交换需要13个时钟周期,列变换同样需要13个时钟周期,这将导致26个时钟周期的延迟。在设计中,行变换和列变换采用流水线操作方式,每13个时钟周4上海大学研究生毕业论文期就可以馈送一组新的块数据,从而提高了数据处理的速度。25上海大学研究生毕业论文第四章离散余弦逆变换的误差分析41离散余弦逆变换误差产生的原因由于MEPG2编码器中DCT的部件还要兼做IDCT运算,IDCT的运算过程因系数量化和中间结果字长有限而带来误差。但是图像的解码系统可能由不同厂家去做,如果不同厂家采用不同的结构实现IDCT,所得到的结果也将具有不同的数据精度。对于给定一组输入,由于采用了不同厂家的DCT而使得编码和解码系统中的输出出现误差,这种差异称之为失配误差MISMATCHEITOR“。失配误差对帧内编码的影响不大,但是在帧间编码模式下,由于编码和解码过程构成了一个重构环,如果产生失配误差,会在这个重构环中累加,并作为附加噪声出现在重构环中,这样,在系统重新刷新之前,重构图像质量的下降将随着编码过程的继续而日夜严重II州。42离散余弦逆变换误差的解决办法421IEEELL801990标准关于离散余弦逆变换误差的规定为了解决编解码系统中由于IDCT的失配而造成的图像质量下降,保证兼容性,IEEELL801990标准制定了严格的标准来计算88IDCT的字长【20】。标准规定了在给定的随机的输入下,计算被测试的IDCT的输出和参考输出的误差。误差被排成88的矩阵,这样就可以衡量一个块中不同像素点的误差。为了保证IDCT满足这个标准的要求,需要对有限字长进行仿真。仿真的输入为10000个88的数据块,数据有IEEELL801990标准附录中的随机数发生器产生。需仿真3种结果1L256,H256;2L5,H5;3L300,H300。其中L、H是随机数的上限和下限。CCITTISO联合委员会制定了关于IDCT有穷字长标准,如果设计的IDCT运算精度符合这个标准,IDCT的失配误差将不会导致图像质量的明显下降。在IEEESTD11801990标准中,定义了5个参数,它们是1误差峰值PEAKPIXELERRORPPE26上海大学研究生毕业论文尸。MAXEKF,J,0F,7,1K10000;2峰值平方误差PEAKPIXELMEANSQUAREERRORPPMSE2鼢酽“N0000;3总体平均平方误差OVERALLMEANSQUAREERROROMSEE地,5磊万矿。4峰值平均捩差PEAKPIXELMEANERRORPPMERE0M;1,AXJ;7罗KIE,710000;5总体的平均误差OVERALLMEANERROROMEF,0。鼍筹J矿;在IEEESTD11801990中,对IDCT程序做如下测试1由给定程序生成特定范围的随机数,并由这些随机数组成10000个88块。2对每个块,以不低于64位浮点的精度做DCT变换,变换结果舍为整数,并把范围限制在2048,2047】。3对于每个块的DCT变换结果,以不低于64位浮点的精度做IDCT变换,变换结果舍为整数,并把范围限制在256,2551,这是IDCT的参考数据。4对于每个块的DCT变换结果,用所测试的IDCT交换程序,生成IDCT的测试数据。5对于以上产生的参考数据和测试数据,计算峰值误差,平均误差和平均平方误差。6计算结果应符合下面要求1对于每个像素,其峰值误差PPE不超过L,即厶S127上海大学研究生毕业论文2对于任意像素,其峰值平方误差PPMSE不超过006,即。O063总体平均平方误差OMSE不超过002,O。002;4对于任意像素,其峰值平均误差PPME不超过00015,即P。SO0015;5对于任意像素总体的平均误差OME不超过00015,即O00015。7对于所测试的IDCT,如输入全为零,则输出也全为零。EEELL801990标准规定离散余弦逆变换误差计算流程如下图422误差模型的建立图41误差计算流程基于行列变换的结构可以作为重要的一类设计2DCTIDCT的选择。由于在视频编码器中2DCTIDCT的结构要承担双重计算,而2IDCT的计算是有误差要求的,如何选择一种好的方案既能满足相应的误差标准,又能使各个部件的计算字长尽可能短是本设计讨论的主要目标。在做DCT运算时,有几处计算会带来误差,下图是建立的误差模型。这个模型标出了DCTIDCT计算中所有的误差,利用这个模型能够得到误差与字长的关系。乘数之一为常系数,在进行乘法运算之前首先要把常系数化为定点数,此时会带来定标误差E。,常系数修改同样会带来误差P。,两类误差叠加时取其最大值,即E。MAXE口,E。A28上海大学研究生毕业论文EO20图42IDCT结构的误差模型另一个乘数即原始数据在参与第一次运算时没有误差,而当参与第二次运算即为从存储器中取出的第一次运算的结果时,包含第一次运算的误差,而重新定标带来的误差为E,叠加后误差为口。MAXE,8。正确的乘法器计算结果字长将是两个乘数字长之和,由于乘法器之后还有加法运算、多路选择、数据缓存以及数据通道等多个部件,因此乘法结果字长也要进行截断,因此带来误差8。乘法结果的截断方式有两种从高位向低位截取、从低位向高位截取,若从低位向高位截取会出现溢出误差G。A累加器的位数并不直接对应于存储器,因此累加器到存储器的数据截断会出现误差E。另外还包括其他误差,在此不一一列举。利用图41误差计算流程,模拟程序送入的数据用【一256,Z55内共1000029上海大学研究生毕业论文个88随机数宏块产生。根据2一DCTIDCT在编码系统中的计算次序得到的误差模型,根据这一模型,对计算的误差进行推导,最后得到了该模型对应的误差公式,从该公式可以得到这样的结论乘法器常系数字长对总体误差影响更大;存储器字长也是乘法器变乘数字长1对硬件开销的影响更大2L】。43字长优化IDCT矩阵有A,B,C,D,E,F,G七个参数,由于AF4,若将所有的参数放大2I,此时整个二维IDCT的最终结果放大了8倍。把得到的结果右移3位,即可得到正确的结果。这样作的好处是系数A变成了1,减少了一个乘法器另一个优点是避免直流信号数据通路的乘法计算误差,可以提高计算精度。另六个系数的值如下表41矩阵系数表系数二进制数值14B准确值14B转化为十进制值C10LOOLLL0011111306562964876413065185546875F01000101010001054119610014620054113769531250B101100011000101387039845322L13869628906250D100101101000001175875602419411757812500000E01100100100100078569495838710O78564453125000G00100011010100027589937928294027587890625000在进行IDCT计算时,需要同时完成输入K与一组固定系数A,C,F的乘法和输入XO与一组固定系数B,D,E,G的乘法。如果单独对每个乘法器进行设计会产生计算的冗余。为了解决这个问题,可采用提取同一个矩阵中不同乘法器之间共有的位模式,以减少乘法器的数目。提取共有位模式后,系数C,F,B,D,E,G可以表示为C100010001L,111100000,0000,10001;F01000100000,00100000,0000,10001;B1010001000100000,00010001;DL00010100000,0101;E0100100100000,0001001;30上海大学研究生毕业论文92001000100000,0010100000,0000,001;为了降低运算通道的字长要求,需要确定各点数据的最大幅度,并通过分析计算中由于舍入与截断引入的误差,以确定实际的数据长度。按照IDCT一致性规范IEEELL801990,采用3组10000个88的随机数据块,峰值分别是1L5,H5;2L256,H255;3L300;H300。根据测试结果,进行字长的优化处理。优化的首要目标是降低转置矩阵存储器的字长,这是因为存储器对整个电路规模的影响很大;其次是降低数据通道的字长。通过仔细调整各个运算步骤的运算结构与保留结果的精度,综合字长与硬件消耗的关系最终,本文得到了工程适用的各部件字长转置矩阵存储器的字长为15B,数据通道的输入字长为15B,运算结构内部字长为17B。一31上海大学研究生毕业论文第五章离散余弦逆变换的FPGA验证在第三、四章中,我们完成了离散余弦逆变换模块的设计。为了确保设计的正确性,还要进行硬件仿真EMULATION。硬件仿真有两种方式,即FPGA验证和ASIC验证,本章主要介绍离散余弦逆变换模块的FPGA验证。可编程逻辑器件可以对其内部的逻辑进行编程,主要有现场可编程门阵列FPGAFIELDPROGRAMMABLEGATEARRAY和复杂可编程逻辑器件CPLDCOMPLEXPROGRAMMABLELOGICDEVICE两大类。也可以把可这两种器件通称为FPGA可编程逻辑器件【22】【23241。FPGA是IC设计的一个重要领域,具有设计周期短布局布线非常容易,并且FPGA芯片在出厂之前都经过测试,所以相当于只有ASIC设计的前端、研发费用底不需要投片的费用、调试方便引脚非常多的优点,适用于上市时间短、中等规模的产品开发。在ASIC设计中,常用FPGA进行原型调试。F252627ZT29POFPGA产品一般分为两种类型,一类是基于乘积项PRODUCTTERM技术,用EEPROM电可擦除可编程只读存储器或FLASH闪存制造,多用于5000门以下的小规模设计。另一类基于查找表LOOKUPTABLE技术,用RAM静态存取存储器工艺制造,密度高,触发器多,多用于10000门以上的大规模设计,FPGA可编程逻辑器件有两个基本功能应用设计,设计诊断。系统集成人员把加载过设计的FPGA芯片置于系统中,这时FPGA芯片是作为系统构件之一,它使电子系统设计变得快捷、灵活,且便于修改。这是FPGACPLD芯片得到广泛应用的根本原因。而FPGA芯片还有一个相当重要的作用用于集成电路设计的诊断。在以往的集成电路设计中,从系统结构设计、逻辑设计、各层次仿真、综合直至流出样片才能在硬件层次上验证设计的正确性。如果到物理实现后才发现有错误,不仅要浪费流片的巨大成本,而且要耗费大量的设计时间。FPGA的出现为解决这个问题提供了有效的解决途径。在流样片之前,可以把设计下载到FPGA芯片中,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论