(微电子学与固体电子学专业论文)基于vq的视频压缩的关键技术研究.pdf_第1页
(微电子学与固体电子学专业论文)基于vq的视频压缩的关键技术研究.pdf_第2页
(微电子学与固体电子学专业论文)基于vq的视频压缩的关键技术研究.pdf_第3页
(微电子学与固体电子学专业论文)基于vq的视频压缩的关键技术研究.pdf_第4页
(微电子学与固体电子学专业论文)基于vq的视频压缩的关键技术研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(微电子学与固体电子学专业论文)基于vq的视频压缩的关键技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章绪论 1 绪论 1 1 研究背景介绍 随着互联网的飞速发展,消费类电子、通信、电视、电影、广播和计算机技术日益紧 密结合起来,计算机与通信、多媒体技术融合的趋势不可逆转,使得基于互联网的多媒体 产业成为目前发展最快、规模最大的产业之一。 众所周知,人类通过视觉获取的信息量约占总信息量的7 0 ,而且视频信息具有直观 性、可靠性等一系列优点,所以多媒体技术中一个重要的技术就是视频技术。 目前视频技术的应用范围很广,如网上视频会议、网上可视电子商务、网上政务、网 上学校、远程医疗、个人网上聊天、可视咨询等业务。 视频技术应用中传输的数据量非常大,单纯用扩大存储器容量、增加数据传输率的办 法是不现实的。数据压缩技术是有效的解决方法,通过数据压缩,同时也可使计算机实时 处理音频、视频信息,以保证播放出高质量的视频节目。可见,多媒体数据压缩是非常必 要的。与文字信息不同,图像信息需要大的存储容量和宽的传输信道,尤其是在需要实现 大规模图像数据库或传输高分辨率实时图像序列的场合,即使以现在的技术,仍然难以满 足原始数字图像存储和传输的需要。例如现行的国内电视传输标准p a l 制式规定每秒传 送2 5 帧画面,分辨率是7 2 1 x 5 7 6 像素,若不压缩,则传输速率是1 2 5 m b p s ,而正在普及 的h d t v 每秒传输3 0 帧,分辨率是1 9 2 0 x 1 0 8 0 像素,未压缩数据传输速率更是达到了 1 0 0 0 m b p s 。所以,对图像数据的压缩就成为了技术进步的迫切需求,正是由于这种要求, 使得图像压缩( 编码) 算法和技术成为近3 0 年来非常活跃的一个研究领域,并在商业上 已取得极大的成功。 目前,相关机构已经制定了一些标准。如关于静态图像压缩的j p e g 和j p e g 2 0 0 0 标准 【l - 3 j 。动态图像方面的标准有m p e g 一1 h i ,m p e g 2 【5 1 ,m p e g 4 【6 】,h 2 6 1 7 1 ,h 2 6 3 8 1 , h 2 6 4 a v c 9 】等。 j p e g 的核心算法是d c t ( 离散余弦变换) 变换,j p e g 2 0 0 0 的核心算法是小波变换【l 0 1 。 这两大标准的应用范围十分广泛,其压缩比高,图像质量好,优势非常明显。但是它们的 算法比较复杂,图像的压缩速度较慢,在很多需要实时处理的场合( 比如视频会议,监控 等) ,就无法满足需求。另一方面,国外厂商对相关技术设置了技术壁垒和专利保护,利 用国外标准开发相关产品就需向美国公司缴纳专利费,导致国内产品成本较高,一直缺乏 自有核心技术。 出于以上的原因,研究人员仍然积极地探索其他类型的标准和算法,矢量量化( v q ) 算法就是其中的一种。矢量量化算法的突出特点是压缩比较高,理论证明其效果优于传统 的标量压缩算法,而且其算法简单,非常适合于硬件实现,可用于图像的实时压缩处理。 西安理工大学硕士学位论文 1 2 矢量量化简介 矢量量化( v e c t o rq u a n t i z a t i o n ,v q ) 技术是一种2 0 世纪7 0 年代后期发展起来的数据 压缩技术。基于v q 技术的图像压缩方法是利用相邻图像数据之间的高度相关性,将输入的 图像数据序列分组,形成一个k 维空间r 中的一个矢量,然后对此矢量进行量化,只传输 或存储矢量地址,因而可以大大提高压缩率。由于v q 技术具有压缩率大、算法简单的特 点,因此非常适合于硬件实现。其基本流程如图1 - 1 。 矢量量化的本质是用有限的具有代表性的小图像块( 亦称之为码矢量) 的组合表示一 幅图像。在矢量量化技术中,每一幅图像可以分割成4 x 4 像素的小图像块,称为码矢量, 维数是1 6 。码书是具有代表性的图像块( 称为特征码矢量) 的集合,特征码矢量的个数就 是码书的大小。编码时首先将图像分割成由多维矢量代表的子图像块,然后将每个矢量量 化为码书中最接近的特征码矢量,在传输信道中传输的就是对应特征码矢量的地址,而不 是码矢量本身,从而可以大量节省传输时间和存储空间,达到压缩的目的。在接收端,仅 需通过查表检测出发送地址对应的特征码矢量就可以恢复原图像,所以,解码器非常简单, 这是矢量量化技术最主要的优势之一。 矢量量化编解码系统的原理如图1 - 1 所示,信道两边的终端分别放置编码器和解码器, 两个终端使用相同的码书。 h 栝筅髓x 诤箨缀- 1 、袭戴嬲援。 棒奉袋羧氟 哥缆晖配轷毒笼麓。 传簸溺邋绒 存铭戈竹 强援磊袋 栩翔辫咎袭日l 蟹t 量 t - - t 璐嚣存储罄翰存储荔 矢缴羧纯器筋码璇 图1 - 1 矢量量化基本原理 f i g 1 1p r i n c i p l eo f v e e t o rq u a n t i z a t i o n 1 3 视频编码及运动估计 视频图像中存在冗余信息,即相关性。主要的冗余信息有空间冗余信息和时间冗余信 息。空间冗余信息是指在一帧图像中像素之间的相关性。一帧图像中,相邻或相近的像素, 其灰度值或色度分量的值总是很相近,相邻像素之间存在很强的相关性。而相邻帧之间的 时间间隔是由帧率决定的。帧率越大,相邻帧之间的时间间隔就越小,一般是几十毫秒。 在这样短的时问内,大部分被拍摄的对象都是静止不动或只有很小的移动,因此视频序列 中存在时间上的冗余信息。视频压缩主要就是从时域、空域两方面去除冗余信息。 2 第二章视频帧内编码研究 将原始图像按1 1 1 1 个像素大小为单位进行小块划分,每个小块组成个k 维( k = n n ) 的矢量,含k 个像素;编码时,首先通过在码节c 叶1 为饵个输入图像矢量x 搜索最匹配 的码字y 一使其失真和性值最小;然后将最匹配码字的索引p 作为编码值代替矢量x 进 行存储或传输。解码时,则先根据接收到的索引p 从相i o j 码书中找出对应的码字,然后 用这些码字重构图像。 根据香农的率失真理论”i ,码书尺寸的下限与图像的失真度成反比。当码书尺寸足够 人时,矢量量化性能有可能任意接近率失真戳:反之,码书尺、ja 小时,图像的失真度必 然超出可接受的范围,因此码书的尺寸也要控制在一定范围内,常用的码书尺寸有2 5 6 5 1 2 ,1 0 2 4 和2 0 4 8 等。理论上,使用的码书尺寸越大所获得的压缩图像质量越高,读墩 码书的输入带宽越大编码的速度也就越快,但在实际应用特别是硬件实现中,码书尺寸越 太所使用的存储空间也越大,输入带宽越大所占用的i o 口就越多,而用于存放码书的 r o m 和i o 口的面积叉在整个系统电路的使用面积中占有很大比例,因而研究如何减少 码书存储数量和输入带宽并且同时保持图像压缩质量的方法是十分有意义的。而本文提出 的旋转压缩码书充分利用了原始码书方向顺序匕的相关性,将原始码书压缩存储,可以大 幅降低硬件实现过程中码书的存储面积和输入带宽,并设计了相应的快速搜索算法。 2 2 旋转压缩码书生成 在图1 中,可以看到四个不同的老块,但是这四个宏块在方向上的相关性是很大的 如果将第一个宏块按顺时针方向旋转三次,就可以发现每次旋转的结果和另外的三个宏块 是几乎一样的。所以,在实际的图像块中,像素的排列往往具有一定的方向性,而对于通 崩码书中的所有码字来说,l 司样存在与图2 - 1 相似的方向性。 匪矸碉山 图2 2 码书旋转原理 f i 9 2 - 2p r i n c i p l e o f e o d e b o o kr o t a t i o n 所以,为了利用这种码书内的方向上的相关性首先利用小波变换,生成有规律的符 第二章视频帧内编码研究 矗 笆 岱 z 也 t h r e 8 h o l dv a l u et 图2 _ 4 不同阈值t 对应的编码重构效果 f i g 2 4d i f f e r e n tr e c o n s 咖c t e dp e 墒舢舳c e 锄dc o 仃e s p o n d i n gt 2 3 使用旋转压缩码书的快速搜索算法 l 象 和 值 i呜荔 。和值骐配 映射 m 嘎 7 昂 致硒翔j 旋转恢复 旗配 为4 个方向 最铎凝霹搿罕 m 和值弼书 旋转鹾缩 码书确书 图2 5 算法匹配搜索流程 f i g 2 - 5a 1 9 0 r i t h mf l o w 为了配合旋转压缩码书的使用,设计了基于旋转压缩码书的搜索算法,具体流程如下: ( 1 ) 开始搜索前,计算各旋转压缩码字的和值s ,待1 ,2 ,2 5 6 ,然后按码字和值的大小 对旋转压缩码书进行升序排列。 ( 2 ) 将码书分成三块,并把将每一块中间或中间附近的码字的和值作为本块码书的特 征和值。 ( 3 ) 当宏块矢量开始输入,搜索开始,搜索流程如图2 5 。首先,计算输入矢量x 的和 7 西安理工大学硕士学位论文 值s ,。由于特征和值码书是升序排列的,所以可以通过二分比较查找法来找到与和值s 。最 相近的码书块的特征和值s 。和其所对应的码书块p 。 ( 4 ) 将码书块p 的中间码字作为初始匹配码字,该码字附近同时上下扩展搜索m 个相 邻码字,搜索范围内的码字旋转恢复出4 个方向的码字,在恢复码字中找到与输入矢量x 最优匹配码字,和旋转次数f 。 ( 5 ) 将码字索引,和旋转次数f 输出。 2 4 关键参数选定 由于码书的分块和上下扩展搜索范围的选取直接影响算法的性能和实现复杂度。所 以,为了确定最终选用的码书的分块和上下扩展搜索范围,做了以下的试验。在m a t l a b 平台下,取码书块数三= 1 2 8 ,6 4 ,3 2 时和搜索范围m - 2 ,3 ,4 ,1 0 ,对5 1 2 5 1 2 尺寸,2 5 6 灰度级标准静止灰白图像l e n a ,c o u p l e ,m a n ,s p l 础,l a x 进行矢量量化压缩, 然后对得到的每幅重建图像效果取平均值,结果如图2 6 。图中横轴为搜索范围m ,纵轴 为峰值信噪比p s n r 。 翁 3 绽 z 良 s e a r c h 滗n g em 图2 6 不同参数的压缩效果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论