图像通信综述new_第1页
图像通信综述new_第2页
图像通信综述new_第3页
图像通信综述new_第4页
图像通信综述new_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、图像通信综述根据统计人类接受外界信息的比例:视觉占全部的60%,听觉占20%,其余是触觉15%,味觉3%,嗅觉2%。人们常说:“眼见为实,耳听为虚”,“百闻不如一见”,“一目了然”。这些都表明,视觉信息也即图像信息,在人类认识外部事物的过程中是如此重要。当前社会人类已进入了信息时代,图像通信在电视、电影、传真、电视会议、作战指挥、监控、医疗、教育等各领域有着广泛的应用,面对越来越庞大的信息量,如何在实际应用中的不同领域实现高效、实时、准确的图像通信,已成为研究的重点。一、图像通信的特点图像通信是传送和接收图像信息的通信。与广泛使用的声音通信方式不同,传送的不仅是声音,而且还有看得见的图像、文字

2、、图表等信息,这些可视信息在发送端通过图像通信设备变换为电信号进行传送,在接收端再把它们真实地再现出来。图像通信的一大难点是图像的信息量巨大,特别是彩色活动图像。例如数字化后的标准清晰度电视(720×576/4:2:2),需要的带宽为165.9Mbps,如对比64kbps的数字话路,相当于2592个有效数字话路。这么大的数据量,对于存储、处理以及在通信线路上传输都会造成了巨大的负担。正因为如此,先进的数字图像压缩技术以及先进的数字传输技术成为了图像通信的关键技术。二、人类的视觉特性在进行图像处理时如果能够充分考虑人眼的视觉特性,在满足主观质量的前提下进行有效压缩,将能够很好地解决图像

3、信息在各种通信网络上进行交换和传输时所带来的占用带宽和占用存储空间大的问题。1)人眼视觉范围:10°以内是视觉的敏锐区,对彩色及细节的分辨力最强;10°20°能正确识别图形等信息;20°30°分辨能力下降,但对活动信息敏感;30°以上分辨能力会大大下降,但有临场感。利用该特点,在图像处理时可实现不同区域不同的压缩比率。2)视觉惰性:人眼在观察景物时,光信号传入大脑神经,需经过一段短暂的时间,光的作用结束后,视觉形象并不立即消失,这种残留的视觉称“后像”,视觉的这一现象即视觉惰性。具体应用中电影采用24帧/秒,电视根据电源频率的不同采用

4、50或60场/秒,当达到该帧频时,人眼可产生连续感觉。利用该特点,发送端传输的图像帧数只需达到一定数量,接收端即可实现还原。3)图像信息流大小由视觉的细节分辨率、灰度分辨率和活动分辨率三个因素决定:活动分辨率高(快速运动)时细节分辨率会下降,反之会上升;细节分辨率高(细节丰富)时灰度分辨率会下降,反之会上升;活动分辨率高(快速运动)时灰度分辨率会下降,反之会上升。利用该特点,根据人眼对不同类型的图像的感知不同,可对其不敏感的因素进行压缩。三、图像压缩编码的原理对于信息量庞大的图像,在存储、传输、处理时都非常困难,因此有必要对其进行压缩。而图像之所以能被压缩,就是因为其数据中存在着冗余。主要表现

5、为:单帧图像中相邻像素间具有相关性(空间冗余);活动图像多帧之间存在相关性(时间冗余);图像数据不同符号出现的概率不同(符号冗余),可用不同码长表示;人眼视觉掩盖效应(视觉冗余),如颜色分辨率低于亮度分辨率、静止部分空间分辨率高于运动部分、平坦区失真较边缘纹理区敏感、屏幕中心区失真敏感等,可实现有损压缩;利用先验知识建立模型(知识冗余),对模型参数编码,以实现高压缩比。图像编码一般框图:1)映射变换:改变图像数据的特性,消除冗余度,使之有利于压缩。包括预测编码、变换编码、模型编码等。预测编码:利用图像局部区域的像素高度的相关性,根据先前的像素来推断当前的像素情况。如果预测比较准确,误差就会很小

6、。只要把预测值与实际像素值之间的差值经过熵编码后发送到接收端,接收端通过预测值加差值来重建原像素。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。预测编码中典型的压缩方法有脉冲编码调制(PCM)、差分脉冲编码调制(DPCM)、自适应差分脉冲编码调制(ADPCM)等。变换编码:将图像的光强矩阵(时域信号)变换到系数空间(频域信号)上进行处理。在空间上具有强相关性的信号,反映在频域上时某些特定区域内的能量常常被集中在一起或系数矩阵的分布具有某些规律。利用这些规律在频域上减少量化比特数,达到压缩的目的。变换编码是一种间接编码方法,其中关键问题是图像数据之间相关性大,空间冗余

7、度大,经过变换在频域中描述,数据相关性大大减少,数据冗余量减少,参数独立,数据量少,这样再进行量化,编码就能得到较大的压缩比。常用的正交变换有:傅立叶 (Fourier)变换、沃尔什(Walsh)变换、哈尔(Haar)变换、斜(Slant)变换、余弦变换、正弦变换、K-L(Karhunen-Loeve)变换等。运动补偿:是减小帧间时间冗余度的一个有力的工具,以对图像视频帧间运动的估算为基础,即若视频镜头中所有物体均在空间上有一定位移,那么用有限的运动参数即可对帧间的运动加以描述。由于一些运动矢量之间的空间相关性通常较高,图像一般划分成一些不连接的像素块(如16×16),对于每一个这样

8、的像素块,只对一个运动矢量进行估算、编码和传送。通常,预测误差和运动矢量均传送至接收端。2)量化:用于有限失真编码,以有效提高压缩比,分为标量量化和矢量量化。标量量化是一维的量化,一个幅度值对应一个量化结果。而矢量量化是二维甚至多维的量化,由两个或两个以上的幅度值决定一个量化结果。标量量化使用固定量化表,矢量量化使用码书方式成组量化,实现比较复杂。但矢量量化的好处是引入了多个决定输出的因素,并且使用了概率的方法,一般会比标量量化效率更高。3)熵编码:用于消除符号冗余度,属于无失真编码,其编码下限为量化后数据的信息熵。常用的熵编码是Huffman码和算术码,其原理均是大概率符号用短码,故也称为变

9、长编码(VLC)。Huffman编码的基本方法是先对图像数据扫描一遍,计算出各种像素出现的概率,按概率的大小指定不同长度的唯一码字,由此得到一张该图像的Huffman码表。编码后的图像数据记录的是每个像素的码字,而码字与实际像素值的对应关系记录在码表中。在最新的H.264标准中采用了基于内容的自适应变长编码(CAVLC),将零游程与幅值分开考虑,以降低复杂度,利于码表优化。四、可靠的图像通信大部分的图像压缩编码使得数据通过信道后产生的错误不能被定位,并且可能在时间和空间上扩展,高效压缩的追求也使得码流对信道传输差错愈加敏感。为加强图像通信系统对信道误差的免疫力,从以下三个角度来考虑错误恢复机制

10、:1)前向差错控制技术:在发送端进行信源或信道编码时在比特流中加入冗余信息,来减少误码影响。实际应用中可采用分层编码,即考虑传输可分优先级,编码时采取基本层编码加增强层编码的方法;多重描述编码,即在传输无法分优先级时,编码采取产生多个同等重要的码流,每个码流均可解出图像,只是质量差,但多个组合可得高质量图像;信源信道联合编码,即使信源编码适应信道的具体误码特性;稳健的变换编码,即在码流中保留冗余信息,以提高稳健性,如帧内编码帧也传运动矢量等;稳健的熵编码,如采用可反置变长编码RVLC,适当降低编码效率,使码字双向对称。2)后向误码掩盖技术:由于误码难免,在已经出现差错且不可纠正的情况下,在解码器端考虑使用误码掩盖技术让人眼对误码不敏感。该方法对恢复图像的主观质量有很大的提高,而且仅在解码端进行,使它能够在图像压缩标准之外进行设计。例如空间预测:若图像传输过程中运动矢量丢失,则通过所丢块的相邻块地运动矢量来预测当前的运动矢量;若DCT系数丢失,则从空间相邻块的DCT系数预测当前块;时间预测:若图像传输过程中当前帧或块错误或丢失,则从上一帧来预测当前错误的帧或块信息。3)双向差错控制:该技术需要有从解码端到编码端的实时反馈信道。解码端通知编码端哪部分数据有误码,编码端将改变操作来抑制误码影响。最简单的方法是再发送一次丢失的数据,但该方法会产生时延,往往行不通。替代

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论