深度学习基础与实践 课件 7.3.3 图像编与解码_第1页
深度学习基础与实践 课件 7.3.3 图像编与解码_第2页
深度学习基础与实践 课件 7.3.3 图像编与解码_第3页
深度学习基础与实践 课件 7.3.3 图像编与解码_第4页
深度学习基础与实践 课件 7.3.3 图像编与解码_第5页
已阅读5页,还剩6页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图像编与解码图像编码、解码01图像编码背景BMP格式的图像文件通常比较大,如一幅512*512的黑白图像的比特数为512*512*8bit=2097152bit=256KB。一部90分钟的彩色电影,每秒放映24帧。假设每帧只有1024*1024像素,每像素的RGB三个分量分别占8bit,总比特数为90*60*24*3*1024*1024*8bit=3037.5Gbit=379.6875GB。可见图像和视频文件很大,占用存储空间大,存储设备花费高,并且造成图像和视频的传输困难,不能满足在线观看的要求,因而,图像压缩是必要的。所谓图像压缩是指在满足一定质量(信噪比或主观评价)的条件下,以较少比特数无(或少)损失信息地表示图像的技术。图像编码、解码01图像编码背景1948年,信息论学的奠基人香农曾经论证:不论是语音或图像,由于其信号中包含很多的冗余信息,所以可以通过压缩技术使得数据占用的空间更小。在他的理论指导下,图像编码已经成为当代信息技术中较活跃的一个分支。经过近半个世纪的努力,图像编码技术已从实验室走入通信和电子领域的实际应用。图像编码、解码01冗余数据类型编码冗余如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余。例:如果用8位表示黑白图像的像素,我们就说该图像存在着编码冗余,因为该图像的像素只有两个灰度,用一位即可表示。空间冗余由于图像中的像素间存在相关性,那么对于任一给定的像素值,原理上都可以通过它的相邻像素值预测得到。这就带来了空间冗余。视觉冗余图像中某些信息相对人的视觉效果来说显得不重要,可以忽略的部分,就称为视觉冗余。图像编码、解码01图像编码、解码流程数据是信息表达的手段,相同的信息可以通过不同的数据量去表示,尝试用不同的表达方式以减少表示图像的数据量,对图像的压缩可以通过对图像的编码实现。图像编解码在实际应用中的流程如下。原始图像编码编码结果存储传输解码原始图像图像编码:对图像信息以特殊的方式进行组合,以减少数据量,便于存储、处理和传输。图像解码:对压缩图像进行解压以重建原图像或其近似图像。图像编码、解码01图像压缩系统模型输入图映射器量化器符号编码器符号解码器反映射器输出图编码器解码器编码器:映射器:对输入数据变换以减少像素的相关冗余(降低空间和时间冗余,例如游程编码)量化器:减少映射器输出的精度减少心理视觉冗余。符号编码器:将短码赋给最频繁出现的量化器的输出以减少编码冗余。解码器:符号解码器、反映射器。量化器不可逆,解码中没有量化器的逆操作,故量化器不可用在无失真编码中。图像编码、解码01图像编码的分类图像编码技术根据不同的标准,有不同的分类方法。根据编码过程有无信息损失,可分为有损编码和无损编码。有损编码有损编码又称为不可逆编码,是指对图像进行有损编码,致使解码重新构造的图像与原始图像存在一定的失真,即丢失了部分信息。由于允许一定的失真,这类方法能够达到较高的压缩比。有损编码多用于数字电视、静止图像通信等领域。无损编码无损编码又称可逆编码,是指解压后的还原图像与原始图像完全相同,没有任何信息的损失。这类方法能够获得较高的图像质量,但所能达到的压缩比不高,常用于工业检测、医学图像、存档图像等领域的图像压缩中。图像编码、解码01图像压缩编码的分类图像压缩编码技术根据压缩原理进行划分,可以分为预测编码、变换编码、统计编码等。预测编码预测编码是利用图像信号在局部空间和时间范围内的高度相关性,以已经传出的近邻像素值作为参考,预测当前像素值,然后量化、编码预测误差。变换编码变换编码是将空域中描述的图像数据经过某种变换转换到另一个变换域中进行描述,变换后的结果是一批变换系数,然后对这些变换系数进行编码处理,从而达到压缩图像数据的目的。统计编码统计编码也称为熵编码,它是一类根据信息熵原理进行的信息保持型变字长编码。编码时对出现概率高的事件(被编码的符号)用短码表示,对出现概率低的事件用长码表示。图像编码、解码01信息熵信息是用来消除随机不确定性的内容。根据前面的分析,熵越大则可能的状态越无序,如果有人提供信息则会使可能的状态更有序。因此,香农提出利用玻尔兹曼熵来度量信息的思想,称之为信息熵,其定义为

其中,k为正的常量;pi为处于第i个状态的概率,通过用处于第i个状态的样本个数除以样本总数来估计。图像编码、解码01无损编码RLE编码——RunLengthEncodingRLE编码就是行程长度编码,其编码思想是:用行程的灰度和行程的长度代替行程本身。所谓行程就是具有相同灰度值的像素序列。例:编码前:aaaaaaabbbbbbcccccccc,编码后:7a6b8c。其他无损编码:

LZW编码、霍夫曼编码、无损预测编码等图像编码、解码01openCV对图片编码解码cv2.imencode()函数将图片格式转换(编码)成流数据,赋值到内存缓存中;主要用于图像数据格式的压缩,方便网络传输。cv2.imdecode()函数从指定的内存缓存中读取数据,并把数据转换(解码)成图像格式;主要用于从网络传输数据中恢复出图像。OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在Linux、Wi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论