数字电视第四章作业参考答案.doc_第1页
数字电视第四章作业参考答案.doc_第2页
数字电视第四章作业参考答案.doc_第3页
数字电视第四章作业参考答案.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字电视原理作业四1.声音压缩的依据是什么?MPEG-1音频编码利用了听觉系统的什么特性?音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。MPEG-1音频编码主要利用了以下听觉系统的特性:层1:使用频域掩蔽特性,编码器的输出数据率为384kb/s层2:除了使用频域掩蔽特性外还利用了时间掩蔽特性,编码器的输出数据率为256kb/s192kb/s层3:除了使用频域掩蔽特性和时间掩蔽特性,还使用了立体声数据的冗余,编码器的输出数据率为64kb/s8.压缩数字视频数据量的基本原理是什么?视频数据中存在着大量的冗余, 即图像的各像素数据之间存在极强的相关性。 利用这些相关性, 一部分像素的数据可以由另一部分像素的数据推导出来, 结果视频数据量能极大地压缩, 有利于传输和存储。 视频数据主要存在以下形式的冗余。1. 空间冗余视频图像在水平方向相邻像素之间、 垂直方向相邻像素之间的变化一般都很小, 存在着极强的空间相关性。 特别是同一景物各点的灰度和颜色之间往往存在着空间连贯性, 从而产生了空间冗余, 常称为帧内相关性。 2. 时间冗余在相邻场或相邻帧的对应像素之间, 亮度和色度信息存在着极强的相关性。 当前帧图像往往具有与前、 后两帧图像相同的背景和移动物体, 只不过移动物体所在的空间位置略有不同, 对大多数像素来说, 亮度和色度信息是基本相同的, 称为帧间相关性或时间相关性。 3. 结构冗余在有些图像的纹理区, 图像的像素值存在着明显的分布模式。 如方格状的地板图案等。 已知分布模式, 可以通过某一过程生成图像, 称为结构冗余。 4. 知识冗余 有些图像与某些知识有相当大的相关性。 如人脸的图像有固定的结构, 嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于脸部图像的中线上。 这类规律性的结构可由先验知识得到, 此类冗余称为知识冗余。 5. 视觉冗余人眼具有视觉非均匀特性, 对视觉不敏感的信息可以适当地舍弃。 在记录原始的图像数据时, 通常假定视觉系统是线性的和均匀的, 对视觉敏感和不敏感的部分同等对待, 从而产生了比理想编码(即把视觉敏感和不敏感的部分区分开来编码)更多的数据, 这就是视觉冗余。 人眼对图像细节、 幅度变化和图像的运动并非同时具有最高的分辨能力。 人眼视觉对图像的空间分解力和时间分解力的要求具有交换性, 当对一方要求较高时, 对另一方的要求就较低。 根据这个特点, 可以采用运动检测自适应技术, 对静止图像或慢运动图像降低其时间轴抽样频率, 例如每两帧传送一帧; 对快速运动图像降低其空间抽样频率。 另外, 人眼视觉对图像的空间、 时间分解力的要求与对幅度分解力的要求也具有交换性, 对图像的幅度误差存在一个随图像内容而变的可觉察门限, 低于门限的幅度误差不被察觉, 在图像的空间边缘(轮廓)或时间边缘(景物突变瞬间)附近, 可觉察门限比远离边缘处增大34倍, 这就是视觉掩盖效应。 根据这个特点, 可以采用边缘检测自适应技术, 对于图像的平缓区或正交变换后代表图像低频成分的系数细量化, 对图像轮廓附近或正交变换后代表图像高频成分的系数粗量化; 当由于景物的快速运动而使帧间预测编码码率高于正常值时进行粗量化, 反之则进行细量化。 在量化中, 尽量使每种情况下所产生的幅度误差刚好处于可觉察门限之下, 这样能实现较高的数据压缩率而主观评价不变。 6. 图像区域的相同性冗余在图像中的两个或多个区域所对应的所有像素值相同或相近, 从而产生的数据重复性存储, 这就是图像区域的相似性冗余。 在这种情况下, 记录了一个区域中各像素的颜色值, 与其相同或相近的区域就不再记录各像素的值。 矢量量化方法就是针对这种冗余图像的压缩方法。 7. 纹理的统计冗余有些图像纹理尽管不严格服从某一分布规律, 但是在统计的意义上服从该规律, 利用这种性质也可以减少表示图像的数据量, 称为纹理的统计冗余。 电视图像信号数据存在的信息冗余为视频压缩编码提供了可能。11.请画出MPEG-1视频编码的原理框图,说明框图中每个模块的功能,并回答下列问题。(1)在具有运动补偿的帧间预测编码中,如果运动矢量估计得不准,产生的后果是什么?是否会产生图像失真?为什么?(2)经上述编码器压缩的图像,在解压缩之后会出现“方块效应”,产生“方块效应”的根源是什么?(3)在DCT变换之后进行Zig-zag扫描的目的是什么?帧重排分组后,无论对于哪种制式,其GOP中的各帧次序是固定不变的,如图4.24所示,然而在实现MPEG-l编码时,如果严格按各GOP中每一帧的次序编码时,删会出现一个问题,即在完成对I帧的编码后,应该马上对B帧编码,然而B帧是双向预测帧,此时还缺少一个后向参考帧(P帧)只有对两个参考帧都读出时才能对B帧进行预测编码。为解决这一矛盾,在编码前,需以GOP为单位进行帧顺序重新排列,即帧重排,这也正是MPEG编码必须以GOP为单位的重要原因。I帧编码I帧是GOP的基础,是GOP中的第一帧,以后各帧,均以I帧作为参考,I帧本身不需要运动矢量,它是运动的起始点,I帧图像数据处理的质量,直接影响到整个GOP中各帧图像质量,如果某一I帧的某些宏块在编码中出了问题,则在该GOP中各帧相关联部分都无法重构图像,这就是在几帧图像内连续在某一区域内出现“码赛克”的原因之一。但是它不应影响下一个GOP,可见I帧编码的质量是非常重要的。I帧的压缩编码采用的是帧内压缩方式,其方法与JPEG基本相同P帧编码与I帧编码截然不同,它属于帧间压缩,以它之前的I帧或P帧为参考帧进行预测编码。 首先,编码器从GOP存储器中读出重排后的P帧图像宏块数据,然后分两路传送,一路送入运动估值器,采用三步法确定宏块的运动矢量,再将运动矢量送入运动补偿预测器,它根据P帧当前编码宏块的位置和运动矢量坐标,在I帧或P帧存储器中取出与之最相近的匹配宏块,作为预测值,一路送入减法器,与P帧中当前编码宏块相减,另一路送入加法器。在减法器中求出编码像块与预测像块的差值后,送入FDCT变换器,将空域中的8*8差值矩阵转换为8*8频域系数。与I帧不同的是,P帧预测误差的FDCT系数的量化没有采用量化表,而只选择了不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论