版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2014第1章多媒体概述主讲人:吕小星2014第1章多媒体概述主讲人:吕小星第1章多媒体概述学习内容
1.多媒体技术的基本概念
2.数据压缩的基本概念和基本原理
3.超文本系统的基本概念
4.虚拟现实技术的基本概念实训内容
从互联网上收集多媒体技术发展的最新动态
2第1章多媒体概述学习内容2第1章多媒体概述学习目标
理解:多媒体技术、数据压缩、超文本系统的基本概念,
数据压缩的基本原理。
了解:虚拟现实技术的基本概念、多媒体技术的发展趋势。3第1章多媒体概述学习目标3第1章多媒体概述1.1多媒体技术的定义
多媒体技术使计算机具有综合处理声音、文字、图像和视频的能力,它以形象丰富的声、文、图信息和方便的交互性,极大的改善了人机界面,改变了使用计算机的方式,从而为计算机进入人类生活和生产的各个领域打开了方便之门,给人们的工作、生活和娱乐带来深刻的变化。4第1章多媒体概述1.1多媒体技术的定义4第1章多媒体概述1.1.1多媒体的定义1.媒体
(1)定义:媒体(Medium)是指承载或传递信息的载体。(2)种类:
感觉媒体:人接触信息的感觉形式,如视觉、听觉、触觉等;
表示媒体:信息的表示形式,如图形、图像、声音、视频等;
显示媒体:表现和获取信息的物理设备,如显示器、扬声器、
摄象机等;
存储媒体:存储数据的物理设备,如磁盘、光盘、优盘等;
传输媒体:传输数据的物理设备,如光缆、电缆、电磁波、
交换设备等。(3)在计算机领域中媒体有两种含义,一是指用以存储信息的实体,一是指信息的载体。多媒体技术中的媒体是指后者。
5第1章多媒体概述1.1.1多媒体的定义5第1章多媒体概述2.多媒体(1)多媒体一词译自于20世纪80年代初出现的英文单词“Multimedia”(2)定义:文本、声音、图形、图像、动画和视频是信息的载体,其中两个或多于两个的组合构成了多媒体。(3)常见的多媒体的定义
定义1:多媒体是对文本、图形、声音、图像等多种媒体信息进行统一的处理,实现信息有效表现的手段。
定义2:多媒体是一种技术的平台,用户通过计算机能对文本、图形、动画、声音进行整合。
定义3:多媒体是一种传递媒体信息多样化的状态。它是以计算机对图像、声音、文本等多种媒体进行整合的一维化处理。
定义4:利用计算机交互式地综合处理各种媒体信息:文本、图形、图像、声音,使它们建立起一定的逻辑连接,集成为一种具有交互性的系统。6第1章多媒体概述2.多媒体6第1章多媒体概述1.1.2多媒体的主要元素1.文本(1)文本一般由文字、数字和符号等构成,在计算机中文本是用字符代码及字符格式表示出来的数据。(2)文本是一种最基本的传播媒体,也是多媒体信息系统中出现最频繁的媒体。(3)文本文件的常见格式包括:TXT、CSV、DOC、RTF、WPS、PDF、CAJ等。2.图形(1)图形也称矢量图形,一般指用计算机绘制的画面,如直线、圆、圆弧、矩形、任意曲线和图表等。(2)矢量图形文件中只记录生成图的算法和图上的某些特征点,(3)对矢量图形的各个部分分别进行控制很方便。(4)矢量图形一般在多媒体素材的创建过程中使用。7第1章多媒体概述1.1.2多媒体的主要元素7第1章多媒体概述1.1.2多媒体的主要元素3.图像(1)图像是指由照相机和摄像机等数字化采集设备捕捉的实际场景画面,或用计算机图像处理软件创建的景物。(2)图像是由许多的像素按照其在图像中所处的位置排列所构成的平面点阵图。(3)常见的图像文件格式包括:JPG、GIF、PNG、BMP等。4.音频(1)音频(一般指人耳能听到的声音)包括语音、音乐和效果声。(2)常见的音频文件格式包括:WAV、MP3、RA、WMA、MID等。8第1章多媒体概述1.1.2多媒体的主要元素8第1章多媒体概述1.1.2多媒体的主要元素5.动画(1)动画是移动的画面,实质是一幅幅静态图像的连续播放所形成的动态感觉。(2)动画一般是指人们的主观设计而非摄像机摄下的影像。(3)动画可分为二维动画(平面)和三维动画(立体)两类。(4)动画的常见格式包括:SWF、GIF、AVI等。6.视频(1)视频一般是指用摄像机拍摄的动态影像。(2)视频可记录和反映真实世界的实际场景和画面。(3)数字视频常见的存储格式包括:AVI、MPEG、ASF、WMV、MOV、RM、RMVB、FLV等。9第1章多媒体概述1.1.2多媒体的主要元素9第1章多媒体概述1.1.3多媒体技术的定义1.定义
多媒体计算机技术(MultimediaComputingTechnology)是计算机综合处理多种媒体信息:文本、图形、图像、音频和视频,使多种信息建立逻辑连接,集成为一个系统并具有交互性。2.简单地说(1)计算机综合处理声、文、图信息;(2)具有集成性和交互性。10第1章多媒体概述1.1.3多媒体技术的定义10第1章多媒体概述1.1.4多媒体技术的特性111.多样性(1)信息媒体的多样化,有人称之为信息多维化。计算机所能处理的信息不再局限于数值、文本。(2)多媒体体信息的多维化不仅仅指输入,还有输出。2.交互性(1)交互性是多媒体计算机可以与使用者作交互性沟通的特性。(2)交互性不仅能够为使用者提供按照自己的意愿解决问题的性能,而且可以帮助使用者通过交谈式的沟通进行学习。3.集成性(1)多媒体信息媒体的集成(2)处理这些媒体的设备与设施的集成,即系统的集成图2-1多媒体创作流程第1章多媒体概述1.1.4多媒体技术的特性111.多样第1章多媒体概述1.2数据压缩技术
数据压缩技术是多媒体技术的关键技术,也是多媒体技术发展的基础,数字化的多媒体信息尤其是数字视频、音频信号的数据量特别庞大,具有海量性,如果不对其进行有效的压缩就难以得到实际的应用。12第1章多媒体概述1.2数据压缩技术12第1章多媒体概述1.2.1什么是数据压缩1.定义
数据压缩就是以最少的数码表示信源所发的信号,减少容纳给定消息集合或数据采样集合的信号空间。(1)定义中的“信源”可以是数据、静止图象、语音、电视或其他需要存储和传输的信号;(2)“信号空间”是指信号集合所占的空域、时域和频域空间。(3)“最少”是指在保证信源的一定质量或者说是有效的前提下的最少。13第1章多媒体概述1.2.1什么是数据压缩13第1章多媒体概述1.2.1什么是数据压缩2.数据压缩的分类(1)有损压缩
是指经过压缩后经解码再还原的信号与原信号不能严格一致。(2)无损压缩
是指压缩后经解码还原的信号与原信号严格一致。14第1章多媒体概述1.2.1什么是数据压缩14第1章多媒体概述1.2.2数据压缩的必要性1.对多媒体数据进行压缩,主要原因就是多媒体数据的海量性。2.未压缩信源的大致比特率3.如果不进行数据压缩处理,计算机系统就无法对它进行存储和传输。15电话(200~3400HZ)8000样本数/秒×12比特/样本=96KBPS宽带语音(50~7000Hz)16000样本数/秒×14比特/样本=224kbps宽带音频(20~20000Hz)44100样本数/秒×2信道×16比特/样本=1.412Mbps图像512×512像素色彩图像×24比特/像素=6.3兆比特/图像(幅)视频640×480像素色彩图像×24比特/像素×30图像/秒=221Mbps高清晰度电视1280×720像素色彩图像×60图像/秒×24比特/像素=1.3Gbps第1章多媒体概述1.2.2数据压缩的必要性15电话(第1章多媒体概述1.2.3数据压缩的可能性多媒体数据压缩是必要的,那么能否对多媒体数据进行压缩呢?1.根据信息论,只要信源中存在数据冗余就存在压缩的可能性。2.“信息量”与“数据量”之间的关系信息量=数据量-冗余量,即I=D-du。“I”表示信息量;“D”表示数据量;“du”表示冗余量,16第1章多媒体概述1.2.3数据压缩的可能性16第1章多媒体概述3.图像数据的空间冗余和时间冗余(1)空间冗余空间冗余也称为空域相关,一幅图像是由若干个像素组成的,在相邻像素之间相关性很大,有很大的信息冗余,这就是空间冗余。(2)时间冗余时间冗余也称为时域相关。在运动图像中,相邻帧之间也存在着很大的相关性,它表示在时间轴上相邻的两帧图像是相似的,这种冗余为时间冗余。17第1章多媒体概述3.图像数据的空间冗余和时间冗余17第1章多媒体概述4.
图像其它类型的冗余(1)结构冗余有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等。我们称此为结构冗余。已知分布模式,可以通过某一过程生成图像。(2)知识冗余有些图像的理解与某些基础知识有相当大的相关性。这类规律性的结构可以由先验知识和背景知识中得到,我们称此类冗余为知识冗余。例如:人脸的图像有固定的结构。比如说嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正脸图像的中线上,等等。18第1章多媒体概述4.图像其它类型的冗余18第1章多媒体概述4.
图像其它类型的冗余(3)视觉冗余人类的视觉系统对图像场的敏感区是非均匀和非线性的。然而,在记录原始的图像数据时,通常假定视觉系统是线性的和均匀的,对视觉敏感和不敏感的部分同等对待,从而产生了比理想编码更多的数据,这就是视觉冗余。视觉冗余是非均匀、非线性的。例:人类视觉分辨率为26,但常用28就是数据冗余。19第1章多媒体概述4.图像其它类型的冗余19第1章多媒体概述4.
图像其它类型的冗余(4)图像区域的相同性冗余它是指在图像中的两个或多个区域所对应的所有像素值相同或相近,从而产生的数据重复性存储,这就是图像区域的相似性冗余。(5)纹理的统计冗余有些图像纹理尽管不严格服从某一分布规律,但是它在统计的意义上服从该规律。利用这种性质也可以减少表示图像的数据量,所以我们称之为纹理的统计冗余。。20第1章多媒体概述4.图像其它类型的冗余20第1章多媒体概述1.2.4数据压缩的基本原理数据压缩技术的理论基础是信息论。根据信息论的原理,可以找到最佳数据压缩编码方法,数据压缩的理论极限是信息熵。1.信息信息是用不确定的量度定义的,也就是说信息被假设为由一系列的随机变量所代表,它们往往用随机出现的符号来表示。2.信息量信息量指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。也可以说是辨别N个事件中特定事件所需提问“是”或“否”的最小次数。21第1章多媒体概述1.2.4数据压缩的基本原理21第1章多媒体概述1.2.4数据压缩的基本原理2.信息量例如:从64个数(1~64的整数)中选定某一个数,提问:“是否大于32?”,则不论回答是与否,都消去半数的可能事件,如此下去,只要问6次这类问题,就可以从64个数中选定一个数,则所需的信息量是
设从N中选定任一个数
的概率为
,假定任选一个数的概率都相等,即
,则信息量
可定义为:22第1章多媒体概述1.2.4数据压缩的基本原理22第1章多媒体概述1.2.4数据压缩的基本原理2.信息量当
,相应的信息量单位为比特(bit);当
,相应的信息量单位为奈特(Nat);当
,相应的信息量单位为哈特(Hart);23第1章多媒体概述1.2.4数据压缩的基本原理23第1章多媒体概述1.2.4数据压缩的基本原理3.信息熵
在信息论中称为信源的“熵”(Entropy),它的含义是信源发出任意一个随机变量的平均信息量。(1)当处于事件发生之前,
是不确定性的度量;(2)当处于事件发生之时,
是一种惊奇性的度量;(3)当处于事件发生之后,
是获得信息的度量;(4)还可以理解为是事件随机性的度量。24第1章多媒体概述1.2.4数据压缩的基本原理24第1章多媒体概述1.2.4数据压缩的基本原理4.最大离散熵定理
所有概率分布
所构成的熵,以等概率时为最大。5.熵的范围6.信息熵的最大值与熵值之间的差值,就是信源X所含的冗余度。25第1章多媒体概述1.2.4数据压缩的基本原理25第1章多媒体概述1.2.4数据压缩的基本原理7.香农编码定理在编码中用熵值衡量是否为最佳编码,熵值是平均码长的下限。若用
表示编码器输出的平均码长,则:(1)时,有冗余,不是最佳编码;(2)不可能发生,只能有
(3-1)(3)稍大于时
时,为最佳编码。(4)在论述平均码长在构成瞬时可解码的编码方式时,
香农指出应满足
(3-2)称式(3-1)和式(3-2)为香农编码定理。26第1章多媒体概述1.2.4数据压缩的基本原理26第1章多媒体概述1.2.5数据压缩编码的方法多媒体数据压缩方法根据不同的依据可产生不同的分类。第一种,根据质量有无损失可分为有损失编码和无损失编码。第二种,按照其作用域在空间域或频率域上分为:空间方法、变换方法和混合方法。第三种,根据是否自适应分为自适应性编码和非自适应性编码。27第1章多媒体概述1.2.5数据压缩编码的方法27第1章多媒体概述1.2.5数据压缩编码的方法1.预测编码(1)编码器记录与传输的不是样本的真实值,而是它与预测值的差。这一方法称为DPCM(differentialpulsecodemodulation)方法。(2)预测值由欲编码图像信号的过去信息决定。(3)通常采用线性预测,比例系数由其统计特性估计得到。(4)预测不仅可以在相邻像素值之间进行,而且可以在行与行之间进行。(5)由于空间相关性,真实值与预测值的差值变化范围远远小于真实值的变化范围,因而可以采用较少的位数来表示。28第1章多媒体概述1.2.5数据压缩编码的方法28第1章多媒体概述1.2.5数据压缩编码的方法2.变换编码(1)主要思想:利用图像块内像素值之间的相关性,把图像变换到一组新的基上,使得能量集中到少数几个变换系数上,通过存储这些系数而达到压缩的目的。(2)在变换编码中,由于对整幅图像进行变换的计算量太大,所以一般把原始图像分成许多个矩形区域子图像独立进行变换。(3)常用的变换方法KLT变换,DCT变换,WHT变换,DFT变换29第1章多媒体概述1.2.5数据压缩编码的方法29第1章多媒体概述1.2.5数据压缩编码的方法3.统计编码(1)Huffman编码对于出现频率大的符号用较少的位数来表示,而对出现频率小的符号用较多的位数来表示。其编码效率主要取决于需编码的符号出现的概率分布,越集中则压缩比越高。30第1章多媒体概述1.2.5数据压缩编码的方法30第1章多媒体概述1.2.5数据压缩编码的方法(2)算术编码每一符号对应[0,1)上的一子区间,区间长度为该符号出现的概率。该方法将被编码的符号串(数值串)表示成实数0到1之间的一个区间。初始把它设为整个区间[0,1)。当出现一个新的待编码符号,先把完整的[0,1)区间影射到上一次形成的区间,然后新区间取为[0,1)上新符号对应区间所映成的像。解码时,根据区间的覆盖性来逐一解出原符号串。算术编码的优点是可方便地使用自适应编码,可以根据当前接收的数据不断地更改概率模型。31第1章多媒体概述1.2.5数据压缩编码的方法31第1章多媒体概述1.2.5数据压缩编码的方法(3)游程编码游程编码实际上是一维信号的分段常数逼近,是一个相当简单的编码方法。编码器不断比较一维的相邻元素值的变化幅度,一旦发现有明显的变化,就称一个游程(run)开始了。编码器对每一个游程需要确定两种信息:游程的起点位置和该游程对应的信号值。由于游程是连续的,一个游程的终止是下一个游程的开始,所以游程的位置信息和信号值都可以用两种方式记录:差分方式和绝对数值方式。32第1章多媒体概述1.2.5数据压缩编码的方法32第1章多媒体概述1.2.5数据压缩编码的方法4.混合编码混合编码是指合并变换和预测技术的编码方法。通常有两种编码形式:第一种为在某一方向上进行酉变换(例如X方向),而在另一方向(例如Y方向)上用DPCM对变换系数进行预测编码。另一种形式是对动态图像而言,二维变换再加上时间方向上的DPCM预测。33第1章多媒体概述1.2.5数据压缩编码的方法33第1章多媒体概述1.2.6数据压缩标准及应用多媒体技术的关键技术之一是关于多媒体数据压缩(编码)和解压(解码)算法。为了解决不同厂家产品的兼容性问题,国际标准化协会ISO(InternationalStandardizationOrganization),国际电子学委员会IEC(InternationalElectronicsCommittee),国际电信协会ITU(InternationalTelecommunicationUnion)等国际组织于90年代领导制定了三个重要的多媒体国际标准:JPEG标准;H.261标准;MPEG标准。34第1章多媒体概述1.2.6数据压缩标准及应用34第1章多媒体概述1.2.6数据压缩标准及应用1.JPEG标准全称为“多灰度静态图像的数字压缩编码”,是用于静态图像压缩的国际标准。2.MPEG标准MPEG压缩标准用于数字卫星广播、高清晰电视、数字录象机以及网络环境下的电视点播(VOD)、DVD等各方面。目前已有MPEG-1、MPEG-2、MPEG-4等3个国际标准,正在完成的有2个:MPEG-7和MPEG-21。35第1章多媒体概述1.2.6数据压缩标准及应用35第1章多媒体概述1.2.6数据压缩标准及应用2.MPEG标准(1)VCD采用的是MPEG-1标准;(2)DVD采用的MPEG-2标准;(3)MPEG-4标准主要用于网络环境中流媒体数据的压缩。(4)MPEG-7标准(ISO/IEC15938)名称叫“多媒体内容描述接口”,是一个关于表示音/视信息的信息的标准。(5)MPEG-21标准(ISO/IEC18034),正式名称叫“多媒体框架”。MPEG-21的目标是用于通过网络实现数字内容的电子交易。36第1章多媒体概述1.2.6数据压缩标准及应用36第1章多媒体概述1.2.6数据压缩标准及应用3.H.26X标准H.261标准主要用于视频电话和视频会议。H.263标准特别适用于无线网络、PSTN和因特网等环境下的视频传输。其传输码率可以低于64kbps。H.264标准,为视频编码应用提供下一代的解决方案,提供显著增强的编码效率,,同时减少H.263中一些混乱的可选模式。优点是更高的压缩比和更好的信道适应性;缺点是计算复杂度的大大增加。37第1章多媒体概述1.2.6数据压缩标准及应用37第1章多媒体概述1.2.6数据压缩标准及应用4.AVS标准AVS是我国具有自主知识产权的视音频编码标准。2006年9月,AVS已正式成为国际电联ITU-T的联络组织,意味着AVS标准已具备选入ITU-T标准体系的资格,为AVS的国际化道路打开了大门。2007年5月,AVS列入ITU-TIPTVFG的内容编码标准文件,成为与H.264、VC-1并列的选项。38第1章多媒体概述1.2.6数据压缩标准及应用38第1章多媒体概述1.2.6数据压缩标准及应用5.HEVC协议标准HEVC(HighEfficiencyVideoCoding)。2010年1月,ITU-TVCEG(VideoCodingExpertsGroup)和ISO/IECMPEG(MovingPictureExpertsGroup)联合成立JCT-VC(JointCollaborativeTeamonVideoCoding)了联合组织,统一制定下一代编码标准:HEVC。HEVC(H.265)标准于2013年2月发布正式版本,由于其在压缩效率、并行处理能力以及网络适应性方面的极大改进,它的发展和应用必将把视频编解码理论和应用推向一个新的高度39第1章多媒体概述1.2.6数据压缩标准及应用39第1章多媒体概述1.3超文本与超媒体
人类的记忆是一种联想式的记忆,它构成了人类记忆的网络结构。超文本结构就类似于人类的这种联想记忆结构,它采用一种非线性的网状结构组织块状信息,没有固定的顺序,也不要求读者必须按某个顺序来阅读。采用这种网状结构,各信息块很容易按照信息的原始结构或人们的“联想”关系加以组织。40第1章多媒体概述1.3超文本与超媒体40第1章多媒体概述1.3.1基本概念1.定义超文本可以定义为由结点和表示信息结点间相关性的链构成的一个具有一定逻辑结构和语义的网络。结点:超文本内部互连的信息块,可以是计算机的若干屏,也可以是若干窗口、文件或更小信息块。链:每个结点都有若干指向其他结点或从其他结点指向该结点的指针,这些指针被称为链(link)。
41第1章多媒体概述1.3.1基本概念41第1章多媒体概述1.3.1基本概念2.超文本系统的特点(1)在用户界面中包括对超文本的网络结构的一个显示表示,即向用户展示结点和链的形式。(2)给用户一个网络结构的动态总貌图,使用户在每一时刻都可以得到当前结点的邻接环境。(3)超文本系统一般使用双向链,这种链应支持跨跃各种计算机网络,如局域网和因特网。42第1章多媒体概述1.3.1基本概念42第1章多媒体概述1.3.1基本概念2.超文本系统的特点(4)用户可以通过自己思想的联想及感知,根据自己的需要动态地改变网络中结点和链,以便对网络中的信息进行快速、直观、灵活的访问,如浏览、查询、标注等。这种联想和感知被准确地定义,并要求有良好的性能/价格比。(5)尽可能不依赖它的具体特性、命令或信息结构,而更多地强调它的用户界面的“视觉和感觉”。43第1章多媒体概述1.3.1基本概念43第1章多媒体概述1.3.2典型的超文本(媒体)系统1.HyperCard1987年8月,美国苹果公司在Macintosh微机上推出了HyperCard软件,这是一个十分形象的集图文声为一体的超文本系统,它的出现对超文本技术的推广起着重大作用。该系统以卡片组作为结点信息的表现形式,在信息呈现时,每次只呈现一枚卡片。卡片是透明的,可以重叠在背景上,对于不同的卡片,背景可以共用。HyperCard使用面向对象技术,图形、文本和按钮等三种类型的对象,根据实际需要被设置在卡片和背景上。44第1章多媒体概述1.3.2典型的超文本(媒体)系统44第1章多媒体概述1.3.2典型的超文本(媒体)系统2.NoteCardNoteCard是美国Xerox公司的PARC研究中心为研究设计人员或作家开发的一个基于工作站的超文本系统。NoteCard有一个良好的浏览工具,包括一个层次系统和组织复杂的NoteCard网络。NoteCard提供了一组工具:包括对于网络的组织、显示和管理,还有为创建管理此网络的程序而提供的方法和协议。在NoteCard系统中核心结构是一个语义网络,它由电子记事卡组成,这些电子记事卡通过分类链将节点连接起来。45第1章多媒体概述1.3.2典型的超文本(媒体)系统45第1章多媒体概述1.3.2典型的超文本(媒体)系统3.Guide1986年由办公工作站有限公司(OWL)推出的,它推出时即为商品化软件,所以是第一个广泛应用的超文本,可以在Macintosh,IBMPC等多种个人机上运行。Guide系统比HyperCard和NoteCard更面向正文,它有许多不同的链类型:替换链、记事链、引用链、查询链等。该系统结构较为简单,用户在使用时很少迷航,与此同时,它也制约了超媒体的网络结构设计、制约了网络对信息的表现能力。46第1章多媒体概述1.3.2典型的超文本(媒体)系统46第1章多媒体概述1.3.3超文本与超媒体系统模型1.超文本系统模型47
Combell和Goodman模型Dexter参考模型用户接口层超文本抽象机层
(HAM)数据库层元素内部层
存储层
运行层第1章多媒体概述1.3.3超文本与超媒体系统模型47第1章多媒体概述1.3.3超文本与超媒体系统模型(1)数据库层要保证信息的存取操作对于高层的超文本抽象机来说是透明的,即无论高层访问的信息是存储在本地或在远地,是存储在一台计算机中还是存储在多台计算机中,数据库层都能保证正确存取。数据库层还要处理其他传统的数据库问题,如多用户并发访问信息的安全性、版本维护以及响应速度等问题。超文本的节点和链都是没有什么特殊含义的数据对象。它们各自占据若干比特的存储空间,构成在同一时间只有一个用户可修改的单元。48第1章多媒体概述1.3.3超文本与超媒体系统模型48第1章多媒体概述1.3.3超文本与超媒体系统模型(2)超文本抽象机层这一层决定了超文本系统节点和链的基本特点,记录了节点之间链的关系,并保存了有关节点和链的结构信息。提供信息转换格式。超文本的格式转换比在节点中简单地转换混合数据要困难的多,尽管它也存在非ASCII码信息的非标准数据格式问题,但问题是超文本的转换不仅要转换节点中的多媒体混合数据,还要求传送信息之间的链接关系,它可能传送了基本链(如A→B)的信息,但丢失了其他的链接信息。49第1章多媒体概述1.3.3超文本与超媒体系统模型49第1章多媒体概述1.3.4超文本与超媒体的发展前景1.由超文本向超媒体发展从超文本到超媒体是技术发展的进步,也是技术发展的必然性。2.由超媒体向智能超媒体发展在超媒体的链和节点中嵌入知识或规则,允许链进行计算和推理,使得多媒体信息的表现具有智能化。3.由超媒体向协作超媒体发展超媒体建立了信息之间的链接关系,那么也可用超媒体技术建立人与人之间的链接关系,这就是协作超媒体技术。协同工作使得多个用户可以同一组超媒体数据上共同进行操作。50第1章多媒体概述1.3.4超文本与超媒体的发展前景50第1章多媒体概述1.4
虚拟现实虚拟现实技术(VirtualRealityTechnology,简称VRT)的出现实际是计算机图形学、人机接口技术、传感器技术以及人工智能技术等交叉与综合的结果。以虚拟现实技术为代表的新型人机交互技术旨在探索自然和谐的人机关系,使人机界面从以视觉感知为主发展到包括视觉、听觉、触觉、力觉、嗅觉和动觉等多种感觉通道感知。51第1章多媒体概述1.4虚拟现实51第1章多媒体概述1.4.1虚拟现实技术的产生与发展1956年,美国的MortonHeileg开发了一个被称为Sensorama(传感景院)的摩托车仿真器。1965年,美国ARPA信息处理技术办公室主任IvanSutherland发表了一篇名为“TheUltimateDisplay”(终极的显示)的文章。首次指出,应该将计算机显示屏幕看作观察虚拟世界的一个窗口,计算机系统将使该窗口中的景象、声音乃至物体的行为都非常逼真。1968年,IvanSutherland在哈佛大学组织开发出第一个计算机图形驱动的头盔显示器(Helmet-MountedDisplay,即HMD),并开发了与HMD相配的头部位置跟踪系统。52第1章多媒体概述1.4.1虚拟现实技术的产生与发展52第1章多媒体概述1.4.1虚拟现实技术的产生与发展80年代初,美国的VPL公司的创始人JaronLanier在正式提出了“VirtualReality”一词,简称VR,中文译为“虚拟现实”或“灵境”。1984年,美国宇航局(NASA)Ames研究中心虚拟行星探测实验室的MichaelMcGreevy和J.Humphries博士组织开发了用于火星探测的虚拟世界视觉显示器VIEW系统,将火星探测器发回的数据输入计算机,为地面研究人员构造了火星表面的三维虚拟世界。1993年的11月,宇航员利用虚拟现实系统的训练成功地完成了从航天飞机的运输舱内取出新的望远镜面板的工作。53第1章多媒体概述1.4.1虚拟现实技术的产生与发展53第1章多媒体概述1.4.1虚拟现实技术的产生与发展1996年12月世界第一个虚拟现实环球网在英国投入运行,因特网用户可以在一个由立体虚拟现实世界组成的网络中遨游,身临其境般地欣赏各地风光、参加博览会和到大学课堂听讲座等。进入20世纪90年代,迅速发展的计算机硬件技术与不断改进的计算机软件系统极大地推动了虚拟现实技术的发展,虚拟现实技术已经计算机科学中一个十分活跃的研究方向,并已逐步应用于军事、设计、教育、娱乐等诸多领域。54第1章多媒体概述1.4.1虚拟现实技术的产生与发展54第1章多媒体概述1.4.2虚拟现实的概念1.虚拟现实虚拟现实或称虚拟环境(virtualenvironment),是一种逼真的视、听、触觉一体化的计算机生成环境,用户可以借助必要的装备以自然的方式与虚拟环境中的物体进行交互作用、相互影响,从而获得亲临等同真实环境的感受和体验。虚拟现实=virtual+reality。55第1章多媒体概述1.4.2虚拟现实的概念55第1章多媒体概述1.4.2虚拟现实的概念2.虚拟现实概念模型
图1-4虚拟现实的概念模型56第1章多媒体概述1.4.2虚拟现实的概念56第1章多媒体概述1.4.2虚拟现实的概念3.虚拟现实方法是将计算科学处理对象统一看作一个计算机生成空间,并将操作它的人看作是这个空间的一个组成部分。人与计算机空间的对象之间的交互是通过各种先进的感知技术与显示技术完成。人可以感受到虚拟环境中的对象,虚拟环境也可以感受到人对它的各种操作。虚拟现实的主要实现方法是借助必要的装备,实现人与虚拟环境之间的信息转换,最终实现人与环境之间的自然交互与作用。57第1章多媒体概述1.4.2虚拟现实的概念57第1章多媒体概述1.4.3虚拟现实系统的基本组成一个虚拟现实系统的4个组成部分:1.输入(1)输入过程完成实物虚化的任务。(2)主要设备:键盘、鼠标、跟踪球、游戏杆、
数据手套、头部跟踪器和数据衣等。2.仿真(1)仿真是根据某些理论或物理规律确定虚拟环境在每一时刻的状态,包括物体的位置、方向、变形、分解与聚合。(2)仿真过程一般是一个离散的过程,它以一定的时间间隔更新虚拟环境中每个物体的状态。58第1章多媒体概述1.4.3虚拟现实系统的基本组成58第1章多媒体概述1.4.3虚拟现实系统的基本组成3.输出(1)完成显示任务,根据虚拟环境的当前状态,生成虚拟环境对用户的视觉、听觉、触觉和味觉等多种感知,将虚拟环境“显示”给用户。(2)这个过程是一个虚物实化的过程。4.数据库记录了虚拟环境的当前状态59第1章多媒体概述1.4.3虚拟现实系统的基本组成59第1章多媒体概述1.4.4虚拟现实的三个特征1.沉浸感
沉浸感(immersion)是指参与者对虚拟现实的融入程度,即参与者全身心地沉浸于计算机所生成的三维虚拟环境,具有很好的临场感,并产生身临其境的感觉。虚拟现实的沉浸感来源于对虚拟世界的多感知性,常见的有视觉感知、听觉感知、力觉感知、味觉感知、嗅觉感知和身体感觉等。60第1章多媒体概述1.4.4虚拟现实的三个特征60第1章多媒体概述1.4.3虚拟现实的三个特征2.交互性交互性(interaction)是指参与者可以利用各种感官功能及人类自然技能虚拟环境进行交互考察与操作。在虚拟现实系统中,强调人与虚拟世界之间以自然的方式进行交互,如人的走动、头的转动、手的移动等方式与虚拟现实系统交互,并借助于虚拟现实系统中特殊的硬件设备,实时产生真实世界中一样的感知,甚至连参与者都意识不到计算机的存在。61第1章多媒体概述1.4.3虚拟现实的三个特征61第1章多媒体概述1.4.4虚拟现实的三个特征3.构想性构想性(imagination)是指参与者借助虚拟现实系统给出的逼真视听触觉信号而产生的对虚拟空间的想象。可以使人类突破时间与空间,去体验世界上早已发生或尚未发生的事件;可以使人类进入宏观或微观世界进行研究和探索;也可以完成那些因为某些条件限制难以完成的事情。62第1章多媒体概述1.4.4虚拟现实的三个特征62第1章多媒体概述1.4.5虚拟现实的研究方向1.感知技术2.合成显示技术3.建模技术4.分布式虚拟现实技术5.支撑软件与开发工具63第1章多媒体概述1.4.5虚拟现实的研究方向63第1章多媒体概述1.5多媒体技术的产生与发展641.5.1多媒体技术的产生1.起源于20世纪60年代(1)1965年,纳尔逊(TedNelson)提出了一种计算机上把文本中遇到的相关文本组织在一起的方法,并为这种方法杜撰了一个词,称为“hypertext(超文本)”。(2)1976年,美国麻省理工学院体系结构机器组向DARPA提出多种媒体(MultipleMedia)的建议。第1章多媒体概述1.5多媒体技术的产生与发展641.5第1章多媒体概述651.5.1多媒体技术的产生2.实现于20世纪80年代中期(1)1984年美国Apple公司在研制Macintosh计算机时,创造性地使用了位映射(bitmap)、窗口(window)、图符(icon)等技术。(2)1987年Apple公司又引入了“超级卡”(Hypercard),使Macintosh机成为更容易使用、易学习并且能处理多媒体信息的机器,受到计算机用户的一致赞誉。(3)1985年,美国Commodore公司推出世界上第一台多媒体计算机Amiga系统。第1章多媒体概述651.5.1多媒体技术的产生第1章多媒体概述661.5.1多媒体技术的产生2.实现于20世纪80年代中期(4)1986年荷兰Philips公司和日本Sony公司联合研制并推出CD-I。并经过国际标准化组织(ISO)的认可成为国际标准。(5)1987年3月,美国无线电公司RCA在国际第二届CD-ROM年会展示了交互式数字视频(DVI,DigitalVideoInteractive)的技术。(6)1985年10月IEEE计算机杂志首次出版了完备的“多媒体通信”的专集,是文献中可以找到的最早的出处。(7)1987年,成立了交互声像工业协会,该组织1991年更名为交互多媒体协会(IMA,InteractiveMultimediaAssociation)。第1章多媒体概述661.5.1多媒体技术的产生第1章多媒体概述1.5多媒体技术的产生与发展671.5.2多媒体技术的标准化阶段(1)1990年10月,在微软公司会同多家厂商召开的多媒体开发工作者会议上提出了MPC1.0标准。(2)1993年由IBM,Intel等数十家软硬件公司组成的多媒体个人计算机市场协会(MPMC,TheMultimediaPCMarketingCouncil)发布了多媒体个人机的性能标准MPC2.0。(3)1995年6月,MPMC又宣布了新的多媒体个人机技术规范MPC3.0。第1章多媒体概述1.5多媒体技术的产生与发展671.5第1章多媒体概述681.5.2多媒体技术的标准化阶段(4)1992年,实现网络上的第一个M-Bone音频广播。(5)1993年,在美国伊利诺斯大学的美国超级计算应用国家中心开发出第一个万维网浏览器Mosaic。(6)1986年ISO和IEC联合成立了联合图片专家组JPEG,主要制定静态图像帧内压缩编码ISO/IEC10918即JPEG标准。(7)1988年成立了运动图像专家组MPEG(MovingPictureExpertsGroup)。1992年正式通过ISO/IEC11172运动图像压缩编码标准即MPEG-1标准。1995年5月15日正式通过并编辑出版了ISO/IEC13818即MPEG-2标准。第1章多媒体概述681.5.2多媒体技术的标准化阶段第1章多媒体概述691.5.2多媒体技术的标准化阶段
MPEG-1标准的正式名称叫“信息技术——用于数据率1.5Mbit/s的数字存储媒体的电视图像和伴音编码”,由系统、视频、音频、一致性测试和软件模拟五个部分组成。MPEG-2标准的正式名称叫“信息技术——活动图像和伴音信息的通用编码”。MPEG-2的基本位速率为4~8Mbps,最高达15Mbps。MPEG-2包含九个部分:系统,视频,音频,一致性测试,软件模拟,数字存储媒体命令和控制(DSM-CC)扩展协议,先进音频编码(AAC),系统解码器实时接口扩展协议,和DSM-CC一致性扩展测试。MPEG-4标准的正式名称叫“甚低速率视听编码”,定义了一个广阔的第1章多媒体概述691.5.2多媒体技术的标准化阶段第1章多媒体概述701.5.2多媒体技术的标准化阶段MPEG-4标准的正式名称叫“甚低速率视听编码”,定义了一个广阔的通信平台,支持从低码率(5Kbps-64kbps)到高码率(100Mbps)的各种应用,为保证标准的灵活性,它提供一系列的编码算法和工具,以供应用开发者选用。MPEG-7标准(ISO/IEC15938)名称叫“多媒体内容描述接口”,是一个关于表示音/视信息的信息的标准。MPEG-21标准(ISO/IEC18034),正式名称叫“多媒体框架”。MPEG-21的目标是,把支持分布在大范围网络和设备中的多媒体资源的技术透明地集成起来以支持多种功能。第1章多媒体概述701.5.2多媒体技术的标准化阶段第1章多媒体概述1.5多媒体技术的产生与发展711.5.3多媒体计算机的发展趋势(1)进一步完善计算机支持的协同工作环境(2)智能多媒体技术(3)把多媒体信息实时处理和压缩编码算法作到CPU芯片中。第1章多媒体概述1.5多媒体技术的产生与发展711.5第1章多媒体概述72本章小结
本章主要讲述了多媒体技术的定义、分类和基本特性,数据压缩的基本概念和基本原理以及数据压缩技术标准和应用;介绍了超文本技术和虚拟现实技术的基本概念、特性和系统构成;简略介绍了多媒体技术的产生于发展。通过本章的学习使学生具有多媒体技术的基本概念,为后面学习多媒体软件的使用打下理论基础。第1章多媒体概述72本章小结谢谢2014谢谢20142014第1章多媒体概述主讲人:吕小星2014第1章多媒体概述主讲人:吕小星第1章多媒体概述学习内容
1.多媒体技术的基本概念
2.数据压缩的基本概念和基本原理
3.超文本系统的基本概念
4.虚拟现实技术的基本概念实训内容
从互联网上收集多媒体技术发展的最新动态
75第1章多媒体概述学习内容2第1章多媒体概述学习目标
理解:多媒体技术、数据压缩、超文本系统的基本概念,
数据压缩的基本原理。
了解:虚拟现实技术的基本概念、多媒体技术的发展趋势。76第1章多媒体概述学习目标3第1章多媒体概述1.1多媒体技术的定义
多媒体技术使计算机具有综合处理声音、文字、图像和视频的能力,它以形象丰富的声、文、图信息和方便的交互性,极大的改善了人机界面,改变了使用计算机的方式,从而为计算机进入人类生活和生产的各个领域打开了方便之门,给人们的工作、生活和娱乐带来深刻的变化。77第1章多媒体概述1.1多媒体技术的定义4第1章多媒体概述1.1.1多媒体的定义1.媒体
(1)定义:媒体(Medium)是指承载或传递信息的载体。(2)种类:
感觉媒体:人接触信息的感觉形式,如视觉、听觉、触觉等;
表示媒体:信息的表示形式,如图形、图像、声音、视频等;
显示媒体:表现和获取信息的物理设备,如显示器、扬声器、
摄象机等;
存储媒体:存储数据的物理设备,如磁盘、光盘、优盘等;
传输媒体:传输数据的物理设备,如光缆、电缆、电磁波、
交换设备等。(3)在计算机领域中媒体有两种含义,一是指用以存储信息的实体,一是指信息的载体。多媒体技术中的媒体是指后者。
78第1章多媒体概述1.1.1多媒体的定义5第1章多媒体概述2.多媒体(1)多媒体一词译自于20世纪80年代初出现的英文单词“Multimedia”(2)定义:文本、声音、图形、图像、动画和视频是信息的载体,其中两个或多于两个的组合构成了多媒体。(3)常见的多媒体的定义
定义1:多媒体是对文本、图形、声音、图像等多种媒体信息进行统一的处理,实现信息有效表现的手段。
定义2:多媒体是一种技术的平台,用户通过计算机能对文本、图形、动画、声音进行整合。
定义3:多媒体是一种传递媒体信息多样化的状态。它是以计算机对图像、声音、文本等多种媒体进行整合的一维化处理。
定义4:利用计算机交互式地综合处理各种媒体信息:文本、图形、图像、声音,使它们建立起一定的逻辑连接,集成为一种具有交互性的系统。79第1章多媒体概述2.多媒体6第1章多媒体概述1.1.2多媒体的主要元素1.文本(1)文本一般由文字、数字和符号等构成,在计算机中文本是用字符代码及字符格式表示出来的数据。(2)文本是一种最基本的传播媒体,也是多媒体信息系统中出现最频繁的媒体。(3)文本文件的常见格式包括:TXT、CSV、DOC、RTF、WPS、PDF、CAJ等。2.图形(1)图形也称矢量图形,一般指用计算机绘制的画面,如直线、圆、圆弧、矩形、任意曲线和图表等。(2)矢量图形文件中只记录生成图的算法和图上的某些特征点,(3)对矢量图形的各个部分分别进行控制很方便。(4)矢量图形一般在多媒体素材的创建过程中使用。80第1章多媒体概述1.1.2多媒体的主要元素7第1章多媒体概述1.1.2多媒体的主要元素3.图像(1)图像是指由照相机和摄像机等数字化采集设备捕捉的实际场景画面,或用计算机图像处理软件创建的景物。(2)图像是由许多的像素按照其在图像中所处的位置排列所构成的平面点阵图。(3)常见的图像文件格式包括:JPG、GIF、PNG、BMP等。4.音频(1)音频(一般指人耳能听到的声音)包括语音、音乐和效果声。(2)常见的音频文件格式包括:WAV、MP3、RA、WMA、MID等。81第1章多媒体概述1.1.2多媒体的主要元素8第1章多媒体概述1.1.2多媒体的主要元素5.动画(1)动画是移动的画面,实质是一幅幅静态图像的连续播放所形成的动态感觉。(2)动画一般是指人们的主观设计而非摄像机摄下的影像。(3)动画可分为二维动画(平面)和三维动画(立体)两类。(4)动画的常见格式包括:SWF、GIF、AVI等。6.视频(1)视频一般是指用摄像机拍摄的动态影像。(2)视频可记录和反映真实世界的实际场景和画面。(3)数字视频常见的存储格式包括:AVI、MPEG、ASF、WMV、MOV、RM、RMVB、FLV等。82第1章多媒体概述1.1.2多媒体的主要元素9第1章多媒体概述1.1.3多媒体技术的定义1.定义
多媒体计算机技术(MultimediaComputingTechnology)是计算机综合处理多种媒体信息:文本、图形、图像、音频和视频,使多种信息建立逻辑连接,集成为一个系统并具有交互性。2.简单地说(1)计算机综合处理声、文、图信息;(2)具有集成性和交互性。83第1章多媒体概述1.1.3多媒体技术的定义10第1章多媒体概述1.1.4多媒体技术的特性841.多样性(1)信息媒体的多样化,有人称之为信息多维化。计算机所能处理的信息不再局限于数值、文本。(2)多媒体体信息的多维化不仅仅指输入,还有输出。2.交互性(1)交互性是多媒体计算机可以与使用者作交互性沟通的特性。(2)交互性不仅能够为使用者提供按照自己的意愿解决问题的性能,而且可以帮助使用者通过交谈式的沟通进行学习。3.集成性(1)多媒体信息媒体的集成(2)处理这些媒体的设备与设施的集成,即系统的集成图2-1多媒体创作流程第1章多媒体概述1.1.4多媒体技术的特性111.多样第1章多媒体概述1.2数据压缩技术
数据压缩技术是多媒体技术的关键技术,也是多媒体技术发展的基础,数字化的多媒体信息尤其是数字视频、音频信号的数据量特别庞大,具有海量性,如果不对其进行有效的压缩就难以得到实际的应用。85第1章多媒体概述1.2数据压缩技术12第1章多媒体概述1.2.1什么是数据压缩1.定义
数据压缩就是以最少的数码表示信源所发的信号,减少容纳给定消息集合或数据采样集合的信号空间。(1)定义中的“信源”可以是数据、静止图象、语音、电视或其他需要存储和传输的信号;(2)“信号空间”是指信号集合所占的空域、时域和频域空间。(3)“最少”是指在保证信源的一定质量或者说是有效的前提下的最少。86第1章多媒体概述1.2.1什么是数据压缩13第1章多媒体概述1.2.1什么是数据压缩2.数据压缩的分类(1)有损压缩
是指经过压缩后经解码再还原的信号与原信号不能严格一致。(2)无损压缩
是指压缩后经解码还原的信号与原信号严格一致。87第1章多媒体概述1.2.1什么是数据压缩14第1章多媒体概述1.2.2数据压缩的必要性1.对多媒体数据进行压缩,主要原因就是多媒体数据的海量性。2.未压缩信源的大致比特率3.如果不进行数据压缩处理,计算机系统就无法对它进行存储和传输。88电话(200~3400HZ)8000样本数/秒×12比特/样本=96KBPS宽带语音(50~7000Hz)16000样本数/秒×14比特/样本=224kbps宽带音频(20~20000Hz)44100样本数/秒×2信道×16比特/样本=1.412Mbps图像512×512像素色彩图像×24比特/像素=6.3兆比特/图像(幅)视频640×480像素色彩图像×24比特/像素×30图像/秒=221Mbps高清晰度电视1280×720像素色彩图像×60图像/秒×24比特/像素=1.3Gbps第1章多媒体概述1.2.2数据压缩的必要性15电话(第1章多媒体概述1.2.3数据压缩的可能性多媒体数据压缩是必要的,那么能否对多媒体数据进行压缩呢?1.根据信息论,只要信源中存在数据冗余就存在压缩的可能性。2.“信息量”与“数据量”之间的关系信息量=数据量-冗余量,即I=D-du。“I”表示信息量;“D”表示数据量;“du”表示冗余量,89第1章多媒体概述1.2.3数据压缩的可能性16第1章多媒体概述3.图像数据的空间冗余和时间冗余(1)空间冗余空间冗余也称为空域相关,一幅图像是由若干个像素组成的,在相邻像素之间相关性很大,有很大的信息冗余,这就是空间冗余。(2)时间冗余时间冗余也称为时域相关。在运动图像中,相邻帧之间也存在着很大的相关性,它表示在时间轴上相邻的两帧图像是相似的,这种冗余为时间冗余。90第1章多媒体概述3.图像数据的空间冗余和时间冗余17第1章多媒体概述4.
图像其它类型的冗余(1)结构冗余有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等。我们称此为结构冗余。已知分布模式,可以通过某一过程生成图像。(2)知识冗余有些图像的理解与某些基础知识有相当大的相关性。这类规律性的结构可以由先验知识和背景知识中得到,我们称此类冗余为知识冗余。例如:人脸的图像有固定的结构。比如说嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正脸图像的中线上,等等。91第1章多媒体概述4.图像其它类型的冗余18第1章多媒体概述4.
图像其它类型的冗余(3)视觉冗余人类的视觉系统对图像场的敏感区是非均匀和非线性的。然而,在记录原始的图像数据时,通常假定视觉系统是线性的和均匀的,对视觉敏感和不敏感的部分同等对待,从而产生了比理想编码更多的数据,这就是视觉冗余。视觉冗余是非均匀、非线性的。例:人类视觉分辨率为26,但常用28就是数据冗余。92第1章多媒体概述4.图像其它类型的冗余19第1章多媒体概述4.
图像其它类型的冗余(4)图像区域的相同性冗余它是指在图像中的两个或多个区域所对应的所有像素值相同或相近,从而产生的数据重复性存储,这就是图像区域的相似性冗余。(5)纹理的统计冗余有些图像纹理尽管不严格服从某一分布规律,但是它在统计的意义上服从该规律。利用这种性质也可以减少表示图像的数据量,所以我们称之为纹理的统计冗余。。93第1章多媒体概述4.图像其它类型的冗余20第1章多媒体概述1.2.4数据压缩的基本原理数据压缩技术的理论基础是信息论。根据信息论的原理,可以找到最佳数据压缩编码方法,数据压缩的理论极限是信息熵。1.信息信息是用不确定的量度定义的,也就是说信息被假设为由一系列的随机变量所代表,它们往往用随机出现的符号来表示。2.信息量信息量指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。也可以说是辨别N个事件中特定事件所需提问“是”或“否”的最小次数。94第1章多媒体概述1.2.4数据压缩的基本原理21第1章多媒体概述1.2.4数据压缩的基本原理2.信息量例如:从64个数(1~64的整数)中选定某一个数,提问:“是否大于32?”,则不论回答是与否,都消去半数的可能事件,如此下去,只要问6次这类问题,就可以从64个数中选定一个数,则所需的信息量是
设从N中选定任一个数
的概率为
,假定任选一个数的概率都相等,即
,则信息量
可定义为:95第1章多媒体概述1.2.4数据压缩的基本原理22第1章多媒体概述1.2.4数据压缩的基本原理2.信息量当
,相应的信息量单位为比特(bit);当
,相应的信息量单位为奈特(Nat);当
,相应的信息量单位为哈特(Hart);96第1章多媒体概述1.2.4数据压缩的基本原理23第1章多媒体概述1.2.4数据压缩的基本原理3.信息熵
在信息论中称为信源的“熵”(Entropy),它的含义是信源发出任意一个随机变量的平均信息量。(1)当处于事件发生之前,
是不确定性的度量;(2)当处于事件发生之时,
是一种惊奇性的度量;(3)当处于事件发生之后,
是获得信息的度量;(4)还可以理解为是事件随机性的度量。97第1章多媒体概述1.2.4数据压缩的基本原理24第1章多媒体概述1.2.4数据压缩的基本原理4.最大离散熵定理
所有概率分布
所构成的熵,以等概率时为最大。5.熵的范围6.信息熵的最大值与熵值之间的差值,就是信源X所含的冗余度。98第1章多媒体概述1.2.4数据压缩的基本原理25第1章多媒体概述1.2.4数据压缩的基本原理7.香农编码定理在编码中用熵值衡量是否为最佳编码,熵值是平均码长的下限。若用
表示编码器输出的平均码长,则:(1)时,有冗余,不是最佳编码;(2)不可能发生,只能有
(3-1)(3)稍大于时
时,为最佳编码。(4)在论述平均码长在构成瞬时可解码的编码方式时,
香农指出应满足
(3-2)称式(3-1)和式(3-2)为香农编码定理。99第1章多媒体概述1.2.4数据压缩的基本原理26第1章多媒体概述1.2.5数据压缩编码的方法多媒体数据压缩方法根据不同的依据可产生不同的分类。第一种,根据质量有无损失可分为有损失编码和无损失编码。第二种,按照其作用域在空间域或频率域上分为:空间方法、变换方法和混合方法。第三种,根据是否自适应分为自适应性编码和非自适应性编码。100第1章多媒体概述1.2.5数据压缩编码的方法27第1章多媒体概述1.2.5数据压缩编码的方法1.预测编码(1)编码器记录与传输的不是样本的真实值,而是它与预测值的差。这一方法称为DPCM(differentialpulsecodemodulation)方法。(2)预测值由欲编码图像信号的过去信息决定。(3)通常采用线性预测,比例系数由其统计特性估计得到。(4)预测不仅可以在相邻像素值之间进行,而且可以在行与行之间进行。(5)由于空间相关性,真实值与预测值的差值变化范围远远小于真实值的变化范围,因而可以采用较少的位数来表示。101第1章多媒体概述1.2.5数据压缩编码的方法28第1章多媒体概述1.2.5数据压缩编码的方法2.变换编码(1)主要思想:利用图像块内像素值之间的相关性,把图像变换到一组新的基上,使得能量集中到少数几个变换系数上,通过存储这些系数而达到压缩的目的。(2)在变换编码中,由于对整幅图像进行变换的计算量太大,所以一般把原始图像分成许多个矩形区域子图像独立进行变换。(3)常用的变换方法KLT变换,DCT变换,WHT变换,DFT变换102第1章多媒体概述1.2.5数据压缩编码的方法29第1章多媒体概述1.2.5数据压缩编码的方法3.统计编码(1)Huffman编码对于出现频率大的符号用较少的位数来表示,而对出现频率小的符号用较多的位数来表示。其编码效率主要取决于需编码的符号出现的概率分布,越集中则压缩比越高。103第1章多媒体概述1.2.5数据压缩编码的方法30第1章多媒体概述1.2.5数据压缩编码的方法(2)算术编码每一符号对应[0,1)上的一子区间,区间长度为该符号出现的概率。该方法将被编码的符号串(数值串)表示成实数0到1之间的一个区间。初始把它设为整个区间[0,1)。当出现一个新的待编码符号,先把完整的[0,1)区间影射到上一次形成的区间,然后新区间取为[0,1)上新符号对应区间所映成的像。解码时,根据区间的覆盖性来逐一解出原符号串。算术编码的优点是可方便地使用自适应编码,可以根据当前接收的数据不断地更改概率模型。104第1章多媒体概述1.2.5数据压缩编码的方法31第1章多媒体概述1.2.5数据压缩编码的方法(3)游程编码游程编码实际上是一维信号的分段常数逼近,是一个相当简单的编码方法。编码器不断比较一维的相邻元素值的变化幅度,一旦发现有明显的变化,就称一个游程(run)开始了。编码器对每一个游程需要确定两种信息:游程的起点位置和该游程对应的信号值。由于游程是连续的,一个游程的终止是下一个游程的开始,所以游程的位置信息和信号值都可以用两种方式记录:差分方式和绝对数值方式。105第1章多媒体概述1.2.5数据压缩编码的方法32第1章多媒体概述1.2.5数据压缩编码的方法4.混合编码混合编码是指合并变换和预测技术的编码方法。通常有两种编码形式:第一种为在某一方向上进行酉变换(例如X方向),而在另一方向(例如Y方向)上用DPCM对变换系数进行预测编码。另一种形式是对动态图像而言,二维变换再加上时间方向上的DPCM预测。106第1章多媒体概述1.2.5数据压缩编码的方法33第1章多媒体概述1.2.6数据压缩标准及应用多媒体技术的关键技术之一是关于多媒体数据压缩(编码)和解压(解码)算法。为了解决不同厂家产品的兼容性问题,国际标准化协会ISO(InternationalStandardizationOrganization),国际电子学委员会IEC(InternationalElectronicsCommittee),国际电信协会ITU(InternationalTelecommunicationUnion)等国际组织于90年代领导制定了三个重要的多媒体国际标准:JPEG标准;H.261标准;MPEG标准。107第1章多媒体概述1.2.6数据压缩标准及应用34第1章多媒体概述1.2.6数据压缩标准及应用1.JPEG标准全称为“多灰度静态图像的数字压缩编码”,是用于静态图像压缩的国际标准。2.MPEG标准MPEG压缩标准用于数字卫星广播、高清晰电视、数字录象机以及网络环境下的电视点播(VOD)、DVD等各方面。目前已有MPEG-1、MPEG-2、MPEG-4等3个国际标准,正在完成的有2个:MPEG-7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 硅芯制备工安全宣贯测试考核试卷含答案
- 栲胶蒸发工岗前实操知识技能考核试卷含答案
- 油母页岩供料工岗前创新思维考核试卷含答案
- 2022-2023学年吉林省白山市普通高校对口单招综合素质自考真题(含答案及部分解析)
- 2025年本地网传输系统合作协议书
- 2025年原油加工量合作协议书
- 2025年LED超大屏幕显示器项目发展计划
- 三级安全教育考试卷(附答案)
- 医院检验科年度工作总结及计划
- 2026营养师基础知识试题及答案
- 中华医学会麻醉学分会困难气道管理指南
- 医务部会议管理制度范本
- 绘本制作培训课件
- 客户分配管理办法管理
- 燃气入户安检培训
- 高中地理思政融合课《全球气候变暖》
- 《山东省市政工程消耗量定额》2016版交底培训资料
- 《中医六经辨证》课件
- 挂名合同协议书
- 苏教版高中化学必修二知识点
- 2024年国家公务员考试国考中国人民银行结构化面试真题试题试卷及答案解析
评论
0/150
提交评论