多媒体数据库ppt讲解ppt课件_第1页
多媒体数据库ppt讲解ppt课件_第2页
多媒体数据库ppt讲解ppt课件_第3页
多媒体数据库ppt讲解ppt课件_第4页
多媒体数据库ppt讲解ppt课件_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/3/26,1,多媒体数据库,2,概述,多媒体数据库,1,多媒体数据库系统,2,多媒体数据库的数据模型,3,多媒体数据库系统的同步机制,4,多媒体数据压缩技术,5,6,多媒体数据压缩常用的标准,3,一、概述,1.1多媒体数据与多媒体数据管理 字符数据:同关系数据库中的字符数据。多媒体数据库仍然需要对其进行管理。 文本数据:书籍、文献、档案等。 声音数据:音乐、语音等。 图形数据:GIS/CAD等。通常是用符号或特定的数据结构表示的。 图像数据:照片、图片等。指位图式图像。 视频数据:引入了时间属性,在时间空间上进行管理 只包含某种媒体的数据称为单媒体。单媒体可以看作是特殊的多媒体。 多媒体数据可以分为两大类: (1)离散型多媒体数据。如:文本数据、图像数据和图形数据。 (2)连续型多媒体数据。如:音频数据、视频数据。,4,1.1多媒体数据与多媒体数据管理,5,1.1多媒体数据与多媒体数据管理,8,4特殊的用户接口及操作 对于声音、影视数据,除了需要提供一般数据都有的增、删、改和查询等操作外,还需要提供与媒体有关的接口和操作,例如演播、倒退、快进,按内容、序号或时间选播等接口和操作。,9,1.1多媒体数据与多媒体数据管理,多媒体数据带来的问题: 数据量大 媒体种类多 多解查寻(非精确匹配/相似性查询) 用户接口的支持(操作与表示技术。不同的媒体与数据库有不同的交互接口。每种媒体均有自己存取和表现方法,用户对同一种媒体可能有不同的表现要求,如不同图像尺寸,不同的播放帧率) 服务质量的要求(及时、逼真或满意) 版本控制问题(版本控制的作用是为了解决在一个持续性数据对象被一个应用程序修改时,其它应用要使用修改前的数据对象所产生的矛盾。多媒体数据优于数据量大,以及媒体的复合性,对版本管理提出了新问题),10,1.2多媒体数据库,多媒体数据库是存储多种媒体的数据库,不仅包含数字、字符等类型数据构成的结构化数据,还包括文本、图形、图像、视频、音频等非结构化数据。 多媒体数据库体系结构 多媒体数据库的一般结构形式: 组合型 集中统一型 客户/服务器型 超媒体型,11,组合型结构,12,组合型结构 每一种媒体的数据库都有自己独立的数据库管理系统:每一种媒体数据库的设计不必考虑与其他媒体的匹配和协调。用户既可以对单一媒体数据库进行访问,也可以对多个媒体的数据库进行访问。 用户有灵活性 对多个媒体数据库的联合操作等都比较难以实现,用户的应用程序设计相对复杂,13,集中统一型结构,14,集中统一型结构 单一的多媒体数据库和单一的多媒体数据库管理系统: 各种媒体被统一地建模 对各种媒体的管理与操纵被集中到一个数据库管理系统之中 多媒体的查询检索结果可以统一地表现 实际上,这种多媒体数据库系统是很难实现的,目前还没有一个比较恰当而且效率比较高的方法来管理所有的多媒体数据。面向对象方法为建立这样的系统带来了一线曙光,15,客户/服务型结构,16,客户/服务型结构 各种单媒体数据仍然相对独立 系统将每一种媒体的管理与操纵各用一个服务器来实现 所有服务器的综合和操作也用一个服务器完成 与用户的接口采用客户进程实现 客户与服务器之间通过特定的中件系统连接 这种体系结构必须采用标准化的和开放的接口界面,否则,对多种媒体的联合操作、合成处理和概念查询等都比较难以实现,17,超媒体型结构 强调对数据时空索引的组织。依据如下: 数据库分散在网络上(信息空间) 没有必要建立一个统一多媒体数据库系统 能够通过超链建立起各种数据的时空关系 目前的WWW使我们看到了这种数据库的雏形,18,多媒体数据库的层次结构 传统数据库的层次结构 对抽象化的字符和数值进行比较、排序、查找和增删改等操作,19,多媒体数据库的层次结构,20,多媒体数据库的层次 最高层支持多媒体的综合表现和用户的查询描述: 多媒体用户接口层:完成查询描述和结果描述 中间层增加对多媒体数据的关联和超链的处理。(建立数据模型) 概念数据模型层:对现实世界用多媒体数据信息进行的描述。为上层的用户接口、下层的多媒体数据存储和存取建立起一个在逻辑上统一的通道。 存取与存储数据模型层:通过存取与存储数据模型,描述媒体数据的逻辑位置安排、相互的内容关联、特征与数据的关系以及超链的建立等。完成多媒体数据的逻辑存储与存取 底层增加对多媒体数据的控制与支持: 媒体支持层:建立在多媒体操作系统之上,对不同性质媒体分别进行相应的分割、识别、变换等操作。,21,多媒体数据库的特点 多媒体数据库与传统数据库的不同特征:,22,多媒体数据库管理系统(MMDBMS),多媒体数据库由于其管理数据的特殊性,其系统要复杂的多。对于多媒体数据库到底应该具有哪些功能,还没有一个统一的标准,但从实际考虑应该具备如下基本功能: 系统应能够有效地表示多媒体数据 系统应能够处理多媒体数据,正确识别和表现多媒体数据的特征,多媒体时间或空间的关联 多媒体数据库应该提供传统数据库可以实现的搜索、浏览、删除等操作,同时多媒体数据库还应该提供针对各种媒体的特殊操作。 多媒体数据库管理系统应该具有开放的功能,能够通过多媒体数据的接口编写自己的应用程序。此外,系统还应该提供特种事务处理和版本管理功能。,23,多媒体数据库管理系统的的查询方式,多媒体数据管理系统是一个以多媒体数据库为基础的多媒体应用。该应用能够完成对多媒体数据库的各种操作及管理功能,如对MMDB的定义、创建、访问、删除等。 MMDBMS的查询方式针对多媒体应用的灵活性,人们希望MMDBMS能够提供多种方式的“模糊”查询手段,具体描述如下: 基于元数据的查询 基于注释的查询 基于特征的查询 用实例查询,24,基于元数据的查询 元数据在这里是指数据库条目的外在属性。比如作者姓名、创建时间以及标题等。在VOD(视频点播)应用中,这种方式的查询可以是:“请列出由XXX在2012年出息的重要会议”这种类型的查询可以用传统的DBMS技术来实现。 基于注释的查询 注释是指对数据库条目内容的文字描述。查询时一般给出关键字或一些自由文本,而检索是基于查询与内容注释的相似性。这种方式的查询可以是:“请放映一下2008年北京奥运会开幕时的视频片段。”这种类型的查询要求事先对所有数据库条目都恰当地进行注释,然后用传统的IR技术进行处理。视频数据、脚本和字母均可作为注释。,25,基于特征的查询 特征是多媒体数据的统计信息。如音量、颜色分布及纹理等。这种方式的查询实例可以是:“请放映一个音量分贝在XX至XX的视频帧。”处理这类查询,传统的DBMS已无能为力了,数据库条目的有关统计信息事先手机、整理并存储。 用实例查询 用多媒体数据对象来进行查询,这个对象可以是一个静止的图像、一张草图或一个声音片段。这种类型的查询中如果包含有数据对象的空间和时间关系,处理时可能会非常复杂,要支持这么多种复杂的查询方式,多媒体数据库引擎需要有全新的体系结构。,26,多媒体数据库管系统的体系结构,根据前面描述的MMDBMS所支持的查询方式,给出下图所示MMDBMS的体系结构:,27,多媒体数据库管系统的体系结构,用户图形接口 MMDBMS的用户接口可以通过Internet或图形界面访问。这个用户接口支持用户用图形方式进行基于内容的查询,同时也支持传统的文本查询方式。 索引子系统 索引子系统以多媒体数据及相关文本注释作为输入,通过数据分析子系统,提取低层多媒体特征信息(如颜色、纹理、形状等),加上一些重要的文本买哦书信息(如作者姓名、类属、主题等),并将这些内容存储在特征数据库中。,28,数据分析子系统 数据分析子系统的功能是提取重要的低层多媒体数据特征,如音量、颜色、纹理、形状等。 特征数据库 特征数据库中的条目内容包括低层特征数据以及高层的文字描述数据。,29,查询处理器 查询处理器从图形用户界面接受查询语言,通过特征数据库进行计算评估,然后向用户返回匹配最好的多媒体数据。这里所指的查询语言必须能利用低层特征数据及文字描述来表达复杂的查询方式,传统的SQL肯定不能胜任。 存储子系统 存储子系统完成对文本、图像、音频、视频等数据库数据的定义、创建、查询、访问、删除等管理功能与操作。,30,多媒体数据模型,常用的三种多媒体数据模型 三种多媒体数据库的数据模型: 扩充的关系模型(NF2 数据模型) 面向对象数据模型 对象-关系模型 超文本数据模型,31,多媒体数据模型,NF2 (Non First Normal Form)数据模型 对关系数据库的要求: 第一范式(1NF) 在关系模式R中的每一个具体关系r中,如果每个属性值 都是不可再分的最小数据单位,则称R是第一范式的关系。(不允许表中表) 多媒体数据库: NF2 (Non First Normal Form)数据模型 在关系模型的基础上通过扩展来提高关系数据库处理多媒体数据的能力-打破关系数据库中关于1NF的要求,允许在表中可以有表。,32,例如:给人员档案添加人员的照片、声音,33,NF2 数据模型实现的主要手段是在关系数据库中引入抽象数据类型,使得用户能够定义和表示多媒体信息对象。对大多数关系数据库来说都采用的方法是利用标准的扩展字段,例如: Fox pro的通用General字段;Paradox for windows 的动态注释,格式注释,图形,BLOB(大二进制对象 Binary Large Object )等 特点: 建立在关系数据基础之上,比较容易实现 建成模能力不强(在定义抽象数据模型,反映多媒体数据各成分间的空间关系、时间关系和媒体对象的处理方法仍有困难) 特殊媒体的基于内容查询、存储效率实现较难,34,面向对象模型 面向对象的方法最适合描述复杂对象,通过引入封装、继承、对象、类等概念,用面向对象观点来描述实体的逻辑组织、对象间限制、联系等。 但面向对象数据模型尚未形成统一标准,实现技术还不够成熟。,35,对象-关系模型 对象-关系模型结合了面向对象和关系模型的特点,允许用户定义新的数据类型和操作,可以定义抽象数据类型表示具有内部结构的复杂的多媒体数据以提供对复杂对象的描述,用户自定义函数为操作不同媒体类型的数据提供了方便。 同时对象-关系模型又可以利用关系数据库技术提供对数据的存取管理功能,是目前多媒体系统可采用的一种实用的和有效的数据模型。,36,超文本数据模型 超文本是一种由结点以及结点之间的关系链构成网状结构的信息管理技术。其中超文本结点是信息的基本单位,它可以是文本,也可以是图形、图像或声音等;关系链描述了数据间的各种语义和组织结构上的联系,把结点链接成网状结构。 超文本数据模型的常用操作包括编辑和浏览等。 编辑不仅指对节点信息的编辑,还包括对网络中节点和链的创建、修改和删除。 浏览则是指用户在超文本中网络中能够快速定位,查询所需信息。由于超文本在逻辑上采用了与一般文本有本质的非线性结构,其每个节点的一个起始链和多个目标链分别指明了上个结点和下一个需检索的结点,从而可以实现快速浏览。,37,根据所支持的任务不同,采用超文本数据模型的系统有多种结构。典型的超文本系统由编辑器、超文本库和浏览器组成。 编辑器实现对文本、图形、图像、声音等对象实体的编辑及登录。 超文本库包括超索引和对象库两部分,超索引为对象库的索引文件,对象库存放多媒体对象实体信息。 浏览器是一个基于窗口和菜单的三维视图显示系统。 从本质上看,超文本数据模型等价于一种语义网络加上浏览机制,只要是用于教学、信息查询、图书情报检索或问题探索等只读型应用系统。,38,多媒体数据库与传统数据库的区别,1.所管理的数据类型不同 2.数据库体系结构不同 3.检索方法不同,39,多媒体数据库的应用,多媒体数据库目前已经广泛应用于许多领域中,例如办公自动化、信息系统、教育、CAD、CAM和医疗等应用中都涉及大量的文本、图形、图像、声音等多媒体数据;还有犯罪现场录像,犯罪嫌疑人相片、声音和指纹信息的犯罪嫌疑反跟踪系统等。,40,多媒体数据库系统的同步机制,同步是一个与时间相关的概念,多媒体系统中的同步主要指各媒体对象间的时序关系,广义的多媒体同步包括媒体对象之间的内容、空间、时间关系。,41,一般的多媒体应用系统中,一个节点实例本身可能包含多个媒体数据,由于动态数据的引入,不可避免地要考虑各个媒体数据在时间上的相互依赖关系。例如对一段录像进行记录时,不仅需要记录其中一系列的视频数据和音频数据,同时还需要考虑两者之间的时序关系(图1)。 例如:在一个餐饮服务系统中,有一项介绍菜肴的服务,对每一道菜的介绍内容包括有关该菜肴的图片以及对菜肴的文字介绍和语音讲解,在时序上要求同时显示图片和文字,再进行语音,形成下图的时序关系(图2) :,多媒体数据库系统的同步机制,42,动态类型同步和混合类型同步,在展示动态类型和混合类型的媒体时, 必须考虑媒体内部及媒体之间在时间上的同步关系。媒体对象间的同步包括时间相关和时间无关的媒体对象之间的同步。,43,多媒体同步类型(按照涉及对象分类),44,多媒体同步模型,由于多媒体同步涉及对象的复杂性以及同步类型的多样性, 建立统一的同步模型来描述多媒体的同步机制是十分困难的。通常的做法是根据不同的需求选择采用不同的同步模型, 而且在该模型中尽量改善模型的描述能力, 吸收其它模型的优点, 提高模型的通用性。下面给出几种在分布环境下的多媒体同步模型及其适用范围。,45,基于缓冲的多媒体同步模型,基于缓冲的多媒体同步模型主要适用于单一媒体的同步控制。其基本思想是:将多媒体数据流划分成若干个数据块, 通过设置传输缓冲区, 并根据网络传输和主机处理的延迟确定缓冲区管理机制。在媒体数据传输较快时, 将超前的数据先存于缓冲区中;而在媒体数据传输较慢时,从缓冲区中取数据, 从而实现连续媒体流数据的平滑、稳定播放, 使各数据块严格按规定的时序约束展示。 例如, 设Video 媒体的录制速率为30 帧/ 秒, 则其播放速率必须相同才能达到播放效果。为此, 需根据网络传输特性确定缓冲区的大小、各数据块的发送时间和预取数据块的个数, 以保证该连续媒体的平滑播放。,46,基于反馈的多媒体同步模型,基于反馈的同步模型也是一种用于单个媒体同步控制的方法。其基本思想是: 将多媒体数据流划分成若干个数据块, 通过把已到达的媒体数据块的有关信息反馈到发送方, 发送方接收到反馈信息后根据一定的原理和算法, 确定将要传输的数据块, 以此来控制数据的稳定传送。,发送,反馈,47,基于时标的多媒体同步模型,基于时标的多媒体同步模型可适用于描述在网络环境下多种媒体间及媒体内的同步关系。其基本思想是: 在多媒体数据生成过程中,为数据流中的数据块赋予时标, 具有相同时标的多媒体对象必须保持同步。 在网络环境下, 存储在文件服务器上的多媒体对象的各个组成部分是由位于网络不同地点的信息源在不同的时间产生的。由于没有全局同步时钟, 需要引入统一的相对时间系统, 并在该系统中设置多媒体对象的时标。相对时间系统可以选用时间轴同步模型或参考点同步模型。 时间轴同步模型:如果采用时间轴同步模型, 则各媒体对象均彼此独立地依赖于同一时间轴, 它适合于起始时间点固定的多媒体对象, 但不适合于由于人机交互而导致起始时间点不定的场合;,48,基于时标的多媒体同步模型,参考点同步模型:如果采用参考点同步模型, 则是将连续媒体视为由离散的子单元构成的序列, 起始处的媒体单元位于时间系统的零点, 一个媒体单元在相对时间系统中的位置称为一个参考点, 其相对时间即为时标, 不同媒体对象之间的同步通过将其在同一时刻的媒体单元相连接来进行控制。 在具体实现时, 一般选定主设备对时标进行驱动。主设备上的第一个媒体单元被赋予启动时标, 以后的媒体单元被赋予时标递增。当文件服务器从不同的设备接收到媒体单元时, 首先判定这些媒体单元是否位于一个有界的时间窗口内。如果是, 则这些媒体单元被赋予相同的时标, 并要求播放时同步,这些媒体单元组成的集合称为同步集合。在播放时, 同步控制机制采用了反馈法, 即由播放设备定时向文件服务器发送一个包含有媒体单元时标的反馈信息, 文件服务器据此进行同步控制。,49,基于时间片的多媒体同步模型,时间片是由某一时间单位表示的非零时间段, 定义为两个时刻构成的二元组 T1, T2 。基本的多媒体对象可以用基本时间片来表示, 它开始于一个起始点,结束于一个终止点,在起始点和结束点之间与其它多媒体对象没有同步关系; 而复合的多媒体对象是由基本的多媒体对象组合而成, 它可以分解后分步展示, 也可以用组合时间片来表示。 对于任意给定的的两个时间片, 它们之间基本的时间同步关系有七种: before( 先于) 、meets( 衔接) 、overlaps( 重叠) 、during( 包含于)、starts(同始)、ends( 同终)、equals( 等于) , 此外还有前六种关系的逆关系: before- 1、meets- 1、overlaps- 1、during- 1、starts- 1、ends- 1。,50,基于时间片的多媒体同步模型,图1给出了七种基本的时间同步关系的示意图, 其中A 和B 为给定的两个时间片。,A,B,A,B,A,B,B,A,A,B,B,A,A,B,A before B,A meets B,A overlaps B,A during B,A starts B,A ends B,A equals B,图1,51,多媒体同步机制的实现,图2给出在分布式环境下一种实现多媒体同步控制方法的基本思想, 该同步机制采用了时标法,其中还综合使用了缓冲、反馈和中断等技术。网络的拓朴结构如下图所示。其中:FS 为文件服务器,Si ( i = 1, 2, , n) 为工作站,它们分别是产生媒体单元mi ( i = 1, 2, ,n ) 的源; ti为媒体单元mi 在源Si 产生的时间, ri 为媒体单元mi 到达FS的时间; min、max 分别为网络通信的最小和最大延迟。,图2,52,多媒体同步机制的实现,实现多媒体同步控制方法的基本思想如下: (1)媒体单元的存放 在文件服务器FS上开辟n 个缓冲队列, 用来存放借助于网络通信协议从n 个主/从设备传输来的媒体单元。 (2)时标RTS 的计算 设主设备为Sk ,从设备为Sj ,Sj S1, S2, , Sn - Sk ;mk 和mj 分别为由Sk 和Sj 产生的媒体单元,mk 和mj 的最早和最晚产生时间分别记为Tek (mk ) 、T lk (mk ) 、Tej(mj ) 、Tlj(mj ) ,则: T ek(mk ) = rk - max Tlk (mk ) = rk - min T ej(mj ) = rj - max T lj( mj ) = rj - min 设为指定的媒体单元间最大允许的非同步区间, 若max Tlk(mk)-Tej(mj),Tlj(mj)-Tek(mk) ,则mk和mj属于同一同步集合,这些媒体单元应赋予相同的时标RTS,播放时要求同步。,53,多媒体同步机制的实现,(3)时标RTS 的赋予 文件服务器FS以中断方式实时地接收源站点产生的媒体单元信息, 按上述方法计算其RTS ,并将RTS赋予媒体单元, 进入相应的缓冲队列,RTS 值的自动递增。 (4)媒体单元的播放 文件服务器主程序根据缓冲队列的队首信息, 比较其RTS , 对于具有相同RTS 的媒体单元同时出队列并发送到播放设备; 否则, 选择具有最小RTS 的媒体单元出队列并发送到播放设备, 其处理流程如图3 所示。 (5)反馈信息 播放设备在播放时, 定期向文件服务器FS发送反馈信息, 其中包含正播放的媒体单元的RTS 。文件服务器主程序以中断方式接收反馈信息, 并据此调整设备队列中的媒体单元, 以保持由RTS 描述的媒体单元间的同步关系。,54,多媒体同步机制的实现,图3给出了在分布式环境下文件服务器主程序的处理流程:,图3,55,多媒体数据压缩技术,多媒体数据库系统的核心任务是实时地综合处理图、文、声信息。数字化的图像、声音信号数据流庞大,要实时地处理、传输和存储这些数据必须进行压缩和解压缩技术。因此,数据压缩和解压缩技术是实现多媒体数据库系统的关键技术。 多媒体数据为什么要压缩 数据量大 存在着大量的信息冗余 分辨率为640*480的NTSC制式全彩色, 每分钟的数据量大约为 1.6GB,56,多媒体数据压缩技术,数据压缩的必要性 数据通信 数据存储 ,24 Bit Bitmap (193k),JPEG (10k),57,多媒体数据压缩技术,多媒体数据之所以能够进行压缩是因为原始信源数据存在以下几种形式的冗余: (1)空间冗余是静态图像中存在的最主要的一种数据冗余。同一景物表面上采样点的颜色之间往往存在着空间连贯性,但是基于离散像素采样来表示物体颜色的方式通常没有利用这种连贯性。例如:图像中有一片连续的区域,其像素为相同的颜色,空间冗余产生。 (2)时间冗余是序列图像中经常包含的冗余。一组连续的画面之间往往存在着时间和空间的相关性,但是基于离散时间采样来表示运动图像的方式通常没有利用这种连贯性。例如:房间里的两个人在聊天,在这个聊天的过程中,背景(房间和家具)一直是相同的,同时也没有移动,而且是同样的两个人在聊天,只有动作和位置的变化。如下图,两幅图背景相同,动作不同。,58,多媒体数据压缩技术,(3)结构冗余是在某些场景中,存在着明显的图像分布模式,这种分布模式称作结构。图像中重复出现或相近的纹理结构例如:方格状的地板,蜂窝,砖墙,草席等图结构上存在冗余。 (4)视觉冗余是人类的视觉系统对于图像场的任何变化(亮度或色度变化等)并不是都能感知的。例如:对于图像的编码和解码处理时,由于压缩或量比截断引入了噪声而使图像发生了一系列变化,如果这些变化不能为视觉所感知,则认为图像足够好。这类冗余称为视觉冗余。 (5)编码冗余是指频率相差很大的像素使用相同长度的代码进行编码。 (6)听觉冗余是指人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注。,59,多媒体数据压缩技术,考虑因素 不能失真 磁盘文件 。 允许失真 在不影响“质量”的情况下,ABCAACBBC,#$%&*,数据还原,ABCAACBBC,压缩编码,24 bit (193k),256 color (66k),60,多媒体数据压缩技术,根据解码后数据与原始数据是否完全一致进行分类,数据压缩方法一般可划分为两类: 无损压缩(Lossless Compression)是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同,压缩比大约在2:15:1之间。如Huffman编码、算术编码等: 有损压缩(Lossy Compression)是指还原图像与原始图像存在一定的误差,但视觉效果一般可以接受,压缩比可以从几倍到上千倍来调节。常用的有变换编码和预测编码。 有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。例如,图像和声音的压缩就可以采用有损压缩,因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。,61,多媒体数据压缩技术,无损压缩:Huffman编码 Huffman编码原理:在变长编码中,对出现概率大的信源符号赋予短码字,而对于出现概率小的信源符号赋予长码字。如果码字长度严格按照所对应符号出现概率大小的逆序排列,则编码结果平均码字长度一定小于任何其它排列方式。对一组信源符号进行编码的步骤如下: (1)将信源符号按概率递减顺序排列; (2)把两个最小的概率加起来作为新符号的概率,并按(1)重排; (3)重复步骤、,直到概率和达到1为止; (4)在每次合并消息时,将被合并的消息赋以“1”和“0”; (5)寻找从每一信源符号到概率为1处的路径,记录路径上的“1”和“0”; (6)对每一符号写出“1”、“0”序列(从码树的右边到左边),即为Huffman编码。,62,多媒体数据压缩技术,Huffman 编码,63,多媒体数据压缩技术,根据上图建立Huffman树,一开始把所有的符号都当成树的叶子节点,然后从概率最小的两个节点开始,合并生成新节点,对新节点和剩余的叶子节点再重复这一过程,直到所有符号可用一单个节点表示为止,结果如下图,64,多媒体数据压缩技术,根据Huffman树为每个符号产生一个二进制值,在赋值时把左边分支用数字“0”代替,右边分支用数字“1”代替,按自顶向下的顺序对每个符号节点赋值,如下表所示:,(注:第一行的短语表示的是一首歌中的单词,概率表示其出现的次数的比例。),65,多媒体数据压缩技术,差值脉冲编码调制法(DPCM) DPCM 的基本原理是基于图像中相邻像素之间具有较强的相关性。每个像素可通过以前已知的几个像素来做预测。因此在DPCM中,编码想传输的并不是像素采样值本身,而是这个采样值的预测值与其实际值之间的差值。 一幅二维静止图像,设空间坐标 (i,j)像素点的实际样本为f(i,j), 是预测器根据传输的相邻的样本值对该点估算得到的预测值。编码时不是对每个样本值进行量化,而是预测下一个样本值后,量化实际值与预测值之间的差。计算预测值的参考像素,可以是同一行扫描行的前几个像素,这种预测叫一维预测;也可以是本行、前一行或者前几行的像素,这种预测叫二维预测;除此之外,甚至还可以是前几帧图像的像素,这种预测就是三维预测。一维预测和二维预测属于帧内预测,三维预测则属于帧间预测。实际值和预测值之间的差值用以下式表示: e(i,j)= f(i,j)-,66,多媒体数据压缩技术,将差值e(i,j)定义为预测误差,由于图像像素之间有极强的相关性,所以这个预测误差是很小的。编码时不是对像素点的实际灰度f(i,j)进行编码,而是对预测误差信号 e(i,j)进行量化、编码、发送,由此而得名为差值脉冲编码调制法,简写DPCM。 DPCM预测编、解码的原理图如下:,67,多媒体数据压缩技术,DPCM系统包括发送端、接收端和信道传输3个部分。发送端由编码器、量化器、预测器和加减法器组成;接收端包括解码器和预测器等。DPCM系统的结构简单,容易用硬件实现。 预测编码的步骤: f (i,j)与发送端预测器产生的预测值 相减得到预测误差 e(i,j); e(i,j)经量化器量化后变为 e(i,j),同时引起量化误差。 e(i,j) 再经过编码器编成码字发送,同时又将e(i,j)加上 恢复输入信号 f(i,j) 。因存在量化误差,所以 f(i,j) f(i,j),但相当接近。发送端的预测器及其环路作为发送端本地解码器。 发送端预测器带有存储器,它把 f(i,j) 存储起来以供对后面的像素进行预测。 继续输入下一像素,重复上述过程。,68,多媒体数据压缩技术,预测编码方法的特点 算法简单、速度快、易于硬件实现。 编码压缩比不太高,DPCM一般压缩到24bit/s。 误码易于扩散,抗干扰能力差。,69,多媒体数据压缩的常用标准,JPEG标准,MPEG标准,CCITT H.261标准,在多媒体数据库系统中常用以下三个压缩标准:,70,多媒体数据压缩的常用标准,JPEG标准 JPEG标准是由ISO和CCITT联合制定的静态连续色调图像压缩标准,适用于连续色调静止图像的压缩标准。 MPEG标准 MPEG标准是适用于连续色调活动图像及其伴音的数据压缩标准。 CCITT H.261标准 CCITT H.261标准是一种视频压缩编码标准,适用于可视会议和会议电视等应用系统中的压缩。,71,多媒体数据压缩的常用标准,JPEG标准 该标准可满足连续色调静态图像数据压缩实际应用的需求,其目标是: (1)应用先进的图像压缩技术,在保障压缩率的同时,失真程度控制在一定范围之内; (2)适用于所有的连续色调图像,不对图像的特性进行限制; (3)具有适中的计算复杂度; (4)具有顺序编码、累进编码、无失真编码等操作模式。 JPEG是基于ADCT的,但也融合了Huffman编码、算术编码和预测编码等方法,是一种混合编码系统。其中,基于ADCT的编码和解码过程虽然有失真,但却能获得较高的压缩比,且重构的图像与源图像的视觉效果甚为接近。提供Hu

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论