多媒体第一章教材_第1页
多媒体第一章教材_第2页
多媒体第一章教材_第3页
多媒体第一章教材_第4页
多媒体第一章教材_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多媒体通信技术

吴华怡2016-2-29wuhuayi@参考书1、多媒体通信技术基础/蔡安妮等编著,第三版,电子工业出版社,2012

2、多媒体通信/徐作庭,李来胜编著,人民邮电出版社,2011.

绪论——2013年8月16日,国务院发布《关于促进信息消费扩大内需的若干意见》——2014年3月,李克强总理在政府工作报告中进一步明确“把消费作为扩大内需的主要着眼点,扩大服务消费,促进信息消费”。——2015年3月,李克强总理在政府工作报告中指出:制定“互联网+”行动计划,推动移动互联网、云计算、大数据、物联网等与现代制造业结合,促进电子商务、工业互联网和互联网金融健康发展,引导互联网企业拓展国际市场。2012通信行业分析报告预测一、通信行业将进入稳步增长期预测二、把握终端制造链和内容应用链的投资机遇预测三、行业拐点将至,关注电信联通2014通信行业分析报告未来趋势:一、4G正处于建设高峰期二、运营商面临巨大考验虚拟运营商、国家基站公司、电信业“营改增”2015年12月25日,中国信息通信研究院在北京召开“ICT深度观察大型报告会暨白皮书发布会”,公开汇报年度重大研究成果,“中国信息通信行业2015年十大热点及2016年十大趋势”正式发布。

“信息通信领域2015年十大热点”,分别是:“互联网+”拓展网络经济新空间,打造经济发展新动能;“提速降费”成为宽带网络发展的重要主题;分享经济构建移动互联网时代的新型商业模式;4.5G继续增强并横向拓展,5G国际标准化拉开序幕;云计算发展进入2.0时代;应用基础设施重塑网络体系架构;

“中国制造2025”,工业互联网是其关键基础设施;智能终端产业进入手机升级和硬件创新双重驱动时代;网络安全立法全面推进,构筑我国网络空间制度根基;国际“网络中立”立法取得重大进展,欧美政策导向不同。“信息通信领域2016年十大趋势”,分别是:信息通信服务业收入突破2万亿元,历史性转折初现;固定宽带全面迈入高速光网时代;4G浪潮加速推进,为5G新纪元筑基;互联网网络架构优化变革,转型交换中心;SDN/NFV从数据中心走向广域网;物联网迈向2.0时代,全球生态系统加速构建;工业互联网引领全球新产业变革;人工智能步入快车道,孕育改变未来;“互联网+”安全重要性凸显,安全防御技术智能化演进;“互联网+”大融合大变革,重塑监管制度。第一章多媒体通信技术概述第二章音频技术基础第三章图像技术基础第四章视频信息压缩与处理第五章多媒体通信系统中的关键技术第六章多媒体通信网络技术第七章多媒体数据的分布式处理第八章多媒体通信应用系统主要内容第一章多媒体通信技术概述1.1多媒体技术的概念1.2多媒体通信系统的概念及主要特征1.3多媒体通信中的关键技术1.4多媒体通信的应用1.5多媒体通信技术的发展趋势1.1多媒体通信的基本概念1.媒体

“媒体”是指信息传递和存储的最基本的技术和手段,即信息的载体。——多媒体与媒体Multi+Media=Multimedia——传统的四大媒体电视、广播、报纸、网站从出现的先后顺序来划分,报纸刊物应为第一媒体,广播应为第二媒体,电视应为第三媒体,互联网则应被称为第四媒体,移动网络应为第五媒体什么是媒体?

媒体(Medium)在计算机领域中有两种含义,一是指用以存储信息的实体,如磁盘、磁带、光盘和半导体存储器;一是指信息的载体,如数字、文字、声音、图形图像和视频等。多媒体数据的多通道异步输入过程媒体的定义和分类国际电话电报咨询委员会CCITT(ConsultativeCommitteeonInternationalTelephoneandTelegraph,国际电信联盟ITU的一个分会)把媒体分成如下5类:

感觉媒体(PerceptionMedium)

表示媒体(RepresentationMedium)

显示媒体(PresentationMedium)

存储媒体(StorageMedium)

传输媒体(TransmissionMedium)几种媒体的关系CPUOutputDeviceStorageInputDevice表示媒体存储媒体显示媒体显示媒体感觉媒体感觉媒体表示媒体传输媒体 (1)感觉媒体(perceptionmedium) 感觉媒体是指人类通过其感觉器官,如听觉、视觉、嗅觉、味觉和触觉器官等直接产生感觉(感知信息内容)的一类媒体,包括:声音、文字、图像、气味、冷热等。 (2)表示媒体(representationmedium)

表示媒体是指用于数据交换的编码表示,包括:图像编码、文本编码、声音编码等。其目的是为了能有效地加工、处理、存储和传输感觉媒体。 (3)显示媒体(presentationmedium) 显示媒体是指进行信息输入和输出的媒体。输入媒体包括:链盘、鼠标、摄像头、话筒、扫描仪、触摸屏等,输出媒体包括:显示屏、打印机、扬声器等。

(4)存储媒体(storagemedium) 存储媒体是指进行信息存储的媒体。包括:硬盘、光盘、软盘、磁带、ROM、RAM等。 (5)传输媒体(transmissionmedium) 传输媒体是指承载信息,将信息进行传输的媒体。包括:双绞线、同轴电缆、光缆、无线电链路等。 在多媒体技术中的“多媒体”通常是指感觉媒体的组合,即声音、文字、图像、数据等各种媒体的组合。

2.多媒体(Multimedia)

“多媒体技术”的定义:所谓多媒体技术就是计算机交互式综合处理多媒体媒体信息——文本、图形、图像和声音,使多种信息建立逻辑连接,集成为一个系统并具有交互性。简而言之,多媒体技术就是计算机综合处理声、文、图信息的技术,具有集成性、实时性和交互性的特点。

多媒体技术最简单的表现形式就是多媒体计算机。多媒体计算机相对于普通计算机的一个根本不同点在于在多媒体计算机中增加了对活动图像(包括伴音在内)的处理、存储和显示的能力,其硬件配以声卡、视频采集卡等。其主要特征体现在它能够有效地对电视图像数据进行实时的压缩和解压缩,并能够使在时间上有相关性的多种媒体保持同步。多媒体的定义“多媒体”译自20世纪80年代初产生的英文词“multimedia”,最早出现于美国麻省理工学院(MIT)递交给国防部的一个项目计划报告中。

多媒体是指信息表示媒体的多样化,常见的多媒体有文字、图形、图像、声音、音乐、视频、动画等多种形式。

多媒体技术是利用计算机技术把文本、声音、视频、动画、图形和图像等多种媒体进行综合处理,使多种信息之间建立逻辑连接,集成为一个完整的系统。

多媒体技术单一媒体:文本声音视频动画图形图像…集成的多媒体系统综合处理各种媒体,建立信息间的逻辑链接多媒体计算机技术及其发展历史1941~1945美国政府为了准确计算导弹的弹道,秘密地进行全电子计算机PX计划的开发

1945美国罗斯福总统的科学顾问Bush(1894~1974)在《大西洋月刊》上发表的“Aswemaythink”的著名论文,提出了采用设备或技术来帮助科学家检索、记录、分析及传输各种信息的新思路和名为“Memex”的一种工作站构想,影响着一大批最著名计算机科学家

1946美国宾夕法尼亚大学电机工程系科学家研制超过首部电子计算机ENIAC(ElectronicNumericalIntegratorAndComputer),它采用18000个电子管,体积达3000ft3

1947发明晶体管,为计算机的微型化打通道路1951美国RemingtonRand公司首次使用磁带来存储IBM商用计算机的资料,这种磁带一直使用到20世纪60年代初期1959

发明集成电路1960-1970

美国空军研究部门与IBM合作,研究中文处理方法,耗资6000多万美元,但没有成功1963

美国麻省理工学院Sutherland开创了计算机图形学的新领域,并获1988年ACM图灵奖。他还在1968年开发了头盔式立体显示器,奠定了现代虚拟现实技术的重要基础多媒体计算机技术及其发展历史1963

美国斯坦福研究所的Engelbart发明了鼠标,当时它的外壳是用木头做的。1968年12月9日,鼠标的使用在旧金山一次计算机展上得以示范;其后,施乐在其操作系统中加入了鼠标操作的设计1965

TedNelson提出Hypertext概念,它日后成为WWW的理论基础1968

GordonMoore、RobertNoyce和葛罗夫成立Intel公司。“Intel”这个字是由“IntegratedElectronics”(集成电子)两个英文单词组合成的1969-05-01

AMD公司成立多媒体计算机技术及其发展历史1971-11-13

Intel工程师成功开发出首枚微处理器,即4位的4004,它包含2300个晶体管1972

Intel推出8位的微处理器80081972-09

PHILIPS展示了长时间播放电视节目的光盘系统,光盘上记录的是模拟信号1975-07

盖茨和爱伦成立了微软公司1976

首部超级计算机问世。同年制成了没有声音、图像、键盘和外壳的计算机AppleⅠ。1978-06-08

Intel推出16位的8086处理器,集成2900个晶体管,主频为5MHz、8MHz和10MHz1979-06

Intel推出8088处理器,主频为5MHz和8MHz多媒体计算机技术及其发展历史多媒体计算机技术及其发展历史1981-08-12

IBM推出首部PC,采用DOS1.0操作系统。从此,与PC兼容的计算机铺天盖地地发展起来1982

Intel推出16位的80286处理器,集成134000个晶体管,主频为8MHz、10MHz、12MHz1982

SONY推出了世界上第一台CD播放机CDP-101,并生产了第一张CD1983-11

微软推出Windows操作系统,只预装在计算机里,不作零售。1985年11月,又推出1.0零售版1985-10-17

Intel推出首枚32位处理器80385DX,集成275000个晶体管,主频16MHz、20MHz、25MHz和30MHz1985

PHILIPS和SONY定义了CD-ROM标准。1986

PHILIPS和SONY公司联合推出了交互式紧凑光盘系统,能够将声音、文字、图形、图像等数字化信息存储到光盘上1987-03在国际第二届CD-ROM年会上展出了世界上第一台多媒体计算机多媒体计算机技术及其发展历史1989

TimBerners-Lee在日内瓦的CERN用HTML及HTTP开发了WWW网,,随后出现了各种浏览器(网络用户界面),使互联网飞速发展起来1989-04-10

Intel推出80486处理器,集成120万个晶体管,并首次内置浮点运算器和8KB缓存,其速度比8088快50倍以上。1990-05-22

Windows3.0推出;1992年4月6日,经过改进的Windows3.1推出,年销量2700万套,席卷全球。由微软公司联合一些主要PC厂商和多媒体产品开发商组成了MPC联盟。并制定了第一代多媒体计算机标准--MPC1标准1991在日内瓦确定HTML格式,为WWW发展奠定了基础1992-08

Intel推出486DX2-66处理器1993-04

美国伊利诺州大学推出首个WWW浏览器Mosaic;次年,浏览器的主要设计员Marcandreessen和SiliconGraphics的创办人JamesH.Clark合作创办Netscape公司,同年10月14日推出Navigator浏览器测试版,12月推出正式版,到1995年,Navigator浏览器市场占有率达90%1993-05

Intel推出其第五代处理器,集成310万个晶体管,并首次放弃以数字命名的方式,取名Pentium。同年,IBM、Motorola和苹果公司合作开发PowerPC处理器,次年3月14日,苹果公司推出的PowerMacintosh首次采用PowerPC处理器1993-05

MPC联盟制定了第二代多媒体计算机标准--MPC2标准,该标准提高了基本部件的性能指标1994-10

IBM推出OS/2WARP3.0操作系统,1996年10月,又推出WARP4版本,但仍无法扭转微软在PC操作系统的优势1995

Internet热潮兴起1995-06

MPC联盟制定了第三代多媒体计算机标准--MPC3标准。该标准在进一步提高对基本部件的要求的基础上,增加了全屏幕、全动态(30帧/秒)视频及增强版的CD音质的视频和音频硬件标准。MPC3指定了一个更新的操作平台可以执行增强的多媒体功能,首次将视频播放的功能纳入MPC标准1995-08-24

Windows95推出;微软调动500名程序员开发的InternetExplorer(简称IE)浏览器推出1.0版本,1996年8月推出3.0版本,直接对Netscape公司造成威胁;IE不仅可以免费下载,更免费供应ISP,1998年则内置在Windows98中,蚕食Navigator浏览器的市场1995-09

SONY和其他8家公司共同建立了DVD格式的统一标准1995-11-01

Intel推出其第六代处理器PentiumPRO,集成550万个晶体管,出世一年半即被PentiumII取代1997Intel推出PentiumII,集成750万个晶体管。5月,国际象棋大师卡斯帕罗夫被IBM深蓝击败,在前一年2月,他曾战胜过深蓝,有人怀疑人类制造的机器是否会将人击败;8月6日,苹果公司宣布,微软入股苹果公司1.5亿美元1999

Intel推出PentiumIIICPU,其中集成了2400万个晶体管1999

ICQ和免费电子邮件的浪潮势不可挡,吸引了数以千万的用户登记2000

Intel推出Pentium4CPU,其中集成了4200万个晶体管2002-03-04.Intel发布Pentium4移动处理器Pentium4-M(简称P4-M)。P4-M采用NetBurst架构、0.13

m工艺流程生产,芯片内部集成5500万个晶体管,共有512KB二级缓存,系统前端总线频率达到400MHz2002-11-14Intel发布3.06GHzPentium4。这款具有创新意义的含超线程技术新款英特尔奔腾Pentium4处理器,主频为3.06GHz,是世界上第一款采用业界最先进的0.13

m制造工艺、每秒计算速度超过30亿次的量产微处理器2003-03-12

Intel正式发布名为迅驰(Centrino)的移动计算技术。迅驰是一项移动计算技术,它具有集成的无线局域网连接能力;突破性的移动计算性能;延长的电池使用时间;更轻、更薄的外形设计

3.多媒体通信

多媒体通信技术是多媒体技术、计算机技术、通信技术和网络技术等相互结合和发展的产物。 多媒体通信系统同时具有以下三个特征:集成性交互性同步性除了以上三个特征,实际上多媒体还具有很多其它的特征,例如实时性,它主要指类似声音和视频这样的媒体,它们具有很强的时间相关性。集成性:

主要是对各类信息进行存储、传输、处理、显现的能力。1)内容数据信息:文本、图形、静止图像与二值图像、声音、运动图像。2)多媒体和超媒体信息:是结构化信息,由结构框架+内容数据组成。3)脚本信息4)特定的应用信息5)多媒体集成性不仅是多种媒体的集成,而且还指多种业务的集成。

交互性:指的是在通信中使用者与系统之间的相互沟通的特性,它使用户可以更有效地控制和使用信息,增加对信息的注释和理解。交互性有两个方面的内容:人机接口:也就是人在使用系统的终端时,系统向用户提供的操作界面。通信协议:用户终端与系统之间的应用层通信协议。

多媒体信息空间中的交互性向用户提供更加有效地控制和使用信息的手段,同时也为应用开辟了更广阔的领域,交互可以增加对信息的注意和理解,延长保留的时间。同步性:多媒体通信终端上显现的图象、声音和文字等信息是以同步方式工作。检索“刘谦春晚”,显示多媒体信息,各信息同步显示。多媒体技术的应用视频点播

电子出版物

CAI

游戏与娱乐

计算机视频会议

多媒体展示和信息查询系统

MIS与OA传媒、广告

讲演辅助

联机服务(On-lineservice)视频点播电子出版游戏娱乐视频会议多媒体信息查询多媒体信息查询经过10多年的努力,许多学者试图实现基于内容的多媒体信息检索技术,以弥补上述多媒体信息检索技术的缺陷。国内外有很多学者在积极研究基于内容的多媒体信息检索技术,其中包括对图像(如图1所示)、视频和音频等多媒体信息的内容处理和分析(Parsing)、自动标注(Annotation)、构建索引(Indexing)和相似检索(Retrieval)等。图1基于内容的图像检索系统——PicToSeek多媒体信息检索技术管理信息系统与办公自动化管理信息系统与办公自动化传媒联机服务多媒体技术的发展趋势计算机技术和网络通信技术的结合为多媒体技术的进一步应用和发展提供了巨大的可能性,目前这种可能性已经逐渐变为现实。多媒体技术的未来将朝着智能化和三维化两个方向发展。

显示视配器三大信息技术联合计算机通信大众传媒数值计算数据处理图形、图象处理声音处理视频处理邮政电报电话传真数据通信综合业务(N-ISDN)多媒体书,刊,报纸广播电影电视光盘出版物交互电视网络出版支持宽带综合业务的数据通信网络信息技术走向汇聚和融合多媒体的起源与发展计算机0,1通信大众传媒文本图象图形声音视频MPC邮政电报电话数字网ISDN信息高速报纸广播电影电视HDTVITV多媒体时代通信大众传播计算机计算机和通信主动结合Multimedia-信息系统的融合计算机网公共通信网广播网

光纤窄带综合业务数字有线数据网数字网电视网基于ATM交换的宽带综合业务数字网B-ISDN可移动的全球宽带智能个人综合业务数字网BIP-ISDN

三网合一1.多媒体数据压缩技术

数据压缩的必要性和可能性。1.2多媒体通信中的关键技术多媒体信息的特点1.多媒体信息的类型文本、图形、图像、动画、声音、视频2.常用多媒体处理软件

CorelDrawIllustrator图形类图像类photoshopACDSee

多媒体信息的特点

动画类·二维动画FlashANIMO·三维动画3dsmaxmayaCooleditproVEGAS声音类影视编辑类交互演示类AuthorwaredirectorflashPremiereaftereffect编程类VbVCDelphiJava3.多媒体信息的特点多媒体数据类型复杂(多样性)

多媒体数据种类繁多也决定了多媒体数据表示的复杂性多媒体数据的实时性由于在多媒体技术中新引入的复杂媒体类型大部份都含有与时间有关的信息,因此在许多场合都要求实时处理3.多媒体信息的特点多媒体数据的同步性另一由于引入与时间有关的媒体而形成的重要特点数据量大多媒体系统需要大量的存储空间来存放复杂类型的数据多媒体数据的交互性码率可变、突发性强人们讲话时的停顿、所传场景图像中物体的运动等都会形成码流速率的波动,而且这种波动往往呈现出极强的突发性。信息压缩的必要性由于多媒体数据量非常大,造成计算机的存储和网络传输负担若帧速率为25帧/秒,则1s的数据量大约为25MB,一个640MB的光盘只能存放大约25s的动态图像一幅640×480分辨率的24位真彩色图像的数据量约为900KB;一个100MB的硬盘只能存储约100幅静止图像画面解决办法之一就是进行数据压缩,压缩后再进行存储和传输,到需要时再解压、还原。表1各种信号的特性和未压缩速率信息压缩的必要性从上图可以看出:未进行任何形式编码和压缩的窄带语音信号需要128kb/s的速率,即两倍于普通电话的速率。信号未被压缩的宽带话音需要256kb/s的速率,未压缩的双声道立体声CD音频需要1.41Mb/s的速率。在保持原始信号质量的前提下,窄带语音可以压缩到4kb/s(30∶1的压缩比),宽带话音可以压缩到约16kb/s(15∶1的压缩比),CD音频可以压缩到64kb/s(22∶1的压缩比)。显然,多媒体信号在进行有效的存储和传输之前,必须进行处理,而最关键的处理方法是进行数据压缩。信息压缩的可行性研究表明,一个文件所包含的数据量并不等于它所包含的信息量,数据中通常包含很大的冗余,其关系如:D=I+r其中D为数据量,I为信息量,r为冗余量。压缩:在多媒体信息中包含大量冗余的信息,把这些冗余的信息去掉的过程。

信息压缩的可行性音频、图像和视频数据中存在的冗余主要有以下几种:(1)空间冗余图象本身的数据冗余在任何一幅图像中,均有许多灰度或颜色都相同的邻近像素组成的局部区域,它们形成了一个性质相同的集合块,即它们之间具有空间(或空域)上的强相关性,在图像中就表现为空间冗余。空间冗余的压缩方法:把这种局部区域集合块当作一个整体,用极少的数据量来表示,从而节省存储空间。这种压缩方法叫空间压缩或帧内压缩,它的基本点就在于减少邻近像素之间的空间(或空域)相关性。信息压缩的可行性该图为一张俯视图,图中央的黑色是一块表面均匀的积木块,在图中,黑色区域所有点的表示数据差不多都是相同的,因而黑色区域的数据表达有很大的冗余。信息压缩的可行性(2)时间冗余序列图像和语音数据中包含的冗余。活动图像(视频)中的两幅相邻图像之间存在的相关性或一段时间内连续音频存在的相关性。信息压缩的可行性(3)信息熵冗余信息熵冗余也称为编码冗余,它是指一块数据所携带的信息量少于数据本身所产生的冗余。例如,利用等长码表示信息就比不等长码如Huffman编码表示信息量存在冗余。(4)结构冗余指图象各部分结构上的类似性所产生的冗余,例如物体表面图象上的纹理结构。信息压缩的可行性(5)知识冗余指某些图象的结构可由这些图象的先验知识和背景知识获得。例:汽车图象的结构可由汽车的先验知识和背景知识得到。这种冗余称为知识冗余。例:人脸的图像有固定的结构,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正脸图像的中线上等等。这类规律的结构可由先验知识和背景知识得到,因此这类信息对一般人来说是冗余信息。信息压缩的可行性(6)视觉听觉冗余视觉听觉冗余是指人的视觉、听觉分辨率低于实际图象、音频的分辨率所产生的冗余。例如,人的视觉对灰度等级的分辨率是2个等级,而一般图象量化所采用灰度等级是2等级。例如,人的视觉对于图像边缘的急剧变化不敏感,对图像的亮度信息敏感,对颜色的分辨率较弱等。因此,如果图像经压缩或量化发生的变化(或称引入了噪声)不能被视觉所感觉,则认为图像质量是完好的或是够好的,即图像压缩并恢复后仍有满意的主观图像质量。(7)其他冗余4.压缩的种类无损压缩也称为冗余压缩或无失真压缩。冗余压缩法去掉或者减少了数据中的冗余,但这些冗余数据是用特定的方法重新插入到数据中。冗余压缩是可逆的,它能保证百分之百地恢复原始数据。在多媒体技术中,一般用于文本的压缩。但这种方法压缩比较低。常用的压缩编码方法有LZW编码、行程编码、霍夫曼(Huffman)编码等,压缩比一般在2:1~5:1之间。有损压缩也称为有失真压缩或熵压缩法。压缩了熵,会减少信息量,而损失的信息量是不能恢复的,因此这种压缩方法是不可逆的。这种方法适合对图像、声音、动态视频等数据进行压缩,对动态视频的压缩比可达到50:1~200:1。当然,对多媒体数据进行有损压缩后,就涉及到压缩质量的问题,一般的要求是压缩后的内容不应该影响人们对信息的理解。数据压缩的主要指标有较高的压缩比、压缩和解压缩时间短、解压缩后信息恢复质量高是评价压缩好坏的主要方面。1.有较高的压缩比

即压缩前后的数据量之比,如果文件的大小为1MB,经过压缩处理后变成0.5MB,那么压缩比为2:1。高的压缩比是数据压缩的根本目的,无论从哪个角度看,在同样压缩效果的前提下,数据压缩得越小越好。当然还要考虑多媒体数据压缩后的输入和输出表示方式。数据压缩的主要指标2.解压缩后信息恢复质量高

对于文本等文件,特别是是程序文件,是不允许在压缩和解压缩过程中丢失信息的。因此需要采用无损压缩,不存在压缩后恢复质量的问题。对于图像、声音和视频影像,数据经过压缩后允许信息的部分丢失。在这种情况下,信息经解压缩后不可能完全恢复,压缩和解压缩质量就不能不考虑。因此,是否具有好的恢复质量是数据压缩的另一个重要指标。表2图像主观评价性能表

主观评价分

质量尺度

妨碍观看尺度5

非常好

丝毫看不出图像质量变坏4

能看出图像质量变化,但不妨碍观看3

一般

清楚地看出图像质量变坏,对观看稍有妨碍2

对观看有妨碍1

非常差

非常严重地妨碍观看数据压缩的主要指标3.压缩和解压缩时间短

数据的压缩和解压缩是在一定数学模型的基础上,通过一系列数学运算实现的。计算方法的好坏直接关系到压缩和解压缩过程所需要的时间。数据压缩的主要指标有较高的压缩比、压缩和解压缩时间短、解压缩后信息恢复质量高是评价压缩好坏的主要方面。1.有较高的压缩比

即压缩前后的数据量之比,如果文件的大小为1MB,经过压缩处理后变成0.5MB,那么压缩比为2:1。高的压缩比是数据压缩的根本目的,无论从哪个角度看,在同样压缩效果的前提下,数据压缩得越小越好。当然还要考虑多媒体数据压缩后的输入和输出表示方式。1.2多媒体通信中的关键技术视频压缩

从图像压缩编码的发展过程看,可以分为三个阶段,即第一代、第二代、第三代图像压缩编码方法。 第一代图像压缩编码方法以仙农信息论为基础,考虑图像信源的统计特性,采用预测编码、变换编码、矢量量化编码、子带编码、小波变换编码、神经网络编码等方法。第一代图像压缩编码方法于80年代初已趋于成熟,目前利用第一代技术对视频图像的压缩可以得到8~48Kb/s的最低码率。第二代图像压缩编码方法充分考虑了人眼的视觉特性,从人类的主观特性出发,采用基于方向滤波的图像编码方法和基于图像轮廓-纹理的编码方法,利用第二代图像压缩编码方法可以获得极低码率的图像数据,目前第二代技术尚未发展到成熟的阶段。第三代图像压缩编码方法考虑到了图像传递的景物特征,采用分形编码方法和基于模型的编码方法,其中基于模型的压缩编码方法是目前最活跃的研究领域,代表着新一代的压缩编码方向。

有关图像压缩编码的国际标准主要有:JPEG、H.261、H.263、MPEG-1、MPEG-2/H.262、MPEG-4等。MPEG-7和MPEG-21是MPEG系列标准中的新成员,MPEG-7的正式名称为“多媒体内容描述接口”,用于描述多媒体内容数据。MPEG-21即“多媒体框架”,这一概念是在1999年10月的MPEG会议上提出的,它是一种用于协调处于不同地点、与不同类型的网络相联接的各种设备间进行多媒体信息交互的综合性标准。音频压缩基本上与图像压缩编码技术相同,不同之处在于图像信号是二维信号,而音频信号是一维信号。相比较而言,其数据压缩难度较低。涉及的声音压缩编码的国际标准主要有:G.711、G.721、G.722、G.728、G.729、G.723.1等。2.多媒体数据的获取与显示技术

多媒体数据的获取与显示主要指人机交互的界面,它介于用户和计算机系统之间。用户通过人机界面向系统提供命令、数据等输入信息,系统则将输出信息通过人机界面呈现给用户。

字符界面,输入工具是键盘

图形化界面,输入工具是鼠标、跟踪球、电子笔、触摸屏、摄像头和视音频采集卡等;输出手段可采用声音、图形图像以及活动视频作为信息的显示形式。文字识别技术语音识别技术

3.多媒体数据库及其检索技术

传统的数据库管理系统管理多媒体数据的方法的局限性,集中表现在以下三个方面。第一,多媒体数据所包含的信息量非常大,用人工注释难以准确描述;第二,多媒体数据随时变化,因而难以统计及预测;第三,多媒体数据内部有各种复杂的时域、空域以及基于内容的约束关系,传统的数据库系统未曾涉及到这些方面。由此开发出新的多媒体数据库系统,同时基于内容的多媒体信息检索研究方案也应运而生。

多媒体数据的内容包括:

概念级内容、感知特性(例如图像的颜色、纹理,声音的音色、音质等)、逻辑关系(例如音视频对象的时空关系等)、信号特征(通过信号处理方法例如小波变换获得的媒体特征)、特定领域的特征(与应用相关,例如人的面部特征、指纹特征)等。

4.多媒体通信网络技术 随着视频会议、视频点播、远程教育等多媒体网络应用的开展,能够满足多媒体应用需要的通信网络必须具有高带宽、可提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论