版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多鐸体技术的应用珈就彫发您超勢摘要多媒体技术是当今信息技术领域发展最快、最活跃的技术,本文通过对多媒体技术的应用 现状和 发展趋势的分析,使我们展瑕到,随着f1益普及的高速 信息网,它正被广泛应用在咨询服务、图书、教育、通 信、军事、金融、医疗等诸多行业。关键词多媒体技术应用现状发展趋势中图分类号g434文献标识码a文章编号1008 7656 (2002) 03 0016 06多媒体技术是当今信息技术领域发展最快、最活跃的技术,是新一代电了技术发展和竞争的焦点。体技术机、声音、文本、图像、动画、视频信等多于一体,借助日益普及的高速信息网,全球联网和信息资源共享,因此被广泛 务、图书、教育、通信
2、、军事、金融、医 ,并止潜移默化地改变着我们生活的血媒体技术涉及的内容多媒体技术是使用计算 机交互式综合技术和数字通 信 网络技术处理 多种表示媒体文本、图形、图像、 视频和声咅,使多种信息建立逻辑连接,集成为一个交 互式系统。它主要 涉及如 下 儿 个 部 分:1.1多媒体数据压缩,图像处理:它包括hci与交互介面设计、多模态转换、压缩与编码和虚拟现实等。12咅频信息处理:它包括咅乐合成、特定人与非特定人的语音识别、文字语音的相互转换等。13多媒体数据库和基于内容检索:它包括多媒体数 据库和基于多媒体数据库的检索等。1. 4多媒体著作工具:它包括多媒体同步、超媒体和 超文木等。1.5多媒体通
3、信与分布式多媒体:它包括cscw、会议系 统、vod和系统设计等。16多媒体应用:cai与远程教学、gis与数字地球、多 媒休远程监控等。2多媒体技术的应用现状多媒体技术的开发和应用,使人类社会工作和生活 的方方而而都沐浴着它所带来的阳光,新技术所带来 的新感觉、新体验是以往任何时候都无法想象的。2. 1多媒体数据压缩,图像处理的应用多媒体计算机技术是面向三维图形、环绕立体声和彩色全屏幕运动iwi而的处理技术。ifu数字计算机而临的是数值、文字、语言、咅乐、图形、动画、图像、视频等多种媒体的问题,它承载着曲模拟量转化成数字量信息的吞吐、存,储;和传!输。数字化了的视频和音步!瓦信号的数量之大是
4、非常惊人的,它给存储器的存储容量、通信干线的信道传输率以及计算机的速度都增加了极大的压力解决这问题,单纯用扩大存储器容量、.增加通信干线的传输率的办法是不现实的。数拒;压缩技术为图像、视频和音频信号的压缩,文件存储和分布式利用,提高通信干线的传输效率等应用提供t个行之仃效的方法,同时使计算机实时处理音频、视频信息,1次保1正扌潘放出高质量的视频、音频节成为可能o会等国际组织,于二十世纪90年代领导制定了三个重要的有关视频图像压缩编码的国际标准,jpeg标准;h. 261标准;mpeg标准。2. 1. 1 jpeg它是国际上彩色、灰度、静止图像的第一个国际标 准,它不仅适于静态图像的压缩,电视图
5、像序列的帧内图像的压缩编码,也常采用jpeg压缩标准。2. 1.2 h. 261它是视频图像压缩编码国际标准,主要用于视频电 话和电视会议,可以以较好的质量来传输更复朵的图 像。2. 1.3 mpegmpeg视频压缩技术是针对运动图像的数据压缩技术。h 前又分为 mpeg 1、mpeg- ii、mpeg- iv、mpeg- 7 和 mpeg 21 ompeg- i最初用于数字存储上活动图像及伴音的编 码,数码率为1. 5mbit/ s,图像采用sif格式,两路立体 声伴音的质量接近cd音质,到现在,mpeg- i压缩技术的 应用已经相当成熟,广泛地应用在vcd制作,图像监控 领域。mpeg-
6、ii是mpeg- 1的扩充、丰富和完善。mpeg- ii的视 频数据速率为4 5mit / s,能提供720x 480(ntsc)或720x 576 (pal)分辨率的广播级质量的视像,适用于包括宽屏幕 和高清晰度电视(hdtv)在内的高质量电视和广播。随着网络、有线/无线通信系统的迅猛发展,交互 式计算机和交互性电视技术的普遍应用,以及视频、音 频数据综合服务等应用的发展趋势,对计算机多媒体 数据压缩编码、解码技术及其遵循的标准提出更多更高的要求,有许多要求mpeg i和mpeg ii标准是难以支 持的,因此mpeg- iv应运而生,它正是为解决这些高需 求而推出的。根据mpeg- iv开发
7、的不同的压缩编码,我们可以分为 如下几类:基于内容的多媒体数据访问工具:应用于从在线的程序库和传送信息的数据库中进行基于内容的信息检索。基于内容的处理和比特流编辑:应用于交互式家庭购物、影视的制作和编辑、数字特技o混合自然和人工数据编码:应用于动画和音响的自然组合,在游戏节目中观众可以移动和传送覆盖在要查看的视频之上的图形,从不同的观察点描绘图形和声咅。改进的时间随机访问:应用t音像数据的远程终端随机访问0改进的编码效率:应用于低带宽信道上的有效音像数据存储和传送。多重并行数据流的编码:多媒,体表1演,如虚拟现实游戏,3维动画,训练和飞行模拟,多媒体演示和教育。如今,越来越多的声像信息以数字形
8、式存储和传 输,这为人们更灵活地使用这些信息捉供了可能性。但 随z而來的问题是,随着网络上信息爆炸性的增长,获 取到我们感兴趣的信息的难度却越來越大。传统的基 于关键字或文件名的检索方法显然不适于数据量庞 大、乂不具有天然结构特征的声像数据,因此近些年来 多媒体研究的一个热点是声像数据的基于内容的检 索,例如“从这段新闻片中找出有首相、总统的镜头” 这种形式的检索。实现这种基于内容检索的一个关键步骤是要定义一种述声像信息内容的格式,而(编码)又是密切相关的。国际化组织运动图像专组注意到了这方面的需求和的应用市场影响极大的mpeg 1、mpeg- 2之,尚未完成mpeg 4的最后定稿,便开始着手
9、制定专门支持多媒体信息基于内容检索的编码方案:mpeg- 7ompeg- 7作为mpeg家族中的一个新成员,正式名称叫做内容描述接i”述,这种身一起,支持用户对其感种“资以:下a此1应用领域将从mpeg- 7标准的制定屮获益:数字化图书馆(图像分类目录,咅乐字典9)多媒体目录服务广播式媒体选择做咅机频道,电视频道)多媒体编辑(个人电子新闻服务,媒体替作)还有一些潜在的应用领域教育旅游信息娱乐(例如寻找游戏、卡拉0k节目)购物(例1如寻找你喜欢的衣服)料的快速、有效地检索mpeg- 21的范围可以描述成是一个决定性(关键)技术 的集成,这些技术可以通过访问全球网络和设备实现 对多媒体资源的透明和
10、增强的使用。其功能包括:内容 创建、内容产品、内容发布、内容消耗和使用、内容表 示、知识产权管理和保护、内容识别与描述、财政管 理、用户的隐私权、终端和网络资源抽取、事件报告 等o22咅频信息处理的应用在多媒体技术中,存储声咅信息的文件格式主要 有:wav文件、voc文件、mtdt文件、atf文件、son文件及rmt 文件等。2. 2. 1音频信息录制编辑把音乐和语音加到多媒体应用中,是我们研究音频 处理技术的目的,下面是我们常用的咅频信息录制编 辑软件。waveedit 1 具的 rec 命令;sound blaster 卡 的 vedit2 软 件; microsoft soundsyst
11、em 卡 的 quick recorder 软 件;cooledit 软 件;wave edit 工 具 ; crcativc wavcstudio。2.2.2语音识别语音的识别长久以来一直是人们的美好梦想,让计续出现了许多基于hmm模型的语音识别软什系统。算机听懂人说话是发展人机语音通信和新一代智能计算机的主要r标。随着计算机的普.及、越来越多的人在使用计算机如何给不熟悉计算机的人提供一个友好的人机交互手段,是人们感兴.趣的问.题,而语咅识别技术就是其屮最口然的-种交流手段o从20世纪80年代屮期以来新技术的不断出现使语识别有了实质性的进展o特别是隐马尔可夫模型(hmm)的研究和广泛应用,推
12、动了语音识别的迅速发展,语音识别领域的研究正方兴未艾。在这方面 、新思想和新的应用系统不断涌现。同吋,语域也正处在一个非常关键的时期,世界各国 员正在向语音识别的最高层次应用非特、大词汇量、连续语咅的听写机系统的研究和实用系统进行冲刺,可以乐观地说,人们所期果的语音识技术实用化的梦想很快就会变成现实。2.2.3文语转换目前,世界上已研制出汉、英、日、法、德等语种的 文语转换系统,并在许多领域得到了广泛应用。dec talk文语转换系统:这是dec公司在mit的klatt教授 研制的语音合成器的基础上开发的语音生成系统,用 于英语文语转换。at& t bell文语转换系统:这是美国at&
13、amp; t贝尔实验室 研制的文语转换系统,它最初用于英语的文语转换,现 在正扩展到其它语种。sonic文语转换系统:这是清华大学计算机系基于波 形编辑的汉语文语转换系统。该系统利用汉语词库进 行分词,并且根据语音学研究的成果建立了语音规则, 对汉语中的某些常见语咅现象进行了处理。系统采用 psola算法修改超咅段语咅特征,提高了言语输i的质23多媒体数据库和基于内容检索的应用多媒体信息检索技术的应用使多媒体信息检索系、多媒体数据库,可视信息系统、多媒体信息自动获引系统等应用逐渐变为现实。基于内容的图像文本检索系统c成为近年來多媒体信息检索领为活跃的研究课题,基于内容的图像检索是根,包扌舌颜色
14、、纹理、形状、位置、运动、像库中检索出与查询描述的图像内容相像,利用图像可视特征索引,可以大提高检索能力。随着多媒体技术的迅速普及,web上将,例如,在遥感、医疗、安全、商天都不断产生大量的图像信息。这些信息的有效组织管理和检索中都依赖基于图像内容的检索。目前,这方究已引起了广泛的重视,并已有一些提供图像功能的多媒体检索系统软件问世。例如,由ibm公发的qbtc是最有代表性的系统,它通过友好的图形为用户提供了颜色、纹理、草图、形状等多种检索学伯克利分校与加州水资源部合作t chabot 计划,以便对水资源部的大量图像捉供基效检索手段。此外还有麻省理工学院的photobook,以利用 face,
15、 shape, texture, photobook 分别对人具和纹理进行基于内容的检索,在virage系中乂进步发展了将多种检索特征相融合的手段。的new south wales大学 已 开发了 nuttab系统,用j *数据库的检索。清华大学计算机系结合国家863高技术研究发展项“ web上基于内容的图像检索”的研究,于1997年研制了一个internet ±的静态图像的基于内容检索的原型系统。该项口的研究口标是开发能在internet / intranet环境下,通过友好的人一机界面,以颜色、纹理等图像特征 或样本图像检索图像的方法和工具。24多媒体著作工具的应用多媒体创作工具
16、是电子出版物、多媒体应用系统的 软件开发工具,它提供组织和编辑电子出版物和多媒 体应用系统各种成分所需要的重要框架,包括图形、动 冊i、声音和视频的剪辑。制作工具的用途是建立具有交 互式的用户界面,在屏幕上演示电了出版物及制作好 的多媒体应用系统以及将各种多媒体成分集成为一个 完整血有内在联系的系统。多媒体著作创作工具可以分成:基于时间的创作工 具;基于图符(icon)或流线(line)创作工具;基于卡片(card) 和页面(page)的创作工具;以传统程序语言为基础的创 作工具。它们的代表软件是action> autherware> iconauther>toolbook、
17、hypercard、北大方正开发的方正奥斯和清华大学 开发的ark创作系统。在多媒体著作创作中,还必须借助一些用于文木、 音视频及图像处理软件系统。对于不同的媒体索材,采 用的软件也不同。用多媒体创作工具可以制作各种电了 iii版物及各种 教材、参考帖、导游和地图、医药卫生、商业手册及游 戏娱乐节口,主要包括多媒体应用系统;演示系统或信 息查询系统;培训和教育系统;娱乐、视频动画及广 告;专用多媒体应用系统;领导决策辅助系统;饭店信 息查询系统;导游系统;歌舞厅点歌结算系统;商店导 购系统;生产商业实时监测系统以及证券交易实时查 询系统等。2. 5多媒体通信及分布式多媒体技术的应用人类社会逐渐
18、进入信息化时代,社会分工越来越细人际交往越来越频繁,群体性、交互性、.分布性和协同性将成为人们生活方式和劳动方式的基本特征其间大多数工作都需要群体的努力才能完成o但在现实生活中影响和阻碍上述工作方式的因素太多9如打电话时对方却不在o即,使电话交流也只能通过声-音,而很难看见止匕重要的图纸资料,要而对面的交流讨论,又需要费时的长途旅行和昂贵的差旅费用,这种方式造成t效率低、费吋长、开销大的缺点。今天,随着多媒体计算机技术和通信技术的发展两者相结合形成的多媒休通信和分布式多媒休信息系统较好地解决上述问题。多媒休通信和分布式多媒休技术涉及:计算机支持 的协同工作(cscw)、视频会议、视频点播(v0
19、d)等。25. 1计算机支持的协同工作系统:cscw系统貝有非 常广泛的应用领域,它可以应用到远程医疗诊断系统、 远程教育系统、远程协同编著系统、远程协同设计制造 系统以及军事应用中的指挥和协同训练系统等。2. 5.2多媒体会议系统:它是一种实吋的分布式多媒体软件应用的实例,它参与实时音频和视频这种现场 感的连续媒体,可以点对点通信,也可以多点对多点的 通信,而且还充分利用其它媒体信息,如图形标注、静 态图像、文本等计算数据信息进行交流,对数字化的视 频、咅频及文木、数据等多媒体进行实吋传输,利用计 算机系统提供的良好的交互功能和管理功能,实现人 与人z间的“而对而”的虚拟会议环境,它集计算机
20、 交互性、通信的分布性已及电视的真实性为一体,具有 明显的优越性,是一种快速高效、fi益增长、广泛应用 的新的通信业务。2. 5. 3 vod (video on damend)和交互电视(itv)系统:它是根据的视频点播系统,具有提供给单个 片、视频节口、游戏、信息等进行几 。对于用户而言,只需配备响应的多台电视机和机顶盒,一个视频点播遥控器,“想看什么就看什么,想什么时候看就什么和被访问的资料之间高度的交互性使视频节口的接收方式。它是多媒体数压缩解压,综合了计算机技术、通信技术和电视术的一门在这些vod应用技术的支持和推动下,网络在线视频、在线音乐、网上直播为主耍项目的网上休闲娱乐、新闻传
21、播等服务得到了迅猛发展,各大电视台、广播媒休和娱乐业公司纷纷推出其网上节目,虽然目前由于 网络带宽的限制,视频传输的效果还远不能达到人们 所预期的满意程度,还是受到了越來越多的用户的青 睐。vod和交互电视(itv)系统的应用,在某种意义上讲是 视频信息技术领域的一场革命,具有巨大的潜在市场, 具体应用在电影点播、远程购物、游戏、卡拉0k服务、 点播新闻、远程教学、家庭银行服务等方而。26其他多媒体应用软件的应用现状2. 6. 1 ca1及远程教育系统根据一定的教学目标,在计算机上编制一系列的程 序,设计和控制学习者的学习过程,使学习者通过使用 该程序,完成学习任务,这一系列计算机程序称为教育
22、 多媒体软件或称为cat (computer assist instruction计算机辅助 教学)。)络远程教育模式依靠见代通信j技术及多媒体技术的发展,大幅度地提鬲了教育传播的范围和时效使教育传播不受时间、地点、国1界和气個7的影响。ca1的应用使-学生真正打破了明显的校园界限,改变了传统的a课教学”的概念,突破时空的限制,接受到来自不同国家、教师的指导,可获得除文本以外更丰、肯观的多媒体教学信息,共享教学资源,它可以按学习者的思维方式来组织教学内容也可以tt1学习者口彳t扌空制和检测,使传统的教学由单向转向双向,实现了远程教学中师生之间、学生与学生:之间的双向交流。2.6.;2地理信息系
23、统(gts)地理信息系统(gis)获取、处理、操作、应用地理间信息主要应用在测绘、资源环境的领域。与语音图像处理技术比较,地理信息系统技术的成熟相对较:晚软件应用的专业程度相对也较高,随着计算机技术的发 展,地理信息技术逐步形成为一门新兴产业。除了大型gis平台z外,设施管理、土地管理、城市 规划、地籍测量的专业应用多媒体技术也层出不穷。2.6.3多媒体监控技术图像处理、声音处理、检索查询等多媒体技术综合 应用到实时报警系统中,改善了原有的模拟报警系统, 使监控系统更广泛地应用到工业生产、交通安全、银行 保安、酒店管理等领域屮。它能够及时发现异常情况, 迅速报警,同时将报警信息存储到数据库屮以
24、备查询, 并交互地综合图、文、声、动画多种媒体信息,使报警 的表现形式更为生动、一直观,人机界面更为友好。3多媒体技术的发展趋势总的來看,多媒体技术正向二个方而发展:一是网 络化发展趋势,与宽带网络通信等技术相互结合,使多 媒体技术进入科研设计、企业管理、办公白动化、远程 教育、远程医疗、检索咨询,文化娱乐、自动测控等领 域;二是多媒体终端的部件化、智能化和嵌入化,提高 计算机系统本身的多媒体性能,开发智能化家电。3. 1多媒体技术的网络化发展趋势技术的创新和发展将使诸如服务器、路由器、转换器等网络高,包括用户端cpu、内存、nil络应用者 更加积极多媒体技术的发展使多媒体计算机将形成更完善的
25、计算机支撑的协同工作环境,消除了空间距离的障碍,也消除了时间距离的障碍,为人类提供更完善的信息服务o交互1的、动态的多;媒体:技术能够在网络环境创建出更加生动逼真的二维与三维场景,人们还可以借助摄像等设备把办公室和娱乐工具集合在终端多媒体计算器上可在界任*角落与千里之外的同行在实时视频会议上进行市场讨论、产品设计,欣赏高质量的图像画面o新代用户界面(ui)与智能人_l (intelligent agent)等网络化、 ,人'性'化、个性化的多媒体软:件的应用还可使不同国籍、不同文化背景和不同文化程度的人们通过“人机对话”,消 除他们之 间的隔阂,自由地沟通与了 解。世界正迈进数
26、字化、网络化、全球一体化的信息时 代。信息技术将渗透着人类社会的方方面面,其中网络 技术和多媒体技术是促进信息社会全面实现的关键技 术。mpeg曾成功地发起并制定了 mpeg 1、mpeg- 2标准,现 在mpeg组织也已完成了 mpeg - 4标准的1、2、3、4版本的标 准,2001年9月完成mpeg 7标准的制定工作,同时在2001 年12月完成mpeg- 21的制定工作。多媒体交互技术的发展,使多媒体技术在模式识 别、全息图像、自然语言理解(语音识别与合成)和新的 传感技术(手写输入、数据手套、电子气味合成器)等基 础上,利用人的多种感觉通道和动作通道(如语咅、书 写、表情、姿势、视线
27、、动作和嗅觉等),通过数据手套 和跟踪手语信息,提取特定人的面部特征,合成而部动 作和表情,以并行和非精确方式与计算机系统进行交 互。可以提高人机交互的自然性和高效性,实现以三维 的逼真输出为标志的虚拟现实。蓝齿技术的开发应用,使多媒体网络技术无线电。 数字信息家电,个人区域网络,无线宽带局域网,新一 代无线、互联网通信协议与标准,对等网络与新一代互 联网络的多媒体软件开发,综合原有的各种多媒体业 务,将会使计算机无线网络异军突起,牵起网络时代的 新浪潮,使得计算无所不在,各种信息随手可得。3. 2多媒体终端的部件化、智能化和嵌入化发展趋势 口前多媒体计算机硬件体系结构,多媒体计算机的视频音频
28、接口软件不断改进,尤其是采用了硕件体系结构设计和软件、:算法;柑结合的方案,彳吏多媒体计算机的性能指标进步提高9但要满足多媒体网络化环境的要求,:还'对1软,件作:进一步的开发和研究,使多媒体终端设备具仃更高的部件化和智能化,对多媒体终端增加如文字的识别和输入、汉语语音的识别和输入、自然语理解和机器翻译、图形的识别和理解、机器人视觉和计算机视觉等智能0过去cpu芯片设t十较多土也考虑计算功i能,主耍用t数学算及数值处理9随着多媒体技术和网络通讯技术的发展,需要cpu芯片本身其具有更高的综合处理声、 文、图信息及通讯的功能,因此我们可以将媒体信息实 时处理和压缩编码算法作到cpu芯片中。从目前的发展趋势看可以把这种芯片分成两类:一 类是以多媒体和通讯功能为主。融合cpu芯片原有的计 算功能,它的设计目标是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年安庆师范大学公开招聘高层次人才86名预参考考试题库及答案解析
- 2026上半年贵州事业单位联考药品监督管理局招聘10人参考考试试题及答案解析
- 2026年黔南民族医学高等专科学校单招综合素质笔试参考题库含详细答案解析
- 2026年广州卫生职业技术学院单招综合素质考试备考题库含详细答案解析
- 2026年安徽审计职业学院单招职业技能考试参考题库含详细答案解析
- 2026年青岛港湾职业技术学院单招综合素质笔试模拟试题含详细答案解析
- 2026年广西水利电力职业技术学院单招综合素质笔试模拟试题含详细答案解析
- 2026年唐山科技职业技术学院单招综合素质笔试参考题库含详细答案解析
- 2026年黔南民族医学高等专科学校单招综合素质笔试备考试题含详细答案解析
- 2026年保定职业技术学院单招职业技能考试参考题库含详细答案解析
- 山东泰安市新泰市2025-2026学年八年级上学期期末检测历史试题(含答案)
- 2026年及未来5年市场数据中国民间美术文化遗产行业市场竞争格局及发展趋势预测报告
- 2026西藏自治区教育考试院招聘非编工作人员11人备考考试试题及答案解析
- 江西省南昌市2025-2026学年上学期期末八年级数学试卷(含答案)
- 2026内蒙古鄂尔多斯市伊金霍洛旗九泰热力有限责任公司招聘热电分公司专业技术人员16人笔试模拟试题及答案解析
- 2025至2030中国现代物流业智慧化转型与多式联运体系构建研究报告
- 马年猜猜乐(猜地名)打印版
- 2026江苏省人民医院消化内科工勤人员招聘2人考试备考题库及答案解析
- 《大学生创新创业指导(慕课版第3版)》完整全套教学课件-1
- 2025年浙江省嘉兴市嘉善县保安员考试真题附答案解析
- AFP急性弛缓性麻痹培训课件
评论
0/150
提交评论