多媒体的学习资料_第1页
多媒体的学习资料_第2页
多媒体的学习资料_第3页
多媒体的学习资料_第4页
多媒体的学习资料_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.什么是媒体?一是指用以存储信息的实体,如磁盘、磁带、光盘和半导体存储器;一是指信息的载体,如数字、文字、声音、图形图像和视频等。媒体的分类:感觉媒体、表示媒体、显示媒体、存储媒体、传输媒体2.多媒体:是指信息表示媒体的多样化,常见的多媒体有文字、图形、图像、声音、音乐、视频、动画等多种形式。(2)多媒体最重要的特征:1多维化2.集成性 3.交互性4.实时性. 3.多媒体技术的应用:视频点播、电子出版物、CAI、游戏与娱乐、计算机视频会议、多媒体展示和信息查询系统、MIS与OA、传媒、广告、讲演辅助、 4.多媒体技术的发展趋势: 计算机技术和网络通信技术的结合为多媒体技术的进一步应用和发展提供了巨大的可能性,目前这种可能性已经逐渐变为现实。多媒体技术的未来将朝着智能化和三维化两个方向发展。 多媒体技术中最主要的处理对象就是数字音频和数字图像,这里的数字图像包括了静态图像和动态图像(视频、动画)。对数字音频的研究,主要涉及的是压缩编码和语音识别,而对数字图像的研究包括了压缩编码、图像分析识别和图像理解。多媒体技术中最主要的处理对象就是数字音频和数字图像,这里的数字图像包括了静态图像和动态图像(视频、动画)。对数字音频的研究,主要涉及的是压缩编码和语音识别,而对数字图像的研究包括了压缩编码、图像分析识别和图像理解。目前相关的研究已经取得了很大的进展无论是自然语言的理解还是图像理解,都将涉及“智能化”,而智能化的目标就是实现人与计算机的自然交互。 5.CPU的内部结构:分为控制单元,逻辑单元和存储单元6.多媒体接口卡:是根据多媒体系统获取,编辑音频或视频的需要。在电脑上解决输入输出。常见:声卡,显卡,视频压缩卡,视频捕捉卡,视频播放卡,光盘接口卡。7.输入设备:键盘,鼠标器,手写板,磁卡设备(磁卡具有如下优点:所记录的内容可以修改,可靠性强、误码率低、信息识别速度快、保密性好、读出设备便宜)、IC卡设备、条码设备、图像扫描仪(主要性能指标如下: 1分辨率-扫描仪对图像细节的表现能力用分辨率来衡量,分辨率通常用每英寸扫描图像上所含有的像素点的个数表示, 2灰度 3色彩度- 色彩数表示彩色扫描仪所能产生的颜色范围。 3速度 4幅面 ),数字化仪,触摸屏(二部分组成:触摸屏控制卡和触摸检测装置 )8.输出设备:CRT显示器,德国人布劳恩发明,因而一般也称为布劳恩管 .是一种在计算机输出显示或图像信息系统中使用的电视监视器. 分类:存储型、随机扫描型(XY型),以及光栅扫描型(家庭用电视机就是这种方式)9.液晶显示器(LCD):是一种液晶利用光调制的受光型显示器件。 也是一种低电压、低功耗器件。优点是:平面型,结构简单,显示面可以任意加工,使用寿命长。反射型的,室内也能看,没有辐射,画面不闪烁,可以悬挂,保护眼睛。10.等离子体显示器(PDP):又称电浆显示器,是新一代显示器,特点:薄,分辨率高,占空间少。优点:可以制作超大尺寸的平面显示器;与阴极射线管不同,它没有弯曲,视角可达160度;分辨率超过传统显示器,所显示色彩更亮丽,鲜艳11.背投:观察者和投影机位于背投屏幕的两侧,将投影机安装在机身内的底部,从投影机投射出来的光照射到半透明的背投屏幕时会有部分光透过,观察者看到的是透射出来的光12.显卡:主要作用是对图形函数进行加速,图形加速卡拥有自己的图形函数加速器和显存,些都是专门用来执行图形加速任务,因此就可以大大减少CPU所必须处理的图形函数 13.影响显卡的性能参数:显存容量,显存的数据位数,带宽和显存速度。显存的容量:显存与系统内存一样,也时多多益善。显存越大,可以储存的图像数据就越多,支持的分辨率与颜色数也就越高。显存的数据位数与带宽:数据位数指的是在一个时钟周期之内能传送的位数,它是决定显存带宽的重要因素,与显卡性能息息相关。当显存种类相同并且工作频率相同时,数据位数越大,它的性能就越高。数据位数是显存也是显卡的一个很重要的参数。显存的速度:显存的速度一般以ns为单位。额定工作频率=1/显存速度。14.打印机:主要分为击打式和非击打式两大类。其中,击打式以点阵针击式打印机为主,非击打式以激光打印机和喷墨式打印机为主。15.调制解调器:作用是利用模拟信号传输线路传输数字信号,电子信号可分为:模拟信号和数字信号16.ADSL:非对称式数字用户线路,技术采用过去未使用的频宽,经过电话线提供高速传输。17.网卡:主要工作原理为整理计算机上发往网线上的数据并将数据分解为适当大小的数据包之后向网络上发送出去18.存储器主要以速度、功耗、价格、循环寿命和非易失性等指标衡量其水平19.相变存储器是一种新型的半导体存储技术,是加工到纳米尺寸的可逆相变材料,利用材料晶态时的低阻与非晶态时的高阻特性来实现存储的一种技术20.NAS:为一种特殊的专用数据存储服务器,内嵌系统软件,可提供跨平台文件共享功能21.IP存储是使用IP把服务器与存储设备连接起来的技术。22.虚拟存储 是把物理上相互独立的存储模块用软、硬件集中起来管理,形成逻辑上的存储单元,从而使主机得以访问。好处提高存储利用率,降低成本,简化存储管理。对商务好处:开放性,扩展性,管理型等优势充分体现数据大且集中,异地容灾应用中。23.USB 通用串行总线,是由Compaq、DEC、IBM、Intel、Microsoft、NEC和Northern Telecom等公司为简化PC与外设之间的互连而共同研究开发的一种标准化连接器USB优点:使用方便,速度快,连接灵活,独立供电,支持多媒体,低成本USB硬件结构:采用四线电缆,点好定义由2条电源线和2条信号线组成USB系统:采用采用级联星型拓扑,由三个基本部分组成:主机、集线器和功能设备。USB的数据流传输 主控制器负责主机和USB设备间数据流的传输。 USB支持四种基本的数据传输模式:控制传输方式:外设与主机之间各种控制、状态、配置等信息的传输 等时传输方式:周期性、时延和带宽有限、数传率不变的外设与主机间的数据传输中断传输方式:数据量小、无周期性、对响应时间敏感的外设与主机间的数据传输数据块传输:数据量很大的外设与主机间的数据传输USB的应用:让计算机支持USB 安装USB连接卡让Windows系统支持USB 安装USB驱动程序让计算机连接更多的USB设备 安装USB集线器USB产品:满足USB要求的外设有调制解调器、键盘、鼠标、光驱、游戏手柄、软驱、扫描仪、音箱等。U盘:即USB盘的简称,也叫闪存盘,是移动存储设备之一。最大的特点就是:小巧便与携带、存储容量大、价格便宜。24.CCD(电荷耦合元件)和CMOS(金属氧化物半导体元件)都基于硅产品,制造时使用的设备也非常相似,但由于工序和设计结构不同,这两种传感器在功能和性能上存在着很大的不同。 CMOS与CCD相比优点:低电源消耗,耗电量不到CCD的1/10芯片撒谎那个符合有额外的电路低系统成本25.数字摄像头主要参数:1最大分辨率 2传感器像素 3接口类型 4色彩位数 5感光器件 6最大帧数26.数码相机:能够进行拍摄,并能通过自身内部进行处理,把拍摄景物转换成数字格式存储。特征:像素,镜头,快门。数字摄像机:能够拍摄连续动态视频图像的数字影像设备。1像机镜头2光学变焦和数码变焦3静态图像存储和视频输出27.图像数据压缩基础:RGB颜色模式。自然界中所有的颜色都可以用红、绿、蓝(RGB)这三种颜色的光按不同的强度叠加而成,这就是人们常说的三基色原理。颜色有三个要素:色泽、饱和度和亮度。28.图像数据压缩的可能性:1统计冗余,图像数据存在大量的统计特征的重复,这种重复包括静态单帧图像数据在空间上的冗余和音频、视频数据在时间上的冗余。2信息熵冗余,所携带的信息量少于数据本身而反映出来的冗余。3结构冗余,有些图像从大面积上或整体上看存在着重复出现的相同或相近的纹理结构,例如布纹图像和草席图像,被称为结构冗余。4知识冗余,有许多图像的理解与图像所表现内容的基础知识(先验或背景知识)有相当大的相关性,从这种知识出发可以归纳出图像的某种规律性变化,这类冗余称为知识冗余。知识冗余的一个典型例子是对人像的理解5视觉冗余,人类的视觉系统实际上只在一定程度上对图像的变化产生敏感,即图像数据中存在着大量人类视觉觉察不到的细节。事实上,人类视觉系统的一般分辨力为64灰度级,而一般图像量化采用的是256灰度级,这类冗余称为视觉冗余。 29矢量图:也称为面向对象的图像或绘图图像,在数学上定义为一系列由线连接的点。像Adobe Illustrator、CorelDraw、CAD等软件是以矢量图形为基础进行创作的。矢量文件中的图形元素称为对象。每个对象都是一个自成一体的实体,它具有颜色、形状、轮廓、大小和屏幕位置等属性。矢量图形与分辨率无关,可以将它缩放到任意大小和以任意分辨率在输出设备上打印出来,都不会影响清晰度。因此,矢量图形是文字(尤其是小字)和线条图形(比如徽标)的最佳选择。矢量图形文件的规律:1.你可以无限放大图形中的细节,不用担心会造成失真和色块。2.一般的线条的图形和卡通图形,存成矢量图文件就比存成点阵图文件要小很多。3.存盘后文件的大小与图形中元素的个数和每个元素的复杂程度成正比。而与图形面积和色彩的丰富程度无关。(元素的复杂程度指的是这个元素的结构复杂度,如五角星就比矩形复杂、一个任意曲线就比一个直线段复杂)4.通过软件,矢量图可以轻松地转化为点阵图,而点阵图转化为矢量图就需要经过复杂而庞大的数据处理,而且生成的矢量图的质量绝对不能和原来的图形比拟。30.位图图像:亦称为点阵图像或绘制图像,是由称作像素(图片元素)的单个点组成的。这些点可以进行不同的排列和染色以构成图样。位图文件的规律: 1.图形面积越大,文件的字节数越多 2.文件的色彩越丰富,文件的字节数越多,这些特征是所有点阵图共有的。31.静态图像压缩标准:JPEG是Joint Photographic Experts Group(联合图像专家组)的缩写,文件后辍名为jpg或jpeg,是最常用的图像文件格式,是一种有损压缩格式,能够将图像压缩在很小的储存空间,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的损伤。JPEG压缩技术十分先进,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像。JPEG格式的应用非常广泛,特别是在网络和光盘读物上,都能找到它的身影。JPEG格式的文件尺寸较小,下载速度快。 32.MPEG4 标准的应用目标是什么?1、解决低比特率下的多媒体通信等问题2、试图建立一种标准,具有广泛的兼容性,能够在多行业得以广泛应用 3、是一种面向未来的标准,考虑将来技术发展,如人与内容的交互 。MPEG4的应用目标是针对窄带宽传输、高画质压缩、交互性操作以及将自然物体与人造物体相溶合的表达方式,同时还特别强调广泛的适应性和可扩展性33.声音信号的特点基频与音调:频率是指信号每秒钟变化的次数。人对声音频率的感觉表现为音调的高低,在音乐中称为音高。谐波与音色:音色是由混入基音的泛音所决定的,高次谐波越丰富,音色就越有明亮感和穿透力。 音宽与频带:频带宽度或称为带宽,它是描述组成复合信号的频率范围34.声音信号的分类【不规则声音】一般指不携带信息的噪声 ;【规则声音】1.音乐 2.音效。多媒体技术中通常处理的是规则声音。规则声音是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波。35.音频信号处理方法:对声音在时间轴和幅度两个方面进行离散化。分别称之为采样和量化。36.音频文件的存储格式:目前比较流行的几种格式为,a、WAV文件: WAV是Microsoft Windows本身提供的音频格式,这个格式已经成为了事实上的通用音频格式。b、mp3文件: mp3可以实现12:1的压缩比例,使得mp3迅速地流行起来。mp3能够达到如此高的压缩比例同时又能保持相当不错的音质是因为利用了知觉音频编码技术。c、RM文件:互联网大行其道之后,Real Media 出现了。这种文件格式几乎成了网络流媒体的代名词。网络流媒体:的道理其实非常简单,简单说就是将原来连续不断的音频分割成一个一个带有顺序标记的小数据包,将这些小数据包通过网络进行传递,在接收的时候再将这些数据包重新按顺序组织起来播放。如果网络质量太差,有些数据包收不到或者延缓了到达,它就跳过这些数据包不播放,以保证用户在聆听的内容是基本连续的。就是这么简单的道理,促成了网络上的又一个传奇。d、其它格式:AVI等。37.音频压缩技术:指的是对原始数字音频信号流运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。可将音频压缩技术分为无损(lossless)压缩及有损(lossy)压缩两大类,而按照压缩方案的不同,又可将其划分为时域压缩、变换压缩、子带压缩,以及多种技术相互融合的混合压缩等等。38.音频编码标准:G.711,本建议公布于1972年,它给出话音信号编码的推荐特性。速率为64kbps,主要用于公用电话网中。G.722,建议的带宽音频压缩仍采用波形编码技术,因为要保证既能适用于话音,又能用于其他方式的音频,只能考虑波形编码速率为64kbps。主要用于视听多媒体和会议电话。G723.1,1996年,CCITT(国际电报电话咨询委员会)通过了G723.1标准用于多媒体传输的5.3kbps或6.3kbps双速率语音编码。G.728, CCITT于1992年制定了G.728标准,速率为16kbps,主要用于公共电话网中。G.729,1996年制定,此标准用于无线移动网,数字多路复用系统和计算机通信系统中。39.MP3压缩技术:MP3是一种音频压缩的国际技术标准。MP3格式开始于二十世纪80年代中期,在德国夫朗和费研究所开始的,研究致力于高质量、低数据率的声音编码。MP3格式是一个让音乐界产生巨大震动的一个声音格式。MP3的全称是Moving Picture Experts Group, Audio Layer 3,它所使用的技术是在VCD(MPEG-1)的音频压缩技术上发展出的第三代,而不是MPEG-3。 MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4:1和6:1-8:1,而MP3的压缩率则高达10:112:1,一分钟CD音质的音乐未经压缩需要10MB存储空间,经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。40.声卡的基本构造:一般的声卡都是由声音控制/处理芯片、功放芯片、声音输入/输出端口几部分组成。41.声卡的工作原理:a.输出:由PCI总线通过系统音频接口传来的音频信号首先输入到主芯片,主芯片对它们进行音频运算处理产生可输出的数字音频信号,信号则通过线路输出到CODEC。b.输入:当一个音源输入后,会先经过滤器和CODEC做预先的取样、模拟转数字的变换,再由数字信号处理芯片(DSP)负责将此音源做各种处理。42.语音合成技术:是以言语产生模型为基础,分析抽取激励源,声道的特征参数;再利用这些特征参数重新综合出语音信号的过程。语音合成技术的应用:虽然语音合成技术的发展还有很长的路要走,但目前已取得的进展已经使其在不同的领域得到更好的应用。 人机对话电话咨询自动播音助讲助读语音教学电话翻译43.语音识别技术及应用:语音识别技术它所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。44.语音识别系统的类型:语音识别系统有以下几种分类方式: 1.根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统 2.根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统,连接词语音识别系统以及连续语音识别系统3.根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。 语音识别技术的应用: 1.语音邮件集成2.数据库输人和询问应用3.语音命令和控制应用45.多媒体软件分成5类:a 驱动程序b 操作系统c 多媒体数据准备软件d 多媒体编辑创作软件e 多媒体应用软件46超文本:是一种按照信息之间关系非线性的存储、组织、管理和浏览信息的计算机技术。超文本系统的基本特征:1 图形用户接口2 向用户给出一个网络结构动态总貌图3 一般使用双向链4 包含管理节点和链信息的引擎5 尽可能不依赖于它的具体特征、命令或信息结构,而更多强调的是它的用户界面的“视觉和感觉”。47.HTML(超文本标记语言):是一种用来制作超文本文档的简单标记语言。生成HTML文档主要有以下三种途径:1.手工直接编写2.通过某些格式转换工具将现有的其它格式文档转换成HTML文档3.由Web服务器一方实时动态地生成。HTML具有很多特点:如独立于平台的格式、结构化设计,特别是超文本链接,这些特点使它成为万维网较好的文档格式。设计超文本的工具:1、java script 语言2、动态网页设计ASP JSP PHP 3、XML语言48.多媒体数据与常规数据的区别:数据量巨大、数据长度差异大、数据模型复杂、数据定义及操作要处理非规范关系、数据的时间特性及版本需要匹配、数据传送对软、硬件要求高。49.多媒体数据库的定义:能够管理数据数值、文字、表格、图形、图像、声音等多种媒体的数据库成为多媒体数据库。50.多媒体数据库要解决三个难题:第一是信息媒体的多样化,不仅仅是数值数据和字符数据,要扩大到多媒体数据的存储、组织、使用和管理。第二要解决多媒体数据集成或表现集成,实现多媒体数据之间的交叉调用和融合,集成粒度越细,多媒体一体化表现才越强,应用的价值也才越大。第三是多媒体数据与人之间的交互性。没有交互性就没有多媒体,要改变传统数据库查询的被动性,能以多媒体方式主动表现。50.多媒体数据库应具有如下功能:1、支持图形、图像、声音、动画、视频、文本等多媒体字段类型;2、支持定长和非定长数据的集成管理3、支持复杂实体的表示和处理4、支持同一实体的多种表现形式5、具有良好的用户界面6、支持多媒体的特殊查询和良好的处理接口7、支持分布式环境51.互联网的特性:1空前的信息容纳能力2高速的信息传递能力3有力的信息组织与检索能力4普遍的可连接性(时间,地点,设备)5多种多样的信息媒体6消除了人们进行信息交流的时空限制,媒体限制,语言限制几项重要技术1.ATM技术:传统网络普遍存在以下缺陷:业务的依赖性 、无灵活性 、效率低 。ATM(Asynchronous Transfer Mode)顾名思义就是异步传输模式,就是国际电信联盟ITU-T制定的标准 2.WAP无线互联:WAP是由WAP编程模型、XML标准的无线标记语言(WML)、无线终端的微浏览器规范、轻量级协议栈以及无线电话应用框架等协议组成。 3.蓝牙技术:“蓝牙”是一种短距离无线通信标准,其技术界面是专用半导体集成电路芯片,用于“嵌入”电子器件内。使用无线的方式将它们连成一个小网(Piconet),多个Piconet之间也可以互连形成Scatternet,从而方便快速地实现各类设备之间的通信。 52.P2P技术称为对等网络技术:是一种用于不同计算机客户之间,不经过中间设备直接交换信息的技术,实质上是一种网络结构思想。 P2P技术存在三种结构模式的体系结构:A、中央控制网络体系结构集中目录式结构 B、分散分布网络体系结构纯P2P网络结构C、混合网络体系结构混合式网络结构 P2P网络的特点:1分散化2可扩展3性鲁棒4性高性能 P2P技术的应用:1实时通讯(RTC)、无服务器型即时通信2实时比赛和游戏3协同工作4文件共享5共享体验6内容分发7音频和视频8分发产品升级补丁9分布式计算10整合计算资源 53.多媒体一体化:信息的采集、存储、加工、传输都是通过不同的载体而进行的。单一的信息载体都是单一的媒体,单一媒体的采集、存储、传输都有自己的理论和专门的技术。而把上述多种媒体综合在一起,就叫多媒体一体化。54.网格:网格是把整个Internet整合成一台巨大的超级计算机,实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享。网格的核心观念是一句老话,即“网络就是计算机”。网格对未来互联网产生的影响:网格会带来一场互联网的革命,将改变整个计算机世界的格局,从而给世界各行各业带来巨大的效益。利用网格,芯片设计厂可以将他们在数星期内方可完成的设计任务在数小时内就可顺利完成,从而大大缩短了产品面市的时间;汽车制造商可以利用网格进行模型的模拟测试,从而取代原来的电力测试和风洞测试,降低了汽车的成本;在金融行业,网格在风险抵抗等方面有很好的作用;在基因工程领域,网格将大显身手,如药物分子模拟、药物研究、基因测序等都离不开网格。55.流媒体:是指在网络中使用流式传输技术的连续时基媒体,如音频、视频、动画或其他多媒体文件。流媒体技术:(或称为流式媒体技术)就是把连续的影像和声音信息经过压缩处理后放到网络服务器上,让浏览者一边下载一边观看、收听,而不需要等到整个多媒体文件下载完成就可以即时观看的技术。流媒体技术并不是单一的技术,它是融合很多网络技术之后所产生的技术。它涉及到流媒体数据的采集、压缩、存储、传输以及网络通信等多项技术。 56.IP电话:是在IP网络即信息包交换网络上进行的呼叫和通话,而不是在传统的公众交换电话网络上进行的呼叫和通话。 IP电话与PSTN电话的技术差别:IP电话和PSTN电话之间在技术上的主要差别是它们的交换结构。因特网使用的是动态路由技术,而PSTN使用的是静态交换技术。57.IP电话通话的方式有哪几种?简述他们之间的异同。目前IP电话的通话方式有3种:PC到PC,PC到电话,电话到电话。相同:都遵循一个宗旨,利用传送语音。不同:PC到PC通话双方同时利用计算机和Modem拨号上网,然后利用计算机中的多媒体技术实现通话的声音传送。PC到电话通话时,一方利用计算机连上因特网,然后通过商业公司提供的IP电话服务器将电话拨叫到对方普通电话机上。电话到电话用户不必直接操作计算机,可进行点对点通话,或者配备上网账号和专用IP电话设备,或者有IP电话服务器支持即可1.多媒体系统的关键技术可以分为如下几个方面:多媒体数据的处理软/硬件平台,数据压缩技术,所媒体信息转换及融合理论。多媒体数据的存储存储设备,数据存储与管理。多媒体数据的传输多媒体计算机网络,服务质量控制,分布式多媒体系统。多媒体输入/输出技术输入/输出设备,人机界面,虚拟现实技术。2. 多媒体信息以3种模式相互集成:制约式:指一种媒体的状态转移或激活影响到另一种媒体。协作式:指两种以上的媒体信息同时存在。交互式:指某种媒体上含有 的信息变换成另一种媒体信息。3. 信息机数据管理式信息系统的核心问题之一。处理大批非规则数据主要有两个途径:一是扩展现有的关系数据库,二是建立面向对象的数据库系统,以存储和检索特定信息。4.虚拟现实,就是采用计算机技术生成一个逼真的视觉、听觉、触觉及嗅觉的感觉世界,用户可以用人的自然技能对这个生成的虚拟实体进行交互考察。这个概念包含三层含义:虚拟实体时用计算机来生成的一个逼真的实体。用户可以通过人的自认技能(人的头部转动、眼动、手势或其他身体动作)与这个环境交互。要借助于一些三维传感设备来完成交互动作,常用的有头盔立体显示器、数据手套、数据服装、三维鼠标等。5.人机界面设计的目的时通过对用户需求的解释达到一种人及之间较好的通信能力。为了达到这个目的,需要在以下几个方面进行研究:稳健的语言处理模式,包括语音识别和自然语言理解。手势分析和理解模型的设计。上述两方面的通信模式的融合,因为两者在对用户需求的理解上市相互补充的。多模式环境中的对话管理,这是保证一个连续的对话过程所必须的。任务的优化图形表示,使对象能过以一种容易理解的方式出现。6.多媒体通信是指在一次呼叫过程中能同时提供多种媒体信息声音、图形、图像、数据、文本等新型的通信方式,它是通信技术和计算机技术相结合的产物。所谓高速多媒体通信技术,是指维满足新一代信息系统中实时多媒体信息传输的需要,网络的带宽可能要在1000Gbps以上,而且能支持鼓舞质量控制(Qos),以适应不同媒体对传输质量的要求。7. 多媒体技术的应用:多媒体技术在工业、农业、商业、医疗卫生保健、金融、教育、娱乐、旅游、房地产开发等领域中,尤其在信息查询、产品展示、广告宣传等方面有非常广泛的应用。其主要应用包括以下几方面:音频/视频流点播、电子出版物、医疗卫生、游戏娱乐、计算机视频会议、多媒体展示和信息查询系统、MIS与OA、传媒、广告、教学管理系统、移动卫星8. 多媒体技术的发展趋势信息技术的未来将朝着智能化和三维化两个方向发展。智能化。无论是自然语言的理解还是图像理解,都将涉及“智能化”,而智能化的目标就是实现人与计算机的自然交互。三维化。多媒体技术的一个重要研究内容就是将计算机视觉技术和图形学技术内容结合起来,即实现所谓的增强显示技术。 计算机图形学发展成一个丰富多彩,深奥且有吸引力的领域。我们没有理由不相信:在不久的将来,多媒体技术一定会在社会生产、生活的各个方面全面开花、结果,更加强而有力的服务于人类。9. .多媒体外部设备: 多媒体外部设备工作方式一般为输入和输出,按其功能分为如下4类:视频/音频输入设备-如摄像机、录像机、扫描机、传真机、数码相机、话筒等。视频/音频输出设备-如显示器、电视机、大屏幕投影仪、音响等。人机交互设备-如键盘、鼠标、触摸屏、绘图板、光笔及手写输入设备等。存储设备-如磁盘、光盘等。10.图像深度是指位图中记录每个像素点所占的位数,它决定了色彩图像中可出现的最多颜色数,或者灰度图像中的最大灰度等级。图像深度与显示深度之间的关系分为3种。显示深度大于图像深度。显示深度等于图像深度。显示深度小于图像深度。11. 评价压缩算法的指标通常包括:1.压缩比压缩编码后的数据量与原始数据大小的比值2.算法的复杂性与运算速度3.失真度4.无损编码解码后的数据与编码前的数据完全一致,可以把数据编码方法分为两类5.有损编码解码后的数据与原始数据有一定程度的偏差和失真,但不影响其效果12. 声卡的功能:声卡的种类很多,其功能不尽相同,但声卡在相应软件的支持下,应具备以下大部分或全部功能:1.录制、编辑和回放数字声音文件2.控制各声源的音量,并混合在一起,以便数字化3.在记录和回放数字文件时进行压缩和解压缩,以节省存储空间4.采用语音合成技术,能让计算机朗读文件5.MIDI接口声卡的工作原理:主机通过总线将数字化的声音信号以PCM的方式送到数模转换器(D/A),将数字信号变模拟的音频信号。同时又可以通过模数转换器(A/D)将麦克风或CD的的输入信号转换成数字信号,送到计算机进行处理。声音处理芯片是声卡中的核心芯片,是一个完整的音频子系统电路,通过对音频信号的转换、控制、加工、处理,在计算机上实现了较理想的音响效果。声卡的另一关键芯片是合成器芯片。13. 不同格式光盘之间的差别主要是:CD-DA存放数字化的音乐节目。CD-G存放静止图像和音乐节目CD-V存放电视图像和数字化的声音CD-ROM存放数字化的文,图,声,像等CD-I存放数字化的电影,电视等节目卡拉OK存放数字化的卡拉OK节目VIDEOCD存放数字化的电影等节目DVD存放高清晰数字化的电影节目14. 刻录是刻录机的主要功能,主要有整盘刻写、轨道刻写和多段刻写三种刻录方式。整盘刻写:光盘对光盘全盘复制 ,无法追加数据轨道刻写:允许指定需要刻写的目录和文件,并允许追加多段刻写:用于CD-RW盘片的写入、追加15.DVD如何提高光盘容量一般有两种方法:1)减小光道间距和凹坑尺寸是主要的方法,这要求读出系统具有更小的光斑尺寸.2)增加层数,即将多层较薄的盘片粘合起来形成一张较厚的盘片,其容量与层数成正比.16.CD-ROM特点:a.标准化b.存储量大c.只读属性d.播放CD音乐e.交叉平台兼容性f.快速的检索方法g.不易损坏h.价格低廉i.多种媒体融合16. .什么是驱动程序?其主要作用是什么?多媒体系统中直接和硬件打交道的软件称为设备驱动程序,它完成设备的初始化,设备各种操作以及基于硬件的压缩和解压缩图像快速变换等基本硬件功能调用. 驱动程序:是一种可以使计算机和设备通信的特殊程序,可以 说相当于硬件的接口,操作系统只有通过这个接口,才能控制硬件设备的工作. 作用: A.随着电子技术的飞速发展,电脑硬件的性能越来越强大。驱动程序是直接工作在各种硬件设备上的软件,其“驱动”这个名称也十分形象的指明了它的功能。正是通过驱动程序,各种硬件设备才能正常运行,达到既定的工作效果。 B.硬件如果缺少了驱动程序的“驱动”,那么本来性能非常强大的硬件就无法根据软件发出的指令进行工作,硬件就是空有一身本领都无从发挥,毫无用武 之地。这时候,电脑就正如古人所说的“万事俱备,只欠东风”,这“东风”的角色就落在了驱动程序身上。如此看来,驱动程序在电脑使用上还真起着举足轻重的 作用。 C.从理论上讲,所有的硬件设备都需要安装相应的驱动程序才能正常工作。但像CPU、内存、主板、键盘、显示器等设备却并不需要安装驱动程序也可以正常工作,而显卡、声卡、网卡等却一定要安装驱动程序,否则便无法正常工作。这是为什么呢?这主要是由于这些硬件对于一台个人电脑来说是必需的,所以早期的设计人员将这些硬件列为BIOS能直接支持的硬件。换句话说,上述硬件安装后就 可以被BIOS和操作系统直接支持,不再需要安装驱动程序。从这个角度来说,BIOS也是一种驱动程序。但是对于其他的硬件,例如:网卡,声卡,显卡等等 却必须要安装驱动程序,不然这些硬件就无法正常工作。17. 音频处理软件的特点和功能:A.音频数据处理软件是为多媒体计算机应用录制、编辑、修改数字化声音的工具软件。 B:功能:a.音频数据的录制,应能选择不同的录音参数,包括多种采样频率、多种采样大小、录音声道数,以及它们的不同组合。b.音频数据的编辑和回放,对录制或通过打开声音文件得到的数字化声音数据进行播放选块、复制、删除、粘贴、声音混合等多种编辑。c.音频数据的参数修改,包括采样频率的修改和格式转换。d.效果处理,包括逆向播放、增减回声、增减音量、声音的淡入淡出、交换左右声道等。e.图形化的工作界面,应能按比例把实际的声音波形显示成图形,做了修改后,应能实时显示其变化。 f.非破坏式修改,即所有修改都是先在内存上进行,只有进行存储操作后,才能破坏原来的数据。g.能以WAV格式文件存储数字化声音数据。18. 视频数据采集过程:通常视频数据的采集过程可以分为以下几个步骤.创建视频捕获窗口.设置视频捕获的相关回调函数.搜寻视频设备.获取连接设备当前的参数设备并根据需要进行修改.设置预览帧率.开始捕获数据.19. 多媒体创作工具的评价标准:评测一个多媒体创作工具的标准有如下8项:编程环境。各种媒体数据输入能力。各种媒体数据输入能力。动画制作与演稿。应用程序间的动态链接。制作片段的模块和面向对象化。易学习、易使用。多媒体创作工具应设计成操作简便、编辑时易于修改,所见即所得。良好的扩充性。20.多媒体创作工具的分类从系统工具的功能角度划分,多媒体创作工具大致可以分为4类:1.媒体创作软件工具:用于建立媒体模型、产生媒体数据。2.多媒体节目写作工具:提供不同的编辑、写作方式。3.媒体播放工具:可以在计算机上播出,有的甚至能在消费类电子产品中播出。4.其他各类媒体处理工具。21. 一个完整的数字化声音处理软件应包括如下功能:音频数据的录制,应能选择不同的录音参数,包括多种采样频率、多种采样大小、录音声道数,以及它们的不同组合。音频数据的编辑和回放,对录制或通过打开声音文件得到的数字化声音数据进行播放选块、复制、删除、粘贴、声音混合等多种编辑。音频数据的参数修改,包括采样频率的修改和格式转换。效果处理,包括逆向播放、增减回声、增减音量、增减速度、声音的淡入淡出、交换左右声道等。图形化的工作界面,应能按比例把实际的声音波形显示成图形,做了修改后,应能实时显示其变化。非破坏式修改,即所有修改都是先在内存上进行,最有进行存储操作后,才能破坏原来的数据。能以WAV格式我那件存储数字化声音数据。22.常用的多媒体播放器?flash的特点? A.播放器:apple公司的QuickTime,Microsoft公司的windows media player和Real Networks公司的Realplayer. B.特点:Flash之所以能占据网络多媒体的重要位置,最重要的一点,是因为它采用了矢量技术。位图在描述简单图形的时候,总是显得冗赘,使得文件很大,而同样情况下,矢量图形则”小得可怜”。而在网络上,当然文件时越小越好了。因此,在文件长度这点来说,Flash已经占据了绝对优势。Flash是一种动画编辑软件,它可以用于制作出一种后缀名为swf的动画,该类动画可以插入HTML页里,也可以单独成页.Flash动画实是一种交互式矢量多媒体技术,或者说是一种矢量动画插件.Flash之所以能占据网络多媒体的位置重要,最重要的一点,是因为它采用了矢量技术。已经占据了绝对优势。Flash格式要比其他格式的文件小得多且能提供更快的下载速度。Flash特别适合于嵌入网页的视频及在媒体服务器中通过浏览器进行观看的流式文件。23. 超文本系统的节点类型:1:文本节点 2:图形节点 3:动画 视频节点 4:音乐 数字化语音节点 5:混合媒体节点 6:动作与操作节点 7:组织型节点 8:推理型节点24.JavaScript与Sun公司推出的Java语言在起名上有些相近,容易引起概念上的混淆,其差异如下: JavaScript不是Java的替代语言 JavaScript不需要特殊开发环境 JavaScript源代码不需编译JavaScript的特点节省CGI的交互时间节省了浏览者的访问时间和网络的流量将JavaApplet作为处理对象25.多媒体数据的复合性、分散性和时序性对数据模型提出了如下要求:支持丰富的数据类型及响应的处理。说明不完备信息。扩充个别对象的定义到其类型定义之外。编组来自不同数据库的数据并加以一致性处理。描述结构化信息。模拟对象的内部概念与外部表达。支持上下文无关和上下文有关的应用。支持数据共享支持版本的生成与控制支持系统预定义的操作和用户定义的操作。支持对象的同频与集成。数据模型的优点: .1概念单一、结构简单;2.集合处理能力强3.数据的独立性26.分布式多媒体数据库系统的特点1)实时性2)同步特性3)服务质量4)体系结构5)客户-服务器结构27.所谓全文检索,就是给定一个字符串会字符串的逻辑表达式,在全文数据库中进行相应的检索,查出与指定表达式相匹配的出现,并将这些出现的原文件作为检索结果返回给用户。当数据库数据量巨大时,实现快书的全文检索包括以下几方面的技术问题:检索的快速响应如何建立索引库如何压缩索引数据提供完整、丰富的检索操作手段28. 多媒体数据库的发展.实现多媒体数据库系统的途径有:1.扩充关系数据库方法,.2.面对对象的方法.3.超文本或超媒体的方法.对多媒体数据库的研究分为两大类型:1.面对对象数据库的研究.2.(老师给我的上面没有写)三种方法实现面向对象数据库:1.扩充关系数据模型 2.在面向对象语言中嵌入数据库功能.3.开发全新的数据模型.现有的面向对象的数据库系统存在的问题:1.缺乏通用的数据类型 2.缺乏理论基础 3.缺乏友好的用户界面和工具环境 4.缺乏有力的查询优化.对关系数据库的扩充:1.扩充字段类型 2.加大字段容量 3.建立索引.对关系数据库的扩充需要研究的问题:1.设计语义模型,特别是图像和视频的语义模型.2.设计有效的多媒体数据的索引和组织方法.3.建立媒体同步和集成的数据模型.4.加强多媒体查询语言的研究.5.设计有效的物理存储模式.6研究分别式多媒体数据库的管理.29. 多媒体计算机通信网络的基本结构和特点可以表现在以下几点:多媒体计算机通信网络与人的交互界面主要是文字、图像、图像、声音等人性化信息,主要体现了人类感觉器官对多媒体信息的自然需求。多媒体计算机通信网络除了通过人性化多媒体信息与人交互外,还可以通过各种属性信息直接与外界交互。在多媒体计算机通信网络中,无论是与人交互的人性化的多媒体信息,还是与客观世界直接交互的多媒体信息,在进入计算机通信网络进行处理、存储和传输时,都被转换成统一的数字编码信息。人对多媒体计算机通信网络具有特别重要的作用30. 什么是MMS与SMS有什么不同MMS,多媒体消息业务,通常称彩信。它最大的特点是支持多媒体功能,能够在支持彩信功能的手机间,或手机与计算机之间传递功能全面的内容和信息。SMS,(短消息业务)消息中心发送的消息都是文本,工作比较简单,而MMS消息中心的工作就比较复杂。彩信并不是带有多媒体信息的短息,在技术上它与短信完全没有关系。31. 多媒体消息服务系统的构成MMS终端,多媒体消息业务中心,MMS用户数据库,MMS重定向器,外部应用服务器,MMS曾之应用平台,WAP网关,计费系统(MMSC)等32.即时通信系统:是指使用因特网技术,允许人们实时地传送文本、语音、视频和数据文件等信息软件系统。其特点是能让用户可以选择性地接收或拒接默认的信息,也可以同一时间与多人进行交流。即时通信系统的设计要求:数据通信完整与可靠性通信安全性通信效率和公平性系统可控性系统稳定性能即时通信系统的结构:即时通信系统主要分为三大部分:服务器端、客户端和注册数据库。软件主要包括节点命名和信息资源命名模块、节点的定位模块、通信模块,以及其他具体的功能服务模块等部分。即时通信系统的核心功能模块如下:节点命名部分实现对节点的命名,从而为区别不同用户创造条件。共享信息资源命名部分实现不同在线用户在Internet上位置的确定。通信服务接口模块是即时通信系统的核心功能模块和具体功能模块之间的接口。即时通信系统为用户提供的具体功能服务模块如下:聊天服务实现用户之间直接通信和好友上线提醒信息资源索引提供位于在线用户计算机上的共享文件索引节点索引提供在线用户索引系统互连提供一个开放的接口,以便与非本系统用户互联代理服务为不能直接建立通信的用户提供代理可以根据需要为用户扩展新功能。33. Huffman编码的基本原理是什么?Huffman编码按信源符号出现的概率大小进行排序,出现概率大的分配短码,出现概率小的则分配长码。(Huffman编码体现了统计编码的思想。它对于出现频率大的符号用较少的位数来表示,而对于出现频率小的符号用较多的位数来表示。其编码效率主要取决于需编码的符号出现的概率分布,越集中则压缩比越高。)哈夫曼编码的两个不足:1.它必须精确地统计出原始文件中每个值的出现频率,如果没有这个精确统计, 压缩的效果就会大打折扣,甚至根本达不到压缩的效果。2它对于位的增删比较敏感。算术编码比哈夫曼编码的优点:前者按照分数比特逼近熵,后者按照整数比特逼近熵;前者可以有效的从模型中分离出来,后者是与统计模型强相关的34. 简述多媒体技术的发展方向?(1)高分辨率,提高显示质量 (2)高速度化,缩短处理时间(3)简单化,便于操作 (4)智能化,提高信息识别能35.分布式多媒体计算机系统的基本特征:1.多媒体综合性:信息的采集、存储、加工、传输都是通过不同的载体而进行的。单一的信息载体都是单一的媒体,单一媒体的采集、存储、传输都有自己的理论和专门的技术。而把上述多种媒体综合在一起,就叫多媒体一体化。2.资源分散性:资源分散性是分布式多媒体系统的一个基本特征。3.运行实时性:多媒体的引入要求分布式计算机系统必须解决实时性,才能应用到分布式多媒体系统中去。4.操作交互性:是指分布式系统中发送、传播和接收各种多媒体信息时,采用实时交互式操作方式,随时可以对多媒体信息进行加工、处理、修改、放大和重新组合。5.系统透明性: 系统透明性是分布式系统的主要特征。分布式多媒体系统中要求透明,主要是因为系统中的资源是分散的,用户在全局范围内,使用相同的名字可以共享全局的所有资源。36. 分布式多媒体系统的层次结构1.多媒体接口层提供的功能和服务:a.实现多媒体输入的模/数转换b.实现多媒体输出的数/模转换c.对输入的数据打上时钟标记2.多媒体传输层提供的服务:a.采用各种协议提供多媒体数据b.可实现从远程发送来的数据与本地的数据具有相同的机制,并对高层提供支持。3.流管理层提供的服务:a.数据员通过下层传输层获取多媒体数据流b.向目的地和高层提交多媒体数据c.对单一媒体如音频和视频进行压缩编码处理等d.流输入的选择和分发4.多媒体表示层提供的服务:a.流间和流内的同步b.综合同步多媒体数据c.对特定流进行处理5.应用层支持在网络环境下各种多媒体资源的共享,支持实时的多媒体输入和输出,支持系统范围透明的存取,支持在网络环境交互式的操作和对多媒体信息的获取、加工处理、存储、通信和传输等。37.支持流媒体传输的网络协议:1.实时传输协议RTP与RTCP .RTP(Real-time Transport Protocol)是用于Internet上针对多媒体数据流的一种传输协议。RTP被定义为在一对一或一对多的传输情况下工作,其目的是提供时间信息和实现流同步。RTP通常使用UDP来传送数据,但RTP也可以在TCP或ATM等其他协议之上工作。RTP传输协议 有如下一些特点:协议的灵活性数据流和控制流分离协议的可扩展性和适用性2.实时流协议RTSP.实时流协议RTSP(Real-time Streaming Protocol)是由Real Networks和Netscape共同提出的。该协议定义了一对多应用程序如何有效地通过IP网络传送多媒体数据。RTSP在体系结构上位于RTP和RTCP之上,它使用TCP或RTP完成数据传输。使用RTSP时,客户机和服务器都可以发出请求,即RTSP可以是双向的。RTSP的特性如下:可扩展性易解析安全独立于传输多服务器支持记录设备控制流控与会议

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论