




已阅读5页,还剩102页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多媒体技术基础,1.1多媒体技术的形成和发展,一、什么是多媒体?(理解)文本、声音、图形、图象和动画等是信息的载体,其中两个或多于两个的组合构成了多媒体。,多媒体技术内容:(理解)多媒体技术:运用计算机综合处理多媒体信息(文本、声音、图形、图像等)的技术,包括将多种信息建立逻辑连接,进而集成一个具有交互性的系统等等。,二、多媒体技术的特性(了解)(1)集成性(2)实时性(3)交互性(4)高质量,三、促进多媒体技术发展的关键技术(了解)1、CD-ROM2、高速计算机网络3、高速位处理技术、专用集成电路技术和亚微米集成电路技术4、多媒体压缩技术、人机交互技术和分布式技术,二、多媒体技术的发展过程及应用(了解)1、启蒙发展阶段2、初期应用和标准化阶段在我国,多媒体技术和应用的发展始于20世纪80年代。,1.2多媒体技术的分类(了解),按功能和应用分类:1、基于功能的分类(1)开发系统(2)演示系统(3)培训系统(4)家庭系统,2、基于应用的分类:(1)多媒体信息咨询系统(2)多媒体管理系统(3)多媒体辅助教育系统(4)多媒体通信系统(5)多媒体娱乐系统,1.3多媒体系统的组成(理解),1、计算机硬件2、多媒体计算机所配置的硬件3、多媒体I/O控制及接口4、多媒体的核心系统5、创作系统6、应用系统,1.4多媒体网络应用技术(了解),1、局域网定义:局域网LAN(LocalAreaNetwork)能够“把分散在一个建筑物或相邻几个建筑物中的计算机、终端、带大容量存储器的外围设备、控制器、显示器以及连接其他网络而使用的网络连接器等相互连接起来,以很高的速率(120Mbps)进行通信”。,功能(从应用角度):(1)设备共享(2)信息共享(3)可进行高速数据通信,进行多种媒体信息的通信(4)分布式处理(5)提高兼容性(6)安全性,2、广域网定义:WAN即WideAreaNetwork是在较大地理范围内将计算机连接起来的计算机网络。,3、因特网(1)internet的发展(2)internet提供的服务方式基本服务方式(电子邮件、文件传输、远程登录)扩展服务方式,第二章多媒体信息的表示与压缩,2.1文字一、西文(ASCII码)二、汉字(数字编码、拼音码、字型编码),2.2音频(Audio),定义:20HZ20KHZ的音频范围分类:波形声音、语音、音乐声音三要素:音调、音强、音色,一、数字音频,音频数字化:把模拟音频信号转换成有限个数字表示的离散序列。转换过程:选择采样频率,进行采样选择分辨率,进行量化形成声音文件,数字录音文件大小的计算:S=RD(r/8)1S以字节为单位,声音文件的格式:,WAV(waveform)au(audio)AIF(AudioInterchangeableFileFormat)snd(sound)为扩展名的文件格式VOC、MIDI、SNO、RMI文件,1、WAV文件存储容量大2、VOC文件3、MIDI文件用于音乐,与WAV文件不同,二、乐器数字接口(MIDI),MIDI信息实际上是一段音乐的描述,只记录产生某种声音的指令,指令中包括了使用MIDI设备的音乐、音量和持续时间长短信息。是数字化的乐谱,由音符序列、定时及合成音色的乐器定义组成。,三、数字化声音和MIDI的比较,MIDI信息实际上就是乐谱的数字表示。与波形声音相比,MIDI数据不是声音而是指令,因此它的数据量要比波形声音少的多。对MIDI的编辑很灵活,可以自由地改变曲调、音色等属性,波形声音就很难做到这点。波形声音与设备有关,MIDI数据与设备有关,即MIDI音乐文件所产生的声音与用来回放的特定的设备有关。数字化声音最重要的优点就是重放质量的一致性、可靠性比较好,可自始至终保证质量。,2.3视觉媒体,计算机的图形、图像均为视觉媒体表示方式:位图表示、矢量表示、曲线表示(动态图像)、符号表示一、图形、图像文件格式DIB、BMP、PCX、TIFF等,二、位图,又称点阵图,是一种写实的手法。能够忠实地记录图像中每一个象素的颜色和位置三、矢量图,四、矢量图与位图的比较,1、概念上:矢量图(图形)一般指计算机绘制的画面,如直线、圆、圆弧、任意曲线和图表等图像是指由输入设备捕捉的实际场景画面或以数字化形式存储的任意画面。,2、存储容量大小图像是由一些排成行列的像素组成的,在计算机中的存储格式有BMP、TIF、GIFD等。一般数据量比较大。除了可以表达真实的相片,也可以表现复杂绘画的某些细节,具有灵活和富于创造力等特点。在打印输出和放大时,容易发生失真。,图形也称矢量图文件中只记录生成图的算法和图上的某些特征点,容易进行移动、缩放、旋转和扭曲等变换,主要用于表示线框型的图画、工程制图、美术字等。常用的矢量图文件有3DS(用于3D造型)、DXF(用于CAD)、WMF(用于桌面出版)等。图形只保存算法和特征点,相对于位图的大数据量来说,它占用的存储空间也比较小。但是显示速度没有图像快,打印输出和放大时,质量较高不会发生很大失真。,五、监视器与颜色,监视器的分辨率分类:屏幕分辨率图像分辨率像素分辨率,2.4动画(animation),定义:指运动的画面。利用快速变换帧的内容达到运动的效果。制作工具:animation、Flash、3Dmax等,视觉暂留,计算机动画设计主要是为了能够生成和处理一连串的静态画面,并通过高速放映来欺骗人的眼睛,使人们相信屏幕上的画面是动态的。,计算机实现动画的两种方法,造型动画:对每一个活动的对象分别进行设计,并构造每一对象的特征,然后用这些对象组成完整的画面,进行实时转换,形成动画。,帧动画,是由一幅幅连续的画面组成的画像或图形序列,动画和视频,是连续渐变的静态图像或图形序列,沿时间轴顺次更换显示,从而构成运动视觉的媒体。动画:序列中每帧图像是人工或计算机产生的图像。视频:序列中每帧图像是通过实时摄取自然景象或活动对象。,动画技术参数,帧速度数据量图象质量,2.5超文本和超媒体,定义:超文本:由信息结点和表示结点间相关性的链构成的一个具有一定逻辑结构和语义的网络。超媒体:多媒体超文本,超文本主要成分:结点和表示结点间关系的链超文本系统的三层模型:数据库层超文本抽象机层用户接口层,2.6数据压缩,多媒体冗余信息:空域相关时域相关视觉掩盖效应,数字压缩技术三个重要指标,1、信息存储量之比大2、压缩的算法简单3、恢复效果好,基本原理,压缩编码:冗余压缩法(无损压缩法或熵编码)有损压缩法(熵压缩法),(一)变长编码,1、Huffman编码定义:对统计独立信源达到最小平均码长的编码方法,具有惟一可译性。基本原理:按信源符号出现的概率大小进行排序,出现概率大的分配短码,出现概率小的则分配长码。,编码过程,(1)将信源符号按概率递减顺序排列;(2)把两个最小的概率加起来,作为新符号的概率;(3)重复(1)和(2),直到概率和达到1为止;(4)在每次合并消息时,将被合并的消息赋予1和0或0和1;(5)寻找从每一信源符号到概率为1的路径,记录下路径上的1和0(6)对每一符号写出从码树的根到终结点1、0序列,2、算术编码定义:是一种二元码的编码方法,在不考虑信源统计的情况下,只要监视一小段时间内码出现的频率,不管统计是平稳的或非平稳的,编码的码率总能趋近于信源熵值,每次迭代时的编码算法只处理一个数据符号,并且只有算术运算。,原理:也是一种统计编码,每个符号对应0到1上的一段子区间,区间长度为该符号出现的概率。该方法将被编码的符号串(数值串)表示成实数0到1之间的一个区间。初始把它设为整个区间。当出现一个新的待编码符号,先把完整的0到1区间映射到上一次形成的区间,然后新区间取为0到1上的新符号对应区间所映成的像。解码时,根据区间的覆盖性来逐一解出原符号串。,预测编码:根据某一数据模型利用以往的样本值对新样本值进行预测,然后将样本实际值与预测值的差值进行编码。如果模型足够好,且样本序列的时间相关性较强,那么误差信号的幅度将远小于原始信号,可以用较少的值对其差值量化,得到较好的压缩效果。预测编码常用的是差分脉冲编码调制(DPCM)和自适应的差分脉冲编码调制(ADPCM)。,变换编码:是将通常在空间域描写的图像信号,变换到另外一些正交矢量空间(即变换域)中进行描写,而且通过选择合适的变换关系使变换域中描写的各信号分量之间相关性很小或者互不相关,从而达到数据压缩的目的。,模型编码:是指采用模型的方法对传输的图像进行参数估测。典型的有分形编码。,2.7音频信号的压缩编码,一、音频信号编码基础音频冗余主要表现为:时域冗余度频域冗余度,音频信号的编码方式:,(1)波形编码,如PCM、APC、ATC等(2)分析合成方法(参数编码方法)如PLC(3)混合编码方法,2.8视频信号的压缩编码,一、视频信号的压缩编码分类无损压缩:利用数据的统计特性来进行数据压缩,典型的编码:Huffman编码、算术编码等。不失真压缩比低有损压缩:利用人的视觉特性使解压缩后的图像看起来与原始图像一样。压缩比高如:预测编码、变换编码、模型编码及混合编码等。,二、视频信号压缩编码的标准,JPEG静止图像压缩算法MPEG运动图像压缩算法,视频压缩方式(补充):,MicosoftVideo1:使用8位有损压缩方法压缩模拟视频。它压缩后的动画尺寸大,而且在进行渐变色处理时会出现条纹。,INDEO:是专门处理局部动态影像和色彩、画质细腻的静态图像的压缩编码技术,压缩比低,且需要较高速的CPU才能确保播放品质。处理渐变色和火焰效果时会有严重的马赛克。,RadiusCinepak:这种有损压缩方法最初用于压缩24位视频,从而在CD-ROM驱动器上播放,图像质量好,播放速度快,能压缩成黑白动画。它的特点是压缩后尺寸小,渐变色外理时不会出现条玟和马赛克,压缩后火焰效果也不会出现马赛克。但如果使用贴图背景,背景会比较粗糙。,FullFrames:在将动画信息以数据流形式存储时,这种方法质量高并得到普便使用。这种方法形成的AVI文件需要大量的硬盘空间,但可为动画提供高质量的单个连续文件。因为它适合于很多机器类型并与桌面视频应用程序兼容,对交互式多媒体产品,是十分有效的。,JPEG和MPEG的差别,MPEG视频压缩技术是针对运动图像的数据压缩技术。为了提高压缩比,帧内图像数据和帧间图像数据压缩技术必须同时使用。MPEG通过帧运动补偿有效地压缩了数据的比特数,它采用了三种图像,帧内图、预测图和双向预测图。有效地减少了冗余信息。对于MPEG来说,帧间数据压缩、运动补偿和双向预测,这是和JPEG主要不同的地方。而JPEG和MPEG相同的地方均采用了DCT帧内图像数据压缩编码。,另外,MPEG中视频信号包含有静止画面(帧内图)和运动信息(帧间预测图)等不同的内容,量化器的设计比JPEG压缩算法中量化器的设计考虑的因素要多。,关于压缩比,衡量一个压缩算法好坏的标准,除了解压后的数据有无失真或失真程度之外,是看压缩比的大小。压缩比常用的定义有两种:(1)采样压缩比(2)比特压缩比,数字视频的制式,PAL制式NTSC制式,影响数字视频质量的因素,(1)帧速(2)分辨率(3)颜色数(4)压缩比(5)关键帧,三、多媒体制作,一、多媒体应用系统开发的一般步骤(1)确定开发对象(2)明确开发方法(3)准备多媒体数据(4)集成一个多媒体系统,二、多媒体数据制作概念,根据多媒体应用系统的需要,制作数字音频、数字图像、动画等文件,完成应用系统的多媒体数据准备工作。,3.1数字音频的制作,一、数字音频的制作过程1、音频概述声波的表示方法,2、数字音频的录制准备步骤(1)选择音源重要因素:音频的质量,(2)录制数字音频A、设置音频硬件配置B、选择采样率和量化位数C、设置音轨的音源和输出端口D、检测输入音频的强度,(3)音频的编辑和存储(4)音频的播放(硬件需求),3、产生失真的原因及解决方法,原因:(1)信号频带宽,但采样频率不够高,数字音频信号发生混叠;(2)模拟音频信号幅度太大,超过了量化器范围。,解决方法:前者:选择与信号相匹配的采样频率后者:可以调整音源的输出幅度或调节采集卡输入放大器的增益,也可选用音频卡的line输入端,而不用microphone输入端。,4、利用AudioEditor实现音频制作,(1)简介(2)数字音频的录制(3)音频特效制作,5、MIDI音乐的制作,(1)MIDI标准(2)MIDIMapper标准(3)Cakewalk编辑MIDI,6、数字视频的获取,数字视频信息获取与处理过程主要有采样、A/D变换、压缩、存储、解压缩、D/A变换。,7、利用AdobePremiere实现视频使用,8、3DStudioMax动画制作,补充:数字图象的制作,用数码相机摄取,利用图象处理软件进行处理,四、多媒体开发环境和工具,一、多媒体创作系统1、概念多媒体创作系统提供一种把内容和功能结合在一起的集成环境。,2、功能,(1)、视频图象的制作(2)、动画制作(3)、交互式演示系统(4)、展示系统,(5)、交互式查询系统(6)、交互式的训练(7)、仿真、厚型和技术的可视化,3、系统组成,素材库编辑播放,二、多媒体开发工具的类型与功能,1、类型(1)基于时间的创作工具(2)基于图标或流线的创作工具(3)基于卡片或页面的工具(4)以传统程序语言为基础的多媒体创作工具,2、功能,(1)优异的面向对象的编程环境(2)具有较强的多媒体数据I/O能力(3)动画处理能力(4)超级连接能力,(5)应用程序的连接能力(6)模块化和面向对象(7)友好的界面、易学易用,3、多媒体开发工具的特征,(1)编辑特征(2)组织特征(3)编程特征(4)交互式特征(5)性能精确特征(6)播放特征(7)提交特征,4、跨平台工具,多媒体开发的基本软件的特点,5、与多媒体创作工具相关的几个概念,(1)创作环境(2)创作系统(3)创作工具(4)集成工具,(五)多媒体应用系统的特点,一、多媒体应用系统的特点(1)增加计算机的友好性(2)涉及技术领域广、技术层次高(3)多媒体技术的标准化(4)多媒体技术的集成化和工具化,二、应用系统开发组三、应用系统开发的各阶段及其主要内容,从软件工程的角度分四阶段:(1)计划制定与成本估算(2)设计与制作(3)测试(4)提交,各阶段的主要任务,1、计划和成本估算软件计划成本估算,2、设计与制作,程序设计方法软件界面设计,3、测试,测试方法软件测试策略测试的复审排错技术,4、提交,软件质量度量模型软件质量评价过程模型软件具体评价软件维护,多媒体软件开发过程的理解,问题定义可行性研究需求分析总体设计详细设计编码测试运行和维护,五、多媒体卡,一、音频卡音频卡的主要功能:1、录制与播放2、编辑与合成,3、MIDI接口和音乐合成4、文语转换和语音识别5、CD-ROM接口6、游戏棒接口,音频卡的分类音频卡的工作原理(了解)主要组成部分:1、声音的合成与处理2、混合信号处理器及功率放大器3、计算机总线接口和控制器,音频卡的选择,根据处理的语音任务选择合乎需求的设备重要因素:三种WINDOWS声音选择音频卡的最重要原则符合MPC标准要求的卡,与MPC公布的标准相兼容的音频卡必须能记录和播放频率达22.05khz的音频,选择音频卡时应当注意下述几项指标:1、与Adlib和soundBlaster兼容能力2、支持16位采样带宽3、具备混音和合成能力4、采样频率最高能支持44.1khz,音频卡的基本技术指标,1、采样频率单位时间内的采样次数2、采样值的量化位数3、声道数4、合成器5、MIDI接口6、I/O设备支持7、即插即用8、兼容性,音频卡的安装,硬件安装软件安装搜索到新硬件,按系统的提示,一步步执行相应的操作即可。测试,二、视频卡,1、视频采集是指将视频信号数字化并记录到文件上的过程。在记录时,视频变成了一系列的图象或者帧,以一定格式存到磁盘上。采集视频的同时可以录制声音。,2、数字视频,数字视频与模拟信号相比的优点:A、不失真地
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 矿山承包协议合同范本
- 租车公司租车合同范本
- 装修班组劳务合同范本
- 食堂共同经营合同范本
- 隧道渣土运输合同范本
- 购买拆迁房签协议合同
- 门面租赁意向合同范本
- 矿山开采合作合同范本
- 软件销售人员合同范本
- 车间劳务派遣合同范本
- 政府法律顾问聘用合同
- 部编人教版六年级上册道德与法治全册教案
- 2025年共青团入团考试测试题库及答案
- 第13章第2节 人体免疫课件-2025-2026学年北师大版八年级上册生物
- 2025上海科技馆招聘高层次专业技术人才3人备考考试试题及答案解析
- 线路维护材料管理办法
- 2025年外企面试英语常见问题与答案解析
- 2025年6月浙江省高考物理试卷真题(含答案解析)
- 民宿课程题目大全及答案
- 2025年银行内部审计部门财务审计员竞聘考试指南
- 洗煤厂冬季三防知识培训课件
评论
0/150
提交评论