第5章_数字媒体及应用_第1页
第5章_数字媒体及应用_第2页
第5章_数字媒体及应用_第3页
第5章_数字媒体及应用_第4页
第5章_数字媒体及应用_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、5.1 文本与文本处理5.2 图像与图形5.3 数字声音及应用5.4 数字视频及应用掌握文本的基本常识了解并掌握图形与图像的类型及应用声音的种类及声音的应用视频的基础知识5.1.1 字符的编码5.1.2 文本准备5.1.3 文本的分类5.1.4 文本编辑、排版与处理5.1.5 文本的展现文字处理是计算机应用的基础计算机应用=使用计算机进行信息处理信息的形态有多种:文字、数值、语言、音乐、图像,其中文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。 5.1.1字符的编码 字符、字符集及其码表字符、字符集及其码表 文字的基本元素是字母和符号,统称为“字符” (character

2、),它包括:字母、数字、标点、符号等字符集:一组特定字符的集合不同的字符集包含的字符数目与内容不同,如:中文字符集、西文字符集、日文字符集等 字符的编码:字符集中每个字符都使用二进位(code) 表示,称为该字符的编码不同的字符其编码各不相同字符集中所有字符的编码的一览表,称为该字符集的码表西文字符的编码ASCII码码西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成美国标准信息交换码(American Standard Code for Information Interchange, 简称ASCII码): ASCII字符集包含96个可打印字符和32个控制字符 采

3、用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符存在问题: (1)7位代码空间太小(只能对128个字符编码) (2) 不同国家和地区使用不同的字符集及其编码,互不兼容 (3) 东亚地区使用的大字符集无法编码汉字如何编码汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素汉字的特点:数量大;多个国家和地区使用;字形复杂,同音字多,异体字多如何编码? (1) 确定收入多少字、哪些字? (2)汉字在字符集中的排序方式 (3) 确定使用的代码结构和代码空间常用的汉子编码字符集国家标准GB2312汉字扩充规范 GBK国家标准GB18030台湾地区的标准汉字字符集C

4、NS 11643 (BIG 5,俗称“大五码”)日本工业标准汉字字符集JIS X 0208-90韩国国家标准汉字字符集KSC 5601-87GB2312汉字编码收入字符 6763个汉字和682个非汉字字符字符排列方式 GB2312汉字的编码汉字的编码(1)每一个GB2312汉字使用16位(2个字节)表示(2)每个字节的最高位均为“1” 第1字节 第2字节11 GB2312汉字编码的不足之处汉字编码的不足之处 GB2312汉字字数太少,无法满足一些特殊应用的需要:人名、地名;古籍整理、古典文献研究。没有繁体字 编码效率不高: (6763+682)/65536 与ASCII码不兼容几种汉字编码的对

5、比几种汉字编码的对比标准名称标准名称GB2312GBKGB18030UCS字符集6763个汉字(简体字)21003个汉字(包括GB2312汉字在内)27 000多汉字(包括GBK汉字和CJK及其扩充中的汉字)包含10万字符,其中的汉字与GB18030相同编码方法双字节存储和表示,每个字节的最高位均为“1”双字节存储和表示,第1个字节的最高位必为“1”部分双字节、部分4字节表示UTF-8单字节可变长编码 UTF-16双字节可变长编码兼容性编码保持向下兼容 5.1.2文本的准备 文字符号输入计算机的方法光学字符识别光学字符识别条形码条形码/磁卡磁卡/IC卡卡/RFID识别识别键盘输入键盘输入联机手

6、写输入联机手写输入语音输入语音输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入键盘输入:(1)数字编码, 如电报码、区位码等, (2)字音编码, 如智能ABC ,(3)字形编码,如五笔字形和表形码等, (4)形音编码发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法联机手写输入:优点:自然,流畅,小型化,适合移动计算不足:识别速度和正确性还需提高书写要求还要降低语音输入:优点:自然,方便,适合移动计算不足:a 对说话人、说话方式、说话内容的适应能力要大大增强 b 识别速度和正确性还需大大提高光学字符识别:扫描仪条形码/磁卡/IC卡/RFID(射频)

7、识别汉字的键盘输入汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码”优秀的汉字键盘输入编码应具有的特点:易学习、易记忆效率高(平均击键次数较少)重码少容量大(可输入的汉字字数多)类型类型原理原理举例举例优点优点缺点缺点数字编码使用一串数字来表示汉字电报码区位码仅使用10个数字键难记忆字音编码把汉语的拼音作为汉字的输入编码智能ABC搜狗微软拼音输入简单易学,适合于非专业人员重码多,需增加选择操作,不会汉语拼音或不知道读音时无法使用字形编码把汉字的部件或笔画作为码元,按照汉字结构及其切分规则作为编码依据,确定每个汉字的输入代码五笔字形表形码郑码重码少、输

8、入速度较快,适合于专业录入员、打字员使用缺乏统一的规范,编码规则不易掌握音形编码(或形音编码)采用字音及字形两种属性作为码元的汉字编码输入方法粤音输入法同上同时要掌握音、形两种取码方法或规则,对普通用户比较困难5.1.3文本的分类按是否具有排版格式分 简单文本简单文本(纯文本纯文本 ) (1)没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是 .txt (2)由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息 丰富格式文本丰富格式文本 (1)有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本” (2)丰富格式文本中,除了正

9、文内容之外,还使用了许多“标记”来描述字符的属性和格式的设置。按文本内容的组织方式分线性文本 内容的组织为线性(顺序),读者总是按顺序一页一页往下读超文本 若干文本或文本中的各个部分可按照其内容的关系互相链接起来,可以通过链接进行跳转、导航、回溯等操作,从而形成 “超文本”小结:文本类型文本类型特点特点在计算机内的表示在计算机内的表示文件扩文件扩展名展名用途用途简单文本没有字体、字号和版面格式的变化,文本在页面上逐行排列,也不含图片和表格由一连串与正文内容对应的字符的编码所组成,几乎不包含任何其他的格式信息和结构信息.txt网上聊天短信文字录入丰富格式文本(线性文本)有字体、字号、颜色等变化,

10、文本在页面上可以自由定位和布局,还可插入图片和表格除了与正文对应的字符编码之外,还使用某种“标记语言”所规定的一些标记来说明该文本的文字属性和排版格式等.doc.rtf.htm.html.pdf公文论文书稿网页丰富格式文本(超文本)除上述特征外,文本中还含有超链,使文本呈现为一种网状结构同上,但还应包含用于指出“链源”和“链宿”的标记.doc.rtf.htm.html.pdf.hlp同上,以及软件的联机文档(帮助文件)5.1.4文本的编辑、排版与处理文本的编辑和排版功能:对字、词、句、段落进行添加、删除、修改等操作文字的格式处理:设置字体、字号、字的排列方向、间距、颜色、效果等段落的格式处理:

11、设置行距、段间距、段缩进、对称方式等表格制作、绘制图形和编辑图像定义超链接页面布局(排版):设置页边距、每页行列数、分栏、页眉、页脚、插图位置等文本处理功能 使用计算机对文本中所含文字信息的形、音、义等进行分析和处理:在字、词(短语)层面:字数统计、自动分词、词性标注、词频统计等在句子层面:语法检查、文语转换(语音合成)、文种转换(机器翻译)等在篇章层面:关键词提取、文摘生成、文本分类、文本检索等在信息安全和存储传输层面:加密、压缩等常用文字处理软件 Microsoft office、Adobe Acrobat、WPS等5.1.5文本的展现(输出)目的:阅读、浏览或打印文本使用的软件:文本阅读

12、器/文本浏览器嵌入在文本编辑(处理)软件中,如微软的Word,独立的软件:如Adobe公司的Acrobat Reader,微软公司的IE等 文本展现的过程:对文本的格式描述进行解释生成文字和图表的映像(bitmap)传送到显示器或打印机输出5.2.1 数字图像的获取5.2.2 图像的表示与压缩编码5.2.3 数字图像处理与应用5.2.4 计算机图形5.2.1数字图像的获取图像的数字化 (1)从现实世界中获得数字图像的过程称为图像的“获取” (2)常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等 (3)图像获取过程: 将彩色图像取将彩色图像取样点的颜色分样点的颜色分解成解成R,G,B三个基

13、色三个基色测量每个取样点测量每个取样点的每个分量(基的每个分量(基色)的亮度值色)的亮度值对取样点每个分对取样点每个分量的亮度值进行量的亮度值进行A/D转换,使用转换,使用数字整型量表示数字整型量表示数字图像获取设备扫描仪、数码相机等图像的表示与压缩编码数字(取样)图像的组成数字取样图像由M(列) N(行)个取样点组成取样点是组成数字取样图像的基本单位,称为“像素”彩色图像的像素通常由3个彩色分量组成灰度图像和黑白图像的像素只包含1个亮度分量例1:黑白图象的表示黑白图像的每个像素只有一个分量,且只用1个二进位表示,其取值仅“0”(黑)和“1”(白)两种黑白图像例2:灰度图象的表示灰度图像的每个

14、像素也只有一个分量,一般用812个二进位表示,其取值范围是:02n-1,可表示2n个不同的亮度灰度图像灰度图像例3:彩色图象的表示彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设3个分量分别用n,m,k个二进位表示,则可表示2n+m+k种不同的颜色红红色色分分量量绿绿色色分分量量蓝蓝色色分分量量数字(取样)图像的主要参数图像大小(图像分辨率):用来表示组成该图像的行列数目,亦即图像所包含的像素数目,使用 水平分辨率x垂直分辨率 表示,对在屏幕上显示出来的大小有影响。颜色空间类型:指彩色图像所使用的颜色描述方法,也叫颜色模型,如:RGB(红、绿、蓝)模型,显示器使用;CMYK(青、品红

15、、黄、黑)模型,彩色打印机使用;HSB(色彩、饱和度、亮度)模型,用户界面中使用;YUV(亮度、色度)模型,彩色电视信号传输时使用。像素深度,即像素的所有颜色分量的二进位数目之和图像类型图像类型像素的组成像素的组成像素深度像素深度(位数位数)颜色数颜色数单色图像黑白图像仅1个分量1位2灰度图像仅1个分量216位465536彩色图像彩色图像3个分量以上836位28236图像的压缩编码数字图像数据量的计算公式(以字节为单位): 图像数据量=水平分辨率垂直分辨率像素深度8 几种常用格式的图像的数据量:例:数字图像传输时间的计算: 假设数据传输速率为56 kb/s(电话上网),则传输一幅分辨率为640

16、480的6.5万种颜色的未压缩图像的时间为: (640 x480 x16)/56000 = 87.8秒 颜色数目颜色数目图像大小图像大小8位位(256色)色)16位位(65536色)色)24位(位(1600万万色)色)640480300KB600KB900KB1024768768KB1.5MB2.25MB128010241.25MB2.5MB3.75MB数字图像的压缩图像数据压缩的必要性:节省存储数字图像所需要的存储器容量提高图像的传输速度,减少通信费用 图像数据压缩的可能性:数字图像中有大量的数据冗余人眼视觉有局限性,允许图像有一些失真图像数据压缩的两种类型:无损压缩:用压缩后的数据还原出来

17、的图像没有任何误差有损压缩:用压缩后的数据还原出来的图像有一定的误差压缩编码方法的评价压缩倍数的高低(压缩比)重建图像的质量(有损压缩时)压缩算法的复杂程度常用图像文件格式名称名称压缩编码方压缩编码方法法性质性质 典型应用典型应用开发公司开发公司(组织)(组织)BMP不压缩无损Windows 应用程序MicrosoftTIFRLE,LZW(字典编码)无损桌面出版Aldus,AdobeGIFLZW无损因特网CompuServeJPEGDCT(离散余弦变换)、Huffman编码大多为有损因特网,数码相机等ISO/IECPNGLZ77派生的压缩算法无损因特网等W3C图像文件格式例图像文件格式例1:B

18、MP格式格式 BMP图像格式是Windows操作系统下使用的一种标准图像格式支持单色、16色、256色、真彩色图像一个文件一幅图像,可以进行无损压缩,也可不压缩非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows 应用软件都能支持图像文件格式例图像文件格式例2: GIF 图像图像颜色数目不超过256色 ,适合用作插图、剪贴画等色彩数要求不高的场合,文件特别小,适合网络传输GIF图像格式具有累进显示功能,适合网络浏览器观看 GIF图像格式能支持透明背景(JPEG不支持)GIF图像格式能支持动画图像文件格式例图像文件格式例3:JPEG图像图像 JPEG是静止图像数据压缩编码的国际标准

19、,采用JPEG标准的图像文件扩展名是 .jpgJPEG特别适合各种连续色调的彩色或灰度图像,在计算机和数码相机中已得到广泛应用 JPEG的最新标准是JPEG2000(图像文件扩展名是 .jp2 ),它采用更先进的技术,可取得更好的效果5.2.3数字图像处理与应用使用计算机对借住照相机、摄像机、传真机、扫描仪、医用CT机、X光机等设备获取的图像,进行去噪、增强、复原、分割、提取特征、压缩、存储、检索等操作处理,成为数字图象处理。目的:提高图像的视觉质量图像复原与重建图像分析图像数据的变换、编码和数据压缩图像的存储、管理、检索,以及图像内容与知识产权的保护等图像处理软件Windows 操作系统自带

20、画图软件和映像软件,Office 中的Microsoft Photo Editor和Picture Manager软件等典型软件:Adobe PhotoShop主要功能:图像的显示控制图像区域的选择图像的编辑操作图像的滤镜操作绘图功能文字编辑功能图层操作数字图像处理的应用 图像通信,包括图像传输、电视电话、电视会议等。 遥感 医疗诊断 工业生产中的应用,如产品质量检测,生产过程自动控制等 机器人视觉 指纹图像 军事、公安、档案管理等其他方面的应用 X光图像光图像CT图像图像核磁共振核磁共振图像图像指纹图像指纹图像虹膜图像虹膜图像5.2.4计算机图形景物的计算机表示计算机绘图:使用计算机描述景物

21、的结构、形状和外貌,然后根据其描述和用户的观察位置及光线的设定,生成该景物的图像。计算机绘图过程建模建模/造型造型(Modeling)景物的景物的模型模型(model) 绘绘 制制(Rendering)(Image Synthesis)景物景物的视图的视图景物的两种描述(建模)方法几何造型几何造型技术技术规则形体规则形体(如工业产品如工业产品)用基本的几何元素用基本的几何元素(如如点、线、面、体等点、线、面、体等)及及材料的表面性质等进材料的表面性质等进行描述行描述 过程模型技过程模型技术术不规则形体不规则形体(如自然现象如自然现象)找出其生成规律,并使用找出其生成规律,并使用相应的算法来描述

22、相应的算法来描述 建模方法计算机图形的绘制在计算机中建立了景物的模型之后,按照该模型在显示屏幕上生成用户可见的具有真实感的该景物图像的过程,称为图像绘制或图像合成。计算机图形的应用计算机辅助设计和辅助制造(CAD/CAM)利用计算机制作各种地形图、交通图、天气图、海洋图、石油开采图等作战指挥和军事训练计算机动画和计算机艺术电子游戏、出版、数据处理、工业监控、辅助教学等领域矢量绘图软件AutoCADARCInfoPROTELSuperMap GIS5.3.1 波形声音的获取与播放5.3.2 波形声音的表示与应用5.3.3 波形声音的编辑与播放5.3.4 计算机合成声音5.3.1 波形声音的获取与

23、播放声音信号的数字化声音的特性和类型声音由振动产生,通过空气进行传播声音是一种波,它由许多不同频率的谐波组成谐波的频率范围称为声音的“带宽”计算机处理的声音类型:话音或语音(speech),专指人的说话声音,带宽仅为3003400Hz全频带声音(如音乐声、风雨声、汽车声等),其带宽可达到20Hz20kHz 人耳可听到的声音统称“可听声”(audio) ,20Hz20kHz数字波形声音的获取取样的目的是把时间取样的目的是把时间上连续的信号转换成上连续的信号转换成时间上离散的信号时间上离散的信号量化是把每个样本从模量化是把每个样本从模拟量转换成为数字量拟量转换成为数字量(8位或位或16位整数表示位

24、整数表示)将所有样本的二进制将所有样本的二进制代码组织在一起,并代码组织在一起,并进行数据压缩进行数据压缩数字波形声音的获取设备声波转换为电信号声音的脱机获取设备:数码录音笔麦克风麦克风(microphone)声音卡声音卡(sound card)模拟声音模拟声音取样、量化和编码数字声音数字声音 声音的重建与播放计算机输出声音分为两步:声音的重建:把声音从数字形式转换成模拟信号形式,由声卡完成声音播放:将模拟声音信号经处理和放大后送到音箱(扬声器)普通音箱接收的是重建的模拟声音信号数字音箱直接接收数字声音信号,失真更小重建的模拟声重建的模拟声音信号音信号数字声音数字声音011010011101插

25、插 值值数模转换数模转换解解 码码把压缩编码的数把压缩编码的数字声音恢复为压字声音恢复为压缩编码前的状态缩编码前的状态把声音样本把声音样本从数字量转从数字量转换为模拟量换为模拟量把时间上离散的一组把时间上离散的一组样本转换成在时间上样本转换成在时间上连续的模拟声音信号连续的模拟声音信号5.3.2 波形声音的表示与应用波形声音的主要参数数字化的波形声音是一种使用二进制表示的按时间先后组织的串行比特流。取样频率:语音的取样频率低,一般为8kHz全频带声音(如音乐)的取样频率高,一般为44.1kHz量化位数:通常为8位、12位或16位声道数目:单声道为1,双声道为2压缩编码方法码率(比特率):每秒钟

26、的数据量数字波形声音码率的计算未压缩时数字波形声音的码率计算公式: 码率=取样频率量化位数声道数(单位:bit/s)压缩编码之后数字波形声音的码率为: 压缩后的码率 = 未压缩时的码率/压缩倍数 声音类型声音信号带宽(Hz)取样频率(kHz)量化位数(bits)声道数未压缩时的码率数字语音3003 40088164 kb/sCD立体声2020 00044.11621411.2(kb/s)波形声音的文件类型及其应用数字波形声音的数据量很大,例如: 数字语音1小时的数据量大约是30MB CD立体声高保真的数字音乐1小时的数据量大约是635MB数据压缩的必要性:为了降低存储成本和提高在网络上的传输效

27、率数据压缩的可能性:声音中包含了大量冗余信息;人耳的灵敏度有限,允许有一定失真根据采用的编码方法的不同,波形声音文件有多种类型音频音频格式格式文件扩文件扩展名展名编码类型编码类型效果效果主要应用主要应用开发者开发者WAV.wav未压缩声音达到CD品质支持多种采样频率和量化位数微软FLAC.flac无损压缩压缩比为2:1高品质数字音乐Xiph.OrgAPE.ape无损压缩压缩比为2:1高品质数字音乐Matthew TM4A.m4a无损压缩压缩比为2:1QuickTime,iTunes 苹果公司MP3.mp3有损压缩压缩比为812:1因特网,MP3音乐ISOWMA.wma有损压缩压缩比高于MP3因

28、特网,音乐微软AC3.ac3有损压缩压缩比可调,支持5.1、7.1声道DVD,数字电视,家庭影院Dolby公司AAC.aac有损压缩压缩比可调,支持5.1、7.1声道DVD,数字电视,家庭影院ISO5.3.3 波形声音的编辑与播放波形声音编辑软件的功能编辑声音:如声音剪辑、复制、调节音量声音的效果处理:如混响、回声等录音声音的格式转换播放声音声声音音编编辑辑软软件件的的典典型型用用户户界界面面数字声音数字声音的参数的参数左声道左声道信号波形信号波形右声道右声道信号波形信号波形时间刻度时间刻度播放标尺播放标尺计算机合成声音什么是计算机合成声音?计算机合成声音就是计算机模仿人说话或演奏音乐计算机合

29、成声音有两类:A 计算机合成语音:计算机模仿人把一段文字朗读出来,即把文字转换为语音(简称为 TTS)应用:有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务等B计算机合成音乐:计算机模拟各种乐器发声并按照乐谱演奏音乐应用:计算机作曲、配器等计算机合成音乐(MIDI)音乐音乐合成器合成器音乐音乐MIDI文件文件媒体媒体播放器播放器MIDI消息消息声卡上的音乐合成器声卡上的音乐合成器能像电子琴一样模仿能像电子琴一样模仿几十种不同的乐器发几十种不同的乐器发出声音,它按照出声音,它按照MIDI消息合成出不同音色消息合成出不同音色和音调的音符,通过和音调的音符,通过扬声器播放出音乐来扬声器播

30、放出音乐来 乐谱在计算机中使用一乐谱在计算机中使用一种叫做种叫做MIDI的音乐描述的音乐描述语言来表示。使用语言来表示。使用MIDI描述的音乐称为描述的音乐称为MIDI音音乐。一首乐曲对应一个乐。一首乐曲对应一个MIDI文件,其文件扩展文件,其文件扩展名为名为 .MID或或 .MIDI媒体播放器软件相当于媒体播放器软件相当于“演奏员演奏员”。播放。播放MIDI音乐时,它先从磁盘上音乐时,它先从磁盘上读入读入.MID文件,解释其文件,解释其内容,然后以内容,然后以MIDI消息消息的形式向声卡上的音乐的形式向声卡上的音乐合成器发出各种指令合成器发出各种指令音乐合成器PC机声卡一般都带有MIDI音源

31、(音乐合成器)MIDI音源有两种:调频合成器(一种受控的电子振荡器)。音色单调,效果较差,已很少使用波表合成器。音色丰富,效果很好,可扩展,现广泛使用 波表合成器的原理预先将真实乐器演奏的各个音符的波形数字化,把它们组织成一个个波表文件存放在存储器中低通滤波低通滤波采样、量化采样、量化加工处理加工处理乐器演奏波表波表文件文件录音录音播放时合成器软件根据乐器类型和音符参数等将相应的波形数据修饰成所要求的音强和时长,然后合成、加工后播放MIDI的优点:A 数据量极小(比CD立体声少3个数量级,比MP3少3个数量级)B 易于制作和编辑修改C可以与波形声音同时播放MIDI的不足:A 只能合成音乐,不能

32、合成歌曲和语言B 音质与硬件设备相关5.4.1 数字视频基础5.4.2 数字视频的压缩编码和文件格式5.4.3 数字视频的编辑5.4.4 计算机动画5.4.5 数字视频的应用5.4.1数字视频基础电视基本知识PAL制彩色电视信号的制彩色电视信号的颜色远距离传输时,不颜色远距离传输时,不使用使用RGB表示,而是使表示,而是使用亮度信号用亮度信号Y和两个色度和两个色度信号信号U、V来表示来表示 为进行远距离传为进行远距离传输必须进行调制输必须进行调制 RGBYUV 复合复合 调制调制摄像机摄像机 话筒话筒发射天线发射天线RGBYUV分路分路解调解调接收天接收天线线将将Y、U、V信号信号转换成为转换

33、成为R、G、B 信号,然后再信号,然后再进行显示进行显示视频信号的数字化数字视频的优点复制和传输时不会引起信号质量下降,容易进行编辑修改,有利于传输(抗干扰能力强,易于加密),节省频率资源等视频信号数字化工具视频采集卡视频获取器视频缓冲器电视编码器叠加/彩色转换DSP图形控制器显示存储器主存储器CPU硬盘模拟视频输入电视/录像机RGB显示器视频卡显卡总线视频卡的功能:从多种视频源中选择一种作为视频输入;支持不同的电视制式;能同时处理图像信号的伴音;可在显示器上监看输入的视频信号, 其位置及大小可调;能将计算机生成的图像/图形/文本与视频图像迭加处理;可随时冻结(定格)一幅画面,并按指定格式保存

34、;可 实时压缩与存储视频及其伴音信息;可 实时解压缩并播放视频及其伴音信息,输出设备可选(VGA监视器、电视机、录相机等)数字摄像头分辨率为352288 800600速度一般在30fps(每秒30帧)左右镜头的视角可达到45-60度 支持USB接口 或IEEE1394(火线)接口成像器件采用CMOS或CCD数码摄像机提供640 480以上的分辨率,清晰度高自动对焦,自动曝光 使用MPEG-2进行压缩编码,然后记录在硬盘上具有录音功能数据量很大,采用USB接口或IEEE1394接口 5.4.2 数字视频的压缩编码和文件格式视频数据压缩的可能性: 数字视频的数据量大得惊人,1分钟的标准清晰度(72

35、0 576)数字电视未压缩时其数据量约1GB,对存储、传输和处理都有很大的困难视频数据压缩的可能性: 视频信息的每个画面内部有很多信息冗余相邻画面的内容有高度的连贯性人眼的视觉灵敏度有限,允许画面有一定失真结论:数字视频的数据量可压缩几十倍甚至几百倍数字视频的三类编码标准数字视频的三类编码标准ITU-T国际标准:H.261(Px64)标准、 H.263标准等ISO/IEC 国际标准: MPEG-1标准, MPEG-2标准(等同于ITU-T H.262), 用于低分辨率、低码率视频应用的MPEG-4 ASP, 代表当前技术水准的MPEG-4 AVC视频编码标准(等同于ITU-T H.264),在

36、HDTV、蓝光盘、XBOX、iPod、iPhone等众多领域得到推广应用。公司标准:Intel公司的IndeoVideo,苹果公司在QuickTime中使用过的Cinepak, Real Network公司的RealVideo,微软公司的 WMV,Adobe公司Flash播放器中使用的VP6等几种常用标准及其应用范围名 称图像格式压缩后的码率主要应用MPEG-1360288大约1.2 Mb/s 1.5Mb/s适用于VCD、数码相机、数字摄像机等H.261360288 或180144Px64 kb/s (P=1、2时,只支持180144格式,P6时,可支持360288格式)应用于视频通信,如可视

37、电话、会议电视等MPEG-2 (MPML)7205765 Mb/s 15Mb/s 用途最广, 如DVD、卫星电视直播、数字有线电视等MPEG-2高清格式144011521920115280 Mb/s 100Mb/s高清晰度电视(HDTV)领域MPEG-4ASP分辨率较低的视频格式与MPEG-1,MPEG-2相当,但最低可达到64kb/s 在低分辨率低码率领域应用,如监控、IPTV、手机、MP4播放器等MPEG-4 AVC多种不同的视频格式采用多种新技术,编码效率比MPEG-4ASP显著减少 已在多种领域应用,如HDTV、蓝光盘、IPTV、XBOX、iPod、iPhone等文件格式.asf、.w

38、mv、.mov、.rm、.rmvb、.flv、.f4v等均支持流式传输,能很好地在因特网上进行音/视频流的实时传输和实时播放,得到了广泛应用文件格式文件格式文件扩展名文件扩展名开发者开发者MPEG.dat、.mpg、.mpeg、.mp4、.vob、.3gp、.3g2等国际标准AVI.avi微软ASF.asf微软QuickTime.mov、.qt苹果RM.rmReal NetworkRMVB.rmvbReal NetworkFLV.flvAdobeF4V.f4vAdobe5.4.3 数字视频的编辑例:简单的视频编辑软件 Windows Movie Maker 由微软公司开发,在Windows X

39、P平台上运行功能:通过摄像机、数字摄像头或其他视频源将音频和视频捕获到计算机中打开已有的音频、视频或静止图片,对音频与视频内容进行编辑(包括添加片头、使用视频过渡或特技效果等)将制作的视频保存到硬盘中,或刻录在CD或DVD光盘上,供“媒体播放器”进行播放 5.4.4 计算机动画(1)什么是计算机动画?计算机动画使用计算机生成一系列内容连续的画面供实时演播的一种技术,它是一种计算机合成的数字视频,而不是用摄像机拍摄的“自然视频”上世纪九十年代开始,计算机动画技术应用于电影特技,如电影侏罗纪公园 、 玩具总动员、泰坦尼克等,取得轰动效应应用领域:影视和广告领域:电影特技、动画片、电视广告制作等教育

40、和培训领域:辅助教学、驾驶员训练等科技领域:科学计算可视化,复杂系统的动态模拟军事领域:军事训练、作战模拟等游戏(2)计算机动画的制作过程计算机动画制作包括:在计算机中建立景物的模型、描述它们的运动、生成一系列逼真的图像三维计算机动画制作过程分以下几个阶段:描述景物的形状与结构(建模)确定景物的颜色和材质(纹理)设置灯光和确定虚拟摄像机的位置描述场景中物体的运动和摄像机的移动绘制一系列的图像输出动画结果动画制作软件著名的造型与动画制作的商品化软件:加拿大Alias公司的Power animator 法国TDI公司的Explore荷兰ElectroGIG公司的3DGO加拿大Vertigo公司的Vertigo美国Wavefront公司的Advanced Visualizer美国SGI公司Alias和Wavefront 公司的MAYA美国Autodesk公司Discreet公司的3ds max,Animator Studio互联网动画:GIF和FlashGIF图像文件中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论