第4章 数字媒体基础(new).ppt_第1页
第4章 数字媒体基础(new).ppt_第2页
第4章 数字媒体基础(new).ppt_第3页
第4章 数字媒体基础(new).ppt_第4页
第4章 数字媒体基础(new).ppt_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 4 章数字媒体基础,目录,现代信息技术,3大特征: 采用电子技术(包括激光技术) 以数字技术(计算机)为基础 以软件为核心 内容: 计算机、微电子、通信、广播、遥感遥测、自动控制、机器人等 其中微电子、通信和数字技术是三项最核心的技术。,4.1 数制转换及其运算,数字技术就是用0和1两个数字来表示、处理、存储和传输一切信息的技术。,一、信息的基本单位-比特,1. 什么是比特,数字技术的处理对象是“比特” bit 二进位数字、二进位、位 两种状态:0或1,比特是计算机和其他数字系统处理、存储和传输信息的最小单位,一般用小写的字母“b”表示。,西文字母-8个比特表示 汉字-16个比特表示 稍大

2、些的计量单位是字节,一般用大写的字母“B”表示. 一个字节包含8个比特,它们习惯上采用下面的顺序排列,b7是字节的最高位, b0是其最低位。,比特这个单位太小了,(1)计量单位 bit(位),Byte(字节) 8bit=1Byte,2. 比特的存储,(2)存储二进制信息时的度量单位,B, KB, MB, GB, TB 1KB=210B=1024B 1MB=220B=1024KB 1GB=230B=1024MB 1TB=240B=1024GB 与千进位的区别,例2: 1GByte=( )bit 1GByte=1024*1024*1024*8 =8Gbit,例1: 1Mbit=( )Byte 1M

3、bit =1024*1024/8 =128KByte,千比特/秒(Kb/s) 1Kb/s=103b/s=1000b/s 兆比特/秒(Mb/s) 1Mb/s=106b/s=1000Kb/s 千兆(吉)比特/秒(Gb/s) 1Gb/s=109b/s=1000Mb/s 太比特/秒(Tb/s),3. 比特的传输,(传输速率 b/s 也称bps),任何形式的信息都需要转化为二进制编码. 1.各种进制及其转换 十进制 十种状态,逢十进一 (0,1,2,3,4,5,6,7,8,9) 二进制 两种状态,逢二进一 (0, 1) 八进制 八种状态,逢八进一 (0,1,2,3,4,5,6,7) 十六进制 十六种状态

4、,逢十六进一 (0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F),二、 比特与二进制数,例如:135.67(10)=1*10+3*10+5*100+6*10+7*10 135.67 (8)=1*8+3*8+5* 80+ 6* 8+7*8=93.86 (10) 101.01 (2) = 1*2+0*2+1* 20+ 0* 2+1*2 =5.25 (10),每个符号处在不同的位子,表示不同的意义。,二(八、十六)进制 十进制,各进制之间转换,按权展开,例1:(1101.101)2=( ? )10 (1101.101)2=1*2+1*22+0*21+1*20 +1*2- 1 + 0*

5、2-2+1*2-3 = (13.625)10 例2: (345.7)8=3*82+4*81+5*80+7*8-1 =(229.875)10 例3:(2AB.C)16=( ? )10 (2AB.C)16=2*162+10*161+11*160+12*161 =(427.75)10,十进制 二(八,十六)进制,整数部分:除2(8,16)取余 小数部分:乘2(8,16)取整,2 107 . 1 (低位) 2 53 . 1 2 26 . 0 2 13 . 1 2 6 . 0 2 3 . 1 2 1 . 1 (高位) 0,例4:例:(107.675)10=( ? )2,0.675 高位 *) 2 1 .

6、 1.350 0.350 *) 2 0 . 0.700 0.700 *) 2 1 1.400 低位,= (110 1011)2 =(0.101) 2 (107.675)10=(110 1011.101)2,以此类推,八进制 二进制 十六进制 二进制,例4: (357.6)8=(011 101 111. 110)2 例5:(3C6.E) 16=(0011 1100 0110. 1110)2 例6:(11101.01)2=(011 101. 010)2=(35.2)8 例7:(11101.01)2=(0001 1101. 0100)=(1D.4)16,3位二进制-1位八进制 4位二进制-1位十六进

7、制 首尾补零,凑足三位(四位),二 十 八 十六,八进制 十六进制,三、 比特的运算,1.算术运算,规则:0+0=0 0+1=1 1+0=1 1+1=10,B)减法,规则:0-0=01-0=1 0-1=1 1-1=0,C)乘法 D)除法,A)加法,例1:10010100+00110010 10010100 + ) 00110010 11000110 例2:110001011001001 11000101 ) 10010010 00110011,例题,2.逻辑运算,规则:00=0 0 1=1 1 0=1 1 1=1,规则:0 1=0 1 0=0 0 0=0 1 1=1,C)取反 ( 非),0变成

8、1,1变成0,B)逻辑乘“与”( ),A)逻辑加“或”(),例1:10010100 00110010 10010100 ) 00110010 10110110 例2:1001010000110010 10010100 ) 00110010 00010000,例3:(10010100)反=? (10010100 )反=01101011 注意: 算术运算 按位运算, 有进位,借位 运算种类:加,减 逻辑运算 按位独立运算, 无进位,借位 运算种类:逻辑加、逻辑乘和取反,练习(1),1. 110101101)2=( )8=( )16 2. 11011011+10101010= ( ) 3. 1011

9、1010-10011001= ( ) 4. 1000110010101011= ( ) 5. 1011010110110011=( ),练习 (1),6. (85)10=( )2=( )16 7. (147)10=( )2 8. (70)8=( )2=( )16 9. (7B)16=( )10 10. (9C)16=( )2=( )8,练习 (2),1. 64Kb/s = ? B/s 2. 传输速率为9600b/s,则每分钟能传送多少字节?,答案 (1),1. (655)8 ,( 1AD)16 2. 110000101 3. 00100001 4. 10101111 5. 10110001 6

10、. (1010101)2 ; (55)16 7. (10010011)2 8. (111000)2 ; (38)16 9. (123)10 10. (10011100)2 ; (234)8,答案 (2),1. 8192B/s 2. 72000B,练习,有一个数值311,它与十六进制数C9相等,则该数值是用 表示的。 A二进制 B八进制 C十进制 D五进制,解:设此数为X进制,则 3*X2+X+1=12*16+9 解此方程得X=8,B,练习,如果PC机用56K的Modem拨号上网,那么下载一个大小为5.6MB的文件,理论上最快需要略多于 秒的时间。 A. 10 B. 100C. 800D. 60

11、00,解:5.6*1024*1024*8/(56*1024)800,C,计算机可以处理各种各样的信息 如:数值、文字、图形、声音、命令、程序等。 这些信息在计算机内部都是用比特(二进位)来表示的。,4.2 常用数据在计算机中的表示,4.2.1 数值型数据,数值信息的表示,数据分为:数值,非数值 计算机中的数据全是二进制 用八位二进制数表示一个字节 数值分为整数和实数两大类 整数不使用小数点,或者说小数点始终隐含在个位数的右边,所以整数也叫“定点数”。,整数分为: 正整数(不带符号的整数即正整数) 整数(带符号的整数) 它们可以用8位、16位、32位甚至64位来表示。 正整数取值范围: 8位:0

12、255(28 1) 16位:0 65535 (216-1) 32位:0 232-1 带符号的整数取值范围: 正数最高位用0表示,负数最高位用1表示 8位:-127(-27+1)+127(27-1) 16位:-215+1+215-1,整数中负数的表示 原码,反码,补码 原码的形式: 0 = 正 ; 1 = 负 例如: +43=00101011 (-43)原=10101011 负数采用补码表示 补码的作用:统一加减法的运算规则,精简机构 反码的形式:符号位仍为1,绝对值部分取反 例如: (-43)反=11010100 补码的形式:符号位也是1,反码的最低位加1 例如: (-43)补=1101010

13、1 再例如: (-56)原=10111000 (-56)反=11000111 (-56)补=11001000,正整数无原码、反码与补码之分,是相同的。,实数(浮点数)的表示 实数是既有整数又有小数的数.纯小数是特例. 一个实数可以表示成一个纯小数和一个乘幂之积 56.725=102(0.56725) -1894.0475=104(-0.18940456) 0.0034756=10-2(0.34756) 二进制完全雷同:1001.011=2100(0.1001011) 即一个实数可用指数和尾数唯一表示,这种表示方法叫做“浮点表示法”。 尾数:由纯小数组成 指数:由整数组成 尾数指数表示法可表示的

14、数的范围大,精度也高。,4.2.2 文本型数据,分为 西文字符 汉字,一、西文字符集,目前计算机中使用最广泛的西文字符集是美国标准信息交换码(American Standard Code for Information Interchange)也叫做标准ASCII码。 使用7个二进位对字符进行编码,用字节表示,最高位为“0”。 基本的ASCII字符集共有128个字符(取值范围:0-127) 96个可打印字符(常用字母、数字、标点符号等) 32个控制字符 特殊字符的ASCII码 空格(32) A(65) a(97) 0(48),ASCII字符集,(1)GB2312-80汉字编码 1981年颁布第

15、一个国家标准:信息交换用汉字编码字符集基本集(GB2312-80),由下面几部分组成: 第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个(统称为GB2312图形符号) 第二部分:一级常用汉字,共3755个, 按汉语拼音排列 第三部分:二级常用字,共3008个, 按偏旁部首排列,二、汉字的编码(6万多),汉字6763,所有字符7445,区位码: GB2312的所有字符分布在一个94行*94列的二维平面内,行号称为区号,列号称为位号。每一个汉字或符号在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位

16、号分别用1个字节来表示, 如:“大”字的区号20,位号83,区位码是20 83 用2个字节表示为:00010100 01010011,区位码,国标交换码: 问题:信息通信中,汉字的区位码与通信使用的控制码(00H1FH)发生冲突。 解决方案:为了避免汉字区位码与通信控制码的冲突,ISO2022规定,每个汉字的区号和位号必须分别加上32(即二进制0010 0000)。 经过这样处理得到的代码称为汉字的“国标交换码”(简称交换码)。因此,“大”字的交换码是: 00110100 01110011。,国标交换码,机内码: 问题:文本中的汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,

17、它与单字节的标准ASCII码就会混淆不清。 解决方法:把一个汉字看作两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位(b7)都等于“1”。这种高位为l的双字节(16位)汉字编码就称为GB2312汉字的“机内码”,又称内码。 如:“大”字的内码是:10110100 11110011(B4F3),机内码,各种码制之间的转换,区位码+(2020H)=国标码 国标码+(8080H)=机内码 区位码+(A0A0H)=机内码,注意:公式中的所有编码采用十六进制形式。,(2)GBK汉字内码扩充规范 问题:GB2312-80只有6763个汉字,在信息处理时经常不够使用。 解决方法:1995年发布

18、GBK,全称为汉字内码扩展规范GBK字符集中一共有21003个汉字和883个图形符号,它与GB2312国标汉字字符集及其内码保持兼容。 GBK/1:GB2312中的符号;GBK/2:GB2312中的全部汉字; GBK/4和GBK/3:包括繁体字在内的大量汉字;GBK/5:符号。 例如計算機係等繁体汉字和冃冄円冇鎔等生僻的汉字。,GBK汉字规范目前已经得到了较好的应用。微软公司的Windows简体中文版操作系统均采用GBK代码。,汉字字符集,GB2312-80 区位码、国标码、机内码 GBK GB18030 Unicode,3、文本的获取,键盘输入,(1)数字编码, 如电报码、区位码等, (2)

19、字音编码, 如智能ABC等 (3)字形编码,如五笔字形和表形码等, (4)形音编码 发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法,优点: 自然,流畅 小型化,适合移动计算 不足: 识别速度和正确性还需提高 书写要求还要降低,优点: 自然,方便,适合移动计算 不足: 对说话人、说话方式、说话内容的适应能力要大大增强 识别速度和正确性还需大大提高,识别率已达到98% 功能: 简、繁体字混合识别 中文、西文混合识别 文字、表格混合识别 智能校对功能,技术上非常困难,还无法实用 目前准备先突破工整的楷书手写体的识别!,汉字的键盘输入,汉字与键盘上的键无法一一对应,因此必须使

20、用几个键来表示一个汉字,这就称为汉字的“键盘输入编码” 优秀的汉字键盘输入编码应具有的特点: 易学习、易记忆 效率高(平均击键次数较少) 重码少 容量大(可输入的汉字字数多),汉字键盘输入方法的比较,文本的分类,简单文本(plain text):这种文本通常称为纯文本,在PC机中的文件后缀名是.txt。“记事本” 特性:是最通用的文本文件格式,文件体积小,阅读不受限制,几乎所有的文字处理软件都能识别和处理,但它没有字体、字号的变化,不能插入图片、表格等,不能建立超链接。,简单文本(纯文本),文本的格式化(字体、字型、字号、颜色、文字走向,页面布局等)。 丰富格式文本 RTF格式,丰富格式文本,

21、超文本的应用 Windows等一些软件中的“帮助”文件 使用浏览器从Web服务器上下载的网页(html或htm文件) 超媒体(Hypermedia):超文本中的节点不单是文本节点,还包含图形、图像、声音或动画节点,这种基于多媒体信息结点的超文本,有时也称为“超媒体” 。,超文本,小结:文本的分类,(1)面向通信的文本处理软件 计算机网络上最普及的应用是用电子邮件进行通信。大多数情况下电子邮件正文的内容一般都是简单文本,因此电子邮件内嵌的文本编辑器功能比较简单,操作使用方便。 典型软件:微软公司的Outlook Express,具有文字的增、删、改以及字体、字号的设置功能,也可以设定一些简单的格

22、式和插入一些图片。当然邮件所带的附件并不受此限制。在互联网上进行聊天所使用的文本处理软件更加简单。,常用文本处理软件,(2)面向办公的文本处理软件 功能要求: 文本制作的高效率、高质量 软件面向非专业用户,易学好用 文本处理能力,既功能丰富,又操作简单 排版功能 典型软件: MS-Office WPS2000 永中Office中的文本处理软件,(3)面向出版的文本处理软件 排版软件的主要功能:将文字、图形和图像等合理地安排在页面内。 典型排版软件: 方正集团公司的“飞腾”排版软件。 PageMaker和PDF Writer。,文本的输出,当显示某个汉字时,通过汉字的国标码找到该汉字在字库中的位

23、置,将字模取出并显示出来。 点阵字库 轮廓字库,一类是从现实世界中通过扫描仪、数码相机等设备获取的图像,称为点阵图像(dot matrix image)或位图图像(bitmap image)简称图像(image) 另一类是使用计算机合成(制作)的图像(synthetic image),称为矢量图形(vector graphics),简称图形(graphics),数字图像按生成方法分类,4.3 图像与图形,数字图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤: 扫描 分色 取样 量化(A/D转换),一、 数字图像的获取,4.3.1 图像,设备:从现实世界获得数字图像过程中所使用的设备通称

24、为数字图像获取设备 设备的功能:将现实的景物输入到计算机内并以取样图像的形式表示 2D图像获取设备(如扫描仪、数码相机等)只能对图片或景物的2D投影进行数字化 3D扫描仪能获取包括深度信息在内的3D景物的信息,二、数字图像获取设备,分辨率 800600,1024768等 颜色模型 RGB、CMYK、HSV、YUV等 位平面数目 3 4 像素深度 24,三、图像的基本参数,RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等,都可以相互转换。,四、图像的保存格式,常用的图像文件的数据格式有BMP、TIFF、GIF、JPEG、PCX以及TGA格式

25、等,BMP(BitMaP-file)图像:微软公司在Windows操作系统下使用的一种标准图像文件格式,几乎所有Windows应用软件都能支持。 TIFF(Tagged Image File Format)图像文件格式:用于扫描仪和桌面出版,能支持多种压缩方法和多种不同类型的图像,有许多图像图形应用软件支持这种文件格式。,GIF(Graphics Interchange Format):互联网上广泛使用的一种图像文件格式,它的颜色数目较少,文件特别小,适合网络传输。尤为突出的是,它可以将许多张图像保存在同一个文件中,显示时按预先规定的时间间隔逐一进行显示,从而形成动画的效果,因而在网页制作中大

26、量使用。,五、图像的压缩,不进行压缩,一幅图像的数据量非常巨大,计算公式是: 图像数据量=水平分辨率垂直分辨率像素深度/8 几种常用图像的数据量,图像数据压缩的可能性:由于数字图像中的数据相关性很强,数据的冗余度很大,因此对数字图像进行大幅度的数据压缩是完全可能的。而且,人眼的视觉有一定的局限性,即使压缩前后的图像有一定失真,只要限制在人眼允许的误差范围之内,也是允许的。,图像的压缩,图像的压缩,无损压缩 基于统计概率的方法 哈夫曼编码、算术编码等 基于字典的技术 游程编码、LZW编码等 有损压缩 快速傅里叶变换(FFT)或离散余弦变换(DCT)等,图像处理软件与应用领域密切相关,通常具有很强

27、的专业性,如遥感图像处理软件、医学图像处理软件等。 图像处理软件PhotoShop、Paint、ACDSee、PhotoEditor PhotoShop,集图像扫描、图像编辑、绘图、图像合成及图像输出等多种功能于一体,是一个流行的图像处理工具。,六、图像处理软件,图像的显示控制 图像区域的选择 图像的编辑操作 图像的滤镜操作 绘图功能 文字编辑功能 图层操作,PhotoShop的主要功能包括,图像处理软件,处理前图片上有划痕,处理后划痕被清除,图像的滤镜操作,背景图,前景图,复合后的图像,图层操作,图像通信 :传真、可视电话、视频会议 遥感 :航空遥感、卫星遥感 医疗诊断:X射线、超声、计算机

28、断层摄影(即CT)、核磁共振等 工业生产中的应用:质量检测、自动控制 机器人视觉 :军事侦察、危险环境作业等 军事、公安、档案管理,七、数字图像的应用,X光图像,CT图像,核磁共振图像,指纹图像,4.3.2 图形,图形通常是由计算机模拟产生的,一般以数学函数来描述其位置、大小、形状、色彩等属性 常见的图形编辑器有AutoCAD、CorelDraw、Adobe Illustrator、Freehand等,图形的应用,科学研究(直方图,百分比图等) 绘制勘测图形(地质图、天气图,海洋图,石油开发图,人口密度图等) 计算机辅助设计(CAD)和计算机辅助制造(CAM) 模拟及动画(飞行或驾驶的仿真系统

29、) 计算机辅助教学(CAI) 艺术和商业(绘制生产、销售、库存图表,制作广告等),小结:图像与图形的比较,计算机中的“图”按其生成方法可以分为两大类: 通过数字化设备获取的“图”,它们称为取样图像、点阵图像,或位图图像等,通常简称图像(image) 通过计算机建模并绘制而成的“图”,称为矢量图形,通常简称图形(graphics); 两者在外观上很难区分,但它们有许多不同的属性,一般需要使用不同的软件进行处理,图 形,4.4 音频与视频,声音:由振动而产生,通过空气进行传播。它由许多不同频率的谐波所组成,谐波的频率范围称为声音的带宽(bandwidth),带宽是声音的一项重要参数。 多媒体技术处

30、理的声音信号主要是人耳可听到的2020kHz的音频信号(audio) 语音:人说话的声音,其频率范围约为3003400Hz 全频带声音:音乐声、风雨声、汽车声等其他声音,其带宽可达到2020kHz,4.4.1 音频,声音信号的数字化:将模拟声音信号转换成数字编码形式以便于计算机进行处理的过程 声音信号数字化的过程: 取样 量化 编码,声音信号的数字化,模拟声音信号,取 样,量 化,编 码,数字声音,011010011101,常用声音文件格式,WAV MIDI MP3 MPEG-1标准的音频部分,根据压缩质量和编码处理的不同分为3层:Layer 1,Layer 2和Layer 3,分别对应“*.

31、mp1”,“*.mp2”和“*.mp3”文件 WMA RealAudio 主要适用于在网络上在线音乐欣赏,录音机和媒体播放器,录音机 Windows Media Player,Windows 附件“录音机”基本编辑操作: 录制声音 编辑声音 声音的效果处理 格式转换 播放声音,计算机合成声音,计算机合成语音的应用: 股票交易、航班动态查询、电话报税等业务 有声E-mail服务 CAI课件或游戏解说词的自动配音 文稿校对、语言学习、语音秘书、自动报警、残疾人服务等,语音合成,音乐是使用乐器演奏而成的 音乐的基本单元是一些音符 音符的属性: 音调:声波的基频 音色:由声音的频谱决定,不同乐器有不同

32、的音色 音强:声音的强度 旋律:乐曲中音符持续时间的变化 音源:也称为音乐合成器(music synthesizer),它能模仿许多乐器生成各种不同音色的音符。 PC机的声卡一般都带有音源。,音乐合成,4.4.2 视频,视频(Video)由许多幅按时间序列构成的连续图像,每一幅图像称为一个帧(Frame)。当每秒播放24帧以上的图像时,由于人眼的视觉效应就产生了连续运动的效果,通常视频图像还配有同步的声音。,视频基础,视频信号有模拟视频信号和数字视频信号 模拟电视存在三种电视制式:,视频信息的获取,获取视频信号的最主要的工具是数字视频摄像机(DV) 摄像头作为一种视频输入设备被广泛运用于视频会

33、议、远程医疗及实时监控,视频压缩编码(1),MPEG-1 MPEG-1主要适用于VCD、数码相机、数字摄像机等 也可用于数字电话网络上的视频传输,如视频点播(VOD)等 MPEG-2 适用于高清晰度电视(HDTV),还可用于有线电视网、电缆网络以及卫星直播提供的数字视频 MPEG-4 更注重多媒体系统的交互性和灵活性,对数据传输速率的要求较低,主要应用于可视电话、可视电子邮件以及远程监视和控制等,视频压缩编码(2),MPEG-7 不是一种压缩编码方法,而是一种多媒体内容描述接口,不针对某个具体的应用 可应用于数字图书馆,多媒体查询服务,广播媒体选择,多媒体编辑等 MPEG-21 正式名称是“多媒体框架”或“数字视听框架”,其目的是为所有使用多媒体信息的用户提供透明而有效的电子交易和使用环境,使得用户能以各种方式使用分布在全球不同设备上各种各样的多媒体信息,数字视频的编辑,数字视频的编辑处理:通常是在称之为非线性编辑器的软件支持下进行的,编辑时把电视节目素材存入硬盘中,根据需要对不同长短、不同顺序的素材进行剪辑,同时配上字幕、特技和各种动画,再进行配音、配乐,最终制作成高质量的电视节目。 核心软件:数字视频编辑器,如Adobe Premiere,数字视频的应用,可视电话和视频会议,可视电话:通话双方能互相看见的一种电话系统 电话机具有摄像、显

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论