第4章 多媒体数据知识_第1页
第4章 多媒体数据知识_第2页
第4章 多媒体数据知识_第3页
第4章 多媒体数据知识_第4页
第4章 多媒体数据知识_第5页
已阅读5页,还剩121页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章多媒体数据知识基础、王丽、多媒体数据知识基础、图形图像知识基础数字音频基础数字视频基础、一、图形图像知识基础、针对视觉系统颜色的感知图像颜色模型(RGB模型和CMYK模型) 图像的分辨率图像的像素深度矢量图和位图(位图)灰度图和彩色图图像文件形式,一般视觉可见光是波长380nm到780nm之间的电磁波,我们看到的光不是一个波长的光,而是组合许多不同波长的光。 研究表明,人的视网膜中有红、绿、蓝三种对颜色敏感程度不同的锥体细胞,另一种是在光功率极低的条件下工作的棒状细胞,因此颜色只存在于眼和脑。 人类对视觉系统颜色的感知可以归纳为以下特性:眼睛本质上是相机的红、绿、蓝三种锥体细胞对不同频率

2、光的感知程度不同,对不同亮度的感知程度也不同自然界的任何颜色都是r、g、 b三个色值之和,通常可以用三个量来测量人类对颜色的感知,色调:自然界中光源、气候、季节和环境的变迁,本来就存在各种色调,不同颜色的物体一定会复盖一定的亮度、色相的光源颜色,各个固有颜色的不同物体表现会复盖统一的色彩倾向,这种统一的色彩是自然界饱和度:图像的颜色饱和度或鲜明度,如果将单个图像的饱和度降低到100,则图像将具有灰度亮度。 图像的明暗度的平衡,决定明暗色调的强度。 二、图像的颜色模型RGB和CMY、图像的颜色模型、发出光波的物体称为有源物体,该颜色由该物体发出的光波决定,不发出使用RGB相加混色模型的波的物体称

3、为受体,该颜色由该物体吸收或反射哪个光波决定显示1彩色图像用RGB相加混色模型,用于电视机和计算机显示器的阴极射线管是有源物体。 CRT是使用3个电子枪分别产生红(Red )、绿(Green )和蓝(Blue种波长的光,以各自的相对强度统一产生颜色,彩色显像管产生颜色的原理,理论上任何颜色都能以3种基本颜色以不同的比例混合。 三色光的强度越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也不同,光到达不了眼睛,就会变得漆黑。 当三原色以不同强度相加时,整体光强增强,并且可以获得任何颜色。 单击颜色与这三种颜色之间的关系,方法是将颜色r (红色的百分比) g (绿色的百分比) b (蓝

4、色的百分比)与混色相加,然后使用公式Red (红色) Green (绿色)=Yellow (黄色)。 图像中的各个点称为像素,每个像素都有一个称为像素值的值,代表特定颜色的强度。 一个像素值通常由r、g、b三个分量表示。 中的组合图层性质变更选项。 如果每个像素的每个颜色分量由二进制单位表示,则每个颜色分量只有两个值“1”和“0”。 也就是说,每种颜色的强度为100%或0%。 在这种情况下,每个像素显示的颜色是八种可能的颜色之一。8色、RGB色000黑001蓝010绿011蓝、RGB色100红101品红110黄111白、打印彩色图像用CMYK减去混色模型,将用彩色油墨或颜料混合得到的颜色称为减

5、法颜色。用该方法生成的颜色称为减法颜色是由于在视觉系统中识别颜色所需的反射光减少了。 图像处理中,通常不采用CMYK模式,但该模式的图像文件由于空间大,另外,photoshop提供的多个过滤器不能使用,所以仅在打印时将图像颜色模式转换为该模式。 在减法混色中,在三原色同量减法时得到黑色的等量的黄色(y )和品红色(m )为减法青色(c )为0时,得到红色(r )的等量的青色(c )和品红色(m )为减法黄色(y )为0时,得到蓝色(b )。 等量的黄色(y )和青色(c )减去品红色(m )为0时,得到绿色(g )。减法混色、三、图像分辨率、我们经常遇到的分辨率有五种:画面分辨率、图像分辨率、

6、像素分辨率、打印机分辨率、扫描仪分辨率、1画面分辨率、画面分辨率是指能够在显示器上显示的像素数。 例如,如果屏幕分辨率为640480,则显示器将分割为480行,每行显示640个像素,整个显示器包含307200个显影点。 画面上可显示的像素越多,显示设备的分辨率越高,显示的画质也越高。 屏幕分辨率取决于计算机的图形卡,有LCD和CRT、计算机显示器两种:液晶显示器LCD(liquid crystal display )一般是CRT显示器计算机CRT显示器显示画面上的各彩色点由表示r、g、b三种模拟信号的相对强度决定,这些彩色点构成彩色图像。 2图像分辨率、图像分辨率是指构成一张图像的像素密度的测

7、定方法。 对于相同大小的插图,构成插图的图像的像素越多,图像的分辨率越高,显得越真实。 相反,图像显得粗糙。 扫描仪扫描彩色图像时,通常指定图像的分辨率,以每英寸的点数(DPI(dots per inch ) )表示。 以300DPI的速度扫描810个彩色图像可获得24003000像素的图像。 分辨率越高,像素数越多。 图像分辨率和画面分辨率是两个不同的概念。 图像分辨率是决定构成一张图像的像素数,显示分辨率是决定画面图像的区域尺寸。 如果显示器分辨率为640480,则320240的图像仅占显示器的四分之一,而24003000的图像无法在此显示器上显示完整的屏幕。 3像素分辨率、像素分辨率是指

8、显像管荧光屏上1像素点的宽度与长度之比。 例如,捕捉图像时,如果图像管的像素分辨率为2:1,生成图像的图像管的像素分辨率为1:1,则该图像会变形。 4打印机的分辨率或输出分辨率是打印输出的分辨率界限,决定打印机的打印质量。 分辨率高,可以减少印刷的锯齿边缘,灰度的半色调表现也变得平滑。 通常用dpi (点/英寸)表示。 每台24针打印机的比率是180dbi,并且喷墨或激光打印机可以达到300、600甚至1200dpi .5扫描仪的分辨率,这表示扫描仪每英寸长度扫描的像素数是单个光学分辨率: 1200dpi输出分辨率: 2400dpi,4、像素深度、像素深度(颜色深度)和像素深度是用于存储每个像

9、素的位数,也用于测量图像的分辨率。 (音频数字化时的采样位数)像素深度决定彩色图像的每像素可能的颜色数或灰度图像的每像素可能的亮度级数。 例如,一个彩色图像的每个像素由三个颜色r、g、b分量表示,如果每个分量是8比特,则一个像素可以由24比特表示,像素深度是24,并且每个像素可以是224=16 777 216颜色中的一个。 在这个意义上,像素深度通常被称为颜色深度。 表示像素的位越多,表示的颜色就越多,深度就越深。六、图形和图像、矢量图和位图(位图),在计算机中,要表现图像和计算机生成的图形图像,请使用“矢量图”(vector based image )和“位图”(bit mapped ima

10、ge )方法几何(矢量图)、几何(图形)是从点、线、面到三维空间的黑白或彩色的几何图。 几何图形格式是一组命令,用于描述几何图形(如点、线和面)的大小、形状及其位置和维数。 图形文件也称为向量图,因为它仅记录了生成图形的算法和图形上的一些特征点。 图像(位图/位图)和图像(图像)是由像素位图组成的屏幕。 静止图像是描述构成图像的每个点(称为像素点pixel )的强度和颜色等信息的矩阵。 这样的图像也称为“位图”(bit-mapped picture )。 将图形与图像进行比较时,位图文件所占的内存容量较大。 影响位图文件大小的主要因素有两种:图像分辨率和像素深度。 分辨率越高,构成图表的像素数

11、越多,图像文件越大;像素深度越深,表示各个像素的颜色和亮度的位数越多,图像文件越大。 向量图文件的大小主要取决于图的复杂性。 矢量图形快,文件的数据量图像多,但图像表现的自然不真实。 由于矢量图形是以命令提供颜色作为绘制实体的残奥参数,所以图形的颜色数与文件大小无关,图像像素所占的二进制位数与图像的颜色数有关,颜色越多,文件数据越大的矢量图案即使进行放大缩小旋转等操作,也不会产生歪斜,图像会产生歪斜,特别是放大数倍的话会变成大粒子状,缩小的话可能会吃掉一部分像素点的内容。 所述向量图与位图之间可以以软件来进行转换,其中向量图到点位图的转换采用栅格化技术,并且其中所述用于将点位图从相对容易的点位

12、图转换成向量图的跟踪技术在理论上是可选的。 七灰度图和彩色图、一灰度图、灰度图(gray-scale image )被分为灰度等级的数据。 只有黑白两种颜色的图像称为单色图像。 图中的每个像素的像素值按比特存储,其值只有“0”或“1”,640480的单色图像需要占用37.5 KB的存储空间。标准单色图和标准灰度图、彩色图像、彩色图像(color image )可以根据颜色的数量分开,例如,256色图像或真彩色(2241677216色)。 将256色的标准图像转换为256灰度的图像,上图是将256色的标准图像转换为256灰度的图像,彩色图像的各像素的r、g和b的值用1字节表示,640480的8位

13、彩色图像需要307.2 KB的存储空间。 (6404801307200byte ),基于真彩色图像转换的256灰度图像,上图是基于真彩色图像转换的256灰度图像,每个像素的r、g和b分量分别用1字节表示,在640480的真彩色图像中,保持921.6 km/s (6404803921600byte ),许多24位彩色图像存储为32位,这种额外的8位称为alpha通道,其值称为alpha值,用于表示此像素如何产生特效。 真彩色显示的图像需要较大的存储空间,网络传输也需要较长的时间。 由于人的视角系统的色分辨率不高,所以在不需要使用真彩色的情况下尽量不使用。 八图像文件格式、图像文件格式、BMP G

14、IF JPG PCX TIFF、图像压缩、图像数字化后的数据量非常多,在因特网上传输很花时间,在保存到盘时占据“地盘”,所以不压缩图像数据压缩的目的是满足存储容量和传输带宽要求,而且成本很高。 图像压缩和图像数据压缩主要基于两个基本事实实现: 一个是图像数据有很多重复数据,能通过用数学方法表现这些重复数据来减少数据量。 另一事实是人眼对图像的细节和颜色的认识是有限的,甚至去除超出限度的部分也达到了数据压缩的目的。 利用前者的事实的压缩技术是可逆压缩技术,利用后者的事实的压缩技术是不可逆压缩技术。 实际的图像压缩可以组合各种有损压缩技术来实现,BMP (相对文件大小) BMP是最常见的位图格式之

15、一,也是Windows系统中的标准格式。 BMP格式支持RGB。 不支持alpha通道的索引颜色、灰度和位图颜色模式。 GIF格式GIF是压缩的8位图像文件,广泛用于网络传输,最多只有256种颜色。 新的GIF89a格式可以以透明的背景格式(支持alpha通道)保存,将多个图像存储为一个文件,创建动画效果,并支持位图、灰度或索引颜色模式的图像JPEG格式JPEG是一种高效的压缩格式,可以在归档时删除人眼看不见的数据,从而节省存储空间。 JPEG格式支持RGB和灰度颜色模式,而不支持alpha通道。 JPEG格式是有损压缩,通过有选择地删除数据来压缩文件。 与GIF图像相比,它包含更多有关颜色的

16、信息,具有颜色真实、文件小的优点。 多媒体和网页使用的照片和图像,适合以JPEG格式存储。练习、二、数字音频的基础、掌握声音的基本常识了解声音的数字化过程了解常见的音频文件格式,一声的基本知识、一声的基本常识、声音因空气振动而引起耳膜的振动,被人的耳朵感知。 本质上,空气的振动会产生声波。 人耳感觉到的声音范围是2020kHz人的声音范围是3003kHz,空气的振动,空气的振动形成声波,1 .声音的三要素,研究表明,一般的声音是由很多不同频率的正弦信号组合而成的。 正弦波有频率、振幅、相位三个重要的残奥仪表。 声音的三个要素是音调、声音的强度、音色。 基本频率和音调、频率是指信号在1秒内变化的

17、次数。 人对音频的感觉表现为音调的高低,在音乐中被称为音高。 音调由频率决定。 音乐中音阶的区分是用频率的对数坐标(20log )等分的东西。 谐波和音色,nO被称为o的谐波成分,也被称为倍音。 音色取决于混入基音的泛音,但谐波越丰富,音色就越有明亮和通透的力。 由于高次谐波的不同,振幅An和相位偏移n也不同,可以得到各种各样的音色效果。 宽度和声音很强,人耳对声音细节的识别只有在强度适度时才最敏锐。 人的听觉响应与强度呈对数关系。 一般人只能感知3分贝的声音的强烈变化,细分没有什么意义。 我们用音量表现声音的强度,用分贝(dB=20log )单位表现。 当处理音频信号时,绝对强度可以放大,但是其相对强度可以更加含义,并且描述构成复合信号的频率范围,该复合信号通常被

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论