




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算机科学与工程系计算机科学与工程系大学计算机基础大学计算机基础(第七章)(第七章)多媒体技术多媒体技术华南农业大学信息学院华南农业大学信息学院主讲教师朱梅阶主讲教师朱梅阶计算机科学与工程系计算机科学与工程系 多媒体技术使得计算机具有综合处理声音、多媒体技术使得计算机具有综合处理声音、文字、图形、图像、动画和视频信息的能力,它文字、图形、图像、动画和视频信息的能力,它所涉及的有关多媒体信息数字化及数据压缩编码所涉及的有关多媒体信息数字化及数据压缩编码是问题求解的一个典型的计算思维活动。是问题求解的一个典型的计算思维活动。 本章主要介绍多媒体计算机硬件与软件方面本章主要介绍多媒体计算机硬件与软件
2、方面的基础知识,以及计算机中音频、图像等信息的的基础知识,以及计算机中音频、图像等信息的获取与处理、动画与视频的概念、多媒体数据压获取与处理、动画与视频的概念、多媒体数据压缩原理等方面的相关内容。缩原理等方面的相关内容。计算机科学与工程系计算机科学与工程系7.1 多媒体计算机技术概述多媒体计算机技术概述 在计算机或通讯领域,媒体是指信息的载体或者信息在计算机或通讯领域,媒体是指信息的载体或者信息的存储实体,信息载体包括数字、文字、声音、图形、图的存储实体,信息载体包括数字、文字、声音、图形、图像、视频;信息的存储实体包括磁盘、光盘、像、视频;信息的存储实体包括磁盘、光盘、U盘等。而就盘等。而就
3、多媒体计算机而言,媒体则是指信息载体。多媒体计算机而言,媒体则是指信息载体。 计算机科学与工程系计算机科学与工程系7.1 多媒体计算机技术概述多媒体计算机技术概述2.为传送和表达感觉媒体而人为为传送和表达感觉媒体而人为研究出来的媒体研究出来的媒体 (如如ASCII、汉字、汉字、图像、声音、视频编码等图像、声音、视频编码等)1.人类通过感观直接人类通过感观直接感知的信息感知的信息 (文字、文字、声音、图像等声音、图像等)3.输入和输出信息的媒输入和输出信息的媒体体(如键盘、鼠标、显如键盘、鼠标、显示器、打印机等示器、打印机等)4.存储表示媒体存储表示媒体的介质的介质 (软盘、软盘、硬盘、光盘等硬
4、盘、光盘等)5. 传输信息的媒体。传输信息的媒体。 (如光纤、电缆等如光纤、电缆等)感觉媒体感觉媒体存储媒体存储媒体传 输 媒传 输 媒体体显示媒体显示媒体显示媒体显示媒体表示媒体表示媒体计算机科学与工程系计算机科学与工程系7.1 多媒体计算机技术概述多媒体计算机技术概述 多媒体:通常是指文字、声音、图多媒体:通常是指文字、声音、图像、图形、动画、视频等各种媒体的组像、图形、动画、视频等各种媒体的组合。合。计算机科学与工程系计算机科学与工程系1文本:包含字母、数字、汉字等基本元素。文本:包含字母、数字、汉字等基本元素。 2图形:又称矢量图。图形:又称矢量图。7.1 多媒体计算机技术概述多媒体计
5、算机技术概述多媒体计算机的主要多媒体计算机的主要元素元素: : 计算机科学与工程系计算机科学与工程系3. 图像:又称位图或像素图。图像:又称位图或像素图。4. 动画:采用编程或动画软件创作的连续画面。动画:采用编程或动画软件创作的连续画面。编程或动画制作软件生成的画面编程或动画制作软件生成的画面7.1 多媒体计算机技术概述多媒体计算机技术概述计算机科学与工程系计算机科学与工程系5. 音频:指人耳能听到的连续变化的音波。音频:指人耳能听到的连续变化的音波。6. 视频:动态的影视图像。视频:动态的影视图像。 数字音频信号、压缩音频信号数字音频信号、压缩音频信号用电视摄像设备捕捉的实物场景用电视摄像
6、设备捕捉的实物场景7.1 多媒体计算机技术概述多媒体计算机技术概述计算机科学与工程系计算机科学与工程系 1984年,年,Apple公司推出公司推出Machintosh图形操作系统。图形操作系统。 1985年,世界上第一台多媒体计算机问世。年,世界上第一台多媒体计算机问世。 1986年,推出光盘系统。年,推出光盘系统。 1990年,多媒体个人计算机协会制定年,多媒体个人计算机协会制定MPC1标准。标准。 1995年,年,Windows95操作系统问世。操作系统问世。Apple计算机计算机(1984)Commodore Amiga系统系统(1984)7.1 多媒体计算机技术概述多媒体计算机技术概述
7、计算机科学与工程系计算机科学与工程系7.1 多媒体计算机技术概述多媒体计算机技术概述 多媒体特点是:多媒体特点是: (1) 多样性:多媒体不只处理一种媒体,而是综合处理多多样性:多媒体不只处理一种媒体,而是综合处理多种媒体,包括图文声像信息。种媒体,包括图文声像信息。 (2) 集成性:多媒体的集成性一方面表现在信息载体的集集成性:多媒体的集成性一方面表现在信息载体的集成,另一方面是多媒体设备的集成。成,另一方面是多媒体设备的集成。 (3) 交互性:多种媒体系统可以实现人机互动,用户可以交互性:多种媒体系统可以实现人机互动,用户可以根据需要来使用系统。根据需要来使用系统。7.1.3 多媒体技术的
8、特点和关键技术多媒体技术的特点和关键技术计算机科学与工程系计算机科学与工程系7.1 多媒体计算机技术概述多媒体计算机技术概述 多媒体技术涉及的领域众多,其关键技术主要表现在多媒体技术涉及的领域众多,其关键技术主要表现在以下几个方面:以下几个方面:关键技术关键技术涉及范围涉及范围数据的输入输出技术如何将声音、图像、视频、动画等信息方便、快速、准确地输入计算机,这些信息又如何准确地还原,是多媒体技术研究的首要任务。数据的压缩编码和解码技术多媒体信息的最大问题是数据量太大,要解决在有限空间中的存储和在有限带宽上的传输,数据压缩编码是最有效的方法,而与之对应的解码则实现对压缩数据进行还原。数据存储技术
9、音频、视频、图像等信息需要相当大的存储空间,因此发展大容量存储器的是解决多媒体信息存储的一个关键问题。虚拟现实技术利用计算机技术生成的一个逼真的具有视、听、触及嗅觉的感觉世界,可以用人的自然手法对这个虚拟实体进行交互动作。计算机科学与工程系计算机科学与工程系7.1 多媒体计算机技术概述多媒体计算机技术概述7.1.5 未来多媒体技术的发展未来多媒体技术的发展未来发展趋势未来发展趋势说说 明明多媒体技术智能化把人工智能领域某些研究课题和多媒体计算机技术很好地结合。例如,文字的识别和输入,汉语语音的识别和输入,自然语言理解和机器翻译,图形的识别和理解,机器人视觉和计算机视觉,知识工程以及人工智能的一
10、些课题。多媒体信息实时处理和压缩编码算法芯片化随着技术的进步,如果压缩算法采用国际标准设计原则,多媒体功能采用集中解决、体系结构设计和算法相结合的方案,就能够把多媒体信息实时处理和压缩编码算法直接放置到CPU芯片中,从而大大改善多媒体计算机的性能指标。虚拟现实技术虚拟现实技术是指运用多种技术综合形成一种模拟现实环境的人造环境,用户在该环境中通过五官和大脑的亲自体验和活动参与到该人造的、虚拟的环境中,可以与之交互。让你感觉到如同置身于真实世界一样。它是多媒体技术的最高境界。计算机科学与工程系计算机科学与工程系7.2 多媒体计算机系统多媒体计算机系统计算机科学与工程系计算机科学与工程系7.2 多媒
11、体计算机系统多媒体计算机系统 (1) 基本硬件设备基本硬件设备 光盘存储器光盘存储器(见第三章见第三章) 声卡声卡 用于处理声音,是多媒体计算机的基本配置。用于处理声音,是多媒体计算机的基本配置。声卡的基本工作原理声卡的基本工作原理计算机科学与工程系计算机科学与工程系7.2 多媒体计算机系统多媒体计算机系统 声卡中最为关键的三个部件分别是声卡中最为关键的三个部件分别是: 数字信号处理器数字信号处理器(DSP) 主要用于实现对声音的模主要用于实现对声音的模/数数(A/D)转换和数转换和数/模模(D/A)转转换。换。 混合信号处理器混合信号处理器(简称混音器简称混音器) 是用于实现对各种音频源进行
12、混音。是用于实现对各种音频源进行混音。 音乐合成器音乐合成器 声卡可以通过内部合成器或外接到计算机声卡可以通过内部合成器或外接到计算机MIDI端口的端口的外部合成器播放外部合成器播放MIDI文件。文件。 计算机科学与工程系计算机科学与工程系7.2 多媒体计算机系统多媒体计算机系统 声卡的作用主要有:声卡的作用主要有: A/D(模模/数数)转换转换将模拟量的自然声音转化成数字化的将模拟量的自然声音转化成数字化的声音,然后以文件形式保存在计算机中。声音,然后以文件形式保存在计算机中。 D/A(数数/模模)转换转换把数字化的声音转换成模拟量的自然把数字化的声音转换成模拟量的自然声音并输出到声音还原设
13、备中。声音并输出到声音还原设备中。 输入、输出功能输入、输出功能可以将模拟信号引入声卡并转换成可以将模拟信号引入声卡并转换成数字信号;也可以将数字信号转换成模拟信号送到输出端口驱数字信号;也可以将数字信号转换成模拟信号送到输出端口驱动音响设备发出声音。动音响设备发出声音。音频卡的基本原理音频卡的基本原理计算机科学与工程系计算机科学与工程系7.2 多媒体计算机系统多媒体计算机系统 (2) 扩展设备扩展设备 具有代表性的扩展设备有:触摸屏、视频卡、扫描仪、数具有代表性的扩展设备有:触摸屏、视频卡、扫描仪、数码相机、数字摄像机、摄像头等等。码相机、数字摄像机、摄像头等等。计算机科学与工程系计算机科学
14、与工程系 触摸屏:属于输入设备,可通过手指直接触及屏幕触摸屏:属于输入设备,可通过手指直接触及屏幕上的菜单、光标、接钮等。上的菜单、光标、接钮等。 系统主要由传感器、控制部件、驱动程序组成。系统主要由传感器、控制部件、驱动程序组成。 当用手指或其它设备触摸显当用手指或其它设备触摸显示器前面的触摸屏时,所摸到的示器前面的触摸屏时,所摸到的位置以坐标形式被触摸屏控制器位置以坐标形式被触摸屏控制器检测到,并通过接口送到检测到,并通过接口送到CPU,从而确定用户所输入的信息。从而确定用户所输入的信息。 7.2 多媒体计算机系统多媒体计算机系统计算机科学与工程系计算机科学与工程系 扫描仪工作原理:把原件
15、朝下放在扫描仪的玻璃台上,扫扫描仪工作原理:把原件朝下放在扫描仪的玻璃台上,扫描仪内发出光照射原件,反射光线经光学镜面导向后,照射到描仪内发出光照射原件,反射光线经光学镜面导向后,照射到CCD的光敏器件上。的光敏器件上。CCD将不同颜色光的强度转换成等价的电将不同颜色光的强度转换成等价的电信号,再送到模数转换器中转换成代表每个像素的数字值。步信号,再送到模数转换器中转换成代表每个像素的数字值。步进电机驱动扫描头沿平台作微增量运动进电机驱动扫描头沿平台作微增量运动,每移动一步,即获得一每移动一步,即获得一行像素值。行像素值。7.2 多媒体计算机系统多媒体计算机系统 扫描仪:是一种图形输入设备。配
16、合适当的应用软件后,扫描仪:是一种图形输入设备。配合适当的应用软件后,扫描仪还可以进行中、英文智能识别。扫描仪还可以进行中、英文智能识别。 计算机科学与工程系计算机科学与工程系NoImage 数码相机数码相机 采用采用CCD作为记录图像的介质,作为记录图像的介质,CCD实实际上是一块布满光敏元件的感光板,际上是一块布满光敏元件的感光板, 它通过它通过光照的不同引起的电荷分布的不同来记录被摄光照的不同引起的电荷分布的不同来记录被摄入的物体,入的物体,CCD上的感光元件越多则像素就上的感光元件越多则像素就越多,图像越清晰。越多,图像越清晰。7.2 多媒体计算机系统多媒体计算机系统1.光信号转换成电
17、信号光信号转换成电信号2.电信号再转换成数字信号电信号再转换成数字信号3.编码、压缩等处理编码、压缩等处理4.保存压缩数字图像保存压缩数字图像计算机科学与工程系计算机科学与工程系 数码摄像机数码摄像机 数码摄像机是将图像信号和音频信号进行数码摄像机是将图像信号和音频信号进行模数转换压缩处理后再将这两路信号送给磁头模数转换压缩处理后再将这两路信号送给磁头完成记录的存储。完成记录的存储。 存储介质主要有四种:存储介质主要有四种:DV带;带;DVD可擦可擦写光盘;微型硬盘;大容量存储卡。目前,数写光盘;微型硬盘;大容量存储卡。目前,数码摄像机普遍趋于采用大容量存储卡做存储介码摄像机普遍趋于采用大容量
18、存储卡做存储介质。质。7.2 多媒体计算机系统多媒体计算机系统 电子白板电子白板 目前,比较流行的交互式电子白板,可利目前,比较流行的交互式电子白板,可利用特定的定位笔代替鼠标在白板上进行操作。用特定的定位笔代替鼠标在白板上进行操作。计算机科学与工程系计算机科学与工程系7.2 多媒体计算机系统多媒体计算机系统计算机科学与工程系计算机科学与工程系7.2 多媒体计算机系统多媒体计算机系统类别类别说说 明明图形处理软件主要进行矢量图的加工与处理。图像处理软件主要进行图像的加工与处理。音频处理软件主要对音乐进行模数转换、数字音频的处理、合成、声音还原等。视频处理软件主要对视频影像、动画进行加工、合成等
19、。媒体平台软件用于多媒体素材的组合与处理、交互功能的实现、输入输出控制、界面生成等。计算机科学与工程系计算机科学与工程系7.3 音频信息的获取和处理音频信息的获取和处理 人耳感觉到空气分子的振动就是声音。由振动产生的人耳感觉到空气分子的振动就是声音。由振动产生的声音有两个基本参数,它们是频率和幅度。声音的频率是声音有两个基本参数,它们是频率和幅度。声音的频率是指每秒钟振动的次数,用指每秒钟振动的次数,用Hz表示,幅度则表示声音大小和表示,幅度则表示声音大小和强弱程度。人说话时的信号频率范围一般在强弱程度。人说话时的信号频率范围一般在3003000Hz,称为话音信号。称为话音信号。 超声波超声波
20、振幅周期频率计算机科学与工程系计算机科学与工程系7.3 音频信息的获取和处理音频信息的获取和处理 按照带宽可将声音质量分为按照带宽可将声音质量分为4级:级: 数字激光唱盘数字激光唱盘CD-DA。属于音质的最高等级。属于音质的最高等级。 调频无线电广播,简称调频无线电广播,简称FM质量。音质其次。质量。音质其次。 调幅无线电广播,简称调幅无线电广播,简称AM质量。音质较差。质量。音质较差。 电话质量。音质最低等级。电话质量。音质最低等级。计算机科学与工程系计算机科学与工程系7.3 音频信息的获取和处理音频信息的获取和处理 早期记录声音的技术,是利用设备的物理参数随着声波早期记录声音的技术,是利用
21、设备的物理参数随着声波的连续变化而变化的特性,来模拟和记录声音,如通过话筒的连续变化而变化的特性,来模拟和记录声音,如通过话筒进行录音。当人对着话筒讲话时,话筒能根据它周围空气压进行录音。当人对着话筒讲话时,话筒能根据它周围空气压力的变化而输出相应连续变化的电压值,以电压的大小表示力的变化而输出相应连续变化的电压值,以电压的大小表示声音的强弱。这种变化的电压值便是一种对人的讲话声音的声音的强弱。这种变化的电压值便是一种对人的讲话声音的模拟,是一种模拟量,它不仅在时间上连续,在幅值上也是模拟,是一种模拟量,它不仅在时间上连续,在幅值上也是连续的。声音的录制是将代表声音波形的电信号转换成对应连续的
22、。声音的录制是将代表声音波形的电信号转换成对应的电磁信号记录在录音磁带上。我们把在时间和幅值上都连的电磁信号记录在录音磁带上。我们把在时间和幅值上都连续的信号称为模拟信号。续的信号称为模拟信号。 计算机只能处理时间和幅度上都离散的数字信号。因此,计算机只能处理时间和幅度上都离散的数字信号。因此,对连续的模拟声音信号必须先进行数字化处理。对连续的模拟声音信号必须先进行数字化处理。 计算机科学与工程系计算机科学与工程系7.3 音频信息的获取和处理音频信息的获取和处理 数字音频信号是由模拟声音经采样、量化和编码得来数字音频信号是由模拟声音经采样、量化和编码得来的。其信号在时间和幅度上都用离散的数字序
23、列表示。的。其信号在时间和幅度上都用离散的数字序列表示。音频信号的数字化过程音频信号的数字化过程 采样就是每间隔一段时间就读一次声音信号的幅度,量采样就是每间隔一段时间就读一次声音信号的幅度,量化就是把采样得到的声音信号幅度转换为数字值。化就是把采样得到的声音信号幅度转换为数字值。计算机科学与工程系计算机科学与工程系7.3 音频信息的获取和处理音频信息的获取和处理 采样频率是指计算机每秒钟采集多少个声音样本。采样频率是指计算机每秒钟采集多少个声音样本。(1) 采样频率采样频率 采样频率越高,单位时间所得到的振幅值就会越多,采样频率越高,单位时间所得到的振幅值就会越多,因而对于原声音曲线的模拟也
24、就越精确。因而对于原声音曲线的模拟也就越精确。 采样频率采样频率声音信号最高频率声音信号最高频率 2 奈奎斯特奈奎斯特(Nyquist)采样定理:采样定理: 主流声卡的采样频率一般可分为主流声卡的采样频率一般可分为22.05KHz、44.1KHz、48KHz三个等级,三个等级,22.05只能达到只能达到FM广播的声质,广播的声质,44.1KHz则则是理论上的是理论上的CD音质界限,音质界限,48KHz则更加精确一些。则更加精确一些。计算机科学与工程系计算机科学与工程系7.3 音频信息的获取和处理音频信息的获取和处理 量化的过程是将采样后的信号按整个声波的幅度划分成量化的过程是将采样后的信号按整
25、个声波的幅度划分成有限个区段,然后把落入某个区段内的值归为一类,并赋予有限个区段,然后把落入某个区段内的值归为一类,并赋予相同的量化值。通常,声卡可按相同的量化值。通常,声卡可按8位、位、16位、位、32位、位、64位分类,位分类,这些数字指的是声卡的量化精度。这些数字指的是声卡的量化精度。 (2) 量化精度量化精度计算机科学与工程系计算机科学与工程系7.3 音频信息的获取和处理音频信息的获取和处理 高的采样频率、量化精度,就可以减少失真。但由此得高的采样频率、量化精度,就可以减少失真。但由此得到的数字音频信号数据量也就越大。到的数字音频信号数据量也就越大。 由于经采样和量化后的音频信号数据量
26、很大,所以一般由于经采样和量化后的音频信号数据量很大,所以一般要先对数字化的音频信息进行编码和压缩,然后再在计算机要先对数字化的音频信息进行编码和压缩,然后再在计算机内传输和存储。内传输和存储。 (3) 编码编码 众所周知,我们今天使用的计算机属于电子数字计算机,它只能处众所周知,我们今天使用的计算机属于电子数字计算机,它只能处理离散的二进制数字信息,而客观世界连续变化的量。这里理离散的二进制数字信息,而客观世界连续变化的量。这里“连续连续”与与“离散离散”之间的之间的“鸿沟鸿沟”就给我们带来了问题:离散量的精确度是有限就给我们带来了问题:离散量的精确度是有限的,数字信号不能达到无限的精确。因
27、此,数字世界可以近似地表示真的,数字信号不能达到无限的精确。因此,数字世界可以近似地表示真实世界,但不能完全模拟;模实世界,但不能完全模拟;模/数、数数、数/模转换需要耗费计算机系统大量的模转换需要耗费计算机系统大量的时间和资源,但这是必须付出的代价。现在你也许明白了,计算机采用时间和资源,但这是必须付出的代价。现在你也许明白了,计算机采用二进制,实在是二进制,实在是“迫不得已迫不得已”!计算机科学与工程系计算机科学与工程系7.3 音频信息的获取和处理音频信息的获取和处理存储格式扩展名特点WAV格式*.WAV来源于对声音模拟波形采样,量化、编码。标准的WAV文件通常保存的是不压缩的声音数据。因
28、而,这种文件最大的缺点是占用存储空间大。适用领域:音频原始素材保存。该格式是通用音频格式。MP3格式*.MP3采用1:101:20压缩率制作的数字音频文件。标准的MP3格式按1:10压缩,所采用的比特率是128Kbps。RA格式*.RA最早的因特网流媒体音频,(RealNetworks公司开发),音质相对较差。特点是可在低的带宽下在网上实时播放。WMA格式*.WMA因特网流媒体音频,(Windows Media Audio 微软开发),用于在互联网上播放的压缩音频文件。质量优于RA。MIDI格式*.MIDMIDI文件并不是一段录制好的声音,而是记录声音的信息,然后在告诉声卡如何再现音乐的一组指
29、令。这样一个MIDI文件每存1分钟的音乐只用大约510KB。APE格式*.APE是一种音频无损压缩格式,APE文件大小可压缩到传统无损格式 WAV 文件的一半;类似的无损压缩格式还有FLAC、TAK、TTA、WV等。AIF格式*.AIFApple计算机的波形音频文件格式。计算机科学与工程系计算机科学与工程系7.3 音频信息的获取和处理音频信息的获取和处理 未压缩的未压缩的WAV格式音频文件和格式音频文件和CD音频光盘的存储容量计音频光盘的存储容量计算如下:算如下:存储量存储量=采样频率采样频率采样量化位数采样量化位数声道数声道数时间时间/8 【例】采样频率为【例】采样频率为44.1KHz,采样
30、数据量化位数为,采样数据量化位数为16位、位、双声道,一张双声道,一张60分钟的分钟的CD唱片所占存储容量为:唱片所占存储容量为: (44.110001623600)/8=635040000(B) 606(M) 声道数:记录声音时,如果每次生成一个声波数据,称为单声道。每声道数:记录声音时,如果每次生成一个声波数据,称为单声道。每次生成次生成2个声波数据,则称立体声双声道(声音在录制过程中被分配到两个声波数据,则称立体声双声道(声音在录制过程中被分配到两个独立的声道,增加了声音的方位感和现场感觉)。随着三维音效技术的个独立的声道,增加了声音的方位感和现场感觉)。随着三维音效技术的发展,目前环绕
31、立体声已从发展,目前环绕立体声已从5.1声道发展到声道发展到7.1声道声道(增加了中左和中右两个增加了中左和中右两个发音点发音点),声音效果更加完美的。,声音效果更加完美的。计算机科学与工程系计算机科学与工程系7.3 音频信息的获取和处理音频信息的获取和处理 比特率是指经过编码(压缩)后的音频数据每秒钟需要比特率是指经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示。比特率越高音频的质量就越好,但编用多少个比特来表示。比特率越高音频的质量就越好,但编码后的文件就越大。码后的文件就越大。 经压缩的音频文件的比特率计算方法如下:经压缩的音频文件的比特率计算方法如下:比特率比特率=未压缩的音频
32、文件比特率未压缩的音频文件比特率/压缩比压缩比 【例】一个未压缩的【例】一个未压缩的WAV波形音频文件,其采样频率为波形音频文件,其采样频率为44.1KHz、数据量化位数为、数据量化位数为16位、立体声双声道,该文件的位、立体声双声道,该文件的比特率为比特率为44100216=1411200 (bps)1378 (kbps)。如果把。如果把它压缩成比特率为它压缩成比特率为128kbps的的mp3格式的音频文件,则该格式的音频文件,则该 mp3格式的音频文件:格式的音频文件: 压缩比压缩比= 1378 /128 = 10.766计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像
33、信息的获取和处理 我们先来看看计算机是如何在屏幕上显示图像的。一幅我们先来看看计算机是如何在屏幕上显示图像的。一幅虎皮鹦鹉的照片看起来细腻平滑。可是,当我们放大它的眼虎皮鹦鹉的照片看起来细腻平滑。可是,当我们放大它的眼睛部分,却发现细节部分其实并没有那么平滑。当我们将图睛部分,却发现细节部分其实并没有那么平滑。当我们将图片放得更大时,你会注意到,图片其实是由一大堆小方块拼片放得更大时,你会注意到,图片其实是由一大堆小方块拼成的,它们被称为像素。在计算机显示器和打印机中,人的成的,它们被称为像素。在计算机显示器和打印机中,人的肉眼并不能看见如此微小的像素。正因为是那么的小,一张肉眼并不能看见如此
34、微小的像素。正因为是那么的小,一张图片往往需要数以百万、千万计的像素构成。图片往往需要数以百万、千万计的像素构成。计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 在计算机中,表示在计算机中,表示“图图”的手段有两种,一种是图像,的手段有两种,一种是图像,一种是图形,二者有很大区别。一种是图形,二者有很大区别。计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 图像由像素构成,像素是组成图像最基本的元素,每个图像由像素构成,像素是组成图像最基本的元素,每个图像点用若干个二进制位进行描述。图像又称位图,相对于图像点用若干个二进
35、制位进行描述。图像又称位图,相对于矢量图形,位图占据的存储空间比较大,缩放时会产生锯齿矢量图形,位图占据的存储空间比较大,缩放时会产生锯齿现象。由于位图占用存储空间较大,一般需要进行数据压缩。现象。由于位图占用存储空间较大,一般需要进行数据压缩。图像通常用于表现自然景观、人物、动物、植物等复杂的场图像通常用于表现自然景观、人物、动物、植物等复杂的场景。景。 图形,又称矢量图。图形使用坐标、运算关系以及颜色图形,又称矢量图。图形使用坐标、运算关系以及颜色数据进行描述,是由具有方向和长度的矢量线段构成。数据进行描述,是由具有方向和长度的矢量线段构成。 图形图形不需要保存每个像素的颜色值,而是仅仅保
36、存几个参数,因不需要保存每个像素的颜色值,而是仅仅保存几个参数,因而数据量小。放大和缩小图形时,也是根据参数的缩放重新而数据量小。放大和缩小图形时,也是根据参数的缩放重新描绘图形,不会像位图那样产生锯齿现象。矢量图常用于表描绘图形,不会像位图那样产生锯齿现象。矢量图常用于表现直线、曲线以及由各种线段围成的图形,不适于描述色彩现直线、曲线以及由各种线段围成的图形,不适于描述色彩丰富、复杂的自然影像丰富、复杂的自然影像 。计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 颜色是人的视觉系统对可见光的感知结果。人之所以能颜色是人的视觉系统对可见光的感知结果。人之所
37、以能看到空间某位置上的景物存在,是因为有光线照在该景物上,看到空间某位置上的景物存在,是因为有光线照在该景物上,并且经其反射或透射作用射入人的眼中,从而在视网膜上产并且经其反射或透射作用射入人的眼中,从而在视网膜上产生感知信号。如在阳光下看到的红色物体,就是由于该物体生感知信号。如在阳光下看到的红色物体,就是由于该物体吸收了白光中的其他光、反射了红光而形成的。而人们所看吸收了白光中的其他光、反射了红光而形成的。而人们所看到的发光体的颜色则由物体本身发射的光波形成,如灯光、到的发光体的颜色则由物体本身发射的光波形成,如灯光、电视、显示器等。电视、显示器等。 光是一种电磁波,人只能感知到其中一段波
38、长的可见光。光是一种电磁波,人只能感知到其中一段波长的可见光。人类的视觉系统将不同波长的光感知为不同的颜色。人类的视觉系统将不同波长的光感知为不同的颜色。计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 (1) 颜色的基本描述颜色的基本描述 彩色可用亮度、色调和饱和度来描述,人眼看到任意彩色可用亮度、色调和饱和度来描述,人眼看到任意彩色光都是这三个特性的综合效果。亮度是光作用于人眼彩色光都是这三个特性的综合效果。亮度是光作用于人眼时所引起的明亮程度的感觉,色调是反映的是颜色的种类,时所引起的明亮程度的感觉,色调是反映的是颜色的种类,饱和度是指颜色的纯度,饱和
39、度越深颜色越鲜明。饱和度是指颜色的纯度,饱和度越深颜色越鲜明。亮度亮度色调色调饱和度饱和度色彩的明暗程度色彩的明暗程度颜色的种类颜色的种类色彩的纯度色彩的纯度计算机科学与工程系计算机科学与工程系7.3 图像信息的获取和处理图像信息的获取和处理(2) 颜色模型颜色模型 在不同的应用场合,人们需要用不同的描述颜色的量化在不同的应用场合,人们需要用不同的描述颜色的量化方法,这便是颜色模型。例如,显示器采用方法,这便是颜色模型。例如,显示器采用RGB模型;打印模型;打印机采用机采用CMYK模型;从事艺术绘画的人习惯用模型;从事艺术绘画的人习惯用HSL模型等。模型等。在一个多媒体计算机系统中,常常涉及用
40、几种不同的颜色模在一个多媒体计算机系统中,常常涉及用几种不同的颜色模型表示图像的颜色。型表示图像的颜色。 RGB模型模型 自然界常见的各种彩色光,都可由红自然界常见的各种彩色光,都可由红(R)、绿、绿(G)、蓝、蓝(B)三种颜色光按不同比例相三种颜色光按不同比例相配而成。同样,绝大多数颜色也可以分解成配而成。同样,绝大多数颜色也可以分解成红、绿、蓝三种色光,这就是色度学中最基红、绿、蓝三种色光,这就是色度学中最基本原理本原理三基色原理。三基色原理。计算机科学与工程系计算机科学与工程系7.3 图像信息的获取和处理图像信息的获取和处理 把三种基色光按不同比例相加,称之为相加混色。显示把三种基色光按
41、不同比例相加,称之为相加混色。显示彩色图像用彩色图像用RGB三基色,被称为相加混色模型。该模型主要三基色,被称为相加混色模型。该模型主要用于计算机显示。用于计算机显示。 CMY模型模型 三基色是青、品红和黄色,简称为三基色是青、品红和黄色,简称为CMY,适用于彩色印刷或彩色打印。在实际印刷过程适用于彩色印刷或彩色打印。在实际印刷过程中还须再加上黑色,这样就称中还须再加上黑色,这样就称CMYK模型。在模型。在该模型中当白光照到有不同比例该模型中当白光照到有不同比例C、M、Y、K油墨的纸上,部分光谱被吸收,而另一部分被油墨的纸上,部分光谱被吸收,而另一部分被反射回眼睛,产生颜色。所以反射回眼睛,产
42、生颜色。所以CMYK模型产生模型产生颜色的方法又被称为减色法。颜色的方法又被称为减色法。 计算机科学与工程系计算机科学与工程系7.3 图像信息的获取和处理图像信息的获取和处理 YUV模型模型 适用于彩色电视系统,其中适用于彩色电视系统,其中Y表示亮度信号,表示亮度信号,UV表示色表示色差信号。差信号。 HSL色彩空间色彩空间:H表示色调,表示色调,S表示颜色的饱和度,表示颜色的饱和度,L表示光的亮度。表示光的亮度。采用采用YUV模型来表示彩色图像模型来表示彩色图像计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 88 像素像素 1616像素像素 3232像素
43、像素 6464像素像素 (1) 采样:图像采样就是对图像在水平方向和垂直方向采样:图像采样就是对图像在水平方向和垂直方向上等间隔地分割成矩形网状结构,每个矩形网格称为像素上等间隔地分割成矩形网状结构,每个矩形网格称为像素点。像素总数就是图像的分辨率。点。像素总数就是图像的分辨率。 对于现实世界的自然景物或使用光学透镜系统在胶片上对于现实世界的自然景物或使用光学透镜系统在胶片上记录下来的图像中任何两点之间有无穷多个点,图像颜色变记录下来的图像中任何两点之间有无穷多个点,图像颜色变化也会有无穷多个值。这种在二维空间中位置和颜色都是连化也会有无穷多个值。这种在二维空间中位置和颜色都是连续变化的图像叫
44、做连续图像或模拟图像,一幅模拟图像在用续变化的图像叫做连续图像或模拟图像,一幅模拟图像在用计算机进行处理前必须先转化为数字形式。和声音类似,图计算机进行处理前必须先转化为数字形式。和声音类似,图像数字化过程也要经过采样、量化和编码这三个步骤。像数字化过程也要经过采样、量化和编码这三个步骤。计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 (2) 量化:是将采样值划分成各种等级,用一定位数的二量化:是将采样值划分成各种等级,用一定位数的二进制数来表示采样的值。量化位数越大,则越能真实地反映进制数来表示采样的值。量化位数越大,则越能真实地反映原有图像的颜色,但得
45、到的数字图像容量也越大。原有图像的颜色,但得到的数字图像容量也越大。 在量化时表示量化的色彩值在量化时表示量化的色彩值(或灰度值或灰度值)所需的二进制位所需的二进制位数称为量化字长。一般可用数称为量化字长。一般可用8位、位、16位、位、24位或更高的量化位或更高的量化字长来表示图像的颜色。字长来表示图像的颜色。 (3) 编码:图像编码是按一定的规则,将量化后的数据编码:图像编码是按一定的规则,将量化后的数据以二进制形式存储在文件中。以二进制形式存储在文件中。图像的数字化图像的数字化数字图像表示数字图像表示计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 (1
46、) 分辨率分辨率 与图像有关的分辩率主要有以下几种:与图像有关的分辩率主要有以下几种: 图像分辩率图像分辩率:是指数字图像水平和垂直方向的像素点数,是指数字图像水平和垂直方向的像素点数,用点的用点的“列数行数列数行数”表示。图像分辨率实际上是对一幅模表示。图像分辨率实际上是对一幅模拟图像采样的数量。对同样尺寸的一幅图,数字化时图像拟图像采样的数量。对同样尺寸的一幅图,数字化时图像分辨率越高,则组成该图的像素数量越多,看起来就越细分辨率越高,则组成该图的像素数量越多,看起来就越细致。图像分辨率是图像固有的属性,图像分辨率的高低直致。图像分辨率是图像固有的属性,图像分辨率的高低直接影响图像的质量。
47、接影响图像的质量。7.4.4 图像的属性图像的属性 扫描分辩率:采样时,每英寸长度取得的像素点数。扫描分辩率:采样时,每英寸长度取得的像素点数。扫描分辩率越高,像素就越多,得到的图像就越细腻。扫描分辩率越高,像素就越多,得到的图像就越细腻。计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 打印分辩率:如果将图像打印在纸上,单位尺寸上打打印分辩率:如果将图像打印在纸上,单位尺寸上打印的点数反映图像的分辩能力。印的点数反映图像的分辩能力。 屏幕分辨率:以显示器的水平和垂直像素表示。屏幕屏幕分辨率:以显示器的水平和垂直像素表示。屏幕分辨率体现显示设备的显示能力,显
48、示器的最大屏幕分辨分辨率体现显示设备的显示能力,显示器的最大屏幕分辨率与它的硬件参数以及显示卡有关。率与它的硬件参数以及显示卡有关。 (2) 颜色数量和深度颜色数量和深度 与自然界中的影像不同,数字化图像的颜色数量是有与自然界中的影像不同,数字化图像的颜色数量是有限的,这是因为表示图像的二进制数的位数是有限的。根限的,这是因为表示图像的二进制数的位数是有限的。根据量化的颜色深度的不同,图像可分为二值(黑白二值)、据量化的颜色深度的不同,图像可分为二值(黑白二值)、灰度和彩色图像三大类。灰度和彩色图像三大类。计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 黑
49、白图像:每个像素只有两种值,黑或白,需要用一黑白图像:每个像素只有两种值,黑或白,需要用一位信息表示。位信息表示。 灰度图像:是每个像素只有一个采样颜色的图像。这灰度图像:是每个像素只有一个采样颜色的图像。这类图像通常显示为从最暗黑色到最亮的白色的灰度,分成类图像通常显示为从最暗黑色到最亮的白色的灰度,分成若干个等级。若干个等级。 彩色图像:每个像素通常由红彩色图像:每个像素通常由红(R)、绿、绿(G)、兰、兰(B)三个三个分量来表示的,分量值介于分量来表示的,分量值介于0255之间。之间。颜色深度颜色深度颜色总数颜色总数图像名称图像名称12单色图像单色图像416索引索引16 色图像色图像82
50、56索引索引256 色图像色图像1665536HIColor 图像图像2416672216True Color 图像图像 颜色深度是指在某颜色深度是指在某一颜色系统中图像的每一颜色系统中图像的每个颜色所用的二进制位个颜色所用的二进制位数,而颜色数量是指该数,而颜色数量是指该颜色系统中共有多少种颜色系统中共有多少种颜色。颜色。计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 真彩色真彩色 当某个图像的颜色深度达到或高于当某个图像的颜色深度达到或高于24bit时,其颜色数量时,其颜色数量已经足够多,且图像的色彩和表现力非常强,基本上还原了已经足够多,且图像的色彩
51、和表现力非常强,基本上还原了自然影像,习惯上把这种图像叫做自然影像,习惯上把这种图像叫做“真彩色图像真彩色图像”。真彩色。真彩色的每个像素的颜色由的每个像素的颜色由RGB基色分量的数值直接决定。每个基基色分量的数值直接决定。每个基色分量占一个字节,共有色分量占一个字节,共有3个字节即个字节即24bit,可生成的颜色数,可生成的颜色数为为224=16777216种颜色。而种颜色。而32位真彩色是用其中的位真彩色是用其中的24位描述位描述颜色部分,另外颜色部分,另外8位记录位记录256级灰度,用以加强真彩色的质量。级灰度,用以加强真彩色的质量。32级灰度级灰度 8级灰度级灰度 黑白二值黑白二值16
52、色图像色图像24位图像位图像计算机科学与工程系计算机科学与工程系7.4 图像信息的获取和处理图像信息的获取和处理 索引色索引色 真彩色模式使用了超过真彩色模式使用了超过1600万种的颜色。许多应用程序万种的颜色。许多应用程序不需要如此大的颜色范围。索引色(或调色板色,伪彩色)不需要如此大的颜色范围。索引色(或调色板色,伪彩色)模式仅使用其中的一小部分。在该模式中,每个应用程序从模式仅使用其中的一小部分。在该模式中,每个应用程序从大的色彩集中选择一些颜色(通常是大的色彩集中选择一些颜色(通常是256种)并对其建立索种)并对其建立索引。对选中的颜色赋一个值。引。对选中的颜色赋一个值。 颜色深度小于
53、颜色深度小于24bit的图像其像素颜色的图像其像素颜色取自一个颜色查找表中最接近的颜色,这取自一个颜色查找表中最接近的颜色,这种方法显示的颜色不是图像本身真正的颜种方法显示的颜色不是图像本身真正的颜色,称为伪彩色。这就类似艺术家可能在色,称为伪彩色。这就类似艺术家可能在他们的画室用到很多种颜色,但一次仅用他们的画室用到很多种颜色,但一次仅用到他们调色板中的一些。到他们调色板中的一些。计算机科学与工程系计算机科学与工程系7.3 图像信息的获取和处理图像信息的获取和处理 对于同一幅数字图像,采用不同的文件格式保存时,其图对于同一幅数字图像,采用不同的文件格式保存时,其图像数据量、色彩数量和表现力会
54、有不同。像数据量、色彩数量和表现力会有不同。(1) 图像文件的格式图像文件的格式文件格式文件格式颜色深度颜色深度(最大最大)说明说明BMP 32bit Windows用位图,鲜艳、细腻、但尺寸大用位图,鲜艳、细腻、但尺寸大GIF 8bit 256索引颜色,尺寸小,有小动画效果索引颜色,尺寸小,有小动画效果JPEG 32bit JPEG压缩文件,质量高、尺寸小、略失真压缩文件,质量高、尺寸小、略失真PSD 24bit Photoshop专用,图像细腻专用,图像细腻TIFF 24bit 通用图像文件,用于扫描仪、出版印刷通用图像文件,用于扫描仪、出版印刷计算机科学与工程系计算机科学与工程系7.3
55、图像信息的获取和处理图像信息的获取和处理 一幅未经压缩的数字图像数据量计算公式如下:一幅未经压缩的数字图像数据量计算公式如下: 图像数据量大小图像数据量大小 = 像素总数像素总数图像颜色深度图像颜色深度8 例如:一幅例如:一幅 640480 ,256 色图像为色图像为 64048088 = 307200 (字节字节)(2) 图像文件的数据量图像文件的数据量 (1) 使用数码相机拍照使用数码相机拍照 (2) 使用扫描仪扫描使用扫描仪扫描 (3) 使用现成图像使用现成图像 (4) 使用图像处理软件绘制使用图像处理软件绘制像素点个数像素点个数8位颜色深度位颜色深度位转换为字节位转换为字节计算机科学与
56、工程系计算机科学与工程系7.5 动画与视频信息动画与视频信息扫描样张扫描样张光电转换器光电转换器数字信号数字信号输出输出 动画由多幅画面组成,当画面快速连续地播放时,由于动画由多幅画面组成,当画面快速连续地播放时,由于人类眼睛存在人类眼睛存在“视觉滞留效应视觉滞留效应”而产生动感。所谓而产生动感。所谓“视觉滞视觉滞留效应留效应”是指当被观察的物体消失后,物体仍在大脑视觉神是指当被观察的物体消失后,物体仍在大脑视觉神经中停留短暂的时间。利用这一特性,在一幅画面还没有从经中停留短暂的时间。利用这一特性,在一幅画面还没有从视觉里消失,马上播放下一幅画面,就给人造成一种流畅的视觉里消失,马上播放下一幅
57、画面,就给人造成一种流畅的视觉变化效果。视觉变化效果。 电脑动画是指利用计算机来创作的动画。电脑动画的原电脑动画是指利用计算机来创作的动画。电脑动画的原理与传统动画基本相同,只是在传统动画的基础上,把计算理与传统动画基本相同,只是在传统动画的基础上,把计算机技术用于动画的处理。机技术用于动画的处理。计算机科学与工程系计算机科学与工程系7.5 动画与视频信息动画与视频信息扫描样张扫描样张光电转换器光电转换器数字信号数字信号输出输出 电脑动画有两大类:帧动画;矢量动画。电脑动画有两大类:帧动画;矢量动画。 矢量动画是经过电脑计算而生成矢量动画是经过电脑计算而生成的动画,主要表现变化的图形、线条、的
58、动画,主要表现变化的图形、线条、文字和图案。矢量动画通常采用编程文字和图案。矢量动画通常采用编程或矢量动画制作软件来完成。或矢量动画制作软件来完成。 帧动画借鉴传统动画的概念,一帧动画借鉴传统动画的概念,一帧对应一个画面,每帧的内容不同。帧对应一个画面,每帧的内容不同。当连续演播时,形成动画视觉效果。当连续演播时,形成动画视觉效果。 常用的动画制作软件:常用的动画制作软件: Flash网页动画软件。网页动画软件。 3DS Max三维造型和动画软件。三维造型和动画软件。计算机科学与工程系计算机科学与工程系7.5 动画与视频信息动画与视频信息扫描样张扫描样张光电转换器光电转换器数字信号数字信号输出
59、输出存储格式存储格式扩展名扩展名特点特点SWF格式*.SWFFlash动画软件的一种文件输出格式。属于矢量格式,占用的存储空间较小。GIF格式*.GIF一种动态图片格式,也称为GIF89a格式文件。目前Internet上大量采用的彩色动画文件多为这种格式,很多图像浏览器都可以直接观看该类动画文件。计算机科学与工程系计算机科学与工程系7.5 动画与视频信息动画与视频信息扫描样张扫描样张光电转换器光电转换器数字信号数字信号输出输出 视频与动画没有本质的区别。视频来自于数码摄像机拍视频与动画没有本质的区别。视频来自于数码摄像机拍摄和经数字化的模拟摄像资料等,常用于表现真实场景。动摄和经数字化的模拟摄
60、像资料等,常用于表现真实场景。动画则是借助于编程或动画制作软件生成一系列景物画面。画则是借助于编程或动画制作软件生成一系列景物画面。 常用的视频编辑软件:常用的视频编辑软件: Premiere视频编辑软件。视频编辑软件。 绘声绘影绘声绘影视频编辑软件。视频编辑软件。 按照处理方式的不同,视频可以分为按照处理方式的不同,视频可以分为: 模拟视频:是一种用于传输图像和声音,并且其信号模拟视频:是一种用于传输图像和声音,并且其信号在时间和幅度上都连续的电信号。在时间和幅度上都连续的电信号。 数字视频:是指将模拟视频信号经过数字化处理,转数字视频:是指将模拟视频信号经过数字化处理,转换成二进制格式表示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代物流运输调度管理案例分析
- 农产品电商平台运营方案及推广策略
- 建筑智能化项目承包合同书
- 新员工培训总经理发言稿模板
- 2025四川南充营山县引进“带编入企”人才考核招聘20人考试模拟试题及答案解析
- 手机软件与网站接口开发合作合同
- 2025山东潍坊市产业发展集团有限公司权属公司山东潍坊新华印务有限责任公司招聘6人备考练习试题及答案解析
- 农业新型机械设采购与售后服务合同
- 2025河南新乡延津县职业中等专业学校招聘代课教师7人备考练习题库及答案解析
- 2025浙江丽水市遂昌县招聘专职社区工作者4人考试参考题库及答案解析
- 玉石床垫讲稿课件
- 初中音乐七年级上册第一单元 红岩魂走进歌乐山
- 栈桥修复方案(全文)
- 某五星级酒店单项工程经济指标
- 交通标志牌工程施工组织设计(标准版)
- 【课件】《红烛》课件24张统编版高中语文必修上册
- 交通事故认定书复核申请书模板
- 电气一次设备吊装搬运施工方案
- “一机一档”范本(共12页)
- 长输管道施工工序
- 公司法实施条例
评论
0/150
提交评论