版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7章多媒体技术
大学计算机基础第7章多媒体技术大学计算机基础1本章主要内容
多媒体基本概念及常见媒体类型多媒体系统组成数字图像处理基础声音处理技术基础视频处理技术基础动画制作技术基础虚拟现实技术基础本章主要内容多媒体基本概念及常见媒体类型27.1多媒体基本概念及常见媒体类型媒体:信息交流的中介。多媒体:多媒体是由两种以上的媒体融合而成的信息综合表现形式,是多种媒体的处理、集成和利用的结果。多媒体技术:具有集成性、实时性和交互性的计算机综合处理声文图信息的技术。7.1多媒体基本概念及常见媒体类型媒体:信息交流的中介。37.1.1
计算机中常见媒体类型文本图形指用计算机绘制的几何形状
如:直线、圆、圆弧、矩形
曲线、图表等,也称矢量图。图像
由输入设备捕捉的实际场景画面,
或以数字化形式存储的任意画面。
也称位图7.1.1计算机中常见媒体类型文本47.1.1计算机中常见媒体类型音频数字化的声音,除包括音乐、语音外,
还包括各种音响效果。视频
一种活动影像,与电影(Movie)和
电视原理一样—视觉暂留。7.1.1计算机中常见媒体类型音频57.1.1
计算机中常见媒体类型动画视频一般是指对自然界真实影像的记录,如用摄像机记录下来的自然
风光,而动画通常指人工创作出的
联系图像所组合成的动态影像。三维模型
三维模型示物体的多边形表示,通常
用计算机或者其它设备进行显示。一般
用三维建模工具或者三维扫描仪获取。7.1.1计算机中常见媒体类型动画6文本文件格式TXT、RTF以及WORD格式的DOC、DOCX、DOT文件声音文件格式WAV、MID和MP3等图形、图像文件格式BMP、PCX、GIF、TIF、JPG、TGA等影像文件格式AVI、MOV、MPG和DAT文件等7.1.2常见媒体信息文件格式文本文件格式7.1.2常见媒体信息文件格式7动画文件格式GIF、AVI、SWF等3D模型文件格式OBJ、3DS、FBX和X等7.1.2常见媒体信息文件格式动画文件格式7.1.2常见媒体信息文件格式87.2多媒体系统组成多媒体系统层次结构7.2多媒体系统组成多媒体系统层次结构97.2.1多媒体计算机系统多媒体系统硬件体系7.2.1多媒体计算机系统多媒体系统硬件体系10显示系统7.2.3多媒体计算机主要部件介绍显卡1)ROMBIOS:固化在存储器芯片中的只读驱动程序,显卡的特征参数、基本操作等保存在其中。2)RAM:显示缓冲存储器,其容量大小决定了显示颜色数量的多少和分辨率的高低。3)控制电路:控制显示的状态,进行显示指令的处理等。4)信号输出端子:将显示信息和控制信号送至显示器。显示系统7.2.3多媒体计算机主要部件介绍显卡1)11显卡分类
1)一般显示卡:完成显示基本功能,显示性能的优劣主要由品牌、工艺质量、缓冲存储器容量等因素确定。2)图形加速卡:目前以AGP显示卡为主,带有图形加速器。该卡在显示复杂图像三维图像时速度较快。3)3D图形卡:专为带有3D图形的高档游戏开发的显示卡,三维坐标变换速度快,图形动态显示反应灵敏、清晰。4)显示/TV集成卡:在显示卡上集成了高频头和视频处理电路,使用该显示卡既可显示正常多媒体信息,又可收看电视节目。5)显示/视频输出集成卡:在显示卡上集成了视频输出电路,在把信号送至显示器显示正常信号的同时,还把信号转换成视频信号,送到视频输出端子,供电视机或录像机接收、录制和播放。7.2.3多媒体计算机主要部件介绍显卡分类7.2.3多媒体计算机主要部件介绍12显示器7.2.3多媒体计算机主要部件介绍CRT显示器LCD显示器显示器7.2.3多媒体计算机主要部件介绍CRT显示器LCD13显示器性能指标屏幕尺寸:显示器的屏幕尺寸分为三种,即显像管尺寸(tubesize)、可视尺寸(viewablesize)和光栅尺寸(rastersize)。其中,显像管尺寸是指显像管正面对角线的长度,一般以英寸(1英寸=25.4厘米)为单位;可视尺寸指的是显示器可显示区域对角钱的长度,该尺寸小于显像管尺寸,一般以毫米为单位:光栅尺寸是指显像管最大扫描区域的尺寸,用横向数值和纵向数值分别表示区域的大小。点距:显示器上最小的发光单位是像素点,像素点是电子束穿过荧光屏内侧钢板上的阴罩孔激发荧光物质而形成的,同色像点之间的距离称为点距,单位为毫米。点距是衡量显示器质量好坏的重要指标之一,其数值越小,清晰度越高,显示器质量越好,但技术难度也越大。7.2.3多媒体计算机主要部件介绍显示器性能指标7.2.3多媒体计算机主要部件介绍14显示器性能指标扫描频率:显示器的显示器件是显像管,显像管在工作时,电子束按顺序高速扫描整个屏幕,使人们看到近似连续的显示信息。就理论而言,扫描频率越高,显示质量越好,图像越稳定。显示分辨率:显示器的显示分辨率是一组标称值,以像素点(pixel)为基本单位。表示方法是320×200、640×480,前面是屏幕横向像素点的总数,后面是屏幕纵向像素点的总数。颜色数量:颜色数量是指显示器同屏显示的颜色数量,它主要由显示适配器决定。当显示适配器上的缓冲存储器容量足够大时,显示器同屏显示的颜色数量也足够多。7.2.3多媒体计算机主要部件介绍显示器性能指标7.2.3多媒体计算机主要部件介绍15音频设备
音频卡即声卡,计算机通过它处理音频信号。音频卡的关键技术包括数字音频、音乐合成和MIDI。7.2.3多媒体计算机主要部件介绍声卡音频设备7.2.3多媒体计算机主要部件介绍声卡163D音效原理
为什么能用几个扬声器(7.1声道、5.1声道、4.1声道、5声道、4声道,甚至2声道)回放出接近于真实世界的各种声音和音乐效果?
人类感知声源的位置最基本的理论是双工理论,这种理论基于两种因素:两耳间声音的到达时间差和两耳间声音的强度差。时间差是由于距离的原因造成,当声音从正面传来时距离相等,所以没有时间差,但若偏右3度,则到达右耳的时间就要比左耳约少30μs,而正是这30μs,使得人耳辨别出了声源的位置。7.2.3多媒体计算机主要部件介绍7.1声道音响系统3D音效原理7.2.3多媒体计算机主要部件介绍7.1声道音17数字图像设备(1)摄像头
7.2.3多媒体计算机主要部件介绍镜头像素接口视频捕获能力调焦功能等参数。数字图像设备7.2.3多媒体计算机主要部件介绍镜头18数字图像设备(2)数码相机
7.2.3多媒体计算机主要部件介绍由镜头、CCD、A/D(模/数转换器)、MPU(微处理器)、内置存储器、LCD(液晶显示器)、PC卡(可移动存储器)和接口(计算机接口、电视机接口)等部分组成数字图像设备7.2.3多媒体计算机主要部件介绍由镜头、C19数字图像设备(3)扫描仪
7.2.3多媒体计算机主要部件介绍手动式平面式滚筒式胶片式数字图像设备7.2.3多媒体计算机主要部件介绍手动式平面式20视频设备7.2.3多媒体计算机主要部件介绍数码视频摄像机将视频信号经过数码化处理成0和1信号并以数码记录的方式,通过磁鼓螺旋扫描记录在6.35mm宽的金属视频录像带上,视频信号的转换和记录都是以数码的形式存储,从而提高了录制图像的清晰度,使图像质量轻易达到500线以上。视频设备7.2.3多媒体计算机主要部件介绍数码视频摄像机将21打印输出设备(1)针式打印机7.2.3多媒体计算机主要部件介绍优点:便宜、耐用、可打印多种类型纸张。缺点:打印效果比较一般,而且噪声较大打印输出设备7.2.3多媒体计算机主要部件介绍优点:便宜、22打印输出设备(2)喷墨打印机7.2.3多媒体计算机主要部件介绍优点:价格较便宜,而且它打印时噪声较小,图形质量较高。缺点:墨盒用完了要及时更换,但相对于针式打印机来说消耗较高。打印输出设备7.2.3多媒体计算机主要部件介绍优点:价格较23打印输出设备(2)激光打印机7.2.3多媒体计算机主要部件介绍优点:分辨率很高,有的能达到600dpi以上,打印效果精美细致。缺点:价格较高。硒鼓打印输出设备7.2.3多媒体计算机主要部件介绍优点:分辨率247.3
农业病害图像诊断基于图像处理和模式识别的草莓病害识别研究(1)图像获取(2)图像预处理(3)图像分割(4)图像特征提取(5)病害类型的识别7.3农业病害图像诊断基于图像处理和模式识别的草莓病257.3.1
数字图象处理基础
自然界中的图像都是模拟量,电视、电影、照相机等图像记录与传输设备都是使用模拟信号对图像进行处理。但是计算机只能处理数字量,而不能处理模拟图像。所以我们要在在处理图像之前进行图像数字化。
简单的说,数字图像就是能够在计算机上显示和处理的图像。7.3.1数字图象处理基础自然界中的图像都是模拟量26数字图像的显示WhatweseeWhatacomputerseesSource:S.Narasimhan数字图像的显示WhatweseeWhatacompu277.3.2图像的分辨率图像的空间分辨率(SpatialResolution)
图像的空间分辨率是指图像中每单位长度包含的像素或点的数目。常以像素/英寸(pixelsperinch,ppi)为单位表示。
如72ppi表示图像中每英寸包含72个像素或点。分辨率越高,图像越清晰,图像文件所需要的磁盘空间越大,处理时间也越长。7.3.2图像的分辨率图像的空间分辨率(Spatial287.3.2图像的分辨率一般来说,采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现像素呈块状的棋盘格效应(CheckerboardEffect);采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。7.3.2图像的分辨率一般来说,采样间隔越大,所297.3.2图像的分辨率图像的灰度分辨率(Gray-LevelResolution)
在数字图像中,灰度级分辨率又称色阶,指图像中分辨的灰度级科目,即灰度级数目,它与存储灰度级别所使用的数据类型有关。由于灰度级量度的是投射到传感器上光辐射值的强度,所以灰度级分辨率也叫辐射计量分辨率。7.3.2图像的分辨率图像的灰度分辨率(Gray-Lev307.3.1图像的分辨率
量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小。7.3.1图像的分辨率量化等级越多,所得图像层次317.3.3颜色模式RGB模式三基色:红、绿、蓝每个像素需要3个字节来存储颜色数据,红、绿、蓝各需要8位每个红、绿、蓝都被赋予0-255之间的一个值,0表示没有颜色,255表示最高亮度的颜色。7.3.3颜色模式RGB模式327.3.3颜色模式HSB:用色相、饱和度、亮度三种基本特性表示颜色;索引色模式:为了节约存储空间,把图像中使用的所有颜色与一个颜色表对应起来;HSV:用色调、饱和度和数值来描述彩色系统;7.3.3颜色模式337.3.3颜色模式CMY:青、洋红、黄三基色叠加颜色;CMYK:青色、品红、黄色、黑色四原色叠加颜色;HIS:使用颜色的三要素色调(Hue)、饱和度(Saturation)和亮度(Intensity)来描述颜色;Lab颜色模式、YIQ颜色模型,YUV模型等7.3.3颜色模式CMY:青、洋红、黄三基色叠加颜色;347.3.4位图与矢量图数字化图像信息通常有两种存在形式:一种是位图(也叫点阵图),另一种是矢量图。通常把位图称为图像,把矢量图称为图形。7.3.4位图与矢量图数字化图像信息通常有两种357.3.4位图与矢量图200%大小(上图)和50%大小(左图)的矢量图200%大小(上图)和50%大小(左图)的位图7.3.4位图与矢量图200%大小(上图)和50%大小(367.3.4位图什么是位图?位图由一系列组成网格的点组成,每个点的颜色都以二进制数字形式存储。在哪里可以看到位图?通常用于创建实际的图像,比如照片。如何创建位图?可以通过图像处理软件,如Photoshop、Windows画图;也可以使用扫描仪、数码相机等。7.3.4位图什么是位图?377.3.4位图位图被分成一系列颜色不同的像素点。每个像素点的颜色数据都以二进制形式存储7.3.4位图位图被分成一系列颜色不同的像素点。每个像素387.3.4
位图-重要特点组成位图的网格尺寸取决于分辨率。分辨率用横向和纵向所含像素数目来表示。如150*100高分辨率的图比低分辨率的图包含更多数据,图像更清晰。分辨率越高图像文件越大。位图拉伸和收缩不改变分辨率。原始图像的分辨率为24*24拉伸后图像的分辨率仍为24*247.3.4位图-重要特点组成位图的网格尺寸取决于分辨率。397.3.4矢量图矢量图:是由一套可以重建图像的指令构成。不保存每个像素的颜色值,而是包含了为图像中的每个对象创建形状、尺寸、位置和颜色等的计算机需要的指令。如何识别矢量图简单判断:具有轮廓不清晰、类似卡通画的画质准别判断:文件扩展名,如.wmf、.dxt、.mgx、.pict7.3.4矢量图矢量图:是由一套可以重建图像的指令构成。407.3.4
矢量图矢量图由线条和形状构成,它们可以被着色或加阴影7.3.4矢量图矢量图由线条和形状构成,它们可以被着色或417.3.4矢量图与位图的比较矢量图与位图比较,位图的容量一般较大,矢量图一般较小;位图的文件内容是点阵数据,矢量图的文件内容是图形指令。从应用的特点看,位图适合于获取和复制,表现力丰富,但编辑较复杂;矢量图易于编辑,适于绘制和创建,放大和缩小不会产生失真,位图放大会产生失真。7.3.4矢量图与位图的比较矢量图与位图比较,位图427.3.4
矢量图与位图的比较改变大小时矢量图比位图效果更佳矢量图通常比位图需要更少的存储空间编辑矢量图比编辑位图更容易矢量图不如位图真实7.3.4矢量图与位图的比较改变大小时矢量图比位图效果更佳437.3.5
数字图像编码压缩图像数据编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。数字图像一般可以表示为f(i,j),i=0,1…,i-1,j=0,1,…j-1,它是对二维图像f(x,y)抽样和量化过程而得到的。在这种表示中存在着冗余度,图像压缩的目地就是要消除这种冗余度。7.3.5数字图像编码压缩图像数据编码压缩是指在满447.3.5
数字图像编码压缩BMP基本位图格式,没有压缩。经常用于充当图像元素,如计算机程序中的按钮和控件。JPEG按照JPEG标准压缩过的位图。可以用于很多应用程序,如网页中的图片等GIF经过压缩,网页图像的常用式。PNG用于网页图片的GIF格式的变形。7.3.5数字图像编码压缩BMP基本位图格式,没有压缩。457.3.6
农业病虫害图像诊断(1)图像预处理针对大棚温室的环境特点,如噪声干扰、光照不均、背景复杂,首先对采集到的图像进行预处理。原始图像通过直方图均衡化消除光照不均7.3.6农业病虫害图像诊断(1)图像预处理原始图像通过467.3.6
农业病害图像诊断(2)图像分割1.经过预处理的图像2.在RGB空间提取红色分量的部分3.经OSTU阈值分割的得到的初步果实模板7.3.6农业病害图像诊断(2)图像分割1.经过预处理477.3.6
农业病害图像诊断(2)图像分割4.覆膜法擦除部分果实区域5.在RGB空间提取绿色分量的部分6.擦除绿色区域并填回红色区域7.3.6农业病害图像诊断(2)图像分割4.覆膜法擦除48对白粉病草莓的分割结果对白粉病草莓的分割结果49对缩果病草莓的分割结果对缩果病草莓的分割结果50对成熟不均病草莓的分割结果对成熟不均病草莓的分割结果517.3.6
农业病害图像诊断(3)图像特征提取图像颜色特征7.3.6农业病害图像诊断(3)图像特征提取图像颜色特征527.3.6
农业病害图像诊断(2)图像特征提取纹理特征
纹理具有局部区域性质的特点,通常可将纹理看做对局部区域中像素之间的关系的一种度量。与颜色特征基于像素点的特征不同的是,纹理特征需要在包含多个像素点的区域中进行统计计算。7.3.6农业病害图像诊断(2)图像特征提取53大学计算机基础第7章多媒体技术课件54大学计算机基础第7章多媒体技术课件557.3.7
农业病害图像诊断(4)病虫害类型的识别用特征数据对BP神经网络、支持向量机进行训练,并进行测试,得出病害的分类结果。7.3.7农业病害图像诊断(4)病虫害类型的识别56大学计算机基础第7章多媒体技术课件577.4音频信息的采集和处理声音的概念声音是通过一定弹性介质传播的一种连续的机械波。声音是如何听到的?自然界中声音主要是靠空气传播的,人们把发出声音的物体称为声源,声音在空气中传播能引起非常小的压力变化。声源引起的空气压力变化能够被我们耳朵中的耳膜检测,然后产生电信号刺激大脑的听觉神经,从而感知到声音的存在7.4音频信息的采集和处理587.4音频信息的采集和处理声音的传播方式:声音信号所携带的信息大体可以分为声音是依靠介质(比如:空气、液体、固体)的振动进行传播的声源是一个振荡源,它使周围介质产生振动,并以波的形式传播人耳感觉到这种传播过来的振动,反映到大脑,就意味听到声音声音在不同的介质中传播,其传播速度和衰减速率都是不一样的7.4音频信息的采集和处理声音的传播方式:声音信号所携597.4音频信息的采集和处理声音本质是一种机械波,所以具有波的周期性变化特性,以正弦波为例声音信号所携带的信息大体可以分为特性振幅—波的高低幅度,表示声音的强弱周期—两个相邻波之间的时间长度频率—每秒钟波振动的次数,单位是Hzt振幅周期A7.4音频信息的采集和处理声音本质是一种机械波,所以具有波60声音按频率分类:次声波可听声波超声波20Hz20kHzf(Hz)人类说话声音频率范围:300Hz-3kHz1020502003.4k7k15k20kCD-DAFM广播AM广播电话f(Hz)频带声音按频率分类:次声波可听声波超声波20Hz20kHzf(H61声音的频率范围声音的频率范围62声音的三要素:音调——(高低)代表声音的高低,与频率有关;使用音频处理软件对声音的频率进行调整时,其音调也会随之发生变化音强——(强弱)声音的强度(响度或音量),与声波振幅成正比;唱盘、CD盘等声音载体中的音强不变,通过播放设备的音量控制可改变聆听时强度;音频处理软件可提高声源音强音色——(特质)声音的特色,主要影响因素是复音;复音指具有不同频率和不同振幅的混合声音,其中最低频率是“基音”,是声音的基调,其他频率的声音为“谐音(泛音)”声音的三要素:63
模拟信号(自然界、物理)自然界的声音是连续变化的,它是一种模拟量。人类最早记录声音的技术是利用一些机械的、电的、磁的参数随声波引起的空气压力的连续变化而变化来模拟和记录自然的声音,例如麦克风、磁带录音机、留声机。
数字信号(计算机)数字信号是离散的,不连续的。计算机存储的是一个个离散的数字。要是计算机能够存储和处理声音,必须将模拟信号转换为数字信号。音频信号的类型音频信号的类型64数字化音频的获取是通过每隔一定的时间间隔测一次模拟音频的值并将其数字化。这一样过程称为采样,每秒钟采样的次数称为采样率。一般的,采样率越高,记录的声音就越自然,反之,将失去原有声音的自然特性,称为失真。7.4.1数字化音频65当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上取一个电压幅度值,称之为采样。采样得到的表示声音强弱的模拟电压幅值是连续的,把无穷多个电压幅值用有限个数字表示,称之为量化。7.4.1数字化音频65当把模拟声音变成数字声音时,需要每隔7.4.1数字化音频多媒体计算机中录制和放音处理过程模-数转换A/D数-模转换D/A录音放音数字音频数字音频模拟音频模拟音频7.4.1数字化音频多媒体计算机中录制和放音处理过程模-数转66音频数字化过程采样量化编码采样量化编码模拟信号数字信号模拟信号数字信号A/DADCD/ADAC7.4.1数字化音频音频数字化过程采样量化编码模拟信号数字信号模拟信号数字信号A67采样声波是连续信号,或称连续时间函数x(t)。用计算机处理这些信号时应先离散化,即按一定的时间间隔(T)取值,得到x(nT)(n为整数),T称采样周期,1/T称采样频率(每秒钟采样次数),x(nT)称采样值(或离散信号)7.4.1数字化音频采样7.4.1数字化音频687.4.1数字化音频采样定理奈奎斯特(Nyqust)采样定理:只要采样频率大于或者等于信号中所包含的最高频率的两倍,则理论上就可以完全恢复原来的信号。即当信号是最高频率时,每个周期至少采样两个点,可获得一个无损采样。
例如:人类能够接受的声音频率是20Hz~20KHz.则依据上述理论,如果要产生人能听得见的声音需要大于40KHz的采样率。为满足这个需要,philip和sony公司设计光盘时,采用44.1KHz的采样率。Windows还支持11.025KHz和22.05KHz的采样率。一般来讲,采样频率越高声音失真越小,用于存储数字音频的数据量也越大。7.4.1数字化音频采样定理一般来讲,采样频率越高声音失真越69量化就是把采样得到的声音信号幅度转换为有限个数字值之一,是声音信号在幅度上被离散化。量化位数是每个采样点能够表示的数据范围,常用的有8位、12位和16位。213541.2747.4.1数字化音频量化213541.2747.4.1数字化音频707.4.1数字化音频量化量化原理先将整个幅度划分成为有限个小幅度(量化阶距)的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化值。如果量化值是均匀分布的,称为均匀量化。量化幅值之后的结果123456707.4.1数字化音频量化量化原理先将整个幅度划分成为有限个小717.4.1数字化音频数字化音频的过程如下图所示。连续的模拟声音信号声音信号的采样离散的音频信号顺序7.4.1数字化音频数字化音频的过程如下图所示。连续的模拟声727.4.1数字化音频编码音频模拟信号经过采样与量化之后,为把数字化音频存入计算机,需对其编码,即用二进制数表示每个采样的量化值,完成整个模数转换过程PCM编码一种最方便简单的编码方法是脉冲编码调制,常称为PCM(PulseCodeModulation)编码。是一种未经压缩的数字音频信号,常作为一种参考信号,以便其他编码方法与之比较,或者在此基础上作进一步压缩编码处理7.4.1数字化音频编码PCM编码一种最方便简单的编码方法737.4.1数字化音频声道反映音频数字化质量的另一个因素是声道个数。记录声音时,如果每次生成一个声波的数据,称为单声道;每次生成二个声波数据,称为双声道(立体声);每次生成二个以上声波数据,称为多声道(环绕立体声)。7.4.1数字化音频声道74采样频率量化位数声道数每秒钟抽取声波幅度样本的次数每个采样点用多少二进制位表示数据范围使用声音通道的个数采样频率越高声音质量越好数据量也越大量化位数越多音质越好数据量也越大立体声比单声道的表现力丰富,但数据量翻倍11.025kHz22.05kHz44.1kHz8位=256(28)个值16位=65536(216)个值单声道立体声7.4.1数字化音频声音数字化三要素采样频率量化位数声道数每秒钟抽取声波幅度样本的次数每个采样点75音频文件如未经压缩是非常浪费存储空间的,我们可以拿一个未压缩的CD文件(PCM音频流)和一个MP3文件作一下对比:
PCM音频:一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码CD文件,它的数据速率则为
44.1K×16×2
=1411.2
Kbps,这个参数也被称为数据带宽。再除以8将bit换算成字节byte,就可以得到这个CD的数据速率,即176.4KB/s。这表示存储一秒钟PCM编码的音频信号,需要176.4KB的空间。
MP3音频:将这个WAV文件压缩成普通的MP3,44.1KHz,128Kbps的码率,它的数据速率为128Kbps/8=16KB/s。7.4.2音频编码与压缩音频文件如未经压缩是非常浪费存储空间的,我们可以拿一个未压缩767.4.2音频编码与压缩音频格式比特率存1秒音频数据所占空间CD(线性PCM)1411.2Kbps176.4KBMP3128Kbps16KBAAC96Kbps12KBmp3PRO64Kbps8KBWMA64Kbps8KB7.4.2音频编码与压缩音频格式比特率存1秒音频数据所占空77有损(lossy)/无损(lossless)/未压缩(uncompressed)音频格式
未压缩音频是一种没经过任何压缩的简单音频。例如PCM或WAV音轨;所谓无损压缩格式,顾名思义,就是毫无损失地将声音信号进行压缩的音频格式。目前比较出名的无损压缩格式有APE、FLAC、LPAC、WavPack。无损压缩的不足就是占用空间大,压缩比不高。
有损压缩就是在压缩过程中会舍弃一些细节,也就是压缩是不可逆的。有损压缩包括AC3,
DTS,
AAC,
MPEG-1/2/3的音频部分。7.4.2音频编码与压缩有损(lossy)/无损(lossless)/未压缩(unc78基于视频处理的生猪行为检测跟踪技术研究(1)视频图像获取(2)视频图像预处理(3)建立目标检测模型(4)目标跟踪识别(5)目标行为分析7.5
规模化养殖中动物行为监测与分析基于视频处理的生猪行为检测跟踪技术研究7.5规模化养殖中791.视觉暂留现象人眼有一种视觉暂留的生物现象,即人观察的物体消失后,物体映像在人眼的视网膜上会保留一个非常短暂的时间(约0.1—0.4s)。利用这一现象,将一系列画面中物体移动或形状改变很小的静止图像,以足够快的速度连续播放,就会产生连续活动的场景。7.5.1
视频基本概念1.视觉暂留现象7.5.1视频基本概念802.视频的定义视频(Video)又称运动图像或活动图像,它是指连续地随着时间变化的一组静止图像。视频处理技术泛指将一系列静态影像以电信号方式加以捕捉、纪录、处理、储存、传送、重现的各种技术帧:一幅单独的图像帧频:每秒种播放的帧数,单位是f/s典型的帧频:24f/s、25f/s、30f/s常见的视频信号:电影、电视7.5.1
视频基本概念2.视频的定义7.5.1视频基本概念813.视频的分类模拟视频用于传输图像和声音并随时间连续变化的电信号。特点:
以模拟电信号记录
依靠模拟调幅手段在空间传播
使用盒式磁带存储在磁带上。缺点:多次拷贝以后信号会产生失真,图像的质量随着时间的流逝而降低,模拟视频信号在传输过程中容易受到干扰。7.5.1
视频基本概念3.视频的分类7.5.1视频基本概念823.视频的分类数字视频。由随时间变化的一系列数字化的图像序列组成。特点:
适合于网络应用。实现资源的共享,传输过程中不容易受到干扰,没有传输距离的限制。再现性好。永久地保存和无限次拷贝不会出现任何失真,不会因为信号衰减而导致失真。便于计算机编辑处理。利用计算机进行存储、处理,进行创造性编辑与合成,并进行动态交互。本节的视频处理技术指的是数字视频处理技术。缺点:处理速度慢、数据量大7.5.1
视频基本概念3.视频的分类7.5.1视频基本概念83AVI视频格式。是一种音频视频交错记录的数字视频文件格式。独立于硬件设备,各种版本不一定能够兼容播放。ASF和WMV。ASF:流媒体格式,Microsoft开发,使用了MPEG4压缩编码算法。WMV:流媒体格式,是ASF的升级。同等视频质量下,WMV数据量很小,很适合在网上播放和传输。7.5.2
视频文件常见格式AVI视频格式。是一种音频视频交错记录的数字视频文件格式。独84MOV视频格式。Apple公司开发,扩展名为mov,用QuickTimeforWindows可播放。MPEG标准。MPEG-1:压缩率很高,清晰度损失比较大。包括.mpg、.mlv、.mpe、.mpeg及VCD光盘中的.dat文件等。MPEG-2:是一种低数据率,高质量的视频压缩算法。包括.mpg、.mpe、.mpeg、.m2v及DVD光盘上的.vob文件等。MPEG-4:运动图像压缩算法实现了以最少的数据获得最佳的图象质量,广泛应用于视频电话、视频电子邮件和电子新闻等领域,其数据传输速率要求较低(在4.8~64Kb/s)7.5.2
视频文件常见格式MOV视频格式。Apple公司开发,扩展名为mov,用Qu851、视频信号的数字化过程采样:将模拟视频信号以一定的频率进行采样;量化:进行A/D转换和色彩空间转换等处理,就可以转换成相应的数字视频信号;编码:转换后的数字视频信号数据量大,需经压缩方可保存,经过编码、压缩后,形成不同格式和适量的数字视频,可适用不同的处理和应用要求。7.5.3
视频图像获取1、视频信号的数字化过程7.5.3视频图像获取862、视频采集卡作用。视频采集卡也称为视频捕捉卡,其作用是将输入的各种制式的模拟视频信号数字化,并转换成适合计算机处理、储存、传输、显示和播放的格式。性能分类。广播级视频采集卡、专业级视频采集卡和普通视频采集卡三大类。连接。视频采集卡是捕捉视频图像的工具,将视频采集卡的输入端与摄像机、录像机、视频光盘机等视频信号的输出端连接之后,就可以用采集卡捕捉到视频图像,并且可以根据需要转变成静止图像或者活动图像,以文件的形式保存在硬盘上7.5.3视频图像获取2、视频采集卡7.5.3视频图像获取872、视频采集卡7.5.3视频图像获取2、视频采集卡7.5.3视频图像获取881、视频数据压缩帧内压缩(Intraframecompression)。也称为空间压缩(Spatial
compression),仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,一般采用有损压缩算法,达不到很高的压缩比。帧间压缩(Interframecompression)也称为时间压缩(Temporal
compression),是基于许多视频或动画的连续前后两帧具有很大的相关性(即连续的视频其相邻帧之间具有冗余信息)的特点来实现的。通过比较时间轴上不同帧之间的数据实施压缩。一般是无损压缩。7.5.4视频编码压缩1、视频数据压缩7.5.4视频编码压缩892、常见编码MPEG系列标准:
MPEG-1、MPEG-2、MPEG-4H.26X系列:
H.261、H.262、H.263、H.2647.5.4视频编码压缩2、常见编码7.5.4视频编码压缩90(1)视频图像获取7.5.5
生猪行为检测跟踪技术研究(1)视频图像获取7.5.5生猪行为检测跟踪技术研究91(2)视频图像预处理平滑处理、图像分割、连通性检测。7.5.5
生猪行为检测跟踪技术研究(2)视频图像预处理7.5.5生猪行为检测跟踪技术研究92(3)目标生猪检测模型建立●目标检测过程7.5.5
生猪行为检测跟踪技术研究(3)目标生猪检测模型建立7.5.5生猪行为检测跟踪技术93(3)目标生猪检测模型建立●背景建模及更新7.5.5
生猪行为检测跟踪技术研究(3)目标生猪检测模型建立7.5.5生猪行为检测跟踪技术94(3)目标生猪检测模型建立●目标检测7.5.5
生猪行为检测跟踪技术研究(3)目标生猪检测模型建立7.5.5生猪行为检测跟踪技术95(4)目标生猪跟踪●特征提取与相似性度量7.5.5
生猪行为检测跟踪技术研究(4)目标生猪跟踪7.5.5生猪行为检测跟踪技术研究96(4)目标生猪跟踪●跟踪定位7.5.5
生猪行为检测跟踪技术研究(4)目标生猪跟踪7.5.5生猪行为检测跟踪技术研究97(5)行为分析7.5.5
生猪行为检测跟踪技术研究(5)行为分析7.5.5生猪行为检测跟踪技术研究98基于动画制作技术的水利工程设计动画仿真演示(1)三维地形建模(2)三维环境建模(3)水利建筑物真实感模型构建(4)动态水环境的实现(5)三维海量数据实时交互漫游7.6
动画制作技术基础基于动画制作技术的水利工程设计动画仿真演示7.6动画制作991.动画动画是指对许多帧静止的画面,逐帧拍摄,以一定的速度(如每秒16张)连续播放时,肉眼因视觉暂留产生错觉,而误以为画面活动的作品。画面制作方式,常见的是手绘在纸张或赛璐珞片上。随着计算机,网络技术的发展,出现了许多电脑动画软件,直接在电脑上制作动画。7.6.1
动画基本概念1.动画7.6.1动画基本概念1002.计算机动画(ComputerAnimation)借助计算机来制作动画的技术,由于计算机动画可以完成一些简单的中间帧,使得动画的制作得到了简化。计算机动画从表现形式上可以分为二维动画和三维动画两种。7.6.1动画基本概念2.计算机动画(ComputerAnimation)7.61013.二维动画借助计算机2D位图或者是矢量图形来创建、修改、编辑动画,制作上和传统动画比较类似7.6.1动画基本概念3.二维动画7.6.1动画基本概念1024.三维动画基于3D电脑图形来表现。有别于二维动画,三维动画提供三维数字空间利用数字模型来制作动画。三维动画主要的制作技术有:建模、渲染、灯光阴影、纹理材质、动力学、粒子效果(部分2D软件也可以实现)、布料效果、毛发效果等7.6.1动画基本概念4.三维动画7.6.1动画基本概念1033DStudioMaxMAYAFlashPhotoshopAutoCAD7.6.2动画制作常用软件3DStudioMax7.6.2动画制作常用软件104(1)三维地形建模7.6.3三维动画技术在水利工程仿真中应用(1)三维地形建模7.6.3三维动画技术在水利工程仿真中应用105(2)三维环境建模7.6.3三维动画技术在水利工程仿真中应用(2)三维环境建模7.6.3三维动画技术在水利工程仿真中应用106(3)水利建筑物真实感模型构建7.6.3三维动画技术在水利工程仿真中应用(3)水利建筑物真实感模型构建7.6.3三维动画技术在水利工107(4)动态水环境建模7.6.3三维动画技术在水利工程仿真中应用(4)动态水环境建模7.6.3三维动画技术在水利工程仿真中应108(5)建立三维海量数据实时交互漫游在建立了三维模型后,能否实现实时动画漫游是一个三维动画可视化系统成功的关键。在显示的过程中建立动态调用三维数据的机制,采用分页技术7.6.3三维动画技术在水利工程仿真中应用(5)建立三维海量数据实时交互漫游7.6.3三维动画技术在水109
基于虚拟现实技术的养猪场可视化信息管理的研究(1)房屋及环境建模(2)三维树木建模(3)鱼池、河道建模(4)合成场景(5)三维海量数据实时交互漫游7.7
虚拟现实技术基础基于虚拟现实技术的养猪场可视化信息管理的研究7.7虚拟1101.虚拟现实技术虚拟现实是利用计算机生成一个关于视觉、听觉、触觉等感官的三维空间的虚拟世界,让参与者身临其境一般,产生沉浸感。虚拟现实并不是真实的环境,更不是现实世界,而是人们利用计算机把抽象、复杂的计算机数据表现为他们所熟悉的、直观的可以交互的高级人机接口。7.7.1
虚拟现实基本概念1.虚拟现实技术7.7.1虚拟现实基本概念1112.虚拟现实技术具有三个特征沉浸感。使参与者全心身地沉浸于三维虚拟环境中,产生身临其境的感觉,将人与环境融为一体,是操作者感受到自己是在真实客观世界一样。构想感。虚拟现实技术提供一个更广泛的可想象的空间,开发者可以在这个空间内不受限制地实现现实生活中不存在的,甚至不可能做到的对象作为虚拟环境7.7.1
虚拟现实基本概念2.虚拟现实技术具有三个特征7.7.1虚拟现实基本概念1122.虚拟现实技术具有三个特征交互性。在虚拟环境中用户根据自己的想法与虚拟环境之间进行交互控制,通过自己的动作改变感受的内容,可以用自然地方式对虚拟环境中的物体进行操作、获取信息7.7.1
虚拟现实基本概念2.虚拟现实技术具有三个特征7.7.1虚拟现实基本概念113(1)动态环境建模技术动态环境建模技术的目的在于利用实际环境的三维数据,并根据应用的需要,利用获取的三维数据建立与之相适应的虚拟环境模型(2)实时三维图形生成和显示技术快速三维图形生成技术、动态显示技术(3)新型交互设备的研制主要设备:头盔显示器、数据手套、数据衣服、三维位置传感器和三维声音产生器等。语音识别与语音输入技术:虚拟现实系统重要人机交互手段新型交互设备:让用户能够直接操作虚拟物体并感觉到虚拟物体的反作用力。
7.7.2
虚拟现实的关键技术(1)动态环境建模技术7.7.2虚拟现实的关键技术114(4)应用系统开发工具研究开发VR系统平台、分布式VR技术(5)系统集成技术集成技术包括信息同步、模型标定、数据转换、数据管理模型、识别与合成等技术7.7.2
虚拟现实的关键技术(4)应用系统开发工具7.7.2虚拟现实的关键技术115(1)房屋及环境建模
7.7.3养猪场可视化信息管理研究(1)房屋及环境建模7.7.3养猪场可视化信息管理研究116(2)三维树木建模7.7.3养猪场可视化信息管理研究(2)三维树木建模7.7.3养猪场可视化信息管理研究117(3)合成场景7.7.3养猪场可视化信息管理研究(3)合成场景7.7.3养猪场可视化信息管理研究118(4)三维海量数据实时交互漫游在建立了三维模型后,能否实现实时动画漫游是一个三维动画可视化系统成功的关键。在显示的过程中建立动态调用三维数据的机制,即采用分页技术7.7.3养猪场可视化信息管理研究(4)三维海量数据实时交互漫游7.7.3养猪场可视化信息管理119谢谢!谢谢!120
第7章多媒体技术
大学计算机基础第7章多媒体技术大学计算机基础121本章主要内容
多媒体基本概念及常见媒体类型多媒体系统组成数字图像处理基础声音处理技术基础视频处理技术基础动画制作技术基础虚拟现实技术基础本章主要内容多媒体基本概念及常见媒体类型1227.1多媒体基本概念及常见媒体类型媒体:信息交流的中介。多媒体:多媒体是由两种以上的媒体融合而成的信息综合表现形式,是多种媒体的处理、集成和利用的结果。多媒体技术:具有集成性、实时性和交互性的计算机综合处理声文图信息的技术。7.1多媒体基本概念及常见媒体类型媒体:信息交流的中介。1237.1.1
计算机中常见媒体类型文本图形指用计算机绘制的几何形状
如:直线、圆、圆弧、矩形
曲线、图表等,也称矢量图。图像
由输入设备捕捉的实际场景画面,
或以数字化形式存储的任意画面。
也称位图7.1.1计算机中常见媒体类型文本1247.1.1计算机中常见媒体类型音频数字化的声音,除包括音乐、语音外,
还包括各种音响效果。视频
一种活动影像,与电影(Movie)和
电视原理一样—视觉暂留。7.1.1计算机中常见媒体类型音频1257.1.1
计算机中常见媒体类型动画视频一般是指对自然界真实影像的记录,如用摄像机记录下来的自然
风光,而动画通常指人工创作出的
联系图像所组合成的动态影像。三维模型
三维模型示物体的多边形表示,通常
用计算机或者其它设备进行显示。一般
用三维建模工具或者三维扫描仪获取。7.1.1计算机中常见媒体类型动画126文本文件格式TXT、RTF以及WORD格式的DOC、DOCX、DOT文件声音文件格式WAV、MID和MP3等图形、图像文件格式BMP、PCX、GIF、TIF、JPG、TGA等影像文件格式AVI、MOV、MPG和DAT文件等7.1.2常见媒体信息文件格式文本文件格式7.1.2常见媒体信息文件格式127动画文件格式GIF、AVI、SWF等3D模型文件格式OBJ、3DS、FBX和X等7.1.2常见媒体信息文件格式动画文件格式7.1.2常见媒体信息文件格式1287.2多媒体系统组成多媒体系统层次结构7.2多媒体系统组成多媒体系统层次结构1297.2.1多媒体计算机系统多媒体系统硬件体系7.2.1多媒体计算机系统多媒体系统硬件体系130显示系统7.2.3多媒体计算机主要部件介绍显卡1)ROMBIOS:固化在存储器芯片中的只读驱动程序,显卡的特征参数、基本操作等保存在其中。2)RAM:显示缓冲存储器,其容量大小决定了显示颜色数量的多少和分辨率的高低。3)控制电路:控制显示的状态,进行显示指令的处理等。4)信号输出端子:将显示信息和控制信号送至显示器。显示系统7.2.3多媒体计算机主要部件介绍显卡1)131显卡分类
1)一般显示卡:完成显示基本功能,显示性能的优劣主要由品牌、工艺质量、缓冲存储器容量等因素确定。2)图形加速卡:目前以AGP显示卡为主,带有图形加速器。该卡在显示复杂图像三维图像时速度较快。3)3D图形卡:专为带有3D图形的高档游戏开发的显示卡,三维坐标变换速度快,图形动态显示反应灵敏、清晰。4)显示/TV集成卡:在显示卡上集成了高频头和视频处理电路,使用该显示卡既可显示正常多媒体信息,又可收看电视节目。5)显示/视频输出集成卡:在显示卡上集成了视频输出电路,在把信号送至显示器显示正常信号的同时,还把信号转换成视频信号,送到视频输出端子,供电视机或录像机接收、录制和播放。7.2.3多媒体计算机主要部件介绍显卡分类7.2.3多媒体计算机主要部件介绍132显示器7.2.3多媒体计算机主要部件介绍CRT显示器LCD显示器显示器7.2.3多媒体计算机主要部件介绍CRT显示器LCD133显示器性能指标屏幕尺寸:显示器的屏幕尺寸分为三种,即显像管尺寸(tubesize)、可视尺寸(viewablesize)和光栅尺寸(rastersize)。其中,显像管尺寸是指显像管正面对角线的长度,一般以英寸(1英寸=25.4厘米)为单位;可视尺寸指的是显示器可显示区域对角钱的长度,该尺寸小于显像管尺寸,一般以毫米为单位:光栅尺寸是指显像管最大扫描区域的尺寸,用横向数值和纵向数值分别表示区域的大小。点距:显示器上最小的发光单位是像素点,像素点是电子束穿过荧光屏内侧钢板上的阴罩孔激发荧光物质而形成的,同色像点之间的距离称为点距,单位为毫米。点距是衡量显示器质量好坏的重要指标之一,其数值越小,清晰度越高,显示器质量越好,但技术难度也越大。7.2.3多媒体计算机主要部件介绍显示器性能指标7.2.3多媒体计算机主要部件介绍134显示器性能指标扫描频率:显示器的显示器件是显像管,显像管在工作时,电子束按顺序高速扫描整个屏幕,使人们看到近似连续的显示信息。就理论而言,扫描频率越高,显示质量越好,图像越稳定。显示分辨率:显示器的显示分辨率是一组标称值,以像素点(pixel)为基本单位。表示方法是320×200、640×480,前面是屏幕横向像素点的总数,后面是屏幕纵向像素点的总数。颜色数量:颜色数量是指显示器同屏显示的颜色数量,它主要由显示适配器决定。当显示适配器上的缓冲存储器容量足够大时,显示器同屏显示的颜色数量也足够多。7.2.3多媒体计算机主要部件介绍显示器性能指标7.2.3多媒体计算机主要部件介绍135音频设备
音频卡即声卡,计算机通过它处理音频信号。音频卡的关键技术包括数字音频、音乐合成和MIDI。7.2.3多媒体计算机主要部件介绍声卡音频设备7.2.3多媒体计算机主要部件介绍声卡1363D音效原理
为什么能用几个扬声器(7.1声道、5.1声道、4.1声道、5声道、4声道,甚至2声道)回放出接近于真实世界的各种声音和音乐效果?
人类感知声源的位置最基本的理论是双工理论,这种理论基于两种因素:两耳间声音的到达时间差和两耳间声音的强度差。时间差是由于距离的原因造成,当声音从正面传来时距离相等,所以没有时间差,但若偏右3度,则到达右耳的时间就要比左耳约少30μs,而正是这30μs,使得人耳辨别出了声源的位置。7.2.3多媒体计算机主要部件介绍7.1声道音响系统3D音效原理7.2.3多媒体计算机主要部件介绍7.1声道音137数字图像设备(1)摄像头
7.2.3多媒体计算机主要部件介绍镜头像素接口视频捕获能力调焦功能等参数。数字图像设备7.2.3多媒体计算机主要部件介绍镜头138数字图像设备(2)数码相机
7.2.3多媒体计算机主要部件介绍由镜头、CCD、A/D(模/数转换器)、MPU(微处理器)、内置存储器、LCD(液晶显示器)、PC卡(可移动存储器)和接口(计算机接口、电视机接口)等部分组成数字图像设备7.2.3多媒体计算机主要部件介绍由镜头、C139数字图像设备(3)扫描仪
7.2.3多媒体计算机主要部件介绍手动式平面式滚筒式胶片式数字图像设备7.2.3多媒体计算机主要部件介绍手动式平面式140视频设备7.2.3多媒体计算机主要部件介绍数码视频摄像机将视频信号经过数码化处理成0和1信号并以数码记录的方式,通过磁鼓螺旋扫描记录在6.35mm宽的金属视频录像带上,视频信号的转换和记录都是以数码的形式存储,从而提高了录制图像的清晰度,使图像质量轻易达到500线以上。视频设备7.2.3多媒体计算机主要部件介绍数码视频摄像机将141打印输出设备(1)针式打印机7.2.3多媒体计算机主要部件介绍优点:便宜、耐用、可打印多种类型纸张。缺点:打印效果比较一般,而且噪声较大打印输出设备7.2.3多媒体计算机主要部件介绍优点:便宜、142打印输出设备(2)喷墨打印机7.2.3多媒体计算机主要部件介绍优点:价格较便宜,而且它打印时噪声较小,图形质量较高。缺点:墨盒用完了要及时更换,但相对于针式打印机来说消耗较高。打印输出设备7.2.3多媒体计算机主要部件介绍优点:价格较143打印输出设备(2)激光打印机7.2.3多媒体计算机主要部件介绍优点:分辨率很高,有的能达到600dpi以上,打印效果精美细致。缺点:价格较高。硒鼓打印输出设备7.2.3多媒体计算机主要部件介绍优点:分辨率1447.3
农业病害图像诊断基于图像处理和模式识别的草莓病害识别研究(1)图像获取(2)图像预处理(3)图像分割(4)图像特征提取(5)病害类型的识别7.3农业病害图像诊断基于图像处理和模式识别的草莓病1457.3.1
数字图象处理基础
自然界中的图像都是模拟量,电视、电影、照相机等图像记录与传输设备都是使用模拟信号对图像进行处理。但是计算机只能处理数字量,而不能处理模拟图像。所以我们要在在处理图像之前进行图像数字化。
简单的说,数字图像就是能够在计算机上显示和处理的图像。7.3.1数字图象处理基础自然界中的图像都是模拟量146数字图像的显示WhatweseeWhatacomputerseesSource:S.Narasimhan数字图像的显示WhatweseeWhatacompu1477.3.2图像的分辨率图像的空间分辨率(SpatialResolution)
图像的空间分辨率是指图像中每单位长度包含的像素或点的数目。常以像素/英寸(pixelsperinch,ppi)为单位表示。
如72ppi表示图像中每英寸包含72个像素或点。分辨率越高,图像越清晰,图像文件所需要的磁盘空间越大,处理时间也越长。7.3.2图像的分辨率图像的空间分辨率(Spatial1487.3.2图像的分辨率一般来说,采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现像素呈块状的棋盘格效应(CheckerboardEffect);采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。7.3.2图像的分辨率一般来说,采样间隔越大,所1497.3.2图像的分辨率图像的灰度分辨率(Gray-LevelResolution)
在数字图像中,灰度级分辨率又称色阶,指图像中分辨的灰度级科目,即灰度级数目,它与存储灰度级别所使用的数据类型有关。由于灰度级量度的是投射到传感器上光辐射值的强度,所以灰度级分辨率也叫辐射计量分辨率。7.3.2图像的分辨率图像的灰度分辨率(Gray-Lev1507.3.1图像的分辨率
量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小。7.3.1图像的分辨率量化等级越多,所得图像层次1517.3.3颜色模式RGB模式三基色:红、绿、蓝每个像素需要3个字节来存储颜色数据,红、绿、蓝各需要8位每个红、绿、蓝都被赋予0-255之间的一个值,0表示没有颜色,255表示最高亮度的颜色。7.3.3颜色模式RGB模式1527.3.3颜色模式HSB:用色相、饱和度、亮度三种基本特性表示颜色;索引色模式:为了节约存储空间,把图像中使用的所有颜色与一个颜色表对应起来;HSV:用色调、饱和度和数值来描述彩色系统;7.3.3颜色模式1537.3.3颜色模式CMY:青、洋红、黄三基色叠加颜色;CMYK:青色、品红、黄色、黑色四原色叠加颜色;HIS:使用颜色的三要素色调(Hue)、饱和度(Saturation)和亮度(Intensity)来描述颜色;Lab颜色模式、YIQ颜色模型,YUV模型等7.3.3颜色模式CMY:青、洋红、黄三基色叠加颜色;1547.3.4位图与矢量图数字化图像信息通常有两种存在形式:一种是位图(也叫点阵图),另一种是矢量图。通常把位图称为图像,把矢量图称为图形。7.3.4位图与矢量图数字化图像信息通常有两种1557.3.4位图与矢量图200%大小(上图)和50%大小(左图)的矢量图200%大小(上图)和50%大小(左图)的位图7.3.4位图与矢量图200%大小(上图)和50%大小(1567.3.4位图什么是位图?位图由一系列组成网格的点组成,每个点的颜色都以二进制数字形式存储。在哪里可以看到位图?通常用于创建实际的图像,比如照片。如何创建位图?可以通过图像处理软件,如Photoshop、Windows画图;也可以使用扫描仪、数码相机等。7.3.4位图什么是位图?1577.3.4位图位图被分成一系列颜色不同的像素点。每个像素点的颜色数据都以二进制形式存储7.3.4位图位图被分成一系列颜色不同的像素点。每个像素1587.3.4
位图-重要特点组成位图的网格尺寸取决于分辨率。分辨率用横向和纵向所含像素数目来表示。如150*100高分辨率的图比低分辨率的图包含更多数据,图像更清晰。分辨率越高图像文件越大。位图拉伸和收缩不改变分辨率。原始图像的分辨率为24*24拉伸后图像的分辨率仍为24*247.3.4位图-重要特点组成位图的网格尺寸取决于分辨率。1597.3.4矢量图矢量图:是由一套可以重建图像的指令构成。不保存每个像素的颜色值,而是包含了为图像中的每个对象创建形状、尺寸、位置和颜色等的计算机需要的指令。如何识别矢量图简单判断:具有轮廓不清晰、类似卡通画的画质准别判断:文件扩展名,如.wmf、.dxt、.mgx、.pict7.3.4矢量图矢量图:是由一套可以重建图像的指令构成。1607.3.4
矢量图矢量图由线条和形状构成,它们可以被着色或加阴影7.3.4矢量图矢量图由线条和形状构成,它们可以被着色或1617.3.4矢量图与位图的比较矢量图与位图比较,位图的容量一般较大,矢量图一般较小;位图的文件内容是点阵数据,矢量图的文件内容是图形指令。从应用的特点看,位图适合于获取和复制,表现力丰富,但编辑较复杂;矢量图易于编辑,适于绘制和创建,放大和缩小不会产生失真,位图放大会产生失真。7.3.4矢量图与位图的比较矢量图与位图比较,位图1627.3.4
矢量图与位图的比较改变大小时矢量图比位图效果更佳矢量图通常比位图需要更少的存储空间编辑矢量图比编辑位图更容易矢量图不如位图真实7.3.4矢量图与位图的比较改变大小时矢量图比位图效果更佳1637.3.5
数字图像编码压缩图像数据编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。数字图像一般可以表示为f(i,j),i=0,1…,i-1,j=0,1,…j-1,它是对二维图像f(x,y)抽样和量化过程而得到的。在这种表示中存在着冗余度,图像压缩的目地就是要消除这种冗余度。7.3.5数字图像编码压缩图像数据编码压缩是指在满1647.3.5
数字图像编码压缩BMP基本位图格式,没有压缩。经常用于充当图像元素,如计算机程序中的按钮和控件。JPEG按照JPEG标准压缩过的位图。可以用于很多应用程序,如网页中的图片等GIF经过压缩,网页图像的常用式。PNG用于网页图片的GIF格式的变形。7.3.5数字图像编码压缩BMP基本位图格式,没有压缩。1657.3.6
农业病虫害图像诊断(1)图像预处理针对大棚温室的环境特点,如噪声干扰、光照不均、背景复杂,首先对采集到的图像进行预处理。原始图像通过直方图均衡化消除光照不均7.3.6农业病虫害图像诊断(1)图像预处理原始图像通过1667.3.6
农业病害图像诊断(2)图像分割1.经过预处理的图像2.在RGB空间提取红色分量的部分3.经OSTU阈值分割的得到的初步果实模板7.3.6农业病害图像诊断(2)图像分割1.经过预处理1677.3.6
农业病害图像诊断(2)图像分割4.覆膜法擦除部分果实区域5.在RGB空间提取绿色分量的部分6.擦除绿色区域并填回红色区域7.3.6农业病害图像诊断(2)图像分割4.覆膜法擦除168对白粉病草莓的分割结果对白粉病草莓的分割结果169对缩果病草莓的分割结果对缩果病草莓的分割结果170对成熟不均病草莓的分割结果对成熟不均病草莓的分割结果1717.3.6
农业病害图像诊断(3)图像特征提取图像颜色特征7.3.6农业病害图像诊断(3)图像特征提取图像颜色特征1727.3.6
农业病害图像诊断(2)图像特征提取纹理特征
纹理具有局部区域性质的特点,通常可将纹理看做对局部区域中像素之间的关系的一种度量。与颜色特征基于像素点的特征不同的是,纹理特征需要在包含多个像素点的区域中进行统计计算。7.3.6农业病害图像诊断(2)图像特征提取173大学计算机基础第7章多媒体技术课件174大学计算机基础第7章多媒体技术课件1757.3.7
农业病害图像诊断(4)病虫害类型的识别用特征数据对BP神经网络、支持向量机进行训练,并进行测试,得出病害的分类结果。7.3.7农业病害图像诊断(4)病虫害类型的识别176大学计算机基础第7章多媒体技术课件1777.4音频信息的采集和处理声音的概念声音是通过一定弹性介质传播的一种连续的机械波。声音是如何听到的?自然界中声音主要是靠空气传播的,人们把发出声音的物体称为声源,声音在空气中传播能引起非常小的压力变化。声源引起的空气压力变化能够被我们耳朵中的耳膜检测,然后产生电信号刺激大脑的听觉神经,从而感知到声音的存在7.4音频信息的采集和处理1787.4音频信息的采集和处理声音的传播方式:声音信号所携带的信息大体可以分为声音是依靠介质(比如:空气、液体、固体)的振动进行传播的声源是一个振荡源,它使周围介质产生振动,并以波的形式传播人耳感觉到这种传播过来的振动,反映到大脑,就意味听到声音声音在不同的介质中传播,其传播速度和衰减速率都是不一样的7.4音频信息的采集和处理声音的传播方式:声音信号所携1797.4音频信息的采集和处理声音本质是一种机械波,所以具有波的周期性变化特性,以正弦波为例声音信号所携带的信息大体可以分为特性振幅—波的高低幅度,表示声音的强弱周期—两个相邻波之间的时间长度频率—每秒钟波振动的次数,单位是Hzt振幅周期A7.4音频信息的采集和处理声音本质是一种机械波,所以具有波180声音按频率分类:次声波可听声波超声波20Hz20kHzf(Hz)人类说话声音频率范围:300Hz-3kHz1020502003.4k7k15k20kCD-DAFM广播AM广播电话f(Hz)频带声音按频率分类:次声波可听声波超声波20Hz20kHzf(H181声音的频率范围声音的频率范围182声音的三要素:音调——(高低)代表声音的高低,与频率有关;使用音频处理软件对声音的频率进行调整时,其音调也会随之发生变化音强——(强弱)声音的强度(响度或音量),与声波振幅成正比;唱盘、CD盘等声音载体中的音强不变,通过播放设备的音量控制可改变聆听时强度;音频处理软件可提高
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025曲靖医学高等专科学校工作人员招聘考试试题
- 2025江苏省宿城中等专业学校工作人员招聘考试试题
- 2026年高考作文主题预测考前必看必刷题(人文关怀+乡村振兴)
- 实行分包的附着式升降脚手架工程安全施工方案
- 地下连续墙专项施工方案
- 吊车梁安装施工技术方案
- 变电站主变大修工程专项施工方案
- 2025年节能建筑材料在建筑节能产品中的应用前景及可行性研究
- 基于用户反馈的国家智慧教育云平台课程体系优化研究教学研究课题报告
- 成都银行2025年年报及2026年一季报点评:息差企稳质量优异
- 2026湖北武汉首义科技创新投资发展集团有限公司招聘8人笔试历年备考题库附带答案详解
- (四模)新疆2026年高三普通高考五月适应性文科综合试卷(含答案及解析)
- 邮政寄递活动方案策划(3篇)
- 2026四川宜宾市科教产业投资集团有限公司下属子公司第一批自主招聘33人考试备考题库及答案解析
- 2026中国氢能源基础设施建设与政策支持分析报告
- (二模)2026年广州市普通高中高三毕业班综合测试(二)物理试卷(含答案及解析)
- 摄影构图(共86张PPT)
- DB33T 988-2022 柔性生态加筋挡土墙设计与施工技术规范
- DB31T 1234-2020 城市森林碳汇计量监测技术规程
- 对外经贸函电课程课件-新Unit-10-Packing
- 导线展放出口张力、牵引力计算表格
评论
0/150
提交评论