版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数字数字图像处理课件图像处理课件第1章 数字图像处理基础知识1.1 基本概念1.1.1 像素与图像像素(Pixel) 由Picture(图像) 和Element(元素)这两个单词的字母所组成。一个像素通常被视为图像的最小的完整采样。整个屏幕上画面的每一个点称为一个像素。像素是离散的点,像素点按行列排列的方式构成一个图片区域。显然,一幅图像的像素点数目由图像的大小和水平、垂直方向上单位长度(如英寸)的像素点数目决定。我们若把影像放大数倍,会发现这些连续色调其实是由许多色彩相近的小方点所组成,这些小方点就是构成影像的最小单位“像素”, 图像(Image) “图”是物体透射或反射光的分布,是客观存在
2、的。“像”是人的视觉系统对图在大脑中形成的印象或认识,是人的感觉。图像是图和像的有机结合,既反映物体的客观存在,又体现人的心理因素,是客观对象的一种可视表示,它包含了被描述对象的有关信息。根据图像空间坐标和幅度(亮度或色彩)的连续性可分为模拟(连续)图像和数字图像。模拟图像是空间坐标和幅度都连续变化的图像,而数字图像是空间坐标和幅度均用离散的数字(一般是整数)表示的图像。 灰度信息数字化数字化像素1124421112788721158558611685686116875421158416611483166112611111坐标上的幅值称为该点图像的强度或灰度。如果是一幅彩色图像,则是一个向量,
3、它的每一个分量代表图像在该点相应颜色通道的亮度值。数字图像可以用一个二维的整数数组来表示,或者一系列的二维数组来表示,每一个二维数组代表一个颜色通道。一幅数字化图像通常具有如下的形式:其中0G-1,这里N和G通常用2的整数幂来表示。1.1.2 数字图像处理,计算机视觉,计算机图形学数字图像处理(Digital Image Processing) 又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理中,输入的是质量低的图像,输出的是改善质量后的图像。数字图像处理的主要内容包括:几何处理(Geometrical Processing),算术处理(Arit
4、hmetic Processing),图像增强(Image Enhancement),图像复原(Image Restoration),图像重建(Image Reconstruction),图像编码(Image Encoding),图像识别(Image Recognition),图像理解(Image Understanding)。计算机视觉(Computer vision) 用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能够像人一样通过视觉观察和理解世界,具有自主适应环境的能力。计算机视觉是一门综合性的学科,其中包括计算机科学和
5、工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。计算机视觉的一个重要应用领域是自主车辆的视觉导航,目前人们的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。 计算机图形学(Computer Graphics,简称CG) 一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。计算机图形学中,输入的是数据,输出的是图形。计算机图形学的主要研究内容是如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法,如图形硬件、图形标准、图形交互技术、光栅图形生成算法、曲线曲面造型、实体造型、真实感图形计算与显示算法、
6、非真实感绘制,以及科学计算可视化、计算机动画、自然景物仿真、虚拟现实等。图形通常由点、线、面、体等几何元素和灰度、色彩、线型、线宽等非几何属性组成。从处理技术上来看,图形主要分为两类,一类是基于线条信息表示的,如工程图、等高线地图、曲面的线框图等,另一类是明暗图,也就是通常所说的真实感图形。图形与图像两个概念间的区别在于:图像单纯指计算机内以位图形式存在的灰度信息;而图形含有几何属性,或者说更强调场景的几何表示,由场景的几何模型和景物的物理属性共同组成。计算机图形学研究的主要目的是利用计算机产生令人赏心悦目的真实感图形。为此,必须建立图形所描述的场景的几何表示,再用某种光照模型,计算在假想的光
7、源、纹理、材质属性下的光照效果。所以,计算机图形学与计算机辅助几何设计、图像处理有着密切的关系。其主要研究领域包括计算机辅助设计与制造(CAD/CAM)、计算机辅助教学(CAI)、计算机动画、管理和办公自动化、国土信息和自然资源显示与绘制、科学计算可视化等。1.1.3 常用图像处理应用软件及文件格式Photoshop Adobe Photoshop最初的程序是由Michigan大学的研究生Thomas创建,后经Knoll兄弟以及Adobe公司程序员的努力Adobe Photoshop一举成为优秀的平面设计编辑软件。Photoshop是世界顶尖级的图像设计与制作工具软件。无论是平面广告设计、室内
8、装潢、影像特效及广告创意设计,还是处理个人照片,Photoshop都已经成为不可或缺的工具。Photoshop的一些实用功能包括:图像合成、色彩校正、图层调板、通道使用、动作调板、路径工具、滤镜等图像处理功能。CorelDraw CorelDraw 是加拿大Corel软件公司的产品。是一个基于矢量图的绘图与排版软件,广泛应用于商标设计、标志制作、模型绘制、插图描画、排版及分色输出等诸多领域。CorelDraw界面设计友好,操作精微细致。向设计者提供了一整套绘图工具包括圆形、矩形、多边形、方格、螺旋线,并配合塑形工具对各种基本图形做出更多的变化,如圆角矩形,弧、扇形、星形等。同时也提供了特殊笔刷
9、,如压力笔、书写笔、喷洒器等。为便于设计需要,CorelDraw还提供了一整套的图形精确定位和变形控制方案。给商标、标志等需要准确尺寸的设计带来极大的便利。CorelDraw的实色填充提供了各种模式的调色方案以及专色的应用、渐变、位图、底纹的填充,颜色变化与操作方式更是别的软件都不能及的。而CorelDraw的颜色管理方案让显示、打印和印刷达到颜色的一致。CorelDraw的文字处理与图像的输出输入构成了排版功能。文字处理功能强大,支持了大部分图像格式的输入与输出,可以与其他软件畅行无阻地交换共享文件。常用图像文件格式:BMP、GIF、JPEG、JPEG2000、PSD、PNG、SVG、CDR
10、BMP格式BMP是英文Bitmap(位图)的简写,是Windows操作系统中标准的图像文件格式,能够被多种Windows应用程序所支持。这种格式的特点是包含的图像信息较丰富,几乎不进行压缩,也由此导致了它与生俱生来的一个缺点:占用磁盘空间过大。所以,目前BMP在单机上比较流行。GIF格式GIF是英文GraphicsInterchangeFormat(图形交换格式)的缩写。顾名思义,这种格式是用来交换图片的。上世纪80年代,美国一家著名的在线信息服务机构CompuServe针对当时网络传输带宽的限制,开发出了GIF图像格式。先看到图像的大致轮廓,然后随着传输过程的继续而逐步看清图像中的细节部分,
11、从而适应了用户的“从朦胧到清楚”的观赏心理。目前Internet上大量采用的彩色动画文件多为这种格式的文件。GIF格式只能保存最大8位色深的数码图像,所以它最多只能用256色来表现物体,对于色彩复杂的物体就力不从心了。尽管如此,这种格式仍在网络上广泛应用,这和GIF图像文件短小、下载速度快、可用许多同样大小的图像文件组成动画等优势是分不开的。JPEG格式JPEG由联合照片专家组(JointPhotographicExpertsGroup)开发并命名为“ISO10918-1”,JPEG仅仅是一种俗称而已。JPEG文件的扩展名为.jpg或.jpeg,其压缩技术十分先进,它用有损压缩方式去除冗余的图
12、像和彩色数据,获取极高的压缩率的同时能展现十分丰富生动的图像,换句话说,就是可以用最少的磁盘空间得到较好的图像质量。由于JPEG格式的压缩算法是采用平衡像素之间的亮度色彩来压缩的,因而更有利于表现带有渐变色彩且没有清晰轮廓的图像。同时JPEG还是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对同一文件压缩,比如最高可以把1.37MB的BMP位图文件压缩至20.3KB。当然,完全可以在图像质量和文件尺寸之间找到平衡点。基于JPEG的优点,应用非常广泛,特别是在网络和光盘读物上。目前各类浏览器均支持JPEG这种图像格式,主要是因为JPEG格式的文件尺寸较小,下载速度快,使得Web页
13、有可能以较短的下载时间提供大量美观的图像。JPEG 2000格式JPEG 2000同样是由JPEG组织负责制定的,正式名称叫做“ISO15444”,与JPEG相比,它是具备更高压缩率以及更多新功能的新一代静态影像压缩技术。JPEG 2000作为JPEG的升级版,其压缩率比JPEG高约30%左右。与JPEG不同的是,JPEG 2000同时支持有损和无损压缩,而JPEG只能支持有损压缩。无损压缩对保存一些重要图片十分有用。JPEG 2000的一个极其重要的特征在于它能实现渐进传输,这一点与GIF的“渐显”有异曲同工之妙,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示
14、,而不像JPEG,由上到下慢慢显示。此外,JPEG2000还支持所谓的“感兴趣区域”特性,你可以任意指定影像上你感兴趣区域的压缩质量,还可以选择指定的部份先解压缩。JPEG2000和JPEG相比优势明显,且向下兼容,因此取代传统的JPEG格式指日可待。JPEG2000可应用于传统的JPEG市场,如扫描仪、数码相机等,亦可应用于新兴领域,如网路传输、无线通讯等等。PSD格式PSD是Photoshop的专用格式PhotoshopDocument(PSD)。PSD其实是Photoshop进行平面设计的一张“草稿图”,它里面包含有各种图层、通道、遮罩等多种设计的样稿,以便于下次打开文件时可以修改上一次
15、的设计。在Photoshop所支持的各种图像格式中,PSD的存取速度比其它格式快很多,功能也很强大。 PNG格式PNG(PortableNetworkGraphics)是一种新兴的网络图像格式。在1994年底,由于Unysis公司宣布GIF拥有专利的压缩方法,要求开发GIF软件的作者须缴纳一定费用,由此促使免费的PNG图像格式的诞生。PNG一开始便吸取GIF及JPG两家之长,打算一举取代这两种格式。1996年10月1日由PNG向国际网络联盟提出并得到推荐认可标准,并且大部分绘图软件和浏览器开始支持PNG图像浏览,从此PNG图像格式生机焕发。PNG的缺点是不支持动画效果,如果在这方面能有所加强,
16、便可以完全替代GIF和JPEG。Macromedia公司的Fireworks软件默认格式就是PNG。现在,越来越多的软件开始支持这一格式,而且在网络上也越来越流行。PNG是目前保证最不失真的格式,它汲取了GIF和JPG二者的优点,存贮形式丰富,兼有GIF和JPG的色彩模式;它的另一个特点能把图像文件压缩到极限以利于网络传输,但又能保留所有与图像品质有关的信息,因为PNG是采用无损压缩方式来减少文件的大小,这一点与牺牲图像品质以换取高压缩率的JPG有所不同;它的第三个特点是显示速度很快,只需下载1/64的图像信息就可以显示出低分辨率的预览图像;第四,PNG同样支持透明图像的制作,透明图像在制作网
17、页图像时很有用,可以把图像背景设为透明,用网页本身的颜色信息来代替设为透明的色彩,这样可使图像和网页背景很和谐地融合在一起。SVG格式SVG是目前最流行的图像文件格式,它的英文全称为ScalableVectorGraphics,意思为可缩放的矢量图形。基于XML(ExtensibleMarkupLanguage),由WorldWideWebConsortium(W3C)联盟开发的。严格的说是一种开放标准的矢量图形语言,用于设计高分辨率的Web图形页面。用户可以直接用代码来描绘图像,可以用任何文字处理工具打开SVG图像,通过改变部分代码来使图像具有互交功能,并可以随时插入到HTML中通过浏览器来
18、观看。提供了目前网络流行的GIF和JPEG格式无法具备的优势:可以任意放大图形显示,但绝不会以牺牲图像质量为代价;文字在SVG图像中保留可编辑和可搜寻的状态;平均来说,SVG文件比JPEG和GIF格式的文件要小很多,因而下载也很快。CDR格式CDR格式是著名绘图软件CorelDraw的专用图形文件格式。由于CorelDraw是矢量图形绘制软件,所以CDR可以记录文件的属性、位置和分页等。但它在兼容度上比较差,所以CorelDraw应用程序中能够使用,但其他图像编辑软件打不开此类文件。1.2 视觉原理1.2.1 人眼的构造图1-5所示是人眼横截面简图,人的眼睛近似球形,位于眼眶内。其平均直径大约
19、为20mm。最前端突出于眼眶外12-14mm,受眼睑保护。眼睛包括眼球壁、眼内腔和内容物、神经、血管等组织。眼球壁主要分为外、中、内三层。外层由角膜、巩膜组成。角膜是一种硬而透明的组织,覆盖着眼睛的前表面。与角膜相连的巩膜是一层包围着眼球其余部分的不透明膜。中间层又称葡萄膜、色素膜,具有丰富的色素和血管,包括虹膜、睫状体和脉络膜三部分。虹膜是环绕在瞳孔四周有色彩的部分,它的颜色完全由父母遗传而来,因人而异。虹膜的收缩和扩张控制着进入眼睛的光量。虹膜中间开口处(瞳孔)的直径是可变的,范围大约在2-8mm;睫状体是连续于虹膜后方的环形增厚部分,通过晶状体悬韧带与晶状体相连,睫状体内含睫状肌,有调节
20、晶状体曲度的作用;脉络膜位于巩膜的下面,这层膜包含有血管网,脉络膜外壳着色很重,因此有助于减少进入眼内的外来光和眼球内反向散射光的数量,主要功能是营养视网膜外层及玻璃体,并有遮光作用,使反射的物象清楚。 同时对人的视觉系统起保护作用,对整个视觉神经有调节作用。内层为视网膜,是一层透明的膜,它布满了整个后部的内壁。当眼球适当地聚焦时,来自眼睛外部的光在视网膜上成像。视网膜表面分布的感光细胞提供了图案视觉。感光细胞分为两类:锥状体和杆状体。每只眼睛包含的锥状体数目在600万到700万之间,主要位于视网膜的中间部分,称之为中央凹,中央凹本身是在视网膜上直径约为1.5mm的凹坑,对颜色灵敏度很高。每个
21、锥状体都连接到自身的神经末端,人们可以利用这些锥状体充分地分辨图像细节。锥状视觉称为白昼视觉和亮光视觉;杆状体较锥状体的数目更多,约有7500万到15 000万个分布在视网膜表面。由于分布面积较大而且几个杆状体连接到一个神经末端,因此减少了感光细胞感知细节的数量。杆状体用来给出视野内一般的总体图像,它们没有彩色感觉,而在低照明度下对图像较敏感。 1.2.2 图像在眼睛中的形成过程人类眼睛的成像原理与照相机类似,照相机有镜头、光圈、暗箱、底片和调节装置。在人类眼睛的结构上,角膜和晶状体相当于镜头,瞳孔相当于光圈,脉络膜相当于暗箱,视网膜相当于底片。自然界各种物体在光线的照射下,不同颜色可以反射出
22、明暗不同的光线,这些光线透过角膜、晶状体、玻璃体的折射,在视网膜上显出景物的影景象(倒立的像),构成光刺激。视网膜上的感光细胞(锥状体和杆状体)受光的刺激后,经过一系列的物理化学变化,转换成神经冲动,由视神经传入大脑层的视觉中枢,然后我们就能看见物体了,经过大脑皮层的综合分析,产生视觉。人们要看清景物(正立的立体像),需要通过睫状肌的收缩与松弛完成,就象相机能拍出清晰的照片,要调节镜头的焦距一样。1.3 数字图像处理的目的及特点1.3.1 数字图像处理的目的1、提高图像的视觉质量以提供人眼主观满意或较满意的效果。 2、提取图像中目标的某些特征,以便于计算机分析或人进行识别。 3、为了存储和传输
23、庞大的图像和视频信息,常常对这类数据进行有效的压缩。 4、信息的可视化。 5、信息安全的需要,主要反映在数字图像水印和图像信息隐藏。 1.3.2 数字图像处理的特点数字图像处理主要具有如下几方面的特点:1、处理精度高。图像采集设备可将一幅模拟图像数字化为任意大小和精度的二维数组供处理设备加工。根据应用的需求,数字化的像素数可以从几十到几百万,每个像素的等级可以量化为1位到16位甚至更高,活动图像的帧率可以从十几Hz到六十Hz,高速摄像达几千Hz到上万Hz。而对处理设备来说,不同数据量的图像其处理程序大致是一样的。2、重现性能好。理论上,数字图像处理不会因图像的存储、传输等过程而导致图像质量的退
24、化。图像质量主要受数字化过程时取样样本数、量化精度,处理过程中的处理精度等的限制。由于在一定范围内,人眼和机器视觉的分辨率都是有限的,所以只要保持足够的处理精度,则数字图像处理过程能够保持原有图像的重视。3、灵活性高。与模拟图像处理相比较,由于图像处理软件功能十分强大、扩展性好、与用户可以友好地交互,数字图像处理不仅能完成一般的线性和非线性处理,而且一切可以用程序实现的智能信息处理方法都可以加以采用。4、数字图像处理后的图像可能是供人观察和评价的,也可能作为机器视觉的预处理结果。如果供人观察,则处理后的图像的质量优劣必然受人的主观因素的影响。由于人的视觉系统十分复杂,受环境条件、视觉性能、人的
25、心理和知识背景等因素的影响,其评价体系也难以统一。通常对图像处理的评价往往从客观和主观两方面进行评价。另一方面,机器视觉是依靠计算机来模仿人的视觉功能,通过人类视觉感知机理的研究促进计算机视觉的研究,但图像庞大的信息量、多义性、环境因素的影响,以及不同知识的指导将使机器视觉对图像的理解的正确性远远低于人类视觉。5、数字图像处理技术适用面宽。原始模拟图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像、超声波图像或红外图像。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。来自不同信息源的图像只要被变换为数字编码形式后,均可采用二维数
26、组表示的形式,也可用计算机来处理。6、数字图像处理技术综合性强。数字图像处理技术适用面宽,涉及的技术领域相当广泛。数学、物理学等领域更是数字图像处理的基础。通信技术、计算机技术、电子技术、电视技术等是其实现的支撑技术。1.4 本章小结本章主要介绍了有关数字图像处理的基本概念、人类的视觉成像原理及数字图像处理的目的和特点。由于篇幅有限,本章中涉及主题的覆盖面是使读者在整体概念方面对数字图像处理技术有了一定的了解。学习本章要求掌握图像和像素的基本概念以及数字图像处理、计算机视觉、计算机图形学的概念和它们之间的相互关系。了解数字图像处理的目的及特点。习题1、结合自己的实际工作和生活说明数字图像处理的
27、应用。2、简述像素与图像的概念。3、数字图像处理、计算机视觉、计算机图形学所研究内容的区别和联系。4、图像存储的常用格式。5、简述图像在人眼中的形成过程。6、简述数字图像处理的目的与特点。Thank You!第2章 图像的数字化与显示图像是人类获取和交换信息的主要来源。图像处理的任务是将客观世界的景象进行获取并转化为数字图像,进行增强、编码、恢复和压缩等处理,将一幅原始图像转化为一幅被赋予新意义的图像。 2.1 图像的输入图像的输入主要是通过图像输入设备,图像输入设备完成将模拟光学图像转换成模拟电图像的过程,数字化图像输入设备进一步将模拟电图像进行数字化以便于进行介质存储和计算机处理。根据不同
28、的需求,图像输入设备主要有数码摄像机、数码照相机、扫描仪和各种遥感图像获取设备(如红外摄影设备、微波设备)等。1、数码摄像机数码摄像机(Digital Video),译成中文就是“数字视频”的意思。如图2-2所示。数码摄像机是目前使用最广泛的图像获取设备。其工作原理为:数码摄像机的镜头聚焦来自摄像对象的光线。经过聚焦的光线照射到电荷藕合器件上,光能被转换成相应的电荷。电流顺序通过A/D转换器后,被转换成一系列的数字信号。该数字信号随后又送到编码解码器,编码解码器利用压缩算法压缩各帧的比特数,但不丢失任何可视信息。压缩值被写入磁带中多条磁轨中的一条上,组成了完整的视频。其他磁轨包括音频、时间记录
29、和帧数等等,由于每一帧是分别压缩的,所以它可被用作一个单独的快照。数码摄像机的核心部件是光电转换装置,也称为固态阵。目前大多数感光基元多为电荷藕合器件CCD(Charge Coupled Device),使用一种高感光度的半导体材料制成,是位于数字摄像机后部的一块集成电路板上的感光二极管阵列,该阵列通常由对应于六十五万到一百多万个像素的感光二极管组成,具体情况视摄像机的分辨率而定。能把光线转变成电荷,通过模数转换器芯片转换成数字信号。一个视频的每一帧只用到阵列的一部分。对于各帧来说,是由红、绿、蓝三种镜头来确定各个二极管记录何种色光。数码摄像机的镜头由多片镜片组成,材质则分为玻璃与塑料两类。如
30、果数码摄像机镜头以玻璃为材料。从右至左镜头组件依次由透镜、电子快门、透镜组1、透镜组2以及CCD组成,拍摄的影像就是沿着这条光路投射在CCD上成像的。如图2-3所示。组件中的焦距调节系统和快门系统由透镜组1和电子快门构成,二者连接在一起。在电机的带动下,透镜组1和电子快门可以前后移动,进行焦距调节,从而获得最清晰的图像,由电子快门控制曝光。多组透镜用来完成光学成像,而最后的CCD把光信号转换为电信号. 数码摄像机的优点是体积小巧、 速度快、成本低、灵敏度高,适用于作为实时图像输入设备。缺点是灰度层次较差、非线性失真较大、有黑斑效应,在使用中需要校正。目前,CCD摄像机可达19201035的高分
31、辨率,快门速度可达10-4s。2、数码照相机数码照相机(Digital Camera,简称数码相机)也叫数字相机,是传统照相技术与数字图像处理技术相结合的产物。与普通照相机在胶卷上靠溴化银的化学变化来记录图像的原理不同,它是由光学镜头、CCD器件、A/D、MPU(微处理器)、内置存储器、LCD(液晶显示器)、PC卡(可移动存储器)和接口(计算机接口、电视机接口)等部分组成。核心部件是CCD图像传感器,主流机型分辨率已在400万像素以上。感光器件是CCD阵列。CCD可以对亮度进行分级,但并不能识别颜色。为此,数码照相机应用红、绿、蓝三个彩色滤镜,当光线从红、 绿、 蓝滤镜中穿过时,就可以得到每种
32、色光的反应值,再通过软件对得到的数据进行处理,从而确定每一个像素点的颜色。 CCD生成的数字图像被传送到照相机的一块内部芯片上。该芯片负责把图像转换成相机内部的存储格式(通常为JPEG格式)。最后,把生成的图像保存在存储卡中。再通过USB接口与计算机相连,将拍摄的图像下载到计算机中,以便处理或插到文档Web页面中,或用彩色打印机输出。如图2-4所示 .3、扫描仪扫描仪是将各种形式的图像信息(如照片、文本页面、图纸、美术图画、照相底片、菲林软片,甚至纺织品、标牌面板、印制板样品等三维对象)输入计算机的重要工具,特点是精度和分辨率高。目前,1200DPI(Dot Per Inch)以上精度的扫描仪
33、很常见。而且扫描仪的成本很低,一台平板式扫描仪的价格在千元左右。由于扫描仪良好的精度和低廉的价格,已成为当今应用最为广泛的图像数字化设备。但是用扫描仪获取图像信息速度较慢,不能实现实时输入。扫描仪外形如图2-5所示。扫描仪内部基本组成部件是光源、光学透镜、感光元件,还有一个或多个的模拟-数字转换电路。从最基本的原理讲,扫描仪是把模拟数据转化为数字数据的图像输入设备。从上图扫描仪的工作过程来看,首先将欲扫描的原稿正面朝下铺在扫描仪的玻璃板上;然后启动扫描仪驱动程序后,灯管发出光线,照射到扫描仪玻璃板上的反射稿件上,为了均匀照亮稿件,扫描仪光源为长条形,并沿y方向扫过整个原稿;照射到原稿上的光线经
34、反射后穿过一个很窄的缝隙,形成沿x方向的光带,根据稿件不同地方亮暗程度的不同,形成强弱不等的反射光线,然后通过一系列反射镜,由光学透镜聚焦并进入分光镜,经过棱镜和红绿蓝三色滤色镜得到的RGB三条彩色光带分别照在镜头另一端的电荷藕合器(CCD)上, CCD排列成横行,每一个单元对应着一行里的一个像素,CCD将光学信号转换为相应的电信号,即模拟信号(电压),同时量化出像素的灰暗程度,这些信号最终通过A/D转换器转化为计算机所能识别的数字信号,然后经不同的接口,EPP、USB或SCSI输送到计算机。整个扫描过程涉及到光学、机械、电子等不同方面,任何一个部件的设计都会影响到最终的数字化结果。不同级别的
35、扫描仪的构造基本一样,但所使用的部件及技术却大不相同。 4、各种遥感图像获取设备遥感中常用的图像获取设备有光学摄影设备, 如摄像机、 多光谱像机等; 红外摄影设备,如红外辐射计、 红外摄像仪、 多通道红外扫描仪、 多光谱扫描仪(MSS);微波设备,如微波辐射计、 侧视雷达、 真空孔径雷达、 合成孔径雷达(SAR)。2.2 图像的取样和量化用计算机处理图像,就要首先把连续图像进行空间坐标和幅度的离散化处理。把对图像空间连续坐标和的离散化,称为对图像的取样;对图像幅度的离散化,称为图像的量化。数字化过程包括图像的取样和量化两个过程。经过数字化,一副画面就转化成计算机能够处理的数字图像。图像分辨率和
36、灰度级是在取样和量化过程中用到的两个基本概念。图像分辨率 表示图像总像素的数目,分辨率越高,相邻像素点间的距离越小,显示的字符或图像就越清晰。例如,640480图像的总像素数为307,200个。对同样大小的一副图,如果组成该图的图像像素越多,则说明图像的分辨率越高,看起来就越逼真(包含了更多的图像细节)。相反,图像显得越粗糙,如图2-7所示。2.2.1 图像采样 图像在空间上的离散化称为采样。也就是用空间上部分点的灰度值代表图像,这些点称为采样点。由于图像是一种二维分布的信息,为了对它进行采样操作,需要先将二维信号变为一维信号,再对一维信号完成采样。具体做法是:先沿垂直方向按一定间隔从上到下顺
37、序地沿水平方向直线扫描,取出各水平线上灰度值的一维扫描。而后再对一维扫描线信号按一定间隔采样得到离散信号,即先沿垂直方向采样,再沿水平方向采样这两个步骤完成采样操作。对于运动图像(即时间域上的连续图像),需先在时间轴上采样,再沿垂直方向采样,最后沿水平方向采样由这三个步骤完成。对一幅图像采样时,若每行(即横向)像素为M个,每列(即纵向)像素为N个,则图像大小为MN个像素。如图2-9所示。2.2.2 图像量化图像幅度的数字化处理,即把采样点上表示明暗的连续量(灰度级)离散化后用数值表示的过程称为量化。模拟图像经过采样后,在时间和空间上离散化为像素。但采样所得的像素值(即灰度级)仍是连续量,所以需
38、要将采样后所得的各像素的灰度级从模拟量转换为离散量。如图2-10(a)所示,若连续灰度级用z来表示,对于满足zizzi+1的z值,都量化为整数qi。qi称为像素的灰度级,z与qi的差称为量化误差。一般,像素值量化后用一个字节(8 bit)来表示。如图2-10(b)所示,把由黑灰白的连续变化的灰度级,量化为0255共256级灰度值,灰度级的范围为0255,表示亮度从深到浅,对应图像中的颜色为从黑到白。图像的量化等级反映了图像的质量。例如,图像中的每个像素都用8位二进制数表示,有2的8次方256个量级;若采用16位二进制数表示,则有2的16次方65536个量级;若采用24位二进制数表示,则有2的2
39、4次方1667万个量级。量级越大,图像质量就越高,存储空间要求就越大。从人眼的识别能力来看,量级越大,图像可以拥有更丰富的亮暗变化信息,自然可以产生更为细致的图像效果。但由于计算机的工作速度,存储空间是相对有限的,各种参数都不能无限地提高。如图2-11所示。对于不同的图像,量化方法分为两种:一种是等间隔量化,另一种是非等间隔量化。等间隔量化就是简单地把采样值的灰度范围等间隔地分割并进行量化。对于像素灰度级在黑白范围分布较均匀的图像,这种量化方法可以得到较小的量化误差。该方法也称为均匀量化或线性量化。并不是所有的图像的像素灰度级都是在黑白范围均匀分布的,为了减小量化误差,引入了非均匀量化的方法。
40、非均匀量化是依据一幅图像具体的灰度值分布的概率密度函数,按总的量化误差最小的原则来进行量化。具体做法是对图像中像素灰度值频繁出现的灰度值范围,量化间隔取小一些,而对那些像素灰度值极少出现的范围,则量化间隔取大一些。由于图像灰度值的概率分布密度函数因图像不同而异,所以不可能找到一个适用于各种不同图像的最佳非等间隔量化方案。因此,实用上一般都采用等间隔量化。一幅图像在采样时,行、列的采样点与量化时每个像素量化的级数,既影响数字图像的质量,也影响到该数字图像数据量的大小。假定图像取MN个采样点,每个像素量化后的灰度二进制位数为Q,一般Q总是取为2的整数幂,即Q=2k, 则存储一幅数字图像所需的二进制
41、位数b为 对一幅图像,当量化级数Q一定时,采样点数MN对图像质量有着显著的影响。采样点数越多,图像质量越好;当采样点数减少时,图上的块状效应就逐渐明显。同理,当图像的采样点数一定时,采用不同量化级数的图像质量也不一样。量化级数越多,图像质量越好;当量化级数越少时,图像质量越差,量化级数最小的极端情况就是二值图像(即非黑即白,灰度级没有中间过渡的图像),图像出现假轮廓(即原始场景中不存在的轮廓)。字节数B为 对一幅图像,当量化级数Q一定时,采样点数MN对图像质量有着显著的影响。采样点数越多,图像质量越好;当采样点数减少时,图上的块状效应就逐渐明显。同理,当图像的采样点数一定时,采用不同量化级数的
42、图像质量也不一样。量化级数越多,图像质量越好;当量化级数越少时,图像质量越差,量化级数最小的极端情况就是二值图像(即非黑即白,灰度级没有中间过渡的图像),图像出现假轮廓(即原始场景中不存在的轮廓)。2.3 连续图像的数学描述图像经过采样和量化后的结果是一个矩阵。用两种主要方法来表示数字图像。假如一幅图像被取样,则产生的数字图像有M行和N列,坐标的值变为离散值,而且为表达清楚和方便起见,离散坐标应该用整数。这样,原点的坐标值为,沿图像第一行的下一个坐标值用来表示。用符号(0,1)表示沿第一行的第二个取样很重要,但他并不意味着是图像取样的物理坐标实际值。用紧凑矩阵形式写出完整的MN数字图像:这个表
43、达式的右侧定义了一幅数字图像。矩阵中的每个元素称为图像单元、图像元素或像素。在某些讨论中,可以用传统矩阵表示法来表示数字图像和像素:显然, 因此公式(2-3-1)和公式(2-3-2)是恒等矩阵。2.4 图像的输出数字图像的显示,其目的在于将数字图像转化为适合于人眼观察的形式。在多媒体技术中,显示器和其他图像输出设备(如打印机、胶片记录仪、静电绘图仪等)都可以看成图像的输出显示媒体。显示器是典型的暂时显示设备(volatile display),而打印机等是永久显示设备(permanent display)。1、暂时显示设备常见的暂时显示设备主要有采用光栅扫描的阴极射线管(CRT)、显示器、液晶
44、显示器(LCD)和等离子显示器等。(1)光栅扫描显示器光栅扫描的阴极射线管(CRT)显示器主要由电子枪、偏转线圈、荫罩、荧光粉层和玻璃外壳五部分组成。光栅扫描方式将CRT屏幕分成由像素构成的光栅网格,其中像素具有灰度和颜色,所有像素的灰度和颜色信息(也称为显示内容)保存在一个专门的内存区域中,称为帧缓冲存储器(简称帧缓存)。当显示器通电后,在电子枪和荧光粉层之间形成一个电势差为1000030000伏特的直流加速电场,当电子枪射出的电子束经过聚集和加速后,水平和垂直偏转线圈分别产生水平和垂直磁场,电子束在不同方向磁场力作用下从左向右,从上向下扫描荧光屏,产生一幅幅光栅,经过高压加速后的电子束所得
45、动能的一部分便转化成光能,形成可见光。电子束先从左到右、再从上向下,做快速的水平扫描和垂直扫描(一秒钟超过几十遍)。由于荧光粉的余辉和人眼的视觉暂效应,还要进行水平回扫和垂直回扫,人们就可以看到在屏幕上形成了一幅幅的图像。(2)液晶显示器早在19世纪末,奥地利植物学家就发现了液晶,即液态的晶体,也就是说一种物质同时具备了液体的流动性和类似晶体的某种排列特性。在电场的作用下,液晶分子的排列会产生变化,从而影响到它的光学性质,这种现象叫做电光效应。利用液晶的电光效应,英国科学家在本世纪制造了第一块液晶显示器。液晶显示器从1998年开始进入台式机应用领域。液晶按照分子结构排列的不同可分为三种:类似粘
46、土状的Smestic液晶、类似棉花棒的Nematic液晶、类似胆固醇状的Choleseic液晶,这三种液晶的物理特性不尽相同,目前用于液晶显示器的是第二种液晶。液晶显示技术也存在弱点和技术瓶颈,与CRT显示器相比亮度、画面均匀度、可视角度和反应时间上都存在明显的差距。其中反应时间和可视角度均取决于液晶面板的质量,画面均匀度和辅助光学模块有很大关系。由于液晶显示器有着许多传统CRT不可比拟的优点,液晶显示器是通过数字信号来显示影像的,和阴极射线管采用模拟信号不太相同,不过为了符合市场要求,目前液晶显示器的信号种类是模拟与数字两种均有。采用模拟信号的好处是可以和目前绝大多数显卡兼容,但是这样做在液
47、晶显示器内部还得加装一个APC,将传输进来的模拟信号再转换成数字信号,这样可能会影响显示品质。 目前一些供应商正在制定PC机与LCD之间的专用标准接口,其目的是提供在主流机型已存在的端口上直接兼容数字信号,不过目前的显卡很少有支持数字传输界面的,而且数字界面的管脚也尚未统一,这是近期内要解决的问题之一。 此外,液晶显示器的色彩调校。一直不尽如人意,这是因为LCD的色彩调校要考虑到环境光源和液晶显示器的属性,再加上液晶显示器的可视角度狭窄,要同时调整出一个最佳的观看角度和色彩正确性就非常不容易。目前市面上还没有专为桌面型液晶显示器所设计的色彩调校软件,不过相信未来,将会有更多的厂商重视液晶显示器
48、的色彩调校。(3)TFT型液晶显示器TFT液晶显示器,也称为薄膜晶体管液晶显示器,其英文全称为Thin-film transistor liquid crystal display, 简称为TFT LCD。工作原理:采用两夹层,中间填充液晶分子,夹层上部为FET晶体管。夹层下部为共同电板,在光源设计上要用“背透式”照射方式,在液晶的背部设置类似日光灯的光管。光源照射时由下而上透出借助液晶分子传导光线,透过FET晶体管层,晶体分子会扭转排列方向产生透光现象,影像透过光线显示的屏幕上,到下一次产生通电之后分子的排列顺序又会改变,再显示出不同影像。(4)等离子显示器等离子显示器(Plasma Dis
49、play Panel,简称PDP)是一种利用气体放电原理显示的输出设备,这种屏幕采用了等离子管作为发光元件。一般由三层玻璃板组成。在第一层的内表面涂有金属氧化物导电薄膜作激励电极的垂直条,中间层是等离子管阵列,内部充有氖、氙气体,第三层内表面涂有金属氧化物导电薄膜作激励电极的水平条。要点亮某个地址的等离子管,开始要在相应行或列上施加较高的电压,封在两层玻璃之间的等离子管小室中的气体会产生紫外光,从而激励荧光屏上的红、绿、蓝三基色荧光粉发出可见光。 每个等离子管作为一个像素。等该等离子管点亮后,可用低电压维持氖气等离子管的亮度。关掉某个等离子管,只要将相应的电压降低。等离子管开关的周期时间是15
50、ms。由于像素的明暗和颜色变化组合,通过改变控制电压,可以产生各种灰度和色彩的图像。等离子体技术同其它显示方式相比,在结构和原理方面存在根本的区别。从工作原理上来说,类似普通日光灯,等离子显示器由各个独立的荧光粉像素发光组合而成,而且是主动发光,不需要多余的背光照明系统,因此图像鲜艳、明亮、干净、清晰。另外,等离子显示设备最突出的特点是可以做到很薄,可轻易做出40英寸以上的大屏幕显示设备,而厚度一般不超过10厘米。 与LCD液晶电视相比,等离子电视有亮度高、色彩还原浓烈鲜艳(不过只适合中远距离观看)、灰度丰富、对快速变化的画面响应速度快等优点。另外,等离子体显示器视野开阔,视角宽广,等离子的屏
51、幕越大,图像的色深和保真度越高,能提供格外亮丽、均匀平滑的画面和前所未有的更大观赏角度,避免了LCD技术中的响应时间问题。等离子显示器无扫描线扫描,因此图像清晰稳定无闪烁,不会导致眼睛疲劳。等离子无X射线辐射。由于这些突出特点,等离子堪称真正意义上的绿色环保显示产品,是替代传统CRT彩电的理想产品。PDP显示器因为其特殊的结构和工作原理,先天就带有一定的缺点。首先,一块PDP显示面板是由几十万个独立的小气室组成的,每一个小气室即每个独立像素都需要发光,相比LCD和传统CRT显示器其耗电量是很惊人的。其次,PDP的使用寿命也是有一定局限性的,其老化是难以避免的,一般使用几千个小时后,就会产生明显
52、的亮度降低。2、永久显示设备(1)打印机 分为针式打印机、喷墨打印机、激光打印机、热升华打印机针式打印机之所以得名,关键在于其打印头的结构。打印头的结构比较复杂,大致说来,可分为打印针,驱动线圈,定位器,激励盘等等。简单的说,打印头的工作过程是:当打印头从驱动电路获得一个电流脉冲时,电磁铁的驱动线圈就产生磁场吸引打印针衔铁,带动打印针击打色带,在打印纸上打出一个点的图形。因其直接执行打印功能的是打印针,所以这类打印机被称为针式打印机,如图2-12所示。喷墨打印机按工作原理可分为固体喷墨打印机和液体喷墨打印机两种(常见为液体喷墨打印机),而液体喷墨方式又可分为气泡式(Canon和HP)与液体压电
53、式(Epson),喷墨打印机外形如图2-13所示。激光打印机是将激光扫描技术与电子照排技术结合起来的产物,是一种既可以打印字符又可以打印图形、图像的设备,它的打印精度很高,分辨率可达300dpi或600dpi,且打印速度快,因此在图形输出设备中应用非常广泛。但是它的打印幅度较小,最大幅面为A4或A3。激光打印机可分为黑白和彩色两种,彩色激光打印机的打印色彩鲜艳,可达到真彩色效果,但价格昂贵,如图2-14所示。热升华打印机 (Thermal Dye Sublimation)的工作原理是将多种颜色(青色、品红色、黄色和黑色,简称CMYK)的固体颜料(称为色卷)设置在一个转鼓上,这个转鼓上面安装有数
54、以万计的半导体加热元件,当这些加热元件的温度升高到一定程度时,就可以将固体颜料直接转化为气态(固态不经过液化就变成气态的过程称为升华,因此这种打印机被称为热升华打印机),然后将气体喷射到打印介质上。每个半导体加热元件都可以调节出256种温度,从而能够调节色彩的比例和浓淡程度,实现连续色调的真彩照片效果,如图2-15所示。(2)胶片记录仪胶片记录仪属于高精度图像输出设备。其作用是将数字图像通过逐点曝光扫描作业,高保真度的变换成记录在照相底片上的可视图像。一般胶片记录仪可以输出2K(即分辨率为2000线)的图像。35mm胶片的分辨率至少达到4K。它具有几何精度高、色彩、灰度保真度好,密度动态范围大
55、,扫描速度快,图像质量优,暗室装片,明室扫描的特点。广泛应用于航天、航空、测绘、公安、情报、天文、规划、生物、医学、广告和其他科研机构中需要将数字高保真度的变换成胶片影像的诸多领域(3)静电绘图仪静电绘图仪是一种光栅扫描设备,写头上密集排列着一排写针,图纸在供纸系统控制下匀速前进。它的输出主要是电子式的,运动部分很少,只有供纸系统和调色盒是由机械驱动。它的工作原理是:事先使白纸或黑纸上带有负电荷,吸有调色剂的写针尖带有正电荷,当由程序控制的电压按阵列式输出并选中某针尖时,就将调色剂附着到纸上,产生极小的静电点,进而生成图像和字符。分辨率可达800dpi。彩色静电绘图仪采用高质量的黄、紫、青、黑
56、四色墨水和纸张,可在不同的位置形成4000多种色彩图案,可产生比彩色照片还好的效果。2.5本章小结本章主要介绍了数字图像的处理过程,包括数字图像的输入、采样和量化、处理后的数字形式和输出等几个方面。学习本章要求了解数字图像输入设备和输出设备的基本工作原理。掌握数字图像采样和量化理论。掌握连续数字图像的表示。习题1、图像的输入设备包含哪些?2、在理想情况下获得一幅数字图像时,采样和量化间隔越小,图像的画面效果越好。当一幅图像的数据量被限定在一个范围内时,如何考虑图像的采样和量化,使得图像的表现效果尽可能好?3、图像量化时,如果量化级比较小时会产生什么现象?为什么?4、图像的输出设备包含哪些?Th
57、ank You!第三章 彩色图像处理彩色图像中的颜色信息非常重要,因为,第一,利用颜色信息,可以简化目标物的区分及从场景中提取出目标物;第二,人眼对颜色非常敏感,可以分辨出来几千种颜色色调和亮度,却只能分辨出几十种灰度。由于第二种原因,我们也常常通过伪彩色变换将灰度图像变为彩色图像,来区分相似的灰度。彩色图像处理可分为两个主要领域:全彩色处理和伪彩色处理。在第一类中,图像用全彩色传感器获取,如彩色摄像机或彩色扫描仪。在第二类中,对特定的单一亮度或亮度范围赋予一种颜色。3.1 彩色基础虽然人的大脑感知和理解颜色所遵循的过程是一种生理心理现象,这一现象还没有完全了解,但颜色的物理性质可以由实验和理
58、论结果支持的基本形式来表示。白光通过棱镜,就会折射出颜色的光谱。一般可以分解成红、橙、黄、绿、蓝、青、紫七色。可见光谱的每部分都有它自己唯一的值,它被称之为颜色,理论上可以选择几百万种颜色,从一种颜色转换成另一种颜色实际上很难区别。可见光谱可以由多种颜色构成,但是人们一般只看到一种颜色,它是多种颜色混合后结果。因为人眼有把多种颜色相混合的能力。在心理生物学上,颜色由其色彩、色饱和度和明度决定。顾名思义,色彩即颜色的“色彩”,它是某种颜色据以定义的名称。色饱和度是单色光中掺入白光的度量,单色光的色饱和度为100%,白光加入后,其色饱和度下降,非彩色光的色饱和度为0%,明度为光的强度值。在心理物理
59、学上,与色彩、色饱和度和明度相对应的是主波长、色纯和亮度。在可见光谱上,单一波长的电磁能所产生的颜色是单色的。光的颜色由其主波长决定,而色纯则由单色光中掺入的白光量的相对大小决定。亮度与光的能量成比例,它是单位面积上所接受的光强。 纯的单色光在实际生活中是少见的,人们所看到的颜色都是混合色。彩色图形显示器(CRT)上每个像素都是由红、绿、蓝三种荧光点组成,这是以人类视觉颜色感知的三刺激理论为基础设计的。三刺激理论基于这样一个假设:人类眼睛视网膜中的锥状视觉细胞,分别对红、绿、蓝三种光最敏感。实验表明,对蓝色敏感的细胞对波长为440nm左右的光最敏感;对绿色敏感的细胞对波长为545nm左右的光最
60、敏感;对红色敏感的细胞对波长为580nm左右的光最敏感。实验还显示,人类眼睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。3.2 彩色模型彩色模型的用途是在某些标准下用通常可以接受的方式简化彩色规范。本质上,彩色模型是坐标系统和子空间的规范,位于系统中的每种颜色都由单个点来表示。为了科学地定量描述和使用颜色,人们提出了各种颜色模型。目前常用的颜色模型按用途可分为两类,一类面向诸如视频监视器、 彩色摄像机或打印机之类的硬件设备。另一类面向以彩色处理为目的的应用,如动画中的彩色图形。面向硬件设备的最常用彩色模型是RGB模型,而面向彩色处理的最常用模型是HSI模型。3.2.1 RGB彩色模型国际照明委
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年浙江警官职业学院单招职业适应性测试模拟试题及答案解析
- 2026年江苏食品药品职业技术学院单招职业适应性测试备考题库及答案解析
- 2026年贵州建设职业技术学院单招职业适应性测试备考题库及答案解析
- 2026年重庆工业职业技术学院单招职业适应性考试备考题库及答案解析
- 2026年湖南司法警官职业学院单招职业适应性测试模拟试题及答案解析
- 2026年烟台南山学院单招职业适应性测试参考题库及答案解析
- 2026年湖南九嶷职业技术学院单招职业适应性考试模拟试题及答案解析
- 2026年河南推拿职业学院单招职业适应性考试模拟试题及答案解析
- 2026年湖南食品药品职业学院单招职业适应性测试模拟试题及答案解析
- 2026年菏泽职业学院单招职业适应性考试模拟试题及答案解析
- 《山区公路桥梁典型病害手册(试行)》
- 110kv输电线路继电保护系统设计说明书-最终
- 墨尔本餐饮创业计划书
- (新平台)国家开放大学《农村社会学》形考任务1-4参考答案
- 2023燃煤电厂智慧电厂典型设计规范
- 献身国防事业志愿书范文
- 宋小宝小品《碰瓷》完整台词
- 2023年06月北京第一实验学校招考聘用笔试题库含答案解析
- 毛泽东思想和中国特色社会主义理论体系概论(山东师范大学)知到章节答案智慧树2023年
- 《先秦汉魏晋南北朝诗》(精校WORD版)
- 心理学案例分析【六篇】
评论
0/150
提交评论