




已阅读5页,还剩87页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数字图像处理,计算机与信息技术学院李文举,课程性质:专业选修课,课程的地位和意义:数字图像处理是一门新兴的跨学科的前沿高科技,在军事、工业、科研、医学等领域获得了广泛应用,是国内外高校和科研院所的研究生教育中一个重要的研究方向,具有广阔的发展前景。,教学安排:课堂教学:26学时实验:6学时,教材:,计算机图像处理与识别技术,王耀南,李树涛,毛建旭编著,参考教材:,1.数字图像处理及分析,张弘等,机械工业出版社2.数字图像处理与分析,龚声蓉等,清华大学出版社,3.图像处理和分析基础,章毓晋,高等教育出版社4.图像工程,章毓晋,清华大学出版社5.数字图像处理,陈天华,清华大学出版社6.实用数字图像处理,陈书海等,科学出版社7.数字图像处理(第二版),RafaelC.Gonzalez等著,阮秋琦等译,第一章数字图像处理综述,1.1概论人类传递信息的媒介:语言、文字和图像图像:二维或三维景物呈现在视网膜上的影像。图像处理:模拟图像处理、数字图像处理模拟图像处理:包括光学透镜处理、摄影、广播级电视制作等,属于实时处理。速度快且能并行作业,但精度低、灵活性差,基本上无判断功能和非线性处理功能。数字图像处理:一般指用计算机进行的图像处理,也称计算机图像处理或计算机数字图像处理。精度高、处理内容丰富、可进行复杂的非线性处理,但处理速度较慢。数字图像处理技术的发展历史:里程碑:1964年美国加利福尼亚的喷气推进实验室用计算机处理“旅行者7号”传送的月球图像。60年代末70年代初:医学图像、地球遥感监测和天文学等领域。,图像识别:对处理后的图像进行分类,确定类别名称。图像处理与识别技术是一门跨学科的高新科学技术。1.2计算机数字图像处理系统数字图像处理系统是执行处理图像、分析理解图像信息任务的计算机系统。主要含有:图像输入设备、执行处理分析与控制的计算机及图像处理机、输出设备、存储系统中的图像数据库、图像处理程序库与模型库。数字图像处理与其它数据处理的不同之处是其庞大的数据处理量和存储量,以及对图像的显示。因此,无论从硬件的配置还是软件环境上看,计算机图像处理系统都有别于其它的计算机系统,从而形成了专门的图像处理计算机系统。,扫描仪,摄像机,CD-ROM,高档微机系统图像图像处采集卡理软件图像数据库,绘图仪,打印机,显示器,监视器,图像通信接口,通信网络,硬盘、光盘等,图1.2.1微机图像处理系统示意图,1.2.1计算机图像处理系统的分类,按系统的层次分:高、中、低图像处理系统按图像传感器的敏感区域分:可见光、红外、近红外、X射线、雷达、伽玛射线、超声波等图像处理系统按采集部件与景物的距离分:遥感、宏观、微观图像处理系统按应用场所分:通用图像处理系统和专用图像处理系统,1.2.2微机图像处理系统的基本构成微机图像处理系统由图像的采集部件、主机和图像的输出部件三部分构成。1.图像采集部件作用:采集原始的模拟图像数据并将模拟信号转换成数字信号。常用的图像采集部件:摄像机+视频图像采集卡,图像扫描仪,数码摄像机(1)摄像机和视频图像采集卡摄像机:电子管式摄像机、固体器件摄像机。电子管式摄像机:光电子发射效应式、光导效应式。体积大。固体器件摄像机:电荷耦合器件阵列(CCD摄像机)、电荷注入器件(CID)阵列、光电二极管阵列。CCD摄像机:由电荷耦合元件组成的图像探测器。它是,将景物通过物镜成像在一块电荷感应光板(电荷耦合探测器)上,用感应光板上的感应电压模拟景物的亮度变化。体积小,重量轻,结构紧凑。CCD摄像机的分类:按传感器的有效工作范围分:可见光、近红外、红外、X射线CCD摄像机按快门速度分:静止和实时CCD摄像机视频图像采集卡:将摄像机摄取的模拟图像信号转换成数字图像信号。视频图像采集卡的分类:中速采集卡、实时单帧采集卡、实时采集卡中速采集卡:1帧/秒实时单帧采集卡:瞬时采集1帧图像实时采集卡:40帧/秒,连续采集多帧图像,(2)图像扫描仪适合于薄片介质的图像数字化设备。图像扫描仪的分类:按灰度分辨率分:黑白64级灰度扫描仪、黑白256级灰度扫描仪、彩色图像扫描仪按面幅大小分:手提式扫描仪、平板式扫描仪、滚桶式扫描仪按扫描仪结构分:透射式扫描仪、反射式扫描仪分辨率:空间分辨率,灰度分辨率空间分辨率:数字图像的空间分辨率取决于像素尺寸的大小。像素(Pixel)是构成数字图像的基本单元。如果把数字图像放大许多倍,会发现这些连续图像其实是由小点组成。把一幅图像按行与列分割成mn个网格,就可用一个mn的矩阵来表达该图像就说该图像的空间分辨率为mn。每一格即为一个像素,m与n数值越大,像素量就越大,单个像素的尺寸就越小,图像就越细腻,空间分辨率就越高。,(3)数码摄像机数码摄像机将图像采集和数字化部件集成在统一设备中,其输出的信号能直接为计算机所接受。适合于现场数据采集。,灰度分辨率:是指在灰度级别中可分辨的最小变化,取决于灰度的模数转换位数。每个像素的亮度称为灰度(对彩色图像则是颜色),可用一个有限长度的二进制数值表示。位数越长,灰度级别就越多,层次就越丰富(或颜色就越逼真),灰度分辨率就越高。如果是8位模/数转换,则灰度可分为28=256个级别;如果是16位模/数转换,则灰度可分为216=65536个级别。,所以说,空间分辨率是指数字化图像的大小,以水平的和垂直的象素数的乘积来表示,反映了图像中可辨别的最小细节。,2.图像处理部件微机3.识别结果的输出部件从广义的角度讲,图像的输出形式分为两种:一种是根据图像处理的结果作出判断,给出提示供人或机器作出选择。另一种是以图像为输出形式,它包括中间过程的监视和结果图像的输出。图像输出方式有屏幕输出、打印输出、视频硬拷贝输出。1.3数字图像的形成图像的数字化:抽样、量化抽样:把在时间上和空间上连续的图像转换成为离散的抽样点(即象素)集的一种操作。具体做法:先沿垂直方向抽样,再沿水平方向抽样两步完成抽样操作。,若抽样结果每行(即横向)象素为M个,每列(即纵向)象素为N个,则整幅图像大小为M*N个象素。量化:把抽样后所得的连续量表示的象素值离散化为整数值的操作。,Zi+1,Zi,Zi-1,连续的灰度值,.,.,.,量化值(整数值),qi+1,qi,qi-1,黑灰白,从白到黑的连续变化,.,.,.,.,.,.,.,.,.,黑,灰,白,.,.,.,灰度标度,255,128,0,255,128,0,灰度级的分配,(a)量化,(b)把从白到黑灰度量化为8位值,图1.3.5量化,1.4数字图像的数学描述形式1.4.1数字图像的矩阵表示数字图像在计算机内部是一个灰度值的二维数组的集合。该数组若用f(x,y)来表示时,其含义是位于坐标(x,y)处的象素,其灰度值是f(x,y)。,表1.4.1数字图像的类别,一幅N1*N2个象素的数字图像,其象素灰度值可用N1行N2列的矩阵F来表示。,1,2,.,.,.,.,N1,1,.,.,2,N2,数字图像,N1*N2个象素,图1.4.1数字图像的矩阵表示,1.4.2二维数组和图像的关系一幅M*N个象素的数字图像,在算法语言中可以用一个M*N的二维数组F来表示。数字图像的各象素的灰度值可按一定的顺序存放在F数组中。习惯上把图像左上角的象素定为(1,1)个象素,右下角的象素定为(M,N)个象素。这样,从左上角开始,横向第I列,纵向第J行,的第(I,J)个象素值就存储到数组F(I,J)中。F(即FORTRAN)型表示:(I,J),I为列数,J为行数M(即MATRIX)型表示:(I,J),I为行数,J为列数,1.5数字图像的数据结构图像数据常用的结构:二维数组、一维数组、分层结构树状结构,1.6数字图像处理的基本方法1.6.1基本处理过程对图像进行扫描,并在扫描过程中逐点对各象素进行处理.顺向扫描:对图像按照由左到右,由上到下的顺序进行扫描.逆向扫描:对图像按照由下到上,由右到左的顺序进行扫描.1.6.2基本运算形式(1)点运算在对图像各象素进行处理时,只输入该象素本身灰度的运算方式称为点运算.g(i,j)=p(f(i,j)其中,f(i,j)为输入的原图像在(i,j)处的灰度值,g(i,j)为经点运算后得到的输出图像在(i,j)处的灰度值.(2)邻域运算在对图像各象素进行处理时,不仅输入该象素本身的灰度,还要输入以该象素为中心的某局部区域(即邻域)中的一些象素的灰度进行运算的方式,称为邻域运算.,(3)并行运算并行运算:对图像上各象素同时进行相同处理的运算方式.优点:速度快缺点:只能用于处理的结果与处理的顺序无关的场合.点运算可采用并行运算方式.(4)串行运算串行运算:在图像上按照规定的顺序逐个对象素进行处理的运算方式.凡是对象素的处理是在邻域象素处理的基础上进行的处理方法,都必须采用串行运算形式,并同时规定处理顺序.(5)迭代运算迭代运算:反复多次进行相同处理的运算.(6)窗口运算窗口运算:对图像特定的矩形区域进行某种运算的形式.一般,矩形区域由矩形左上角象素点的坐标和矩形所包含的行数和列数确定.,(7)模板运算模板运算:对图像中特定形状的区域进行某种运算的方式.这里的模板就是指特定形状的区域,它常常是与图像中存在的对象物有相同特征的一个局部的子图像,因此,模板实质上就是一个二维数组.模板与窗口的区别:1.形状不同2.窗口是划定一个处理范围,而模板是子图像.(8)帧运算帧运算:在两幅或多幅图像之间进行运算产生一幅新图像的处理.,1.7数字图像处理与识别及图像理解所研究的内容,1.7.1图像处理技术1.图像数字化其目的是将模拟形式的图像通过数字化设备变为计算机可用的离散的图像数据.2.图像变换为了便于后续的工作,改变图像的表示域和表示数据.3.图像增强以便于人或机器分析、理解图像内容为主要目标的改善图像质量的方法。增强是用以改善供人观看的图像的主观质量,而不一定追究图像降质的原因。4.图像恢复对失真的图像进行处理,使处理后的图像尽量接近原始的未失真的图像。,图像恢复需找出图像降质的原因,并尽可能消除它,使图像恢复本来面目。5.图像分割根据选定的特征将图像划分成几个有意义的部分,从而使原图像在内容表达上更为简单明了。6.图像重建利用X射线、超声波等手段取得物体的多幅来自不同角度的二维投影图(它们反映了物体的内部情形),通过计算可得出物体内部部位的图像;或者利用明暗、运动、体视等图像信息恢复三维物体形状的技术。7.图像数据压缩与编码在数字图像的传输或存储时,通过某种方式的编码,可删除其中相关信息,实现不失真压缩;或在容许失真限度内进行有失真压缩,以换取更大压缩率。,8.图像通信电视电话、会议电视、电缆电视(CATV)、传真通信、图文电视(Teletext)、可视图文(Videotex)、智能用户电报(Teletex)、电子邮政、多媒体图像等。9.图像存储包括图像的格式化、编码和解码、数据结构、索引等,其作用是把图像数据存储在给定的存储介质中。10.图像检索使用索引或更灵活的相似检索技术,或以某种查询语言来从图像数据库中检索图像。11.图像分析图像分析主要是研究图像分割、特征提取、测量、表达、纹理分析、运动等。,1.7.2图像识别图像识别以研究某些对象或过程(统称图像)的分类与描述为主要内容.,被识别图像,图像信息获取,处理、特征抽取,识别判断,结果,图1.7.2图像识别系统框图,1.图像识别方法(1)统计方法(数学方法):以数学上决策理论为基础,根据这种理论建立统计学识别模型以得到反映图像本质特点的特征进行识别.(2)句法结构识别方法(语言学方法、结构学方法)它是立足于分析图像的结构,一幅图像可以模仿语言构造,用一些语句来表达,然后,制定一组可以描述对象各部分之间关系的语法规则进行识别。(3)模糊识别方法,(4)神经网络识别方法2.文字识别光学文字识别(OCR):识别字母、数字和符号。,文字图形,检测,预处理,特征提取,识别判断,文字种类,图1.7.3文字识别装置框图,1.7.3图像理解图像理解是在图像处理的基础上,结合人工智能和认知理论,进一步研究图像中各目标的性质和它们之间的相互关系,并理解图像内容的含义及解释原来的客观场景,从而指导和规划行动.图像理解是要用计算机系统来帮助解释图像的含义,从而实现利用图像信息解释客观世界.,1.8图像处理与图像识别及图像理解的关系1.8.1图像处理和图像识别图像处理包括图像编码、图像增强、图像压缩、图像复原、图像分割等。输入是图像,输出也是图像。图像识别是对图像进行分类,确定类别名称。输入是图像(一般是经过处理的图像),输出是类别和图像的结构分析,而结构分析的结果则是对图像做描述,从而对图像的重要信息得到一种理解和解释。图像处理和图像识别是相互交叉的。1.8.2图像理解所谓图像理解是一个总称,它是在图像处理及图像识别的基础上,再根据分类作结构句法分析,去描述图像和解释图像。因而图像理解包括图像处理、图像识别和结构分析。对理解部分来说,输入是图像,输出则是对图像的描述,与解释。,图像处理(编码压缩、增强、分割、复原),图像输入,图像输出,图像识别(特征提取、分类、分析),图像输入,类别+结构分析,图像理解,图像输入,(a)图像处理示意图,(b)图像识别示意图,(c)图像理解示意图,图1.8.1图像处理、识别及理解示意图,图像描述+解释,1.8.3图像识别与图像处理及图像理解的关系,表1.8.1图像处理、识别及理解间的关系,输入,输出,图像输入,图像预处理,图像分割,图像特征提取,图像分类,图像结构分析,客观世界模型,图像描述和解释,图1.8.2图像理解系统关系图,增强复原,图像处理,图像识别,句法结构分析,1.9计算机视觉(机器视觉)计算机视觉就是用计算机模拟人眼的视觉功能,从图像或图像序列中提取信息,对客观世界的三维景物和物体进行形态和运动识别.计算机视觉研究的目的之一就是要寻找人类视觉规律,从而开发出从图像输入到自然景物分析的图像理解系统.Marr的视觉计算理论:(1)三个层次Marr认为,视觉是一个信息处理系统,对此系统研究应分为三个层次:计算理论层次,表示与算法层次,硬件实现层次.,表1.9.1视觉研究的三个层次,按照Marr的理论,计算视觉理论要回答视觉系统的计算目的和策略是什么,或视觉系统的输入和输出是什么,如何由系统的输入求出系统的输出。在这个层次上,信息系统的特征是将一种信息(输入)映射为另一种信息(输出)。例如,系统输入是二维灰度图像,输出则是三维物体的形状、位置和姿态,视觉系统的任务就是研究如何建立输入输出之间的关系和约束,如何由二维灰度图像恢复物体的三维信息。表示与算法层次是要进一步回答如何表示输入和输出信息,如何实现计算理论所对应的功能的算法,以及如何由一种表示变换成另一种表示。最后一个层次是解决用硬件实现上述表示和算法的问题,比如计算机体系结构及具体的计算装置及其细节。从信息处理的观点来看,至关重要的乃是最高层次,即计算理论层次。通过正确理解待解决问题的本质,将有助于理解并创造算法。如果考虑解决问题的机制和物理实现,则对理解算法往往无济于事。,(2)视觉表示框架视觉过程划分为三个阶段。第一阶段(早期视觉),是将输入的原始图像进行处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图。第二阶段(中期视觉),是指在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图。第三阶段(三维阶段),是指在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体的过程。,第二章MATLAB语言基础,2.1MATLAB简介MATLAB(MatrixLaboratory)语言是由MathWorks公司推出的计算机软件,是一种直译式的语言,主要功能是做矩阵的数值运算,广泛流行于图像处理、自动控制、语音处理、生物医学工程、信号分析等领域。工具箱(Toolbox):图像处理工具箱(ImageProcessingToolbox)通信工具箱(CommunicationsToolbox)符号数学工具箱(SymbolicMathToolbox)统计工具箱(StatisticsToolbox)神经网络工具箱(NeuralNetworkToolbox)小波理论工具箱(WaveletToolbox)模糊逻辑工具箱(FuzzyLogicToolbox)金融工具箱(FinancialToolbox)样条工具箱(SplineToolbox)控制系统工具箱(ControlSystemToolbox),第三章图像预处理,图像预处理:改善图像质量的处理,主要指按需要对图像进行适当的变换突出某些有用的信息,去除或削弱无用的信息,如改变图像对比度,去除噪声或强调边缘的处理等.也称为图像增强.图像预处理的基本方法:图像变换、直方图变换、灰度变换、图像平滑、图像锐化、伪彩色和假彩色处理等。,3.1图像变换图像变换:图像的二维正交变换常用的图像变换:傅里叶变换(FourierTransform)、离散余弦变换(DiscreteCosineTransform)、沃尔什-哈达玛变换(Walsh-HadamardTransform)、离散卡-洛变换(DiscreteK-LTransform),3.1.1傅里叶变换,1.一维连续函数的傅里叶变换,傅里叶变换:,其中,f(x)为实变量x的连续函数,傅里叶反变换:,如果f(x)是连续的和可积的,且F(u)是可积的,则称式(3.1.1)和(3.1.2)为傅里叶变换变换对.,式中,傅里叶变换的幅度或频率谱,傅里叶变换的相角或相位谱,傅里叶变换的能量或功率谱,u,频率变量,2.二维连续函数的傅里叶变换,如果f(x,y)是连续的和可积的,且F(u,v)是可积的,则存在下式的傅里叶变换对.,二维傅里叶变换的幅度或频率谱,二维傅里叶变换的相角或相位谱,二维傅里叶变换的能量或功率谱,u,v,频率变量,3.一维离散傅里叶变换,设,式中x为离散值0,1,N-1.,离散傅里叶变换对:,式中u=0,1,2,N-1.,式中x=0,1,N-1.,4.二维离散傅里叶变换,离散傅里叶变换对:,式中x=0,1,M-1,y=0,1,N-1.,式中u=0,1,M-1,v=0,1,N-1.,当图像抽样成方形阵列时,M=N,这时离散傅里叶变换对:,式中x=0,1,N-1,y=0,1,N-1.,式中u=0,1,N-1,v=0,1,N-1.,一维和二维离散函数的频谱、相位谱和能量谱分别由式(3.1.4)(3.1.6)和(3.1.11)(3.1.13)给出。唯一的差别是独立变量是离散的。,表3.1MATLAB与傅里叶变换有关的部分命令,3.1.2离散余弦变换(DCT),一维离散余弦变换一维离散余弦变换的定义如下:,其中,u=1,2,N-1,一维离散余弦逆变换的定义如下:,2.二维离散余弦变换,二维函数f(x,y)的离散余弦变换的定义如下:,式中u=0,1,N-1,v=0,1,N-1.,二维离散余弦反变换的定义如下:,式中x=0,1,N-1,y=0,1,N-1.,MATLAB中的离散余弦变换命令:B=DCT2(A)MATLAB中的离散余弦逆变换命令:B=IDCT2(A),3.2灰度变换,灰度变换是图像增强的一种重要手段,它可使图像动态范围加大,使图像对比度扩展,图像更加清晰,特征更加明显.,3.2.1灰度线性变换,1.全域线性变换,令原图像f(m,n)的灰度范围为a,b,线性变换后图像g(m,n)的灰度范围为a,b,g(m,n)与f(m,n)存在以下关系:,图3.2.1全域线性变换示意图,f(m,n),g(m,n),b,a,a,b,F,F,另一种情况:图像中大部分象素的灰度级在a,b范围内,少部分象素分布在小于a和大于b的区间内.则可做下列的截取式线性变换:,g(m,n),f(m,n),a,b,F,a,F,b,图3.2.1截取式线性变换示意图,2.分段线性变换,将图像灰度区间分成两段乃至多段分别做线性变换称为分段线性变换。,3.2.2灰度非线性变换,对数变换:,指数变换:,其中,a,b,c是可调参数。,3.3直方图变换,3.3.1灰度直方图,直方图:用于表达图像灰度分布情况的统计图表。其横坐标是灰度值r,纵坐标是出现这个灰度值的概率密度p(r)(对连续图像f(x,y)而言),或者是出现这个灰度值的概率值p(ri)(对数字图像f(m,n)而言)。,p(r),r,0,p(r),r,0,(a)f(x,y)的直方图,(b)f(m,n)的直方图,图3.3.1灰度直方图,设图像象素的灰度值为r0,r1,rL-1,则概率p(ri)为:,且有:,MATLAB中计算和绘制直方图的命令:,imhist(I,N)-在长度为N的灰度条上显示灰度图像I的直方图,对于灰度图像,N的缺省值为256,对于黑白二值图像,N的缺省值为2。,图3.3.3lena图像的灰度直方图,3.4空间域图像平滑,图像平滑(滤波):消除图像噪声的工作。平滑的目的:改善图像质量、抽取对象特征。平滑可以在空间域进行也可以在频率域进行。,3.4.1邻域平均法,设噪声,是加性白噪声,其均值为0,方差(噪声功率)为,而且噪声与图像f(m,n)不相关。其有噪声的图像f(m,n)为:,经邻域平均法处理后的图像g(m,n)为:,其中s是(m,n)点的邻域内的点集。,设E.和D.分别表示求统计平均和方差的运算,则:,上式表明邻域平均之后,残余噪声的平均值仍为0,而方差则下降为由原来的1/N,噪声被抑制,但图像g(m,n)中目标的轮廓或细节变模糊了。可用模板反映邻域平均算法的特征,四邻域和八邻域可用下述模板:,3.4.2选择平均法,选择平均法是以邻域平均法为基础的。它只对灰度值相同或相近的象素进行平均,或者按照灰度特殊的程度加权之后再求和,以免造成目标边缘的模糊。,1.阈值法,其中,S是点(m,n)的一个邻域,N是所取邻域内的象素数,T是预先设定的阈值。,2.半邻域法,设在3*3局部区域内图像为:,半邻域法的具体算法为:,(1)对Ai排序,灰度值较大的前5点构成B组,灰度值较小的后3点构成A组。(2)设定门限值T。(3)求A、B两组的平均值(4)若,,认为无边缘通过,进行9点局部平均;,若,,则认为有边缘通过,P与B组中的5点,进行6点平均。,3.4.3中值滤波,中值滤波是一种非线性处理技术,能抑制图像中的噪声。它是基于图像的这样一种特性:噪声往往以孤立的点的形式出现,这些点对应的象素数很少,而图像则是由象素数较多、面积较大的小块构成。,在一维的情况下,中值滤波器是一个含有奇数个象素的窗口。在处理之后,位于窗口正中的象素的灰度值,用窗口内各象素灰度值的中值代替。中值滤波不影响阶跃函数和斜坡函数,因而对图像边界有保护作用;但是,对于持续期小于窗宽的1/2的脉冲将进行抑制,因而可能损坏图像中某些细节。,若以Med.表示中值滤波,K为常数,则对窗口W内的点集进行中值滤波具有下述性质:,但是:,在二维的情况下,窗口的形式可以是正方形的、近似圆形的或十字形的。MATLAB中二维中值滤波函数:medfilt2,3.4.4空间域低通滤波,噪声的频谱一般位于空间频率较高的区域,而图像本身的频率分量则处于较低的空间频率区域之内,因此,可以用低通滤波的方法来实现平滑。采用离散卷积可以实现滤波作用。,式中g(m,n)为输出的平滑图像,f(i,j)为输入图像,而H为L*L脉冲响应阵列。,用于平滑噪声的低通形式的算子阵列H:,MATLAB中噪声的加入:,其中,I为欲加噪声的原图像,J为加噪声后的图像。TYPE为噪声类型。gaussian-高斯白噪声salt其二是边缘发生在过零点处(图4.1.1(c)、图4.1.1(e)。,(a)阶梯状边缘,(d)脉冲状边缘,(b)阶梯状边缘的一阶差分,一阶差分,二阶差分,(c)阶梯状边缘的二阶差分,一阶差分,(e)脉冲状边缘的一阶差分,二阶差分,(f)脉冲状边缘的二阶差分,图4.1.1常见边缘的一阶差分和二阶差分概念,(1)梯度算子,在点(m,n)处,梯度Gf(m,n)的幅度为:,对数字图像,式(4.1.1)可写成:,式中,也可简化为:,或:,取适当的门限T,如果Gf(m,n)T,则(m,n)为阶跃状边缘点,(2)罗伯特(Robert)梯度,(3)Laplacian算子,式中,s可以是f(m,n)为中心上、下、左、右4邻点的集合,也可以是8邻点的集合,或者是对角线4邻点的集合。,2.Laplacian-Gauss算子,梯度算子和Laplacian算子对噪声比较敏感。对此,一方面可在运用这两种算子作边缘提取前,先用邻域平均法等作平滑处理,另一方面可先用高斯形二维低通滤波器对图像进行滤波,然后再对图像作Laplacian边缘提取,这种方法被称为Laplacian-Gauss算子法。具体是,令g(m,n)为高斯低通滤波后的图像,,表示边缘提取,后的图像,则有:,式中,参数W为正瓣宽度,4.1.2模板匹配法,模板是为了检测某些区域特征而设计的阵列。设有一个3*3模板窗口W,其元素Wij的位置如图4.1.6(a)所示,一幅图像F的各元素f(m,n)的位置如图4.1.6(b)所示。模板匹配的过程是求乘积和的过程。,式中,g(m,n)为边缘检测模板输出,l=L/2,L为窗口宽度,对于3*3窗口,l=-1,0,1。,(a),(b),图4.1.6模板W及图像F的各元素,1.点模板,点模板如图4.1.7(a)所示,一般用于背景强度恒定、目标图像灰度相同或基本相同的图像(如二值图像)。,(a)点模板,W1,W2,W3,W4,(b)线模板,图4.1.7匹配滤波器模板,2.线模板,线模板如图4.1.7(b)所示,线模板能有效地检出线型类图像结构。图4.1.7(b)中,W1W4分别是0、45、90、-45度四个方向的线模板。,3.边缘模板,(a)j方向模板(h1i,j),(b)k方向模板(h2i,j),图4.1.10sobel梯度模板,4.1.3曲面拟合法,曲面拟合法的基本思路是用一个平面或曲面去逼近一个图像面积元,然后用这个平面或曲面的梯度代替点的梯度,从而实现边缘检测。,(a)4点面积元,(b)9点面积元,图4.1.11面积元示意图,1.一次平面拟合,令图像面积元由图4.1.11(a)所示的4个相邻象素组成。用一次平面ax+by+c去拟合该面积元上4个相邻象素,即用:,去逼近f(x,y)。,g(x,y)与f(x,y)之间的均方误差:,为达到最佳吻合,应使均方误差最小。这时,需,根据梯度定义,平面ax+by+c上的梯度幅度为:,也可进一步表示为:,由式(4.1.31)、式(4.1.32)可知,a是两列的平均值的差分,b是两行的平均值的差分。由于这里的差分是建立在平滑基础上,所以对噪声就不像直接使用微分算子那样敏感。把平面的梯度看作是邻域中心(m+1/2,n+1/2)点处图像梯度的近似值。,2.二次曲面拟合,设检测象素处于图4.1.11(b)所示的面积元上,用二次曲面:,去拟合面积元,并产生均方误差:,欲使,最小,需用,分别对a,b,c,d,e,f,g求偏导,并令其,为0,从而解得系数a,b,c,d,e,f,g。再根据式:,求得曲面梯度幅度。,4.2灰度阈值分割,灰度阈值分割是利用象素的灰度值,通过取阈值进行分类的过程。它基于下列假设:每个区域是由许多灰度值相近的象素构成的。物体和背景之间或不同物体之间的灰度值有明显的差别,可以通过取阈值来区分。待分割图像的特性愈接近于这个假设,用此方法分割的效果愈好。,若图像中存在背景S0和n个不同意义的部分S1、S2Sn,并设背景的灰度值最小,则可在各区域的灰度差异处设置n个阈值T0、T1、Tn-1(T0T1Tn-1),并进行如下分割处理。,在简单的图像中常常只出现背景和一个有意义部分两个区域,这时只需设置一个阈值,就能完成分割处理,并形成仅有两种灰度值的二值图像。图像中区域的范围常常是模糊的,因此,如何选取阈值便成为区域分割处理中的关键问题。,4.2.1双峰法,在一些简单图像中,背景和各个对象物在图像的灰度直方图上各自形成一个波峰,即区域和波峰一一对应.由于每两个波峰间形成一个低谷,因而选择双峰间低谷处所对应的灰度值为阈值,可将两个区域分离。,4.2.2p参数法,设图像的灰度直方图有3个明显的波峰,且3个区域的灰度分布互有重叠。若各区域面积占图像总面积的比例p是大致清楚的或预先设定的,令灰度低端的区域1的面积比,为p1,由于p1为直方图中代表该区域部分的频率累加值,因此,当从灰度0到fj(j=0,1,G-1)计算累加直方图函数值:,并在某fj处满足下式关系:,则此时的fj为从图像中分离出区域1的阈值T1:,式中,表示由面积比p1近似等于累加直方图函数来,确定相应灰度值的反变换关系。,若从图像中分离灰度高端的面积比为p2的区域2,则方法同上,这时:,4.3区域生长法,区域生长的基本思想是将具有相似性质的象素集合起来构成区域。区域生长法可以分为简单连接、混合连接、中心化连接等。,简单连接区域生长法是把每个象素看成是连接图中的一个节点,然后把单个象素和空间相邻象素的特性进行比较,把特性相似的象素所对应的节点之间用弧把它们连接起来,从而进行区域的生长。,混合连接区域生长法的总过程与上述过程类似,但是,对每个节点,它用该节点对应的象素周围k*k邻点的灰度值来表示其特性,这就提高了抗干扰性。,中心化连接区域生长法是从满足检测准则的点开始,在各个方向上“生长”物体。一般地说,在物体中同一区域的各象素的灰度级不会相差很远。设O为已接受的一小,块物体,检查它的全部邻点,并把满足跟踪接受准则的任何邻点并入上述小块中。此接受准则可以根据邻点的灰度级相对于O的平均灰度级接近程度来确定。当邻近点被接受后,“生长”成新的O,用所得的新O重复上述过程。当没有可接受的邻近点时,生长过程终止。,第五章图像数据压缩编码,图像编码与压缩从本质上说就是对要处理的图像源数据按一定的规则进行变换和组合,从而达到以尽可能少的代码(符号)来表示尽可能多的信息。压缩通过编码来实现,或者说编码带来压缩的效果。所以,一般把此项处理称为压缩编码。,5.1概述,5.1.1图像编码压缩的必要性,图像数据的特点之一是信息量大。如一幅512*512、灰度等级为8位的图像,其数据量为56KB。要保存这些数据需要很大的存储空间。在多媒体中,海量图像数据的存储和处理是难点之一。一张600MB的光盘,仅能存放20s左右的640*480象素的图像画面信息。如不进行编码压缩处理,多媒体信息,的保存将遇到很大的困难。,在现代通信中,图像传输已成为重要内容。在工作中除要求设备可靠、图像保真度高以外,实时性将是重要技术指标之一。在信道带宽、通信链路容量一定的前提下,采用编码压缩技术,减少传输数据量,是提高通信速度的重要手段。没有编码压缩技术,大容量图像信息的存储与传输是难以实现的,多媒体等新技术在实际中的应用也会遇到困难。,5.1.2图像编码压缩的可能性,数据压缩技术最初始于信息论。20世纪80年代前,研究的主要内容是有关信息熵、编码方法及数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 饮料合作加盟合同范本
- 公司聘用文秘合同范本
- 隔热夹芯板采购合同范本
- 公司代签合同范本
- 香港公司股权合同范本
- 基地鱼塘租售合同范本
- 新款合同范本模板
- 衣物袋采购合同范本
- 仓库旧料回收合同范本
- 车辆安全协议合同范本
- 惠州卫生职业技术学院辅导员考试真题2022
- XXX加油站风险分级管控台账
- 甘12J8 屋面标准图集
- 购买设备合同
- GB/T 28288-2012足部防护足趾保护包头和防刺穿垫
- GB/T 19666-2019阻燃和耐火电线电缆或光缆通则
- GA/T 1241-2015法庭科学四甲基联苯胺显现血手印技术规范
- 小学和初中科学教学衔接
- 《循证医学》治疗性研究证据的评价和应用
- “李可中医药学术流派论治厥阴病”-课件
- 通用技术作品设计报告
评论
0/150
提交评论