基本图像分割技术.ppt_第1页
基本图像分割技术.ppt_第2页
基本图像分割技术.ppt_第3页
基本图像分割技术.ppt_第4页
基本图像分割技术.ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章 基本图像分割技术,数字图像分析与处理,在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣。这些部分常称为目标或前景(其它部分称为背景),它们一般对应图像中特定的、具有独特性质的区域。为了辨识和分析目标,需要将这些有关区域分离提取出来。 图像分割是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。,图像分割也是目前公认的图像处理难题,其困难源于图像内容的多样性以及模糊、噪声等的干扰。至今还没有普适性分割方法和通用的分割效果评价标准,分割的好坏必须结合具体应用来评判。总体而言,一个好的图像分割算法应该尽可能具备以下特征: (1) 有效性:对各种分割问题有效的准则,能将感兴趣的区域或目标分割出来。 (2) 整体性:即能得到感兴趣区域的封闭边界,该边界无断点和离散点。 (3) 精确性:得到的边界与实际期望的区域边界很贴近。 (4) 稳定性:分割结果受噪声影响很小。,8.1 图像分割定义和技术分类 8.2 并行边界技术 8.3 串行边界技术 8.4 并行区域技术 8.5 串行区域技术,第6章,图像分割定义 可借助集合概念 (1) (2) 对所有的i和j, ,有 (3) 对i = 1, 2, n,有P(Ri ) = TRUE (4) 对 ,有 (5) 对i = 1, 2, , n,Ri是连通的区域,6.1 图像分割定义和技术分类,图像分割的基本策略 分割算法基于灰度值的两个基本特性:不连续性和相似性。 区域内部的像素一般具有灰度相似性,而在区域之间的边界上一般具有灰度不连续性。 检测图像像素灰度级的不连续性,找到点、线(宽度为1)、边(不定宽度)。先找边,后确定区域。,图像分割的基本策略 检测图像像素的灰度值的相似性,通过选择阈值,找到灰度值相似的区域,区域的外轮廓就是对象的边,图像分割方法和种类 以不同的分类标准,图像分割方法可以划分为不同的种类。,图像分割应用 机器阅读理解 OCR录入 遥感图像自动识别 在线产品检测 医学图像样本统计 医学图像测量 图像编码 图像配准的预处理,6.2 边缘检测算子,边缘检测是所有基于边界的图像分割方法的第一步。边缘是灰度值不连续的结果,这种不连续常可利用求导数方便地检测到。一般常用一阶和二阶导数来检测边缘。 边缘的定义: 图像中像素灰度有阶跃变化或屋顶变化的那些像素的集合,图像局部亮度变化最显著的部分。 边缘的分类 阶跃状、脉冲状、屋顶状,阶跃状,屋顶状,一阶微分:用梯度算子来计算 特点:对于亮的边,边的变化起点是正的,结束是负的。对于暗边,结论相反。常数部分为零。 用途:用于检测图像中边的存在,二阶微分:通过拉普拉斯来计算 特点:二阶微分在亮的一边是正的,在暗的一边是负的。常数部分为零。 用途: 1)二次导数的符号,用于确定边上的像素是在亮的一边,还是暗的一边。 2)0跨越,确定边的准确位置,几种常用的边缘检测算子 梯度算子 Roberts算子 Prewitt算子 Sobel算子 Kirsch算子 Laplacian算子 Marr算子,梯度算子一阶导数算子,函数f(x,y)在(x,y)处的梯度为一个向量: f = f / x , f / y 计算这个向量的大小为: G = (f / x)2 +(f / y)21/2 近似为: G |fx| + |fy| 或 G max(|fx|, |fy|) 梯度的方向角为: (x,y) = tan-1(fy / fx) 可用下图所示的模板表示,为了检测边缘点,选取适当的阈值T,对梯度图像进行二值化,则有: 这样形成了一幅边缘二值图像g(x,y) 特点:仅计算相邻像素的灰度差,对噪声比较敏感,无法抑止噪声的影响。,Roberts算子,公式: 模板: 特点: 与梯度算子检测边缘的方法类似,对噪声敏感,但效果较梯度算子略好,Prewitt算子,公式 模板: 特点: 在检测边缘的同时,能抑止噪声的影响,Sobel算子,公式 模板 特点: 对4邻域采用带权方法计算差分 能进一步抑止噪声 但检测的边缘较宽,Sobel梯度算子的使用与分析 1. 直接计算y、x可以检测到边的存在, 以及从暗到亮,从亮到暗的变化 2. 仅计算|x|,产生最强的响应是正交 于x轴的边; |y|则是正交于y轴的边。 3. 由于微分增强了噪音,平滑效果是Sobel 算子特别引人注意的特性,Kirsch算子(方向算子),模板,特点 在计算边缘强度的同时可以得到边缘的方向 各方向间的夹角为45 分析 取其中最大的值作为边缘强度,而将与之对应的方向作为边缘方向; 如果取最大值的绝对值为边缘强度,并用考虑最大值符号的方法来确定相应的边缘方向,则考虑到各模板的对称性,只要有前四个模板就可以了。,拉普拉斯算子二阶导数算子,定义: 二维函数f(x,y)的拉普拉斯是一个二阶的微分定义为: 2f = 2f / x2 , 2f / y2 离散形式: 模板: 可以用多种方式被表示为数字形式。对于一个3x3的区域,经验上被推荐最多的形式是:,定义数字形式的拉普拉斯的基本要求是,作用于中心像素的系数是一个正数,而且其周围像素的系数为负数,系数之和必为0。,拉普拉斯算子的分析: 优点: 各向同性、线性和位移不变的; 对细线和孤立点检测效果较好。 缺点: 对噪音的敏感,对噪声有双倍加强作用; 不能检测出边的方向; 常产生双像素的边缘。,由于梯度算子和Laplace算子都对噪声敏感,因此一般在用它们检测边缘前要先对图像进行平滑。,Marr算子(LOG算子),Marr算子是在Laplacian算子的基础上实现的,它得益于对人的视觉机理的研究,有一定的生物学和生理学意义。 先用高斯函数对图像进行平滑,然后再用拉普拉斯算子进行运算。 平滑函数应能反映不同远近的周围点对给定像素具有不同的平滑作用,因此,平滑函数采用正态分布的高斯函数,即:,其中是方差。用h(x,y)对图像f(x,y)的平滑可表示为: *代表卷积。令r是离原点的径向距离,即r2=x2+y2。对图像g(x,y)采用Laplacian算子进行边缘检测,可得: 这样,利用二阶导数算子过零点的性质,可确定图像中阶跃边缘的位置。 称为高斯拉普拉斯滤波算子,也称为LOG滤波器,或“墨西哥草帽”。,一维LOG函数及其变换函数,二维LOG函数,2019/5/30,图 LOG算子的55模板,特点: 与高斯滤波器进行卷积,既平滑了图像又降低了噪声,孤立的噪声点和较小的结构组织将被滤除。 在边缘检测时仅考虑那些具有局部梯度最大值的点为边缘点,用拉普拉斯算子将边缘点转换成零交叉点,通过零交叉点的检测来实现边缘检测。,,,Canny(坎尼)算子 3个准则: 信噪比准则 定位精度准则 单边缘响应准则,,,具体步骤: 首先用2D高斯滤波模板进行卷积以平滑图像; 利用微分算子,计算梯度的幅值和方向; 对梯度幅值进行非极大值抑制。即遍历图像,若某个像素的灰度值与其梯度方向上前后两个像素的灰度值相比不是最大,那么这个像素值置为0,即不是边缘; 使用双阈值算法检测和连接边缘。即使用累计直方图计算两个阈值,凡是大于高阈值的一定是边缘;凡是小于低阈值的一定不是边缘。如果检测结果大于低阈值但又小于高阈值,那就要看这个像素的邻接像素中有没有超过高阈值的边缘像素,如果有,则该像素就是边缘,否则就不是边缘。,,,例子,梯度算子,Roberts算子,Prewitt算子,Sobel算子,Kirsch算子,原始图像,Laplacian算子,Marr算子,曲面拟合法,Sobel,Robert,Prewitt,LOG,Canny,2019/5/30,边缘检测算子的对比,在数字图像处理中,对边缘检测主要要求就是运算速度快,边缘定位准确,噪声抑制能力强,因此就这几方面对以上介绍的几个算子进行分析比较。首先,在运算速度方面,对于一个图像,其计算量如表所示。,2019/5/30,2019/5/30,根据实际测试结果,简单介绍各个算子的特点。 1.Roberts算子 Roberts算子利用局部差分算子寻找边缘,边缘定位精度较高,但容易丢失一部分边缘信息,同时由于没经过图像平滑计算,因此不能抑制噪声。该算子对具有陡峭的低噪声图像响应最好。,2019/5/30,2.Sobel算子和Prewitt算子 Sobel算子和Prewitt算子都是对图像进行差分和滤波运算,差别只是平滑部分的权值有些差异,因此对噪声具有一定的抑制能力,但不能完全排除检测结果中出现伪边缘。同时这2个算子边缘定位比较准确和完整。该类算子对灰度渐变和具有噪声的图像处理结果较好。,2019/5/30,3.Krisch算子 该算子对八个方向边缘信息进行检测,因此具有较好的边缘定位能力,并且对噪声有一定的抑制作用,就边缘定位能力和抗噪声能力来说,该算子的处理效果比较理想。,2019/5/30,4.Laplacian算子 拉普拉斯算子为二阶微分算子,对图像中的阶跃状边缘点定位准确且具有旋转不变性,即无方向性,但是该算子容易丢失一部分边缘的方向信息,造成一些不连续的检测边缘,同时抗噪声能力比较差。拉普拉斯算子比较适用于屋顶型边缘的检测。,2019/5/30,5.Marr-Hildreth算子 Marr-Hildreth算子首先通过高斯函数对图像作平滑处理,因此对噪声的抑制作用比较明显,但同时也可能将原有的边缘也平滑了,造成某些边缘无法检测到。此外高斯函数中方差 参数的选择,对图像边缘检测效果有很大的影响。 越大,检测到的图像细节越丰富,但对噪声抑制能力相对下降,易出现伪边缘;反之,则抗噪声性能提高,但边缘定位准确性下降,易丢失许多真边缘,因此,对于不同的图像应该选择不同的参数。,边界闭合 在有噪声时,用各种算子得到的边缘像素常是孤立的或分小段连续的。为组成区域的封闭边界以将不同区域分开,需要将边缘像素连接起来 边缘像素连接的基础是它们之间有一定的相似性。用梯度算子对图像处理可得到像素2方面的信息:梯度的幅度;梯度的方向,先检测边缘再串行连接成闭合边界 图搜索 边界点和边界段可以用图结构表示,通过在图中进行搜索对应最小代价的通道也可以找到闭合边界 一个图可表示为G = N, A,其中N是一个有限非空的结点集,A是一个无序结点对的集。集A中的每个结点对(ni, nj)称为一段弧(niN,njN)。通路的总代价:,6.3 串行边界技术,定义图中的边缘元素是两个互为4-近邻的像素间的边界,边界由一系列边缘元素构成 每个由像素p和q确定的边缘元素对应一个代价函数,代价函数的取值与像素间的灰度值差成反比,灰度值差小则代价大,灰度值差大则代价小,动态规划 一个借助有关具体问题的启发性知识减少搜索的方法 估计代价 图搜索的算法 (1) 将起始结点标记为OPEN并置g(s) = 0 (2) 如果没有结点OPEN,失败退出,否则继续。 (3) 将估计代价r(n)为最小的OPEN结点标记为 CLOSE,(4) 如果n是目标结点,找到通路(可由n借助指针上溯至s)退出,否则继续 (5) 展开结点n,得到它的所有子结点(如果没有子结点,返回(2)) (6) 如果子结点ni还没有标记,置r(ni) = g(n)+c(n, ni),标记它为OPEN并将指向它的指针返到结点n (7) 如果子结点ni已标记为OPEN或CLOSE,根据g(ni ) = ming(ni), g(n)+c(n, ni)更新它的值。将其g 值减小的CLOSE子结点标记为OPEN,并将原指向所有其g 值减小的子结点的指针重指向n。返回(2),并行的直接检测区域的分割方法 原理和分类 取阈值技术是最常见并行区域分割方法 首先对一幅灰度取值在gmin和gmax之间的图像确定一个灰度阈值T(gmin T gmax),然后将图像中每个像素的灰度值与阈值T相比较,并将对应的像素根据比较结果(分割)划为两类:即像素的灰度值大于阈值的为一类,像素的灰度值小于阈值的为另一类,6.4 并行区域技术,阈值分割算法是区域分割算法中具有代表性的一类非常重要的分割算法。以一定的图像模型为依托,通过取阈值后得到的图像,各个区域可以分离开。最常用的图像模型是假设图由具有单峰灰度分布的目标和背景组成。,单一阈值的灰度直方图,仅使用一个阈值分割的方法称为单阈值分割方法 。 如果图像中有多个灰度值不同的区域,那么可以选择一系列的阈值以将每个像素分到合适的类别中去 ,这种用多个阈值分割的方法称为多阈值分割方法。,分类 :单阈值分割,多阈值分割,多阈值的灰度直方图,图像阈值分割是一种广泛应用的分割技术,利用图像中要提取的目标物与其背景在灰度特性上的差异,把图像视为具有不同灰度级的两类区域(目标和背景)的组合,选取一个合适的阈值,以确定图像中每个象素点应该属于目标还是背景区域,从而产生相应的二值图像。 阈值分割法的特点是:适用于物体与背景有较强对比的情况,重要的是背景或物体的灰度比较单一;而且总可以得到封闭且连通区域的边界。,图像二值化 设原始图像f(x,y),以一定的准则在f(x,y)中找出一个合适的灰度值,作为阈值T,则分割后的图像g(x,y),可由下式表示:,另外,还可以将阈值设置为一个灰度范围T1,T2,凡是灰度在范围内的象素都变为1,否则皆变为0,即,某种特殊情况下,高于阈值T的象素保持原灰度级,其它象素都变为0,称为半阈值法,分割后的图像可表示为:,取阈值分割方法的关键是选取合适的阈值 (1) 全局阈值:仅根据各个图像像素的本身性质f(x, y)来选取而得到的阈值 (2) 局部阈值:根据像素的本身性质f(x, y)和像素周围局部区域性质q(x, y)来选取得到的阈值 (3) 动态阈值:根据像素本身性质f(x, y),像素周围局部区域性质q(x, y)和像素位置坐标(x, y)来选取得到阈值,2019/5/30,原始图像 阈值T=91 阈值T=130 阈值T=43 图 不同阈值对分割结果的影响,全局阈值,原理:假定物体和背景分别处于不同灰度级,图像被零均值高斯噪声污染,图像的灰度分布曲线近似用两个正态分布概率密度函数分别代表目标和背景的直方图,利用这两个函数的合成曲线拟合整体图像的直方图,图像的直方图将会出现两个分离的峰值,如图所示。然后依据最小误差理论针对直方图的两个峰间的波谷所对应的灰度值求出分割的阈值。,图双峰直方图,简单直方图分割法,双峰法选取阈值的缺点:会受到噪音的干扰,最小值不是预期的阈值,而偏离期望的值。 改进办法:1)取两个峰值之间某个固定位置,如中间位置上。由于峰值代表的是区域内外的典型值,一般情况下,比选谷底更可靠,可排除噪音的干扰;2)加强对噪音的处理。对直方图进行平滑处理,如最小二乘法等补点插值。,该方法适用于具有良好双峰性质的图像,但需要用到数值逼近等计算,算法十分复杂,而且多数图像的直方图是离散、不规则的。 在实际阈值分割过程中,往往需要能够自动获取阈值,下面的算法可以自动获得全局阈值: 1)选取一个的初始估计值T; 2)用T分割图像。这样便会生成两组像素集合:G1由所有灰度值大于T的像素组成,而G2由所有灰度值小于或等于T的像素组成。 3)对G1和G2中所有像素计算平均灰度值u1和u2。 4)计算新的阈值:T=1/2(u1 + u2)。 重复步骤(2)到(4),直到得到的T值之差小于一个事先定义的参数T0。,全局阈值的选取 极小值点阈值 最优阈值,全局阈值的选取 最大凸残差阈值 当图像中目标和背景面积相差较大时,直方图的一个峰会淹没在另一个峰旁边的缓坡里 图像的直方图(包括部分坐标轴)可看作平面上的一个区域,对 该区域可计算其凸包 并求取其最大的凸残 差,用来分割图像,局部阈值的选取 直方图变换 利用一些像素邻域的局部性质对原来的直方图进行变换以得到一个新的直方图,局部阈值的选取 灰度-梯度散射图 一个轴是灰度值轴,一个轴是梯度值轴,而其统计值是同时具有某一个灰度值和梯度值的像素个数,动态阈值的选取 当图像中有不同的阴影(例如由于照度影响),或各处的对比度不同时,如果只用一个固定的全局阈值对整幅图进行分割,则由于不能兼顾图像各处的情况而使分割效果受到影响 用与坐标相关的一系列阈值来对图像进行分 割。基本思想是首先将图像分解成一系列子图像,对每个子图像计算一个阈值。通过对这些子图像所得阈值的插值就可得到对图像中每个像素进行分割所需的阈值,动态阈值的选取 (1) 将整幅图像分成一系列重叠的子图像 (2) 做出每个子图像的直方图 (3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论