版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、图 像 分 割,潘春洪, 唐 明 chpan,图像理解的基本构成,知识库,1. 什么是图像分割,图像分割是将图像空间 R 划分为 n 个互不重叠的区域,其中 P(Ri)为作用于 Ri 中所有象素的相似性逻辑谓词。,定义,实例,1.,2.,3.,4.,2. 图像分割的重要性和难度,计算视觉,低层视觉,高层视觉,中层视觉,图像分割,中层视觉:获得图像中物体的 2.5 维描述,低层视觉:获得要素图(二维图像中的边缘点、直线段、曲线段、顶点、纹理等),高层视觉:获得图像中物体的三维描述,计算机视觉的其他领域,医学图像处理 遥感图像处理 目标跟踪 生物特征识别 等等,分割依赖于高层视觉,分割依赖于低层视
2、觉,分割依赖于高层视觉(续),图像分割是中层视觉中的最基本问题,也是计算视觉和图像理解中的最基本问题之一。它还是该领域国际学术界公认的将会长期存在的最困难的问题之一。,图像分割之所以困难的一个重要原因是其并不完全属于图像特征提取问题,它还涉及到各种图像特征的知觉组织。,从一般意义上来说,只有对图像内容的彻底理解,才能产生完美的分割。 通过限制图像的类型,可以降低图像分割的难度。,图像分割的基本思路 从简到难,逐级分割; 控制背景环境,降低分割难度; 把焦点放在增强感兴趣对象,缩小不相干图像成分的干扰上。,从简到难,逐级分割 分割矩形区域 定位牌照 定位文字,控制背景环境,降低分割难度 背景环境
3、: 路面、天空,把焦点放在增强感兴趣对象,缩小不相干图像成分的干扰上 感兴趣的对象: 汽车牌照 不相干图像成分: 非矩形区域,图像分割的基本策略 基于灰度值的两个基本特性: 不连续性区域之间 相似性区域内部 根据图像像素灰度值的不连续性: 先找到点、线(宽度为1)、边(不定宽度) 再确定区域。 根据图像像素灰度值的相似性: 通过选择阈值,找到灰度值相似的区域 区域的外轮廓就是对象的边。,对图像特征空间做分类的方法,分割算法的大致分类(共五类),基于区域的方法(区域生长等),基于函数优化的方法(Bayesian等),综合考虑边缘和区域信息的混合分割 方法,基于边缘的方法(边缘检测/主动边 缘),
4、自动阈值方法,阈值方法的本质,阈值方法并不要求直方图必须同时 包含峰和谷。,Pixel,h,?,3.1 全局阈值方法,众数法(J.M.S. Prewitt, et al., 1966, Ann. New York Acad. Sci.) 已知图像仅包含具有明显灰度差别的目标和背景。此时灰度直方图通常为双峰单谷型。取谷底点为阈值即可完成分割。,Otsu法(N.Otsu, 1979, IEEE T-SMC),在直方图上定义类内方差和类间方差,其中,Pi为第 i 类出现的概率,i为第 i 类的均值,为混合分布的均值。,总体方差为,三个方差的关系为,求使类间方差(分离度)尽量大而类内方差尽量小的阈值t
5、。三者等价。取计算量最小的(t):,定义如下函数,Otsu法可以应用于多维特征空间中。,基于熵的方法 KSW法(J.N. Kapur, et al., 1985, CVGIP),设直方图上阈值 t 两侧的分布分别为 pi、qi,以及,选择满足下式的 t* 作为分割阈值,上述熵的理论分析十分困难,分割意义也不十分明确。正因为如此,我们也可以,基于矩不变的方法(W. Tsai, 1985, CVGIP),设图像 f 的第 i 阶矩为(i = 1, 2, 3),其中 zj 为灰度直方图中的第 j 个灰度值。,设分割后图象 f 的第 i 阶矩为,其中 zj 为分割后灰度直方图中的第 j 个灰度值。此时
6、只有两个灰度级。,设,,i = 1, 2, 3, 有,解上述方程组即得,。从而,可以确定划分目标和背景的阈值。,最小误分阈值法(Frank, et al., 1995),假设概率密度为混合Guassian:,最小均方拟合:,用优化方法(如共轭梯度法或牛顿法)求得Pi, i, i,即得 pi(g)。,求交点 t:,取对数,整理得:,去掉一个不适当的解即可得到解。,近似最小误分阈值法(J. Kittler, et al., 1986, PR),利用相对熵的概念定义Gaussian函数与直方图之间的距离:,设,为第 i 类的Guassian拟合函数。,去掉常数项,整理得新的表达式,这里,J(T)越小
7、,则两个Guassian函数的重叠面积就越小。于是求,使得,其他方法,1) 概率松弛法(A. Rosenfeld, et al., 1981),这里,m是类数,r为已迭代次数,pij表示第 i 个象素属于第 j 类的概率,qij 是根据其它象素所属类别对 pij 的调整量。,这里,n是象素个数,c(i, j; h, k)是相容性函数,表示第 i 个象素属于第 j 类与第h个象素属于第k类的相容程度。,体现了其它象素所属区域对第 i 个象素属于第 j 个区域的综合影响。,的设置(以两分分割为例),设 d 和 l 分别为原始图象中最黑和最亮的灰度,zi 为第 i 个象素的灰度,则,相容性的设计?,
8、相容性函数的例子:,染色体图象,海面云层图象,坦克红外图象,2) 直方图变换法,a. 依据各个象素的局部特征对各象素灰度加权(如 1/(1+2), D. Mason, et al., 1975)。,b. 利用四分树法对目标和背景的灰度平滑后再建立直方图(A.Y. Wu, et al., 1982)。,目的:获得具有更深的谷和更尖锐的峰的直方图。,3) 引入二阶灰度统计量,灰度共生矩阵,中元素的含义,mij表示在图象中灰度为 i 和 j、间距为 d 个象素、与水平方向夹角为 的象素对的数目。,如 M (1,) 中的元素 mij 表示4-邻域相邻象素中灰度分别为 i 和 j 的象素对的个数。,a.
9、 N. Ahuja, et al, 1975,构造两个新直方图:,h1:对 M 对角线附近的元素,,h2:对非 M 对角线附近的元素。,在 h1 和 h2 的谷峰重叠处选择一个阈值。,b. F. Deravi, et al, 1983,这里,x 为 h 或 v 或 vh,Tij 是 Tx 的元素。,最优阈值:,可以认为,图像边缘附近(其灰度大多位于灰度直方图的谷底附近)应当具有最多的4-相邻的不同类象素对。于是有目标函数:,全局阈值方法比较,大量实验表明,基于简单统计量的方法往往可以获得较好的分割结果。而基于熵的方法应用于有噪声图象时结果一般较差。,c. 利用灰度和均值构造二维直方图,并在其上
10、定义统计量。,3.2 局部阈值方法,将图像分块,分别用全局阈值方法分割,最后再综合。,3.3 递归阈值方法(R. Ohlander, 1975),3.4 动态K-L变换阈值分割方法(Y. Ohta, et al, 1980),以RGB三基色的K-L变换为特征 ,采用递归阈值方法分割彩色图像。 设 S 为待分割区域,对其RGB做K-L变换,得到新的特征x1, x2, x3。利用它们对S分割。,重要现象,问题思考,找出上述方法中你认为缺陷最大的一个,并提出修改意见;,比较各方法的优缺点,并指出各适合哪类图像的分割;,提出自己基于直方图的分割方法。,4. 基于边缘的方法,4.1 边缘检测算子,4.2
11、 主动边缘模型,经典主动边缘模型 (M. Kass, et al, 1988),测地线主动边缘模型 (V. Caselles, et al, ICCV, 1995),一些其它的手工交互方法:,Level Set Intelligent Paint Intelligent Scissors Matting (Poisson, Bayesian, etc.) Image Contour Editing Graph Cut (Grab Cut) Lazy snapping,一些手工交互方法的比较,Active Contour,Intelligent Scissors,Graph Cut,NURBS-
12、HMM,5. 基于区域的方法,区域生长,a | b - c | d,a)原始X线探 伤图象 b)种子区域 c)生长结果 d)缺陷区边缘,上页图a的直方图。种子区域由灰度为255的象素构成。,从种子区域开始以8-邻域方式向外生长,只要一个象素的灰度g 与种子点的灰度差小于65 (即g191),即将该象素归入目标区。,分裂与合并,R1,R2,R3,R41,R42,R43,R44,R,R1,R2,R3,R4,R41,R42,R43,R44,分水岭分割法,标准步骤: 1)将图象看作地形图; 2)在每一个极小点处“打一个孔”; 3)以一致的速率从小孔向外“喷水”,并始 终保持地形中所有的水位一致; 4)
13、不同盆地的水相遇时则筑坝,并且随着 水位的不断升高,坝也升高; 5)当水位达到地形的最高点时算法终止。,缺陷:可能出现“过度分割”问题。,a | b,图a 为原始电泳图象,图b为标准分水岭分割法分割图 a 的梯度图象的结果。,带标记的分水岭算法 “泉眼”的位置是(自动或手工) 指定的, 而不是由极小点确定的。 这样可以避免“过度分割”问题。,电泳图象的分割方法 1)滤波; 2)选择平缓的“盆地”底部作为标记 (红斑); 3)调用分水岭算法确定分水线 (黄线); 4)在每个分水线分出的小区域内,利用前 述阈值法或分水岭法等完成分割。,6. 基于函数优化的方法,基于成对方式聚类的纹理图像分割(T.
14、 Hofmann, et al, ICIP96, T-PAMI, 1998),需优化的函数:,其中, M = Miv(NK)为标记矩阵,Miv 表示象素 i 用 v 标记,,Dij 为一对象素 i、j 间的纹理不相似性度量,N为象素个数,K 为标号个数(分类数),Ni 为象素 i 的邻域。,思考:Dij的定义?,公式中的() 表示象素 i 的邻域中和 i 具有相同标号的象素与 i 之间的平均不相似性。于是 H(M) 就表示整幅图象上的不相似性。这种不相似性自然是越小越好。即求标记矩阵M,使得:,上式需要复杂的寻优算法来优化。,实验结果,2) 基于 Bayesian 的图象分割方法,设有定义在离
15、散网格上的标量离散随机场,为随机变量。,定义离散网格上的邻域系:,为x的邻域:,定义象素团(clique):,邻域和象素团(clique)的例子,如果 是单网格点,或是由两两相邻的网格点组成,则 C 是定义在上的一个象素团。,Markov随机场(MRF),一个随机场,被称为关于邻域,系 N 的 Markov 随机场,如果,即只由 xi 的邻域决定。,用局部条件概率描述 Markov 随机场很不方便。,Gibbs 随机场(GRF),一个随机场,被称为关于邻域,系 N 的 Gibbs 随机场,如果,其中,,这里,T 为温度参数,U 为Gibbs能量,VC 为象素团 C 的能量,O 为象素团集合。,
16、Markov随机场和Gibbs 随机场的等价性,Hammersley-Clifford (H-C) 定理: 设 N 是邻域系。z(x) 是关于 N 的Markov随机场,当且仅当 z(x) 是关于 N 的 Gibbs 随机场。,希望得到一个分割标号随机场 z,z(x) = l 表示象素 x 属于l-th类。这里, l = 1, K。,基于 Bayesian 的分割方法 maximum a posteriori probability (MAP),设有含加性噪音的图象:,根据 Bayes 公式,希望下式左边取极大:,要求 p(z | g) 极大,就要求条件概率 p(g | z) 和先验概率 p(
17、z) 的积为极大。,采用4-邻域来估计两个概率。假设图象服从卡片纸模型。,1) 先验概率模型 p(z) 的估计:,对于单个网格点的象素团,如果 z(x) = l,,pl 是 l-th 类区域出现的先验概率,它反映了我们对于不同类区域出现概率的先验知识。 pl 越小,先验概率越大。,对于双网格点象素团,以如下方式强加象素团能量,其中 0。 越大,平滑性约束就越强。,2) 条件概率模型 p(g | z) 的估计:,设 l (x)(l = 1, 2, , K)是 l-th 类区域的灰度均值,则有:,对上式利用模拟退火算法优化,求出最优分割标号集 z 和l (x),这里 l = 1, 2, , K。,
18、综合1)、2) 所述,得后验概率,2) 基于“均值移动”的图象分割方法 (D. Comaniciu et.al, ICCV99, T-PAMI, 2002),a) 均值移动(Mean Shift)思想,核函数,b) 均值移动滤波,实验结果,c) 均值移动分割,实验结果,1) 通过区域均匀性和类不确定性最小化求取最优阈值 (MHUE)(P.K. Saha, et al, T-PAMI, 2001),7. 综合考虑边缘和区域的方法,假设A: 在任何具有模糊边界的图像中,在利用最优阈值得到的区域划分中,类不确定性高的象素出现在物体的边缘附近。,a) 基于灰度的类不确定性的确定,设 Fo,t 和 Fb
19、,t 分别是阈值为 t 时的物体和背景象素集。假设物体和背景的灰度都服从Gaussian 分布,c 为一个象素,C为图象空间,| X | 表示集合X元素个数。设,设 pt (g) 是 c g的概率,即,所以,由Bayes公式,具有灰度g的象素 c 属于物体的后验概率为,设 po,t (g) 和 pb,t (g) 分别是作为物体和背景上的象素 c g 的概率,即,所以,若已知象素 c 具有灰度 g,则在阈值为 t 时对 c 分类的不确定性可由 Shannon 熵表示,即,而具有灰度g的象素 c 属于背景的后验概率为,物体和背景上的象素 c g 的概率的定义,b) 区域均匀性的确定,这里,c、d
20、是两个象素,,确定 c 与 d 是否属于同一个区域。,大,则表示 c 与 d 属于同一个区域。所以,越大,则表示 c 及其邻域越均匀。,注意,,的计算与阈值 t 的选取无关。,C、,的定义可参阅P.K. Saha, et al, T-PAMI, 2001,c) 最优阈值的确定,d) 实验结果,(c), (f) 为MHUE 方法所得的分割结果。图 (g)为MHUE中的类不确定性。,e) 定量比较实验结果,三个不同的切片图,且所加 Gaussian 噪声自左至右递增。,(a), (e), (i) 分别对应上页三图的无噪声原图。第三列是本文方法的分割结果,第四列为“最优”阈值的分割结果。,和“最优”
21、阈值所得结果相比,MHUE的结果最大误差为0.2%,平均误差为0.13% ! 作为一种阈值分割方法,MHUE方法的参数很少 (只有一个,在计算区域均匀性时用到),而且其结果似乎也很难再被其他阈值分割方法所超越。,总结,在图象分割领域还没有出现对任意图象都可以分割的算法,需要根据问题的不同设计和采用不同的算法,还可能要考虑时空复杂度的可接受性。,图像分割相关的一些研究方向:,图像Matting,目标:从I(x,y) 中同时计算出a(x,y), F(x,y), B(x,y),典型方法:,J. Wang and M. F. Cohen. An iterative optimization appro
22、ach for unified image segmentation and matting. In Proc. of IEEE ICCV, pages II: 936943, 2005.,Y.Y.Chuang, B.Curless, D.Salesin, and R.Szeliski. Bayesian Approach to Digital Matting. In Proc. of IEEE CVPR, pages 264271, 2001.,A.R.Smith and J.F.Blinn. Blue screen matting. In Proceedings of ACM SIGGRA
23、PH, pages 259268, Aug 1996.,J.Sun, J.Y.Jia, C.K.Tang, and H.Y.Shum. Poisson matting. In Proc. of ACM SIGGRAPH, pages 315321, 2004.,一些结果:,纹理分割和纹理合成:,纹理分割的目标:To compare texture samples and decide if they belong to the same family,纹理合成的目标:从样本纹理合成出相似的大纹理(giving a small patch of sample texture, generatin
24、g a large texture ),C. Palm and T. M. Lehmann, Classification of Color Textures by Gabor Filtering, Computer Graphics and Vision vol.11, no. 2/3, 2002, pp. 195-219.,典型文章:,M. Varma and A. Zisserman, Texture Classification: Are Filter Banks Necessary? In Proceedings of CVPR, 2003.,X. Liu and D. Wang,
25、A Spectral Histogram Model For Texton Modeling And Texture Discrimination, Vision Research 42(2002), pp. 2617-2634.,D Heeger and J Bergen, Pyramid-based Texture Analysis/Synthesis, In Proc ACM SIGGRAPH, August 1995.,纹理分割的一些结果:,纹理合成的一些结果:,图像解析(Image Parsing),目标: Parsing image into several parts, each parts modeled one of the specified models with different models Models can be high level models such as face and text, or low level models such as region and curve,Bayesian Framework Each model has a prior probability; Each model has a likelihood probability w.r.t. Ima
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 糖尿病饮食控制实施方案
- 西蓝花设施栽培技术规程
- 生鲜农产品出库管理制度规范
- 草原牛羊越冬保膘营养方案
- 大棚番茄嫁接育苗技术规范
- 高尿酸血症饮食控制执行标准
- 肢体活动度检测评估规范
- 柑橘溃疡病防控应急方案
- 职业病健康风险评估标准
- 生产管理中级试卷及分析
- 工程造价咨询服务投标方案(技术方案)
- GB/T 44299-2024探测器探测范围的测量方法和声明用于大和小运动探测的被动式红外探测器
- 《交通监控系统》课件
- 等静压石墨行业分析
- 27.2.2相似三角形的性质教学设计人教版九年级数学下册
- GSTGM9000图形显示装置软件用户手册
- 明管结构计算书(Excel)
- 2023年同等学力申硕经济学综合历年真题及答案
- 《社会工作实务》初级社会工作师
- 环境规划学课后习题答案
- 最新4桥面结构课件
评论
0/150
提交评论