




已阅读5页,还剩47页未读, 继续免费阅读
(计算机软件与理论专业论文)图像特征提取算法研究与应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 特征提取一直是图像处理和计算机视觉研究领域中一个值得探讨的问题 在计算机 科学 医疗辅助诊断 军事 工业测量等众多领域都广泛采用这一技术 尤其是计算机 视觉和模式识别研究中 如何准确定位和提取关键特征往往是其中首先需要解决的问题 之一 是提高识别率等问题的重要前奏和关键问题 有着广泛的应用前景和潜在的市场 价值 主动形状模型 a c t i v es h a p em o d e l a s m 是特征提取等模式识别领域中常用的一种 方法 然而 由于受到初始情况 光照等诸多因素的影响 主动形状建模经常会陷入最 优化过程中的局部最小问题 从而导致其性能下降 本文系统介绍并复现主动形状模型 主要研究了a s m 中的一些关键问题 对影响a s m 性能的各因素进行实验与分析 针 对传统a s m 存在的问题研究两个改进算法 1 在传统主动形状模型基础上 研究一种构建局部纹理模型的新方法 该模型充 分利用特征点之间的联系 构建加权模型 更好地捕捉局部点的特征信息 从而更精确 地进行特征定位 2 人工鱼群算法 a r t i f i c i a lf i s hs w a r ma l g o r i t h m a f s a 是一种新型的寻优算法 具有良好的克服局部极值 取得全局极值的能力 算法具有对初值无要求 对各参数的 选择也不很敏感等优点 本文针对初始状态严重影响定位结果等问题研究了一种基于人 工鱼群算法 a f s a 的a s m 从而提高了特征提取准确率 在0 r l 人脸数据库 j a f f e 人脸数据库中进行特征定位实验 将改进算法与传统 算法进行比较 实验结果表明 改进算法具有搜索速度快 定位精度高 对初始状态不 敏感 避免局部最优等优点 关键词 图像处理 特征提取 主动形状模型 局部形状建模 人工鱼群算法 a b s t r a c t a b s t r a c t f e a t u r ee x t r a c t i o ni sa l w a y so n eo ft h em o s tt y p i c a lr e s e a r c h t o p i c si nt h ei m a g e p r o c e s s i n ga n dc o m p u t e rv i s i o n i th a sb e e nt a k e nw i d e l yu s eo fi nt h ea r e a so fm i l i t a r y c o m p u t e rs c i e n c e s c o m p u t e r a i d e dd i a g n o s e i n d u s t r ya n dh u m a n m a c h i n e c o m m u n i c a t i o n f e a t u r ee x t r a c t i o nh a saw i d er a n g eo fa p p l i c a t i o n sa n dp o t e n t i a lm a r k e tv a l u e a c t i v es h a p em o d e l s a s m i so n eo fp o w e r f u lt o o l sf o rf e a t u r ee x t r a c t i o n h o w e v e r t h e p e r f o r m a n c eo fa s mi s o f f e ni n f l u e n c e db ys o m ef a c t o r ss u c ha st h ei n i t i a ll o c a t i o n i l l u m i n a t i o na n ds oo n w h i c hw i uf r e q u e n t l yl e a dt ot h el o c a lm i n i m ai no p t i m i z a t i o n i nt h i s p a p e r c l a s s i c a la c t i v es h a p em o d e l a s m i ss t u d i e di n c l u d i n gs h a p em a t c h i n ga l g o r i t h m b a s e do n 铲a y l e v e l s o m ef a c t o r sw h i c hi m p a c ta s m s e a r c h i n ga r ec o n d u c t e da n da n a l y z e d t h ep e r f o r m a n c e so fo u rm e t h o d sa r ei l l u s t r a t e db ys i m u l a t i o ne x p e r i m e n tr e s u l t s 1 1 1 e m a j o rc o n t r i b u t i o n so ft h i sp a p e r a r ea sf o l l o w s 1 n l i sp a p e rp r o p o s e saw e i g h t e da c t i v es h a p em o d e l s i nw h i c ht h em o r er o b u s t1 0 c a l a p p e a r a n c em o d e li sc o n s t r u c t e dw i t ht h el o c a li n f o r m a t i o no fe a c hl a n d m a r kf u l l v 2 a r t i f i c i a lf i s h s w a r ma l g o r i t h mi sa na n i m a l sa u t o n o m o u sm e t h o dt h a tb a s e so nt h e p r i n c i p l eo fa r t i f i c i a li n t e l l i g e n t i th a ss o m ec h a r a c t e r s s u c ha sn os p e c i a lr e q u i r e m e n tf o r o b j e c tf u n c t i o n s b e i n gi n s e n s i t i v et ot h ei n i t i a lv a l u e s t o l e r a t i n gw i d er a n g eo fv a l u e so f p a r a m e t e r s h a v i n gt h e a b i l i t i e so fp a r a l l e lp r o c e s s i n ga n dg l o b a ls e a r c h t h i s p a p e r i n t r o d u c e da na s mb a s e do na r t i f i c i a lf i s h s w a r ma l g o r i t h m f i n a l l y t h o s ei m p r o v e dm e t h o d sa r ee v a l u a t e do no r l f a c ed a t a b a s ea n dj a f f ef a c e d a t a b a s e t h r o u g ht h ei m p r o v e dm e t h o dt h el o c a lm i n i m ap r o b l e mc a nb es o l v e de f f i c i e n t l y e x t r a c t e dt h ed e t a i l e dl o c a li n f o r m a t i o no ff e a t u r ep o i n t sa n dl o c a l i z e dt h ep o i n t sa c c u r a t e l y t h ee x p e r i m e n t a lr e s u l t ss h o wt h a tt h en e wa l g o r i t h m sh a v es o m ea d v a n t a g e si nt e r m so f s e a r c h i n gs p e e d s e a r c h i n ga c c u r a c y a v o i d i n gl o c a lo p t i m u m k e y w o r d s i m a g ep r o c e s s i n g f e a t u r ee x t r a c t i o n a c t i v es h a p em o d e l l o c a la p p e a r a n c em o d e l a r t i f i c i a lf i s h s w a r ma l g o r i t h m 1 1 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取 得的研究成果 尽我所知 除了文中特别加以标注和致谢的地方外 论文 中不包含其他人已经发表或撰写过的研究成果 也不包含本人为获得江南 大学或其它教育机构的学位或证书而使用过的 t l i 与我一同工作的同志 对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意 签名 盏l 至垂拄日期 一塑2 1 星 生 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留 使用学位论文的规定 江南大学有权保留并向国家有关部门或机构送交论文的复印件和磁盘 允 许论文被查阅和借阅 可以将学位论文的全部或部分内容编入有关数据库 进行检索 可以采用影印 缩印或扫描等复制手段保存 汇编学位论文 并且本人电子文档的内容和纸质论文的内容相一致 保密的学位论文在解密后也遵守此规定 签名 导师签名 确痢 第一章绪论 第一章绪论 1 1 研究背景 在图像处理和计算机视觉研究领域中 特征提取一直是一个值得探讨的问题 这一 问题的研究是与数字图像处理 l 3 的发展密不可分的 数字图像处理 即用计算机对图像迸行处理 与人类对视觉机理着迷的历史相比 它 是一门相对年轻的学科 但在其短短的历史中 它却以程度不同的成功被应用于几乎所 有与成像有关的领域 由于其表现方式 用图像显示 所固有的魅力 它吸引了从科学家 到平头百姓太多的注意 数字图像处理也是一门多学科交叉的领域 在这把大伞下会聚了光学 电子学 数 学 摄影技术 计算机科学等众多学科 下列因素表明数字图像处理技术的应用将更加 广泛 一个主要因素是图像处理所需的计算机设备的不断降价 处理器和大容量存储器 都一年比一年便宜 另一个因素是图像的数字化和图像显示设备的越来越普及 特征提取技术正是在数字图像处理领域中涌现出来的一种新的应用 在军事 医学 和计算机科学等众多领域 都广泛地采用了这一技术 1 无人飞行器的自主导航与定位 利用存放在飞行器上的参考图像 与其在飞行过程中获得的下视或前下视图像进行 比较 从而判断无人飞行器的当前位置 确定其飞行方向和位置上的偏差 帕 2 医疗辅助诊断 从严格意义上说 在引入现代医疗仪器之前 医学基本上不能称为科学 传统的医 疗诊断靠的是经验 事实上即使在今天中医也基本上依靠经验 这样就带来两方面的问 题 一是医生的训练无法科学化 二是诊断的结果加入了较多的人为因素 现代医疗仪 器的使用在一定程度上解决了这两方面的问题 但仪器除了直接提供数据外 几乎不能 进行任何自动分析工作 很多仪器如x 一光机 c t b 超 各种显微诊断设备等提供 的都是图像 这样诊断的结论又再一次依赖于读者的经验 采用特征提取技术 对人体 器官的医学图像进行病灶定位与分析 就能为了解器官与组织的构成与病变情况提供准 确的依据 这在早期疾病诊断方面起到了非常重要的作用 7 9 1 3 人机交互研究领域 现在计算机与人的交流还是机械式的 计算机无法识别用户的真实身份 从严格意 义上讲口令并不代表实际的用户身份 除了键盘 鼠标外的其他的输入手段还不成熟 在机器人研究领域 机器人的视觉一直是提高机器人智能化水平的关键技术 通过广泛 地采用特征提取 目标定位方法 可以很大程度提高机器人对周围环境的感知能力 从 而提高了机器人运动的准确性和对环境的适应能力 利用计算机特征提取与识别技术可 以使计算机检测到用户是否存在 鉴别用户身份 识别用户的体势 如点头 摇头等 此外这种人机交互方式还可以推广到一切需要人和机器交互的场合 如入口安全控制 过境人员的验放等 1 0 1 2 江南大学硕上学位论文 4 图像数据库检索 图像数据库检索目前是图像处理和计算机视觉中的前沿课题 研究如何在一个海量 图像数据库中确定哪一幅或者哪几幅图像与给定的图像相似 或者相同 图像数据库检 索也是人的认知过程的近似描述 其中的关键技术就是如何确定图像数据库中的每一幅 图像与给定图像的相似程度 1 3 1 6 5 基于模型的目标识别 图像理解的高层分析主要完成图像的识别 解释和描述等任务 其所依赖的内部模 型可以分为基于图像特征 基于空间几何形状和基于知识三类 这些方法有比较大的区 别 但其研究基础都是图像与内部模型的匹配和比较 比如指纹和人脸识别 都是在图 像数据中提取有效特征并通过匹配最终完成目标的识别 1 7 1 9 6 工业测量 探伤检测 通过现场获取的视频 判断在输入的序列图像中是否存在工件损伤 感兴趣的特定 物体以及工件安装是否到位 通常实现这些控制的常用方法也是特征提取 图像匹配 2 0 2 l 0 总之 计算机设备成本的下降加上正在兴起的上述非常重要的应用 可以预料到 特征提取问题的研究将随着数字图像处理的发展而发挥更重要的作用 1 2 特征提取研究概述 目前大多数图像数据库系统对图像数据的检索是根据图像的某些属性 如图像名 制作日期 作者等能用文字表示的特征 利用查询语言对整个图像库进行检索 这种方 法存在检索费时 必须熟悉查询语言等缺点 一种解决方法是提取图像的二维特征 据 此进行检索 这样 检索信息就不仅包含有图像的属性 更多和更重要的是包含有图像 本身的内容 在图像中存在着一些特殊的信息 这些信息使该图像有别于其它任何图像 这些特 殊信息就是图像的特征 从广义上讲 图像的特征是图像场明显可分的 本原的特性或 属性 这里的属性是指图像的名称 制作日期 作者等可用文字表示的信息 而本文所 指的图像特征是这类属性之外的特征 按区域划分的话 特征有点特征 局部特征 整 体特征 而根据特征的表示可分为幅度特征 直方图特征 变换系数特征 点线特征 边缘特征等 特征信息可以用图像 子图 文字或数字表示 要求特征信息的信息量 丰实而所占存贮单元尽可能少 图像特征提取涉及的面很广 从一幅图像中提取出什么样的特征 需要根据建库者 所关心的问题来决定 由于图像具有很强的领域性 不同的领域图像的特征千差万别 与图像所反映的对象物体的各种物理的 形态的性能有很大的关系 因而有各种各样的 特殊方法 特征提取工作是相当复杂的 如何从一幅图像中抽取能完全唯一表征该图像的特 征 往往需要与有关领域的专业人员共同努力 根据所建图像库是有关哪类图像的具体 2 第一章绪论 问题来决定 如对文字 符号等可只抽取几何形状特征 而对某些图像则需要抽取频谱 特征 从一幅图像中可提取的特征不是唯一的 如何根据各种评价函数 选出最合适和最 有代表性的特征组成图像的特征向量 就需要进行特征选择 特征选择的目的是对特征 规范化 降低特征向量的维数 特征选择有各种方法 但都必须特别注意对任何变换都 不变化的那些分量 总之 图像特征提取是以经验为指导的 需要具体问题具体分析 不同的情况采用 不同的特征提取方法 1 3 特征提取一般方法 代表图像二维特征的有边缘 区域 形状和纹理等特征 不同的特征有不同的提取 方法 1 形状特征 形状特征是指图像中物体的几何特征 根据其几何形状又分为块状形的和线形的形 状特征 2 2 2 3 1 1 周长 面积 复杂度 图形的周长可通过对图形边界点的个数进行计数求得 而面积可由象素数计数得 到 图形的复杂度由其周长的平方除以面积表示 形状越复杂 复杂度就越大 2 凹凸性 连接图形内任意两个象素的线段 若不通过这个图形以外的象素 则此图像称为凸 对于任何一个图形 把包含它的最小凸图形叫做这个图形的凸闭包 3 矩特征 图像的矩特征是由式1 1 所定义的m p g 及其组合来决定的 m p g i p 9 石 1 1 f 这里 厶 是在图形内设为l 外面设为o 的二值图像 由 p q 值决定了各式各样 的特征向量 其中最常用的有重心 主轴等特征 4 傅里叶描述符 在分析图形的形状时 用边界跟踪算法跟踪图形的边界线 并把这一结果对应于一 封闭曲线 然后展开成傅里叶级数 用展开系数来表示形状特征 除了以上特征外 一些有关图形连通性的特征量 如欧拉数 连接成分数 孔数等 也可用来表示图形的特征 另外 对于一些经过细化后的线图形 则需要考虑提取特征 点 2 边缘检测 边缘检测的基本思想是在图像物体的边界处 灰度存在着急剧变化 因此寻找灰度 变化较大的点就能找到边缘 常用方法有 1 一次微分 3 江南大学硕士学位论文 一次微分的离散形式 即差分为 1 v 厂 x 少 f x l 少 f x 少 j 厂 x y 1 f x 少 j o 1 z 由于微分反映了函数的变化率 因此当w x y 大于某一阙值时就表明在点 x y 处 灰度有较大变化 该处就可能是边缘的一个点 在很多场合 常采用反映梯度的各种边 缘检测算子 如r o b e r t s s o h e l 等算子 2 二次微分 由于一次微分是一种向量 与标量相比它的数据存储量大 并且在斜率一样的宽区 域上 若把全部区域都当作边缘取出时 情况有时会变化 故有必要做二次微分 即采 用二阶差分 这就是拉普拉斯算子 1 a p l a c i a n v 2 f x y x 1 y f x y 卜 x y f x 一1 少 厂 x y 1 一f x y 一 厂 x y 一f x y 一1 1 3 另外还有一些模式匹配 但其实质依然是差分操作 但具有平滑噪声的优点 并且 根据各子区域边缘的方向进行连接 能得到比一 二次微分较好的结果 然而计算量较 大 费时间 3 区域分割 区域分割 2 4 2 5 1 是把图像分割成具有某种意义的部分图像 如对象物区域与背景区域 的方法 最简单的方法就是二值化处理 其关键在于阈值的确定 而较复杂的方法有 1 区域扩张法 区域扩张法就是取出等灰度的部分 即在给定图像的平面上进行小区域的分类 根 据这些小区域特征的类似性 把图像分割成特征一致的连续区域群 根据区域形成的过 程不同 又分为合并 象素结合等方法 其中合并法较容易又适用 它的基本原理就是 把图像分割大小为n x y 的子区域 根据一定的判断标准研究邻接小区域的类似性 合并类似性高的区域 反复进行 直到不能合并为止 这里的判断标准有灰度差 灰度 分布的相似性和区域的形状等 2 在特征空间利用聚类进行区域分割 本方法实际上是把象素 或小区域 作为一个模式 然后应用模式识别理论进行分类 它首先把图像平面内的象素变换到特征空间上 然后利用识别函数或分类法来判别特征 空间内的象素分类 属于某一类的象素加上标号 然后反转回到图像平面 在实际应用 中常用小区域代替象素 有时采用坐标轴上的一维投影代替多维特征 4 纹理特征 纹理 t e x t u r e 可认为是灰度和颜色的二维变化图案 是区域所具有的重要特征之一 不管是什么样的东西 若一直放大下去再进行观察的话 就一定能显现出纹理 1 直方图特征 直方图特征最简单的特征是纹理区域的灰度直方图或灰度平均值和方差等 但灰度 直方图不能得到纹理的二维灰度变化 对二维灰度变化的图像简单地赋予特征方法 有 从图像求出边缘或灰度极大 极小点上的二维局部特征 并利用它们分布的统计性质的 方法 此外 直方图较强的边缘密度或边缘的平均大小也成为表示纹理粗细的有用特征 4 第一苹绪论 2 灰度共生矩阵特征 在灰度直方图中 因各个象素的灰度是独立地进行处理的 故不能很好的给纹理赋 予特征 所以 若研究图像中的两个象素组合中灰度配置的情祝 就能很好地表现纹理 特征 这样的特征 叫做二次统计量 其代表有以灰度共生矩阵为基础的纹理特征计算 法 3 傅里叶特征 上述的特征是在图像空间上提取的 另外还有对图像进行傅里叶变换 从其频率成 分的分布来求得纹理特征的方法 首先确定图像f i j f 傅氏变换f u v 的功率谱 e u y 并用极坐标的形式表示为p r 9 再求出 万 出 2 p 2 p r 9g q p q 1 4 q o r 0 其中缈表示了e u y 的大小 于是可用p g q 图形的峰的位置和大小 p p 和 g p 的平均值和方差来做纹理特征 上面介绍的是从具有同样纹理特征的区域计算其特征的方法 在图像内存在着若干 个不同纹理区域的场合 为了利用上述方法提取纹理特征 有必要进行纹理区域的分割 分割的方法之一就是在各点的周围设置5 个邻域 把在最一致邻域中的点密度作为该点 输出值 再根据直方图进行分割 同样 对于纹理特征 也还有纹理边缘的检测 为了 求得纹理边缘 应分别求出 f 的 v l n 令g 域内的局部特征 如灰度 边缘点的密度 方向等 的平均值 用它们的差来定义边缘的值 这里的关键是如何选择邻域的大小r l 若刀设大了 则边界会出现模糊 相反 刀小了 则反应出纹理本身有波动 1 4 本文的主要研究工作 图像的特征提取是一个传统而又面临挑战的课题 本文在此方面作了大量工作 主 要完成了以下研究内容 1 c o o t e s 等人提出的主动形状模型 a c t i v es h a p em o d e l s a s m 方法 2 6 2 7 已成为非 常流行的物体定位方法 其优点在于它能允许一定程度的形状变化而又能保证变化后的 形状还代表着某一类物体或者结构 文本从a s m 原始的思想出发 充分利用标定点之 间的联系 研究一种构建局部纹理模型的新方法 将其扩展为更为鲁棒的模型一加权模 型 从而为更精确地定位面部关键特征点提供可靠的依据 最后 在o r l j a f f e 人 脸数据库中进行实验 分析改进模型的性能 2 尽管a s m 有较好的性能 但这个方法存在诸多不足的地方 比如受初始化状 态 旋转角度等因素影响可能导致定位失败 本文在分析a s m 不足的基础上 将集群 智能优化算法一人工鱼群算法引入到a s m 中 人工鱼群算法 a r t i f i c i a lf i s hs w a r m a l g o r i t h m a f s a t 2 8 3 0 1 是新近提出的一种智能优化算法 该算法具有良好的克服局部极 值 取得全局极值的能力 结果表明 本文算法具有搜索速度快 定位精度高 对初始 状态不敏感 避免局部极值等优点 5 江南大学硕上学位论文 1 5 本文的结构安排 本文的结构安排如下 第一章绪论部分 主要介绍了图像特征提取问题的目的和意义 研究现状 应用前 景 主要研究方法以及本文的主要工作与章节安排等 第二章详细阐述特征提取算法 介绍了几种流行算法的原理 主要包括 s n a k e 模 型 主动形状模型 a s m 主动表观模型 a a m g a b o r 小波变化与隐马尔可夫过程法 系统详细介绍地了主动形状模型 该算法是本文的工作重点 第三章主动形状模型算法分析与改进 复现a s m 算法 对影响a s m 性能的各因 素进行实验与分析 在实验中发现了传统a s m 存在的一些问题 针对这些问题 研究 了一种改进的主动形状模型 通过实验将两种算法进行了对比 实验表明 改进算法具 有搜索速度快 搜索精度高等优势 第四章基于人工鱼群算法的a s m 介绍了一种新颖的群体智能优化算法一人工鱼 群算法 针对a s m 受初始化状态 旋转角度等因素影响可能导致定位失败的问题 将 人工鱼群算法引入到a s m 中 实验表明 本文算法具有搜索速度快 定位精度高 对 初始状态不敏感 避免局部极值等优点 第五章总结与展望 对于研究结果进行了分析 对研究的未来进行展望 6 第二章特征提取算法 第二章特征提取算法 传统的特征提取主要采用基于模型的方法 归纳起来 有三种构造模型的方法 分 别是参数模型 图像模型和统计模型 参数模型的方法主要有隐马尔可夫模型 3 1 3 2 1 图 像模型的方法主要是相关模板匹配 3 3 1 以及主动轮廓模型 a c t i v ec o n t o u rm o d e l 3 4 3 6 1 等 而本章介绍的主动形状模型就属于统计模型范畴 2 1 主动轮廓模型 a c t i v ec o n t o u rm o d e l a c m k a s s 等人在1 9 8 7 年提出了称为s n a k e 的主动轮廓模型3 刀 s n a k e 是能量极小化的 样条 内力约束它的形状 外力引导它的行为 图像力将其拖向显著的图像特征 s n a k e 是 主动 的轮廓模型 它锁定在图像特征的附近 准确地将它们极小化 s n a k e 模型 引人之处在于 它对于范围广泛的一系列视觉问题给出了统一的解决方法 在最近的十 多年中 它已经被越来越多的研究者成功应用于计算机视觉的很多领域 如边缘提取 图像分割和分类 运动跟踪 3 d 重建 立体视觉匹配等 2 1 1s n a k e 的数学模型 s n a k e 是图像力和外部约束力作用下移动的变形轮廓线 k a s s 等人通过构造合适的 变形能e 1 来定义目标的轮廓 这里1 x s y s 表示轮廓 代表从单位参量域j 0 1 到图像表面的映射 同时认为轮廓上的外部力是势能p 1 s 的微分 这样 轮廓上的总 能量可以定义为 e v e 1 尸 2 1 其中 a 一 e 1 r o s i 吃1 2 坳2i k1 2 凼 2 2 1 的脚标表示相当于s 的微分 e 1 s 定义了一个可伸长和可弯曲的轮廓1 s 的内 部能量 他包括两个参数 q s 控制轮廓的应力 咤控制轮廓的刚度 这些参数操纵 着模型的物理行为和局部连续性 特别地 设r o s o r 0 2 s o 0 允许 位置的不连续性 设r 0 2 s 0 0 允许 点切线上的不连续性 外部势能p v 吸引s n a k e 到显著的图像特征 一 尸 v p v d s 2 3 尸 v 是定义在整个图像表面i x y 上的标量函数 当不考虑外部约束力时 若 p 1 t 0 3i 嘭 i x y i s n a k e 将会被吸引到图像中的暗区或亮区 若 p 1 t 0 3lv q i x y i s n a k e 将会被吸引到图像的边缘 鸭控制势能的幅值 q 表示图像和特征密度为仃的g a u s s 平滑滤波器卷积 7 江南大学硕上学位论文 2 1 2s n a k e 模型的实现与改进 大多数改进的s n a k e 模型的研究工作至少涉及下列问题之一 改进s n a k e 对初始化 轮廓的敏感性 保证s n a k e 能收敛到全局极值 改善s n a k e 在能量极小化过程中的收敛 速度与数值稳定性 有的学者致力于数学模型上加以改进 又有的学者研究了新型的算 法 还有的二者兼而有之 将式 2 2 2 3 联立 得到 e 1 f q s jk1 2 2 r 0 2 s 1 1 2 2 r 0 3 j p v 凼 f f y k k 幽 2 4 e v j 是v s 的泛函 若e v s 在某一确定的曲线上取得极值 则式 2 4 满足e u l e r 方程 一芸 弓 巩 0 2 5 v s c o 1 v o v o 吨 v 0 h 1 1 v 这样 e 的能量极小值问题就转化为求解偏微分方程式 2 5 k a s s 等人用有限差分的方法在一组节点u 1 砌 f 0 l 2 一1 上离散化式 2 5 k k 一v j h 得到线性方程组 a v f 2 6 其中 么是稀疏的 带状的矩阵 是势能的负梯度 对于二维问题 用l u 分解 法解此线性方程 计算复杂度是o n 3 其中以为离散点数 用有限差分近似微分以及 计算数字图像上的梯度时 使用矩阵么以及f 都产生了摄动 有可能改变数值解的稳定 性 同时 为了不丢失控制点的信息并保证平滑 必须有足够数量的控制点 这相应的 增加了计算复杂性 因此 c o h e n 等人提出了s n a k e 模型的有限元算法 3 8 1 其基本思想 是在s o b o l e v 空间中选取有限维子空间 圪 i c 0 1 n v h x f 鼍 1 e 薯 薯 l 0 i n l 2 7 其中 茸是小于或等于k 的多项式线性空间 把泛函式 2 4 在函数空间中的极值函 数作为目标轮廓的近似解 适当的选取基函数仍 x 则v s 仍 x 这样 e v e v h 研 仍 x 令越 锄 o 而且考虑边界条件 可得到线性方程 k u b 2 8 其中 k 是稀疏带状的刚度矩阵 求解该方程组得u i 江l 2 刀 使得泛函e 屹 j 在心 s 中取得极小值 c o h e n 等人的方法能够用较少的控制点来表达目标轮廓 并且增 加了解的稳定性 对于s n a k e 模型的算法改进远不止与此 其他算法在此不一一详述 2 1 3s n a k e 模型的应用 1 变形模板 8 第二苹特征提取算法 由于自然物体形状的多样性和复杂性以及图像的噪声等复杂因素的影响 在使用刚 性模型提取图像轮廓时遇到了极大的困难 基于s n a k e 模型的变形模板方法 为解决这 一问题展现了令人鼓舞的前景 相对于刚性模板来说 变形模板使自己发生变形以匹配 到显著的图像特征 从数学角度来看 这可以解释为两项组成的目标函数 其中一项测 变形模板与理想轮廓的偏差 另一项衡量变形模板与相应图像特征的匹配程度 于是 轮廓提取变成了使目标函数最大化或最小化的最优化问题 变形模板不但能检测出目标 特征 而且能够给出目标的描述 从而将其用于分类和匹配中 2 运动跟踪 在时变图像中使用s n a k e 进行跟踪的思想最初是由k a s s 等人提出来的 他们使用 s n a k e 模型跟踪说话的唇动 当从动力学角度研究s n a k e 模型时 研究工作取得了很大 的进展 3 其他方面的应用 c o h e n 等人将s n a k e 模型进行推广 将其应用于3 d 重建 3 8 m e n e t 等人用相似的 方法对航空照片中的建筑进行了立体匹配 3 9 1 2 1 4s n a k e 模型的定位结果与讨论 s n a k e 在能量极小化过程中表现出来的动态行为使其具有广泛的适用性 特别适合 于医学图像处理 图2 1 2 2 显示了成功和失败的s n a k e 模型进行定位的例子 图2 1 与2 2 的区别在于初始化的不同 由此可知 s n a k e 模型更有利于定位标定点内部的目 标 不能用来定位外部目标轮廓 s n a k e 模型的特点总结如下 将图像数据 初始估计 目标轮廓及基于知识的约束统一于一个特征提取过程中 经适当的初始化后 它能够自主收敛与能量极小值状态 尺度空间中由粗到精地极小化能量可以极大地扩展捕获区域和降低计算复杂性 同时 s n a k e 模型也有其自身的缺点 对初始位置敏感 需要其他机制将s n a k e 放置在感兴趣的图像特征附近 由于s n a k e 模型的非凸性 它有可能收敛到局部极值 甚至发散 只能定位外轮廓 不能反映内部纹理 9 江南大学碰十学位论文 2 2 主动形 l l 模型 a c t i v es h a p em o d e l a s m 主动形状模型方法最早是由c o o t e s 提出的 2 6 2 7 这种建模的技术从设计理念上很类 似于k a s s 等提出的活动轮廓模型 a c m a s m 的优点在于模型实例可以根据在训练 集中学习到的方式变形 也就是说 这种模型并不是始终不变的 而允许一定程度上的 形状的变化 这个使得a s m 不但能定位物体的外轮廓 而且能够发现内在的轮廓 但 是这种变形又是有限度的 不会脱离它们所要表现的那类目标对象的本质特征 通过允 许参数在一定范围内改变 获得更加精确的定位效果 2 2 1 特征点的标定f 点分布模型 p v m 在a s m 中 一个形状是用一组标定点来表示的 我们需要一组最能体现其特征的 关键点 称其为点分布模型 p o i n td i s t r i b u t i o nm o d e l p d m l 柏j 点分布模型能够对物体 的形状进行很好的描述 一方面他能够对目标形变进行控制 保证分布不脱离目标 另 一方面 它允许有目标样本中没有的变形 这使得它能灵活地对目标进行描述 本文从 第二章特征提取算法 统计的角度用物体轮廓上一系列边界点来定义物体的外形 所谓边界点 是指位于物体 轮廓上反映物体外形特征的一系列点 边界点一般选在能表示目标物体外形特征的地 方 比如拐角点 t 形连接处等 同时在具有外形特征的边界点中间 用等间距采样的 方式选取另外一些中间边界点 共同构成目标轮廓的边界点集合 图2 3 t 图2 4 显示了 面部点分布模型 囤2 3 边界点的选取 f i 9 2 0 s c l e c t i 蚀o f 血c l a n d m a r kp o i n t s 日 2 4 面部点分布模型 f i 9 2 4 p o i n t d i s 订i b u t l o n m o d e l 边界点集合中的各点均用一个二维坐标表示 这样h 个边界点构成的边界点集合可 以表示成长度为知的向量工即 x 竹 x x y y 2 y 了 啦 选取 幅包含同类目标物体的二维图像 用上述方法进行轮廓边界点标定得到训 练样本集n i o n 置 置 耳 图像中标物体的外形和位置会存在较大偏差 因 此在对 中向量进行统计分析之前 有必要用相似性变换对其进行归一化处理 2 2 2 相似性变换 相似性变换是一种基本的几何运算 在图像处理中 几何运算的主要作用是改变图 像中各物体之间的空间关系 这种运算可以被看成是将 各 物体在图像内移动 其效果 1 1 g 墨y f x y 9 口 蕾j 6 五y 2 1 0 a x y x b x y y 2 1 1 口 x y x x o b x y y y o 2 1 2 菇 露 采用齐次坐标的表达方式 可以将等式写成简洁的矩阵形式如下 譬 壹三罩 i 2 3 a x y x c b x j y d 2 1 4 降 湘 5 a x y 一x b x 力 y 2 1 6 a x y x c o s o y s i n 0 2 1 7 b x j x s i n o y c o s o 2 1 8 l c s o i s 口o c s 薯i n 口0 i c 2 9 1 2 第二章特征提取算法 齐次坐标系为确定复合变换公式提供了一个简单的方法 例如 围绕点 的旋 转可由下式实现 兰 暑 妻三辜j c s o s 秒o c s c 苫i n 秒0 壹三二i 享 这里首先将图像进行平移 从而使位置 y o 成为原点 然后旋转乡角 2 2 0 再平移回 按上述方法 任意抽取q 中两个向量x 和x 通过将x 进行变换t 后 使x 和 x 所代表的目标轮廓中对应边界点的距离平方和最小 即 使误差e 值达到最小 e lt x 一x 1 2 2 2 1 t 去相似性变换 其中三个变换因子分别是 伸缩因子s 旋转因子p 和位移因 子t 用如下矩阵形式表示为 t c 2 2 2 其中 u s c o s i f s s i n 0 这样 s 2 1 t 2 1 2 秒 t a n q 么 将式 2 2 2 代入 2 2 1 得 e u 0 爿t r 一x 1 2 峨一啊 一 2 峨 研 0 一一 2 2 2 3 于是 求解式 2 2 3 的最小值就能使误差值e 最小 通过对式 2 2 3 求偏导数并令其 为零 得到的相应变换参数为 甜 x x i i x l 2 v l 誓乃 一以z l i x l 2 2 t x 吉善z 炉吉善 2 2 3 统计模型的建立 应用统计方法解决模式识别问题时经常碰到的问题之一是维数问题 在低维空间里 解析上或计算上行得通的方法 在高维空间里往往行不通 因此 降低维数有时就成为 处理实际问题的关键 一种处理维数过多的方法是采用组合特征的方法来降维 对几个 特征作线性组合是一种特别具有吸引力的方法 因为线性组合容易计算 并且能够进行 解析分析 从本质上来说 线性方法是把高维的数据投影到低维空间中 主成分分析 p r i n c i p l ec o m p o n e n ta n a l y s i s p c a 4 1 1 是一种经典的寻找有效的线性变换的方法 这一 方法的目的是寻找在均方意义下最能够代表原始数据的投影方法 此外 在点分布中变 化的大部分是冗余的 因此可将校准后的形状向量通过主分量分析从原始的多个变量中 江南大学硕 i 学位论文 取若干线性组合 使得它们尽可能多地保留原始变量中的信息 由此生成形状特征子空 间 且任何形状都可用a s m 的形状模型来表达 当形状参数在合理的范围内变化时 可以认为其能够表达所有目标图像的形状特征 下面对所得对齐后训练数据进行训练得 到形状变换的模型便是p c a 方法的一个应用 过程如下 1 计算对齐后形状向量的平均形状 贾 告 置 2 2 5 l i 2 计算对齐后形状向量的协方差矩阵 5 2 击善 五一两 一牙 7 2 2 6 样本点在知维空间形成一个知维椭球形状的云团 则协方差矩 或散布矩阵 的特 征向量就是这个云团的主轴 p c a 便是通过提取云团散布最大的那些方向的方法来达到 对特征空间降维的目的 如图2 5 所示 3 对协方差矩阵8 进行特征分解 其特征值丑 丑 小丑 o k l 五 2 砷和对 应的特征向量n 满足下式 跳 最 c 2 7 p r p l 2 2 8 图2 5 主成分分析 f i 9 2 5 p i i n g 如l e c o m p o n e n t a n a l y s i s 4 取前 个特征值 如 丑 使得 拟 酗 苎三 壁笙堡里墨堡 其中 为所选特征占总特征的比例 一般为9 5 9 8 取相应的特征向量并将其 单位化 记为p a 岛 岛 最终获得全局形状模型为 z 牙 p 6 2 3 0 其中 j 表示平均形状 p 为主成分特征向量构成的变换矩阵 6 为主分量参数 控制前f 个特征值的系数 不同的6 对应不同的形状 而且 3 压 自 助 这样最佳匹配位置的搜索就转换 为寻找采样灰度向量与模型向量的匹配位置 如图2 7 用模型灰度向量在采样灰度向量 上移动 计算各个位置的匹配程度 匹配位置就是d g 最小值的位置 l 搦一一 l 模型i 灰度 厂1h 阿n 匹配程度 图2 7 沿样本轮廓搜索局部纹理的最佳匹配 f i g 2 7b e s tm a t c ha l o n gt h ec o n t o u ro fs a m p l e 2 2 5 多分辨率框架 m r a s m 图像可以用多种不同的分辨率来表示 显然 降低图像的分辨率可以降低阵列的尺 寸 但要丢失一些信息 使得信息恢复工作比较困难 然而 降低分辨率可以降低对存 1 6 第二章特征提取算法 储器容量和计算速度的要求 图像的层级表示可以是多分辨率表示 在许多应用中 首 先在低分辨率下进行图像特性计算 然后在高分辨率上对图像某一选定区域再进行精细 计算 多级图像表示也在图像处理中得到了广泛应用 常用图像层级表示方法如金字塔 四叉树等 以多分辨率来解释图像的一种有效但概念简单的结构就是图像金字塔 p y r a m i d t 4 2 图像金字塔最初用于机器视觉和图像压缩 一幅图像的金子塔是一系列以金字塔形状排 列的分辨率逐渐降低的图像集合 金字塔的底部是待处理图像的高分辨率表示 而顶部 是低分辨率的近似 向金子塔的上层移动时 尺寸和分辨率就减小 如图2 8 所示 第o 层 图2 8 高斯图像金字塔 f i g 2 8g a u s sp y r a m i d 为了提高算法的效率和鲁棒性 主动形状模型的搜索过程采用多分辨率框架 m u l t i r e s o l u t i o nf r a m e w o r k 阳 也就是开始时在一个粗糙的图像中搜索目标 然后在 一系列逐渐精确的图像中不断改善定位结果 这种方法可以加快搜索速度 并能减少受 到错误图像结构带来的影响 对每个训练或测试图像构造一个高斯图像金字塔 最底层 图像就是原始图像 接下来一层通过对原始图像进行高斯底通滤波 滤波的操作有很多 如邻域平均可生成平均值金字塔 如果不滤波则生成自抽样金字塔 并以2 为步长进行 抽样 子抽样 在每一维得到图像的像素数目都是原来的一半 然后同样的操作 进一 步的滤波和降采样得到后面的每一层 无论在哪一层在每个轮廓模型中一般都采用相同 数目的像素点 因为第三层像素间距离是原始图像 即第o 层 的2 工倍 越高层的模型描 述了图像越大的部分 如图2 9 1 7 江南大学硕士学位论文 薛 王 工 璃 壬 第0 层 第l 层 第2 层 图2 9 在每一层采用相同像素点的纹理统计模型 f i g 2 9s t a t i s t i c a lm o d e li ne a c hl a y e rh a v i n gs a m ep i x e l 同样 搜索时在每层也只需要搜索当前点两边的少量的像素点n 在越高层搜索的 范围也越大且模型收敛到一个最优的形状 当提高分辨率时我们只需小量的修改此结 果 在每层进行搜索时 我们需要一种算法来决定是何时进行更高分辨率的搜索何时停 止整个搜索 可以记录下每次搜索得到的最优点在轮廓法线中心长度的5 0 范围内 也 就是说 最优点在离当前点的 z 2 个像素范围内 的次数 当次数占所有点数的比例满 足一定的值 妇 如 9 0 时 就认为算法在该层收敛 进入下一层搜索 以同样方法 继续直到收敛 当在最后一层得到收敛时 整个搜索停止 2 2 6 计算形状参数 通过a s m 搜索算法 我们可以找到最佳匹配位置 计算形状位移d x 为了将形状 x 变换到x d x 我们必须寻找当前搜索变化与模型变化的对应关系 这样我们可以 用训练好的模式重构形状 由
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 难忘瞬间600字初三作文9篇范文
- 客服问题反馈记录单解决及反馈模板用户需求全覆盖
- 时间在流逝课件
- 文艺复兴时期艺术成就概览:美术教案四年级下册
- 时装画技法课件
- 六年级日记班级辩论会500字7篇范文
- 进行时态中现在分词用法教学预案通俗易懂适用于各年级语法课程
- 供应链管理优化方案库存与物流协调模板
- 数学竞赛模拟题训练:高中数学竞赛备考教案
- 紧急应对方案快速制定与实施模板
- 2025 年小升初苏州市初一新生分班考试数学试卷(带答案解析)-(人教版)
- 2025年建筑工程管理与实务一级建造师考试冲刺押题卷
- 2025版建筑垃圾处理废弃物处理设施运营管理合同
- (2025年标准)融资委托协议书
- 2025自贡开放大学公需科目答案
- 2025年招录考试-工会招聘考试历年参考题库含答案解析(5套典型题)
- 毕马威:2025年第三季度中国经济观察报告
- 2025年电力工程行业研究报告及未来发展趋势预测
- 手术部位感染案例分析
- 气道支架植入术后护理查房
- 2025年时事政治题附完整答案详解【各地真题】
评论
0/150
提交评论