综述补充版.doc_第1页
综述补充版.doc_第2页
综述补充版.doc_第3页
综述补充版.doc_第4页
综述补充版.doc_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

稀疏编码综述一、图像特征提取综述1 引言在数字图像处理中,图像最原始的表示是基于像素的矩阵形式。以灰度图像为例,它是对连续图像信号进行采样、量化得到的2维灰度矩阵。每个采样点对应一个像素,像素灰度值表示这一点的明暗程度,对于量化等级为0255的8位灰度图像而言,0255是一个由黑(0)到白(255)的灰度渐变过程(也可反过来)。如下图,显示了1幅灰度图像中的1个子区域的像素灰度矩阵。 至于彩色图像,可认为其每个像素处不是只有一个灰度值,而是颜色空间多个颜色通道灰度值的组合。如,RGB空间图像的每个像素包含红、绿、蓝(R、G、B)三种颜色分量,针对各颜色分量的多少,可划分为0255共256个等级,0表示不含某种颜色分量,255表示含有100%的该颜色分量。这样,红、绿、蓝分量就能组合出256256256种颜色,例如某像素红、绿、蓝分量分别为255、0、255时显示为紫色。特征提取可以是全局性的,即针对整幅图像进行处理和统计分析,最终用一个向量来描述图像,形成图像的全局表示(Holistic Representation),常用的颜色、形状、纹理特征就属于此类,如颜色直方图、轮廓矩、纹理能量等,这类特征常常被称为 全局特征(global feature);特征提取也可以是局部的,即针对图像中的特定子区域,这些子区域通常通过精心设计的检测算法获取67,也可以简单地进行密集采样(Dense Sampling)或随机采样(Random Sampling)而得到68,每个子区域均用一个相同维度的向量来描述,即局部特征(local features)。2、 图像局部特征及性质 图像局部特征是指图像中某个微小区域所表现出的区别于其邻域的信号模式。图像局部特征提取包含特征检测(Feature Detection)和特征描述(Feature Description)两个步骤。相应的算法习惯上称为检测算子(Detector,简称检测子)和描述算子(Descriptor,简称描述子)。2、 基于稀疏编码模型的图像稀疏表示方法1、 引言 从“信号重构”的角度对图像局部特征的编码,并在此基础上采用新的局部特征编码集成(融合)方法,形成图像的最终全局表示。这种“重构”是有条件的,即重构系数要满足“稀疏性”约束条件,即:用较少的系数捕获感兴趣目标的重要信息,最终用一个高维稀疏向量来表示图像。稀疏编码(SC)技术可以实现这一思想。稀疏编码模型中的特征编码则是利用视觉词典中较少数量的视觉单词来重构局部特征向量,其数学意义是用稀疏线性组合的基向量(这里是视觉单词)来恢复原始信号(这里是局部特征向量),换句话说,原始信号可分解为少数基向量的线性组合。2、 稀疏编码的基本概念和关键技术稀疏编码的概念最初来源于科学家们对视觉神经网络的研究。该研究表明,视觉皮层处理外界刺激的过程采用了 神经稀疏表示 的原则,即:视觉皮层在处理外界刺激时,只有相当少的一部分视觉神经元处于被激活的状态,而与此同时大量的视觉神经元处于未被激活的状态。稀疏编码使得一个目标向量可以由少量的基向量来线性逼近,要实现信号(或图像)的稀疏表示,就要求基向量之间不仅具有完备性,而且还应具备一定程度的冗余性,形成所谓的“超完备基”,这可以通过使基向量个数远大于基向量维数(即在构造B时使Kd )来达到。2.1 基本概念 B中的列向量成为原子,B称为字典(或词典),由于B的行数小于列数,B是超完备字典(词典),或称之为冗余字典(或词典)。该方程组是欠定的,即方程个数少于未知数个数,通常解向量s 有无穷多个,构成了一个解空间。而稀疏编码的目标是要在该解空间汇总寻找一个最稀疏解,即:要使得系数向量s中的非零元素个数最少。如果用 表示向量 中所含非零元素的个数(这里, 就是所谓的 L0-范数 ),上述稀疏表示问题的数学描述为如下优化问题: (1)实际中,通常更多的是进行稀疏逼近,即允许稀疏表示有一定的重构误差,也就有如下的形势: (2)稀疏编码一般分为两个过程:(1)词典构造。通过无监督学习方法学习得到一组冗余的基向量,构成超完备词典。该过程为“词典学习”(2)稀疏分解。将目标向量在词典所长成的空间分解,求得分解稀疏,在保证重构精度的前提下,尽量提高系数向量的稀疏性。2.2 SC模型表示图像的关键技术基本流程如下:利用SC模型表示图像,获得图像的全局稀疏向量表示形式,基本步骤包括:(1) 图像局部特征提取;利用局部特征提取算法,从图像中提取局部特征。(2) 视觉词典学习。包括稀疏分解和词典更新两个过程。(3) 局部特征稀疏编码。(4) 局部特征编码集成(融合)。基于稀疏编码模型表示图像的问题可以表示成下面的优化问题: 其中,表示重构误差, 是稀疏性的惩罚函数,一般取 L0-范数或 L1-范数,即 =(表示非零元素的个数)或=(表示非零元素的绝对和), 为正则化参数,用于权衡重构误差项和稀疏约束项2.3 二维Gabor函数为了更精确分析神经元的功能,需要建立刻画其响应特性的可计算模型即感受野函数。工程上可将感受野函数看作神经元的脉冲响应函数,将二维Gabor函数作为简单细胞的感受野函数,刻画其响应特性。作为原子的产生函数,二维Gabor具有七个自由参数,其模型如下所示其中,为归一化常数,使Gabor原子具有单位范数。参数表示图像中像素点的位置;确定原子的中心位置;标准差决定了原子支撑区域的大小,类似于神经元的感受野。变换参数,可以使原子匹配图像中不同空间尺度的结构。参数确定了高斯因子的离心率,从而决定了原子支撑区域的宽度与长度的比率(纵横比),也称参数为纵横比因子为了匹配边缘轮廓结构,要求0,那么该测试图像就属于正样本,否则为负样本。1.2 模型实现首先用交替迭代更新法进行特征提取,该方法分为两步:通过固定基矩阵求解系数和通过固定系数求解基矩阵,具体可以采用特征符号搜索算法和拉格朗日对偶法分别求解。然后进行无监督特征学习,该学习是对训练样本进行的,具体步骤为:(1)预处理(2)获取样本向量(3)训练基向量(4)训练系数接着进行有监督分离器训练。以线性SPM作为SVM的核函数进行分类器训练,具体步骤为(1)特征标记。对系数矩阵S进行类别标记,以区分样本类别(2)线性SPM。对系数矩阵S和对应位置G进行线性SPM计算获得Z。(3)将Z输入到简单线性SVM中,训练得到分类器classifier。最后是识别过程,利用上面得到的分类器对测试样本进行分类。参考文献:基于稀疏编码的脑脊液图像快速识别模型黄文明,蔡文正,邓珍蓉方法2:鲁棒协作表示(RCR )RCR寻求稀疏编码问题的最大似然估计解;然后,利用迭代重加权协作表示算法来解决RCR模型;最后,对测试图像进行分类和识别。与其他算法比,大幅降低计算复杂度的同时保证了识别率。RCR是一种有效的人脸识别算法,对遮挡的人脸识别具有很强的鲁棒性。 为了用训练样本集D 协作表示测试样本y,使用规则化的最小二乘方法,即有 其中:是规则化参数。L2范数规则化项具有二重性,首先它使最小二乘解稳定,特别是当矩阵D欠定时;然后,它使编码系数向量具有一定的稀疏性,但是稀疏性要比L1规则化弱。可以得到上式的解: RCR算法步骤如下:参考文献:一种鲁棒协作表示的人脸识别算法,林国军,解梅图像去噪1、基于多项式拟合的稀疏编码图像去噪算法基于多项式拟合的稀疏编码图像去噪算法,该方法采用多项式来拟合稀疏系数的概率密度函数,进而估计稀疏系数的收缩函数,有效地解决了传统的去噪变量的概率密度模型无法反映图像数据特点的问题。仿真计算结果验证了该算法的有效性,并且在效果上要明显优于最大似然估计算法 稀疏码收缩的算法去噪方法如下:(1)从大量无噪声的图像中用独立分量分析的方法获得基向量 A,进而获得图像的稀疏变换s=Wx 式中:WA 的伪逆。(2)对有噪声的图像进行稀疏变换得到带噪的稀疏系数假设稀疏系数 s 为拉普拉斯分布,即。采用最大似然估计,根据高斯噪声的方差对 进行收缩(3) 对稀疏系数进行逆变换,得到去噪后的图像 =A 该方法假设噪声经过预处理和稀疏变换后为均值和方差均不变的高斯分布。该假设是不精确的。修正方法为:(1) 先对稀疏系数s的概率密度的倒数进行多项式拟合。(2) 根据ICA的方法得到基向量A和稀疏变换矩阵W。然后对有噪声的图像进行稀疏变换得到带噪的稀疏系数。(3) 推出带噪系数处理的收缩函数。(4) 对收缩后的系数逆变换得去噪后的图像。参考文献:基于多项式拟合的稀疏编码图像去噪算法研究,孙海英,王晓凯,李锋 英文文献综述 1、Facial Expression Recognition via Non-Negative Least-Squares Sparse Coding 稀疏编码是在信号处理,计算机视觉和模式识别的一个活跃的研究课题。本文通过使用非负最小二乘法(NNLS)稀疏编码的新方法对面部表情进行识别,提出了研究。该NNLS稀疏编码被用于形成一个面部表情分类器。为了验证该方法的性能,局部二值模式(LBP)和原始像素进行提取人脸特征的代表性。面部表情识别实验是在日本女性表情(JAFFE)数据库中进行的。本文与其他广泛使用的方法进行了比较,如线性支持向量机(SVM),稀疏表示,基于分类器(SRC),最近的子空间分类器(NSC),K近邻(KNN)和径向基函数神经网络(RBFNN)。2、 Group sparse reconstruction for image segmentation 图像分割是计算机和图像分析的基本问题。特别是医疗图像的分割可以帮助医生做出决定。由于缺少描述器官边界的明显特征并将特征与功能匹配,医疗图像分割很难高精度实现。在本文中,提出一个一级分类器,这个分类器用来匹配决定像素是否是边界的功能。这种方法包括两步。首先,在训练阶段运用梯度特点和统计信息建立一个特征矢量空间。然后,为了保持相邻像素的一致性,相邻图像的编码使用相同的字典。3、 Image classification by non-negative sparse coding, correlation constrained low-rank and sparse decomposition 本文通过利用非负稀疏编码提出了一种图像分类框架,以及相关受限的低等级和稀疏矩阵分解技术。首先,我们提出了一个新的非负稀疏编码以及最大池和空间金字塔匹配方法(SC+ SPM) 提取局部特征的信息,以便表示图像,其中非负稀疏编码是用于编码的局部特征。伴随着空间金字塔匹配的最大池用来得到图像特征矢量。其次,本文充分利用有限的相关性低秩和稀疏矩阵恢复技术来分解图象的特征向量。以加入通用和特定的属性到图像表示,本文仍然采用稀疏编码来的想法重新编码的各个图像的SC+ SPM表示。4、 Low-rank decomposition and Laplacian group sparse coding for image classification 本文提出了一种新的图像分类框架(简称LR-LGSC)通过利用低秩矩阵分解和拉普拉斯组稀疏编码.首先,通过观察从邻近的补丁图像中提取的局部特征(如SIFT)通常含有相关(或共同)项目和具体的(或嘈杂)项目的激励,构建基于当地功能的结构化字典。本低秩和稀疏成分字典有更强大的表示能力。然后,们调查组生成的组稀疏编码和介绍拉普拉斯算子约束考虑到的相互关系组之间,从而可以保持低重建的错误,同时促使类似的样品有类似编码.最后,线性支持向量机分类器是用于分类。5、 Random combination for information extraction in compressed sensing and sparse representation-based pattern recognition 在基于模式识别的压缩感知和稀疏表示中,用密集随机转换矩阵随机投影被广泛用于信息提取。本文考虑了随机投影方法.首先,本文提出了一个简单随机法,随机组合,信息提取,解决了密集的问题随机方法.理论分析和实验结果表明,它可提供性能堪比那些密集随机方法。第二,本文分析另一个简单随机方法,随机选择,并给出其适用场合。比较分析和实验结果表明,它的工作原理以及在密集的情况更好,但是在稀疏情况下更差.第三,本文建议变换矩阵,用于测量基于模式识别的稀疏表示的有效性。6、 Robust Pedestrian Tracking and Recognition from FLIR Video:A Unified Approach via Sparse Coding 稀疏编码是已经成功应用到新兴的方法强大的目标跟踪和识别的视觉文献。在本文中,我们提出探索稀疏编码为基础的方法对联合目标跟踪,以及识别和探索的前视红外(FLIR)视频支持分析其潜在的 夜间的机器视觉系统。这项工作的一个重要的技术贡献是统一现有在相同的稀疏编码为基础的方法对跟踪和识别框架内,以使它们可以彼此在一个闭环中受益。一方面,通过时间帧跟踪同一个对象可以让我们实现更高的识别通过模板/词典的动态更新,并结合多种性能识别结果;另一方面,识别各个对象的方便多个对象(即,行走的行人)的跟踪,特别是在存在在一个拥挤的环境闭塞。7、Sparse Spatial Coding: A Novel Approach to Visual Recognition 成功的基于图像的对象识别技术已建成建立在强大的技术如稀疏表示,以代替流行的载体量化的方法。然而,一个严重的缺点疏基于空间的方法是局部特征十分相似的可以量化成截然不同的视觉词。解决这个问题的新方法用于目标识别,所谓稀疏的空间编码,它有效地结合了稀疏编码字典学习和空间约束的编码阶段。该方法实现了高精确度。8、Two-Step Sparse Coding for the Pan-Sharpening ofRemot

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论