




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于隐马尔科夫的人脸识别1人脸检测及常用算法 人脸检测,指的是从输入的图像(或者视频)中确定人脸的位置、大小和姿态的过程,是进行人脸识别的基础,也是实现人脸识别功能的一个关键环节。人脸检测是一种计算机视觉中的模式识别问题,就是将所有的人脸作为一个模式,而非人脸作为另一种模式,人脸检测的核心问题就是将人脸模式和非人脸模式区别开来。人脸检测的算法主要分为两大类,基于先验知识的和基于后验知识的学习和训练的算法。常见人脸检测的算法有:基于特征子脸人脸检测算法:该算法将所有人脸的集合视作一个人脸子空间,通过检测样本与子空间之间的投影距离检测样本中是否存在人脸;基于模板匹配的人脸检测算法:该算法先设计一个代表标准人脸的模板,将进行检测的样本与标准模板进行比对,通过考察样本与标准模板的匹配程度,设置合理的阈值来检测样本中是否存在人脸;神经网络人脸检测算法:该算法是一种学习算法,用于学习的训练集分为属于人脸图像的训练集和非人脸图像的训练集两类,通过学习从而产生分类器进行人脸检测;基于纹理模型的算法,对于人脸图像的灰度共生矩阵进行计算可以获得倒数分差、惯量相关特征这三个特征矩阵,然后通过迭代计算求得人脸图像矩阵中的参数。使用这种方法取得的模型就被称为人脸纹理模型。若人脸姿态有旋转,通过对眼睛进行定位可以计算出人脸的旋转角度或者使用投影直方图FFT 变换等方法确定人脸旋转的方向,再进行人脸检测。1.1Haar特征Harr 特征是一种矩形特征,在特征提取时由四类特征组成特征模板边缘特征、圆心环绕特征、线性特征和特定方向的特征。特征模板包括白色矩形和黑色矩形两种。白色矩形内像素和(Sum白)减去黑色矩形像素和(Sum 黑)就是模板的特征值。Haar 特征反映的是图像中相邻矩形区域的灰度变化。Haar特征的每一个特征值feature可以表示为:其中表示矩形的权重,表示矩形所包围图像的灰度值之和。Paul Viola 和Michacl Joncs 提出积分图算法提高图像举行特征的计算速度。对于对象中的任意一点,其灰度值为,积分图,经过对图片的一次遍历,就可以得到图像中每一个点的积分图的值。 假设需要计算矩形 D 的特征,其顶点为点 1、2、3、4。这样,矩形 D 的特征为。1.2AdaBoost AdaBoost(the Adaptive Boosting Algorithm)算法是一种用于分类器训练的算法该分类器算法,是一种基于统计模型的迭代算法。核心思想在于将一系列弱分类(Basic Classifier)器通过一定的方式进行叠加(Boost)后形成一个分类能力很强的强分类器(Strong Classifier)。首先,获得用于训练的样本库,样本库需包含正负样本。就人脸识别而言,即需获得人脸图片与非人脸图片,选择人脸图片时需考虑样本的多样性,选择非人脸图片时需要考虑样本是否具有代表性。在选取了合适的样本集合后对其进行循环处理,每次循环处理后可以得到一个假设。接下来对这个假设进行验证,得到使用该假设进行分类的错误率。在开始下一轮循环之前依据该错误率调整每个样本所占的权重。在实际训练过程中,第一次使所有样本的权重相同进行训练,从而得到一个弱分类器。然后使用这个得到的弱分类器进行人脸图片与非人脸图片的分类,得到分类结果。依据结果降低可正确分类的样本的权重,提高被错误分类的样本所占的权重再进行训练,从而得到一个新的分类器,之后重复上述步骤进行循环训练。这样,经过 T 次循环训练之后,就得到了T 个弱分类器,将这 T 个弱分类器经过加权叠加,就得到了强分类器,理论上将,无穷多个大于50%的弱分类器的联合,其分辨正确率可以达到100%。1.3分类器最初的弱分类器可能只是一个最基本的Haar-like特征,计算输入图像的Haar-like特征值,和最初的弱分类器的特征值比较,以此来判断输入图像是不是人脸。比较输入图片的特征值和弱分类器中特征,一定需要一个阈值,当输入图片的特征值大于该阈值时才判定其为人脸。训练最优弱分类器的过程实际上就是在寻找合适的分类器阈值,使该分类器对所有样本的判读误差最低。具体操作过程:1、对于每个特征 f,计算所有训练样本的特征值,并将其排序。2、扫描一遍排好序的特征值,对排好序的表中的每个元素,计算下面四个值: 全部人脸样本的权重的和t1; 全部非人脸样本的权重的和t0; 在此元素之前的人脸样本的权重的和s1; 在此元素之前的非人脸样本的权重的和s03、求出每个元素的分类误差,在表中寻找r值最小的元素,则该元素作为最优阈值。有了该阈值,就生成一个最优弱分类器。强分类器的诞生需要T轮的迭代,具体操作如下:1、 归一化权重:2、对每一个特征f,训练一个弱分类器h,计算此f特征的加权错误率:3、选取具有最小错误率 的弱分类器h4、调整权重,其中表示x被正确分类,表示被错误分类,5、 级联成强分类器,其中将多个训练出来的强分类器按照一定的规则串联起来,形成最终正确率很高的级联分类器。对于人脸需要进行多尺度检测,通常是不断初始化搜索窗口size为训练时的图片大小,不断扩大搜索窗口,进行搜索。级联分类器在进行串联时的原则是“先重后轻”,即将重要特征构成的结构比较简单的分类器放在前面,而后一级的分类器都比前一级使用更为复杂的矩形特征,由于靠前的分类器用于判断的特征相对简单,例如只有一两个矩形框,这种分类器并不能满足人脸检测的需求,但是能够迅速筛选掉大量不是人脸的子窗口。这样,虽然后续分类器的矩形特征在增多,但是由于需要进行后续检测的子窗口的数量大为减少,整体计算量在减少,极大地提升了人脸检测的速度,并且保证了最后的得到的人脸检测结果伪正(false positive)的可能性非常低。2人脸识别算法人脸识别是对对某张特定人脸图片进行身份确认,关键在于在人脸共性特征中寻找不同人物的个性特征并以有效的算法(计算机可以理解并加以运算)进行描述和区分。常用的识别算法有:1、 基于几何特征的识别算法1966 年,Bledsoe就提出了基于几何特征的人脸识别算法,选取的几何特征是人脸面部特征点之间的距离和比例。2、 基于 PCA 的识别算法输入的人脸图像描述为“特征脸”的线性组合,不同的人脸特性用构成该种线性组合的系数来进行描述,其关键技术是PCA3、 基于隐马尔可夫模型的识别算法以二维离散余弦变换特征提取获得观察向量,构建起人脸的 EHMM 模型。之后,利用 EM(Expectation Maximization)算法(B-W算法)进行训练,训练后得到每个人对应的 EHMM 模型。这样在识别阶段就可以计算得到人脸图片观察向量属于每个人物 EHMM 模型的概率,用于该概率进行比较,选择概率大者为匹配结果,从而完成识别工作。其他的还有基于神经网络的识别算法、基于支持向量机识别算法、三维人脸识别算法等等。几种主流识别算法比较:算法名称特点基于几何特征的算法特征简单,但是不易提取到稳定的特征,识别率不高,鲁棒性不高特征脸算法(PCA)简单有效,是人脸识别的基准算法,但是识别率不高,对于表情和姿态的鲁棒性不强,计算时间随着样本数量增多呈指数增加,新样本扩容时需要对多有的样本进行重新训练。隐马尔科夫模型(HMM)识别率高、对人脸姿态、表情变化鲁棒性强,对于人脸库扩容适应性好,实现比较复杂神经网络(NN)不需要复杂的特征提取,可使用硬件进行加速,但是神经元的数量多,运算时间长,需要较多的人脸进行训练,训练过程需要认为控制支持向量机(SVM)在小样本空间识别率较好,但是识别过程中需要对核心函数参数进行调整。奇异值分解(SVD)特征稳定性好,具有选择、位移等不变性质,但是识别率不高。三维人脸识别算法识别率高,人脸三维模型的构造和存储开销大、需要借助专业设备进行三维建模。3隐马尔可夫(HMM)数学模型马尔可夫模型可视为随机有限状态自动机。HMM是建立的马尔科夫模型基础上,由两个随机过程构成,一个是具有状态转移的马尔科夫链,另一个是描述观察值和状态之间关系的随机过程。HMM构成:1、 N:HMM中马尔科夫链的状态数。假设S是状态的集合,该模型在t时刻的状态为。2、 :初始状态矢量,3、 A:状态转移概率,4、 M:状态可能对应观察值的数目,可能的观察值为,t时刻的观察值为5、 B:观察值概率矩阵,其中HMM的三个基本问题是:1.给定模型(五元组),求某个观察序列O的概率。2.给定模型和观察序列O,求可能性最大的隐藏状态序列。3.对于给定的观察序列O,调整HMM的参数,使观察序列出现的概率最大。3.1向前算法解决1 ,但其时间复杂度达到指数级别,太慢了,用动态规划的思想解决向前算法:定义向前变量:1、 初始化先前变量:2、 再将向前变量进行递归运算,其中: 3、 结束: 向后算法类似于向前算法(向后变量为:)3.2Viterbi 算法解决2将定义为时刻t沿一条路径,并且,产生出的最大概率值:最优状态序列进行求解过程如下:1、 对进行初始化: ,2、进行递归运算:3、 结束 4、最优状态序列:3.3EM算法 EM算法是 Dempster,Laind,Rubin 于1977年提出的求参数极大似然估计的一种方法,它可以从非完整数据集中对参数进行MLE估计。EM算法流程:初始化分布参数重复以下步骤直到收敛:E步骤:根据参数初始值或上一次迭代的模型参数来计算出隐形变量的后验概率,即隐性变量的期望,将其作为隐藏变量的现估计值:M步骤:将似然函数最大化以获得新的参数值 3.4Baum-Welch 解决 HMM问题3 该问题是对于一个观察值序列,如何调整HMM模型的参数,从而使最大。 采用递归的思想,从局部最大递归至全局最大。 定义辅助变量:对于给定的训练序列O,HMM模型,马尔科夫链在t时刻的状态为i,在t+1时刻的状态为j的概率:,其也可表示为:另外一个辅助变量是后验概率,该概率表示的是HMM模型在t时刻的状态为i的概率:两个辅助变量的关系是:如果对于时间轴t上的所有相加,我们可以得到一个总和,它可以被解释为从其他隐藏状态访问Si 的期望,或者如果我们求和时不包括时间轴上的t = T 时刻,那么它可以被解释为从隐藏状态Si 出发的状态转移期望值。相似地,如果对在时间轴t 上求和(从t=1 到t=T-1),那么该和可以被解释为从状态Si 到状态Sj 的状态转移期望值。=expected number of transition from =expected number of transition from 使用Baum-Wclch算法对进行参数估计,从而使得这个概率最大。计算过程如下:1、 计算向前变量,向后变量,两个辅助变量2、 使用下面公式对HMM模型的参数进行估计,得到的新模型为 重复上述过程,直至不再明显增大,就认为收敛,这样对样本HMM训练完成。4人脸的 EHMM 模型 人脸图像是二维的,仅用一维的 HMM 模型对人脸图像进行描述并不精确。为了提高人脸识识别的精确度,Nefian 提出了嵌入式隐马尔可夫模型(Embedded Hiden Markov Model,EHMM)。对于嵌入式隐马尔可夫模型的研究是建立在 HMM 的基础上的。HMM 模型表示的是人脸图片从上到下的结构特点,同样,人脸具有从左到右的稳定结构。可以对人脸图片先进行上到下的划分,得到人脸一维 HMM 模型,称之为主 HMM。在已经划分出的五个状态从水平方向再进行一次划分,可以到的 5 组水平方向的 HMM 状态,这 5 组 HMM 称之为子 HMM。主 HMM 的状态通常情况下被称为超状态(Super State),子状态(State)则是水平方向的子 HMM 的状态。由于子 HMM 是限定在主 HMM 内部进行划分的,所以将这种模型称之为嵌入式隐马尔可夫模型(EHMM)。4.1离散余弦变换 离散余弦变换时一种常用的数据压缩方法。压缩质量接近于信息压缩的最优变换KL。对于一副图像M*N的数字图像,其2D离散余弦变换定义为:式中,为变换结果,也称作DCT系数,定义为:离散余弦变换的特点:频域变化因子,较大时,DCT系数的值很小,而数值较大的主要分布在,v较小的左上角区域,也就是有用信息的集中区域。4.2二维Gabor小波小波函数的实质是:带通滤波器。Gabor滤波器可以看作是一个对方向和尺度敏感的方向性的显微镜,Gabor滤波器函数将在与其震荡垂直的边沿处产生强烈的响应,而边缘对物体的识别是至关重要的,Gabor滤波器函数还能够检测到(即响应)图像中的一些具有相应的方向频率信息的局部的显著特征,从而可以形成亮点图像的局部特征图谱,这些局部特征形成了原始输入图像的一种鲁棒、紧凑的特征表示Gabor小波变换作为唯一能够取得空域和频域联合不确定关系下限的Gabor核函数经常被用作小波基函数,是图像的多尺度表示和分析的有力工具,二维Gabor滤波器的函数形式可以表示为: .方括号中的第一项决定了 Gabor核的震荡部分,刻画图像边缘部分的特性,第二项为补偿直流分量,用以消除和函数响应对图像亮度绝对值变化的依赖,以保证不同亮度值构成的均匀亮度区域的响应接近相同。其中,参数控制着高斯窗口的宽度、震荡部分的波长和方向,参数则决定了窗口的宽度和波长的比例关系。 上式定义的Gabor核函数可以定义出一组滤波器。在进行运算过程中,需要对核函数进行频域下采样,即将离散化: 其中,体现滤波器的方向性,为滤波器的采样频率,v和为尺度参数和方向参数,一般情况下。 脸图像的Gabor特征由人脸图像和Gabor滤波器组卷积得到,令表示人脸图像的灰度分布,那么和Gabor滤波器的卷积可定义为: Gabor卷积过程实际产生由实部和虚部两个分量构成的复数响应,在边缘附近,Gabor变换的实部和虚部会产生振荡,而不是一个平滑的峰值响应,而幅值的变化相对平滑而稳定,人脸识别的Gabor特征通常只是采用Gabor特征的幅值,也就是实部和虚部的模值。 提取到的Gabor特征维数巨大,需要后续的降维处理。(PCA降维)4.3人脸特征向量的提取 使用二维离散余弦变换对人脸图片进行特征提取,对于一副图像,其2D-DCT变换为:, 图像变换为能量集中在低频区域,所以选择低频系数作为观察向量。从而降低里观察向量的维数,从而减少了进行HMM训练时和识别的计算量。 对图片进行特征提取时,并不是对整幅图片进行 2D-DCT 采样,而是对图片使用遍历的算法进行采样,采样时,使用像素值为P(宽度)*L(长度)的采样窗口在图像上从左至右,从上到下进行滑动,相近的采样窗口移动的步长为 X *Y,采样完毕后截取 2D-DCT 变换的低频系数作
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 微免试题及答案
- 王者荣耀辅助试题及答案
- 2025年新版营业执照租赁策划与执行协议
- 2025年合作项目策划与合作方协议范本
- 2025年新能源汽车电池维修协议
- 2025年水利尾款结算与支付协议
- 产教融合视角下的职业教育发展
- 针灸治疗对常见病多发病的临床效果
- 智能化质量控制与精确制造
- 商业空间节假日旅游市场发展研究趋势规划基础知识点归纳
- 2025届广东省华附、省实、深中、广雅四校高考历史押题试卷含解析
- 高速公路养护施工安全管理经验
- NB-T47003.1-2009钢制焊接常压容器(同JB-T4735.1-2009)
- 合同委托协议书范文
- 【万科股权结构和公司治理的关系探究11000字(论文)】
- 2024年江苏省苏州市中考物理真题(原卷版+解析版)
- JB-T 14320-2022 氧气用止回阀
- 供配电技术-供配电二次回路和继电保护
- 电工仪表与测量(第六版)中职技工电工类专业全套教学课件
- 110kV变电站及110kV输电线路运维投标技术方案(第一部分)
- 拆模安全操作规程培训
评论
0/150
提交评论