【应用数学论文】基于LBP和Adaboost的人脸识别算法研究.pdf_第1页
【应用数学论文】基于LBP和Adaboost的人脸识别算法研究.pdf_第2页
【应用数学论文】基于LBP和Adaboost的人脸识别算法研究.pdf_第3页
【应用数学论文】基于LBP和Adaboost的人脸识别算法研究.pdf_第4页
【应用数学论文】基于LBP和Adaboost的人脸识别算法研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

【应用数学论文】基于LBP和Adaboost的人脸识别算法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号 u d c 密级 学位论文 基于l b p 和a d a b o o s t 的人脸识别算法研究 作者姓名 指导教师 申请学位级别 学科专业名称 周士奇 张祥德教授 东北大学理学院 硕士学科类别 理学 应用数学 论文提交日期 2 0 1 0 年7 月论文答辩日期 2 0 1 0 年7 月 学位授予日期 2 1 年7 月答辩委员会主席 毳岳 评阅人 趣议孙靶豫 东北大学 2 0 1 0 年7 月 at h e s i si na p p l i e dm a t h e m a t i c s r e s e a r c ho ff a c e r e c o g n i t i o na l g o r i t h m b a s e do nl b pa n da d a b o o s t b yz h o us h i q i s u p e r v i s o r p r o f e s s o rz h a n gx i a n g d e n o r t h e a s t e r nu n i v e r s i t y j u l y2 0 1 0 独创性声明 本人声明 所呈交的学位论文是在导师的指导下完成的 论文中 取得的研究成果除加以标注和致谢的地方外 不包含其他人己经发表 或撰写过的研究成果 也不包括本人为获得其他学位而使用过的材料 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确 的说明并表示谢意 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留 使用学 位论文的规定 即学校有权保留并向国家有关部门或机构送交论文的 复印件和磁盘 允许论文被查阅和借阅 本人同意东北大学可以将学 位论文的全部或部分内容编入有关数据库进行检索 交流 左纠 十一 l 箬口 矾 名纠 到 乙 者作 史 期 沦位学 日 彳锣入 f 仞0 d 沁 荆剁了 得 两 弘艮 獬 谚 潞瑚 秘 隧阳 肄 师字 r 篓 削 导签 寸 斗 扮 年 湖一茸 知垌 同 一 名h 币 鏖况 厢 一 鹤帅 得 口 睹 和 作 东北大学硕士学位论文摘要 基于l b p 和a d a b o o s t 的人脸识别算法研究 摘要 人脸识别作为一种生物特征识别技术 受到了广泛的关注 成为应用数学 信息技术紧密结合的前沿热点问题 识别算法是人脸识别系统的核心部分 直接影响到系统的性能 结合现代应 用数学技术 本文主要研究了基于局部二进制模式 l o c a lb i n a r yp a t t e r n 简称l b p 和a d a b o o s t 的人脸识别算法 主要内容如下 第一 在应用l b p 算子构造特征的过程中 提出了新的跳跃式分块方式 用 此方法构造的特征能够在信息冗余较低的情况下 反映人脸不同尺度 不同位置 的特征 便于机器学习算法高效地选择最佳特征 第二 在a d a b o o s t 算法的训练过程中提出了快速计算样本方法和计算阈值方 法 提高了a d a b o o s t 算法的训练速度 并提出对样本进行随机排序 提高训练结 果的鲁棒性 第三 针对l b p 算子的一些不足 采用了拓展局部二进制模式 e x t e n d e dl o c a l b i n a r yp a t t e r n 简称e l b p 构造特征 使得到的特征不仅反映纹理变化的大小 而且反映了纹理变化的趋势 并且在训练过程中 应用统计方法构造了e l b p 算 子的统一模式 减小了训练的计算量 本文算法分别在中科院c a s i an i r 近红外人脸数据库 中科院c a s p e a l r 1 可见光人脸数据库上进行了实验 系统的正确识别率分别达到了9 9 o 和9 9 2 关键词 人脸识别 局部二进制模式 a d a b o o s t 算法 e l b p 算子 东北大学硕士学位论文a b s t r a c t r e s e a r c ho f f a c e r e c o g n i t i o na l g o r i t h m b a s e do n l b pa n da d a b o o s t a b s t r a c t a so n eo fb i o m e t r i c s f a c er e c o g n i t i o nh a sg o t t e nm u c hi n t e r e s ta n db e c o m ea r e s e a r c hf o c u si na p p l i e dm a t h e m a t i c sa n di n f o r m a t i o nt e c h n o l o g y f a c er e c o g n i t i o na l g o r i t h mi st h ec r i t i c a lp a r to ff a c er e c o g n i t i o ns y s t e m a n di tc a l l d i r e c t l ya f f e c tt h ep e r f o r m a n c eo ft h es y s t e m i nt h i sp a p e rf a c er e c o g n i t i o na l g o r i t h m b a s e do nl o c a lb i n a r yp a t t e r n l b p a n da d a b o o s ti sr e s e a r c h e dw i t hm o d e ma p p l i e d m a t h e m a t i c s t h em a i nc o n t r i b u t i o no ft h i sp a p e ri sa sf o l l o w i n g f i r s t an e ww a yo fj u m p i n gb l o c ko fl b pi sp r o p o s e dt of o r mf e a t u r e s f a c e c h a r a c t e r i s t i c so fd i f f e r e n tr e g i o n sa n ds i z ea r er e f l e c t e da tt h es a m et i m eb yt h ef e a t u r e s a n dt h ei n f o r m a t i o nh a sr e l a t i v e l yl o w e rr e p e a t a b i l i t y w h i c hc a nm a k et h em a c h i n e l e a r n i n ga l g o r i t h ms e l e c tt h eb e s tf e a t u r e sm o r ee a s i l ya n de f f i c i e n t l y s e c o n d af a s tm e t h o dt om a k et r a i n i n gs a m p l e sa n dc a l c u l a t et h r e s h o l di sd e s i g n e d t og r e a t l yi m p r o v et h es p e e do ft r a i n i n g r a n d o ms o r to ft h et r a i n i n gs a m p l e si s p r o p o s e dt oi m p r o v et h er o b u s t n e s so f t h et r a i n i n gr e s u l t t h i r d t h el o c a lb i n a r yp a t t e mi se x t e n d e d e l b p t om a k eu ps o m ed e f i c i e n c yo f l b ee l b pc a nn o to n l yr e f l e c tt h et r e n do ft e x t u r ed i f f e r e n c el i k el b p b u ta l s oc a l l r e f l e c tt h ep r e c i s ev a r i a t i o no fg r a y u n i f o r mp a t t e mf o re l b pi sp r o p o s e dt h r o u g hal o t o fs t a t i s t i c s a n dt h i sc a ng r e a t l yr e d u c et h ec o m p u t a t i o n l a s t t h ea l g o r i t h md e s i g n e di nt h i sp a p e ri st e s t e do nc a s i a n i rn e a ri n f r a r e da n d c a s p e a l r 1v i s i b l el i g h t i n gf a c ed a t a b a s e t h es y s t e mr e c o g n i t i o nr a t er e a c h e d 9 9 o a n d9 9 2 s e p a r a t e l y k e yw o r d s f a c er e c o g n i t i o n l o c a lb i n a r yp a t t e r n a d a b o o s t e l b p i i l 东北大学硕士学位论文 目录 目录 独创性声明 i 摘要 l i a b s t r a c t i i i 第1 章绪论 1 1 1 人脸识别研究的背景和意义 l 1 2 人脸识别方法概述 一2 1 2 1 人脸识别研究现状 2 1 2 2 人脸识别的主要方法和分析 2 1 3 本文主要内容及安排 5 第2 章l b p 算子 7 2 1l b p 算子 7 2 1 1 纹理概述 7 2 1 2l b p 算子 7 2 2l b p 算子的统计测定 9 2 3l b p 算子的优点 11 2 4 本章小结 1 2 第3 章a d a b o o s t 算法 一1 3 3 1a d a b o o s t 算法 1 3 3 1 1a d a b o o s t 算法 1 3 3 1 2 训练误差分析 1 4 3 2 改进a d a b o o s t 算法 1 4 3 3 级联分类器 15 3 4 本章小结 1 9 第4 章l b p 和a d a b o o s t 结合的人脸识别算法 2 1 4 1 人脸识别问题转化 2 l 东北大学硕士学位论文目录 4 2 特征构造 2 2 4 2 1 人脸归一化 2 2 4 2 2 图象编码 2 4 4 2 3 图像分块 2 5 4 2 4 直方图相交 2 9 4 3a d a b o o s t 的训练过程 31 4 3 1 弱分类器的学习过程 31 4 3 2 强分类器的训练 3 3 4 3 3 训练级联分类器 3 5 4 3 4 识别过程 3 7 4 4 实验结果分析 3 8 4 4 1 训练数据和结果 3 8 4 4 2 测试结果 4 l 4 4 3 错误结果分析 4 5 4 4 4 人脸识别系统 4 7 4 5 本章小结 4 8 第5 章e l b p 算子 4 9 5 1l b p 算子应用于人脸识别的不足 一4 9 5 2e l b p 算子 4 9 5 3 对比实验结果 一5 2 5 4 本章小结 5 3 第6 章总结和展望 5 5 6 1 本文工作总结 5 5 6 2 未来工作展望 一5 5 参考文献 5 7 致谢 6 3 东北大学硕 学位论文 第1 章绪论 第1 章绪论 1 1 人脸识别研究的背景和意义 身份鉴定是人类社会日常生活中的基本活动之一 人们几乎每时每刻都需要 证明自己的身份 与此同时 随着计算机和网络技术的发展 网上银行 电子商 务 自动门禁系统等越来越普及 这就对身份认证的准确性 安全性和实用性等 提出了更高的要求 传统的身份认证方法主要靠各种认证信息例如 口令 密码 或者各种信物 例如 证件 i c 磁卡 钥匙等 传统的身份验证方法有很多显而 易见的缺点 例如 认证信息容易遗忘 随着计算机计算速度的加快 这些信息 也越来越容易被破解 信物容易丢失 损坏或者被盗 传统方法一个致命弱点就 是非常容易被人盗用 即它不能真正的区分真正的拥有者和冒充者 生物识别技 术由此应运而生 人脸识别技术作为生物特征识别技术中的一种 与其它生物特征识别方法相 比具有以下几种优点 1 符合用户习惯 非常容易被大多数人接受 交互性比较强 2 信息采 集方便 对目标进行非接触式的采集 客户能够接受 不会造成生理上的伤害 3 应用推广方便 现在各个公共场合 例如车站 机场 建筑物的大厅等等监控设 备已经比较普及 人脸识别算法可以应用在这些设备上 进行更加智能的监控 4 可以进行隐蔽操作 可以在必要时进行隐性操作查找目标人物 例如查找罪犯等 当前人脸识别技术可以应用到以下几个方面 1 身份验证 在机场 海关等部门都需要对人的身份进行验证 人脸识别 系统可以做到自动化 2 门禁系统 公司门口或者小区入口等地使用人脸识别 系统取代传统的打卡的方 3 保护电脑上重要信息 利用人脸识别技术限定电脑 登录人员或者限定重要信息的查看权限 4 刑侦破案 公安部门在系统中存储 犯罪嫌疑人的档案照片 搜查罪犯时可以利用系统快速对比 排除 查找犯罪人 员或者找出相应的犯罪记录 提高了工作效率 5 视频监控 在银行或者一些 机密部门需要不问断的监控 当有陌生人闯入或者异常情况时 需要系统自动报 警并对人脸信息自动采样保存 以供将来的查询 东北大学硕士学位论文 第l 章绪论 1 2 人脸识别方法概述 1 2 1 人脸识别研究现状 人脸识别的研究历史比较悠久 g a l t o n l lj 最早在1 8 8 8 年在 n a t u r e 杂志上对 人类自身的人脸识别能力进行了分析 但是真正的从工程应用的角度来研究它则 开始于2 0 世纪6 0 年代 到今天为止人脸识别技术已经有了几十年的历史 在此 阶段 新技术也是不断涌现 按照时间划分人脸识别大致经历了以下三个阶段 第一阶段 这一阶段是以 b l e d s o e f 2 j 的工作为开端的 但是他提出的方法需要人的操作 而后k e l l y 3 j 在 b l e d s o e 的框架之上做了改进提出了最近邻分类法 这一阶段的特点就是识别过程 要依赖于操作人员的参与 系统只是半自动系统 第二阶段是采用人机交互的方 式进行识别 代表性的是k a n a d 4 创造性的运用积分投影方法从单幅图像上计算出 一组脸部特征参数 再利用模式分类计数与标准人脸匹配 此外还有g o l d s t i o n 等 人 5 1 用集合特征参数来表示人脸正面图像 并引用此特征进行人脸识别 k a y a 和 k o b a y a s h i l 6 1 则是利用欧氏距离来表示入脸特征 并采用了统计识别的方法 第三 阶段是真正的机器识别阶段 2 0 实际9 0 年代以来随着计算机计算性能的不断提升 人脸识别方法也有了比较大的突破 目前国外 国内有许多科研机构院所设立了专门的研究小组从事人脸识别的 理论研究 国外著名的人脸识别研究机构包括美国卡耐基梅隆大学 c m u 的机 器人研究所 麻省理工学院媒体实验室 m i tm e d i al a b 和人工智能实验室 a i l a b 芬兰的赫尔辛基大学c i s 研究所 法国的i n r i a 研究所 马里兰大学 1 肘d 等 9 0 年代中后期以来国内的许多科研机构以及院校等也开始了人脸识别的研究 其中主要包括中科院自动化所 计算机所 上海交通大学图像处理与模式识别研 究所 清华大学 北京大学 哈尔滨工业大学 南京理工大学 大连理工大学 中国科技大学等 其中中科院自动化所和计算机所的研究工作处于国内领先水平 1 2 2 人脸识别的主要方法和分析 1 基于几何特征的方法 最早的人脸识别方法就是b l e d s o e l 2 1 提出的基于几何特征的方法 该方法首先 手动定位面部特征点 然后以特征点的距离和比率作为特征 利用最近邻方法来 识别人脸 k a n d a 4 1 b r u n e l l i 和p o g g i 0 1 7 3 利用眼角 鼻子 嘴巴 下巴等面部特征 厶 东北大学硕士学位论文 第1 章绪论 计算其距离 角度以及其它几何关系 最后用这些几何关系来进行人脸识别 基 于几何特征的方法非常直观 而且特征提取不受光照的影响 识别速度快 但是 非常容易受到姿态或者表情的影响 整体上识别率比较低 2 基于子空间分析的方法 子空间分析可以分为线性和非线性子空间分析 它主要是指在一定目标下 寻找一个线性或者非线性的空间变换把原始信号压缩到低维子空间 从而使数据 在空间的分布更为紧凑 并尽量保留原空间的最大信息 这就大大降低了计算的 复杂度 t u r k 8 以k l 变换 k a r h u n e n l o e v et r a n s f o r m 为基础提出主成分分析 p r i n c i p a lc o m p o n e n t a n a l y s i sp c a 把人脸变换到一个由 特征脸 矢量构成的 子空间 再进行分析 f i s h e r 最早在1 9 3 6 年提出了线性判别分析的思想 l i n e a r d i s c r i m i n a n ta n a l y s i sl d a 即寻找一组投影轴线使得线性变换后的样本具有类内 离散度最小 类间离散度最大的性质 b e l h u m e u r 等人1 9 则首先将f i s h e r 线性判别 分析应用到了人脸识别中 为了克服线性判别分析的一些问题 后来c h e n 等人 1 0 提出直接线性判别分析算法 c o m o n 1 1 在1 9 9 4 年提出了独立成份分析 i d e n p e n d e n t c o m p o n e n t a n a l y s i si c a 的概念 基本思想是通过线性变换 利用训练样本寻找 到一组相互独立的投影轴 并以此来描述样本数据 b a r t l e t 等人首次将独立成份 分析应用到人脸识别领域 后来l i u 12 1 z h a n g 13 1 k w a k t l 4 1 又对独立成分分析方 法进行了改进 特征子空间分析的方法实现简单而且识别效果比较好 是人脸识 别领域的重要方法之一 3 基于统计的人脸识别方法 统计学习理论研究的目的是如何从给定的数据集中估计出尽量精确的函数依 赖关系 根据给定的已知的训练样本 估计出系统输入与输出之间的依赖关系 使之能够尽可能准确的预测系统的输出结果 基于统计理论的人脸识别方法主要 有三类 人工神经网络 a r t i f i c i a ln e u r a ln e t w o r k sa n n 1 9 4 3 年心理学家 m c c u l l o c h 和逻辑学家p i t t s 最早建立了神经网络的数学模型 l5 1 把模型的统计特征 隐含于神经网络的结果和参数中 k o h o n e n i l 6 1 贝 1 将人工神经网络应用到入脸识别 中 他采用关联图的m n 记忆系统 该系统允许输入图像含有大量噪声 甚至部 分遮挡 后来l e e 等人 1 刁提出了用于人脸识别的模糊b p 网络 l a w r e n c e 等人 1 8 则把卷积神经网络用于人脸识别 使算法对图像的平移 旋转和变形有一定的鲁 棒性 支持向量机 s u p p o a v e c t o r m a c h i n es v m s v m 是建立在维理论和结构 风险最小化的原理基础之上的 该算法利用样本信息建立分类的超平面 支持向 东北大学硕士学位论文 第l 章绪论 量机的特点是推广性比较好 并且能防止过学习 这是优于人工神经网络的 v i o l a 和j o n e s 1 9 1 利用a d a b o o s t 算法并结合经典的h a a r 特征将其用在人脸检测上并取得 了非常好的效果 a d a b o o s t 是依据训练样本信息得出一个按照加权投票方式决定 输出值的预测函数 l i 2 8 等人把人脸识别这个多类分类问题转化两类问题后结合 l b p 特征将a d a b o o s t 用在了人脸识别领域 4 基于模板匹配的人脸识别方法 基于模板匹配的方法分为固定模板和形变模板两种情况 一般直接计算两幅 图像的相似度 所用模板一种是人脸的整体特征 一种是独立的小模块 例如眼 睛 嘴巴 鼻子 眉毛 下巴等 l a n i t i s 等人1 2 0 通过在人脸特征的边沿选择一些 稀疏的基准点来描述人脸的形状特征 并建立人脸的几何形状模型 y u i l l e 等人 2 l j 则提出了可变形模板技术建立器官模型 借鉴以往的形变模型 c o o t e s 等口2 彩1 人 提出了主动性状模型 a c t i v es h a p em o d e l a s m 该方法快速简单 能快速定位 目标物体的内部和外部形状 但是a s m 方法仅仅是使用了图像的形状信息和局部 的纹理信息 并没有利用到全局的纹理信息 所以不稳定并且很容易收缩到局部 极值 1 9 9 8 年c o o t e s 2 睨5 在a s m 的基础之上做出了比较大的改进 提出了主动 表现模型 a c t i v ea p p e a r a n c em o d e l a a m 不仅利用了目标物体的形状信息 而且包含了内部和整体的纹理信息 a s m 和a a m 一般用于人脸的特征点定位 2 6 1 然后再进行识别 上面所述的方法基本是在可见光图像上使用的人脸识别算法 可见光的图片 有一个显而易见的缺点就是很容易受到光照的影响 a d i n i 等人 2 7 1 对光照变化对人 脸识别算法的影响做了深入分析 得出以下几点 第一 光照条件尤其是光照角 度的变化会剧烈的改变人脸图片的外观 第二 在对人脸图像做预处理之前 同 一个人在不同光照条件下的人脸图像的差别要大于不同人在相同光照条件下的人 脸图像差别 第三 大多数图像处理算子都不能够适应图像中光照方向的变化 即使是像g a b o r 滤波器这样相对来说对光照条件不敏感的滤波器也会受到很大的 影响 中科院l i 等人 2 8 3 0 成功开发了近红外光烈e a ri n f i a r e d 图像的人脸识别算法 与基于可见光的算法相比该算法不受光照的影响 甚至可以在完全黑暗的条件下 进行识别 而且图像采集设备也比较便宜 很容易普及 近几年来还出现了3 d 人脸识别技术 3 1 3 3 1 利用由三维扫描仪获取的三维人脸 信息进行识别 与二维图像人脸识别算法相比较 三维人脸识别不受光照 视图 东北大学硕士学位论文 第1 章绪论 变化 化妆等的影响 三维人脸识别算法主要分为三类 第一类是基于空间域的 直接匹配算法 其中的代表算法是由c h e n 3 4 1 b e s l i 3 5 1 同时提出的迭代最近点算法 i t e r a t i v ec l o s e s tp o i n t i c p 和利用霍夫 h a u s d o r f f 3 6 距离等 第二类是基于 局部特征的匹配 例如n a g a m i n e 3 7 提出的基于脸部曲线匹配的三维人脸识别方法 g o r d o n 3 s 提出的利用曲率特征的三维人脸匹配算法 第三类是基于整体特征的匹 配算法 这一类和二维人脸识别中的子空间算法类似 有p c a i c a 等等 1 3 本文主要内容及安排 本文在前人的基础之上对人脸识别技术展开进一步深入的研究 主要是l b p 算子和a d a b o o s t 机器学习理论结合的人脸识别算法 论文各个章节的内安排如下 第一章是绪论 论述了人脸识别的技术背景及应用前景 人脸识别技术的研 究现状 并介绍了人脸识别的主要算法 第二章介绍了l b p 算子的基础知识和对应用l b p 算子进行编码后的图像进行 统计后的直方图测定方法 并分析了l b p 算子应用于纹理分析的特点 第三章介绍了a d a b o o s t 算法 并分析了其训练误差 然后介绍了a d a b o o s t 的 改进算法和a d a b o o s t 算法的级联策略 第四章详细讨论了l b p 和a d a b o o s t 结合的人脸识别方法 首先详细介绍了利 用l b p 算子构造特征的方法 然后讨论了利用l b p 算子构造的特征进行a d a b o o s t 训练的方法和最后的识别算法 最后介绍了我们在中科院可见光和近红外光人脸 图库上进行算法实验的结果 并对算法结果进行了分析 第五章探讨了l b p 算子在人脸识别应用中的不足 引出了纹理表征能力更强 的e l b p 算子 并通过统计计算给出了对应于e l b p 算子的新的统一模式 最后通 过对比实验验证了新算法 第六章对全文的研究工作进行了总结和展望 东北大学硕士学位论文 第2 章l b p 算子 第2 章l b p 算子 o j a l a 等人 3 9 在1 9 9 9 年最早提出局部二进制模式 l o c a lb i n a r yp a t e m l b p l b p 算子能够有效地描述图像的纹理特征 在近1 0 年中l b p 算子已经广 泛应用于纹理分类 4 0 4 2 1 图像检索 4 3 1 运动分析 删等领域 后来a h o n e n 等人 4 5 舶 开始将l b p 算子用于人脸识别 本章将对l b p 算子及其发展应用做简单的介绍 2 1l b p 算子 2 1 1 纹理概述 纹理是图像分析中一个常用的概念 它是由于物体表面物理属性不同所引起 的能够表示某个特定表面特征的灰度或者颜色信息 一般来说可以认为纹理是由 许多相互接近的 互相联系的元素构成 所以直观来说纹理描述可以提供图像区 域的平滑 稀疏 周期性等特性 4 7 构成纹理特征的有两个元素 一是纹理基元 另一个是纹理基元的排列组合 纹理基元是一种或者多种图像基元的组合 纹理基元有一定的形状和大小 纹理 基元的排列组合就是反映基元排列的疏密 周期性和方向性的不同 这些不同使 图像的外观产生极大地改变 2 1 2l b p 算子 图2 1 不同纹理的图像 f i g2 1i m a g e so f d i f f e r e n tt e x t u r e 局部二进制模式 l b p 是灰度范围内的纹理描述方式 最初的l b p 算子定 义在3 3 的窗口 以窗口中心像素点为阈值 将相邻的8 个像素的灰度值与其进 行比较 若是周围像素大于或者等于中心点的值 则该像素位置标记为1 否则标 记为0 这样3 3 的邻域内的8 个点可产生一个8 b i t 的无符号数 然后把这个8 b i t 的无符号数看成一个二进制的数 再计算它的十进制的值 即为中心像素的l b p 编码值 如图2 2 所示 东北大学硕士学位论文第2 章l b p 算子 1 8 0 1 7 6 1 6 8 1 7 9 1 7 5 1 7 0 1 6 91 7 4 1 7 0 原始像素值 r 二二 二一二二二二二一 l10 l 0 剖c 如1 1 0 0 0 0 c 2 黼 1 9 3 1 0 黼j 0 o 0 和中心像素比较后的值中心像素编码结果 图2 2 基本的l b p 算子 f i g2 2b a s i cl b pf i l t e r 图2 3 人脸图像发其l b p 编码倒 f i g2 3f a c ei m a g ea n di m a g ef i l t e r e db yl b pf i l t e r 基本的l b p 算子的最大缺陷在于它只覆盖了一个固定半径范围内的小区域 这显然不能满足不同尺寸纹理的需要 后来o j a l a 等人 4 8 对l b p 算子进行了改进 将3 3 的邻域扩展到任意邻域 即矩阵的大小是可变的 并且点的个数也是可以 改变的 拓展后的l b p 算子用l b p 尸 来表示 l b p p 是指在半径为r 的邻域内使 用p 个相邻子块来进行比较得到的l b p 特征 例如l b p 4 是指仅仅使用与中心块 距离为1 的4 个临近子块来比较 l bp 指的是与中心距离为2 的1 6 个子块来比 较 原始的就是l b p 8 如图2 4 所示 8 1 1 6 2 8 2 图2 43 种l b p 算子 f i g2 4t h r e el b pf i l t e r s 东北大学硕士学位论文 第2 章l b p 算子 图2 l b p s 3 插值 f i g2 5i n t e r p o l a t i o no f 三职3f i l t e r 如图2 5 利用l b p s 编码方式进行编码的时候 l 2 3 4 5 6 7 8 位置 点的值 可以用相应点的灰度值 也可以用其相邻几个像素的平均值 当所取的 点不在像素位置的时候 如图2 4 所示的l b p s 可以用双线性插值等方式计算相应 点的值 图2 6 分别是用l b p s 1 l b p s l b p s 3 几种l b p 编码方式编码后的图像 三蕊网凤园离斟崮 图2 6 人脸图像及其3 种l b p 编码图 f i g2 6f a c ei m a g ea n di t s3k i n d so fl b pi m a g e s 从图2 6 可以看出l b p 算子半径越小越能反映图像的纹理细节 半径越大越 能反映纹理的整体情况 因此对于图像的纹理分析来说要根据实际情况选择合适 的l b p 编码方式 2 2i b p 算子的统计测定 对图像进行l b p 编码后得到的仍然是一张图片 在这个过程中所改变附只是 图像各个像素的灰度值 在利用l b p 进行纹理分析的应用中 一般都不直接将l b p 图像作为特征向量用于纹理分析 而是采用l b p 图像的统计直方图作为特征向量 用于纹理分析 即取两个样本l b p 图像相同位置的一块或者整个l b p 图像 并统 计其灰度值的直方图 然后把两个直方图作为特征向量用于分类识别 目前常用的几种直方图间距离的计算方法f 4 9 有 1 c h i 平方统计法 c h is q u a r es t a t i s t i c 东北大学硕士学位论文 第2 章l b p 算子 以洲 莩等等 2 直方图相交距离 h i s t o g r a mi n t e r s e c t i o n d s m m i n s m 3 对数似然统计法 l o g l i k e l i h o o ds t a t i s t i c l s m 一 sl o g m 在式子2 1 2 2 2 3 中s m 分别代表相应的直方图 盲方图的第i 个数的佰 2 1 2 3 2 3 s m 分别代表相应 今 方图比较 严铲 l t 图2 7l b p 算子统计测定 f i g2 7t h es t a t i s t i c a lc o m p a r i s o no fl b p 对图像进行l b p 编码后可以得到2 8 2 5 6 种模式 这样每个直方图就有2 5 6 个数据 当直方图的个数非常多的时候计算量会非常大 为了解决二进制模式过 多的问题 减少计算量提高整个系统的速度 o j a l a 5 0 对各类图像进行统计后发现 有5 8 种模式所占比例超过9 0 也就是统一模式 u n i f o r mp a t t e r n 我们对9 0 2 8 张人脸图片进行统计后 统计结果显示在人脸l b p 编码图像中也符合此项规律 其5 8 种具体的模式如表2 1 所示 1 0 东北大学硕士学位论文 第2 章l b p 算子 表2 15 8 种统一模式 t a b l e2 1 5 8k i n d so fu n i f o r mp a t t e r n 把其它种类的二进制模式归为1 类 共得到5 9 种二进制模式 这样每个直方图的 维数由2 5 6 降低到5 9 从而极大地降低了计算量 2 3l b p 算子的优点 在纹理分析方面l b p 是最好的纹理描述手段之一 它主要具有以下几个优 点 1 计算简单 l b p 算子结构简单 在计算过程中主要就是编码操作和直方 图的统计 相对于其它一些复杂的处理方法 比如傅里叶变换 g a b o r 变换等操作 l b p 算法所需要的计算量非常少 因此计算速度比较快 2 无参数 n o n p a r a m e t r i c 相对于g a b o r 变换等纹理分析手段 l b p 算子 不需要进行比较繁琐 复杂的参数调节工作 3 纹理表征能力强 l b p 并不是从单一像素点来描述纹理 而是用一个局 部区域的模式来描述纹理 这可以看成是一种纹理的微观机构 它反映了纹理的 1 1 东北大学硕士学位论文第2 章l b p 算子 变化趋势 并且很容易描述图像中的微小特征 比如亮点 暗点 以及纹理的边 缘等 同时l b p 具有单调变换不变性和图像旋转不变性 这就使它能够表征对光 照及外界条件变化不太敏感的图像本身的特征 从而对光照和外界条件的化具有 一定的鲁棒性 2 4 本章小结 本章先介绍了有关纹理的一些特性 然后给出了在纹理分析中常用的l b p 算 子 并介绍了l b p 算子的改进形式 然后给出了关于l b p 直方图统计比较的几种 方法 并由此引申出了l b p 算子的统一模式 最后分析了l b p 算子应用于纹理分 析时候的优点 从而为后续工作的开展做好了铺垫 1 2 东北大学硕士学位论文 第3 章a d a b o o s t 算法 第3 章a d a b o o s t 算法 f r e u n d 和s c h a p i r e 5 4 1 在b o o s t i n g 算法基础之上提出了a d a b o o s t 算法 算法提 出后在机器学习领域受到了极大地关注 迄今为止a d a b o o s t 算法仍然是人脸检测 人脸识别等领域的热门算法 本章对此算法做具体介绍 3 1a d a b o o s t 算法 3 1 1a d a b o o s t 算法 k e a m s 和v a l i a n t 证明 5 1 1 只要有足够的数据 弱学习算法就能通过集成的方 式生成任意高精度的假设 1 9 9 0 年由s c h a p i r e l 5 2 1 提出的b o o s t i n g 算法则是最具代 表性的机器学习算法 后来f r e u n d 5 3 1 设计了一个更有效的b o o s t b y m a j o r i t y 算法 但是早期的b o o s t i n g 算法要预先知道弱学习算法正确率的下限 但这在实际问题 中难以实现 19 9 5 年 f r e u n d 和s c h a p i r e 5 4 1 提出了a d a b o o s t a d a p t i v eb o o s t i n g 算法 这种算法的效率和b o o s t b y m a j o r i t y 算法一样 但却不需要任何关于弱学习 的先验知识 可以非常容易的应用到实际问题中去 a d a b o o s t 算法提出来以后 在机器学习领域得到了极大地关注 b o o s t i n g 算法中的大部分由它而来 a d a b o o s t 算法能够自适应的调整弱学习算法的错误率 经过若干次迭代后错 误率能达到预定的期望值 算法在每轮迭代中 根据当前的分类结果对样本权重 进行分布调整 当前被正确分类的样本权重减小 当前被错误分类的样本权重加 大 这样学习算法在下一轮的迭代学习中就能集中学习比较难于分类的样本 最 终每轮产生的弱分类器按照加权投票的方式合并为一个强分类器 对于两类问题a d a b o o s t 算法流程如下 1 给定i l l 练集 s 五 m 而 儿 虼 其中 x x 是i l l 练样本集 y i 是 分类类别标志 只 y y 一1 1 2 初始化权重值 彤 f 1 m i 1 2 m 3 对于r 轮循环 f o r t 1 2 t 1 对有权重分布的训练集学习 得到预测函数h x 一 一1 1 2 计算预测函数h 的错误率s p r 一n 啊 咒 如果s 0 或者 0 5 令 t t 1 并且终止算法 3 计算弱分类器性能评价因子反 o 5 x l n 1 一s 4 更新样本权重 口 f d i e x p a 只曩 葺 互 其中z 是使得 d 1 i i 13 东北大学硕士学位论文第3 章a d a b o o s t 算法 的归一化因子 4 丁轮训练完毕 最终的预测函数为 7 日 x s 忉 a 魄 x 3 1 由预测函数啊 x 作用于样本集产生的错误样本的权重之和s 计算来的a 是 轮训练后产的弱分类器魄 x 的性能评价因子 由a 0 5 l n 1 s l e 可以看出a 是s 的减函数 3 1 2 训练误差分析 s c h p i r e t 5 5 1 于1 9 9 8 年最早从理论上推导出了强分类器的训练误差 定义 厂 x 口 囊 x 则预测函数为h x s i g n f x 那么预测函数的训练误差边界 为 s 扣 她 圳峰1 e x p 一朋删 玎互 3 2 由式3 2 可以得出可以通过限制互 即通过选取每轮的a t 和红来最d 4 t z 从而 使训练误差s 急剧减小 若前提为二值假设m 1 这种想法直接确定了q 的取值为 q 圭h c 导 3 当弱学 j 算法比随机算法好的时候 即s 0 5 时 由3 2 式可以推导出误差的上 界为 s 兀2 丽 兀乒可 y 2 3 4 其中n 0 5 s 由式3 4 i d a 看出强分类器 即预测函数h x 的误判率s 会随着 训练轮数的增大成指数形式的减小 3 2 改进的a d a b o o s t 算法 v i o l a 5 6 5 8 后来在进行人脸检测方法研究时提出了一种新的改进a d a b o o s t 算法 本文中采用了此种的训练方法 定义x 为样本空间 y 1 一1 表示样本类别标识集合 1 和 1 分别对应于 正样本和负样本 共有尸个预选特征 q 表示第t 轮循环第f 个样本的权重 算法 流程如下 1 给定一系列训练样本 而 咒 恐 以 其中薯 x 只 y 假设样本集中 1 4 东北大学硕士学位论文 第3 章a d a b o o s t 算法 共有m 个正样本 个负样本 m 刀 s 2 初始化样本权重 3 f o r l 2 t q 2 1 x i 是正样本 m 一1 x 是负样本 刀 1 归一化样本权重分布魄 l 其中江1 2 s j l 3 5 2 对于每个特征 在给定样本权重分布下训练弱分类器 x 并计算每 个弱分类器对样本集的分类错误率 q 誓 y l j l 2 p i l 3 选择第 轮最优弱分类器啊 x 令七 a r g m i n e u 那么有曩 x z i x j 并且对样本集的分类错误率为a l n l 肛 4 按照该最优的弱分类器更新样本权重q l q 一 其中层 土1 6 e t 0 表示薯被曩 x 正确分类 e 1 表示薯被曩o 错误分类 4 最终的强分类器为 坼 丁 喜口 互1 善t a 6 0 o t h e r s 舯a l n l 鼠 3 3 级联分类器 v i o l a 利用逐级提高检测精度的思想设计了一种级联结构来提高人脸检测系统 的速度 在利用a d a b o o s t 算法进行人脸识别的训练时 一个大的问题就是样本数量的 1 5 东北大学硕士学位论文第3 章a d a b o o s t 算法 庞大和人脸的正负样本巨大的不平衡 在4 1 节有具体的解释 j o n e s 5 9 l 和z h a n 9 1 6 0 i 提出了人脸样本的重采样和级联分类器的训练方式 为了叙述方便 本文首先给出两个定义 定义3 1 在训练过程中 一层强分类器 x 对相同人人脸组合的识别率 即 同一个人的两张人脸图片被判断为是同一个人的数目与相同人的组合总数的比 例 称为强分类器的训练正确识别率 定义3 2 在训练过程中 强分类器日 x 对不同人人脸组合的误识率 即不同 人的两张人脸图片被错误判断为是同一个人的数目与不同人的组合总数的比例 称为强分类器的训练错误识别率 假设每层强分类器的训练正确识别率是r 每层强分类器的训练错误识别率 是w 该训练方式如下 假设目标是训练l 层的强分类器 1 先按照一定比率选取m 个类内人脸样本组合和 个类间人脸样本组合 按照 和w l 训练第1 层的强分类器h x 2 f o ri 2 3 l 1 把前面已经完成的i 1 层强分类器q x 必 x 耳一 x 构成一个总的强 分类器h x 利用h x 对类间人脸样本组合进行识别 此阶段h x 识别错误的 类间人脸样本组合挑出来 直到找到新的玎个识别错误的类间人脸样本 利用原先 的m 个类内人脸样本和新找到的玎个类间人脸样本 按照 和w 训练第f 层的强分 类器 3 把已经训练完成的强分类器q x 日 x 只 x 构成最终的强分类器h x 1 6 东北大学硕士学位论文第3 章a d a b o o s t 算法 图3 1 训练级联人脸识别分类器 f i g3 1t h et r a i n i n go fc a s c a d ec l a s s i f i e r s 级联分类器的设计思想是逐级的提高识别精度 首先使用包含弱分类器比较 少的结构比较简单的强分类器对不同人的组合进行排除 后续的强分类器包含的 弱分类器的数目会越来越多 识别精度也会越来越高 级联分类器的结构实际上就是一个退化的决策树 每一层分类器都排除一定 比例的人脸组合样本 如果分类结果为是同一个人 那么这个样本就被传递到下 一层的强分类器继续进行识别判断 如此下去直到最后一层强分类器 就像查找 算法中的折半查找 极大的提高了识别的速度 识别过程如下 1 f o rf 1 2 l 一1 如果第f 层强分类器e x 判断是同一人 就进行下一层 强分类器的识别 否则结束识别过程 输出结果为不是同一人 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论