创新课程总结报告  _第1页
创新课程总结报告  _第2页
创新课程总结报告  _第3页
创新课程总结报告  _第4页
创新课程总结报告  _第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1/24创新课程总结报告*创新课程*兰州理工大学计算机与通信学院XX年秋季学期学习总结报告专业班级:信息与计算科学2班姓名:杨晨学号:11500212指导教师:成绩:目录摘要.11.人脸检测概述.2、人脸识别技术概念及现状.2、人脸识别技术的应用.22/24、人脸识别技术应用所面临的问题.42.PCA、LDA算法理论.4、PCA算法原理.4、LDA算法原理.53.算法实现.8、PCA算法的实现.8、LDA算法的实现.104.仿真实验结果及分析.13、PCA算法实验结果分析.13、LDA算法实验结果分析.145.学习心得.153/24参考文献.16摘要人脸检测是指对于任意一幅给定的静态图像或视频序列图像,采用一定的策略和方法对其进行搜索以确定其中是否含有人脸,如果有,则返回人脸的位置、大小和姿态人脸检测技术及应用,是计算机视觉的一个重要分支,是一个多学科的交叉领域。本课程拟通过教师指导与学生自学相结合的模式,让学生掌握人脸检测技术的相关理论和方法,并自主设计、开发出一个适用于复杂背景和多人脸的人脸检测系统。使学生通过该课程的学习,可以初步掌握人脸检测的基本原理和应用系统的开发方法,提高综合运用所学知识去解决实际问题的能力,极大限度地发挥出学生的学习主动性和创造性。关键词:人脸检测、图像处理、原理、应用。1.人脸检测概述人脸检测是指对于任意一幅给定的静态图像或视频序列图像,采用一定的策略和方法对其进行搜索以确定其中是否含有人脸,如果有,则返回人脸的位置、大小和姿态。人脸检测可细分为两类:一类是在静止图像中采4/24用一定的策略进行搜索,以判断其中是否存在人脸,若存在,则返冋人脸的位置、大小和姿态信息;另一类是在视频图像序列中判断是否存在人脸,若存在,则动态地跟踪人脸。、人脸识别技术概念及现状人脸识别,即通过计算机、相关算法对人脸进行分析判断的一种认证技术。通常也叫做人像识别、面部识别。严格的来说,我们统称人脸识别。人脸识别技术从应用层面上主要可分为:人脸检测、人脸识别查询、人脸识别身份认证和人脸识别比对四方面的应用,其可全部归纳为人脸识别查询技术。目前,我国从事人脸识别技术研究的单位有很多,使得生物特征识别技术形成了一定市场规模,同时也缩小了与国外的差距。XX年,以清华大学和中科院自动化研究所为代表的北京奥运会实名制票证系统的实施将生物特征识别技术又推到了一个新的水平,为我国生物识别技术在安防领域的应用打下了坚实的基础。、人脸识别技术的应用人脸检测人脸检测,顾名思义,就是对视频图像进行检测看是否有“清晰”人脸的图像高速处理过程。目前,被应用在银行的大联网高速图像搜索系统正是基于人脸检测技术与人脸识别查询技术为一体的视频图像快速索引系统。目前,很多地区的城市视频监控、银行监控都逐渐实施联5/24网工程,浩大的联网工程产生了海量的视频数据。如何对海量的视频数据进行快速准确的查询成为我们目前必须要解决的问题。为此,针对银行大联网高速图像搜索系统的现状而开发出了一套综合应用系统。人脸识别查询人脸识别查询是通过以人脸照片为查找目标,从某个或多个人脸数据库中查找设定相似度照片信息的过程。普遍应用于公安部门,主要有出入境护照管理、刑事侦查嫌犯查询、走失人口及合法公民身份查询。通过建立相应的数据库,采用C/S或B/S架构,通过在客户端输入要查询人的照片,由服务器端完成相似照片的查询,其核心是基于人脸比对技术。人脸识别查询根据数据库容量及客户端使用数量及频率设计合理的应用结构。出入境管理在当今社会起着举足轻重的作用,特别是一些危害国家安全及经济的犯罪分子通过办理多本护照,企图出境躲避法律的制裁,我们更要把其挡在国门之内。犯罪分子可以改姓名、可以有多种身份、可以有多个证件,但是他只有唯一的一张脸是不变的。不管你是谁,你叫什么,这张脸就是你能否办理护照的有效依据。该套系统由于客户端数量有限,且使用频率相对很低,系统采用C/S结构,核心工作基本由服务器完成。在系统客户端输入所要办理护照人员现场拍摄的照片,系统会在多个类型的数据库中一一查6/24询并返回查询结果。在已办理护照人员人脸数据库中查询,可以防止一人多本护照;在法律不准出境人员人脸数据库中查询,可以防止该类人员出境逃避法律;在办理过且未被审核通过人员数据库中查询,可以对其进行重点审核等。人脸识别身份认证人脸识别身份认证,就是通过人脸识别完成对某个人或某些人身份的认证。该项应用主要适用于参加大型活动身份认证、大型会议身份认证、重要机构重要人员身份认证等。目前比较成熟的应用主要有大型活动身份认证,如XX北京奥运会实名制票证系统认证;重要机构重要人员身份认证,如银行押运员身份认证。该类系统,人脸识别起到的是对人员身份的一种认证,是为了提高安全性。通常需要射频技术配合完成。如奥运会实名制票证系统认证,购票人在购票的时候已提交其规定格式的照片,人票合一,完成对进场观众的认证;银行押运员身份认证,通过与其之前使用的工卡完成对押运员的“人卡合一”认证。其核心是一对一比对,不论从认证速度还是准确率来看,已经很成熟的应用在上述场合。人脸识别身份认证,已经越来越受到很多相关部门的重视。、人脸识别技术应用所面临的问题目前,人脸识别技术在上述几方面应用基本上7/24已经很成熟,但还面临着更多的问题需要去解决,如模糊照片的人脸识别、远距离的人脸识别、快速行进中的人脸识别等,这些都是人脸识别将来所要研究的问题。在此,我们看到生物特征识别技术这一庞大的市场需求,但我们也很清醒的认识到人脸识别技术的某些应用是在特定环境下的应用,其中每一项技术的成熟应用,都要有很多科研人员、系统建设人员和用户的共同努力来实现的。所以,人脸识别技术不是属于某人或某群体的技术,而在整个行业链中每一个环节都是特别重要的,人脸识别在多个领域应用的成功。需要让越来越多的企业和研发人员参与进来。2.PCA、LDA算法理论、PCA算法原理主成分分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多的具有一定相关性的指标X1,X2,XP,重新组合成一组较少个数的互不相关的综合指标Fm来代替原来指标。那么综合指标应该如何去提取,使其既能最大程度的反映原变量Xp所代表的信息,又能保证新指标之间保持相互无关。设F1表示原变量的第一个线性组合所形成的主成分指标,即F1?a11X1?a21X2?.?ap1Xp,由数学知识可知,每一个主成分所提取的信息量可用其方差来度量,其8/24方差Var越大,表示F1包含的信息越多。常常希望第一主成分F1所含的信息量最大,因此在所有的线性组合中选取的F1应该是X1,X2,XP的所有线性组合中方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取第二个主成分指标F2,为有效地反映原信息,F1已有的信息就不需要再出现在F2中,即F2与F1要保持独立、不相关,用数学语言表达就是其协方差Cov=0,所以F2是与F1不相关的X1,X2,XP的所有线性组合中方差最大的,故称F2为第二主成分,依此类推构造出的F1、F2、Fm为原变量指标X1、X2?XP第一、第二、第m个主成分。?F1?a11X1?a12X2?.?a1pXp?F?aX?aX?.?aX?22112222pp?.?Fm?am1X1?am2X2?.?ampXp根据以上分析得知:Fi与Fj互不相关,即Cov=0,并有Var=aiai,其中为X的协方差阵F1是X1,X2,Xp的一切线性组合中方差最大的,?,即Fm是与F1,F2,Fm1都不相关的X1,X2,XP的所有线性组合中方差最大者。F1,F2,Fm为构造的新变量指标,即原变9/24量指标的第一、第二、?、第m个主成分。由以上分析可见,主成分分析法的主要任务有两点:确定各主成分Fi关于原变量Xj的表达式,即系数aij。从数学上可以证明,原变量协方差矩阵的特征根是主成分的方差,所以前m个较大特征根就代表前m个较大的主成分方差值;原变量协方差矩阵前m个较大的特征值?i所对应的特征向量就是相应主成分Fi表达式的系数ai,为了加以限制,系数ai启用的是?i对应的单位化的特征向量,即有aiai=1。计算主成分载荷,主成分载荷是反映主成分Fi与原变量Xj之间的相互?关联程度:Paki、LDA算法原理LDA算法与PCA算法一样,都属于子空间分析中的一种,又叫Fisher算法。关于线性判别分析的研究应追溯到Fisher在1936年发表的经典论文。其基本思想是选择使得Fisher准则函数达到极值的向量作为最佳投影方向,从而使得样本在该方向上投影后,达到最大的类间离散度和最小的类内离散10/24度。可以考虑把d维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维。这在数学上总是容易办到的。然而,即使样本在d维空间里形成若干紧凑的相互分得开的集群,若把他们投影到一条任意的直线上,也可能使几类样本混在一起而变得无法识别。但在一般情况下,总可以找到某个方向,使在这个方向的直线上,样本的投影能分开得最好,问题是如何根据实际情况找到这条最好的、最易于分类的投影线。这就是Fisher线性判别法所要解决的基本问题。首先,讨论从d维空间到一维空间的一般数学变换方法。假设有一集合包含N个d维样本x1,x2,?,xN,其中N1个属于1类的样本记为子集x1,N2个属于?2类的样本记为x2。若对xN的分量作线性组合可得标量yn?wTxn,n?1,2,.N这样便得到N个一维样本yN组成的集合,并可分为两个子集y1和y2。从几何上看,如果?=1,则每个yN就是相对应xN到方向为?的直线上的投影。实际上,?的绝对值是无关紧要的,它仅使yN乘上一个比例因子,重要的是选择?的方向。?的方向不同,将使样本投影后的可分离程度不同,从而直接影响识别效果。因此,前述所谓寻找最好投影方向的问题,在数学上就是寻找最好的变11/24换w*的问题。在定义Fisher判别准则之前,先定义几个必要的基本参量。在d维X空间各类样本均值限量mimi?1Ni?x,i?1,2x?i样本内部离散矩阵si和总内部离散矩阵swsi?T,i?1,2x?xisw?s1?s2样本内间离散矩阵sbsb?T其中Sw是对称半正定矩阵,而且当Nd时通常是非奇异的。sb也是对称半正定矩阵,在两类条件下,它的秩最大等于1。在一维Y空间各类样本的均值mimi?1N12?y,i?1,2y?yi样本类内离散度si和总类内离散度sws?,i?1,2y?yi2i2sw?s1?s12/24222现在来定义Fisher准则函数。希望投影后,在一维Y空间里各类样本尽可能分得开些,即希望两类均值m1?m2越大越好;同时希望各类样本内部尽量密集。即希望类内离散度越小越好。因此,可以定义Fisher判别准则为:JF?2s?s2122显然应该寻找使JF的分子尽可能大,而分母尽可能小,也就是使JF值尽可能大的w作为投影方向。但是JF并不是显含w,因此必须设法将JF变成w的显函数。因此:11TT1mi?y?wx?w?wTmiNiNix?xiNix?xiy?yi得:?ww?wSbw现在再来考察JF的分母与w的关系:2TTTTT?Tsi?w?w?wTSiwy?yix?xi?x?xi?22TT2T因此:s1?s2?wTw?wTSww13/24可得:wTSbwJF?wTSww下面求使JF取最大值时的w*。JF是广义Rayleigh商,可以用Lagrange乘子法求得:w?*R?1Sw忽略比例因子R/,得:?1w*?Sww*就是使Fisher判别准则函数JF取极大值时的解,也就是d维空间到一维Y空间的最好投影方向,有了w*,就可以把d维样本xN投影到一维,这实际上是多维空间到一维空间的一种映射。这样,就将d维分类问题转化为一维分类问题了。只要再确定一个阈值,便可做出识别决策,当然也很容易把这种方法推广到多维情况。这就是Fisher线性判别的原理。3.算法实现、PCA算法的实现主成分分析的具体步骤如下:计算协方差矩阵计算样品数据的协方差矩阵:=p?p,其中1nsij?i,j=1,2,?,p14/24n?1k?1求出的特征值?i及相应的正交化单位特征向量ai的前m个较大的特征值?1?2?m0,就是前m个主成分对应的方差,?i对应的单位特征向量ai就是主成分Fi的关于原变量的系数,则原变量的第i个主成分Fi为:Fi=aiX主成分的方差贡献率用来反映信息量的大小,?i为:?i?i/?ii?1m选择主成分最终要选择几个主成分,即F1,F2,?,Fm中m的确定是通过方差累计贡献率G来确定G?i/?ki?1k?1mp当累积贡献率大于85%时,就认为能足够反映原来变量的信息了,对应的m就是抽取的前m个主成分。15/24计算主成分载荷主成分载荷是反映主成分Fi与原变量Xj之间的相互关联程度,原来变量Xj在诸主成分Fi上的荷载lij。:l?ij在SPSS软件中主成分分析后的分析结果中,“成分矩阵”反应的就是主成分载荷矩阵。计算主成分得分计算样品在m个主成分上的得分:Fi?a1iX1?a2iX2?.?apiXpi=1,2,?,m实际应用时,指标的量纲往往不同,所以在主成分计算之前应先消除量纲的影响。消除数据的量纲有很多方法,常用方法是将原始数据标准化,即做如下数据变换:*xij?xij?jsji?1,2,.,n;j?1,2,.,p1n1n2其中:j?xij,sj?2?ni?1n?1i?1根据数学公式知道,任何随机变量对其作标准化变换后,其协方差与其相关系数是一回事,即标准化16/24后的变量协方差矩阵就是其相关系数矩阵。另一方面,根据协方差的公式可以推得标准化后的协方差就是原变量的相关系数,亦即,标准化后的变量的协方差矩阵就是原变量的相关系数矩阵。也就是说,在标准化前后变量的相关系数矩阵不变化。根据以上论述,为消除量纲的影响,将变量标准化后再计算其协方差矩阵,就是直接计算原变量的相关系数矩阵,所以主成分分析的实际常用计算步骤是:计算相关系数矩阵求出相关系数矩阵的特征值?i及相应的正交化单位特征向量ai选择主成分计算主成分得分总结:原指标相关系数矩阵相应的特征值?i为主成分方差的贡献,方差的贡献率为?i?i/?i,?i越大,说明相应的主成分反映综合信息的能力越强,可i?1p根据?i的大小来提取主成分。每一个主成分的组合系数ai就是相应特征值?i所对应的单位特征向量。、LDA算法的实现首先根据导入的训练样本数据分别计算它的总体散布矩阵St、类内散布矩阵Sw、类间散布矩阵Sb和类平均矩阵Sm。假设w1,w2,.,wm是m个已知类别集合,X?xi?,i?1,2,.,N是17/24n维训练样本集合,每个样本xi属于一个类wj,即x?wj,i?1,2,.,?1,2,.,m,wj的先验概率为P,则?T?Sw?PE?wi?1i?mSb?PTi?1mS1?Sb?Sw?ET?其中,x为任一训练样本,m0为所有训练样本平均向量,m0?Ex。然后再根据Fisher判别准则公式,计算最优判别向量:Fisher判别准则公式:?TSb?Jf?T?Sw?改进的Fisher判别准则:?TSb?Jf?T?St?18/24假设R是n维空间集合,?x?R,f?0,g?0,f?g?0,h1?f/如果h2在x0有最大值,那么h1在x0也g,h2?f/?g),有最大值;而且在求解最优分类向量过程中Fisher判别函数可以被试代替,还有如果A是一个非奇异的正矩阵,假设Ax=0,则xAx=0,因此假设St是一个奇异矩阵,St?1?xStx?0,x?Rn,St?1为St?1的互补空间,则最优分类向量?可以通过公式计算出来。计算第一个判别向量?1:根据?maxJf?1?St11?1?以及代数原理St?1?Stxx?Rn,假设n1是矩阵St?1的维数,则?当n1?n,则?1就等于矩阵St?1Sb的最大特征值对应的单位特征向量。当1?n1?n,则假设St?1?span?1,?2,.,?n1?,其中1,2,.,?n1为正交单19/24位向量,那么?1?1?2?2?.?n1?n1?P,其中,1ZP1?Z?P1Z0?1?,其中?1就是最优判别向量中的第一个向量。P1Z0计算第i个判别向量?i假设:St?1?Spana1,a2,.,an?n1?其中,a1,a2,.,an?n1是正交单位向量,假设Vi是被span?1,?2,.,?i?1分割的子空间,Vi?span?1,?2,.,?i?1,a1,a2,.,an?n1,而且向量?1,?2,.,?i?1和a1,a2,.,an?n1都已经被计算出来,由代数原理可以构造出Vi的互补空间Vi?span?1,?2,.,?n?i?1?,其中?1,?2,.,?n?i?1是正交单位矩阵。很显然,求最优判别向量问题与以下公式求最大值问题是等效的。?20/24Jf?maxJf?Vi,1?1其中,?i是Vi中的一个单位向量,对于?Vi,?都可以被表示成以下公式:?1?1?2?2?.?n?i?1?n?i?111假设:?PiZ其中,P?,若Ji)被以下公式定义i?,ZJi)?ZZTTPiSbPiZPiSiPiZTT/PiZ/PiZ22?21/24ZTTPiTSbPiZZPiTSiPiZ那么公式可得:iJi?maxJiZ第i个向量?i计算公式如下:PiZ0?i?PZi0计算出判别向量?,然后则可实现LAD算法。4.仿真实验结果及分析、PCA算法实验结果分析实验在两个图库上测试,一个是自建人脸库,该库包含10个不同人物,每人有5张不同表情和姿态下的图片,总共50幅。另一个是ORL人脸库,该库包含40个不同人物,每人有10张图片,共400幅。用训练样本进行测试,识别率为100%。而随着训练样本的增加,识别率会22/24有所提升,由于标准人脸库在采集时考虑了多种因素,人脸图像比较标准,所以识别率较自建的人脸库识别率高,另外因为自建人连库的图片太少,即训练样本太少,也会对结果产生影响,效果不是很好。进行直方图均衡化比灰度归一化的识别率高,预处理对识别的效果起着至关重要的作用。而此次实验的预处理还比较粗糙,PCA也只是起到了简单的特征脸降

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论