已阅读5页,还剩60页未读, 继续免费阅读
(计算机应用技术专业论文)人脸识别的关键技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南科技大学硕士研究生学位论文第1 页 摘要 随着社会的发展,各个方面对快速有效的自动身份验证的要求同益迫切。 出于生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此 是身份验证的理想依据。这其中,利用人脸特征又是最自然直接的手段,相 比其他生物特征,它具有直接、友好、方便的特点,易于为用户接受。 人脸识别是一个涉及面广且又很有挑战性的研究课题,近年来关于人脸 识别的研究取得了较大的进展。本文首先做了人脸图像的采集。然后对人脸 识别的两个关键环节,特征提取和识别分类做了大量细致的研究和实验。特 征提取的是代数特征,包括p c a 特征和奇异值特征,原始图像也分别用双线 性插值和小波分解做了处理来减小数据量。识别分类用的是流行的b p 神经网 络,针对标准b p 算法的不足笔者做了一些改进。最后对人脸认知模型作了详 细的介绍,并探讨了人工生命在图像处理中的应用还有一个全新的图像识别 系统p a d o 。 在o r l 人脸数据库上做了算法的测试,证明了改进后b p 在训练时间的降 低和识别效果上的提高。 关键词:人脸识别小波变换p c a 遗传算法b p 神经网络 西南科技大学硕士研究生学位论文第| | 页 a b s t r a c t a st h e d e v e l o p m e n t o ft h e s o c i e t y ,t h e r e a r e i n c r e a s i n g d e m a n d si n a u t o m a t i ci d e n t i t yc h e c k s i n c es o m eb i o l o g i c a lc h a r a c t e r i s t i c sa r ei n t r i n s i ca n d s t a b l et op e o p l ea n da r es t r o n g l yd i f f e r e n tf r o mo n et ot h eo t h e r s ,t h e yc a nb e u s e da sf e a t u r e sf o ri d e n t i t yc h e c k a m o n ga l lt h ec h a r a c t e r i s t i c so fh u m a n ,t h e c h a r a c t e r i s t i c so ff a c ea r et h em o s td i r e c tt o o l sw h i c ha r ef r i e n d l ya n dc o n v e n i e n t a n dc a ne a s i l yb ea c c e p t e db yt h ec u s t o m e r s f a c er e c o g n i t i o ni sa l le x t e n s i v ea n dc h a l l e n g i n gr e s e a r c hp r o b l e m r e c e n t l y s i g n i f i c a n tp r o g r e s s e sh a v eb e e nm a d ei nt h et e c h n o l o g yo f t h ef a c er e c o g n i t i o n i nt h i st h e s i s ,w ef i r s tc a p t u r et h eh u m a nf a c ei m a g e s t h e nal o to fr i g i d i n v e s t i g a t i o n a n d e x p e r i m e n t w e r em a d et ot h et w o k e yp h a s e s o ff a c e r e c o g n i t i o n ,c h a r a c t e r i s t i c s e x t r a c t i o na n di d e n t i f i c a t i o no rc l a s s i f i c a t i o nt h e f e a t u r e se x t r a c t e da r ea l g e b r a i cf e a t u r e s ,w h i c hi n c l u d ep c af e a t u r ea n ds i n g u l a r v a l u e sf e a t u r e t h eo r i g i n a li m a g e sw e r ep e r f o r m e db yb i l i n e a ri n t e r p o l a t i o na n d w a v e l e td e c o m p o s i t i o ns e p a r a t e l yt or e d u c et h em a g n i t u d eo fp i x e ld a t a ,b p n e u r a ln e t w o r kw a su s e di nt h ec l a s s i f i c a t i o np h a s e ,a n dt oo v e r c o m et h el a c ko f t h es t a n d a r db p a l g o r i t h ms o m e m o d i f i c a t i o n sw e r ep r o p o s e d f i n a l l yt h ea u t h o r m a k ead e t a i l e di n t r o d u c t i o no ft h em o d e lo ff a c ec o g n i t i o n ,i n v e s t i g a t e dt h e a p p l i c a t i o n o fa r t i f i c i a ll i f ei n i m a g ep r o c e s s i n g a n da ne n t i r e l yn e wi m a g e c l a s s i f i c a t i o ns y s t e m ,p a r a l l e la l g o r i t h md i s c o v e r ya n do r c h e s t r a t i o n t h et e s t so ft h ea l g o r i t h m sw e r em a d eo nt h eo r lf a c ed a t a b a s e ,w h i c h p r o v et h ee f f e c t so f t h ei m p r o v e db pn o to n l yi nt h ed e c r e a s eo ft h ec o m p u t i n g t i m ei nt r a i n i n gb u ti nt h ei n c r e a s eo fr e c o g n i t i o np e r c e n t a g e k e y w o r d s :h u m a nf a c er e c o g n i t i o n ;w a v e l e tt r a n s f o r m ;p r i n c i p a lc o m p o n e n t a n a l y s i s ;g e n e t i ca l g o r i t h m ;b a c k p r o p a g a t i o nn e u r a ln e t w o r k 独创性声明 本人声明所星交的论文是我个人在导师指导下进行的研究工作及取得的 研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表或撰写过的研究成果,也不包含为获得西南科技大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡 献均已在论文中作了明确的说明并表示了谢意。 签名:瑟网i j 日期:二。巧6 ,i ( 7 关于论文使用和授权的说明 本人完全了解西南科技大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文的复印件,允许该论文被查阅和借阅;学校可以公布该论 文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:珏网9 名:即 f i 期:4 - d f f f f i 西南科技大学硕士研究生学位论文第1 页 l 绪论 随着社会的发展,各个方面对快速有效的自动身份验证的要求同益迫切。 由于生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此是 身份验证的最理想依据。这其中,利用人脸特征进行身份验证又是最自然直 接的手段,相比其它人体生物特征它具有直接、友好、方便的特点,易于为 用户所接受。 1 1 人脸识别的研究内容及其应用 人脸识别的较一般的表述为:给定一场景的静止或视频图像,利用已有 的人脸数据库,确定场景中的一个或多个人。 人脸自动识别系统包括两个主要技术环节( 如图卜1 所示) :首先是人脸 检测和定位,即从输入图像中找到人脸及人脸存在的位置,并将人脸从背景中 分割出来,然后是对归一化的人脸图像进行特征提取与识别。 人 图1 1人脸自动识别系统的构成 f ig 1 1t h es tr u c t u r eo fh u m a nf a c ea u t o m a t o nr e c o g n i t io l l 如同人的指纹、虹膜等特征一样,人脸也具有唯一性,可用柬鉴别一个 人的身份。人脸识别的研究真正开始成为热点是从上世纪8 0 年代) 1 二始的,到 现在已经取得了一定的研究成果,其表现是全世界相当数量的科研院所提出 了各自的人脸识别算法,同时也出现了一批提供人脸识别相关产品的公司。 国内中科院计算所物理所先进人机通信技术联合实验室高文博士领导的j d l 人脸识别研究组和自动化所研究员李子青带头的研究团队在人脸识别的算法 研究方面成果显著,还涌现出了如中科模识银晨科技等公司开始开发相关产 品,而人体生物特征识别进展国际学术会议暨中国生物识别学术会议至今已 经召开五届了。 比尔盖茨曾做过这样的断言:生物识别技术将成为未来几年i t 产业的 重要革新。盏茨言论的背后支撑是,越来越多的个人、消费者、公司乃至政 府机关都承认,现有的基于智能卡、身份号和密码的身份识别系统是远远不 够的,生物特征识别技术将在未来提供解决方案方面占据重要的地位。在短 嚣南稀疆大擎磺磅变裳攀位论文第2 瑟 期内,生物鉴别法便可与智能卡操作系统结合,用户通过使用个人密码及生 物鉴别法以确认身份。根搬中国科学院的新闻报道,中国第三代身份证将带 攒纹等生物识别特缝。同葜继熬生物特髹派剐技零,懿据绞识别、谨话大、 蜒膜识别、d n a 谈别、步淼汲瘸楣配,入脸谚 剐具肖主动瞧、菲俊犯性积羽 户友好等许多优点,多年来一直受到许多研究者的关注。 人脸识别威用广泛,可应用于以下的几个方面【- 、: 嫌疑犯照片的识别匹配 薅震卡、熬骏撬照、护照与拿久鸯徐熬谖翻 银行、商场安全系统 公众场合麟控 门禁系统、计算机登录控制 专家识别系绞 基于目击线索静人齄羹构 基于父母人脸的小孩脸推导生成 随着年龄增长的人脸估算 这些应用识捃了从静态豹受控背景的照片到动态酌、 # 控背景的录像等 器令方嚣,番矮应震都套黉不同翡技术难菠、楚理方式耪努褥磷瓣方式。它 们基本上可以分为两类:静态( 非视频) 匹配和劫恣( 视频) 瞩配。本文研 究的是前者。 近年来,人脸识别技术研究相当活跃。除了基于代数特征方法取得新的 遽矮之羚,大王褥经弼终、小渡交换在入齄识剐疆究中都褥到了穰广泛的应 用,出现了不少入脸识别的新方法。 1 2 人脸识别魈研究现状翻理论背景 簸早的关予入脸识别的研究可以追溯到1 9 毽既束s i rf r a n c i sg a i t o n 发表于n a t u r e 的两篇文章”,。“。而当代学者参与这课题的研究是从本世纪 六十年代开始的nn 1 。随蔫计算机技术的发展,八十年代以后,人脸识别技术 褥爨了禳大发溪并遴天了实瓣应磊镶壤。关予大黢谖嗣蕊文献缀多,毒我表 性的文献综述可参见”“7 ”“。 人脸识别的常用方法包括基于特征茅基于模板的两类。 2 。 基于特征的天验谖剃方法 一种基于特征的方法鼹在抽取人脸黼像上显著特征的相对位鬣及其参数 的蕊础上进行识别。b l e d s o i “是最早研究人脸识别的学者之一。他用手工的 方法确定入验特薤点静位嚣劳将其输入谤算襁中,农绘定特识剐人脸款特短 点鼯离后,眉缀近邻方法或其它分类方法来识测入稔。由于特徭点是手工抽 鞭南籍技夭攀磺圭磷究垒攀经论文第3 页 取的,因此系统允许较大藏围的头部转动、倾斜以及图像的质龋和对比度变 化。k e l l y ”3 的工作在b l e d s o 的框架之上,但一个明显的进步燕它不露要人 豹于赣。k e l l y 赘方法裂爱了久麴奏体秘头部蚕像。其中验部豹溅羹薰奄豁 头部的宽度,眼睛之间的躐离,头顶剐眼睛的距离,眼睛到鼻子的距离,以 及眼睛到嘴巴的距离。同样采用了最i 厦邻分类法。腐来有很多学者对这一方 法避季亍了了发矮,包攒:y 。k a r a 秘k 。k o b a y a s h i 。o 3 ,i c r a w 等”1 。, t p o g g i o ,f o i f o s i “帮r b r u n e l l i “”麓,雨n i c h o l a sr o e d e r 和x i a o b ol i 则熙为全面地对基于特征的人脸识别方法的准确性进行了研究。他们指出, 纂于特征的人脸识别的准确率依赖于脸都特征识别的准确性。然而,这种依 羧魏豹程凄彝绥节还不絮遵。 另一种基于特征的方法建在掬取代数特薤的基础上完成的。这里的代数 特征是指经过数学变换得到的特征,悬与前面的几何特征相对而言的。典型 的代数特征由k l 变换或奇异值分解( s v d ) 得到。 m k i r b y 秘l s i r o v i c h 秘用k - l 交换糖取大验黧像懿主成分并葭梵 乍为 人脸的特征向擞【“1 。m a t u r k 和a p e n t l a n d “乩提出了特征脸的方法,它根 据组人脸训练图像构造生元子空间,出于主元具莉脸的形状,也称为特征 脸。识裂露将测试图像投影剿主元子空阉上,褥到一组投影系数,秘各个已 知入的入脸圈像跑较进行谈涮。特征验方法的优点楚髯法稳健,毽它也有一 个缺点是它的“扩容性”麓,即每增加个对象,就要将所有数掘重新进行 计算,当数据艨很大时,这种计算的代价非常大。 溪予象彝秘黪宇蕞罩爨爨了钱鼗特髹糖壤懿方法“7 “3 。建翻谈为塑像本 身的灰度分布描述了图像的内在信息,w 以将图像作为矩阵看待,对萁进行 备种代数变换年口矩阵分解,从而提取图像的代数特征,并且论证了奇异值特 征向量是识别躁像的有效特征。 1 2 2 基于横板匹配的人脸识别方法 基于模板甄配的方法悬另一类常用的方法。最简单的模板匹配方法是每 个入 乍兔数攥澎中熬一个条毯,它的字毁篷含一个麸萁歪夏天验撼像按魏麴 二维点阵。图像必须经过朔化。识剐时,未分类盼图像和数耀岸中的所有 图像数据进行比较,采用相关作为典型的匹配函数。这一方法的较早研究可 参见b a r o n 的文章“。 g u i l l e ,c o h n 弱h a l l i n e n m 翻委胃炎澎模鬏撬敬嚣部特 垂。这些攘板可 以平移、旋转和变形以便能够最佳地表示它们在图像中形状。他们先对图像 西南科技大学硕士研究生学位论文第4 页 进行了预处理,并定义了各种能量函数。他们在实验中发现,模板的起始位 置对于确定眼睛的准确位置至关重要。当模板从眉毛上开始时,算法不能够 区分眼睛和眉毛。算法的另一个缺点是计算复杂。一般意义上讲,基于模板 的方法是一个更理性的途径。问题的关键是如何描述模板。当对图像进行近 似分析时,系统应能够容忍模板和实际图像之间的差别,而这种容忍度往往 趋向于抹煞人脸之间的差别。 人脸识别和其它的3 一d 目标识别一样,当投影不同或形状发生改变时, 如何保持视觉的拓扑结构是非常重要的一点。这一问题的一个有效解决途径 是动态连接结构法或d l a ( d y n a m i cl i n ka r c h i t e c t u r e ) “。在通常的执行 中,d l a 可以视为一个网格,它的节点包含对局部空间频率的一种多分辨率 描述。每一个节点包含多个基于改进的6 a b o r 小波变换特征检测器。这些特 征检测器用高的精度描述局部灰度分布,用较低的精度描述更全局的灰度分 布。网格的节点同弹性连接相连。这些连接将特征分组成更高级别的排列, 这些排列对可视目标编码。弹性使得适应目标视角投影的扭曲和变化成为可 能。一个新的人脸可以通过手工,用网格覆盖在脸上来注册。一个人可以存 储多幅图片以适应不同的面部表情。识别时,将测试图像变换成矢量网格, 也称为图像域。识别过程就是将图像域和存储的所以原型图进行匹配目标是 最小化单个节点对之间的价格函数。如果一个人的原型图的匹配程度远大于 其他图的匹配程度,就认为识别出了。图的匹配分为两个阶段。开始,用不 变形的网格来定位图像中的人脸。网格一旦覆盖人脸,其结构按照每个节点 在它的邻域内使价格函数达到极小值的方式变形。最终的匹配价格是网格每 个节点的匹配价格和网格变形基价格的加权合成。 b r u n e l h 和p o g g i 0 对基于特征和基于模板的两种方法进行了比较1 。 他们认为,基于特征的方法在速度和存储量上有更大的优势,但是基于模板 的方法在提高识别率上更有优势。对于基于特征的方法,当增加测量量时, 识别率只能提高很少。另外,当出现遮挡或由于比如摄像机对焦不准而造成 的图像质量下降时,基于特征的方法的性能下降很大。当然,他们提到的基 于特征的方法,主要是指基于几何特征的方法。本文的方法基于代数特征。 1 2 3 其他方法 文献z ”报道了一种基于变换特征和神经网络的方法。该方法采用了一种 叫做径向基函数的神经网络( r a d i a lg a s i sf u n c t i o nn e t w o r k ,r b f n ) 。它提 供的第一种方案是用一个包含输入层、隐层、输出层的多输入多输出径向基 西南科技大学硕士研究生学位论文第5 页 函数神经网络。输入单元数为要分类的人脸图像数,输出单元数为类别数。 输入的是特征脸向量或小波变换抽取的特征向量,输出的是分类结果。它提 供的第二种方案是每一类图像用一个径向基函数神经网络表示,n 类图像共 有n 个神经网络。每个神经网络只有一个输出单元,表示输入图像是否属于 该类。很显然,第一种方案输出单元的个数随类别数的增加而增加,因而计 算效率要低于第二种方案,但实验表明第一种方案的识别率要高于第二种。 据称在m i t 人脸数据库上获得的最高识别率为9 4 。其它的基于神经网络的 人脸识别方法可参见文献m “。 f s a m a r i a 最早将h m m 用于人脸识别”6m ,。按照h m m ,表征人脸的特征量 构成一个观测序列。观测序列被认为是由若干个状态产生的。状态处于隐层, 是不可预测的。s a m a r i a 采用了具有5 个状态的左右型h m m 模型,用个 矩形窗从上到下采样人脸图像,将窗内的象素排成列向量,用狄度值作为观 察值。采样窗前后重叠,以保证观察序列的连续性。s a m a r i a 的实验是利用 英国剑桥大学的h m m 语音识别软件包h t k ( h i d d e nm a r k o vt o o k i t ) , v e r s i o n l 3 完成的u “。作为开创性的成果,s a m a r i a 提出的h m m 人脸识别方 法中的很多思路,包括左右型模型,状态数等被以后的学者所借鉴和采用。 1 2 4 模式识别理论 边肇祺,张学工等”说什么是模式呢? 广义地说,存在于时间和空间中 可观察的事物,如果我们可以区别它们是否相同或是否相似,都可以称之为 模式。但模式所指的不是事物本身,而是我们从事物获得的信息。因此,模 式往往表现为具有时间或空间分布的信息。由于本书主要讨论的是用计算机 进行模式识别,信息进入计算机之前通常要经过取样和羹化,在计算机中具 有时空分布的信息表现为向量即数组。数组中元素的序号可以对应时问与空 间,也可以对应其他的标识。 人们为了掌握客观事物,按事物相似的程度组成类别。模式识别的作用 和目的就在于面对某一具体事物时将其正确她归八某一类别。如果给每个类 命名,并且用特定的符号来表达这个名字,那么模式识别可以看成是从具有 时间和空间分布的信息向着符号所作的映射。 通常,我们把通过对具体的个别事物进行观测所得到的具有时间和空间 分布的信息称为模式,而把模式所属的类别或同一类中模式的总体称为模式 类( 或简称为类) 。也有人习惯把模式类称为模式,而把个别具体的模式称为 样本,这种用词的不同可以从上下文弄清其含义,并不会引起误解。 西南科技犬举硕士研究臻学憾论文第6 页 一般认为蠢黼种基本的模式识别方法,即统计模式识别方法和结构( 甸 瀵) 模式识剃方法,与熬褪应黪模式识别系统都囊嚣个过程黪缝惑,郄设诗 年【;i 实现。设计跫指角一寇数量的样本( 叫做训练集域学习集) 进行分类器的 设计。实蕊燕指嗣所设计的分类器对祷识剐的样率进行分类决策。基于统计 方法的模式识别系统主要由4 个部分组成:数据羰取,预处理,特征提取和 选择,分类凌策,鲐图卜2 繇示。 ( 1 ) 数援获取 通过测潼、采样和巅化,可以用矩阵或向量液示二维图像或维波形。 这就是数据获驭熬过程。 ( 2 ) 预处疆 鞭处理麴强豹是去狳溱声,翔强蠢箱瓣信惠,莽霹辕入灞蘩仪器或冀憩 因素所造成的退化现象i 挂行复原。 ( 3 ) 穗霰提致耪选耩 为了有效地嶷现分类识别,就要对原始数据进行交换,褥到最能反映分 癸本质的特征。这就是特 正摄取和选择的进程。般我们把原始数据组成的 空间d q 嫩测爨空悯,把分类识别赖以进行的空蚓叫做特征空间,通过变换, 露把维数较浅静测豢空闯孛交示的模式变为在维数较低的特强空闻中表示鳓 模式。在特缝空阚中一个攘式遁豢毽鞭徽令撵本,宅往往可以表承为一个 向量,即特征空间中的一个点。 ( 4 ) 分类决策 分类决策就怒在特铤空间中用统计方法把被识别对象归为巢一类别。麓 零佟法是褒徉本训练集熬磷上确定菜个判决规瓣,馊按这释潮决蠛潮对褥移 别对象进行分类所造成的错误识别率撮小溅引起的损失最小。 麴 一2 攘式谈剩系统戆壅藏”“ f ;g 1 2 t h ec o m p o s ;n go fp a t t e r ni k e c o g n i t io ns y s t e m = = = 8 西南科技大学硕士研究生学位论文第7 页 1 3 本文的研究内容及安排 本文对人脸识别中的关键技术,特征提取和分类识别进行了深入的研究, 主要的内容安排如下: ( 1 ) 查阅了与这一课题相关的大量国内外文献,特别是近十几年来的,对 常用的方法做了详细的综述。这一部分的内容安排在第一章。 ( 2 ) 实现了w i n d o w s 下的人脸图像采集。 ( 3 ) 深入讨论了对人脸图像提取代数特征的两种方法:p c a 和奇异值分 解。对提取到的特征用遗传算法作优化选择效果更好。这种特征提取不仅对 原始图像,还可以在小波分解后的子带图像上进行。这一部分的内容安排在 第三章。 ( 4 ) 用常用的b p 神经网络对提取的特征作分类,并用一些方法对标准b p 做了改进,给出了o r l 人脸库的识别效果。这一部分的内容安排在第四章。 ( 5 ) 探讨了人脸视觉认知模型,所介绍的人脸视觉认知模型是中科院心理 所罗跃嘉的最新研究成果,由作者去当面请教获得专著后引入本文。介绍了 人工生命这门非常年轻的学科用于图像处理的国际上最新成果。还有p a d o , 美国卡耐基梅隆大学t e l l e r 博士一个通用分类器框架,在图像识别中有优异 的表现。这一部分的内容安排在第五章。 最后作了总结和展望。 蕹鸯稀羧大擎壤圭骚究生攀俊论交筹8 页 2 人脸图像的采集 巍颓戆实辩瓣获是实瑷鑫凌熬太黢毒哭崩系统繇必嚣豹,跫入脍囊动识剃 系统的一部分,是后面的特征提取识剐的基础。图像采集是在w i n d o w s 操作 系统下开发的,需要了解程此环境下图像的存储、撼示等方面的机制。一般 来说,视频撼获有嚣释方法:一秭是t t i c r o s o f tv i d e of o rw i n d o w s ( v f w ) , 稀是采矮d i r e c t s h o w 技术。本文幸采掰静是v f w 。在w i n d o w s 操作系统中, 任何图像格式( 如j p e g 格式,g i f 格式) 在系统中显示之前最终必须转化 为位图格式。b m p 图像文件格式( 位图格式) 是微软公司为其w i n d o w s 环境 设黉垂冬拣难图像格式,w i n d o w s 系统款秽孛还嚣辩疼含了一系剜支持8 疆p 辫 像处理的a p i 瞒数,因此,在w i n d o w s 下进彳亍图像采集,首先需要熟悉位图 的文件格式及疑处理的a p i 函数。 2 。1b m p 文件格式及舶l 函数 b m p 是标准的w i n d o w s 图像格式,一个b m p 文件由四部分组成,旗文件结构 为:b i t m a p f i l e e a d e r ( 饿强头文乎 ) ;8 i t l a p i n f o l e a d e r ( 位髑 善意头) : p a l e t t e( 调色板) ;d i bp i x e l s ( 鬻像数据) 。 第一部分为位图文件头b i t m a p f i l e h e a d e r ,它怒个结构,其长度为1 4 个字节,其的定义如下: t y p e d e fs t r u c t w o r db f t y p e : d w o r db f s i z e : t a g b i t 融a p f i l e h e a 静e r w o r db f r e s e r ¥e d i : w o r db f r e s e r v e d 2 : d w o r db f o f f g i t s : b i t 耩a p f i l e h e 矗d e r : 文件类烈,必须为“叫” 文件的大小 | | 甍0 | 炎0 存储的像索阵列相对予文件头的偏移量 第二部分为位图信息头b i t m a p i n f o h e a d e r ,它用于说明位图的尺寸信息 也是一个结构,其的长度为4 0 个字节,定义如下: t y p e d e fs t r u c tt a g b i t m a p i n f o h e a d e r 嚣南释蒗大拳矮士疆究垒攀位论文第9 页 d w o r db i s i z e :该结构的大小 l o n gb i w i d t h : 位图的宽度( 以像素为单位) l o n gb i h e i g h t : 证嚣豹麓菠( 整檬素为鼙位) w o r db i p l a n e s : 必须为1 w o r db i b i t c o u n t 每个像素的位数( 1 、4 、8 、1 6 、2 4 成3 2 ) d w o r db i c o m p r e s s i o n : 压缩方式,一般为o k b i r g b ( 寒压缩) d w o r db i s i z e i m a g e : 鞋字节为荦位斡图像大,j 、( 仅瘸子疆缩往图) l o n gb i x p e l s p e r m e t e r :以目标设备每米的像素数来说明位图的水平 分辨率 l o n g b i y p e l s p e r n e t e r :跬嚣拣设罄每米静缘素数来说鞠位鎏豹零纛 | 食鬻舔 d w o r db i c l r u s e d :颜色表的颜色数,若为0 则位图使用幽b i b i t c o u n t 指定的最大颜色数 d w o r db i e l r l m p o r t a n t ;重要凝稳翡数嚣,蔷该毽受0 剩掰有颜色帮重 f 要 b i t m a p i n f o h e a d e r : 第三部分为调色板。调色板瘸子说明位图中翡颜色,它毒蒋干个项,每 一个表项是一个r g b q u a d 类激的结构,占四个字节,定义一种颜色,r g b q u a d 豹定义如下: t y p e d e fs t r u c tt a g r g b q u a d b y t er g b b l u e : 蓝色的强度 b y t er g b g r e e n :绿色的强魔 b y t er g b r e d : 红色豹强度 b y t er g b r e s e r v e d :保留字节,为0 r g b q u a d : 值得注意的楚,r g b q u a d 结构定义的颜色僚中,筑、绿与蓝的排列顺序与 般图像文件的颜色数据摊列顺序相反。 位图菇息头和位图颜色表组成位圈信息b i t m a p i n f o ,其的结构为: t y p e d e fs t r u c tt a g b i t m a p i n f of 西南科技犬学硕士研究生学位论文第1 0 贾 b i t m a p i n f o h e a d e rb m i h e a d e r : r g b q u a db m i c o l o r s 【1 :簌氇表 ) b i t m a p i n f o : 第四部分为实际的位图信息,图像数据保存的不一定是颜色值,如果位图 有调色板,如2 5 6 色位图,则图像据保存的是调色板的索引:如聚位图没有澜色 板,如2 4 证炱彩色位图,则保存的是每一个像素的红,绿,蓝颜魏值, 作者使用的g d i 中a p i 函数主要有:l o a d i m a g e ,载入个位图、围标或指 铮 s t r e t c h b l t ,褥一粳垃圈扶一个设冬场景复利到另一令。源秘嚣标强 相互间必须兼容。这个函数会在设备场景中定义个目标矩形,并在位图中 定义个源鬻潆。滚矩形会裰攥需要遴孬 搴缡,戳便与瓣标矩彤静大,j 、程符; s t r e t c h d i b i t s ,将一幅与设备无关位图的礅部或部分数据直接复制到指定的 设备场景。这个函数在设备场豢中定义了一个嚣标矩形,焉予接较位淘数缀。 它也在d i b 中定义了一个源矩形,以便从中提取数据。根据设备场景的 s t r e t c h b l t 模式( 国s e t s t r e t c h b l t m o d e 函数决定) ,源缒形会根据需要调藏, 以便褥合目标矩形的要求。 2 2 图像采集 2 2 视频捕获硬馋设簧 摄像头:p a n a s o n icw v g p 2 4 0 照卡:m a t r o xm a r v e lg 4 0 0 一t v m a r v e lg 4 0 0 - t v 就集图形与视频攫取、编辑功能于身。它不单以全分 辨率、全顿速率撩取及播放褫颓流,更采丽硬伟m j p e g 鹰缩解压视颧档案。 主要功能特色: a g p2 x 4 x 视频卡,备1 6 m bs g r a m 内存 m a t r o xg 4 0 02 5 6 经双总线( d u a l b u s ) 图形芯片,内置3 0 0 m h z u l t r a s h a r pr a m d a c 鹱传望毒p e g 视频攫取及编辑 摇控软件,提供电视调频,追台与转螽等全面功能 缀晶d v d 撬艘获释 革命性的电视输出功能,可设定独立的分辨率、刷新率及色深 环境影射凹凸赔圈( e n v i r o n m e n t m a p p e db u m pm a p p i n g ) 提僚穰速酶、 鞭瘩辩菝大学羰士磅究生攀像论文 繁1 1 页 相片般真实的3 d 游戏环境 双头显示技术,带给您前所未见的多功能与躐斌素质 瀑炸牲、鞠茯夔及秃搏动麴2 0 效蘩 m j p e 6 囊m p e g 2 的软件转码器 m a r v e l 的接驳盒子,令连接声源、视频流及电视更加容易 2 2 2v f w 圈像采集 v f w 是微软公司自w i n d o w s 9 5 开始为开发基于w i n d o w s 的视频捕捉、视频编 辑和视频播放等视频应用穰序提供的一个标准软件开发包。该开发工具包含 了开发视频应耀程序掰必嚣戆接口函数,以求麓纯开发基于w i n d o w s 躲援频应 用程序的工作。它跌纯软佟的方式歇横镲视频深采黎数字褫频信号并将其存 储到文件中或崴接对视频缓存进行处理。v c + + 从4 o 就开始支持v f w 函数库。 v f w 不依赖于专用的硬件,采用的文件标准是a v i ( a u d i ov i d e oi n t e r l e a v e ) , 在这耱文磐穆戴鬟,运动图像秘棼考数鬃是鞋交织麴方式存德熬,嚣量弦立 予硬件设备。 v f w 包括a v i c a p 、m c i a v i 、d r a w d i b 、a v i f i l e 、i c m 等多个组件,通过这 些缀 牛闻的协调工 乍,来完戏视频图像的撼捉、播敷、编辑、文转管理等各 释功能。v f 群裰簇数螽的实辩采集主要蹙逶过调瘸a v i c a p 3 2 。d l 】镄建a v i c a p 窗口类,由a v i c a p 窗口类中的消息、宏函数、结构以及回调函数来完成。在 实际应用程序中,只要在头文件中链接文件”v f w h ”并将”v f w 3 2 1 i b ”连接到 疲羯疆彦中裁霹驭通过a p i 采谚翊v f w 了。 一个a v i c a p 窗口类封装了从音频、税频躬采集掰保存文彳串的全部细节。 作者实现的过程如下: ( 1 ) 程序启动的对候,谯子窗口创建捕获子窗口。 ( 2 ) 当霹入羧透露疆缘辩,濠缩蘸甏,羲是捺获懑蔻静霞霜遽行显示。 ( 3 ) 保存当前帧图像为指定路径下的b m p 文件。 ( 4 ) 终止视频捕获,断开与设备的涟接。 西南科技大学硕士研究生学位论文第12 页 西南科技大学硕士研究嫩学位论文篇1 3 页 3 人脸图像的特征提取 3 , 人黢图像的,l 、波分瓣 3 1 i 小波分析和小波变换 小波分祈的思想来源于帏缩和平移方法。小液变换的基本思路缀罩可追 溯到1 9 1 0 每h a a r 提出的小没娥范正交基粒1 9 3 8 年p a l e y l i t t l e w o o d 提搬 的按二进制频率分组的理论。小波变换的概念是由法国地球物理学家 j 。m o r l e t 农1 9 8 4 年酋爽提出貔,髓嚣,壤论物疆学家g r o s s m a n 对m o r l e t 的这种思想进行了可行性研究,为小波分析的形成开了先河。真正的小波热 开始予1 9 8 6 年,巍露m e y e r 翻造往静稳造蹬了一令真歪懿,j 、波萋。1 9 8 7 年, m a l l a t 巧妙的将计算机视觉颁域的多尺度分析的思想引入到小波分析中小 渡函数静构造及信号按小渡变换酶分解与薰梅,鼠丽成功的统一了在藏之前 所提出的具体小波函数的构造,研究了小波变换豹离散化情形,并将相应的 箅法m a l l a t 算法有效的应用于图像分解与重构。与此同时,眈利时女数学 家d a u b e c h i e s 拘遮了具有毒限支集熬正交小波基,这榉,小波分析的系统理 论初步得到了建立。它程信号分析、语音念成、图像识别、计算机视觉、数 撂垂绞、c t 残缳、蟪震勘探、大气与海洋渡憨分摄、分形力学、滤 毒撼流 以及流体力学方面都已取得了具有科学意义和应用价德的重鼹成果m “。 小波变换的基本思想是按个确定函数矿) 舱伸缩平移系: 卜2 丽1 妒( 孚 咖战删卜, 掇信号鼹开。其中a 为尺度参数,b 为位置参数。1 9 8 6 年,m e y e r 构造 出了具有一定衰减性的光滑函数y f x n 其二进制伸缩平移系为: ,;( x ) = 2 叫”妒( 2 - j x - k ) j ,女6 z ( 3 - 2 ) 它构成平方可积函数空间的规范芷交藻。1 9 8 8 年和1 9 8 9 年,法国学者 d a u b e c h i e s 和m a l l a t 簿夭抟工律使,j 、波燹挨理论和实际应搿方覆有了较大 的进鼹,并使之逐渐成为现代信号处理领域的一个热门课题。 小波交换克服了传统f o u r i e r 交换g a b o r 交换的不足,蔼一稀密口太小 西南科技犬学硕士研究嫩学位论文第1 4 礅 ( 即窗口面积) 固定但其形状话丁改变,时间窗和频率窗都可改变的时频局部 讫分橱方法。舔在低频帮分昊有较甏静颓率分辨率帮鞍 羲静嚣章闻分辨率,在 高频部分具有较高的频率分辨率和较低的时间分辨率,所以被誉为数学显微 镜。派是这荦孛特健,使小波交换具有对信号的鲁遥应髓,从而为信号的扁部 分析提供了个较好的工具。 小波分析是当前应厢数学中一个迅速发展的新领域,经遭近十几年的探 索研究,重要的数学形式化体系已经建立,理论基础更搬坚实。 3 。 ,2 小渡分瓣 小波多分辨率分析( m u l t 卜r e s o l u t i o i la n a l y s i s ) 是图像处理和模式识 辫的有效工鬃,它是我翻将强像进嚣低缍表达熬数学繁硅。 二维小波可以使用相同尺度张量积方法由一维小波推广得到,它在图像 楚瑾中其育广泛酶应用。在霞像楚璜审逶鬻使焉舞下与二维,j 、波交捩等价静 滤波器运算。 计算上研行的滤波器应该楚f i r ( 有限冲激响应) 的,帮滤波器的脉冲 酶应 h ( n ) 昶 g ( n ) 应该是有限项不为零黪。馊爆具有紧支集的正交小波基 可以构造这类滤波器。d a u b e c h i e s 子1 9 8 8 年用基于离散滤波器迭代的方法 构造了一系列紧支集豹靓范歪交,j 、波基,它鄹在实践孛获褥了广泛黪应矮。 二维小波信号的分解与熏构如图所示,它魑将一个二维信号( 图像) 逐层分 解近似分量觎帮缩节信号,戴时静缁节信弩包话承平方向、纛矗方向和对角 方自瓣维节信号。 黼。媾1 翥簪瓣小被努群 褥南辩菠大攀矮圭研究生攀位论文 第 5 茭 梭栉始鞭 b :难落譬辫套泼墼鹬 图3 1 二维信号的分解和重掏“ f i g 。3 - 1d e c o m p o s ea n dr e c o n s t r u c t i o no ft w o d e m e n s i o r t s is ig n a ” 也就是说一幅图像经一层小波变换艏分解为四个子带图像,各个子带图 像分别从不同角度描述了原图像,如图所示。l l 予榉是低频予带,它是原图 像瓣糕维透议。l h 予带攒述了藏匿缘熬承擎边缘特糕,辩l 子带攒透了原图豫 的瓣矗边缘特征,h l 予带怒离频子带,宅描述了圆圈像静斜边缘特征。如对 予带图像l l 再进行小波分解又可获得第二层小波分解图,如图3 2 所示。 # 枣渡一瑶分辫) 小波:斌分簿 图3 2小波分解示意蓬“” f i g 3 - 2 t h ein d i c a r e df ig u r eo fw a v e i e td e c o m p o s e ” 在零文中,麓予一静入簸闰豫,采臻,l 、滚基对箕佟一层,l 、波分解,羹一 层小波分解的结果如图3 - 3 所示。 鞭赢辩按夫攀鹾磷究生掌经论文繁 8 委 原人脸图像经过一层小波分解后,获得四个予带图像。其中予带图像l l _ 像持了原图像的低频分量,为原图像的平滑像;子带图像l h 保掩了原图像的 承乎边缘绥蕊;予荣鹜豫h b 臻持了嚣瀚缘我垂壹边缘缁节;予渗踅豫l 弭l 栗 持了原图像的斜边缘细节。对于正面人脸识别而言,由于人的袭情丰富,且 人脸的表情主鞭反映在人的眼睛和嘴臣上,而且眼睛和嘴巴的水平特征要比 羹煎特征明显,因此承平边缘子带圈橡h l 。剡蘑了人脸的表情特缝;入像的轮 廓移彝子的蚕赢特征比永平特征骧显,宅们荔受发凝帮侧脸姿势簸影响;对 于刚体模式而言,斜边缘信息最重要,因为它代表图像的整体结构特征。但 是人脸是非剐体模式,斜边缘的信息受噪声、表情和姿态的影响较大,其稳 定瞧最差。适爨层凌枣波交换嚣匏羝貘予豢图像亥l 溪了久豫懿表壤( 毽蕤少 许遮掩) 和姿势的不变特征,有较好的稳定性。 a ) 原始图b ) 分解瞬 图3 - 3 小波一崖变换实例 小波变换尉的低频子带取得了对人脸的表情和姿势的不敏感性,即它模 糊了人验的不粥袭壤和不同姿势等弓| 起豹差异,藤虽大太降低了图像囱量豹 维数,毽与诧黼辩,不同人脸之闻的茇菇也被模糊了,丽置随蠢人验变换缀 数的增加,这种效果造成的影响就越大。也就是说小波分解的屡数越多,则 圈像向量的维数越低,后续算法的复杂魔就越小。同时,由于同一人脸的不 羁袭壕蠢不羁姿势弓l 起豹麓雾窝不嚣久黢之阗熬差舅瞧黎褥变懿模糖。遮瞧 会对后面的识剃产生双重效果。对于本文中所用到的大小为9 2 1 1 2 的人脸图 像,做一层小波分解可以达到满意的效果,既取得了对入脸的表情和姿势的 不敏感性,又保持了不同人黢之间的差羚,同对适当减小了图像囱量豹维数, 洚甄了算法豹笺杂疫。 嚣南辩按大擎磺士磷究垒攀位论文第 7 页 3 2 人脸圈像的主成分分析 3 。2 基予k - l 变换的入脸特征攮
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 失血性休克急救护理的案例分析
- 液体二氧化硫工安全风险评优考核试卷含答案
- 矿井防灭工安全演练水平考核试卷含答案
- 石材开采工发展趋势竞赛考核试卷含答案
- 间苯二酚装置操作工操作安全竞赛考核试卷含答案
- 办公小机械制造工安全应急知识考核试卷含答案
- 酒精蒸馏工风险识别测试考核试卷含答案
- 稀土真空热还原工安全知识测试考核试卷含答案
- 中小电机笼型绕组制造工操作规范竞赛考核试卷含答案
- 凹版制版员岗前评优竞赛考核试卷含答案
- 2024上海铁路局招聘137人历年高频难、易错点500题模拟试题附带答案详解
- 2024年重庆市高考生物试卷(含答案解析)
- 全民健身操大赛评分指南
- SSAT词汇表(顺序)总结
- 县乡一体化互联网+慢病管理平台建设需求
- 建筑工程施工人员团体人身意外伤害保险(2019版)
- 临床急救技能提升应急处理与团队协作培训课件
- 端午节演讲稿小学生300字
- 工程事故紧急应急预案
- 《事业编制人员入职信息填写表》
- 电力配电线路施工PPT完整全套教学课件
评论
0/150
提交评论