(计算机应用技术专业论文)基于仿生模式的人脸识别研究.pdf_第1页
(计算机应用技术专业论文)基于仿生模式的人脸识别研究.pdf_第2页
(计算机应用技术专业论文)基于仿生模式的人脸识别研究.pdf_第3页
(计算机应用技术专业论文)基于仿生模式的人脸识别研究.pdf_第4页
(计算机应用技术专业论文)基于仿生模式的人脸识别研究.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(计算机应用技术专业论文)基于仿生模式的人脸识别研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 人脸识别是模式识别研究领域的重要课题,也是目前一个十分活跃的研究方向。人 脸识别技术是以计算机为辅助手段,从静态或动态的图像中识别人脸。虽然人类从复杂 的背景中识别出人脸相当容易,但对于计算机来说,人脸自动识别确是一个十分困难的 问题。虽然目前提出的人脸识别方法很多,也有不少关于人脸识别方面的文章,但主要 是基于传统模式识别理论的方法,由于传统模式识别理论是基于统计方法的,导致这种 识别方法在进一步提高识别率方面存在不足。近年来王守觉院士提出了基于人们认识本 质方式的仿生模式识别理论,并用于实际,取得了很好的效果。 由于人脸图像特征提取的好坏直接关系到人脸建模,最终影响到人脸识别率的高 低,所以如何提取出既有表达能力又有辨别能力的特征是人脸识别的关键。又由于同类 人脸图像在高维空间中的分布呈现连续性的特点,符合仿生模式识别的同源连续性原理, 所以仿生模式模式识别可以用于人脸识别,为识别过程提高人脸识别率提供理论依据。 本文针对基于p c a 与l d a 变换的传统人脸识别方法识别率低但特征提取过程中维 数低和基于k - l 变换的仿生人脸识别方法识别率高但在特征提取过程中维数过高的问 题,将两者的优点相结合:在特征提取过程用p c a 与l d a 方法提取出既有表达能力又 有辨别能力的人脸特征,在识别阶段用仿生模式识别方法进行人脸识别,提出了一种基 于p c a 与l d a 变换的仿生人脸识别新方法。分别用p c a 与l d a 变换对训练人脸样本 进行特征提取,然后组合p c a 与l d a 空间得到最优变换子空间,用这个子空间作为变 换空间进行人脸特征提取,把提取的人脸特征映射到高维空间,并用甲3 神经元进行几 何形体覆盖,得到各类人脸的覆盖区域;把待识别人脸特征映射到高维空间,通过判断 其在各覆盖区域的归属情况来识别人脸,如果它落在哪类人脸覆盖区域内,则就属于此 类人脸,否则拒识它,则不属于任何一类人脸。本文提出的人脸识别方法是一次大胆尝 试,实验收到了预期的效果,证明了此方法的可行性。 关键词:人脸识别;主成分分析;线性鉴别分析;k - l 变换;仿生模式识别 a b s t r a c t f a c er e c o g n i t i o ni sa ni m p o r t a n ts u b j e c to fp a t t e r nr e c o g n i t i o nr e s e a r c ha r e a ,a n di sa l s o av e r ya c t i v er e s e a r c hd i r e c t i o na tp r e s e n t t h ef a c er e c o g n i t i o nt e c h n o l o g yi s t a k et h e c o m p u t e ra st h es u p p l e m e n t a r ym e a n s t h a td i s t i n g u i s h e st h ep e r s o nf a c ef r o ms t a t i cs t a t eo ri n t h ed y n a m i ci m a g e a l t h o u g ht h eh u m a n i t yd i s t i n g u i s h e st h ep e r s o nf a c ef r o mt h ec o m p l e x b a c k g r o u n dt ob eq u i t ee a s y , b u tt ot h ec o m p u t e r , t h ep e r s o nf a c ea u t o m a t i cd i a g n o s i si sr e a l l y av e r yd i f f i c u l tq u e s t i o n a tp r e s e n t ,t h ep e r s o nf a c er e c o g n i t i o nm e t h o d sp r o p o s e da r em a n y , a n da l s ot h e r ea r em a n ya r t i c l e sa b o u tt h ep e r s o nf a c er e c o g n i t i o n b u tt h e s em e t h o d sa r e m a i n l yb a s e do nt h et r a d i t i o np a t t e r nr e c o g n i t i o nm e t h o d ,b e c a u s et h et r a d i t i o np a t t e r n r e c o g n i t i o nt h e o r yi sb a s e d o nt h es t a t i s t i c a lm e t h o d ,c a u s i n gt h i sk i n do fr e c o g n i t i o nm e t h o d s t of u r t h e re n h a n c et h er e c o g n i t i o nr a t ea s p e c tt oh a v et h ei n s u f f i c i e n c y i nr e c e n ty e a r s a c a d e m i c i a nw a n gs h o u j u ep r o p o s e dt h eb i o l o g i c a lp a t t e r nr e c o g n i t i o nt h e o r yw h i c hb a s e d 0 1 1t h ew a y p e o p l ek n o wt h ee s s e n t i a l ,u s e st h i st h e o r yi nt h ep r a c t i c e ,a n dh a sm a d e t h ev e r y g o o dp r o g r e s s b e c a u s et h eq u a l i t yo ft h ep e r s o nf a c ei m a g ef e a t u r ee x t r a c t e dd i r e c t sr e l a t i o np e r s o n f a c em o d e l i n g , f i n a l l ya f f e c t st h ep e r s o n + f a c er e c o g n i t i o nr a t e ,s oh o wt oe x t r a c tt h ef a c e f e a t u r ew h i c hb o t hh a st h ep o w e ro fe x p r e s s i o na n dt h ed i s t i n g u i s h a b l ea b i l i t yi st h ek e yt o f a c er e c o g n i t i o n a n dt h es a m ep e r s o nf a c ei m a g e s d i s t r i b u t i o np r e s e n tt h ec o n t i n u i t yi nh i g h d i m e n s i o ns p a c e ,w h i c hb ei nc o n f o r m i t yw i t ht h ep r i n c i p l eo fh o m o l o g o u sc o n t i n u i t yo f b i o m i m e t i cp a t t e r nr e c o g n i t i o n ,t h e r e f o r eb i o m i m e t i cp a t t e r nr e c o g n i t i o nc a nb eu s e df o rf a c e r e c o g n i t i o n ,a n dp r o v i d e s t h et h e o r e t i c a lb a s i so ni m p r o v i n gf a c er e c o g n i t i o nr a t ei n i d e n t i f i c a t i o np r o c e s s an e wm e t h o do fb i o m i m e t i cp a t t e r nf a c er e c o g n i t i o nt h e o r yb a s eo np c aa n dl d a t r a n s f o r mi sp r o p o s e di nt h i sp a p e r t h i sm e t h o dh a ss o l v e dt h el o wr e c o g n i t i o nr a t ep r o b l e m b u td i m e n s i o ni sl o w e ri nt h ef e a t u r ee x t r a c t i o np r o c e s sa n dh a sa l s os o l v e dh i 曲r e c o g n i t i o n r a t ep r o b l e mb u tt h ed i m e n s i o ni se x c e s s i v e l yh i g hi nb i o m i m e t i cp a t t e r nf a c er e c o g n i t i o n b a s e do nk - lt r a n s f o r m a t i o n t h i sa r t i c l ea i m sa tt oe x t r a c tb o t he x i s t i n ge x p r e s s i o na n d d i s c r i m i n a t i o no ff a c i a lf e a t u r e si nt h ef e a t u r ee x t r a c t i o np r o c e s sw i t hp c aa n dl d am e t h o d i l a n di nt h er e c o g n i t i o ns t a g ew i t ht h eb i o l o g i c a lm o d e l l i n gp a t t e r nt od i s t i n g u i s hf a c e u s i n g p c aa n dl d at r a n s f o r mt oe x t r a c tf a c ef e a t u r e sa n dt h e nc o m b i n a t i o no fp c aa n dl d a t r a n s f o r ms p a c et oo b t a i nt h eo p t i m a ls u b s p a c e ,a n du s i n gt h i ss u b s p a c ea st r a n s f o r ms p a c ef o r f a c i a lf e a t u r ee x t r a c t i o n ,t h e nt h ee x t r a c t i o no ff a c i a lf e a t u r e si sm a p p e dt oh i g h d i m e n s i o n a l s p a c e ,a n dc a r r i n go nt h eg e o m e t r yp h y s i q u ec o v e rw i t ht h e 甲3n e u r o n ,a tl a s to b t a i n i n g e a c hk i n do fp e r s o nf a c e sc o v e ra r e a t h ef a c i a lf e a t u r e st ob ei d e n t i f i e da r em a p p e dt o h i g h e r - d i m e n s i o n a ls p a c e ,b ya s s e s s i n gt h ec o v e r a g ea r e ao fv e s t i n gc o n d i t i o n st oi d e n t i f y h u m a nf a c e :i fi tf a l l so nw h i c ht y p eo ff a c ec o v e r a g ea r e a ,t h e ni tb e l o n g st h i st y p eo ff a c e ,o r r e j e c t si t ,i td o e sn o tb e l o n gt oa n yc l a s so ff a c e t h ef a c er e c o g n i t i o nm e t h o dt h i sa r t i c l e p r o p o s e di sab o l da t t e m p t t h ee x p e r i m e n th a sr e c e i v e dt h ea n t i c i p a t e de f f e c t ,a n dh a sp r o v e n t h i sm e t h o df e a s i b i l i t y k e y w o r d s :f a c er e c o g n i t i o n ;p r i n c i p a lc o m p o n e n ta n a l y s i s ;l i n e a rd i s c r i m i n a n ta n a l y s i s ; k - lt r a n s f o r m a t i o n ;b i o m i m e t i cp a t t e r nr e c o g n i t i o n i i i 长沙理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得 的研究成果。除了文中特另, j d h 以标注引用的内容外,本论文不包含任何其他个 人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集 体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承 担。 作者签名:日期:年月 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和 借阅。本人授权长沙理工大学可以将本学位论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密团。 ( 请在以上相应方框内打“4 ) 作者签名: 聊繇谢 日期:年月日 日期:bi 。年6 月r 日 第一章引言 人脸识别是模式识别研究领域的重要课题、也是跨学科的一个课题,也是当前研究 的热点,是现在很活跃的研究方向。人脸识别技术是以计算机作为工具从静态或动态的 图像像中找到有用的信息,来识别人脸的- - f l 技术。这个问题可描述为:给定一幅静止 或动态图像,把已经存在的脸脸数据库作为标准,来确认场景中的人在不在数据库中,这 个过程是人脸确认。或者确认待定的是库里的哪个人的过程是人脸识别。分辨人脸是我 们从小就能做到的事情,但对计算机来讲不是那么容易的问题了。这个问题的之所以困 难,是因为:第一点,虽然人都有眼鼻嘴,但每个人都不一样,在图像中反映也不同;第 二,人脸也有一些易变化的东西,比如有时带眼镜,胡子可以刮掉等,这些都是暂时的, 所以如果从仅有的几个图像中检测或识别人脸则是相当困难的。还有就是人有哭、笑、 咧嘴等表情,这样脸的形状时刻发生着变化,再有人脸受光线和明暗程度影响,也使姿 态万千。总而言之,人的形态是变化多端的。所有这些因素都让人脸识别这个课题复杂 化了。最后,人脸识别研究是模式识别、图像处理、计算机视觉、人工神经网络及神经 生理学、心理学多个领域的交叉学科,所有这些不能不使人脸识别的难度增加了。 1 1 选题背景 1 1 1 问题的提出 如今,科学技术日新月异,计算机和网络都快速发展,信息安全显得异常重要。怎 样更方便有效地进行身份验证和识别,成了如今十分棘手的课题。尤其是零三年的恐怖 事件后拥有最先进技术的美国为了国家安全,也立法要用生物技术进行安检,零三年六 月生物技术在护照中应用,以便在入境时进行个人身份安检。于是各国都竟相发展生物 特征识别的技术。 现在研究的生物特征识别技术最主要有几个:人脸识别、虹膜识别、手形识别、指 纹识别、掌纹识别、声音识别、签名识别等。这几个识别中,人脸特征是最直接和自然 的对人进行身份验证的手段了。 人脸识别技术是用计算机对人脸图像处理的技术,分析后再从中提取出对识别有用 的信息,用提取出的这些有用信息来辨别身份。同时有直接友好方便而稳定的特征。并 且有不容易被用户发现,和容易被用户接受口3 的特点。特别是如果识别对象不方便被接触 进,它的优越性就更能体现出来了。具体归为如下几方面: 1 由于人脸获取是不用接触对象的、不会对对象有任何侵犯的,所以对象很容易地 收集到。 2 当识别时不用和别人相互配合就能完成,无需对行为作限制,更没必要进行正常 行为的矫正; 3 是目前唯一可以用于监控系统的技术: 4 隐蔽性好。是反恐安防最重要的科技手段和攻关目标之一。 虽然人脸识别有这么多优点,但若使人脸识别技术达到人类的识别能力却是一个相 当困难的问题,还有很长的路要走。第一,虽然眼睛、鼻子、嘴巴等是人脸的固有特征, 有其一特定的空间结构,但是人和人各不相同,他们有不同的人脸特征。第二,胡子是 容易消失的特征,眼镜也不是人固有的特征,这些都容易变化。图像的明暗程度是随时 间不同而变化的,所有这些不固定的特征给人脸检测带来不稳定的因素,使它人脸检测 变得困难加大。 1 1 2 人脸识别的应用 人脸识别技术在计算机视觉及相关领域中作为一项关键技术,在现实中的应用主要 在以下几个方面乜矧 1 门卫系统在登录要求严格的部门和机关政府无人执守的门卫系统,通过人脸进 行验证。也可在计算机或上网时用人脸识别登录代替输入变通密码,这样也不用携带、 不怕丢失或被盗,文件的安全性得到了很大程度的保障。 2 刑事审讯典型的应用是在罪犯识别方面。基本方法是对比目标特征和数据库存 储特征的相似性。目标图像的自然属性决定着整个技术的难易程度。在驾使证和护照上 也应用。 3 视频监控一般也就是在被监控人未警觉到的情况下进行的。采用人脸识别,监 控者可以从拥挤的人群中找到要寻找的人。并且如果图像质量是不可控的,一个环境中 存在多个人脸,这些人脸存在尺度、姿态、视角和光照等的变化,人脸识别则方便做到。 4 电子商务在线金融和贸易活动和商业活动都需要无拒付地良性运转,此时需要 对保证客户的身份安全进行认证,而人脸识别技术则可以为此提供保证。这对交易双方、 银行都是十分方便的。 5 人机交互我们一般意义上的人机交互主要指人与计算机之间通过键盘或者鼠标 2 等来完成交互。采用人脸识别技术,用计算机识别操作对象的表情、嘴唇等动作,这样 计算机的智能水平则会大幅度提高,人机交互的范围也会扩大。 1 2 人脸识别技术的研究内容 广义的人脸识另u ( f a c er e c o g n i t i o n ) 研究大体划分为以下五个方面。 1 人脸检测:首先从各种复杂的场景中检测出人脸的存在性,其次是对于其位置的 确定。其中受光照、噪声、面部倾斜度以及各种各样遮挡等都对它产生很大影响。 2 人脸表征:通常意义上的人脸特征提取过程。这个过程实现把人脸图像转换成特 征向量或并生成特征空间。生成了特征空间也就生成了人脸和数据库的表征方式。通常 的表征方式有几何特征法( 如欧氏距离、曲率、角度) 、代数特征法( 如矩阵特征矢量) 、 特征脸法、云纹图、固定特征模板等。 3 人脸鉴别:通过对比分析待识别人脸与数据库中的人脸得出结论。怎样选择适当 的人脸表征方式与匹配策略是本阶段的关键问题。 4 表情分析:通过分析人脸表情得到相关信息,然后归类。 5 生理分类:通过分析人脸的特征得到性别及年龄等有用信息。 人脸检测、人脸表征和人脸识别就是通常意义上人脸识别的三个阶段。 人脸进行检测与定位,首先从输入的图像中分割出人脸,这过程是人脸检测。然后对经 过归一化人脸图像进行特征提取与识别。 1 3 人脸识别技术的发展 人脸识别技术的研究已有很长的时间了。可以从1 9 世纪说起,g a l l o n 对人脸的研究 是,他把人脸侧面特征用一组不同的数字来代表。输入特征分为:正面、倾斜和侧面。但 实际中主要是对人脸正面模式的研究。大体划分为三个发展阶段: 第一阶段:以人脸面部特征为主要研究对象,研究人员以b e r t i l l o n a l l e n 和p a r k e 为 代表。在b e r t i l l o n 构建的模型中,用一个简单的语句和数据库中某一张人脸建立起联系, 并通过指纹分析,构建出一个人脸识别系统。为了提高人脸识别率,a l l e n t 4 1 为待识别人 脸设计了一种解释,p a r k e 并建立了一种高质量的灰度人脸模型。由于这一阶段识别过程 全部由操作人员亲自来完成,所以不能说是一种自动识别系统。 第二阶段:人机交互阶段。本阶段代表性的工作有g o l d s t i o n l h a r m o n 和l e a l 【用几何 特征参数来表示人脸正面图像。他们采用二十一维特征矢量表示人脸正面特征,并设计 出了基于特征矢量表示法的识别系统。k a y a 和o b a y a s h i 则采用了统计识别方法,把人 特征【5 l 用欧式距离来表示。t k a n a d ( m n a g a o ) 设计出一个有一定知识引导的半自动回溯 识别系统3 ,它实现高速的识别,在这个系统中有创造性地运用积分投影法从单幅图像上 计算出一组脸部特征参数,再利用模式分类技术与标准人脸匹配。k a n a d 设计的系统做 到了实时、加速处理,可以说是一个巨大的跨跃。很少人能知道b a r o n t 7 j 在这方面做的 工作。用灰度归一化处理图像,再利用库中的第幅标准图像与掩膜之间的相关系数,一 次性地作为判别依据。所以这些只有在操作员具备先验知识的情况下才能胜任。故这个 阶段的系统仍然摆脱不了人的干预,不是完全自动的人脸识别系统。 第三阶段:真正自动识别阶段。近十余年来,计算机更新换代加快,计算机的发展 其速度和性能飞快发展。所以人脸模式识别方法有了很大的突破,涌现了多种 全自动识别的系统【3 4 】。根据人脸表征方式的不同,可以把人脸正面自动识别技术划分为: 基于几何特征的人脸正面识别方法,基于代数特征的人脸正面识别方法,和基于基于连 接机制的人脸正面自动识别方法三大类。 1 基于几何特征的人脸正面识别方法 这类识别法中人脸用一个几何特征矢量来表征,分类器的设计是用层次聚类思想来 设计的。本阶段要求选择的几何特征矢量要有一定的独特性,同时能体现出不同人脸间 的差异,且有能够反映不同人脸之间的差别,同时又要有弹性,才能消除光照和时间等 的影响。 2 基于代数特征的人脸正面识别方法 与上面的表示方法类似,这类方法仍然用特征矢量来表征人脸,不同的是用的的代 数特征矢量:把人脸图像在由“特征脸 张成的降维子空间上投影。s i r o v i c h 和k i r b y t n 首 先将k l 变换用于人脸图像的最优表示。t u r k 和e n t l a n d t 8 】进一步提出了“特征脸 方法, 这种方法训练样本集的总体散布矩阵作产生矩阵,特征矢量由k l 变换产生,称“特 征脸”。这样由“特征脸”矢量便生成一个子特征子空间,把投影到这个特征空间可以得 到一坐标系数,表明了此人脸在这特征子空间的空间位置。实验表明了该方法有较好的 鲁棒性,可以作为人脸识别的依据。 3 基于连接机制的人脸正面自动识别方法 4 该类识别法中,把人脸用二维灰度矩阵的灰度图表达,神经网络的分类能力及及学 习能力n 。这种方法中,人脸图像的材料信息及细小开关丢失,使得提取牲发容易。且 由于图像是作为整体输入的,这正符合格氏塔心理学中对人类识别能力的解释。与前两 种识别方法相比,这类识别法具有两点明显不同: ( 1 ) 信息处理方式由串行变为并行 ( 2 ) 分布的编码存储方法 经过实验,在有噪声存在的情况下,更有甚者,在图像被物体掩盖的时候,系统都 会无误地把人脸图像复原出来。无疑是对神经元识别能力的一种肯定。 1 4 本文主要研究工作及内容安排 1 4 1 本文主要研究内容 虽然人脸识别的方法很多,但是针对特征提取进行的人脸识别方法和针对模式识别 进行改进的的方法都只顾其一,要么是提取了的特征维数低了,受识别理论的限制识别 率得不到提高;要么就是识别率提高了但是特征提取过程中运算量大,但是识别速度慢 了。如基于p c a 和l d a 变换的传统人脸识别方法,虽然提取出的人脸特征维数低,运算 量小,但进行人脸识别时由于都是以“最佳划分为目标,把待识别对象划归为训练 样本中的某一类,所以正确识别率受传统识别理论的限制不能再提高;而仿生模式的人 脸识别方法与传统的方法不同,它以认识为基础,用高维空间几何覆盖理论对人脸样本 在形成的复杂几何形体高维空i 日j 进行剖析,大幅度地提高了识别率。但是它在特征取过 程中运算量大,提取了的特征维数很高,识别率停止不前,所以本文避开两种识别方法 的缺点,结合两种识别方法的优点提出了融合p c a 和l d a 变换的仿生人脸识别方法。 本文作了以下工作:用p c a 和l d a 两种方法相结合提取出最具有表现力和最有鉴别 力的低维人脸特征,经多项式核函数将低维人脸特征向高维空间投影,再用仿生模式识 别方法在这个高维空间用神经网络对高维空问特征进行覆盖,构建各类样本的覆盖区 域,再根据覆盖结果进行识别。 判别规则为:待识别人脸特征落在哪类人脸特征的高维空间几何体覆盖区域内,待 识别人脸就属于哪类人脸,如果没有落在任何一个覆盖区域,则拒识它,说明它不属于 任何该训练样本中的任何一类人脸。实验收到了预期的效果,证明了此方法的有效性和 可行性。 1 4 2 本文结构安排如下 第一章引言。简单介绍了人脸识别问题的定义及其应用前景、人脸识别技术的主 要研究内容和历史发展,并对本文研究的主要内容及其成果作了概括说明。 第二章仿生模式识别的基本原理与实现方法。对仿生模式识别的基本原理及实现 手段做了详细的阐述,分析了针对不同识别类型,怎样选取不同的神经元构建神经网络。 第三章仿生模式识别在实际中的应用。对仿生模式识别在各方面应用所取得的成 果进行了阐述,并与现有的传统模式识别方法做了比较,证明仿生模式识别方法的优越 性。从而证明本文用仿生模式识别方法来进行人脸识别的可行性。 第四章人脸图像的预处理。对人脸识别过程中的图像预处理方法进行了介绍。包 括对人脸图像进行几何归一化,图像增强,图像平滑等工作,来为后续的特征提取提供 高质量的图像。本文在图像增强方面用直方图方法对o r l 标准人脸库也进行了简单的预 处理。 第五章基于仿生模式的人脸识别研究。本章详细阐述了本文的基于仿生模式的人 脸识别方法,并进行了实验,实验结果表明本文所提出的人脸识别方法是可行的,与以 往的识别方式相比,正确率大大提高。 第六章总结与展望。对仿生模式识别理论及人脸识别技术研究做了总结与展望。 6 第二章仿生模式识别的实现方法 模式识别是人工智能一个重要研究应用领域,始于上世纪二十年代。到六十年代模 式识别迅速发展成一门独立学科。模式识别的理论及方法引起科学界多领域的广泛的重 视,并在现实中有广泛的应用。在现实中的应用同时推动了人工智能系统的向前发展, 扩宽了计算机的应用范围。 2 1 传统模式识别概述 2 1 1 模式识别概述 现实中能看得到的事物,如果它们可以用相同或相似来区分或区别的话,这些就能 称为广义的模式嘲。从狭义上讲,模式是一种时空分布的信息,这种时空信息是对具体的 事物进行观测所得到的,把同一类中模式的总体称为模式类。模式识别就是按某种规则 把打乱的东西重新分到各自所属的类别中去。 长期的生活实践使人们对不同事物的辨别能力同渐增加,同时储存了一些知识,根 据这些知识来辨别事物成了人们的一项技能。人们可以根据物体的颜色、形状、质材、 组成及相互组成部分间的结构关系区分不同物体;也可根据人的高矮胖瘦、性别、年龄、 肤色及脸型等特征把不同的人加以区分。 我们分辨事物的能力看起来是极平常的,如猫和狗它们以有认识自己的主人一样的 道理没有人会产生怀疑。不止如此,连更低级的动物躲避敌害和寻觅食物。所有这些是 生物的本能,只有这样它们才能适应环境生存下来。它们对事物的分辨能力也很高。很 长一段时间心理学家都没有意识到模式识别可以当作一个问题来研究。普遍认为识别对 象是一种的广泛认知能力,像苹果落地一样没有意识到是地球的引力作用,而认为是自 然的现象,在没有计算机的时候,它的难度没有被人们看到,当人们试图用计算机作工 具要把一事物和它事物分开的时,它才被发现。 2 1 2 统计模式识别的局限性 有了统计模式识别,模式识别在相当大的程度上被看成是平均风险达到最小值。十 几年来,人们对于模式识别的研究,都是从若干类别的晟好的划分开始的。支持向量是 7 1 9 7 4 年v a p n i k f l 0 1 提出来的,它是从“最优分类超平面”出发。它是目前最先进的模式识别 理论的识别机,实际效果也远不能达到人们满意。那是由于人们认识事物时不是基于划 分思想的。 人们初次认识事物时,它用的是划分还是认识的方法呢? 按传统的模式识别机理他 就会做出第一种判断。事实上他做出的决定是第二种结果。他会认为“这是一种新事物, 我不认识它 。这种认识正是人类认识事物的方式。它和传统模式识别存在本质的差别。 现实世界中认识事物把认识看得比重大一些,当细分时才注重差别,而传统模式识别则 只注意区分,不会有认识的概念。 传统模式识别的方法都是以分类划分为思想的。按一定的分类规则划分:最无缝钢 佳分类面。在算法实现上,它把不同区别为重点,即一类样本与有限类样本的划分。这 种识别方法忽略了“认识 的概念。世界上的事物是无穷尽的,人们是一类一类地认识 事物的,没有穷尽的,在认识事物的过程中,是根据事物之间的联系来认识的。 传统模式识别认识事物也有两个不足的地方:一、到未学习过的新事物时,识别结果 会把它认为是某一类已学习过的旧事物,不会有新的类别出现;二、在对未学习过的 新事物进行训练时,前面的新知识经常会被扰乱,对原来的旧事物的知识造成破坏。 2 2 仿生模式识别概述 仿生方法和传统模式识别方法是两个完全不同的理论,认识方法也不同。由于它们 的出发点的不同导致实现方式也不一样。仿生方法是一类一类认识事物,它从人们的认 知方式出发,而不是传统方法对待识别的样本进行划分的方法。按照传统模式识别方法 分类:在一个具有n 类的空间,完成一类样本与有限类已知样本的区分,用仿生模式识 别则把一类样本与无穷类样本进行区别,如果n 非常大,传统模式识别的结果会增加。 一个不认识飞机而只认识鸟的人,他第一次见到飞机时不会错误地把它当作鸟,而是看 作是没有见过的事物,也就是拒识它,这正是仿生模式识别的原理,也恰恰是人们认识 事物的过程。 仿生模式识别在概念上不同于传统模式识别, 用了“仿生 二字以示与传统识别方 法的不同。它也只是从其功能和数学模型上突出它的出发点是“认识”方面接近于人类 的识别,实现途径上达不到仿生的目的。 表2 1 仿生模式识别与传统模式识别方法的比较 仿生模式识别传统模式识别 一类样本的认识过程多类样本之间的最优划分 一类样本与无限多未知样本的区分一类样本与有限已知样本的区分 从同类样本间的相似性出发从不同类样本间的差异性出发 同类项样本进行最优覆盖不同类间寻找最优分界面 2 2 1 同源连续性原理 人类识别事物时有两种不同的归类过程:同源归类和不同源归类过程。手写汉字简 体的识别是同源的识别归类;同一个汉字的繁体和简体的识别是按逻辑知识进行的归类, 这个过程是不同源归类识别过程。繁体和简体不是源于同一个字形,是人们人为靠人们 的逻辑知识划成等号的。数学称“同源”的为同一类;先按逻辑归类,需要归在一起而 合并为同一类的为不同类。 仿生模式识别在特征空间中同类样本全体具有的“同源连续性规律 ,使它能成功地 应用于实际。 下面来讨论“同源 同类样本的连续性规律。 自然界中若存在两个“同源”同类但不完全相等的事物,但两个事物的差别是可以 渐变或量子化的,那么这两个事物间至少有一个渐变的过程,在这个渐变过程中所有的 事物都属于同一类n 。宏观世界的绝大多数事物都遵循这个规律,称这个同源样本间的 连续性规律为同源连续性原理( p h c ,p r i n c i p l e o f h o n o l o g y c o n t i n u i t y ) 。 用数学语言描述为: 彳类事物的全体在特征空间中所构成的点集彳,对于集合彳中的任意两个元素x 与 y 血y ,则对 0 ,s 任意,必定有个集合设为b ,使 b = x i ,x 2 石3 ,x 。l x l = x ,x n = y ,lcn ,p ( x m ,x + 1 ) o ,z 4 - l m l ,mcn i , bc a 在r “特征空间中。因为传统识别理论会认为训训练集中包含所有可用信息。传统模式识 别同类样本点不存在先验知识,它们的出发点是对于已知样本的划分,这个规律是人们 认识世界的规律,是客观存在的,这个知识被当作先验知识来看待提高认识事物的能力。 传统模式识别和仿生模式识别,前者在特征空间中把不同类在特征空间中的最佳划 分作为目标,某一类样本在特征空间中的分布的最佳覆面盖作为目标。两种模式识别的区 别以二维空间情况示意图2 1 示意如下。 9 图2 1 几种识别方法的二维空间示意图 图2 1 中,在特征空间中三解形、圆形、和十字形为三类不同样本,为了把三角形从 另外两类中分开,采用三种划分方法。折线为传统( b pb a c kp r o p a g a t i o n ) 的划分方式, 圆形为径向基( r b f ) 网络的划分方式,细长椭圆为仿生模式( b p r ) 的认识方式。因而, 连续性规律以分析训练样本之间的关系为基点,为仿生模式识别方法提供了可能性。 2 2 2 高维空间几何点分布理论 把连续性规律引入到仿生模式识别中后,对“事物”的认识,实质上是分析这类事 物的全体在特征空间构成的无穷点集合的“形状”的认识。仿生模式识别的理论分析数 学工具正是点集拓扑学高维流形研究的问题。它与我们以前认识的以数理统计为基础的 模式识别的数学工具有本质差别,为了防止与传统的统计模式相混淆,故称之为拓扑模 式识别。 用仿生模式识别时,特征空间尺”中任何一类事物所有在r ”中作连续映射而成的“像” 的点集不妨视为一个闭集么,集合么可以根据应用对象的不同用维数不同的流形表示。现 实应用中,采集到的对象肯定有“噪声在里面。故而,仿生模式识别在实现当中要选 集合只而不是彳作为判别事物认识的覆盖。k 为已知的一个常数 e a = 蚓p ( x ,j ,) 尼,y a ,工r ” ,n 维集合只,由于可以推断,仿生模式识别的任务就是 看“被识别事物在特征空间中的“像”属不属于集合只。 在数字信息年代,图像、决定、经验、知识等都可以化为一连串的数字,数字化是是 现代信息技术的特征。在信息技术这个概念里,空间中的一个点可以看作一组数字,也 就是这个点在高维空间的坐标值,这样数字与高维空间就建立了本质的联系,这样高维 1 0 空间数字化有利于空间点的分布分析,将数字化对应于高维空间中的点也能分析数字化 的几何含义。所以数字与高维空间建立了联系,开拓了新思路、研究思路、提出了新算法、 创建了新的模型。 提出并创立高维空间点分布理论n 1 。1 引以后,王守觉院士用高维空间画法几何作为工 具,将多维信息映射为高维空间中的点,通过分析高维空间这些点的分布状态以及几何 体的性质来来研究多维信息之间有什么关系。这种方法很容易实现,再通过并行运算, 运算速度能得到提升,应用到好多领域n 神1 | ,成绩斐然。 2 2 3 多权值神经网络 针对传统模式识别的缺陷,创造性地提出了“仿生模式识别”概念。为了能把这种 理论应用到实际中,提出“多权值神经元网络”算法作为仿生模式识别的实现手段。目前 这种模式识别方法在许多领域都得到了应用 2 2 - 2 4 ,而且效果理想。更为重要的是,由此模 式识别开创了全新的发展方向。 1 高维空间几何形体覆盖 仿生模式识别具有同源连续性的先验知识为在特征空间分析一类事物本质特征提供 了依据。也就是说对一类事物的认识,本质上就是对该类事物的全体在特征样本空间中 所构成的几何覆盖形体的认识与分析。如果样本点集合是具有连续性,则它就是一个拓 扑空间,所以可以把点集拓扑学中的流形看作为生模式识别的基本数学分析工具。 实际识别时,为了判断某待识别样本点是否属于某类别a ,数学上就是点x 的像在 特征空间中的像能否落在n 维覆盖体只内。要达到这个目的,要用软件或硬件来实现。 这个与覆盖集合的近似于n 维空间形体,是以不同维数的“流形的 中无限个点作球 心,r 为半径的无穷个n 维超球体的并集,它是集合a 与n 维超球体作拓扑乘积运算得 到的。 根据维数理论瞳5 l ,如果把一个n 维空间一分为二,必须用一个n 1 维的超平面或超曲 面作为分界面。恰好人工神经网络的每个神经元正是这个1 1 维空间中的一个n - l 维的超平 面或者超球面,此时分r 。为两部分,再由于多权值神经元理论嘶1 中神经元也可以是各种 各样复杂的封闭超曲面。因而,人工神经网络方法是仿生模式识别最好不过的实现手段 了。 目前为止人工神经网络还是很难利用严格的数学理论对其进行定量分析,仿生模式 识别所采用的人工神经网络分析方法抛开用复杂的代数语言进行描述,而定性的几何手 段来描述,并分析样本间的空间关系,从而来实现对事物的识别。 利用“多维空间中非超球复杂几何形体覆盖”识别原理作识别手段,用人工神经网 络高维空间几何分析n 2 1 的方法来分析和实现对事物的识别,所以仿尘模式识别“认识事 物”的过程可以看作是利用多权值神经元网络,并建立高维空间封闭超曲面来完成对事 物最佳覆盖的过程。 广义的一个神经元数学语言解释为: y = 厂卜( x ,吐,x 。) 一秒】 ( 2 1 ) 式( 2 1 ) 中,厂( ) 是神经元非线性输出转移函数,秒是神经元阈值,w ( x 。,z 2 ,x 。) 是神经元基本运算规则,其中包含了w 权值。 针对几种常见神经元,它们的基本运算规则说明如下: b p 神经元,数学式为: v ( x 。,x 2 ,z 。) = w f - ( 2 2 ) r b f 神经元式为: 甲( 工。,x 2 ,x 。) = ( t 心) 2 】尼 ( 2 3 ) 从上面描述可知,神经元与多维空间中的一个超平面或者一个超曲面相对应,其方程 式为: 基。 甲( x l ,x 2 ,x 。) 一0 = 0 ( 2 4 ) 其中输入空间的输入点偏离该超平面或超曲面的程度作为神经元输出函数f ( o ) 的 这样复杂的神经元模型与几何意义就建立了联系,有助于我们更形象更直观地对神 经元模型的理解。 从几何角度方面解释就是仿生模式识别在识别事物的过程中提出了多权值高阶神经 元网络模型,并建立合理的高维空间复杂封闭几何体由此实现对样本的最佳覆盖。 多权值神经元的通用数学模型为: y = f 卜( 彬,以) 一0 j ( 2 5 ) 其式( 2 5 ) 中,暇,既为m 个权值矢量;x = 【x 1 ) x :,工。】作为输入矢量, 秒作为多权值神经元的激活阈值;甲为计算函数,由多权值神经元决定( 其中多个矢量 输入,只有一个标量输出) 厂( ) 作为非线性转移函数。 神经元函数在空问形成是一个闭合的超曲面轨迹,用双权值神经元模型表示如下: 1 2 阿阿隅刊一秒 j 汜6 , 上式( 2 6 ) 中,y 是神经元输出,堤神经元的激励函数,目是双权值神质经元闭值, w f 和以分别作为由第j 输入端连到神经元的方向权值及核心权值,x ,作为第j 个输入端 输入;n 是空间维数,p 是参数,s 是决定单项正负号方法的参数。 仿生模式识别的认知原理和具体实现的手段能很好的表达人类的认知过程,这点是 传统模式识别远不能比的。这使得机器识别和自学习能力都有了极大的提高窿k2 7 驯,仿生 模式方法在语音识别 9 0 , 9 ”、人脸识别、系统优化等相关领域取得很大成功口2 删。 2 几种单纯形神经元: 当用仿生模式识别方法识别具体事物时,最重要的就是“高维空间中复杂几何形体 覆盖 神经元的选取。高维特征空间中样本点的分布形态比较复杂,“高维空间复杂几何 体的覆盖”的方法也较灵活,选取何种覆盖方法,要根据事物本身的特性来设计,才能 构造出在特征空间适合事物分布规律的几何形体。 ( 1 ) 超香肠神经元模型 超香肠神经元的提出 “超香肠 神经元n 门几何模型只针对视角为水平方向,所以观察的事物的“像 是 只能有一个自由变量而构造的形体。正因为这样,某一类目标事物的位置不会有变化, 改变的只有其角度的旋转。这样得到的空间形体应当呈现成一维流行分布,最理想的情 况下,形体应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论