结合分块DCT系数及其统计特征的人脸识别_第1页
结合分块DCT系数及其统计特征的人脸识别_第2页
结合分块DCT系数及其统计特征的人脸识别_第3页
结合分块DCT系数及其统计特征的人脸识别_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、computer engineering and applications 计算机工程与应用2012,48(30)193结合分块 dct 系数及其统计特征的人脸识别刘凡秀,蔡茂国,陈章乐liu fanxiu, cai maoguo, chen zhangle深圳大学 计算机与软件学院,广东 深圳 518060college of computer and software, shenzhen university, shenzhen, guangdong 518060, chinaliu fanxiu, cai maoguo, chen zhangle. combination of coef

2、ficient and statistical features of block dctfor face recognition. computer engineering and applications, 2012, 48(30):193-196.abstract:a face recognition algorithm based on coefficient and statistical features of block dct is proposed. theimage is partitioned into a set of blocks, choosing the dct

3、coefficient of the low frequency part as its features. at the same time the dct transform is performed on each block in order to decompose it into a low-pass filtered image and a reversed l-shape blocks containing the high frequency coefficients of the dct; the statistical measures such as mean, var

4、iance, and entropy rate are then computed on the low-pass filtered image and a reversed l-shape blocks; svm and the nearest neighbor classifier are selected to perform face classification. the experimental results on orl and yale face databases show that the algorithm based on statistical features o

5、f block dct achieves high recognition rate.key words:discrete cosine transform(dct); support vector machine(svm); nearest neighbor classifier; statis-tical features; face recognition摘 要:提出了一种基于分块 dct 系数及其统计特征的人脸识别算法。对图像进行分块,对每一块进行 dct变换,选择低频部分的系数作为识别的特征,将每一块分解为一幅低通滤波图和一个包含 dct 高频系数的反 l 型块;分别对这两块求其均值

6、、方差和熵这三个统计特征;利用支持向量机(svm)和最近邻分类器对这些特 征进行分类识别。在 orl、yale 人脸数据库上的仿真实验表明,使用基于分块 dct 系数及其统计特征可达到 较高的识别率。关键词:离散余弦变换(dct);支持向量机;最近邻分类器;统计特征;人脸识别文章编号:1002-8331(2012)30-0193-04文献标识码:a中图分类号:tp3911引言当今社会,随着信息化进程的深入和互联网的 迅速发展,信息的安全性、隐蔽性越来越受到人们的 重视。人脸识别技术也因其所具有的方便、友好、直 接、易于为用户所接受等特点在近几十年来倍受研 究人员的青睐,相关的方法也相继被提出。

7、根据对 国内外大量文献的统计,主要可以分为基于整体的 方法,典型的有 pca 特征脸和 fisher 脸方法等;基于 局部的方法,如纯几何方法、弹性匹配方法等;基于融合的方法,即同时使用整体和局部信息来识别人脸。在文献1中,通过利用图像的积分投影方法,对 图像进行裁剪并缩放到 30 30 的标准大小,然后再利用 pca 的方法进行识别,由于人脸识别易受光照、姿势、遮挡、表情等影响,所以在利用积分投影方法对图像进行裁剪时,很难准确得到标准图像,且 pca 法的一个不足是需要求解高维矩阵的特征分解问 题,计算量较大,其次,当有新图像加入时,必须重新 计算新图像与原库中的所有图像的协方差矩阵,不作者

8、简介:刘凡秀(1987),女,硕士,主要研究方向:多媒体信息处理、人脸识别;蔡茂国(1965),男,教授,硕士生导师,主要研究方向:多媒体信息处理、计算机网络;陈章乐(1987),男,硕士,主要研究方向:多媒体信息处理、人脸检测。e-mail:收稿日期:2011-06-15修回日期:2011-08-15cnki 出版日期:2011-10-24doi:10.3778/j.issn.1002-8331.2012.30.040/kcms/detail/11.2127.tp.20111024.1015.085.htm

9、lc(u v) 是dct 系数。 a(u) ,a(v) 的定义为:利于新图像的加入。离散余弦变换(dct)是由 n.ahmed 等人在 1974 年提出的正交变换方法,且被广泛用于语音和图像 信号压缩,信号经过正交变换后,能量会集中在少数 变换系数上,一般是集中在变换后的低频部分,删除 对信号贡献较小的系数,只利用余留下来的系数便 可恢复大致的信号,且不会引起明显的失真,dct 的 数据压缩能力在一定条件下近似于 pca,dct 可对 图像进行单独的处理,且 dct 有快速的算法2。近些 年来,许多研究者将 dct 方法运用到人脸识别中,并 取得了不错的效果。如在文献3提出了基于 dct 与

10、svm 的人脸识别方法,并获得了不错的识别率。在 文献4 中,randa 等受小波分解思想的启发,提出 dct 金字塔式的多分辨率的特征提取方法,其采用 多分块 dct 金字塔方法进行人脸识别时,也取得了 较不错的效果。因为图像经 dct 变换之后,用较少 的低频系数便可恢复大致的图像,而统计特征均值 能很好地表现图像的平均灰度信息,方差能很好地 表现图像内灰度波动的情况,熵5可以很好地表现图 像的纹理信息。且在文献4中,对图像进行多级dct 分解比较麻烦,且文中忽略了能代表图像整体信息 的 dct 系数。受此启发,本文提出了利用分块 dct 系数及其统计特征进行人脸识别的方法,该方法首 先对

11、图像进行分块,并对每一块进行 dct 变换,选择 低频部分的系数作为识别的特征,同时将其分解为 一幅低通滤波图和一个包含 dct 高频系数的反 l 型 块;然后分别对这两块求其均值、方差和熵这三个统 计特征;最后利用支持向量机(svm)和最近邻分类 器对这些特征进行分类识别。在 orl、yale 人脸数 据库上的实验结果表明,该方法优于文献3和文献4 的方法。1u = 0m a(u) = 2 u = 1 2 3 m - 1m1n v = 0a(v) = 2v = 1 2 3 m - 1n dct 反变换公式为:i (x y) =m - 1 n - 1 (2x + 1)u (2y + 1)v c

12、(u, v)a(u)a(v)cos(2)cos 2m2nu = 0 v = 0其中,x = 0 1 2 m - 1 ,y = 0 1 2 n - 1 。图 1 所表示的是对一幅图像进行 dct 变换后,取左上角四分之一大小的低频系数经 dct 反变换后得到的低通滤波图像,和剩余类似于反 l 型 dct 高 频系数。(a)原图片(b)低通滤波图(c)反 l 型 dct高频系数图 1 人脸的 dct 及 idct 变换2.2结合分块 dct 系数及其统计特征提取特征提取是人脸识别中最基本的问题之一,由 于人脸图像数据的高维性和数据之间冗余性。因此 特征提取时不但要提取出最有利用人脸分类的特 征,而

13、且要极大地降低人脸样本的维数。基于小波 分解,小波包分解以及 dct 分解的方法,能很好地降 低图像的维数。另外一种有效的降维方法就是计算 图像的一系列统计特征,如均值、方差、熵等。考虑到图像经 dct 变换之后,用较少的低频系 数便可恢复大致的图像,而统计特征均值能很好地 表现图像的平均灰度信息,方差能很好地表现图像 内灰度波动的情况,熵可以很好地表现图像的纹理 信息。所以在本文中将同时使用 dct 分解和计算图2结合分块 dct 系数及其统计特征的人脸识别算法和关键技术2.1离散余弦变换dct 是一种常用的正交变换,图像经 dct 变换 后,图像的主要信息集中在低频部分,可以通过提取 低频

14、部分的少量系数进行 dct 反变换,得到原图像 的近似图。对 一 幅 大 小 为 m n 图 像 i (x y) ,其 二 维 的dct 变换的定义如下:c(u v) =像的统计特征的方法来提取特征。对于一幅图像,先将其分成大小一样的 k 块,然后对每块进行 dct变换,提取低频部分中的少量系数作为特征,同时利 用图 1 所示的方法,将每块分解成一幅低通滤波图和 一个反 l 型 dct 高频系数块,然后计算这两部分中 的均值、方差和熵这三个统计特征。对于每一部分a(u)a(v) i (x y)cos (2x + 1)u cos (2y + 1)v m - 1 n - 1(1) 2m 2nx =

15、 0 y = 0其 中 ,u = 0 1 2 m - 1 ,v = 0 1 2 n - 1 。刘凡秀,蔡茂国,陈章乐:结合分块dct 系数及其统计特征的人脸识别2012,48(30)1952的统计特征向量可以表示为 vi =i i hi ,其中,中,一般有“一对一”、“一对多”、“dag”等方法。2对 于有 n 类样本,“一对一”方法的问题是需要构n (n - 1)/2 个两类分类器,最后采用投票方式进行分 类。“一对多”方法只需要构造 n 个 svm 分类器,它的问题是会出现“数据集偏斜”。而对于“dag”方法i i 分别表示均值、方差和熵,分别被定义为:m n1i = m n (si (

16、y x)(3)y = 1 x = 1m n 2 1 i = m n (s ( y x) - )(4)ii会出现错误累积,如果第一次分类器不能正确判别,y = 1 x = 1hi = - ( p lb( p)(5)则会出现一直错误判别下去,这样会导致分类率的下降。chih-wei hsu 等人对上述的三种方法进行了比 较,表明一一区分法的分类性能最优6。本文对所提 取的统计特征采用“一对一”进行判别。2.4 算法实现步骤(1)将图像缩放成大小为 80 80 ,然后将图像分 成 8 8 大小的100 块。(2)对于每一块进行 dct 变换,并利用 zig-zag 之 字形7 方法提取低频部分中的少

17、量系数组成系数特征向量 c n ,其中 n 为所提取的 dct 系数的个数(本 文中 n = 3)。同时取左上角四分之一大小的低频系 数经 dct 反变换后得到的低通滤波图像,剩余四分 之三的 dct 高频系数组成一个类似于反 l 型 dct 高 频系数块。然后分别对低通滤波图像求其均值 (il)其中,m 和 n 分别是每一分块的大小,它的值为si ( y x) ,p 是直方图统计。因为反 l 型块表示的是 图像经 dct 变换后的高频交流系数,它们的值通常 都比较小,它们的均值相对来说也非常小,一般可以忽略,且反 l 型块的纹理不明显,所以它的熵重要性 不高。所以对于反 l 型块,只计算其方

18、差这一特征, 而对于低通滤波图,由于是先对图像进行分块,然后 再对分块进行 dct 变换和反变换,所以每块内像素 间的差异不会很大,也就是说,它的方差将会很小, 所以也可以忽略不计。因为,对于每一个低通滤波 图像,只计算其均值和熵特征。所以每一块的统计2特征向量可表示为:vi =il hil ih ,其中 il hil 2ih 分别表示每块内的低通滤波图像的均值、熵以及反 l 型 块 的 方 差 。 每 块 的 特 征 向 量 可 以 表 示 为nnvi c ,其中 c 表示所选取的 dct 系数向量,n 表示的是所选取的 dct 系数的个数。则每一幅图像的k和熵 (h ),对反 l 型 dc

19、t 高频系数块求其方差 ( 2ih ) ,il组成一个统计特征向量 v = h 2ih 。则每块的iililn特征向量可以表示为 v = vi c ,其中 k 表示图像n特征向量可以表示为vi c 。每幅图像的特征向量ki = 1总共被分成了 k 块,如图2 所示。n表示为 v = vi c ,其中 k = 100 。i = 1(3)对训练图像和测试图像进行如(2)的操作,得 到训练图像和测试图像的特征库。再分别利用 svm 和最近邻分类器进行识别。在使用 svm 进行分类之 h8il il44 idct82vi =il hil ih 2i88 dctc n前,先分别对训练特征和测试特征进行规

20、一化操作,k使其具有零均值和单位方差。v = vi c ni = 1图 2 人脸的特征向量提取2.3支持向量机支持向量机(svm)是一种基于结构风险最小化 原则的通用学习算法,它的基本思想是在样本输入 空间或特征空间构造出一个最优超平面,使得超平 面到两类样本集之间的距离达到最大,从而得到最 好的泛化能力,在解决小样本、非线性及高维模式识 别中表现出许多特有的优势(http:/www.blogjava. net/zhenandaci/archive/2009/02/13/254519.html)。 支 持向量机算法是专门针对性小样本的二分类问题提 出的。对于多分类的问题,可以通过建立多个 sv

21、m 分类器的方式方法加以解决。在现有的解决方法3实验结果及分析本文的实验平台是 windows 7,采用 matlabtmr2010a 编 程 实 现 ,在 配 置 为 intel core i5 cpu2.53 ghz 2.0 gb ram 的 asus 笔记本上进行了仿 真 。 实 验 中 支 持 向 量 机 采 用 林 智 仁 的 libsvm(http:/.tw/cjlin/libsvm/libsvm-3.1. zip)。因为人脸识别容易受姿态、表情、光照等因素 的影响,为了验证所提出算法在不同条件下的识别 能力,同时在orl 和yale 人脸库上进行了

22、实验。3.1 orl 人脸库实验该人脸库由 40 人、每人 10 幅(见图 3),共 400 幅图像组成,主要包括了姿态、表情和面部饰物的变化,所用图像的大小为 112 92 。随机选择每个人的 5 幅 图像作为训练样本,剩余的另外 5 幅图像作为测试图 像。首先将图像缩放成大小为 80 80 ,然后将图像 分成 8 8 大小的100 块。进行了两组实验,分别是利 用 dct 系数与统计特征进行人脸识别,和只用 dct 系数进行人脸识别,在 dct 系数的选择上,采用了 zig-zag 之字形的方法。最后分别利用最近邻分类器 和svm 对特征进行分类。(a)正确识别(b)错误识别图 4 利用

23、dct 系数与统计特征作为特征,利用欧式距离进行判别的结果3.2yale 人脸库实验该人脸库由 15 人,每人 11 幅的 165 幅图像组成,主要包含光照、表情和姿态的变化。所用图像的大小为 100 100 。随机选择每个人的 5 幅图像作为训 练样本,剩余的另外 6 幅图像作为测试图像。因为该 人脸库的图像光照变化较大,所以在对图像进行分 块提取特征前,先利用直方图均衡化对图像进行处理,然后再与orl 人脸库中实验一样,做一样的处理。总共重复进行了10 次实验,实验结果如表2 所示。从表 2 中可以看出,虽然两种方法都可以达到比 较高的识别率,但是本文中所提出的方法在 yale 人 脸库上

24、识别率并不是特别理想,主要原因可能是因 为 yale 人脸库中图像的光照变化较大,图像经过直 方图预处理之后,使得类间差异性变小了。所提取 到的统计特征类间差异性变小,从而不利于图像的 分类。图 3 orl 人脸数据库中的 10 幅人脸在利用 dct 系数与统计特征进行人脸识别时,每块提取了 6 个特征,即 3 个 dct 系数特征和 3 个统 计特征。在只用 dct 系数进行人脸识别,每块提取 了 6 个 dct 系数特征。最近邻分类器中所采用的是 欧式距离进行判别,svm 中所选用的核函数是线性 核函数,其参数是默认的参数。总共重复进行了 10 次实验,实验结果如表1 所示。从表 1 中可

25、以看出,利用 dct 系数和统计特征 的方法能得到比较高的识别率,其中 dct 系数和统 计特征+svm 的方法所获得的识别率是最高的,平均 识别率达到了96.7%。在文献4中,利用多分块dct 金字塔方法所获得的最高识别率是 95.9% ,相对来 说,本文所提出的方法要优于文献4的方法。图 4 显 示的是利用 dct 系数与统计特征作为特征,利用欧 式距离进行判别的结果。4结论提出了一种结合分块 dct 系数及其统计特征 的人脸识别方法,充分利用了统计特征和 dct 在降 低特征维数和保留对表情、姿态等不敏感的类别信息方面的优点。从实验结果来看,该方法对于姿态、表情变换具有一定的鲁棒性,在

26、orl 人脸库上得到了较高的识别率。但是对于光照变换有点敏感。本 文对于每个分块内的 dct 系数的个数的选取,是根表 1 orl 数据库中算法识别结果比较(%)svm(线性核函数)最近邻分类器(欧式距离)方法最高识别率最低识别率平均识别率最高识别率最低识别率平均识别率dct 系数和统计特征dct 系数999494.084.596.791.196.596.0919193.7593.80表 2 yale 数据库中算法识别结果比较(%)svm(线性核函数)最近邻分类器(欧式距离)方法最高识别率最低识别率平均识别率最高识别率最低识别率平均识别率dct 系数和统计特征dct 系数97.7897.789

27、0.0092.2293.5695.7898.89100.0091.1194.4494.2296.11(下转228 页)2282012,48(30)computer engineering and applications 计算机工程与应用理不确定信息时具有更强的表现能力。结合 petri 网直观的知识表示优点,提出了模糊推理算法。算法 全部采用矩阵形式运算,便于在计算机上实现。选 取最小决策信息集的元素为模糊控制变量,使推理 过程快速、有效。空战战术决策主要指飞行员根据对抗态势信息 选取合适的机动,使飞机占据并保持有利的相对位 置,目的是形成武器攻击条件,并最终发射导弹毁伤 目标。影响空战决策

28、的不确定性因素多,如雷达实 际探测距离、对抗空域气象条件等,直觉模糊集隶属 度函数和非隶属度函数可以描述“非此非彼”的“模 糊概念”,具备强大的模糊描述能力,能有效解决不 确定性因素的问题。文中仿真实例的态势信息是从 一次真实对抗训练中采集的,经过推理得出的结论 与战术专家库的预测结果相符。由于空战对抗稍纵 即逝,态势变化迅速,如果要在实时对抗中应用该模 型辅助飞行员决策,必须考虑算法的时间问题。决 策模型的模糊推理算法时间复杂度为 o(mk nk ) ,其中 n 为库所数,m 为变迁数,k 为迭代次数,时间复杂度 与 mn 的 k 次幂呈正比,当 k 值较小时,算法时间复 杂度主要由 n 和

29、 m 的乘积决定,当 k 值较大时,算法时间复杂度主要与 k 值有关,与 n 、m 值关系不大。 对于不同的库所初始值,k 值也不同。与此同时,在 实际应用中还必须考虑机动无效的情况,即无论飞 行员选取何种机动方式,采取何种机动动作,都无法规避导弹攻击。出现该情况的可能原因是目标机飞行员的威胁意识不强,攻击机发射的导弹已进入末 端制导,弹目距离较近,目标机无法机动规避导弹攻 击。通过研究态势信息和导弹攻击包络线确定机动 无效的时刻,从而进一步完善决策模型。参考文献:1 周创明,申晓勇,雷英杰.基于直觉模糊 petri 网的敌意图识 别方法研究j.计算机应用,2009,29(9):2464-2467.2 史志富,张安,刘海燕,等.基于模糊 petri 网的空战战术决 策研究j.系统仿真学报,2007,19(1):63-66.3 陈军,高晓光,符小卫.基于粗超集理论与贝叶斯网络的超 视距空战战术决策j. 系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论