



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人人脸脸表表情情识识别别综综述述 一、人脸表情识别技术目前主要的应用领域包括人机交互、安全、机器人制造、医疗、通信和汽车领域等 二、1971 年,心理学家 Ekman 与 Friesen 的研究最早提出人类有六种主要情感,每种情感以唯一的表情来反映 人的一种独特的心理活动。这六种情感被称为基本情感,由愤怒(anger)、高兴(happiness)、悲伤 (sadness)、 惊讶(surprise)、厌恶(disgust)和恐惧(fear)组成 人脸面部表情运动的描述方法-人脸运动编码系统人脸运动编码系统 FACS (Facial Action Coding System),根据面部肌 肉的类型和运动特征定义了基本形变单元 AU(Action Unit),人脸面部的各种表情最终能分解对应到各个 AU 上 来,分析表情特征信息,就是分析面部 AU 的变化情况 FACS 有两个主要弱点:1.运动单元是纯粹的局部化的空间模板;2.没有时间描述信息,只是一个启发式信息 三、人脸表情识别的过程和方法 1、表情库的建立:、表情库的建立:目前,研究中比较常用的表情库主要有:美国 CMU 机器人研究所和心理学系共同建立的 Cohn- Kanade AU-Coded Facial Expression Image Database(简称 CKACFEID)人脸表情数据库;日本 ATR 建立的 日本女性表情数据库(JAFFE),它是研究亚洲人表情的重要测试库 2、表情识别、表情识别: (1)图像获取:通过摄像头等图像捕捉工具获取静态图像或动态图像序列。 (2)图像预处理:图像的大小和灰度的归一化,头部姿态的矫正,图像分割等。 目的:改善图像质量,消除噪声,统一图像灰度值及尺寸,为后序特征提取和分类识别打好基础 主要工作人脸表情识别子区域的分割以及表情图像的归一化处理(尺度归一和灰度归一) (3 3)特征提取)特征提取: :将点阵转化成更高级别图像表述如形状、运动、颜色、纹理、空间结构等, 在尽可能保证稳定性 和识别率的前提下,对庞大的图像数据进行降维处理。 特征提取的主要方法有:提取几何特征、统计特征、频率域特征和运动特征等 1 1)采用几何特征进行特征提取采用几何特征进行特征提取主要是对人脸表情的显著特征,如眼睛、眉毛、嘴巴等的位置变化进行定位、测量, 确定其大小、距离、形状及相互比例等特征,进行表情识别 优点:减少了输入数据量优点:减少了输入数据量 缺点:丢失了一些重要的识别和分类信息,结果的精确性不高缺点:丢失了一些重要的识别和分类信息,结果的精确性不高 2)基于整体统计特征的方法)基于整体统计特征的方法主要强调尽可能多的保留原始人脸表情图像中的信息,并允许分类器发现表情图像中 相关特征,通过对整幅人脸表情图像进行变换,获取特征进行识别。 主要方法:主要方法:PCA 和和 ICA(独立主元分析)(独立主元分析) PCAPCA用一个正交维数空间来说明数据变化的主要方向 优点:具有较好的可重建性 缺点:可分性较差 ICA可以获取数据的独立成份,具有很好的可分性 基于图像整体统计特征的提取方法缺点:基于图像整体统计特征的提取方法缺点:外来因素的干扰(光照、角度、复杂背景等)将导致识别率下降 3 3)基于频率域特征提取)基于频率域特征提取: : 是将图像从空间域转换到频率域提取其特征(较低层次的特征) 主要方法:主要方法:GaborGabor 小波变换小波变换 小波变换能够通过定义不同的核频率、带宽和方向对图像进行多分辨率分析,能有效提取不同方向不同细节程 度的图像特征并相对稳定,但作为低层次的特征,不易直接用于匹配和识别,常与 ANN 或 SVM 分类器结合使用, 提高表情识别的准确率。 4)基于运动特征的提取:)基于运动特征的提取:提取动态图像序列的运动特征(今后研究的重点) 主要方法:光流法 光流光流是指亮度模式引起的表观运动,是景物中可见点的三维速度矢量在成像平面上的投影,它表示景物表面上 的点在图像中位置的瞬时变化,同时光流场携带了有关运动和结构的丰富信息 光流模型光流模型是处理运动图像的有效方法,其基本思想是将运动图像函数 f (x, y,t)作为基本函数,根据图像强度守 恒原理建立光流约束方程,通过求解约束方程,计算运动参数。 优点:反映了表情变化的实质,受光照不均性影响较小 缺点:计算量大 (4 4)分类判别)分类判别: :包括设计和分类决策包括设计和分类决策 在表情识别的分类器设计和选择阶段,主要有以下方法:用线性分类器、神经网络分类器、支持向量机、隐马 尔可夫模型等分类识别方法 1) 线性分类器线性分类器:假设不同类别的模式空间线性可分,引起可分的主要原因是不同表情之间的差异。 2) 神经网络分类器:神经网络分类器:人工神经网络(Artificial Neural Network,ANN)是一种模拟人脑神经元细胞的网络结构, 它是由大量简单的基本元件神经元,相互连接成的自适应非线性动态系统。将人脸特征的坐标位置和其相 应的灰度值作为神经网络的输入,ANN 可以提供很难想象的复杂的类间分界面。 神经网络分类器主要有:多层感知器、BP 网、RBF 网 缺点:需要大量的训练样本和训练时间,不能满足实时处理要求 3) 支持向量机支持向量机(SVM)分类算法:分类算法:泛化能力很强、解决小样本、非线性及高维模式识别问题方面表、新的研究热 点 基本思想:基本思想:对于非线性可分样本,首先通过非线性变换将输入空间变换到一个高维空间,然后在这个新空 间中求取最优线性分界面。这种非线性变换通过定义适当的内积函数实现,常用的三种内积函数为:多项式内 积函数、径向基内积函数径向基内积函数、Sigmoid 内积函数 4) 隐马尔可夫模型隐马尔可夫模型(Hidden Markov Models, HMM):特点:特点:统计模型、健壮的数学结构,适用于动态过 程时间序列建模,具有强大的模式分类能力,理论上可处理任意长度的时序,应用范围非常广泛。 优点:运用 HMM 方法能够比较精确的描绘表情的变化本质和动态性能 5) 其他方法:其他方法: 基于人脸物理模型的识别方法,将人脸图像建模为可变形的 3D 网格表面,把空间和灰度放在一个 3D 空 间中同时考虑。 基于模型图像编码的方法是使用遗传算法来编码、识别与合成各种不同的表情 四、研究展望 (1)鲁棒性有待提高: 外界因素(主要是头部偏转及光
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 决策分析中的财务技巧考察试题及答案
- 财务管理考试成功的关键与试题及答案
- 2025年房地产企业数字化营销渠道优化与用户体验研究报告
- 2025年工程法规考试时效性问题试题及答案
- 2025年老年康养服务项目与老年人就业创业支持评估报告
- 2025至2030年中国节能热泵酒店热水系统市场分析及竞争策略研究报告
- 2025年高浓度工业废水浓缩处理装置项目可行性研究报告
- 2025年豪华椭圆机行业深度研究报告
- 2025年全球石油市场供需矛盾与价格走势研究报告
- 2025年短视频平台内容监管案例分析与行业社会责任启示报告
- 开展2025年《安全生产月》活动实施方案
- 宁波水产笔试题目及答案
- 中学金融知识讲座课件
- 2025凉山州继续教育公需科目满分答案-数字时代的心理健康
- 玻璃维修安装合同协议
- 校园景观园林绿化植物配置设计
- 2024船用电气电子产品型式认可试验指南
- 融资融券指南
- 粪便DNA检测研究-全面剖析
- 装车安全协议合同
- 大型商业综合体火灾事故处置桌面推演1105
评论
0/150
提交评论