长春大学情绪识别学科前沿_第1页
长春大学情绪识别学科前沿_第2页
长春大学情绪识别学科前沿_第3页
长春大学情绪识别学科前沿_第4页
长春大学情绪识别学科前沿_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、装订线长 春 大 学 情绪识别学科前言讲座专业型硕士学位研究生学 院:电子信息工程学院姓 名:学 号:年 级:专 业:控制工程报告课题:情绪识别学科前沿讲座第一导师:填表日期:2016 年 1 月 3 日情绪识别学科前言讲座一、生理信息情绪识别的意义多生理信息情绪识别的任务是找出生理信号的混沌特征参量和不同情绪的对应关系。基于混沌特征提取的多生理信息融合的情绪识别方法研究是一交叉学科,涉及到很多领域,如人工智能、社会科学,并且与心理学、生物学、医学等也紧密相关。监测人体生理指标的变化,对于情绪障碍患者和残障人士很重要。在诊断治疗和复健训练时,为了能够准确掌握患者的生理和心理状况,需要对患者的各

2、种生理信号实时的观测和分析,从而拟定对应的治疗计划,安排合适的训练方式,帮助患者恢复健康。21世纪,人们工作节奏快,生活方式不健康,如果能够实时监测在各种不同情感下人的生理信号变化,对于预测和治疗抑郁症以及动态评价人体健康状态具有一定的意义。基于生理信号的情绪识别研究也具有巨大的商业实用价值,例如情绪服饰、情绪眼镜、情绪手表等。人机情绪交互的智能机器人,能够实时感知人的生理信号,从而有感情的与人交流。二、国内外研究进展国内外目前用于情绪识别研究的生理信号主要有光电脉搏容积(PPG)、心电信号(ECG)、眼电信号(EOG)、呼吸信号(RSP)、血氧饱和度信号(OOG)、皮电信号(SC)、脑电信号

3、(EEG)、肌电信号(EMG)等。国内外研究学者对生理信号提取特征参数方法的研究各不相同,有的以线性特征为目标,有的主要以非线性混沌学为研究方法。国内外研究学者对情绪识别方法的研究也不尽相同,有的着重于对情绪进行建模,有的集中对情绪进行分类。近几年,基于混沌特征提取的多生理信息融合的情绪识别方法研究已成为国内外关注的焦点。三、情绪分类及典型生理信号介绍生理信号是一种生物外形特征信号,个体的主观没有办法控制生理信号的变化,当人的情绪出现波动时,生理信号也对应改变,所以生理信号能够表达当前真实的情绪。本章着重介绍目前常用情绪分类模型以及用于情绪识别的典型生理信号。(一)情绪的分类国外学者提出情绪的

4、两种分类模型:第一种基本离散情绪模型,基本情绪组合产生其他情绪;第二种复合情绪模型,是把所有情绪映射到连续情感空间中。基本离散情绪模型认为所有的情绪都是离散的,存在基本的情绪,人类的情绪是由这些基本的情绪通过不同组合产生的。Ortony等通过研究,认为恐惧、高兴、悲伤和愤怒这4种情绪最为普遍,其次是惊奇和厌恶,因此这6种情绪被广泛认为是基本情绪。复合情绪模型认为情绪是连续的,注重情感的维度。复合情绪模型有Markov模型,该模型构建了一个以Fear、Anger和Joy为轴的三维情感空间12,三维情感空间中的点代表相对应的某种情绪;模型,该模型根据情绪表示的主被动程度,将情绪分成相应的等级,构建

5、了三级情绪模型。(二)几种典型的生理信号在提取生理信号的混沌特征之前,需要了解生理信号的一些基本知识。论文所涉及的生理信号分别是心电、肌电、皮电和呼吸信号,着重介绍这4种典型生理信号的基本知识。四、生理信号的相空间重构生理信号可以看作一组时间序列,提取混沌特征参量的前提是时间序列非平稳。其他学者对于生理信号是否为非平稳的已经进行了检验并给出了结论,学者们采用游程检验法验证了生理信号是非平稳混沌时间序列21,证明了利用混沌理论分析生理信号是有意义的,这样下一步我们就可以提取生理信号的混沌特征了。对生理信号混沌序列的计算,不论是特征参数的求取,抑或是模型的分析和估计都需要在相空间内,因此重构相空间

6、对分析生理信号是至关重要的,也就是说重构相空间是提取生理信号混沌参量的根基。相空间重构的根本理论是22:系统中某个变量在演化时一定会受到其它变量的影响,各个变量是相互影响的。具体实现步骤是,先选取一个变量,把这个变量固定在某个时间延迟点上,把得到的输出值当作一个新的维度,重复之前的方法并得到在其他时间点上的延迟量,最终得到一系列的相点,这样就构成了新的状态空间。嵌入维和延迟时间这两个参量的选取对重构相空间非常重要。目前这2个参数的选取主要有两种方法:(1)分别单个求解和。采用自相关法或互信息法23来确定延迟时间,然后采用G-P算法或虚假最近邻点法24来确定嵌入维;(2)统一求解和,主要利用C-

7、C算法来求解。由于C-C算法可以同时算出嵌入维和时间延迟,操作简单、计算方便,在处理大数据集、非线性问题时表现良好,具备很强的抗噪声性能,在相空间重构中应用范围大,因此本论文采用C-C算法来重构相空间求取和。C-C算法的基本原理是用关联积分的统计量来表示非线性时间序列的关联性,以此求解出和时间延迟窗,再根据的值求解出。对于数据组长度为的一组数据,重构相空间中的点为 (3.6)其中,则序列的嵌入关联积分为 (3.7)其中,。把原始非线性序列分解成不相交的个子序列,则各个子序列的统计量定义为 (3.8)当时,统计量为 (3.9)令得到的第一个零点当作最优值,求取所有的平均值为 (3.10)其中,分

8、别代表嵌入维数和的数目。求取所有的平均值为 (3.11)此时统计量的最小值为 (3.12)把它作为时间延迟窗的最佳值。由于,所以也就得到了的值。五、混沌特征参量的提取混沌理论能够提供描述系统的各种特征参量,情绪识别需要的混沌特征参数有最大Lyapunov指数、关联维、盒子维、信息熵、近似熵及复杂度,提取这些特征的方法分别是wolf法计算最大Lyapunov指数,G-P算法计算关联维,DBC算法计算盒子维,用定义计算信息熵和近似熵及L-Z复杂度。指数(Lyapunov index)是用来表示初始条件对混沌运动影响大小的参量,是定量表述混沌系统的重要参数。指数是动力系统中相邻2条轨迹之间收敛或发散

9、的指数率。关联维(Correlation dimension)代表的是系统中相点之间的相关度,是混沌非线性系统一个十分关键的特征参量。基于延迟嵌入空间的思路,构造了G-P算法来求取关联维28。该算法实现简单、原理易懂,所以获得广泛应用。盒子维(Box dimension)可以很好的描述时间序列的复杂性和不规则性,能够很方便的用计算机完成,使用范围较广泛。1994年,N. Sarkar和B. Chaudhuri提出了计算盒子维的DBC(Differential Box Couting)算法29。该算法快速、方便、精确,获得了大范围使用。信息熵(Information entropy)也称为香农熵

10、(Shannon entropy),描述的是系统整体的不确定性,对分析混沌序列有着实际的意义。信息熵代表信源的不确定度,即无序性31,系统愈混乱,信息熵的值愈大;反之,系统是有序的,其值愈小。近似熵(Approximate entropy)是度量时间序列复杂性的混沌特征参数,只需要较少数据就可以得出稳定的数值,比较适合工程应用。混沌系统的近似熵是一个非负数,系统的复杂性愈高,近似熵的值愈大;反之复杂性愈低,其值愈小。六、多生理信息情绪识别用分类器将上一节提取出来的混沌特征属性映射到给定的类别中,就把情绪识别转变成模式识别中的分类问题。我们先学习现有数据,获得目标函数,这样属性集可以对应到提前设

11、置的类标号上,分类的任务就完成了。分类的主要目的是构建和利用分类模型(分类器)29,其中分类模型分为描述性建模和预测性建模,前者根据数据的属性将数据分派到不同的组中,后者可以根据历史数据规律主动推测出将来数据,多生理信息情绪识别研究属于描述性建模分类问题。本节介绍分类器中的C5.0决策树分类器,然后利用C5.0决策树对不同情绪进行识别。(一)分类器分类器包含两种类型,线性分类器及非线性分类器。常见的线性分类器有、等,这些线性分类器对分类数据要求较高,需要数据服从正态分布,最重要的是这些分类器只适合计算两类识别问题。但是实际分类问题中大多数据一般线性不可分、不服从正态分布,而且是多分类问题,这时

12、用线性分类器进行判别往往会出现分类错误,所以就需要采用非线性分类器。常见的非线性分类器有近邻分类器、决策树分类器等,其中应用最广泛的是决策树分类器。(二)决策树分类器决策树分类器是属性分类的一种快捷方法,能够非常方便的解决多类别或多峰问题。决策树分类器由于归纳学习直观易懂和分类步骤快速简单,并且准确率较高,因此一直被广泛使用。决策树直观上是一种类似于流程图的倒置的树结构,它主要围绕生长和剪枝两大核心问题展开。决策树分类的基本思想是利用多个判决准则将繁琐的多类问题化解成一些简单的分类问题35,它的每条路径代表一个准则,把由不同成份组成的主体分割成较小且同性质的组群,所以能够方便的解决多类和多峰问

13、题。它的基本步骤是:第一步,根据训练数据集搭建和精简出一棵决策树,构建决策树模型;第二步,利用完成的决策树对未来的样本进行分类。决策树有2种类型,分别是回归树和分类树,回归树预测结果是叶节点输出的平均值,分类树分类结果是叶节点输出值的众数。本章下小节所采用的C5.0决策树分类器属于后者,它一般不需要耗费许多的训练时间就可以构建决策树,对于处理输入字段很多和数据丢失问题时非常稳健,且生成的决策树很直观、易于理解。(三)C5.0决策树C5.0算法是I. Ross. Quinlan从最初的ID3算法36-37中发展起来的最新决策树算法。ID3算法采用的策略是从上至下不回溯,确保找到一个简单的树。ID

14、3算法的准则是采用信息增益(Gain)法作为属性选择及样本区分的方法。C5.0算法主要克服了ID3算法选择偏向于取值多的属性的不足,采用最大信息增益率(Gain Ratio)作为属性选择及样本区分的准则,它比采用信息增益(Gain)法效率更高。C5.0决策树划分样本集的依据是最大信息增益的字段,通过剪裁或归并决策树各叶子提高分类的精度,最终再确定各叶子的最佳阈值。此算法引入了强大的Boosting算法38,进一步提高分类的精度。Boosting算法先是依次搭建一系列的决策树,其次构建的决策树首要考虑之前被漏分和错分的数据,最终生成更加精确的决策树。七、基于C5.0决策树的情绪识别我们提取了Au

15、gsburg大学生理信号数据库的4种生理信号的6种混沌特征,得到了24个混沌特征参量,分别是ECG-Maximum Lyapunov index、ECG-Correlation dimension、ECG-Box dimension、ECG-Information entropy、ECG-Approximate entropy和ECG-L-Z Complexity;EMG-Maximum Lyapunov index、EMG-Correlation dimension、EMG-Box dimension、EMG-Information entropy、EMG-Approximate entro

16、py和EMG-L-Z Complexity;SC-Maximum Lyapunov index、SC-Correlation dimension、SC-Box dimension、SC-Information entropy、SC-Approximate entropy和SC-LZ Complexity;RSP-Maximum Lyapunov index、RSP-Correlation dimension、RSP-Box dimension、RSP-Information entropy、RSP-Approximate entropy和RSP-L-Z Complexity,将提取出来的数据记

17、录到Excel文件中,作为分析的数据源。我们首先把单一生理信号提取出来的混沌特征数据分别记录到Excel文件里,这样每种生理信号对应一个Excel表格,这种表格是101行、7列,前6列是单一生理信号的6个特征属性,第7列是类别Emotion,每种情绪对应25天的样本数据,所以行数为101行。再把多生理信号混沌特征属性的所有数据记录到另一个单独表格里,这样这个大表格总共有101行、25列,前24列是这4种生理信号的24个混沌特征参量属性,第25列是类别Emotion,每种情绪对应25天的样本数据。ISL (Integral Solutions Limited) 公司基于数据挖掘工具SPSS设计了一个Clementine软件平台,它主要是通过建立一个数据流来实现指定的识别任务。所以,的C5.0决策树算法是基于软件Clementine40来实现多生理信息的情绪识别。建立数据流模型,首先添加源文件模块,因为我们处理的数据格式是Excel,所以添加Exc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论