基于事件相关电位的测谎方法研究 本科毕业论文_第1页
基于事件相关电位的测谎方法研究 本科毕业论文_第2页
基于事件相关电位的测谎方法研究 本科毕业论文_第3页
基于事件相关电位的测谎方法研究 本科毕业论文_第4页
基于事件相关电位的测谎方法研究 本科毕业论文_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 题目:基于事件相关电位的测谎方法研究 学 院 信息科学与工程学院 专 业 自动化 年 级 2010级 学 号 姓 名 指导老师 2014年5 月 摘 要 本研究主要利用P300电位作为辨别测谎的重要指标。P300测谎与任务相关性、刺激性质、注意、记忆、电生理干扰等影响因素有关。利用P300测谎的目的是对单一个体进行其是否在说谎的判断,本课题研究主要关注单个被试内的探测刺激和无关刺激的P300是否存在显著差异。本文采用个人相关信息为刺激内容,以被试真实的相关信息作为目标刺激,例如被试的存钱银行名称等,设计实验范式,将实验采集到的脑电信号作为主要研究对象。P300电位的数据处理分为三步:预处理,

2、特征提取和分类。将采集到的数据通过汉明窗低通滤波器滤波,选择导联和时间窗进行降维,然后利用Fisher线性判别进行分类识别。对分类结果进行分析得出:正确率与训练量的多少、刺激重复次数、导联选取个数均有关系。 关键词:事件相关电位,P300电位,Fisher线性判别ABSTRACT This research mainly uses the P300 potential as an important index to distinguish the polygraph. The relevant factors of P300 polygraph and task dependencies,

3、stimulating properties, attention, memory, electrophysiological disturbance. Using P300 lie to the single individual is lying judgment, this research mainly focus on the detection of single subjects and tn different stimuli P300 whether there are significant differences. This paper uses personal inf

4、ormation related to stimulate the content, related to the information is true as target stimuli, such as the bank name, design experimental paradigm, the EEG signal is acquired from experiments as the main object of study. Data processing of P300 potential is divided into three steps: preprocessing,

5、 feature extraction and classification. The data will be collected by the Hamming window low-pass filter, select lead and time window to reduce the dimension, and then use the Fisher linear classification discrimination. The classification results are obtained: the correct rate and amount of trainin

6、g, stimulus repetition, lead the chosen number of. Keywords: event related potential,P300,Fisher linear discriminant目 录第一章 绪论·····························&

7、#183;·······················1 1.1 引言·························

8、;······································1 1.2 国内外ERP测谎的研究发展概况········&#

9、183;······························1 1.3 本文的研究内容·················&

10、#183;···································2第二章 ERP用于测谎的原理和实验范式设计··········

11、83;···············3 2.1 事件相关电位的概述································

12、·················3 2.2 P300信号介绍······························

13、3;························3 2.3 P300测谎的影响因素·······················

14、;·························4 2.4 实验设计·······················&

15、#183;···································5 2.4.1被试介绍············&#

16、183;········································5 2.4.2刺激方案设计·······&

17、#183;·········································5第三章 脑电信号数据处理······

18、··································7 3.1 脑电信号的特点和预处理·············&

19、#183;·······························7 3.2 脑电信号的特征提取···············

20、3;·································8 3.3 脑电信号的分类识别··············&

21、#183;··································8 3.3.1分类算法简介·············

22、·····································8 3.3.2 Fisher 线性判别··········

23、;···································9第4章 实验数据处理·············

24、······························12 4.1 数据预处理··················

25、·······································12 4.1.1选择电极·········

26、·············································12 4.1.2 低通滤波···

27、;··················································

28、;12 4.1.3 实验数据段提取···············································1

29、3 4.2 数据特征提取················································

30、·······14 4.3 离线数据的分类结果········································&#

31、183;········14 4.3.1 训练量对正确率的影响······································&

32、#183;··14 4.3.2 降采样对正确率的影响·········································15 4.3.3 导联选取个数对正确

33、率的影响···································16 4.4 在线测谎实验的数据处理···········&#

34、183;·································17第5章 结论···············

35、····································18 参考文献·············

36、;········································19 致 谢·········

37、;···············································20 附 录··

38、;··················································

39、;····21 附录1:翻译原文············································

40、··········21 附录2:译文······································

41、83;···················31第一章 绪论1.1 引言 说谎是人类的一种普遍的心理现象,尽管在我们的日常生活中有许多的谎言没有恶意,但整个社会中确实存在着大量为了谋取个人私利和危害人类社会的谎言。为了辨别这些谎言,人类一直在探索着能破解这些谎言的方法。在20世纪80年代测谎开始进入中国,基本上是以传统的多道心理生理测谎方法为主,传统的方法是借助被测者在被询问某些问题时所表现出的植物神经活动

42、变化来判断是否说谎,虽然此种测谎方式在刑事司法领域收到了很大成效,但易受紧张、恐惧、焦虑等因素的影响,无法克服它最大缺陷假阳性1。另外传统多道生理测谎还存在着不敌反测谎的危险,反测谎通过有意识的认知和身体的方法可以改变多道生理的指标。随着科学技术的发展,出现了可以替代传统多道生理测谎的测谎方法。近30年来,事件相关电位(event related potential,ERP)尤其是它的内源性成分P300在医学领域中得到了广泛使用,成为神经电生理研究中的一个锐利武器,所以由于事件相关电位作为研究高级心理功能的重要手段而被引入了测谎领域。事件相关电位测谎技术的使用能够有效弥补多道心理生理测谎的不足

43、,克服假阳性,提高测谎结果的准确性。ERP测谎作为一种新的测谎方法,其相关的理论和研究都还比较少,大部分研究尚处于实验室研究阶段,ERP测谎的信效度问题目前也还没有一致的结论,在国内这方面的研究更是在起步阶段,还需做大量开创性和基础性的研究和探索。同时测谎影响因素很多,目前实验室选用的刺激内容、影响因素的控制不尽相同,测谎准确率的报告的结论也不尽相同。已有研究显示ERP测谎也存在不敌反测谎的潜在危险。因此探讨测谎影响因素就显得很有必要。影响测谎的因素有很多,我们不禁有疑问:不同的刺激内容对测谎的准确性和稳定性究竟有没有影响呢?在实验中刺激的重复出现次数对测谎正确率又有何关联呢?本研究采用个人相

44、关信息为刺激内容,以被试存钱的银行名称等作为目标刺激,假设存钱的银行由于被试日常中经常接触并和他的经济利益密切相关,因此有着丰富的信息量和较强的个人影响和意义。它用于P300测谎若获得成功,实际应用中就可以针对犯罪信息对个人意义的大小来进一步缩小办案线索和获得新的线索2。实验期望在被试隐瞒其个人真实信息所在的情况下,P300测谎程序能成功的提供被试准确的个人相关信息。 1.2 国内外ERP测谎的研究发展概况 1986年,Miyake等人在日本首先报道了利用事件相关电位进行欺骗测验,表明P300是测试犯罪认知的一个有效指标;1989年,Rosenfeld首先利用事件相关电位进行测谎并获得实验室成

45、功,他利用相关单词作靶刺激,以P300的波幅为指标测出被试者所拿走的物品,为测谎研究开辟了一条新的道路3;Farwell和Donchin在1991年采用GKT范式开展了两个测谎实验结果表明能准确测出每个被测者具备的相关知识4;90年代中期开始研究者们开始将注意力从犯罪检测转向假装失忆和错误记忆测谎研究。 国内P30O测谎研究仍以犯罪测谎范式为主,以杨文俊、廖四照等人的研究为代表,20世纪90年代,以杨文俊教授为带头人的中国第一军医大学南方医院神经电生理实验室开始研究事件相关电位测谎技术,并取得了实验室成功。1996年,廖四照等以房间照片作刺激物进行了事件相关电位测谎的实验研究,结果显示所有的被

46、测者在有任务要求和无任务要求的两种不同条件下相关刺激和对照刺激都能引出P300。但在无任务情况下,相关刺激和对照刺激的P300波幅和波面积差异不显著,而有按键任务时,相关刺激的P300波幅明显大于对照刺激。1999年,周亮等进行了P300用于模拟盗取测谎的实验性研究,该研究证明了探查刺激较无关刺激引出的P300波幅高,波面积大。2000年,周亮等进行实验研究比较模拟盗窃者与熟悉现场者在事件相关电位方面的差异,得出的结论表明,实验条件下P300作为客观指标用于测谎是可行的,熟悉现场者参与测谎不会产生假阳性结果5。1.3 本文的研究内容 本文主要是对被试者按按键回答其个人相关信息时产生的P300脑

47、电波进行了研究,通过对信号的预处理、特征提取和分类,最后达到能根据受试者的P300脑电波判断出受试者真实存钱的银行名称的结果。本文选择10Hz的汉明窗FIR低通滤波器对原始数据进行滤波,滤掉高频干扰信号,截取每个闪烁刺激之后0.7s内的数据和选择19个导联,组成19*70的矩阵作为特征向量,然后选择了Fisher线性识别作为信号分类识别的算法,处理实验采集到的视觉刺激诱发的P300数据。本文共分为5章。第1章为绪论,主要介绍了ERP测谎的研究背景和研究意义,阐述了国内外ERP测谎的研究发展概况以及本文的主要研究内容;第2章为ERP用于测谎的原理和实验范式设计,首先介绍了事件相关电位的基本理论,

48、重点介绍了P300信号,然后是P300测谎的影响因素,最后是实验范式的设计;第3章为脑电信号数据处理。首先针对预处理部分介绍了脑电信号包含的噪声及其特点,重点介绍了数字滤波器,其次,介绍了数据的特征提取,最后,介绍了特征分类算法,重点介绍了Fisher线性判别;第4章为实验数据处理,主要对实验采集到的数据进行处理:脑电信号预处理、脑电信号特征提取、特征分类,最后分析和讨论了数据处理结果;第5章为结论,主要对全文的工作进行了总结。第二章ERP用于测谎的原理和实验范式设计 2.1 事件相关电位的概述当被测者在接受测谎时,会由于认知心理和说谎心理对某些问题存在异常的生理反应,这些生理指标的变化一般是

49、由自主神经系统(ANS)控制的,并不受大脑意识的控制,近年来随着人们对脑的认识进一步加深,一些典型的脑波反应来作为测谎技术的生理指标。人类的大脑皮层可以记录两大类的脑电位活动:脑自发电位和脑诱发电位。诱发电位或称诱发反应,是指神经系统(包括外周或中枢,感觉或运动系统)接受内外界刺激所产生的特定电活动。事件相关电位(Event Related Potential,ERP)是一种内源性的诱发电位,包括内源性成分和外源性成分,按照潜伏期来说,它是一种长潜伏期的诱发电位,通过有意赋予刺激某些心理意义,利用多个或多样刺激,或利用刺激的变化所引起的电位6。它与外源性刺激相关的诱发电位不同,除了基本的诱发电

50、位产生条件外,还需要:要求被测者要清醒并能主动参与测试过程;在刺激序列的编排上要有两个以上的刺激随机出现。在以上的刺激条件下,诱发电位的各个成分当中既包括容易受到刺激物理特性影响的外源性成分如P1、N1和P2等,也包括不容易刺激物理特性影响的内源性成分如N2、P3等,后者与注意、期待、辨别和记忆等大脑高级认知活动有密切的关系,可以成为探测心理活动的窗口。事件相关电位的主要成分包括:伴随性负变化(contingent negative variation ,CNV)、失配性负波(mismatch negativity ,MMN)、晚期正电位(P300 为代表)、N400等。ERP测谎的原理是被测

51、者对不同的刺激内容的刺激的认识加工过程不同,表现在脑电变化的不同,同步记录ERP,比较各刺激引出的脑电波幅的高低,可以判断被测者是否说谎。P300作为事件相关电位中最重要的成分,在某些程度上可以反映事件相关电位的实质,所以本研究主要利用P300电位作为辨别测谎的重要指标,而没有涉及到事件相关电位的其他成分。2.2 P300信号介绍P300是事件相关电位(Event Related Potential,ERP)的重要成分,也是目前测谎技术中最常用到的一种脑电指标,它是被测者辨认“靶刺激”时在其头皮记录到的潜伏期约为300ms的最大晚期正性波。“靶刺激”对被测者来说是具有重要信息意义的刺激,在潜伏

52、期平均为300ms(200-700ms)会出现一个“正向诱发电位”,并且这种变化与刺激的强度和种类无关。目前认为,P300是不受刺激物理特性影响的内源性成分,与认知过程密切相关。可以利用视觉、听觉和体感刺激等方法来诱发产生P300,不同的刺激对P300有一定的影响,人脑在接受外界信息时由不同的感受器在脑的不同部分参与下进行初级加工认识,P300的波幅与对刺激的注意程度有关,P300的潜伏期与对不同刺激的辨别分类速度有关。P300测谎的目的是对单一个体进行其是否在说谎的判断,所以测谎的ERP研究需关注单个被试内的探测刺激和无关刺激的P300是否存在显著差异。按照ERP成分的划分方法7,根据潜伏期

53、的差异,10ms内为早成分,10-50ms为中成分,50-300ms为晚成分,300ms以后则称为慢波。P300显然属于晚成分。通常所测量的P300是淹没在自发脑电以及眼电、肌电、脑电、工频等一系列干扰信号中的,而其中最难分离的就是自发脑电信号。事件相关电位有两个重要的特性:潜伏期恒定和波形恒定。与此相对,自发脑电则是随机变化的。所以,可以将同一事件多次引起的多段脑电记录下来,但每一段脑电都是各种成分的综合,包括自发脑电。将由相同刺激引起的多段脑电进行多次叠加,由于自发脑电或噪音是随机变化,有高有低,相互叠加时就出现正负抵消的情况,而 ERP信号则有两个恒定,所以不会被抵消,其波幅反而会不断增

54、加,当叠加到一定程度时,ERP信号就会显现出来了。所以,在一般的ERP信号研究处理中,为了提取事件相关电位变化,会进行多次重复刺激,通过预定程序实现叠加提取。典型P300电位图见下图2.2。 图2.2 典型P300电位图2.3 P300测谎的影响因素(1) 任务相关性影响P300电位的波幅和潜伏期与所接受任务的刺激信息量呈正相关,靶刺激比非靶刺激的信息量多,所以大脑耗费能量多,引出的P300电位波幅亦较高、潜伏期短。任务难度大小、任务内容对被测者的意义也可影响到潜伏期和波幅的变化,难度越大或对被测者越有意义,P300电位越明显。另外,完成实验后对被测者给予一定的奖励,也可以使P300波幅增高8

55、。近年来有关主动P300的电位和被动P300电位的研究引起人们的关注。研究认为,不管主动和被动均能引出P300成分,只是前者波幅更大。(2) 刺激性质的影响 刺激形式有躯体刺激、听觉刺激和视觉刺激等,刺激形式不同所产生的P300也不同,躯体刺激的P300潜伏期最短,听觉刺激产生的P300稍长,视觉刺激产生的P300最长,但听觉刺激产生的P300较稳定,变异小,波形易辨认,无视力影响因素,目前较广泛应用。P300波幅与靶刺激出现概率有关,概率越低,P300波幅越大。另外,刺激强度大,间期越长,P300波幅越大,而潜伏期一般无变化。(3) 注意与记忆的影响 选择性地对刺激系列中的靶刺激给予注意并做

56、出反应,将会使靶刺激引起的P300波幅更高,这表明被测者的记忆可能会影响到P300的波幅。P300波幅的变化持续到随后的710次刺激后才会下降。经过长时间的重复刺激,并多次叠加后可获得满意的P300波形。目标刺激的重复出现有可能造成被测者对该刺激的学习及强化记忆,多次重复之后其会在脑内形成一定的表征,场合更新过程将和靶刺激接近,引出的P300波与靶刺激的相近,降低了分辨率。(4) 电生理干扰的影响 被测者在参加测谎实验时,要求被测者配合测试,如果被测者不配合,频繁的眨眼等眼动活动、肌肉紧张收缩、头部和身体以及舌咽部的运动等都会形成巨大的生理性伪迹而无法进行对脑电的平均叠加。 除了以上四种影响因

57、素外,还有被测者的年龄、精神状况、觉醒水平、睡眠、生活习性、药物和疾病等因素都可影响到P300电位。2.4 实验设计2.4.1被试介绍 选择合适的受试者对研究结果的普遍性和可靠性都具有很重要的影响。本课题的受试者均为在读本科生,均身体健康、精神状态良好、矫正视力在5.0以上、右利手;实验室为环境安静、隔磁、隔热的电磁屏蔽室;电极采用了材料为氯化银的表面电极;为了减少躯体运动和脑电活动的干扰,本次实验选择耳垂作为参考电极(耳垂位置为国际10-20系统标准参考电极位置),而且为避免由同侧颞区造成的耳电极活化,采用对侧耳垂作为参考零电位。2.4.2刺激方案设计 本文共设四个实验组,分别是银行、运动、

58、游戏、网站。先调查确定目标刺激(被试者给出的答案)和非目标刺激(被试者所给出答案以外的选项)的备选项,并且保证不会对同一被试者有多于一个的答案。其中目标刺激与非目标刺激的概率分别为0.2和0.8,每个闪烁刺激随机出现且出现的概率相等,满足在经典的oddball范式中的靶刺激小于30%,标准刺激大于70%。选出存钱的银行名称:中国银行、中信银行、专业银行、招商银行、兴业银行;选择最擅长的球类运动:篮球、排球、网球、羽毛球、乓乓球;选择最近常玩的游戏:跑酷、音速、炫舞、剑灵、魔兽;选择常用资料查询网站:百度、网易、搜狐、谷歌、知网。测试过程中这些名称将以红色字体图片的形式逐个呈现在屏幕上,目标刺激

59、和非目标刺激各随机重复50次。实验过程中,首先是被试在其中一个实验组中给出答案,即为目标刺激。然后进入准备阶段,此时屏幕上会出现“+”符号,时间是1s。接下来是依次随机出现该实验组的所有刺激,每个刺激呈现时间0.5s,再间隔0.5s才呈现下一个刺激,多轮重复,每轮结束都可以休息。每组实验5次刺激随机呈现,重复50轮(为获得满意的P300波形,需要经过多次叠加),以上时间参数全部可调。在呈现刺激的同时,要求被试者在看到每个刺激后,通过按键来做出回答,按Y键表示是其给出的答案,按N键表示不是。在测试前先对被试者进行讲解和训练,告知其所需要做的所有任务和注意事项,被试者需要集中注意力,尽量减少眨眼和

60、肢体的运动。训练过程中要记录按键,训练结束时给出训练合格与否,即被试者是否理解我们的要求。直到合格才进行测试。测试过程中不记录按键结果。第三章 脑电信号数据处理3.1 脑电信号的特点和预处理 脑电信号是由脑神经活动产生并且始终存在于中枢神经系统的自发性电位活动,是一种重要的生物电信号。脑电信号非常微弱。主要有以下几个特点:(1)随机性及非平稳性相当强。(2)脑电信号具有非线性。(3)采集到的脑电信号背景噪声比较复杂,背景噪声是指非研究对象的信号,有50Hz的工频干扰,电极与皮肤的接触噪声以及由肌肉运动、眨眼、神经紧张等引起的干扰等等。在实验的进行中,严格按照实验的要求来进行,实验室温度控制在2

61、5°C,通风透气,避免出汗伪迹的干扰。使被试者尽可能的精神放松,坐姿舒服以减少肌电伪迹的发生。脑电信号的电压幅值很小,只有5-150uV,频率低至几十赫兹以下,这些信号极易被外界干扰信号淹没。因此滤掉高频的干扰信号对脑电的提取就很重要,测谎实验中通过脑电放大器记录的脑电数据是数字信号,因此选择数字低通滤波器来滤掉高频的干扰信号。50Hz工频干扰是由人体的分布电容所引起,包含丰富的谐波分量以及因电网不稳定而造成的其他噪声,用低通滤波器之后会滤掉一部分这种干扰。数字滤波器是一种用来过滤时间离散信号的数字系统,通过对抽样数据进行数字处理来达到频域滤波的目的。根据其单位冲激响应函数的时域特性

62、可分为两类:无限冲激响应(IIR)滤波器和有限冲激响应(FIR)滤波器。与IIR滤波器相比,FIR的实现是非递归的,总稳定的;更重要的是,FIR滤波器在满足幅频响应要求得同时,可以获得严格的线性相位特性。对于线性相位FIR滤波器通常采用窗函数法设计。窗函数法设计FIR滤波器基本思想是在时域逼近理想滤波器的单位脉冲响应,它通过采用不同时宽的窗函数对理想滤波器的无限长单位脉冲响应进行截短,从而得到有限长的单位脉冲响应。窗口函数在时域上截取一段,势必造成频域的矩形窗口的失真,结果就是截取出的信号也相应失真。为了补偿这种失真,只有改变原来窗口的形状,修正经过时域截取后的窗口失真。改善窗口函数的标准:(

63、1)尽量减少窗口频谱的旁瓣,使能量集中在主瓣中,以减少波动的幅度和次数,提高阻带衰减。这样,主瓣就不能太窄;(2)主瓣的宽度应尽量窄,以得到尽量窄的过渡带。工程中。常用的窗函数有以下六种:矩形窗,三角形窗,汉宁窗,汉明窗,布莱克曼窗,凯泽窗9。六种窗函数的性能指标如表3.1所示。表3.1常用窗函数的性能指标 窗函数 窗普性能指标 加窗后滤波器性能指标 旁瓣峰值 dB 主瓣宽度 2/n 过滤宽度2/n 阻带最小衰减 矩形窗 -13 2 0.9 -21三角窗 -25 4 2.1 -25汉宁窗 -31 4 3.1 -44汉明窗 - 41 4 3.3 -53布莱克曼窗 -57 6 5.5 -74凯泽窗

64、 -57 5 5 -80 因此,根据表3.1进行折中选择汉明窗滤波器。由于P300电位的频率分布在10Hz以下,所以在本实验研究中采用10Hz的汉明窗低通滤波器。汉明窗低通滤波的幅频特性和相频特性如图3.1所示。 图 3.1 汉明窗低通滤波的幅频特性和相频特性3.2 脑电信号的特征提取特征提取:对原始数据进行变换,得到最能反映分类本质的特征。将维数较高的测量空间(原始数据组成的空间)转变为维数较低的特征空间(分类识别赖以进行的空间)。脑电信号的特征提取是从经过了预处理和数字化处理的脑电信号中提取出能反应使用者意图的信号特征,在提取特征时时也要遵循一些基本原则,列如,一方面要求所选特征应能够足以

65、表达所述模式,另一方面则要求所选择特征的数量应尽可能地少以便能够高效率地完成后续的分类和识别任务。常用的特征提取方法有自回归模型 、小波变换、独立分量分析和共空间模式等。 特征提取是脑电数据处理中重要的一部分,从原理上讲,P300特征波形是在目标刺激后大约300ms左右出现一个明显的正峰。在早期的研究中,研究者重点关注的是P300正峰本身,所提取的用于分类的参数也是与这个正峰相关的特征量,通常是在一个狭窄的时间窗内提取P300波形的幅值,面积等特征量。目前,直接用降采样后的时域波形作为特征向量进行分类已经成为P300电位分析中的主流,用于分类的数据包含了刺激后0500ms范围内甚至更长时间的数

66、据段。实践证明,采用长时间窗内的数据进行分类比单纯使用P300正峰数据的效果更好。根据这个特点,截取闪烁刺激之后的0.7s内的数据来分析,这样既可以保证有用的数据特征不丢失,又可以确保数据量地减少。3.3 脑电信号的分类识别3.3.1分类算法简介 贝叶斯-卡尔曼滤波(Bayesian-Kalman)10:贝叶斯-卡尔曼滤波是一种经验估值方法,它能把脑电信号转化成相应的感知状态的概率,因此它允许不同状态之间以及一系列训练产生的脑电之间的衔接存在非平稳性。 人工神经网络11:人工神经网络是脑机接口系统中应用最多的分类器,它的应用比较简单,参数原则也很简单,并且分类结果的准确性很高,因此经常被广应用

67、于脑电信号的分类中。但是,由于神经网络的优化目标是基于经验的风险最小化,因此不能够保证网络的泛化能力。 支持向量机:支持向量机是一种由Vapnik在统计学习理论基础上发展出来的一种新的机器学习方法,它基于结构风险最小化原则,保证了学习机器具有良好的泛化能力,在解决小样本、高维数、非线性、局部极小点等问题上比较好。缺点是速度慢,因此不适合大量数据的处理。最小二乘支持向量机是由Suykens 等人提出来的一种新型的支持向量机,它是把最小二乘线性方法进入到支持向量机中,将标准的支持向量机中二次规划问题转变成线性方程求解,因此简化了计算的复杂度。 遗传算法:用遗传算法对特征信号进行分类,要从待处理的脑

68、电信号中提取出大量特征信号(包括有伪特征信号和有用的特征信号),然后,通过遗传算法去除伪特征信号,保留有用的特征信号作为驱动信号。遗传算法搜索速度比较慢,因为它没能及时利用网络的反馈信息。因此,要想得要较精确的解需要较多的训练时间。其并行机制的潜在能力没有得到充分利用,这也是当前遗传算法的一个研究热点。另外,决策树、概率模型、逻辑神经网络、多层感知器等相关分类方法也得到了广泛的应用。 线性判别分析:是统计学上的一种分析方法,用于在已知的分类之下遇到有新的样本时,选定一个判别标准,以判定如何将新样本放置于哪一个类别之中。其基本思想是选择使得Fisher准则函数达到极值的向量作为最佳投影方向,从而

69、使得样本在该方向上投影后,达到最大的类间离散度和最小的类内离散度。在Fisher思想的基础上,Wilks和Duda分别提出了鉴别矢量集的概念,即寻找一组鉴别矢量构成子空间,以原始样本在该子空间内的投影矢量作为鉴别特征用于识别。 Fisher 线性判别如下优点:(1)一般对于线性可分的样本,总能找到一个投影方向,使得降维后样本仍然线性可分,而且可分性更好即不同类别的样本之间的距离尽可能远,同一类别的样本尽可能集中分布。(2)Fisher方法可直接求解权向量;(3)Fisher的线性判别式不仅适用于确定性模式分类器的训练,而且对于随机模式也是适用的。因此本实验数据处理采样Fisher线性判别方法进

70、行分类。3.3.2 Fisher 线性判别 Fisher线性判别分析的基本思想:通过寻找一个投影方向(线性变换),将高维问题降低到一维问题来解决,并要求变换后的一维数据具有如下性质:同类样本尽可能聚集在一起,不同类的样本尽可能远。Fisher线性判别分析,就是通过给定的训练数据,确定投影方向和阈值,即确定线性判别函数,然后根据这个线性判别函数,对测试数据进行测试,最后得到测试数据的类别12。1. 的确定(1)计算各类样本均值向量 (3.1)(2)计算样本类内离散度矩阵和总类内离散度矩阵 (3.2) (3.3)(3)计算样本类间离散度矩阵 (3.4)(4)我们希望投影后,在一维Y空间里各类样品尽

71、可能地分开,也就是说我们希望两类样品均值之差越大越好,同时希望各类样品内部尽量密集,即总类内离散度越小越好,因此,我们可以定义Fisher准则函数为 (3.5) 使得取得最大值的W为 (3.6)2. 阈值的确定 在投影后的一维Y空间中,各类样本均值。实验中采取的方法: (3.7)3. 对于某一个未知类别的样本向量,计算出它在上的投影点。 (3.8)4.根据决策规则分类 (3.9) 第四章 实验数据的分析与处理4.1数据预处理 首先对电极进行选择,然后对包含噪声的信号进行了截止频率为10Hz的汉明窗低通滤波处理,选用50Hz的工频限波去除50Hz的干扰。实验的采样频率是100Hz/s,最后是实验

72、数据段的截取和数据调整工作。由于在实验中已经考虑到眼动干扰、心电干扰和电极接触噪声,所以在本数据中这两种干扰均比较小。具体预处理过程如下: 4.1.1选择电极本实验共采集了19导联。选取19个导联'FP1', 'FP2', 'F3', 'F4', 'C3', 'C4', 'P3','P4', 'Po7', 'Po8', 'F7', 'F8', 'Oz',' T4', 

73、9;T5', 'T6', 'Fz', 'Cz',' Pz'。4.1.2 低通滤波 每一路提取的信号都由一个30阶的汉明窗低通滤波器进行截止频率为10Hz的滤波处理,因为P300电位主要分布在10Hz以下,所以通过滤波后P300电位会被保留下来。未经过滤波的初始信号和通过10Hz汉明窗低通滤波器滤波后的信号的波形图如图4.1.1所示。 图4.1.1 原始的信号和滤波后的信号4.1.3 实验数据段提取 P300脑电信号,在时域会有明显的特征,在300ms附近会有明显的波峰出现,根据这个特点来选择0700ms的时间窗对每一个导联

74、的实验数据段进行截取,从而提取出有用的信息特征。单次的试验从闪烁刺激开始算起,截取每一次闪烁刺激开始时刻之后的0.7s之内的数据。本次实验采样频率默认为100Hz,即1s内采样100个点。本文将由同类刺激多次引起的多段脑电数据进行叠加平均,叠加平均后得到了比较明显的P300信号的数据。 图4.1.2和图4.1.3分别为T6和Pz 两个导联的数据50次重复试验叠加平均后得到的波形图,实线是目标刺激,虚线是非目标刺激。实验中目标刺激和非目标刺激在在300ms500ms之间均有较大的波峰,为P300成分。造成目标刺激和非目标刺激的P300电位没有存在显著差异的原因可能是因为刺激重复次数过多造成的。本

75、次实验刺激重复50次,刺激的重复出现有可能造成被试者对该刺激的强化记忆,多次重复之后在脑电形成一定的表征。 图4.1.2 50次重复试验叠加平均后得到的P300信号 图4.1.3 50次重复试验叠加平均后得到的P300信号4.2数据特征提取实验过程中的每一个闪烁刺激所产生的脑电波的有效数据是一个19(个导联)*70(个数据点)的矩阵。被试者做4组实验,每组实验是5个闪烁刺激重复50次,其中1个闪烁刺激是目标刺激,4个闪烁刺激是非目标刺激,实验中被试者总共进行5*250*4=1000次的视觉刺激,由于最后一组实验得到的样本在采集过程中受损,所以最后得到750个有效样本,每一个样本数据是19*70

76、的矩阵。脑电信号的特征提取是从经过了预处理和数字化处理的脑电信号中提取出能反应使用者意图的信号特征。选取每一个样本19(个导联)*70(个数据点)的矩阵构成一个特征向量,每一个导联的70个数据点构成该特征向量的一个分量,所有样本的特征向量组成一个特征空间。将19*70的矩阵变成一行的数组方便接下去的分类。4.3实验数据的分类结果本实验研究将所得的样本数据分为两部分,一部分作为训练样本,另一部分作为待测样本,将作为训练的观测样本根据其是否为目标刺激分为两类,然后用Fisher线性判别得到最佳投影方向W和阈值y0,待测的样本经过W投影后与y0比较后得到分类结果。4.3.1 训练量对正确率的影响实验

77、重复次数与正确率的关系如图4.3和表4.3所示,图4.3.1中蓝色线代表把全部数据的2/3作为训练数据,1/3作为测试数据,即取500个观测样本作为训练,剩余的250个观测样本作为测试,红色线代表把全部数据的1/3作为训练数据,2/3作为测试数据。结果显示在刺激随机重复8-10次后,会达到一个相对稳定的正确率,随着重复次数的增加,并不能提高相应的正确率。训练组的数据量越大,得到的分类正确率越高。表4.3表示刺激重复10,20,30,40,50次所对应的正确率,全部数据的2/3作为训练样本在重复次数10到50次间得到的平均正确率为54%。全部数据的1/3作为训练样本在重复次数10到50次间得到的

78、平均正确率为46%。 表4.3 实验重复次数与正确率 重复次数 正确率训练量 10 20 30 40 50全部数据的2/3 52% 51% 54% 56% 54%全部数据的1/3 42% 45% 46% 47% 48% 图 4.3.1 重复次数与正确率的关系图 4.3.2 降采样对正确率的影响 对数据进行间隔采样,每隔两个数据点,抽取一个数据点来进行分析,可以减少运算的时间,从而提高运算的效率。采样频率100Hz,进行2倍降采样,这里的单次试验选取的时间段是闪烁刺激过后700ms内的数据,单次试验每个导联的采样点数就为35个。在单次试验中降采样前的信号和经过2倍降采样后信号的波形图如图4.3.

79、2所示。 图4.3.2 降采样前的信号和降采样后的信号 降采样前后的实验重复次数与正确率的关系如图4.3.3所示,蓝色线代表降采样前数据的分类结果,红色线代表2倍降采样后数据的分类结果。结果显示降采样前的正确率比降采样后的正确率要略高一些,虽然降采样提高了运算速度,但在本实验中降采样后却没有提高正确率,造成的原因可能是降采样后有一些有用的数据信息遭到丢失。 图4.3.3 降采样前后实验重复次数与正确率关系图4.3.3 导联选取个数对正确率的影响本实验共采集19个导联'FP1', 'FP2', 'F3', 'F4', 'C3', 'C4', 'P3','P4', 'Po7', 'Po8', 'F7', 'F8', 'Oz',' T4', 'T5', 'T6', 'Fz', 'Cz',' Pz'。如图4.3.4所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论