选修课论文.doc_第1页
选修课论文.doc_第2页
选修课论文.doc_第3页
选修课论文.doc_第4页
选修课论文.doc_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2013届本科生选修课论文 学号:100302030120 成绩:PhotoShop课程学习心得院 部: 电子与信息学院 专 业: 电子信息工程 姓 名: 钟文俊 指导教师: 二一三年十二月毕业论文诚信声明本人郑重声明:所呈交的毕业论文PhotoShop课程学习心得是本人在指导老师的指导下,独立研究、写作的成果。论文中所引用是他人的无论以何种方式发布的文字、研究成果,均在论文中以明确方式标明。本声明的法律结果由本人独自承担。 毕业论文作者签名: 钟文俊 2013年 12 月 6 日摘 要本文阐述了简单的声、光同时控制的路灯电路的制作。声、光同时控制的路灯电路,能自动控制白天开关、夜晚亮灯、人走灯灭。具有灵敏、低耗、性能稳定、使用寿命长、节能等特点。选择声敏传感器、光敏传感器作为基本元件。综合了声、光和延时控制、工作稳定、节电并可延长灯泡寿命。光敏传感器,声控传感器两种传感器形成了声控、光控两种控制的电路。利用布局和布线规则完成了电路板的制作。实现了电子开关的两种控制,实验结果实现了灯的控制。【关键词】 传感器 声控 光控 节能AbstractSound and light control corridor lights switch for automatic switch during the day, night lighting, people take the light off. Sensitive, low consumption, stable performance, long life, energy saving and so on. Here are sound, light control automatically delay saving switch, combines sound, light and time delay control, job security, power saving and extended lamp life. Strong light during the day or the occasion even greater control of the vibration noise can not light bulbs; night or low light encounter sound, vibration, lights and automatic lights, after about one minute (time can be set) automatically can be used for stairs, toilets and other public places, the automatic management of the corridor lights. In this paper, a simple control of sound and light production of the corridor light switch. Select sound sensor, light sensors as a basic element. Photosensitive resistors, sensors voice of two sensors form a voice, light control two control board. Using layout and routing rules of the circuit board production. To achieve the two control electronic switch, the experimental results achieved light control.Key Words:sensor;voice;optical control;energy saving;目 录第1章 绪论1.1疲劳驾驶监测技术的研究背景及意义11.2疲劳机理分析21.3疲劳产生的原因21.4驾驶疲劳的表现31.5驾驶疲劳监测技术的研究现状4第2章 系统的整体结构和图像采集模块2.1本系统主要结构52.1.1系统硬件部分52.1.2系统软件部分62.2图像采集模块简介62.3本章小结8第3章 眼睛的定位与跟踪3.1眼睛模板的制作过程93.2眼睛定位与跟踪算法103.2.1眼睛定位的算法113.2.2眼睛跟踪的算法123.3章小结14第4章 特征提取与图像处理模块的设计4.1 Gabor变换154.1.1窗函数154.1.2短时傅里叶变换174.1.3 Gabor变换184.2 基于Gabor变换的特征提取204.3图像处理模块的设计244.4本章小结25第5章 SVM分类器5.1 SVM分类器的理论基础265.2 SVM分类器的基本原理275.2.1支持向量机275.2.2最优分类面285.2.3判别函数285.3 SVM分类器的设计305.3.1误差的验证315.3.2 SVM分类器的设计315.4本章小结35致 谢36参考文献37V 驾驶员疲劳状态的视频监测的研究 第1章 绪论1.1疲劳驾驶监测技术的研究背景及意义1随着社会的进步,人们的生活水平的提高,近年来,国民拥有私家车的数量不断提高,但与此同时交通事故的发生率也不断的上升,车辆与安全问题已成为社会关注的热点,而其中疲劳驾驶引发的交通事故占事故总数的20%左右,占特大交通事故的40%以上,可以说疲劳已成为安全驾驶的主要原因。下面通过一些具体的事例,让大家了解疲劳驾驶的危害性。新浪网消息:2003年8月27日,赵某驾驶一辆出租车出去拉活,途中,由于赵某疲劳驾驶,精力不集中,车驶入公路一侧绿化带中,将正在清扫垃圾的环卫工人丁某和何某撞倒,两人后经医院抢救无效而死亡。2004年7月21日13点时,吉林省长平高速公路公主岭附近发生了两起交通事故,两辆大货车一前一后翻在高速公路下的沟里,并且两车并没有相撞的迹象。车子损坏也并不严重。据了解,原来这两车不是相撞,而是因为司机疲劳驾驶进了沟,结果造成200多箱鸡蛋被打坏了。这样的交通的事故每天都在发生,在世界各地,只要有车辆的地方,像这样的事件就在不断的上演着。以下的这些数据就是最有力的证据。这些事故不得不让人深思:产生疲劳驾驶问题的根源在哪里,是什么?我们又有什么办法能避免疲劳,从而降低事故发生的概率呢?驾驶是一种体力和脑力消耗都很大的职业,它需要驾驶员集中精力来不断处理行车时遇到的情况及有关的信息,尤其是在现在车辆繁多复杂的情况下,驾驶员的精神处于高度紧张的状态,而良好的精神状态和健康状况则是安全行车的重要保证,驾驶员在行车的时候一旦出现情况,离发生事故也就不远了。因为疲劳了人容易打瞌睡,由于现在公路的路面质量较好,驾驶员的行车速度普遍都较快,等险情真正出现的时候,已经来不及了。为了避免事故的发生,我们可以在车内安装一个视频,一天24小时监视着驾驶员的驾驶状况。主要是针对驾驶员脸部肤色的变化以及眼睛的定位来判断驾驶员驾驶的状态。若是发现驾驶员正处于疲劳状态则立即会响起警报声,告知并提醒驾驶员停止驾驶。当然,当然疲劳驾驶还是在于人的本身,我们还更要加强驾驶员的疲劳驾驶以及怎么更好的去避免疲劳的相关的知识。相关知识加强了,再加上有视频的24时监控着,提醒着,交通事故的发生就会相对的减少,人们更可以安心的行车,更是给他们的家多了一份保障。1.2疲劳机理分析驾驶员产生疲劳有来自多方面的原因。比如,晚上的睡眠质量,驾驶员的心情与心里的压力等有关。这归结来讲,主要是驾驶员的生理上的反应。当驾驶员感觉到了疲劳时,他的眼睛与大脑会感觉到了疲劳,出现大脑反应迟钝,视力不能很好地集中。后就是出现手脚动作缓慢,以至于不能很好的应付车外来的复杂信息。驾驶疲劳导致事故的形成过程通常是:大脑供氧不足中枢神经疲劳感觉下降、知觉迟钝肌肉收缩的调节机能恶化感觉刺激中断认识迟缓,判断失误、操作失误打瞌睡等交能事故。可见,疲劳驾驶的危害非常大,甚至影响自己和他人的生命安全。所以,建立起一个能自动识别疲劳驾驶,并且能在短时间内快速的反应,提醒驾驶者的设备,在当今的社会上非常的重要。如果能设计出一套有效的设备来,让他正常工作,可以在社会上挽救很多事故,所以,研究出一套疲劳监测系统是极有现实意义的。1.3疲劳产生的原因引起疲劳的原因有很多。对于驾驶员来说,主要还是神经和感觉器官方面的疲劳相对严重些,长期间开车,会导致血液不畅,这样肢体非常容易疲惫,而且长时间的集中精力开车,对精力也是一个不小的挑战,容易在精神上面疲惫。由于长时候的保持一个姿势,也让动作不畅,会引起腰酸背痛等症状。我个人觉得形成驾驶疲劳的主要原因有以下几个方面:(1)生活环境。居住的地主离工作点较远;家务事过多或是夫妻不和睦;精神负担重;社交太广,参加的娱乐活动时间太长等。(2)睡眠的质量。晚上就寝的过晚,睡眠的时间太少,睡眠效果差;还有就是嘈杂的睡眠环境不能保证睡眠的质量。(3)车内的环境问题。车内空气质量差,通风不良;温度过高或是过低;噪声和振动严重;座椅的位置高速不当或是与同车人的关系紧张等(4)车外的环境,在午后、傍晚、凌晨、深夜时驾车;路面状况差;天气的原因;交通环境差或是交通条件拥挤等。(5)运行条件。长时间、长距离驾车;车速过快或是过慢;过于限制到达的目的地的时间。(6)驾驶人的身体原因。体力与耐久力差;视、听能力不降;体力不支或是患有某种慢性疾病;服用驾驶车辆忌用的芗;女性生理特殊时期,比如经期,孕期等。(7)驾驶人的经历。技术水平低,操作生疏;驾驶时间短、经验少、安全意识差。(8)驾驶人的心情原因。心情不好,烦躁的心情驾车等等。这些原因是导致驾驶疲劳的直接原因,应该加驾驶员的驾驶安全与防止疲劳的意识。1.4驾驶疲劳的表现疲劳状态是一种不定量的状态,在不同时间、不同个体、不同情境下,疲劳产生的程度也不相同。所以在驾驶员身上,疲劳状态的发生从弱到强可能也有不同的变化。疲劳状态产生的以后,驾驶员疲劳的心理表现形式,也可以通过驾驶员的自我感觉或主观体验来反映,概括起来主要有以下几个方面的表现:(1)无力感。驾驶感觉到体力减弱、操作无力,方向、换挡等操作主动性下降。(2)注意功能失调。疲劳会引起注意稳定性下降,注意力分散,接收外界信息怠慢迟缓,视野逐渐变窄,漏看、错看信息的情况增多。(3)知觉功能减退。感觉器官的功能会由于驾驶疲劳而发生衰退或紊乱,主要表现为礼堂模糊、听力下降,甚至产生幻觉。(4)操作动能下降。换挡不灵活,动作不协调,油门操作不平稳。(5)记忆、思维能力差。头脑不清醒,对外轮事物思维判断力下降。在过度疲劳时,往往会忘记操作程序,如转弯时忘记开转向灯、不观察车侧及车后情况等。(6)困倦瞌睡。头脑昏沉、困倦、闭眼时间延长或打瞌睡等情况的发生。1.5驾驶疲劳监测技术的研究现状2美国Digital Installations 开发的S.A.M.疲劳报警装置利用置于方向盘下方的磁性条检测方向盘转角,如果一段时间内驾驶员没有对方向盘进行任何修正操作,则系统推断驾驶员进入疲劳状态,并触发报警。欧盟的AWAKE 项目对人眼生理反应信息、方向盘操作转角信息、方向盘转向力信息以及车道线信息进行了检测和记录,通过研究这些信息与疲劳之间的关系,利用信息融合技术实现驾驶人疲劳分级评价,采用声音、光照闪烁以及安全带振动等方式对疲劳实现预警,开发了驾驶人疲劳检测报警系统。我国在这方面的起步还是比较晚。现在在从事相关研究的人员也不多。主要还是在大学的研究机构进行。不过值得庆幸的是,现在国内也越来越重视这方面的研究和创新了。很多相关的单位机关也在积极的配合建立研究机构。首都师范大学在基于机器视觉的嵌入式驾驶疲劳检测系统方面进行了研究,在实验室环境实现了检测系统平台,但是在各方面都不是很成熟的条件,在精确度上面还没有很长足的进展。第四军医大学和航空医学研究所对人眼的状态检测和头部运动做了一系列的实验,在利用基于视频的眼部生理特征判断驾驶人疲劳方面做了较为深入的研究工作。综上所述,国内以上相关领域的研究主要集中在基于视频信号的驾驶人面部生理特征的研究方面,而且目前各种算法在识别精度、可靠性、实时性等基础性能方面尚存在问题,与国外相关研究相比存在较大差距。现在在市场上面的疲劳驾驶预警系统,是由清华大学和东南大学的几位博士研发的 gogo85。他的原理主要是检测驾驶员的眼睛开合情况,他最强的地方在于增加了对对瞳孔的识别,睁眼睡觉瞳孔很暗,所以,睁眼睡觉也有可能识别。系统还能对带各类眼镜的驾驶员进行识别,这是一款实用性非常强的产品。现在国家也在致力于疲劳驾驶的研究当中,已经有清华大学等一些博士参加了国家的十一五计划当中,开展驾驶人疲劳状态监测及预警技术的研究,用来开发实用性强,能很好的识别疲劳驾驶的方法,也是从眼部生理反应为主要入手阶段,通过信息融合提高对驾驶人状态判别结果的准确性与可靠性。第2章 系统的整体结构和图像采集模块2.1本系统主要结构该系统的主要表现方式是通过检测驾驶员在驾驶过程中。眼睛的特征来作出判断,该驾驶员是否处于疲劳状态。本系统的硬件组成是由计算机和红外摄像机,而软将方面的功能模块是有以下三部分组成:图像采集模块、图像处理模块和SVM分类器。2.1.1系统硬件部分系统的硬件是由计算机和一个带红外光源的红外摄像机组成的。其中红外摄像头,又可以称为红外夜视摄像头,现在运用非常广泛。英国的天文学家赫谢耳在1800年发现了红外线,而后美国的贝尔实验室也在之后不久的上世纪60年代发明了红外夜视的技术,并将之不断推广,应用于摄像等诸多产品中,产生了红外摄像机等新型高科技产品。因为近年来,红外摄像机的构成物:红外光源产生技术和视频扑捉技术飞速的发展,也使得红外摄像机在国家各方面的运用也越来越广泛。光跟无线电波是一样的,都是一种电磁波,光波的波长可以从几纳米到1毫米。在光波中,人眼看到的只不过是其中的一部分。而这部分可以看见的光波,称之为可见光。可见光波长范围是380nm780nm,根据不同的波长,我们可以分成7种光,分别是紫、蓝、青、绿、黄、橙、红。在红外摄像机中。有几大非常关键的技术,其中红外夜视技术又是非常重要的一块,他是由主动红外夜视技术和被动红外夜视技术构成。主动红外夜技术是由光源来主动照射并利用目标反射回的红外光线进行观察的夜视技术。被动红外夜视技术又常被成为远红外技术。他是由射来实现观察的红外技术,由于他的抗干扰能力非常强。所以在军事等领域都有非常广泛的运用。就现阶段而言,用于监控领域的红外技术主要还是主动红外技术,而红外摄像机则是采用了干红外设想机和红外光源发生器组合的方式。而现在大多数的摄像机都是采用 “电荷耦合器件”作为感光组件。CCD是一种半导体成像器件,它本身就可以感应到红外光线,因此,只要在普通摄像机的CCD前加上红外滤光镜便具备了红外摄像能力。由于现实生活中,疲劳驾驶多出现在晚间,还有就是“亮瞳效应”的关系,本系统采用的是红外摄像机来作为监控设备。2.1.2系统软件部分本系统主要的软件功能模块也是三部分组成:图像采集模块、图像处理模块和SVM分类器。图像采集模块的功能:采集驾驶员脸部图像特征。图像处理模块的功能:在图像采集的基础上,对于采集到的眼睛局部等进行定位和跟踪,以便于提取出系统要研究的一些数据和参数。SVM的主要功能:分析数据,对比数据来判断驾驶员的状态。系统的软件流程图如图2-1所示。图像采集模块图像处理模块SVM处理器图2-1 系统的软件结构具体过程如下。首先,采集模块对驾驶员的脸部采集。然后将采集好的脸部图片送进图像处理模块中,进行眼睛部分的定位和跟踪,然后计算,得出眼睛的特征数据。最后用SVM分类器对其进行分析。判断驾驶员的状态,如果驾驶员出现疲劳状态,系统就会自己发出滴滴的警告声来提醒驾驶员。2.2图像采集模块简介它是由一个带红外光源(这样能适应夜晚的光线)和一个红外滤波器的摄像机所构成的。他主要是用来收集驾驶者的脸部图像集的。现在就一个问题,为什么是收集驾驶员的脸部图形呢?就目前而言,完成本论文,一个基础的理念在于,如何能够感应或者说监控到驾驶员是否是在疲劳驾驶,是一个非常值得商榷的问题,所以,图像采集是采集什么数据的呢,能到到一个什么效果。在近些年的研究中发现,对于脸部的采集,是最有效也是最科学的方法,其一:驾驶员在驾驶过程中,灵活性较大,但是头部的活动范围比较小,其二:人是否疲劳驾驶,一个很大的关键在于脑部是否清醒,眼睛是否清醒,其三:在每个不同的时刻,是否能随时的跟踪,疲劳驾驶最大的一个症状在于,驾驶者眼睛容易疲惫。所以,就目前的科学发展而言,大部分还是使用采集人眼睛图像方式来检测是否存在疲劳驾驶。根据研究指出,人在正常情况下,眨眼睛是0.1秒到0.3秒之间,最长也不会超过0.5秒,所以,利用人的眼睛图像来检测,是非常科学的,可以在很短的时间内,检测出人的驾驶状态。在这我们需要引入一个“亮瞳效应”的概念,它的含义是在驾驶者的前方玻璃或者可以固定的地方放一个摄像机,是带红外线的,当人眼中不可见的红外光沿着摄像机的光轴照到人脸的时候,瞳孔会将接收到的几乎所有的红外光反射给摄像机,使摄像机拍出的人脸图像中的眼睛是一对亮点。“亮瞳效应”也称为“红眼效应”。如下图所示,就是摄像中的“红眼效应”。图2-2亮瞳效应的效果图“亮瞳效应”的工作原理上面已经叙述过了。具体图解,如下图2-3所示。红外摄像机驾驶员的头部图2-3 亮瞳效应的原理图2.3本章小结本章主属于概述的一章节,把本次设计的主要思路和路线描述了一下,也引入了“亮瞳反应”,和图像采集模块的一些简介和意义。 第一小节是主要描述了本系统在硬件部分的主要组成部分,就是计算机和红外摄像机。第二小节是描述了本系统中的软件部分,他主要有三部分组成,分别为图像采集、处理和SVM,最后还介绍了图像采集模块的应用问题。下面就展开讲下各个部分。第3章 眼睛的定位与跟踪要实现眼睛的定位于跟踪就必须先接触另一个概念图像处理模块。它的作用主要体现在图像预处理、眼睛的定位与跟踪、特征提取三部分。它是本设计中一个非常重要的环节。在采集到人脸部的图像后,再经过图像处理模块利用卷积核模板匹配的方式对眼睛进行定位和跟踪。下面,我就对具体的操作流程叙述如下。3.1眼睛模板的制作过程首先,对于眼睛模板的制作,我们要了解,眼睛就类似一个夜空中的明月,中间为两点,而四周是黑色。所以,在制作过程中,我们可以先制作一个黑色背景,把像素调成0,然后再在中间做出一个稍亮的白色点,像素在1-2就可以了。然后,再经过图像处理模板功能,对它进行一些处理。在其中,我们还要用到一个直方图均衡化来增大模板的亮度等。然后把像素的标准调成-2到2之间。这样,我们就能得到一个眼睛的大概图形,然后,在模板的平滑区,为了不使它重叠的效果占用了太多的亮点,我们应该把握好黑色和白色像素的量,要基本持平,这样才能更好的减弱平滑区的黑白像素能互相抵消,缩减他们的相关值。最后,我们还应该注意,类似于眼睛大小的脸部轮廓,比如耳郭、头发、牙齿等等,为了防止他们和平滑区一样,占用了太多的亮点,我们对他们也应该做适当的修改,这又要使用图像处理模块了,可以让他们的像素稍微变低些,或者暗些,这样也能很好的突出眼睛部分。制作眼睛模板的流程图如下图所示。如下图,第一步当中的图形只是一个眼睛的雏形,他并未经过太多的处理,只是用图像处理模块,使用了直方图均衡化、像素值标准化等简单的处理。中间的那幅图是经过了进一步的处理,如图所示,显然白色像素和黑色像素的量差不多到达一比一,使平滑区没有太多的亮点,这样也很好的阻止了平滑区有太多的关注度,衬托出了眼睛的图形。第三幅图是一个完成图,显然看的出,在处理过后,很突出眼睛部分的模型,在这我们把眼睛周围的所有像素都做了变暗处理,这样能更好的凸显眼睛部分的亮色,也很好的阻止了眼睛周围背景获得太多的关注度。它暗像素增减更多的相关值,最终得到眼睛模板。图3-1 眼睛模板的制作过程3.2眼睛定位与跟踪算法眼睛定位和跟踪算法是基于卷积核模板的匹配。他能非常快速和清楚的检测出某物体出现在图像中的具体位置,也能非常清楚制罐的表现出图像与模板之间的相似性,模板匹配在各种图像定位检测中都有非常广泛的运用。下面,我对模板匹配的基本原理做简单的叙述:首先,就是根据被测的图像进行模板的制作,完成后,再把模板跟图像进行对比,要非常仔细认真的扫描对比,通常都是从左上角开始进行逐一的扫描,注意计算在图像和模板同一处的地方的相似度是多少,具体的比例大小,然后再将模板平移一个像素进行相同的一次操作,跟上面的方法一样,计算和记录比例的大小,直到图中所有的点都完成了对比。最后再根据所记录下来的相似度值,来确定图中是否有该物体。如果有的话,又具体在什么地方。在一般来说,表达模板匹配的相似度,也就是同一个大小、位置在模板中的大小和在图像中的相似度,都用类似欧式距离或者余弦距离来表示,但是本设计的表达,是使用的卷积核模板匹配方式,也就是对比图像中和模板中相似的地方通过卷积计算来他们之前的相似关系的,具体的操作如下。首先根据图像,做出模板来,然后将该模板作为卷积函数。相比大小为的原图像,一般都是从图像的左上角开始,选择其中一个与模板一样大小的活动窗口,将该窗口与模板进行卷积运算,也就是:将的像素与模板中对应的像素进行相乘后求和,计算出他们的相似系数 (3-1)然后把他们计算的结果作该活动窗口中心像素的新灰度值。在这之后,将模板往下移一个点,再进行一次同样的操作,得到一个新的值,新的图像,我们称之为,与原图相关的结果相关性图像。在这个图像当中,对比灰度值,值数大,说明他们的相似度高,反之,说明相似度低。可见,卷积核模板匹配过程实际上是一个利用卷积核模板对图像中每个像素的灰度什进行修正的过程。3.2.1眼睛定位的算法这个相对来说比较简单,可以用一副图来直观的表达,如下图所示,就是一个工作流程,他的具体工作原理状态是:第一步,用最初的图像跟制作的眼睛模板,在经过图像处理系统预处理后,进行卷积计算,得到一个结果相关性的图像。第二步,将结果相关性图片和最初的跟原图所计算出来的相似值对比,只留下跟眼睛相关值非常高的那部分,其他的不需要,然后将他们的像素相乘,作为候选者。第三步,也是最后一步,判断留下来的候选者,数量是不是2,如果是2.说明他们就是眼睛。然后记录下他们的具体位置和特征,如果不是2 。在理论上就说明这是没有被检测出来。判断图像中眼睛候选中眼睛选者的个数是否是2.如果为2个,那么认为它取一下一幅图片进行检测。原始的图像卷积核模板匹配像素相乘并阈处理没有检测到眼睛更新特征两个眼的候选者?取下一帧图像检测到眼睛并更新特征图3-2 眼睛定位算法的流程图图3-3 眼睛定位算法的结果示意图从图中能很明显的发现,在原始通向通过卷积核模板匹配之后,得到了相关性图片,这个图片中,眼睛的部位明显更加亮,而且其他区域也相对较暗。能很容易的辨别出来,再进一步进行像素相乘并阀值化处理后,得到的眼睛候选者,就是两个非常明亮的点,我们就称这两个点为眼睛的部位。3.2.2眼睛跟踪的算法由上面的叙述可以看出,虽然卷积的办法是非常好,能很精确而且非常好的计算出眼睛的具体位置,但是方法有些保守,而且时间比较久,而且在计算量上面也是个非常大的工程。所以为了减少计算量,进一步的提高眼睛检测的效率,我们就需要引入一种新的算法眼睛跟踪算法。所谓眼睛跟踪算法,其实主要就是基于摄像机拍摄图像是一个连续的过程,最重要的一点是驾驶员在驾驶过程中,头部是不会有太大幅度的变动的,这也非常有利于跟踪法的进行。而且这个方法还有一个很好的效果,能分辨出人的正常的眨眼与打瞌睡时的闭眼情况,在查阅了一些资料后,一般都指出正常情况下,人眼闭合时间一般在0.20.3秒之间,最长也不会超过0.5秒。这也就是让我们有更好的分辨依据,我们按照摄像机每秒取10帧图像来计算,那么,人正常眨眼的时间的长度不应超过4帧的时间。当我们在上一帧眼睛位置的周围无法检测到当前帧眼睛时,可先不要急于下结论,当在3帧以内,图像上面无法发现眼睛的时候,可以先不做理会,因为这有可能是正常的眨眼,但是当在第4帧还是无法发现眼睛的话。就要认真观察下一张图片了,如果还没有眼睛的出现,有可能就是出现了疲劳驾驶的情况3。我们根据眼睛跟踪算法的工作原理,可以绘制出眼睛跟踪算法的一个工作流程图如图3-5所示。我们先令计数值i=0,在0.1秒钟的时候取下一帧图像,在检测出眼睛的坐标周围是否能检测该帧眼睛位置。如果能准确的检测到眼睛,则立刻更新眼睛坐标等特征,再令i=1并再取一帧图像,在新的眼睛坐标周围检测这帧图像中的眼睛,看是否能检测到。如果没检测到眼睛,那么要分两种情况,其一是判断i是否小于帧数N(一般认为是4)。若i小于N,那么我们可以认为没有特殊情况,上面已经提过了,再令i+后,取出一帧图像,在原眼睛坐标的周围继续进行检测;若i大于等于N,而没有检测到眼睛,那么我们就认为是疲劳驾驶了,应该立刻拿电脑或者笔把当时的情况做好记录,然后还要把这张图像从新的检测一遍,用眼睛定位法。眼睛定位算法i=0记录下一相关的特征更新特征取下一帧频图像检测到眼睛i0) 其傅里叶变换是: (a0)根据上面关于窗函数的公式,可以计算出:可见,G=,这个方程的解释是达到了不确定性原理所给出的下限。对于公式(4-7)中窗函数r(t),如果r(t)的中心是,半径为r,则该公式给出了函数在时间窗r,r中的信息。 为了推导频域里对应的窗函数,我们可以利用Parsevals等式: (4-15) 则,可以将公式(4-7)表示为: (4-16)其中,F-1表示傅里叶变换;式中的 与公式(4-7)类似。假设频率窗函数的中心是,半径为R。那么,由该公式给出了函数在间隔中的信息。由上面的推导过程可知,Gabor变换给出了函数在时间频率窗中信息。下图4-2当时,Gabor变换的时间频率窗的示意图。由此可知,Gabor变换可以写成: (4-17)其中,。图4-2 ,Gabor变换的时间-频率窗如图Gabor变换比较稠密,换为离散型。离散Gabor变换可表示为: (4-18)式中,表示内积。 (4-19)根据限制条件: (4-20)可以恢复函数。 (4-21)函数是由高斯函数调制的正弦波,实际中,对图像的Gabor变换是在一定大小的尺度和一定朝向的角度上进行计算的。考虑到Gabor变换的对称性,角度的范围通常为。例如,可以选择角度分别是0o,30o,60o,90o,120o和150o。对比可知,尺度越大,分辨率越高。多种角度能更好的发挥Gabor滤波器组的功效 4.2 基于Gabor变换的特征提取 在介绍Gabor变化之前,要引入一个多尺度的概念,所谓多尺度技术,就是说用多种不同的角度、大小去表达一个图像,而且还需要在这些不同的尺度下表达出来。在通常情况下,有时候图像从不同的角度看会有不同的效果反应出来,这就需要我们能从多角度,多方向去看待这些问题和事情。所以,所以引入一个尺度概念非常的重要 7。作为物体表面所固有的一种特性,纹理,在图像中,也是一个非常有价值的属性。因为图像信息中包含了不同尺度的特性和结果,所以对它可以用多尺度变换U(b,a)进行分析,这样也有助于更好的分析出结果。其中,多尺度变换中有两个参数,分别是b和a,参数b是与的时间变量t有关的;参数a是与图像的尺度有关的。一般把尺度参数a看作与信号频率的倒数相关,即,。根据b和a,这两个参数,可以将多尺度变换分成时间尺度变换和时间频率变换两类。用多尺度变换U(b,a)来分析信号,可看作是将一维信号用二维变换所展开,这样就可以将在不同尺度的结构信息变成显式信息。信号的傅里叶变换是 (4-22)用多尺度来说,可以将短时傅里叶变换表示为: (4-23)其中,为窗函数。假设窗函数是高斯函数,就得到了Gabor变换。Gabor变换是多尺度变换技术中的时间频率变换技术之中的。Gabor变换将信号在时间和频率上都规则地进行采样,时间上的间隔是T,而频率上的间隔是,两者的关系为: (4-24)对于Gabor变换,可以从下面两个角度进行分析。假设,窗函数是以时间的原点即(t=0)为中心的,对于每一个b,窗口都移到b处,这样,信号与相乘表示仅将通过窗可看到的那部分选出来。如果计算的傅里叶变换,那么,只有上述选出来的部分才会变换。这就是说,Gabor变换在时间域具有局部化的特性,即定时特性。另一方面,如果将Gabor变换用信号的傅里叶变换和高斯窗的傅里叶变换的平移来表示,由与的乘积,即表示围绕频率选择了一个窗口,所以,Gabor变换在频率域也具有局部化的特性。图4-3给出的是Gabor变换所对应的时频网格。如图实线的含义是时间,虚线是频率。从该图可知,Gabor变换在时间上和频率上都具有局部化的特点,只是其局部化网格的尺寸是不随时间或频率变化的。图4-3 Gabor变换的时频网格利用一组二维的Gabor滤波器,可以把图像分成一系列的频率带。复二维的Gabor滤波器的脉冲响应是高斯低通滤波器与一个复指数的乘积,即: (4-25)其中, ,.式中,是由高斯低通滤波器进行缩放和旋转得到的;参数是空间缩放系数,它控制了滤波器脉冲响应的宽度;参数确定了滤波器的长宽比,从而确定了滤波器的朝向。朝向角的计算公式是: (4-26) 假设令参数,可见,通过改变参数、和的值。可以获得各种朝向和带宽的滤波器。基于Gabor变换可以构建Gabor滤波器。对每一个固定的频率,可定义核为: (4-27)其中,。这样,就可将Gabor变换看作是信号f(t)和围绕频率的核的卷积,即 (4-28)其中,方括号外的是一个高斯函数; 方括号内,是是Gabor的变换函数,是一个附加的直流项,用来减少光照的影响。参数定义了滤波器带宽,可取;参数是小波的波矢量(为其模),不同的取值构成了族中不同的具有相近能量的波函数。的定义为: (4-29)其中,表示波的不同方向;沿X轴方向的,大小为,表示波的不同核频率。我们计算时候一般都是取值眼睛区域的内眼角、外眼角以及内外眼角的中心点三个点处的Gabor特征值组成特征向量。对于每一个点,取、1、2,、,计算其多尺度、多方向的Gabor滤波器,就可以得到18个Gabor特征值。这样,三个点共有54个Gabor特征值。还有,驾驶员每次闭眼的时间和没眨眼10次的平均值,也是一个非常重要的数值参数。这两个特征参数都与视频中每帧图像的眼睛坐标有关,为此需要设置一个大小固定的缓冲区,用来存放每一帧图像中的眼睛坐标。该缓冲区的数据每隔一段时间间隔就根据“先进先出(FIFO)”的原则进行更新。眼睛闭合长度,是指在这段时间里面没有侧到眼睛的时间长度。我们可以用帧来计算,假如在某一时刻没有检查出眼睛,就设他为初始值0,下一帧还没有侧到就定义为1,一次类推,直到从新测到眼睛后,当前那帧就又为0 9。前10次眨眼的平均时间也是用帧数来计算。设计一个的FIFO的缓冲矩阵,用于存放每次眨眼的开始帧和结束帧并进行计算。刚开始为零状态,该矩阵为空。当发生眨眼时,则将每次眨眼的开始帧和结束帧数据写入矩阵,并由此计算出前10次眨眼的平均时间。这样,由54个Gabor特征值、眼睛闭合时间和前10次眨眼的平均时间,共56个特征参数组成图像处理模块输出的特征向量,输入到系统下一个功能模块SVM分类器进行分类处理。4.3图像处理模块的设计图4-6给出了图像处理模块的整体结构图。由图可知,图像处理模块由眼睛定位单元、眼睛跟踪单元和特征提取单元三部分组成。刚开始,系统是定位单元。然后检查出了眼睛后,马上就进入跟踪单元,如果没有检测到眼睛连续N帧,就自动返回眼睛定位。如此反复。同时,特征提取单元根据用眼睛定位单元和眼睛跟踪单元检测出的眼睛坐标等信息,计算出每帧图像的56个特征值 10。每一个循环更替,图像处理模块都将输入视频变换为一个含有56个特征值的向量,作为图像处理模块的输出,送到下一个功能模块即SVM分类器进行进一步的处理。图4-4图像模块的整体结构图4.4本章小结本章是非常重要的一个章节,它的作用也可以为第五章将要将的SVM做铺垫。首先是讲了Gabor变换,其中又引进了窗函数、短时傅里叶变换,这都是Gabor变换所要涉及的部分。然后重点的讲了基于Gabor变换的特征提取,然后引入了一个尺度的概念,然后还描述了54个Gabor特征值、眼睛闭合时间和前10次眨眼的平均时间,共56个特征参数组成图像处理模块输出的特征向量,输入到系统下一个功能模块SVM分类器进行分类处理。这也为下章埋下了伏笔。最后还了解了图像处理模块的设计,图像处理模块由眼睛定位单元、眼睛跟踪单元和特征提取单元三部分组成。第5章 SVM分类器SVM分类器是本系统设计的一个重要内容,它的主要任务是根据图像处理模块输出的与疲劳驾驶相关的眼睛特征参数,判断驾驶员是否处于疲劳状态。下面本章将对SVM进行非常全面的叙述。5.1 SVM分类器的理论基础SVM的全称是支持向量机Support Vector Machines,这是在统计学习理论基础上的。统计学习理论SLT是一种处理小样本的统计理论,主要是研究在有限样本情况下的统计模式识别和机器学习问题11。在现代的统计学习方法中,我们经常要接触一个结构风险最小化原则。下面,我就简单的叙述下:所谓结构风险最小化原则(Structural Risk Minization,简称SRM)就是结合了训练误差和泛化误差,是上世纪90年代,由美国AT&T贝尔实验室的V.Vapnik等人首先提出的。这还是一种比较新的思想。支持向量机正是基于结构风险最小化原则的一种新的统计学习方法 12。为了保证学习机的泛化能力,Vapnik等人提出了结构风险最小化准则13。用公式说明就是定义损失为,在二元情况下,损失为0或1。任取,则可以以1-的概率保证: (5-1)其中,h为整数,称VC维(Vapnik-Chervomeiks);为VC置信度;为风险边界由上可知,使用结构风险最小化原则,能使之达到更好的总体效果和性能。5.2 SVM分类器的基本原理5.2.1支持向量机由上我们对SVM已经有了一定的了解,在这里具体展开来说下。SVM是支持向量机的简称,他是建立在统计学习理论基础上面的一种分类器。由上面我们也知道了,向量机是遵行了结构风险最小化的原则,从而减小分类函数在实际输出和理想输出上面的差距。下面我就对SVM分类器的两个特点进行简单的介绍。首先,SVM是基于结构风险最小化理论。通过在特征空间中构造最优分类面,使学习器得到全局最优。特点二:理论上SVM是只针对线性可分情况进行分析的。但是这又不完全是。因为对于线性不可分情况,它也可以通过用非线性映射算法,然后将低维输入空间线性不可分的样本转化到高维特征空间,达到使其线性可分的目的,然后进行分析。由上可知,SVM不仅结构简单,而且有非常好的泛化能力和全局最优化。非常合适在本系统中对驾驶员的状态进行分析和判定。SVM分类器的工作原理如图5-1所示。图5-1 SVM分类器的工作原理由图可知,我们先要提取测试样本中的特征,然后再构造一个最优的分类面,这样就能很好的计算和判别结果是否是一样,从而得到结果。5.2.2最优分类面下面,我对最优分类面进行简单的介绍。用一个二维两类线性可分情况为例,介绍最优分类线的概念14。如图,下图分别用实心和空心来表示了两类样本。假这里要引入一个分类间距的概念。如图,H是分开第一类和第二类样本的中间线。而H1和H2则分别是这两个样本的界限,H1和H2之间的间距就是分类间距。最优分类线就是将这两类数据没有错误地分开且使分类间距最大的分类线。然后将他推广到多维。则是最优分类面。图5-2最优分类线的示意图由上可见,构成最优分类面的条件有两个。第一,就是将数据很好的分开,即要保证经验风险

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论