基于普通输入设备的生物特征识别系统的设计与实现_第1页
基于普通输入设备的生物特征识别系统的设计与实现_第2页
基于普通输入设备的生物特征识别系统的设计与实现_第3页
基于普通输入设备的生物特征识别系统的设计与实现_第4页
基于普通输入设备的生物特征识别系统的设计与实现_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

编号审定成绩毕业设计(论文)设计(论文)题目基于普通输入设备的生物特征识别系统的设计与实现学院名称计算机科学与技术学生姓名专业计算机科学与技术班级学号指导教师答辩组负责人填表时间2015年6月教务处制摘要当今信息化社会,计算机技术、传感器技术、电子信息技术等均在飞速发展,利用人体本身固有的生理特征或行为特征进行身份识别已经取得越来越多人的认可,最终已形成了一种新身份验证方式,即生物特征识别。与根据持有信物而完成的识别相比,生物特征识别具有其与生俱来的唯一性和安全性。生物特征识别技术包括固有生理特征识别和行为特征识别。目前,关于生物特征识别技术的大多数研究主要针对人的固有生理特征(如指纹,掌纹,人脸识别,虹膜识别等)进行的,而针对后天形成的行为特征识别的研究较少。本文主要介绍了一个针对用户后天行为特征(输入特征)而设计的生物识别系统。本文主要介绍了如何利用普通输入设备开发生物特征识别系统。系统实现过程中,主要参考K均值聚类算法,使用C语言及WINFORM窗体编程,同时以MICROSOFTSQLSERVERMANAGEMENTSTUDIO2008作为数据存储解决方案,实现对生物特征的录入,存储,计算,删除,识别等功能,满足了用户的需求,达到了任务书的要求。本文分为五章第一章主要介绍了生物特征识别技术的概念、发展历史和现状、研究目的和意义以及本论文要做的主要工作;第二章主要介绍了和生物特征识别系统开发相关的一些背景知识;第三章主要介绍了需求分析及系统设计;第四章主要为各模块功能实现、运行效果图及系统测试;第五章为总结与展望,总结了系统的实现过程,系统的不足,同时对该系统在未来的应用进行展望。【关键词】生物特征识别输入特征模式识别K均值算法ABSTRACTWITHTHEDEVELOPMENTOFCOMPUTERTECHNOLOGY,SENSORTECHNOLOGY,ELECTRONICINFORMATIONTECHNOLOGY,USINGTHEINTRINSICBODYPHYSIOLOGICALORBEHAVIORALCHARACTERISTICSOFHUMANFORIDENTITIESHAVEGOTTENMOREANDMOREPEOPLESRECOGNITION,ITHASFORMEDANEWAUTHENTICATIONMETHODS,NAMELYBIOMETRICSRECOGNITIONCOMPAREDWITHTHEWAYCOMPLETEIDENTIFICATIONWITHTHEPLEDGE,BIOMETRICSHASITSINHERENTUNIQUENESSANDSECURITYBIOMETRICIDENTIFICATIONTECHNOLOGYINCLUDESTHERECOGNITIONOFINHERENTPHYSICALCHARACTERISTICSANDBEHAVIORCHARACTERISTICSATPRESENT,MOSTSTUDIESOFBIOMETRICIDENTIFICATIONTECHNOLOGYISAIMEDATPEOPLESINHERENTPHYSICALCHARACTERISTICSSUCHASFINGERPRINT,PALMPRINT,FACERECOGNITION,IRISRECOGNITION,ETC,HOWEVERTHESTUDYOFACQUIREDBEHAVIORCHARACTERISTICRECOGNITIONISLESSTHISTHESISMAINLYINTRODUCEDABIOMETRICSYSTEMWHICHISAIMEDATACQUIREDBEHAVIORCHARACTERISTICFEATURESINPUTFEATURESTHISTHESISINTRODUCEDTHEPROGRESSOFDEVELOPINGABIOMETRICSYSTEMWHICHISBASEDONTHECOMMONINPUTDEVICESDURINGTHESYSTEMIMPLEMENTATIONPROCESS,THETHESISREFERREDTOKMEANSALGORITHMANDUSEDCANDWINFORMMEANWHILE,SQLSERVER2008WASUSEDASTHESOLUTIONOFDATASTORAGETHESYSTEMCOMPLETEDFUNCTIONSSUCHASTHEINPUTOFBIOMETRICFEATURES,STORAGE,CALCULATION,DELETIONANDRECOGNITION,WHICHWASMEETTHENEEDSOFUSERSANDACHIEVEDTHEREQUIREMENTSOFTHEMISSIONSTATEMENTTHETHESISWASDIVIDEDINTOFIVECHAPTERSTHEFIRSTCHAPTERINTRODUCEDTHECONCEPT,HISTORYANDCURRENTSITUATION,THEPURPOSEANDSIGNIFICANCEOFBIOMETRICIDENTIFICATIONTECHNOLOGYTHESECONDCHAPTERMAINLYINTRODUCEDTHEKNOWLEDGEOFBIOMETRICIDENTIFICATIONSYSTEMDEVELOPMENTTHETHIRDCHAPTERINTRODUCESTHEREQUIREMENTSANALYSISANDSYSTEMDESIGNTHEFOURTHCHAPTERDESCRIBESHOWTOCOMPLETETHEFUNCTIONSOFEACHMODULE,OPERATIONRENDERINGSANDSYSTEMTESTINGTHEFIFTHCHAPTERSUMMARIZEDTHEIMPLEMENTATIONOFTHESYSTEM,THELACKOFSYSTEM,MEANWHILETHISCHAPTERPROSPECTEDTHEFUTUREOFBIOMETRICS【KEYWORDS】BIOMETRICRECOGNITIONINPUTFEATURESPATTERNRECOGNITIONKMEANSALGORITHM目录第一章前言1第一节生物特征识别技术概述1一、生物特征识别技术简介1二、生物特征识别技术的发展历史和现状1第二节生物特征识别系统的研究目的和意义2第三节本论文主要研究工作4第二章生物特征识别系统开发相关技术5第一节技术知识背景介绍5一、生物特征识别技术5二、WINFORM简介7三、MICROSOFTSQLSERVER2008简介8四、模式识别及KMEANS算法简介8第三章系统的需求分析及设计11第一节系统的需求分析11一、系统功能的需求分析11二、系统功能的运行需求13第二节系统数据库的分析与设计13一、系统数据库分析13二、系统数据库设计13第三节系统功能模块设计14一、特征采集模块功能设计14二、数据归一化处理模块功能设计15三、特征计算模块功能设计16四、特征匹配模块功能设计16第四章系统实现18第一节开发环境配置及工具使用18一、开发环境配置18二、开发工具19三、调试工具19第二节各模块功能的实现19一、特征采集模块功能的实现20二、数据归一化处理模块的实现22三、特征计算模块的实现23四、特征匹配模块的实现27第三节系统测试30一、阀值选定测试30二、根据按键间隔进行生物识别方法测试30三、特征计算算法测试31第五章总结与展望33第一节总结33第二节展望33致谢35参考文献36附录37一、英文原文37二、英文翻译42第1章前言第1节生物特征识别技术概述一、生物特征识别技术简介生物特征识别技术(BIOMETRICRECOGNITION)是通过计算机与声学、光学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性(如指纹、脸象、虹膜等)和行为特征(如笔迹、声音、步态、输入习惯等)来进行个人身份鉴定的技术1。二、生物特征识别技术的发展历史和现状生物识别技术起步于九十年代初期,生物识别的发展历史可以粗略地划分为三个阶段2。第一阶段是从1990年到1997年。在此阶段,整个市场仅有欧美澳等国不超过十家的供应商。国内厂商只是充当了分销商和系统集成商的角色,主要从事对国外产品进行增值分销的工作。第二阶段是从1998年到2002年。在此阶段,通过对国外技术和产品的学习借鉴,中国厂商开始在产品研发上取得一个又一个突破,逐渐攻克了核心软件、硬件处理平台、采集器件以及应用系统设计等难关,最终开始有少量由国内设计和制造的产品出现,同时与国外产品的竞争在这一阶段开始。第三阶段是从2003年至今。在此阶段,中国生物识别技术和产品在商业应用领域占据越来越多的市场份额,直至目前完全占据主导地位,控制了市场。与此同时,国外厂商开始转向复杂大系统、多技术融合等中高端产品及应用的研发工作。生物特征识别技术早年运用于法庭科学的司法鉴定,多是对静态图像如指纹图像、脸形图像等的事后采集和识别上世纪九十年代末和本世纪初,特别是911恐怖事件之后,由于国际反恐斗争的需要,对静态、动态图像的事前事后采集和实时鉴别己成为防范安全风险的主要技术手段3。美国一直走在生物识别技术研究工作的前列。二十世纪九十年代,,美国已经开始启动生物特征识别技术应用的标准化工作,主要针对指纹识别应用在法律实施中的标准制定。1993年美国国家标准与技术研究所的计算机系统实验室制定了国家标准ANSI/NISTCSL11993信息系统和指纹信息交换数据格式和刑事审判信息服务标准WSQ灰度图像的压缩标准。1995年,美国将伤疤、记号和纹身SMT信息加入到原有数据中,并将正面头像、脸形和纹身数据的一个逻辑化记录结构加入到ANSI/NISTCSL11993标准中。1997年,国家标准化与技术研究所信息技术实验室修订了1993年的标准,颁布了ANSI/NISTITLLA1997国家标准信息系统和指纹、脸形、纹身信息交换数据格式。1998年,美国召开了另一个指纹数据交换会议,进一步修正、整理并更新了ANSI/NISTCSL11993和ANSI/NISTITLLA1997标准,美国国家标准化与技术研究所将这个文件发布为NSIT特别资料SP5002453。该文件规定了用于不同的管辖范围和相异的系统之间有效地交换指纹、脸形、伤疤、标记和纹身身份识别数据的一个通用格式3。二十世纪末和本世纪初,商业领域开始应用越来越多新的生物识别技术,包括实时指纹鉴别和身份验证、脸形识别、语音识别、视网膜和虹膜扫描、手形特征、击键特征分析等。生物特征识别技术在商业领域的应用,不仅促进和扩展了生物特征识别技术的应用领域,而且大大提升了安全防范技术的技术层次,使得生物特征识别技术成为安全防范技术的三大主导技术之一。我国于上世纪90年代初,指纹信息识别产品和系统开始应用于公安业务和安全防范领域。据不完全统计,目前生产生物特征识别产品主要是指纹、人脸识别的企业近百家,社会公共安全行业制定的相关标准约30余项。但这些标准都是以公安业务的刑事侦察、证照管理或安全防范的视频监控系统、出入口控制系统等具有应用环境为基础而制定的,未能从人体生物特征识别技术的高度建立相应的标准体系3。第二节生物特征识别系统的研究目的和意义长期以来,识别身份的方法是验证该人是否持有有效的信物,如密码、照片、磁卡、钥匙和身份证等。从本质上看,验证的是该人持有的某种“物”,而不是验证该人本身。所以只要“物”的有效性得到确认,则持有该“物”的人的身份也就随之得到确认4。这种“物”验证的办法存在的漏洞是非常明显的“物”的丢失会导致合法的人无法被认证,各种信物容易被伪造、破译。在网络环境下,密码作为身份识别的标志已被广泛采用。但由于密码容易被遗忘,也有被人窃取的可能,已无法满足当前信息化社会下人们对身份识别的需要。随着社会的发展,传统身份验证方式安全性越来越弱,已无法满足当今社会人们的需求。但是我们在日常生活中随时都需要进行个人身份验证和权限的认定,特别是在信息化社会的今天,人们对安全性的要求越来越高,同时也希望获得简单快速的识别方式。为了解决这一问题,人们把目光投向生物特征识别技术,希望能借助人体固有的生理特征或行为动作来进行身份识别。这样就可以不必携带大串钥匙,也不用费心去记各种密码,并且也不用去担心会忘记密码。另外,生物特征具有唯一性,不可复制性,例如指纹,有学者推论以全球60亿人口计算,300年内都不会有两个相同的指纹出现。以电子商务、电子银行的安全认证为例,在电子商务中会有假冒他人身份的事件发生,如果能够通过生物特征进行论证,就能够有效防止此类事件的发生。另外,网络、数据库和关键文件等的安全控制,机密计算机的登陆认证,银行ATM、POS终端等的安全认证,蜂窝电话,PDA的使用认证等等,都离不开可靠安全的身份识别认证。可见,研究生物特征识别不但有可观的经济效益,还有不可估量的国家信息安全效益。生物特征识别技术是为了进行身份验证而采用自动化技术测量其身体特征或个人行为特点,并将这些特征或特点与数据库的模板数据进行比较,完成认证的一种解决方案,被评为21世纪十大高科技之一5。生物特征识别是目前最为方便和安全的识别技术,并且生物特征识别产品均借助于计算机技术实现,容易与安全、监控、管理系统整合,实现自动化管理。用来鉴别身份的生物特征应该具有惟一性、广泛性、容易采集等特点,实际应用给基于生物特征的身份鉴别系统提出了更多的要求6,包括性能的要求所选择的生物统计特征能够达到多高的识别率,对于资源的要求如何,识别的效率如何等。可接受性使用者在多大程度上愿意接受基于所选择的生物统计特征的系统。安全性系统是否能够防止被攻击。可行性是否具有相关的、可信的研究背景作为技术支持。存储量提取的特征信息是否占用较小的存储空间。价格是否达到用户所能接受的价格。速度和准确率是否具有较高的注册、识别速度和识别率。是否具有非侵犯性。目前,主要的生物特征识别技术有虹膜识别、视网膜识别、人脸识别、签名、识别、声音识别、指纹识别等等。然而,还没有任何一种单独的生物特征可以满足上述全部要求。生物识别技术的应用主要有以下几方面7门禁,重要区域的门禁管制军事基地、枪械库、核能设施、物料放置库房、电脑机房、政府办公室、保密资料室等住宅安全,包括社区人员进出及访客出入记录。职员或会员管理内部授权管制、考勤、薪资计算、俱乐部会员确认。银行证券类身份确认如柜台提款、自动提款机、保险箱、金库、大额取款客户身份确认、公司提现确认、交易终端客户身份确认、远程交易身份确认、保险受益人等各种社会福利受益人身份确认等。个人财产使用管制如移动电话、个人电脑、笔记本电脑、汽车等。证照类包括身份证、暂住证、驾驶证等。社保类社会保险系统、养老金发放系统。医疗档案管理血液管理、公费医疗确认、个人医疗档案管理。计算机系统及信息安全包括网络安全、网上银行及电子商务、电子政务的安全等。第三节本论文主要研究工作在本文中,将使用WINFORM所提供的相关控件及NETFRAMEWORK,结合WINFORM的相关开发指南以及C编程语言实现系统,使用MICROSOFTSQLSERVER2008实现数据存储,主要有以下目的设计并开发基于普通输入设备的生物特征识别程序实现生物特征识别、生物特征添加并存储和识别的功能;分析研究模式识别相关内容,利用模式识别相关算法实现机器学习和生物特征提取功能。本论文将着重讨论基于普通输入设备的生物特征识别系统程序的设计与实现,同时分析研究模式识别的相关技术要点,主要工作如下详细分析基于普通输入设备的生物特征识别系统程序内容,作需求分析,提出具体需求;分析相关流程,做出详细设计,确定扩展程序的总体框架;学习相关开发指南,结合WINFORM编程相关控件以及C语言特点,设计生物特征提取的算法,编写代码,测试功能,最终达到前期的设计目标。第二章生物特征识别系统开发相关技术第1节技术知识背景介绍一、生物特征识别技术生物特征识别实际上是一项整合了众多学科和应用技术的综合性技术,该技术既具有很强的理论性又具有很强的工程性,其本身就是一个多学科交叉融合的典范。所涉及的基础学科包括数学、化学、物理学、生物学等;所涉及的应用学科包括信号处理、图像处理、模式识别、人工智能、传感器技术、嵌入式技术、信息安全、信息融合等。如图21所示,典型的生物特征识别过程通常包括以下步骤8信号获取生物识别系统的信号(一维波形或二维图像等)是由一个采集设备来获取的。所获取的原始信号的质量非常重要,它是后继处理的输入数据。本文在实现基于普通输入设备的生物特征识别系统的过程中,主要基于人的输入习惯,在信号获取阶段,通过程序设计,实现对目标输入相邻按键之间的时间间隔的捕捉,完成信号获取。预处理在这个阶段,对信号/图像进行优化,包括分割、去噪、消除旋转和平移等操作。本文在实现系统的过程中,主要同过对得到的信号进行归一化处理来完成预处理步骤。具体思想是将得到的一组时间间隔作为一个多维向量,通过归一化处理,使向量的模值为1。特征提取提取稳定的、区分能力强的特征,即要求所提取的这些特征能使类内距离小,类间距离大。本文通过迭代计算数据中心点,比较相邻中心点间欧式距离完成特征提取。特征匹配将待识别的特征与模板库中的模板进行匹配,从而得到识别结果。本文通过待识别向量与已提取到的数据进行对比,即可完成识别。信息获取特征提取预处理特征匹配图21生物特征识别系统的组合模块注册(ENROLLMENT)、身份验证(VERIFICATION)和身份辨识(IDENTIFICATION)是一个生物特征识别系统的三种基本操作模式。但对于身份验证和身份辨识两种模式,很多系统仅仅包括其中之一8。注册模式指在进行验证或辨识前,用户的身份需要先注册到生物识别系统中。首先系统接受用户提供的人体生物信号及其个人的标识(如姓名、ID号等);然后对所获取的人体生物信号进行预处理和特征提取;最后将提取的特征作为模板连同用户的个人标识存储到模板库或卡中。身份验证这种模式需要用户先声明自己的身份,然后根据用户的生物特征来完成匹配,即“一对一”匹配(11匹配)。首先系统接收用户所提供的生物信号及个人的标识;然后对所获取的用户生物信号进行预处理和特征提取;最后根据用户提供的个人标识,从数据库库中提出相应的生物特征,并将其与捕捉到的生物特征进行匹配,进而判断匹配是否成功。身份辨识是在事先完全不清楚用户身份的条件下,根据用户的生物特征来识别该用户的身份,也被称为“一对多”匹配(1N匹配)。首先系统接受用户提供的生物特征信号;然后对所获取的用户生物信号进行预处理和特征提取,并将提取的特征与系统数据库中所有或者部分模板进行匹配;最后根据匹配结果得到最为相近的模板,则该模板对应的ID就是这个用户的身份。无论是“一对一”还是“一对多”匹配,衡量匹配成功率的标准都是很关键的。在生物特征识别技术中这一标准称为识别率,而识别率主要又由两种错误率来描述拒真率(FALSEREJECTRATE,FRR)和认假率(FALSEACCEPTRATE,FAR)。在进行生物特征识别时,输入的生物特征要与已注册的生物特征进行不精确匹配。当匹配度大于某个阈值时,则该用户就被当作是合法用户而被接受;当匹配度小于某个阈值时,则该用户就被当作是假冒者而被拒绝。拒真率是指系统将合法用户当成假冒者而拒绝的概率;认假率是指将假冒者当成合法用户而接受的概率。这两种错误率可用下面的公式来计算810NIAFR10NAFR式中,NAA和NIA分别是合法用户和假冒者分别尝试的总次数;NFR和NFA分别是错误拒绝(FALSEREJECTION)和错误接受(FALSEACCEPTANCE)的次数。当FARFRR时,FAR(FRR)称为等误率(EQUALERRORRATE,EER)。拒真率和认假率这两个错误率反映了一个生物特征识别系统两个不同方面的特性FAR越低,假冒者被接受的可能性越低,从而系统的安全性越高;FRR越低,合法用户被拒绝的可能性越低,从而使得系统的易用性越好。对于任何一个生物特征识别系统来说,FAR和FRR越小越好。但是,这两个错误率是矛盾的,二者不能同时降低,其中任何一项的降低,必将引起另一项的升高。所以,应该根据不同的应用来折中调节FAR和FRR对于安全性要求较高的系统,如某些军事系统中,安全最重要,因此应该降低FAR;在对安全性要求不是很高的系统,如很多民用系统中,易用性很重要,这时应该相对降低FRR。二、WINFORM简介WINFORM是NET开发平台中对WINDOWSFORM的一种称谓,以NETFRAMEWORK为基础。为了符合本系统的开发要求,系统采用是微软研发的软件开发平台,采用WINFORM技术进行系统编程工作,这项技术在实用性、适用性以及功能性上表现出了卓越的优势,主要的表现以下几个方面控件灵活WINDOWS窗体提供了一套丰富的控件,并且开发人员可以定义自己有特色的新的控件。WINFORM控件是指以输入或操作数据的对象。比如COMPONENTONE是NET平台下对数据和方法的封装。有自己的属性和方法。属性是控件数据的简单访问者。方法则是控件的一些简单而可见的功能。包含在NETFRAMEWORK中的WINDOWS窗体类旨在用于GUI开发。您可以轻松创建具有适应多变的商业需求所需的灵活性的命令窗口、按钮、菜单、工具栏和其他屏幕元素。数据管理WINFORM提供方便的数据显示和操作应用程序开发中最常见的情形之一是在窗体上显示数据9。WINDOWS窗体对数据库处理提供全面支持。可以访问数据库中的数据,并在窗体上显示和操作数据。向导明确向用户提供创建窗体、数据处理、打包和部署等的分布指导。简单易学WINFORM学习简单,大多数软件开发人员认为C语言比其他的编码语言更简单,尤其是一些特别简单易懂的表单和任务,非常容易上传到客户端,这将使网络布线和站点配置提供了一个方便易用的界面接口。三、MICROSOFTSQLSERVER2008简介SQLSERVER2008数据库技术是由微软公司开发而成,该数据库具有较高的数据处理能力和数据安全性,该版本的数据库增加了快捷的功能设计和个性化的特征,是一款功能全面的数据库,它有以下优点10保障数据安全保障数据安全属于SQLSERVER2008最关键的一个性能指标,需要通过对系统数据流通、日志管理流通以及文件加密等保证数据的安全,系统管理员使用SQLSERVER2008时,能够使用多种途径来访问原有加密的文档数据,而系统其他未授权的用户不能访问加密数据,从而避免数据被无意中泄漏出去。加强了数据的安全特性11。采用密码和密钥统一管理系统中都会涉及到不同的用户,根据用户的性质和操作业务权限不同,需要在数据加密管理的一栏中增加不同等级的数据管理,以免用户的繁杂导致数据信息的不安全,因此数据库技术增加了用户的第三方密钥管理,提高了用户对自身工作内容的数据进行妥善保护,为高校的数据安全性提供了多种有效的方法。增强了数据库镜像功能SQLSERVER2008版本在原有版本的基础上取得更大的进步,同时改善了原有的镜像功能,从而可以实现页面数据的自动修复,当用户发送修复请求,数据库接收镜像的出错报告,对需要修复的数据进行快速和完整的拷贝,然后将修复的结果数据反馈到错误页面中,用户可以重新获取需要修复的数据。数据备份和压缩在数据处理过程中,备份过程中,这样不仅占用大量的磁盘空间,而且占用大量处理时间,为了解决这一问题,数据库提供一个新功能,实现对数据的备份压缩,减少数据占据的空间,以及提高数据备份过程中的时间和效率。4、模式识别及KMEANS算法简介模式识别(PATTERNRECOGNITION),就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为模式。伴随科学技术的发展,人类需要研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。模式识别是指对表征事物或现象的各种形式的数值的、文字的和逻辑关系的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分12。K均值算法是LLOYD于1957年首次提出的,在文献13中,LLOYD首次将K均值算法应用到PCM系统中对信号进行了聚类,并提出了噪声信号对聚类结果的影响。MACQUEEN于1967年给出了经典的K均值算法,在文献14中,MACQUEEN给出了K均值算法完整的理论,证明了该算法的收敛性,并介绍了K均值算法的一些应用。KMEANS算法是一种硬聚类的算法,是典型的基于目标函数聚类的代表方法,以数据到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则15。KMEANS算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。在文献16中,对经典KMEANS算法进行了介绍。算法的基本思想为在N个数据对象中随机选择K个中心,集合中其他数据对象被划分到与中心最近的数据集合中去,形成了A个初始的数据集合。对于每个数据集合,计算新的中心,然后根据新的中心重新分配其他数据集合,这样不断迭代,直到所有的数据中心不再变化。该算法的具体步骤如下随机选择K个初始聚类中心CC1,C2CK如果S与聚类中心CI,之间的距离小于该对象到CJ,2,1SSJIJI的距离,则将S划分到聚类族中。,重新计算聚类族CI的中心。KI,ICSI重复步骤和步骤,直至聚类中心C不在变化。经典K均值算法的流程图如图22所示。输入参数K,N开始随机选择K个初始簇中心计算数据到各个簇中心的距离选择离散数据最近的类中心,将数据费给该类更新聚类簇中心结束聚类中心是否变化否是图22经典K均值算法的流程图本系统所使用的输入特征提取算法是基于KMEANS算法的一种改进,KMEANS算法是将数据点进行聚类,得到多个聚类的中心。而本系统所使用的算法采用KMEANS算法的思想,将同一个人输入的输入特征当做一个类,通过迭代计算出该用户的特征。第三章系统的需求分析及设计第一节系统的需求分析一、系统功能的需求分析本文所开发的生物特征识别系统是基于普通输入设备(即键盘)采集到的用户输入特征(键入相同按键不同按键间时间间隔)实现的生物特征识别。为满足系统的生物特征识别功能,系统的总体流程图如图31所示采集模块(键盘)按键时间间隔采集归一化处理按键时间间隔采集生物特征存储生物特征计算归一化处理报告结果数据比对图31系统总体流程图通过对系统功能分析,用户可使用系统录入自己的生物特征、保存生物特征、删除生物特征、与数据库中特征进行匹配。根据分析画出系统用例图如图32所示。录入特征用户存储特征匹配特征删除特征图32系统用例图根据系统需求及功能分析,在系统实现过程中,可将生物特征识别系统的功能分为特征采集、数据归一化处理、特征计算和特征计算四个模块来实现。各模块具体功能如下1特征采集模块特征采集模块主要负责对用户输入特征(即按键时间间隔)的采集。应具有以下功能识别用户输入按键;存储用户个人标识(即姓名);提取用户相邻按键的时间间隔,并存储,以便于下一步进行特征计算或特征匹配;对存储情况,时间间隔提取情况有一定的回馈,在完成存储或一次特征提取后提醒用户程序进度。2数据归一化处理模块数据归一化处理模块应具有如下功能每次生物特征信息采集模块完成数据采集后,将得到的数据进行归一化处理并存储;3特征计算模块特征计算模块负责将已得到数据通过迭代计算提取出用户输入特征。应具有如下功能系统可自动确定用户需要输入次数;系统可识别波动较大的数据,即在多次输入后,一直无法取得要求的特征,系统提示输入特征波动较大,无法完成特征提取;通过已得到数据可计算中心点,并与上次中心点进行对比,欧氏距离满足要求则保存,否则继续迭代计算。完成后反馈信息,特征提取成功或提取失败。4特征匹配模块特征匹配模块负责将待匹配用户特征与数据库中存储特征对比,从而得出接受或拒绝的结论。具体功能如下能将待匹配数据与数据库中进行匹配,得出结论接受或拒绝;若接受,能实现对用户身份的确认,输出用户姓名;二、系统功能的运行需求生物特征识别系统的开发环境WINDOWS764位操作系统开发工具MICROSOFTVISUALSTUDIO2010旗舰版运行环境WINXP/WIN2003/VISTA/WIN7/WIN8第二节系统数据库的分析与设计一、系统数据库分析根据系统的功能需求分析,本论文提出了以下数据结构用户姓名用于存储用户姓名,进行识别和存储特征时使用;生物特征数据主要用于存储经计算后的用户生物特征,即输入特征,在设计上需用户输入BIYESHEJI字符,设计BI、IY、YE、ES、SH、HE、EJ、JI分别存储相邻按键时间间隔数据;二、系统数据库设计由于本系统为一个生物特征识别系统,所以需要完成对生物特征的存储,删除等功能。设计数据库存储用户的生物特征信息,具体如表31所示表31系统数据库设计表字段类型说明NAMEVARCHAR50用户姓名BIFLOATBI间时间间隔特征IYFLOATIY间时间间隔特征YEFLOATYE间时间间隔特征ESFLOATES间时间间隔特征SHFLOATSH间时间间隔特征HEFLOATHE间时间间隔特征EJFLOATEJ间时间间隔特征JIFLOATJI间时间间隔特征数据库ER图如图33所示HEWORDJIBINAMESHYEIYEJES图33系统数据库ER图第3节系统功能模块设计在系统的实际开发过程中,系统具体分为以下四个模块来实现,具体模块设计如下一、特征采集模块功能设计特征采集模块是采集生物信息的主体部分,该模块主要功能是采集生物特征信息(即按键时间间隔),在本系统中,该模块负责对用户输入特征(即按键时间间隔)的采集。其功能模块图如图34所示生物特征信息采集时间间隔采集采集次数记录采集状态反馈时间间隔反馈用户姓名存储图34生物特征信息模块功能模块图二、数据归一化处理模块功能设计数据归一化处理模块的主要功能是对所得数据进行预处理,为之后特征计算与特征匹配做准备,归一化是一种简化计算的方法,在模块中,将波动较大特征信息数据归一化为一个模为1的多维向量,在进行匹配或特征计算时,由于所有数据均为归一化数据,故若两多维向量的夹角或距离越小,则说明两者越相近。该模块主要为后面特征计算或匹配的数据进行预处理。其功能模块图如图35所示数据归一化处理原始数据记录原始数据导入原始数据归一化归一化数据存储图35数据归一化处理模块功能模块图三、特征计算模块功能设计特征计算模块主要用于对归一化得到的数据进行处理,通过迭代计算出用户特征,特征计算模块主要功能是通过对归一化处理后的数据进行计算后,得到用户的特征,其功能模块图如图36所示生物特征计算间隔提取次数分析计算中心点存储计算所得中心点中心点比对特征计算信息反馈中心点间欧式距离计算取得特征提示并存储未取得特征并提示图36特征计算模块功能模块图四、特征匹配模块功能设计特征匹配模块的主要功能是对待识别用户输入的信息进行提取及预处理,将归一化后的数据提取特征,与数据库中特征进行比对。特征匹配模块是完成特征识别的核心模块,主要负责完成特征识别。其功能模块图如图37所示生物特征匹配时间间隔采集提取到的数据与数据库特征比对用户特征提取数据预处理图37特征匹配模块功能模块图第四章系统实现第一节开发环境配置及工具使用1、开发环境配置开发前需先将环境配置并安装完成,先完成MICROSOFTVISUALSTUDIO2010安装,之后配置为C开发环境,如图41和图42所示图41MICROSOFTVISUALSTUDIO2010安装图42配置环境为C开发2、开发工具系统前台使用VISUALSTUDIO2010开发工具,WINFORM技术开发,C标准类库,后台使用SQLSERVER2008数据库作为数据存储。三、调试工具在使用C语言及WINFORM进行编程的时候,如果程序有错误,编译器会报错,程序也不会执行,开发者可以根据错误信息DEBUG,直至程序运行成功。在开发过程中,通过程序自带调试功能进行程序调试,在程序调试过程中,注意添加各种重要变量的监视,通过监视变量,调试程序过程中判断程序是否按要求执行,例如监视存储原始数据采集情况(DOUBLEARRAY1)、归一化处理后得到的数据(DOUBLEARRAY2)、存储所有归一化处理后的数据的LIST(ITEMCLUSTER)、存储计算所得中心的LIST(CENTERRESULT)等各种变量,如图43所示图43运行调试工具并监视重要变量第二节各模块功能的实现因各功能模块代码较多,部分是代码是重复使用,所以本论文中会只选取各模块中比较重要的代码讲解。一、特征采集模块功能的实现特征采集模块的时间间隔提取功能主要通过WINFORM中TEXTBOX控件中TEXTBOX_TEXTCHANGED事件及STOPWATCH类完成。STOPWATCH类是NETFRAMWORK中的一个类,该类提供了一组方法和属性,可用于准确地测量运行时间。当TEXTBOX控件中内容发生变化时触发TEXTBOX_TEXTCHANGED事件,在TEXTBOX_TEXTCHANGED事件中通过调用STOPWATCH中的方法实现提取按键时间间隔功能。生物特征提取模块模块的流程图及运行效果如图44和图45所示开始结束记录按键时间间隔第一个按键是B按键次数小于8获取一组间隔是否否是提示用户键入规定字母图44生物特征提取模块流程图运行效果图图45生物特征提取模块运行效果图在此模块中通过设置TEXTBOX_TEXTCHANGED时间,调用STOPWATCH函数完成捕捉按时间间隔功能,部分代码如下REGION/取时间间隔IFI/初始化ELSEIFN50/先是第15次,之后每5次之后重新计算中心FORI0I/初始化MYKCENTERINIT/计算中心MYKCENTERNEWITEMMYKCENTERCENTERRESULTAATEXTBOX8TEXTATOSTRINGREGION/初始化TEXTBOX1CLEAR/清空文本框I0J0M0DOUBLEARRAY1NEWDOUBLE8DOUBLEARRAY2NEWDOUBLE8COUNT0SQRT0STOPWATCHRESETENDREGIONTEXTBOX3TEXTNTOSTRING/显示测量次数STRINGDEMOSTRINGFORMAT“第0次记录完成,第1次中心计算完成“,NTOSTRING,ATOSTRINGTEXTBOX4TEXTDEMORETURNELSEFORI0I/初始化ENDREGIONREGION/初始化TEXTBOX1CLEARI0J0M0DOUBLEARRAY1NEWDOUBLE8DOUBLEARRAY2NEWDOUBLE8COUNT0SQRT0STOPWATCHRESETTEXTBOX3TEXTNTOSTRING/显示测量次数STRINGTESTSTRINGFORMAT“第0次记录完成“,NTOSTRINGTEXTBOX4TEXTTESTIFN50TEXTBOX4TEXT“50组数据已经存储完成但数据波动较大无法提取特征“TOSTRINGN0RETURNENDREGION四、特征匹配模块的实现在进行生物识别过程中,特征匹配模块录入十次目标输入特征,通过数据预处理提取出十次输入数据的中心点,通过所得中心点与数据库中目标特征对比,完成特征匹配。若匹配成功则会反馈信息为匹配成功并输出目标姓名,若匹配失败则反馈信息为匹配失败,请重新验证。特征匹配模块流程图和运行效果图如图410,图411和图412所示,开始匹配成功按键间隔采集数据归一化处理特征提取验证失败通过验证结束是否图410特征匹配模块流程图运行效果图图411特征匹配成功效果图图412特征匹配失败效果图特征匹配模块部分代码如下PRIVATEVOIDBUTTON3_CLICKOBJECTSENDER,EVENTARGSEIFMYKCENTERDISTANCEMYKCENTERCHECK,MYKCENTERCENTER0MYKCENTERCHECKNEWLISTMYKCENTERCHECKDEMONEWLISTB0M0I0ELSETEXTBOX9TEXT“匹配失败,请重新验证。“TOSTRINGMYKCENTERCHECKNEWLISTMYKCENTERCHECKALLNEWLISTMYKCENTERCHECKDEMONEWLISTB0M0I0RETURN第3节系统测试一、阀值选定测试根据已完成的系统,通过更改阀值的设定,进而得到阀值与识别成功率,阀值与匹配正确率之间的关系,如图513和图514所示图513阀值与识别成功率关系图图514阀值与匹配正确率关系图从图表中可以较为清晰的看出,阀值与识别成功率成正比,与匹配正确率成反比。识别成功率与匹配正确率是相互影响的数据,若想要有较高的识别成功率,则必定要以牺牲匹配准确率为代价,反之亦然。所以在实际系统中设定阀值时,需综合考虑识别成功率与匹配正确率间关系,选择符合系统需求的阀值。二、根据按键间隔进行生物识别方法测试为验证根据按键时间间隔进行生物特征识别的可行性,对程序进行测试。若不同人在相同相邻按键间时间间隔差距较大,则说明该方式可行;反之不可行。图515和图516分别为系统测得输入特征数据图和特征对比图。图515系统测得输入特征数据图图516特征对比图通过图516可明显看出不同人在输入特征上有较明显的差异。若将输入特征当做一个多维向量,则代表特征的多维向量在空间上有较明显的方向差距。综上所述,根据按键时间间隔进行生物特征识别是可行且可靠的。三、特征计算算法测试为验证特征计算算法可行性,需对程序在特征计算时进行测试。通过记录用户输入次数、数据中心点、中心点间欧氏距离判断算法可行性。若随着计算次数增加,相邻中心点间欧氏距离逐渐减小,则说明欧式距离随用户输入次数增加而逐渐收敛且该算法可行。图517和图518分别为同一个用户多次测量过程中中心点变化图和相邻中心点欧氏距离变化图。图517中心点变化图图518相邻中心点欧氏距离变化图由图517和图518可明显看出随着计算次数增加,相邻中心点间欧氏距离逐渐减小且逐渐收敛,随着用户录入次数增加中心点变化越来越小,已趋于稳定。在这种情况下,可以认为最终所得中心点数据可代表用户的输入特征。综上所述,欧式距离随用户输入次数增加而逐渐收敛且该特征值计算算法可行。第5章总结与展望第一节总结生物特征识别作为作为目前研究的一个主流,大多数研究方向为指纹、掌纹、虹膜、面部识别等人的固有生物特征。对于人的后天形成的行为特征研究较少。本文基于键盘这种普通输入设备,通过对用户的输入特征进行取样计算获得目标的生物特征信息。通过K均值算法改进出适合于系统的特征提取算法,在特征提取过程中,算法会自动根据相邻两组数据所得到的中心点判断所得中心点间的欧式距离是否逐渐收敛并达到精度要求,如达到则结束提取。这样相比设定固定的测量次数简化了特征提取步骤,同时使得到的数据更符合目标输入特征。本文的基于普通输入设备的生物特征识别系统主要是提供一个研究输入特征的平台,距离工程应用还有一定的距离。虽然通过简单算法实现了生物特征识别功能,但是还有许多不足的地方。比如不同键盘对于按键的响应速度不同,会造成同一个人在不同键盘上完成特征识别得到的特征不同。此外,由于算法的局限性,该算法是通过计算验证时提取到的数据中心点与数据库存储的相应特征点间的欧氏距离是否低于设定阀值完成识别。因此无法达到较高的精度,匹配成功率与设定的阀值成正比,匹配准确率与设定阀值成反比。这是一个相互矛盾的问题。若阀值设定过大,则系统可靠度会降低,但若阀值设定过低,则总会出现对正确用户识别失败的情况。所以今后需要在这方面进行较多的测试,通过实际实验得到更精确的阀值与匹配成功率及匹配正确率之间的关系,从而获得阀值的最优解。第2节展望随着更多的实验与数据的获得,通过不断优化算法,可使基于人的输入特征完成识别的生物识别系统具有更高的识别效率和识别准确率。在这种情况下基于普通输入设备的生物特征识别系统将有更宽广的应用前景在软件,邮箱,网站账号登陆时,可在用户输入账号和密码区嵌入类似的特征识别系统,在用户输入用户名,密码的同时捕捉用户的输入特征,与数据库中特征进行对比,从而可实现生物特征与密码的双重验证,提高安全性;在公共安全事业,可通过建立大型数据库,将个人输入特征存入其中,在侦破案件中,可通过设定让键盘自带输入特征捕捉功能,若疑犯使用电脑且生物特征匹配,则可通知警方并通过所用电脑IP地址定位大致方位。该系统的部分实现思想与算法还可用于行为识别中的其他行为特征识别中。例如步态识别时,可以将人的头部及手部摆动距离特征数据进行统计,经过归一化处理,特征提取则可得到目标的生物特征。致谢在论文完成之际,我要深深地感谢在本科就读阶段所有给予我指导和帮助的老师和同学们。首先,由衷感谢导师吴桂军老师,他在我完成论文的过程中,给予了我很大的帮助。从论文开题,直至最后完成论文,吴老师指导一直都耐心的指导我,给予了我无私的帮助。在此,向吴老师致以最衷心的感谢。其次,还要感谢帮助过我的同学们和朋友们,特别是艾子初同学,在他们的大力帮助与鼓励下,我的程序才能及时完成。在这里,我对他们致以深深的谢意。感谢我的家人,是他们多年来对我的关心、鼓励和支持使我得以顺利地完成自己的学业,我衷心的谢谢他们,祝愿他们幸福平安最后,我衷心感谢在百忙之中进行论文评阅和参加答辩的老师们,你们辛苦了参考文献1黎坚生物识别技术在科普场馆中的展览设计与应用J科技与生活,2012,71341352毛巨勇生物特征识别产业发展与现状J中国自动识别技术,2010,53刘希清生物特征识别技术标准化工作现状研究J金卡工程,2005,91367704王崇文,李见为,林国清一种新的复合指纹匹配法J计量学报,2004,0176805田捷,杨鑫,生物特征识别技术理论与应用,北京电子工业出版社,200511806霍宏涛,林小竹,何薇等,数字图像处理,北京北京理工大学出版社,2002,1681827李徐周生物特征识别技术的发展与应用J山东省青年管理干部报,2004,011411438邬向前,张大鹏,王宽全掌纹识别技术北京科学出版社,20069潘少飞基于OPC和NET平台的喷涂机器人监控系统设计J工业控制计算机,2013,12373910张纪生基于指纹身份识别平台系统设计与实现D电子科技大学,201311XUH,VELDHUISRNJ,KEVENAARTAM,ETALAFASTMINUTIAEBASEDFINGERPRINTRECOGNITIONSYSTEMJSYSTEMSJOURNAL,IEEE,2009,3441842712史海成,王春艳,张媛媛浅谈模式识别J今日科苑,2007,2216913ANILKJDATACLUSTERING50YEARSBEYONDKMEANSCDEPARTMENTOFCOMPUTERSCIENCEANDENGINEERING,200914MACQUEENJSOMEMETHODSFORCLASSIFICATIONANDANALYSISOFMULTIVARIATEOBSERVECPROCEEDIN

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论