(电路与系统专业论文)人脸自动识别系统和H264AVC中SP帧技术的应用研究[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)人脸自动识别系统和H264AVC中SP帧技术的应用研究[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)人脸自动识别系统和H264AVC中SP帧技术的应用研究[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)人脸自动识别系统和H264AVC中SP帧技术的应用研究[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)人脸自动识别系统和H264AVC中SP帧技术的应用研究[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩77页未读 继续免费阅读

(电路与系统专业论文)人脸自动识别系统和H264AVC中SP帧技术的应用研究[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京邮电大学硕士学位论文 摘要 人脸自动识别系统和h 2 6 4 a v c 中 s p 帧技术的应用研究 摘要 2 1 世纪是多媒体的世纪,多媒体技术必将加速计算机和通信服务 进入家庭和社会各个方面的进程,给人们的生活、工作和娱乐带来深 刻的革命。多媒体信息的传输技术与数字处理技术是多媒体技术的两 大组成部分,本文正是在多媒体信息的传输与数字处理领域,围绕几 个实际项目课题,作了一些具体的研究和尝试。 论文共分两个部分。第一部分主要是实现个应用于公司考勤实 时监控系统的人脸自动识别系统。在对已有方法的分析基础上,重点 研究了将肤色信息应用于人脸检测算法中。同时设计了存储人员信息 的数据库和系统的交互界面。最后在实验的基础上给出了系统的识别 率,并与其他识别算法进行比较。第二部分主要讨论了h 2 6 4 a v c 标准中定义的一个新的帧类型s p 帧。它的主要特性是:即使参 考帧不同,预测得到的重构帧仍完全相同,因而可以在码流切换、随 机访问和差错恢复等应用中取代i 帧。论文首先描述了s p 帧的这一 特性是如何被用在具体应用中的。然后详细探讨了s p 帧非帧内的编 码解码过程。最后通过应用仿真结果表明,在提供相同功能的同时 s p 帧的编码效率远远高于i 帧。 关键词:人脸识别人脸检测k l 肤色h 2 6 4 a v cs p 帧码流切换 北京邮电大学硕士学位论文 a b s l r a c t t h ea u t o m 【a t i cf a c er e c o g n i t l o ns y s t e m a n dt h ea p p p l i c a t i o nr e s e a r c ho f s p f r a m e sf o rh 2 6 4 ,a v c a b s t r a c t t h e21s tc e n t u r yi st h ec e n t u r yo fm u l t i m e d i at h em u l t i m e d i at e c h n o l o g yw i l l a c c e l e r a t et h ep r o g r e s so f c o m p u t e ra n dc o m m u n i c a t i o n s e r v i c e se n t e ra l lr e s p e c t so f t h e f a m i l y a n ds o c i e t y , a n db r i n ga d e e p r e v o l u t i o nt o p e o p l e sl i f e ,w o r k a n d a m u s e m e n tt r a n s m i s s i o n t e c h n o l o g y a n d d i g i t a lp r o c e s s i n gt e c h n o l o g y o f m u l t i m e d i ai n f o r m a t i o na r et w om a j o rc o m p o n e n t so ft h em u l t i m e d i at e c h n o l o g y 。 t h i st h e s i sh a sm a d es o m ec o n c r e t er e s e a r c ha n da t t e m p ta r o u n ds e v e r a la c t u a l p r o j e c t sj u s t i nt h ef i e l d so ft r a n s m i s s i o na n dd i g i t a l p r o c e s s i n g o fm u l t i m e d i a i n f o r m a t i o n t h i st h e s i sc a nb ed i v i d e di n t ot w om a j o r p a r t s t h ef i r s tp a r ti st oa c c o m p l i s ha f a c e r e c o g n i t i o ns y s t e mw h i c hi sa p p l i e dt oa s u r v e i l l a n c e s y s t e m o na t t e n d a n c e b a s e do nt h es u r v e yo f t h ee x i s t i n gm e t h o d s ,t h ef o c u so f t h i st h e s i si st h ea p p l i c a t i o n o fs k i n c o l o ri n f o r m a t i o nt of a c ed e t e c t i o n i na d d i t i o n , ad a t a b a s e o fp e r s o n i n f o r m a t i o na n das y s t e mu s e ri n t e r f a c ea r ed e s i g n e de x p e r i m e n t sa r ep r e s e n t e d c o m p a r i n g w i t ho t h e ra l g o r i t h m s i nt h es e c o n dp a r t ,w ed i s c u s s e san e wf l a m et y p e , s p f l a m e s ,d e f i n e di nh 2 6 4 a v c ,t h em a i nf e a t u r eo fs 9 - f r a m e si st h i ni d e n t i c a l s p 。f r a m e sc a nb er e c o n s t r u c t e de v e nw h e nd i f f e r e n tr e f e r e n c ef l a m e sa r eu s e df o r t h e i rp r e d i c t i o nt h i sp r o p e r t ya l l o w st h e mt or e p l a c ei - f l a m e si na p p l i c a t i o n ss u c ha s b i t s t r e a ms w i t c h i n g ,r a n d o ma c c e s s ,a n de r r o rr e c o v e r y f i r s tw ed e s c r i b eo nh o w t h e s ef e a t u r e so fs p f l a m e sc a nb ee x p l o i t e di ns p e c i f i ca p p l i c a t i o n s t h e nw ep r o v i d e ad e t a i l e dd e s c r i p t i o no fd e c o d i n ga n de n c o d i n gp r o c e s s e sf o rn o n i n t r ab l o c k si n s p f r a m e s f i n a l l y , s i m u l a t i o nr e s u l t s a r es h o w nt h a ts p f l a m e sh a v es i g n i f i c a n t l y b e t t e rc o d i n ge f f i c i e n c yt h a ni - f l a m e sw h i l ep r o v i d i n gs i m i l a rf u n c t i o n a l i t i e s k e yw o r d :f a c er e c o g n i t i o n ,f a c ed e t e c t i o n ,k ls k i n - c o l o r , h2 6 4 a v c ,s p f r a m e s , b i t s t r e a ms w i t c h i n g 3 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中i 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处 本人签名: 趁盘鸟 本人签名: 丛盘蜀 本人承担一切相关责任。 日期:! ! ! : 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 非保密论文 本人签名: 导师签名: 于保密范围,适用本授权书。 日期:弘丝: :一 日期:丝垒3 :醛! 北京邮电大学硕上学位论文 第一章人脸自动识别系统 第一部分人脸自动识别系统的实现 第一章人脸自动识别系统 1 1 人脸自动识别概述 人脸图像的自动识别是一个饶有趣味而又充满挑战的研究课题。由于人脸 可以提供大量有价值的信息,也可以作为一个友好的交互接口,于是应运而生 了许多新的研究热点,例如人脸识别、表情姿态的识别等。人脸识别作为模式 u 别和人工智能领域中的一个特定内容,有着非常广泛的应用前景,例如:工 业安全核对、公安( 罪犯识别等) 、安全验证系统、信用卡验证、档案管理、人 机交互系统、医学和视频会议等【1 t 2 1 。 9 1 1 事件之后,国际反对恐怖活动的安全措施日益显得重要,能够在公众 场合自动识别出嫌疑犯的识别系统更成为研究的热点。其中对人员身份的确认, 防止不法人员混入重要会议、重要场地也成为安全措旌的重要组成部分。与指 纹、视网膜、虹膜、基因等其他人体生物特征识别系统相比,人脸自动识别系 统更加直接、方便、友好,使用者无任何心理障碍,在安检系统中的应用一定 会大有作为【3 1 。虽然人类可以轻松识别出不同人的脸部特征,但由于人脸表情 丰富,人脸随年龄增长而变化,人脸图像受光照、成像角度及成像距离等影响, 这诸多因素使得人脸识别技术复杂化,因此人脸的自动机器识别成为一项极富 挑战性的课题。它牵涉到模式识别、图像处理及生理、心理学等方面的诸多知 识【”。 人脸识别的研究已有很长的历史,甚至可以追溯到上个世纪,g a l t o n 就曾 经用,一组数字代表不同的人脸侧面特征。1 8 9 3 年,b e r t i l i o n 采用语句描述方法 对人脸分类。 二十世纪六十年代,wb l e d s o e 首先提出人脸的半自动识别系统与特征提 取的方法。 七十年代,美、英等发达国家开始重视人脸识别的研究:作并取得进展。 1 9 7 2 年,h a r m o n 用交互式人脸识别方法在理论上与实践上进行了详细的论述。 就在这一年,s a k a i 设计了人脸图像自动识别系统。 八十年代初,t m i n a m i 研究出了优于s a k a i 的人脸图像自动识别系统。 北京邮电大学硕士学位论文 第一章人腑自动识别系统 九十年代,由于计算机技术、数字图像处理、模式识别技术的发展,加i 二 人们对人脸图像自动识别的迫切需求,各国军、警方及有关部门高度重视,大 公司鼎力相助,对他的研究变得非常热门。 1 9 9 6 年美国军方组织了人脸自动识别系统大赛,勒克菲勒大学的f a c e l t 系 统获得冠军。最近,美国的l a u 公司研制的人脸图像自动识别系统,是以人脸 辨别人的原理,基于生物测量学、人像复员技术开发的装置。用人脸1 2 4 2 个 特征点,对人群中寻找的人进行定量定性识别,已经用在机场、火车站、公共 场所、种蛋控制地区。 近年来,我国有关部门也很重视,一些研究单位、高校也开始从事人脸图 像自动识别的研究。 人脸识别在应用中,目前主要可以归为两类:即身份识别辨认匹配 ( r e c o g n i t i o n i d e n t i f i c a t i o n m a t c h ) 和身份验证证实监督( v e r i f i c a t i o n a u t h e n t i c a t i o n s u r v e i l l a n c e ) 。前者在应用上的典型实例就是公安刑侦追逃;第二 种应用情形的典型实例是身份证件的鉴别、自动门禁控制系统、银行a t m 取款 机、家庭安全等。简单讲,一个是判断他( 她) 是谁,一个是判断他( 她) 是 不是某人。具体地说,前者的应用情形是给出一个未知个体的图像,和已知图 像集中的图像相比较,找到最相似的,从而得知个体的身份。系统给出的结果 不必仅仅一个,而可以根据相似度提出一个最为匹配的图像子集。而后者的应 用情形一一般是访问者提供个i d ,同时自动验证系统获取图像,并与图像集中 与此i d 对应的图像相比较,从而判断此访问者是否与所提供的d 对应的个体 为同一个人。本论文中研究的主要任务就是身份验证的应用,即判断他( 她) 是不是某人。 1 2 系统的组成 一个人脸图像自动识别系统实际上是一个计算机系统在图像处理方面的应 用。一个典型的人脸识别系统的基本框图如图1 1 所示。 图1 1典型的人脸自动识别系统原理框图 2 北京邮电大学硕士学位论文 第一章人脸自动识别系统 由图可见一个人脸识别系统主要由以下几个功能模块组成; f 1 ) 图像获取 图像获取模块完成获取图像,图像有可能来自于摄像机或是扫描仪等设备。 ( 2 ) 人脸检测定位 处理分析输入的图像或图像序列,判断其中是否有人脸,如果有巾人脸则 找到人脸的确切位置,并进一步将人脸从背景中分离出来,输出为分割好的人 脸局部图像。输入的图像可能是静态的也可能是动态的,可能是彩色的也可能 是灰度的,可能是简单背景也可能是复杂背景,可能有一个活着多个人脸,要 根据不同情况作相应的处理。这一部分的工作在整个系统中是非常重要的,它 直接影响后续的特征提取和识别等工作的成功与否。 在大多数应用场合中,人无法控制场景,也没有任何有关人脸位置、尺度、 方向( 上下左右的角度) 、是否遮挡和人脸的姿态的先验知识,于是人脸检测和 定位成为一个非常困难的问题。不过在很多特定情况下这部分的工作会变得比 较简单,在具体摄像条件可控制时这一步还可以省略。比如警察拍罪犯的照片 时要他们将脸的某一部分靠近标尺,这时候人脸的定位很容易,普通证件照片 上头部占了照片中央的大部分地方,定位也比较容易。 ( 3 ) 图像预处理 预处理的主要作用在于尽可能的去除或者减小光照、成像系统、外部环境 等等对于待处理图像的干扰,为后续处理提供高质量的图像。这部分完成对抽 取的人脸图像的几何归一化、消除噪声、和灰度归一化等处理( 可以视具体应 用而选用) ,使不同图像中人脸大小和亮度统一以便在同一条件下完成训练和识 别。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大 小,灰度归一化是指对图像进行光照补偿等处理,光照补偿能够在一定程度上 克服光照变化的影响而提高识别率。 ( 4 ) 特征提取和选择 在前面预处理后的人脸图像中按照某种策略抽取出用来识别的特征,将原 始的脸空间中的数据映像到特征空间。由于原始的图像数据量是相当大的,为 r 有效地实现分类识别,就要对原始数据进行变换,得到最能反映分类本质的 特征。如何提取稳定和有效的特征是识别系统成败的关键。 具体的特征形式随识别方法的不同而不同,比如在基于几何特征的识别方 北京邮电大学硕士学位论文 第4 章人脸自动识别系统 法中,这一步主要是提取特征点,然后构造特征向量;在统计识别方法中,特 征脸方法是利用图像相关矩阵的特征向量构造特征脸;模板匹配方法用相关系 数作为特征;而大部分神经网络方法则直接用归一化后的灰度图像作为输入, 网络的输出就是识别结果,没有专门的特征提取过程。 ( 5 ) 训练 也可称为分类器设计。此过程结束后将生成可用于识别的参数,也就是司 川于分类识别的分类器。事实上,模式识别问题可以看成是一个分类问题,即 把待识别的对象归到某一类中。在人像识别问题中就是把输入的不同的人像归 入某个人这一类。这部分的基本做法是在样本训练集基础上确定某个判决规则, 使按这种判决规则对被识别对象进行分类所造成的错误识别率最小或引起的损 失最小。 f 6 ) 识别 根据训练所得的参数完成人脸的判别工作,给出最后的识别结果,并做出 相应的判断。 概括的说来,人脸识别系统一般可以划分为两个过程,如图l 一1 所示,虚 线上半部分是训练过程,也叫做分类器的设计过程,虚线下半部分是识别过程, 也叫做分类决策过程。 1 3 系统的评价标准 评价一个人脸识别系统通常有下列指标:人数、正识率、拒识率和识别时 间。正识率是指属于该系统的某个人被正确地判定是谁的概率,拒识率则是指 ,f i 属于该系统的人被正确地判定为不属于该系统的概率。在没有特殊说明的情 况卜,识别率就是指正识率。显然,正识率和拒识率这两者之间是存在矛盾的, 所以在实际应用中往往需要加以折衷。例如在安全性要求较高的计算机登陆系 统中,必须要求拒识率尽可能高,而正识率则可以低一些,这样只会增加合法 用户的登陆时间,而并不会降低计算机系统的安全性。识别系统一般都是在一 定的限制条件下达到一定的指针,一般说来,限制约多( 也就说明变化越少) , 则越容易识别,相应的识别率就越高。根据实际应用情况的不同,对于识别时 问也会有相应的要求。 4 北京邮电大学硕士学位论文 第一章人脸自动识别系统 1 4 系统的总体方案设计 1 4 1 ,系统的开发环境 人脸自动识别系统首先是一个大型的数据库系统,因此数据库的选择就显 得非常重要,我选择了o r a c l e 8 ir e l e a s e2 ( 81 6 ) 作为数据库服务器。首先,o r a c l e 是性能优秀的数据库,在安全性方面获得最高认证级别的i s o 标准认证,其次, o r a c l e 能够提供几乎所有平台下的数据库版本,这使以后服务器的平台变化对 客户端没有任何影响。第三,o r a c l e 提供比较完备的开发工具,如p l s q l 可 以方便地在服务器端封装应用的逻辑。而且,o r a c l e 也受到其他厂商的开发工 具的广泛支持。 在客户端,数据库程序选用v i s u a lc + + 6 0 作为开发工具。 1 4 2 系统的主要功能 人脸识别系统是目前最先进的人员识别系统,它可以在自然的环境中对人 员进行识别,确认是否本人。将其与考勤打卡系统结合起来,可以在无人值守 的情况下,自动识别员工,为用户提供了很大的方便。系统主要实现了以下几 方面的功能: 人员信息建库:在客户端利用摄像头和视频采集卡输入人脸和人员的文档 信息。首先,对公司的员工建立数据库,要记录若干基本数据( 例如姓名、年 龄、部门等等) ,磁卡的卡号等,最主要的部分是人脸图像信息的录入,同一个 人在库中存有多张人脸图像。 图像检测定位:在人脸图像入库之前,须对图像进行检测定位,去除复杂 的背景信息,分割出人脸的准确位置,并且进行尺度归一化,确保库中的图像 足大小相同的入脸图像。同样对待识别的人脸图像同样需要这些处理。 特征信息提取:经过训练将从此人脸部图像所抽取的特征存入数据库中, 这些特征将用于实时监控时的人脸识别。 信息比对判断:通过摄像头获得待测人员的有效信息( 人脸图片和卡号信 息) ,并对获得的图像进行脸部定位和特征抽取,得到人脸特征信息,根据人员 卡号将信息与服务器端数据库中的信息进行比对判断,返回最后结果。 1 4 3 系统的硬件部分 系统的硬件结构如图1 2 所示,硬件主要由摄像头、视频采集卡和打卡机 北京邮电大学硕士学位论文 第章人脸自动识别系统 三部分组成。摄像头好比人的眼睛,它从外界采集人脸图像,并把图像转成模 拟信号;视频采集卡决定了采样速率和采样质量,其主要任务就是将接受到的 模拟视频信号转换成数字视频信号;打卡机是持卡人刷卡的设备,刷卡时考勤 系统自动记录卡的编号,并触发监控系统拍照获得用于识别的人脸图像。由于 硬件的某些原因,本系统没有与打卡机建立连接。 144 系统的软件部分 图l 一2 系统硬件结构框图 在系统结构上,系统选择了客户机服务器模式( c s ) ,客户机服务器模式 的特点是,客户机上运行客户程序,提供用户界面,负责输入和输出;服务器 j 二运行服务程序,向客户程序提供计算和数据服务。客户机和服务器通过网络 相连( 实际上也可以是同一台机器) 。现有的数据库系统很多都应用这种结构。 具体结构如图1 3 。首先,对公司的员工建立数据库,要记录若干基本数 据( 例如姓名、年龄、工作部门等等) ,磁卡的编号等,最主要的部分是人脸图 像信息的录入,同一个人在库中存有多张人脸图像,经过训练将从此入脸部图 像所抽取的特征存入库中,这些特征将用于实时监控时的人脸识别。上面的这 些工作是在后台完成的。实际上包含了人脸识别系统中的检测定位模块、预处 理模块、特征提取模块和训练模块。这些工作在后台完成,对运算速度没有什 么严格的要求。 当员工上下班时,先在考勤机上刷卡,微机通过考勤机检测到有人刷卡, 这时读入i c 卡编号,如果使用的是已挂失的i c 卡或非法卡,系统将报警;如 果是合法的卡号,微机会控制摄像机将他的照片实时拍下来,将抓取到的图像 6 北京邮电大学硕士学位论文 第一章人脸自动识别系统 ( 静态的) 输入人脸识别系统进行识别。具体地说,就是对抓取到的图像进行 脸部定位和特征抽取,得到特征信息,用这些特征信息与数据库中的该编号所 对应人的图像特征作比对,如相似程度大于某个相似度阈值则允许此人通过, 否则不允许其通过,并有一定情况下的报警提示。这也就是人脸识别系统中的 识别模块。显然,这部分有一定实时性的要求。因此在选择具体的识别算法时 应该注意到这一点。 图1 3 系统软件结构框图 1 4 5 系统的算法部分 人脸自动识别系统的算法部分构成如图1 4 所示: 图像 像序 - - _ - - _ _ _ _ - _ o o o o - o o - _ - ,- 。- - 图1 4 系统算法结构框图 从入脸自动识别技术所依据的理论来说,人脸检测和人脸识别都是模式识 别的问题。人脸检测就是把所有的人脸作为一个模式,而非人脸作为另一个模 式。,人脸检测的过程就是将人脸模式与非人脸模式区别开来。人脸识别则是把 7 北京邮电大学硕士学位论文第一章人脸自动识别系统 每一个人的脸作为一个模式来对待,不同人的脸属于不同的模式类,人脸识别 的过程就是将属于不同人的脸归于各自的模式。也可以说,人脸检测强调的是 人脸之间的共性,而人脸识别则要区分不同人的脸之间的差异,两者同属于模 式聚类问题。 由于人脸模式的复杂性以及可利用信息的多样性,很难对人脸检测算法准 确地分类,当前有众多的标准:按照人脸的姿态,分为正面人脸检测( 包括端 正以及旋转) 和侧面人脸检测( 包括俯仰、侧影及其旋转) ;按照一幅图像中存 行:的人脸数目,分为单个人脸的检测和多个人脸的检测;按照背景类型分为简 单背景f 的人脸检测( 没有背景或者背景特征受严格约束) 和复杂背景下人脸 的检测( 背景不受限制,比如自然风景) ;按照输入图像的颜色信息分为灰度图 像的人脸检测和彩色图像的人脸检测;按照输入图像的数目分为静止图像中的 人脸检测和运动图像序列中的人脸检测等等。 对于本文的实际应用来说,人脸识别是针对较强约束条件的人脸图像,因 此人脸检测部分变得比较简单,即在简单背景的静止图像中的检测正面、单个 人脸。因为输入到识别系统的图像是彩色的,能够提供比灰度图像更丰富的信 息,考虑到肤色的稳定性,最后选择了基于肤色的人脸检测方法。实验结果表 明这种方法是可行的。 基于k l 变换的p c a 方法和f i s h e r 鉴别准则在理论上已经比较成熟,是 应用很广泛的识别方法。p c a 方法既属于代数特征的人脸识别方法,将人脸用 代数特征向量来表示;又属于整体的研究方法,它考虑了模式的整体属性。f i s h e r 线性判别理论也是经典的模式识别方法,它使得同类模式的样本密集,不同模 式的样本分开。p c a 方法种简单、快捷、实用,虽然此方法存在着一定的局限 性,但是考虑到此识别系统的约束条件较强:人脸没有大幅度的姿态变换、背 景可以设置得简单、光照可以保证均匀等等,以及实时性要求,因此在特征提 取和识别部分采用了p c a 和f i s h e r 准则结合的算法,实验验证了其有效性。 值得一提的是:在整个系统中,相似度阈值的选取是很重要的。相似度阈 值决定了系统的安全性和效率。相似度阈值过大,会使本来有权限通过的人员 不能得到认证,无法通过:而若相似度阈值过小,则使安全性降低,本无权通 过的人员也得到认证。衡量相似度阈值好坏与否的指针主要有两个:在此阈值 f :的错误通过率和错误拒绝率。一般两者是相互制约的,错误通过率相对低时 错误拒绝率会相对高,错误拒绝率相对低时错误通过率会相对高。本文可根据 据识率的高低灵活地确定相似度阈值。 8 北京邮电火学硕士学位论文 第一章人脸自动 = 别系统 1 4 5 系统的界面设计 用户界面是人机交互的接口,应该为用户提供友好、方便的操作。基于这 原则,设计思路基本如下: ( 1 ) 鉴于系统所要实现的功能,界面将主要信息、基本操作都体现在主体 窗f 内,通过工具栏上的一系列工具可以实现需要的所有操作。如图1 - - 5 所示, 界面中的三个窗口分别显示了人员资料信息、图片信息和视频捕捉信息。 ( 2 ) 提供人员基本信息输入对话框,用户通过该界面将人员基本信息输入 数据库中。 ( 3 ) 建立与视频卡的连接,实时显示动态图像,同时可以随时捕捉序列图 像中的某一帧,用于识别判断。 ( 4 ) 提供训i 练识别图片功能,训练时间较长,但是基于我们的考勤系统应 用,我们可以预先处理这一过程。识别过程相对简单,识别后返回判断结果, 足某人( w e l c o m e ) 或不是某人( s o r r y ) 。 图1 5 人机交互界面 9 北京邮电大学硕士学位论文 第二章系统数据库的设计和访问 第二章系统数据库的设计和访问 2 。1 数据库的设计 在进行数据库设计的时候,不可避免地要考虑数据的规范化的问题。这里 所说的规范化是指我们应当如何在数据库表中实现数据关系以及数据的存储。 第三范式( 3 n f ) 数据库是我们设计的目标,因为在大多数情况卜,这一规范 化水平是对规范化过程中功能与易用程度的最好平衡。另外要考虑的就是数据 的完整性问题。数据的完整性是指存储在数据库中的数据的一致性和正确性f 5 】。 卜面将从这两个方面出发介绍数据库的设计思路。 2 1 1 规范化 第一范式( 1 i n f ) 在数据库理论里对第一范式的定义是这样的:如果一个关系模式的每个具 体关系的每个属性都是不可再分的最小数据单位,则称其为第一范式。即要求 数据库表中的每一个值都是原子项或只显示一次。 第二范式( 2 n f ) 第二范式的定义是这样的:满足第一范式的关系模式,如果他的所有非主 属性都完全函数依赖于任一候选关键字,则称其为第二范式。第二范式要求数 据库表中的每个实例或行都必须可以被唯一的区别。 第三范式( 三n f ) 定义如下:如果关系模型满足第二范式,且它的任何一个非主属性都不传 递依赖于任何候选关键字,则称其为第三范式。当数据库满足第三范式时,表 中就不会有多余的已在其他表中包含的非关键字信息。 此外还有更高的第四范式直到第六凡是,但对我们而言,第三范式已经可 以认为是规范化的数据库,因此我们首先按照第三范式的要求来进行数据库的 设计。 2 1 2 数据完整性 数据完整性分为四类:实体完整性、域完整性、参照完整性以及用户定义 的完整性。 实体完整性 1 0 北京邮电大学硕士学位论文 第二章系统数据库的设计和访问 实体或表完整性要求表中的所有行有唯一的标识符,即主键值。主键和任 何外键参照之间的完整性级别决定主键值能否修改或整个行能否被删除。 域完整性 域或列完整性规定对该列为合法的一组数据值是否允许空值。i j 以通过限 定类型( 数据类型) 、格式( c h e c k 约束和规则) 、或可能的取值范围( f o r e i g nk e y 约束、c h e c k 约束和规则) 来实施域完整性。 参照完整性 当修改记录时参照完整性维护表之间确定的关系。参照完整性确保主键( 在 被参照的表中) 和外键( 在参照的表中) 之间的关系始终得以维护。如果 参照行的外键还存在。被参照表中的这一行便不能删除,主键也不能修改。 如果被参照的表中没有对应主键的行,一个外键值便不能插入到参照表中。 用户定义的完整性 用户定义的完整性允许用户定义不属于其它任何一类完整性的特定规则 ( 例如,实现邮政编码的规则) 。各类完整性均支持用户定义的完整性。 21 3 数据库结构和实现 下面是数据库的结构,这里列出系统几个基本的表。 1 表名称及用途 1 ) 员工信息表 表的名称:员工信息 表的用途:存储所有员工的个人信息,是考勤系统的人员档案。 2 ) 图片资料表 表的名称:图片资料 表的用途:存储所有员工的训练图片。 3 ) 子空间基表 表的名称:子空间基 表的用途:存储训练时计算出的子空间基矩阵,它的大小为像素点 特征值,将在以后的识别中查询使用。 北京邮电大学硕士学位论文 第二章系统数据库的设训和访问 4 ) 投影值表 表的名称:投影值 表的用途:存储训练时计算出的每个人对于子空问基矩阵的投影值, 它的大小为员工人数特征值,将在以后的识别中套询使用。 5 ) 域值表 表的名称:域值 表的用途:存储训练时计算出的域值,也将在以后的识别中查询使用。 2 表详细设计 表2 1 员工信息表( 卡号为关键字必须唯一一且非空) 字段名称数据类型大小小数位 仁号n u 她e r1 00 姓名 v a r c h a r 21 0 部门 v a r c i a r 2l o 年龄 n i j m b e r30 性别 c h a r2 电话n m 毋e r1 0o 地址v a r o i a r 21 5 照片 b l o b 表2 2 图片资料表( 卡号为关键字必须唯一且非空) 名称数据类型大小小数位 卡号 m n 仍e r1 0o p h o t 0 1b l o b p h o t 0 2b l o b p i 0 t 0 3b l o b b l o b p i l o t 0 8b l o b 修改时间 d a t e 表2 3 子空间基表 名称数据类型大小小数位 e i g e n v e t o r lv a r c h a r 2l o e i g e n v e t o r 2v a r c h a r 21 0 e i g e n v e t o r 3v a r c n r 21 0 v a r c 眦r 21 0 e i g e n v e t o r 2 2v a r c h a r 21 0 北京邮电大学硕士学位论文第二章系统数据库的设计和访问 表2 4 投影值表 名称数据类型大小小数位 卡号 n u m b e r1 0o e i g e n v e t o r lv a r c n r 21 0 e i g e n v e t o r 2v a r c i a r 21 0 e i g e n v e t o r 3v a r c h a r 21 0 v a r c h r 2 e i c - e n v e t o r 2 2v a r c i a r 21 0 修改时间 n a t e 表2 5 域值表 首先,如前所述,一开始为了满足规范化以及数据完整性的要求,将需要 用到的数据进行了划分,按照它们的属性、用途等特性将他们分入不同的表中。 在这里员工信息表和图片资料表中的关键字卡号是一一对应的,为了满足这种 对应关系,同时保证数据完整性,我在程序里面进行了约束,即添加一个员工 信息实例时,便在图片资料表中添加一条对应的实例,同样,删除员工信息表 中的一个实例时,立刻在图片资料表中删除一条对应的实例。 2 2 数据库的访问 22 1 a d o 数据库访问技术 在人脸自动识别系统的设计中,需要大量与数据库的交互操作,包括人员 资料的读取、图片信息的读取更新等等。下面简要介绍一下v i s u a lc + + 中的数 据库访问技术。 v i s u a lc + + 6 , 0 中开发数据库的技术是多种多样的【6 】包括o d b ca p i 、m f c o d b c d a o 、o l e d b ,a d o 等。在这些技术中,由于o l e d b 、a d o 是基 于c o m 技术的,较之其它技术而言拥有无可比拟的优势,成为未来数据库发 展的新方向。这些优势体现在可以自由地访问关系型数据库和非关系型数据库、 甚至提供数据的硬件,同时访f 1 数据源的速度更快、更易于移植,开发也更简 单。 o l e d b 是一种标准接1 2 1 技术,提供统一的数据访问接口。这里的“数据” 可以是标准关系数据库中的数据,还包括邮件系统中的数据、w e b 上的文本和 图形、目录服务等等。o l e d b 的两个基本结构是o l e d b 驱动程序( 其中包括 数据接口部分) 和o l e d b 用户程序。驱动程序是为访问某些特殊数据源而编 北京邮电大学硕士学位论文 第二章系统数据库的设计和访问 写的,这些数据源通常是数据库,但也可能是任何其他类型的数据源,每一个 数据源具有单+ 的o l e d b 驱动程序。用户程序通过驱动程序得到数据源。儿 个不同的用户程序可以便用同一个o l e d b 驱动程序,也可编写专门的用户程 序来利用o l e d b 驱动程序所启动的特殊过程,从而使得o l e d b 非常灵活。 o l e d b 是基于软件重用思想开发的,其技术特点主要是: ( 1 ) 配置的灵活性。 与以往的数据库访问技术不同,o l e d b 可以访问任何格式数据文件。由于 o l e d b 以c o m 组件的形式实现,所以用o l e d b 开发的程序具有良好的可移 植性。 f 2 ) 良好的健壮性。 c o m 模型中的对象组件都是经过严格测试的,接口严格遵循规定,很容易 通信。对象组件及其接口都提供了“错误”对象和“错误”接口,可以截获错 误的发生,并报告应用程序。从而,组件和接口共同工作,组成了一个健壮的 应用程序。 ( 3 ) 访问数据源速度快。 组件化技术使o l e d b 应用程序实现了功能分配,所以o l e d b 具有比传统 数据库更快的访问速度。 尽管o l e d b 具有这么多的优点,但它也有一个不足,那就是编程代码量大, 对底层的操作比较复杂。虽然a t l 和m f c 的应用可以减弱这一缺点,但实际 应用起来还是比较困难。而继承了o l e d b 的功能并对它进行封装、简化的接 口就是a d o 。 a d o ( a c t i v e x d a t a o b j ) 是一组基于o l e d b 数据库访问技术的高级自动 化( a u t o m a t i o n ) 应用层接口。尽管o l e d b 是一个功能强大的数据访问接口,但 是对于大多数应用程序开发人员来说,他们通常使用不支持函数指针和其他 c + + 调用机制的高级编程语言,因此他们感兴趣的并不是o l e d b 提供的底层数 据访问控制功能,如内存管理、手工集合组件等。另外,由于o l e d ba p l 是 c + + a p i ,只能提供c + + 语言调用接口,不能直接用于其他高级编程语言。所 以,在o l e d b 之上又提供了a d o 对象模型。它们的关系如图2 一l 所示: 1 4 此京邮电大学硕士学位论文第二章系统数据库的设计和访问 图2 1 数据库访问层次关系图 a d o 具有以下特性: ( 1 ) 易于使用。 利用a d o 对象模型完成一个简单的数据访问任务,只需编写很少的代码。 ( 2 ) 编程语言无关性。 a d o 可以用于大多数流行的编程语言,包括脚本编程语言,如v i s u a lb a s i c 、 j a v a 、c + + 、v b s c r i p t 、j a v a s c r i p t 等。 r 3 ) 数据源无关性。 a d o 能访问任何o l e d b 数据源,并具有自适应性。 ( 4 ) o l e d b 功能完备性。 a d o 允许c + + 程序员直接访问底层o l e d b 接口。 ( 5 ) 可扩展性。 a d o 使用数据源属性集动态说明特定数据提供者的属性。另外,a d o 允许 访问被说明成列值的c o m 对象( 如行集和流) ,从而提供了数据类型的可扩展 性。 使用a d o 访问数据库,特别要注意的是数据的类型转换问题。由于c o m 对象是跨平台的,它使用了一种通用的方法来处理各种类型的数据,因此 c s t r i n g 类和c o m 对象是不兼容的,我们需要利用a p i 来转换c o m 对象和c + d 类型的数据。_ v a r i a n tt 和一b s t r t 就是这样两种c o m 对象,它们提供了些通 用的方法转换c o m 对象和c + + 类型的数据。 北京邮电大学硕士学位论文 第二章系统数据库的设计和访问 2 2 2 a d o 对象模型 a d o 对象模型定义了一组可编程的自动化对象,可用于v i s u a lb a s i c 、v i s u a l c + + 、j a v a 以及其他各种支持自动化特性的脚本语言。与一般的数据库接口相 比,a d o 可更好地用于网络环境,通过优化技术,它尽可能地降低网络流量; a d o 的另一个特性是使用简单,不仅因为它是一个面向高级用户的数据库接 口,更因为它使用了一组简化的接口用以处理各种数据源。 图2 - - 2a d o 的对象模型图 a d o 的对象模型如图2 2 所示。在a d o 对象模型中,主体对象只有三个: c o n n e c t i o n 、c o m m a n d 和r e c o r d s e t ,其它四个集合对象e r r o r s 、p r o p e r t i e s 、 p a r a m e t e r s 和f i e l d s 分别对应e r r o r 、p r o p e r t y 、p a r a m e t e r 和f i e l d 对象,整个 a d o 对象模型由这些对象组成。 一个典型的a d o 应用使用c o n n e c t i o n 对象建立与数据源的连接,然后用一 个c o m m a n d 对象给出对数据库操作的命令,比如查询或者更新数据等,而 r e c o r d s e t 用于对结果集数据进行维护或者浏览等操作。c o m m a n d 命令所使用 的命令语言与底层所对应的o l ed b 数据源有关,不同的数据源可以使用不同 的命令语言,对于关系型数据库,通常使用s q l 作为命令语言。 a d o 各个对象功能如下: c o n n e c t i o n 对象:代表与数据源之间的一个连接,a d o 的c o n n e c t i o n 对象 封装j - o l ed b 的数据源对象和会话对象。根据o l ed b 提供者的不同性能, c o n n e c t i o n 对象的特性也有所不同。c o n n e c t i o n 对象是a d o 的基本对象之一, 1 6 北京邮电大学硕士学位论文 第二章系统数据库的设计和访问 它独立1 i 所有其它的对象。如果我们要对数据库进行查询操作,既可以使用 e x e c u t e 方法,也可以使用c o m m a n d 对象。使用e x e c u t e 方法比较简便,但用 c o m m a n d 对象可以保存命令的信息,以便多次查询。 c o m m a n d 对象:代表一一个命令,可以通过其方法执行针对数据源的有关操 作,比如查询、修改等。c o m m a n d 对象执行时,既可以通过a c t i v e c o n n e c t i o n 属性指定相连的c o n n e c t i o n 对象,也可以独立于c o n n e c t i o n 对象,直接指定连 接串,即使连接串与c o n n e c t i o n 对象的连接串相同,c o m m a n d 对象仍然使用其 内部的数据源连接。 r e c o r d s e t 对象。r e c o r d s e t 对象代表一个表的记录集或者命令执行的结果, 在记录集中,总是有一个当前的记录。记录集是a d o 管理数据的基本对象, 所有的r e c o r d s e t 对象都按照行列方式的表状结构进行管理,每一行对应一个记 录限e c o r d ) ,每一列对应一个域( f i e l d ) 。r e c o r d s e t 对象也通过游标对记录进行访 问。r e c o r d s e t 对象是a d o 数据操作的核心,它既可以作为c o n n e c t i o n 对象或 c o m m a n d 对象执行特定方法的结果数据集,也可以独立于这两个对象而使用。 上面三个对象都包含一个p r o p e r t y 对象集合的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论