(机械制造及其自动化专业论文)服务机器人面部结构设计、表情识别与人机交互研究.pdf_第1页
(机械制造及其自动化专业论文)服务机器人面部结构设计、表情识别与人机交互研究.pdf_第2页
(机械制造及其自动化专业论文)服务机器人面部结构设计、表情识别与人机交互研究.pdf_第3页
(机械制造及其自动化专业论文)服务机器人面部结构设计、表情识别与人机交互研究.pdf_第4页
(机械制造及其自动化专业论文)服务机器人面部结构设计、表情识别与人机交互研究.pdf_第5页
已阅读5页,还剩76页未读 继续免费阅读

(机械制造及其自动化专业论文)服务机器人面部结构设计、表情识别与人机交互研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西南科技大学硕士研究生学位论文第1 页 摘要 目前,服务机器人在人机交互中起着越来越重要的作用,逐渐朝着智能 化、人性化、情感化和表情化的方向发展,同时服务机器人的研究也越来越 广泛。 论文设计了服务机器人的面部结构,选用模拟舵机作为驱动器,连杆机 构为主传动机构,该结构主要由眼部水平模块、眼部垂直模块、眼睑模块、 眉毛模块和下颌模块组成。根据人脸头部各部分的尺寸,建立了2 :3 比例的 人脸模型,合理、高效地利用头部空间。在p r o e 中进行三维建模,导入 a d a m s 中进行运动仿真,并对4 种基本表情进行仿真验证。 在m a t l a b 平台上,对采集的表情图像进行基于差分a a m ( a c t i v e a p p e a r a n c em o d e l ) 和支持向量机的人脸表情识别实验。通过差分a a m 来提 取人脸表情特征,然后利用支持向量机对提取的表情特征进行分类与识别。 实验结果表明,改进的算法提高了表情识别的准确率。 设计了基于a t m e g a l 6 与p c 机的人机交互系统,该系统包括a t m e g a l 6 底层控制系统模块、p c 机上层控制模块、人机界面,以及相关的硬件系统。 人机交互的过程如下:( 1 ) 将摄像头与p c 机相连接,通过v c 平台设计的人 机界面,实时地显示获取的图像;( 2 ) 获得的图像经p c 机表情识别处理,显 示人脸表情的识别结果;( 3 ) p c 机根据识别结果做出相应的判断,发送交互 表情指令给底层的a t m e g a l 6 控制系统模块;( 4 ) a t m e g a l 6 控制系统发送指令 给不同的驱动,机器人呈现相应的表情,最终实现了人机交互的目的。 关键词:服务机器人面部结构表情识别运动仿真 西南科技大学硕士研究生学位论文第1 i 页 a b s t r a c t c u r r e n t l y , s e r v i c er o b o t sh a v eb e e np l a y i n ga ni n c r e a s i n g l yi m p o r t a n tr o l e i nh u m a n c o m p u t e ri n t e r a c t i o n ,a n dg r a d u a l l yd e v e l o pt o w a r d sb e i n gi n t e l l i g e n t , h u m a n i z e d ,e m o t i o n a la n dr i c ho fe x p r e s s i o n s t - h er e s e a r c ho fs e r v i c er o b o t si s i n c r e a s i n g l yb e i n gu s e d t h et h e s i s d e s i g n st h ef a c i a l s t r u c t u r eo fas e r v i c er o b o t ,w h i c hu s e s s i m u l a t i n gr u d d e ra s t h ed r i v ea n du s e sl i n k a g e sa st h eb a s i ct r a n s m i s s i o n m e c h a n i s m t h ef a c i a ls t r u c t u r em a i n l yc o n t a i n sm o d u l e sf o rh o r i z o n t a la n d v e r t i c a le y er o t a t i o n a lm o v e m e n t ,t h ee y e l i dm o d u l e ,t h ee y e b r o w sm o d u l ea n d ja wm o d u l e f o rar e a s o n a b l ea n de f f i c i e n tu s eo ft h eh e a ds p a c e ,a c c o r d i n gt o t h es i z eo ft h ev a r i o u sf a c i a lp a r t s ,ah e a ds t r u c t u r ew i t ht h es i z eo f2 3o fa a v e r a g eh u m a nh e a di sd e s i g n e da n dm a n u f a c t u r e u s i n gt h ep r o es o f t w a r e ,a c o m p u t e rm o d e lf o rt h i sd e s i g ni s c o n s t r u c t e d t h er u n n i n gs i m u l a t i o no ft h e h e a ds t r u c t u r ei se x e c u t e di na d a m s ,a n df o u rb a s i ce x p r e s s i o n so ft h em o d e l a r ev a l i d a t e d t h ep h o t o g r a p h e dr e a lh u m a ne x p r e s s i o ni m a g e sa r eu s e di nt h ef a c i a l e x p r e s s i o nr e c o g n i t i o nb a s e do n t h ed i f f e r e n c ea c t i v ea p p e a r a n c em o d e l ( a a m ) a n ds u p p o r tv e c t o rm a c h i n e s ( s v m ) o nt h em a t l a bp l a t f o r m t h er e s e a r c h e x t r a c t st h ef a c i a le x p r e s s i o nf e a t u r e sf r o mt h ei m a g e st h r o u g ht h ed i f f e r e n t i a l a a m ,a n db a s e do nt h e s eo b t a i n e df e a t u r e s ,s t u d yo nt h ec l a s s i f i c a t i o na n d i d e n t i f i c a t i o no ff a c i a l e x p r e s s i o ni s c a r r i e do u tb y u s i n gt h e s v m t h e e x p e r i m e n tr e s u l t s s h o wt h a tt h ee x p r e s s i o n sr e c o g n i t i o na c c u r a c yh a sb e e n i m p r o v e d t h eh u m a n c o m p u t e ri n t e r a c t i o ns y s t e mi sd e s i g n e db a s e do na t m e g al6a n d p cs y s t e m i ti n c l u d e st h eb o t t o ml a y e rm o d u l eo fa t m e g a l6c o n t r o ls y s t e m ,t h e p cs y s t e m ,h u m a n - c o m p u t e ri n t e r f a c ea n dr e l a t e dh a r d w a r es y s t e m t h ep r o c e s s o fh u m a n - c o m p u t e ri n t e r a c t i o ns y s t e mi sa sf o l l o w s :( 1 ) t h ec a m e r ai sc o n n e c t e d w i t ht h ep cs y s t e m ,a n dh u m a n c o m p u t e ri n t e r f a c eo nt h ev cp l a t f o r mw i l l d i s p l a yt h ea c q u i r e di m a g e sf r o mc a m e r ar e a l t i m e l y ;( 2 ) p cs y s t e mt r e a t st h e i m a g e st or e c o g n i z ee x p r e s s i o n ,a n ds h o w st h er e c o g n i t i o nr e s u l t o ff a c i a l e x p r e s s i o n ;( 3 ) i tm a k e sc o r r e s p o n d i n gj u d g m e n t ,a n dt h e ns e n d si n t e r a c t i v e e x p r e s s i o ni n s t r u c t i o n st ot h eb o t t o ma t m e g a l6c o n t r o l s y s t e m ;( 4 ) t h e a t m e g a l6c o n t r o ls y s t e ms e n d sc o m m a n d st ot h ed i f f e r e n td r i v e s ,a n dt h ef a c i a l r o b o tp r e s e n t st h ec o r r e s p o n d i n ge x p r e s s i o n u l t i m a t e l yt h es y s t e ma c h i e v e st h e p u r p o s eo fh u m a n - c o m p u t e ri n t e r a c t i o n k e yw o rds :s e r v i c er o b o t s ;f a c i a l s t r u c t u r e ;e x p r e s s i o nr e c o g n i t i o n : h u m a n - c o m p u t e ri n t e r a c t i o n 西南科技大学硕士研究生学位论文第1 页 1 绪论 1 1 课题研究意义 目前,由于经济和科学技术的不断发展,尤其是计算机、信息、网络、 人工智能等技术的发展,对机器人的研究与应用,由智能机器人的工厂化正 逐步朝着其他领域拓展,如医疗、保健、家庭、娱乐等服务性行业领域的渗 透。人们对机器人的性能要求也从简单的机械运动上升到具有人性化、智能 化和人机交互功能的仿人机器人发展。尤其是随着人口呈现老龄化的特点, 劳动力的供应不足将是全世界共同面临的全球性问题。对于企业而言,世界 的发展潮流逐渐从劳动力密集型向技术密集型转变,产品质量得到很大程度 的保证,生产效率也得到提升。因此,研究和开发仿人服务机器人就变的非 常迫切了,尤其是在解决社会老龄化的家庭服务和医疗问题上,具有重大的 现实意义。 对于“服务机器人”,我们的设计要求是一它不仅能够完成所需求的工作, 还具有与人良好沟通的“仿人”功能,尤其是在一些特殊的场合能够与人很 好地协调作业,这就需要服务机器人与人之间能够进行有效的信息传递和情 感交流,即人机交互。心理学家在调查与实验中发现,人们在日常生活中进 行情感表达之时,言辞的使用比例仅仅占7 ,声调占3 8 ,剩下的5 5 都 是由肢体语言来实现的。所谓的肢体语言,就是人的身体所做的动作和人脸 表情。由此可知,人在进行情感表达过程中,肢体语言起着主要作用【l - 4 1 。因 此,“服务机器人”在不同领域的应用中,面部表情技术起着非常重要的作用, 是“服务机器人”的核心技术之一。 面部表情在人与人之间的交流中起着至关重要的作用,是因为它可以表 达言语所无法表达清楚的情感信息,促进人们之间可以更好地交流。换而言 之,面部表情展现了人在此刻的心情、情感、性格、意志等信息,使得人们 在交流时,接受者不仅能够接收言语表达的信息,还可以通过面部表情获取 言语之外的一些情感信息,使得接收的信息更加充分、圆满,方便双方进行 高效地沟通1 5j 。服务机器人的面部表情技术是一门跨学科、跨领域的综合技 术,从机械、电子、信息等机器人基础学科,到生物学、心理学和艺术学等 其他学科,是一个非常复杂的研究过程。到目前为止,国内外对机器人技术 的相关研究已有十多年的历史,取得了一定的成绩,但仍然存在许多问题, 尤其是在人机交互技术方面,成为世界许多学者的研究重点。服务机器人的 西南科技大学硕士研究生学位论文第2 页 面部表情技术的研究是时代发展的潮流与方向,对我们国家相关领域的技术 发展起着非常重要的意义。 1 2 面部机器人的国内外研究现状 近年来,服务机器人面部表情技术的研究成为智能机器人的研究热点之 一。随着国际上越来越多的研究机构和科学组织对服务机器人面部表情技术 的研究在逐渐地开展,获得了一定的研究成果,尤其在欧美以及日韩等一些 发达国家的许多大学和研究机构,已经开发了许多在技术上相对成熟的面部 表情机器人。但在我们国内,由于在此方面的开展和研究相对要晚许多,开 展相关技术研究的机构和大学较少,其中浙江大学、西北工业大学和哈尔滨 工业大学的相关技术相对领先。 1 2 1国外研究现状概述 ( 1 ) 美国汉森机器人技术公司在2 0 0 3 年,仿人机器人领域的开拓者一 d a v i dh a n s o n 博士创立了汉森机器人技术公司,主要从事仿人机器人社会 化和个性化方面相关技术的研究和制造。汉森机器人技术公司,通过仿人机 器人的研发与技术创新,成功开发出了多款高性能的仿人机器人,受到世人 的青睐,掀起一股研究机器人的热潮。世界多家科研机构及博物馆采购此类 机器人,用于学习研究与陈展。该公司随之也研发了几款技术不断成熟的表 情机器、人,如a n d y r o i d 、k b o t 、p k d 和j u l e s 。该公司的第一代仿人面部机 器人a n d y r o i d ,于2 0 0 2 年在美国人工智能促进联会上得以展示,随即得到 人们的关注。随即,在2 0 0 3 年汉森公司推出了第二代仿人面部机器人k b o t ( 见图1 1 ) ,并在当年的“美国科学促进联会”的年度会议上成为关注的焦 点,它具有各式各样变化的表情。与第一代的a n d y r o i d 机器人相比,k b o t 的表情已经达到了2 8 个,与此同时,k b o t 采用了汉森公司独创的f r u b b e r 人造皮肤及伺服电机,在控制方式上,k b o t 采用尼龙细线与表情控制点相 连接,通过控制尼龙细线的运动来实现各种表情。 在经过近两年的研究,在2 0 0 5 年汉森公司相继推出了第三代面部机器人 p k d ,它的设计思想来源于著名科幻小说家菲利普狄克( p h i l i pk d i c k ) 的生 平和他的小说。在同年的促进联会上,p k d 面部机器人被授予“i n t e l l i g e n t c o n v e r s a t i o n a lp o r t r a i t ”称号。汉森公司一如既往的致力于面部机器人的研制, 在2 0 0 8 年d a v i dh a n s o n 开发出了第四代面部机器人j u l e s ,j u l e s 机器人将语 西南科技大学硕士研究生学位论文第3 页 言与计算机视觉技术、艺术等技术相整合,实现了能够与人类进行简易的语 言交流【6 j 。因此,j u l e s 不仅具有丰富的仿人面部表情,还具有与人进行对话 与互动的功能。j u l e s 机器人在综合机器人对话的技术,并使自然语言与词网 自然地相结合,能够自然的使用c h a t b o t 工具来模仿人类的语言交流与对话 的智慧。同时,j u l e s 也具有计算机视觉功能,能够对人脸进行实时追踪与识 别,以更好地模仿人类语言或肢体上的互动,如眼睛随着说话对象移动而移 动等。 图1 - 1k - b o t 机器人和d a v i dh a n s o n f i g 1 - 1 k b o tr o b o ta n dd a v idh a n s o n ( 2 ) 日本早稻田大学在19 9 5 年,日本早稻田大学就开始研制w e 3 r 机 器人,主要是用于研究“平行双眼追踪三维空间的目标”问题。在1 9 9 6 年, 在w e 3 r 机器人的基础上,对亮度的适应性进行研究,研制出了w e 3 r i i 机器人,此机器人为了能够更好的模仿人类的表情,在外观上增加了眉毛、 嘴唇和下颌机构。在随之的几年里,w e 3 r 系列机器人的技术在不断的进步, 功能也越来越丰富,w e 3 r i v 机器人具有嗅觉和颜色处理功能,w e 3 r v 机 器人还拥有了语音识别系统功能。 经过多年在面部表情上的研究,在2 0 0 2 年,在以上三个系列机器人的基 础上还增加了腰部机构,研制出了w e 4 系统机器人,此机器人具有更小的 头部,与此同时,它还能够识别并分辨出8 种不同颜色的目标。此机器人更 具有仿人的效果,为了判别声音的方向,在耳部安装有电容式麦克风,由于 声音在三维空间内的强度是不同,因此强度最大的为声音的方向。此机器人 的嗅觉功能是通过四个半导体气体传感器来实现的,它可以快速地辨别出酒 精、氨水和香烟中的任何一种。此机器人的触觉是通过f s r s 传感器根据所 西南科技大学硕士研究生学位论文第4 页 受到的力的强度和方式的不同来辨别出敲、推和打三种形式的【7 1 l 】。 ( 3 ) 东京理工大学在1 9 9 2 年,东京理工大学已经开始实施研究机器人与 人相交流的课题,提出了a h i 的概念,即根据机器人对人类语言的认知和理 解程度,来做出相对应最优的反应,并以最合适的方式方法表现出来。在第 二年,东京理工大学研制出了第一代1 9 自由度的面部机器人,它能够比较好 地展现出6 种基本表情。但是它在尺寸和重量上比人的不相符,于是,在1 9 9 8 年,东京理工大学研制出了具有与人类头部尺寸更为相符的第二代面部机器 人,该机器人以直径仅有0 1 5 m m 、具有2 4 n 驱动力的s m a 为驱动,具有 与人类l :1 的尺寸,而且重量只有2 1 k g ,使得该面部机器人能够更快、更 好地模仿人类的表情。随着技术的进步,功能的丰富,在2 0 0 1 年,此机器人 不仅具有丰富的表情,而且还具有了语音功能,能够满足作为迎宾机器人的 要求。在2 0 0 3 年,东京理工大学研发出了第三代以气动作为驱动器的面部机 器人女秘书s a y a ,它能够模仿人类的各种行为,它通过控制皮肤下的1 8 个 不同的薄片来做出丰富的仿人表情,但是,它的表情举止还过于机械化,尤 其是“厌恶”表情和“悲伤”表情很相似【1 2 ”】。 ( 4 ) 日本筑波在2 0 0 9 年3 月1 6 日,日本产业技术综合研究生( a i s t ) 研制并发布了新型的“女性机器人”h r p 4 c ( 见图1 - 2 a ) ,该机器人不仅能够 演绎丰富的面部表情,而且还具有会话的功能。该机器人有着与日本女性相 似的身高、身体比例和体重,具有仿人的喜、怒、哀、乐和惊讶的表情。h r p 4 c b ) h r p 一4 c 跳舞功能 c ) h r p - 4 c 婚礼主持功能 图1 - 2h r p - 4 c 机器人 f ig 1 2 h r p 一4 cr o b o t 身高接近1 5 8 米,重约4 3 公斤,全身运动是通过3 0 个马达来实现的。与此 西南科技大学硕士研究生学位论文第5 页 同此,该机器人还具有与人类同台共舞的功能( 见图1 2 b ) 。同时,她还可以 作为婚礼主持人,主持新人的婚礼( 见图1 2 c ) 。 ( 5 ) 美国麻省理工学院辛西娅布雷齐尔( c y n t h i ab r e a z e a ) ,作为美国 麻省理工学院( m i t ) 领先世界一流的人工智能实验室的领导者,她与仿人 机器人的理解不一样,她有着自己的底线。她认为,机器人仿人技术的不断 发展,人机交互越来越普遍之时,我们可能会过分地依赖与他们一起生活, 这就会引起一定社会问题。在1 9 9 9 年,此实验室研制了类婴儿面部机器人 “k i s m e t ”( 见图1 3 ) ,它拥有1 5 个自由度组成。因此,它可以现实各式各 样的面部表情。它的耳朵有两个自由度,可以折叠或振作耳朵,每个眉毛可 以降低、上升或倾斜,每个眼睑可以独自打开或关闭,该机器人有四个唇部 执行机构,在口中的每个角落,可卷曲或向上向下,还有一个单自由度的颚, 通过这几个部分的协同作用,能够清晰地表达出相应的乐、怒、喜、哀等各 式各样的表情1 1 6 07 。 图卜3 k is m e t 面部机器人 f i g 1 3 k is m e tf a e i a ir o b o t 在2 0 0 1 年,m i t 人工智能实验室与s t a nw i n t o ns t u d i o 公司合作,共同 研制出了具有工程与艺术相结合的l e o n a r d o 机器人。两者间具有明显的分 工,m i t 人工智能实验室负责机器人的设计工作,而s t a nw i n t o ns t u d i o 为项 目提供赞助的同时,还负责艺术方面的设计。在2 0 0 2 年底,l e o n a r d o 机器 人终于与大家见面了,它全身拥有6 4 个自由度,而头部就具有2 4 个自由度, 拥有与人类似的面部表情。此机器人具有与人类进行语言和姿态交流的能力, 西南科技大学硕士研究生学位论文第6 页 同时,它能根据人的表情和动作做出相应的表情、与人进行握手、抖肩部、 扭屁股等人机交互的功能。l e o n a r d o 机器人可以通过视觉技术和听觉技术来 阅读按钮的作用,与人类共同合作完成一些简单的任务【18 1 。 1 2 2国内研究现状概述 我们国家在仿人面部机器人技术的研究和开发与国外相比,起步要晚的 多,尚处于起步的阶段,主要是国内的一些高校、研究院和部分企业对面部 机器人做了相关的研制。 从最早的1 9 9 6 年,哈尔滨工业大学研制出了“孙中山先生机器人”,此 机器人还不具有展现表情的功能。在2 0 0 4 年吴维国博士研制出了f & h r o b o t i 仿人面部表情机器人,该机器人具有8 个自由度,能够展现6 中基本的表 情。而机器人的面部表皮用的是电影制作材料,机器人面部共有1 2 个自由度, 其中头部机构有6 个自由度,面部表情机构有6 个自由度,头部每个部分的 尺寸都跟实际头部相近,可以展现8 种表情。为了更好地实现柔性的面部和 面部表情,面部表情的驱动机构采用结构简单和容量小的绳索驱动机构,但 由于非金属绳索磨损而容易断的问题,非金属绳索在上下滚珠弹簧中间随阻 力而滑动,这样可以减少绳索的摩擦和穿戴次数,达到实验的目的。在2 0 0 6 年,吴博士在f & h r o b o t i i 面部机器人控制系统的基础上,采用了知识和神 经网络的方法来对人脸面部表情进行识别。为了进一步研究仿人头部器官和 仿人面部表情的智能性、机器人与人进行交流的方便性等问题,在面部机器 人系统上增加了口形与语音协调处理和匹配功能。在人类面部肌肉解剖学的 原理和e k m a n 面部表情编码系统f a c s 的基础上,对口部动作驱动点进行了 设置,设计了相关了的口形驱动机构,开发了相关的控制方法,成功研制与 开发出了f & h r o b o t i i i 仿人头像机器人【l 弘2 引。该机器人具有视觉、听觉和丰 富的面部表情功能,并能够对语音进行准确的识别功能,能够实现实时地对 对话人的1 0 个短句做出相应的口形和语音响应。 中国硅像第一人,中国西安超人集团董事长一邹人倜,受到美国“超级 写实主义”的启发,开始研制具有真牙齿和真头发的仿人机器人“邹人倜”, 面部是由独特技术的硅材料制作而成。目前,在中国的1 3 0 多家博物馆、纪 念馆和旅游景区都陈列有西安超人雕塑研究院自主研发的仿真硅像。其中, 陈列于中国蜡像馆的高仿真表演机器人酣睡者,成千上万的参观者没有认 出它的真是身份,都把它当作了真人。在不久前的1 1 月6 日,美国时代 周刊的一期上将其列入了“2 0 0 6 年最佳发明”。此外,西安超人机器人科技 西南科技大学硕士研究生学位论文第7 页 育先公司研发出了另一款具有高仿真的迎宾机器人“索芙亚”,该机器人不仅 具有眼睛动作功能,还可以根据嘴部的上下张合运动来实现不同的发音,并 且能够与顾客进行适当的语音互动。 1 3研究内容、研究思路与体系结构 ( 1 ) 主要研究内容 1 ) 服务机器人人脸识别算法及其改进算法研究与支持向量机算法融合 ( 差分a a m + 支持向量机算法) 2 ) 服务机器人面部结构设计与运动仿真 3 ) 基于差分a a m 和支持向量机的面部表情识别实验 4 ) 面部机器人人机交互系统的研究 研究以服务机器人面部结构,以及差分a a m 和支持向量机的面部表情 识别为基础,以实现人机交互为目的,研究并设计了服务机器人面部结构, 深入研究a a m 及其改进算法、面部表情结构的运动仿真和人机交互系统设 计( 见图1 4 ) 。 图卜4研究方法 f i g 1 4 r e s e a r c hm e t h o d ( 2 ) 研究思路 第一步,在p r o e 3 0 软件上进行服务机器人面部结构设计,搭建面部结 西南科技大学硕士研究生学位论文第8 页 构平台,通过m e c h p r 0 2 0 0 5 设定刚体和运动副,导入a d a m s 2 0 0 7 r 3 中施加 外力和约束进行运动仿真;第二步,研究a a m 人脸表情模型提取算法,并 对算法进行改进,结合支持向量机算法进行表情的分类识别实验;第三步, 研究a t m e g a l 6 与p c 机的人机交互系统,建立人机交互界面,以面部机器人 上的摄像头获取人脸表情图像,p c 机对人脸表情进行识别,并做出相应的服 务指令,发送给底层的a t m e g a l 6 底层控制系统,协同控制面部机器人上的 驱动器,最终实现机器人做出相应的服务表情。 ( 3 ) 论文结构 第一章绪论简单介绍服务面部机器人的研究意义、国内外状况、研究内 容及研究思路等。 第二章阐述了理论基础,包括主动外观模型算法、支持向量机算法、主 动外观模型改进算法及与支持向量机融合算法。 论文第三、四、五章是本文的重点。第三章研究了服务机器人的面部结 构要求与设计,并在a d a m s 上进行了相应的运动仿真实验。第四章深入研 究了基于差分a a m 和支持向量机的人脸表情识别的程序设计,并进行了相 应的表情识别实验。第五章研究了基于a t m e g a l 6 与p c 机的人机交互系统。 1 4 本章小结 本章概括的介绍了面部机器人的国内外现状。另外,阐述了论文的课题 意义、研究内容及研究思路,归纳了论文的主要研究内容,并简要叙述了论 文结构。 西南科技大学硕士研究生学位论文第9 页 2 算法基础及其改进算法 2 1主动外观模型算法 主动外观模型( a a m ) 是一种基于统计模型的面部模型特征提取方法。 该统计外观模型结合了形状变异模型和纹理变异模型两部分,所谓的纹理, 就是在图像块中颜色或强度的样式。为了建立模型,我们需要在每张图像上 标注了相关点的训练集,因为我们需要用标注点集来定义主要特征【2 3 1 。然后 通过p r o c r u s t e s 分析来对齐点集( 记为向量x ) 和建立统计形状模型,对每个 训练图像进行变形获得匹配点的平均形状,得到与形状无关的纹理信息【2 4 1 。 ( 1 ) a a m a a m 的形状是由定点位置的网格决定的,而这些网格通常是三角网格。 我们定义a a m 的形状s 为所标注网格顶点v 的坐标: s = ( x l ,y l ,x 2 ,y 2 ,x ,y ,) ( 2 1 ) a a m 的形状是线性变化的,即形状s 可以由基本形状与门个形状向量 s ;的线性结合之和来表示: n s = s o + 乏:p ,量 ( 2 - 2 ) i 1 其中系数p i 为形状参数。由于我们可以方便的进行线性重参数化,我们假设 向量s i 是正交的【2 5 j 。 a a m 的纹理是在基本网格内决定的,s 。可以根据基本网格内的像 素集x = ( x ,y ) 丁来表示。a a m 的纹理是由像素x 定义的图像a ( x ) 。纹理 a ( x ) 可以由基本纹理如( x ) 与m 个纹理图像彳,( x ) 的线性结合之和来表示: 朋 彳( x ) = a o ( x ) + 么f ( x ) v x s o ( 2 - 3 ) i = 1 其中系数a 为纹理参数。同理,我们也可以假设向量s ,是正交的。 ( 2 ) 拟合a a m 在拟合中,图像,( x ) 和模型实例m ( 形( x ;p ) ) = 彳 ) 必须是相似的【2 6 1 。一 般地,我们想通过i ( x ) 和m ( 彤( z ;p ) ) = a ( x ) 的错误最小化来实现最优标准。如 果x ,那么输入图像,的像素为w ( x ;p ) 。在像素x 中,a a m 的纹理为 彳( x ) = a o ( x ) + :。 么( x 。) ,而在像素形( x ;p ) 中,输入图像的强度为,( 形( x ;p ) ) 。 因此,我们可以最小化两个数量之差的平方和,即 西南科技大学硕士研究生学位论文第1 0 页 荟 彳。c x ,+ 喜丑么jc x ,一,c 形c x ;p , 2 c 2 - 4 , 工e l i = l j 用 假定e ( x ) = 厶( x ) + 丑4 ( x ) 一,( 形( x ;p ) ) 为错误图像。在所有算法中,假 i = l 设在错误图像e ( x ) 和形状纹理参数叠加性增加之间有一个常数线性关系,即 卸。= r 。( x ) e ( x ) ( 2 - 5 ) x e $ 0 从。= z s ,( x ) e ( x ) ( 2 6 ) 其中r ,( x ) 和s t ( x ) 是由基本网格s 。所定义的常量图像。 ( 3 ) 有效的梯度下降图像对齐 由于没有任何有效地算法来解决卸和升级p 卜p + 卸参数。因此,可能 的升级p 参数的方法为: w ( x ;p ) 卜w ;p ) 。形( x ;卸) ( 2 7 ) 通过扩展这合成方法,我们能够为a a m 获得有效的梯度下降算法。下 面主要介绍反向合成图像对齐算法。反向合成算法的模板和实例图像的角色 是相反的,它是关于模板a ( x ) 的估计。反向合成算法最小化可以定义为如下: 【,( ( x ;p ) ) 一心( 形( x ;卸) ) 】2 ( 2 8 ) 关于卸以及其变换升级使用: w ( x ;p ) 卜w ( x ;p ) 。形( 工;卸) 。1 ( 2 - 9 ) 对方程( 2 9 ) 进行泰勒展开: i ( w ( x ;p ) - a ( w ( x ;o ) ) - v a 。o 印wa v ) ( 2 - 1 0 ) 再次假定w ( x ;o ) 为特定的变换,且其值为0 ,那么对这个最小平方的问 题的解答是: 卸圳莓i 刳咿砌卅私) 】 ( 2 _ 1 1 ) 其中h 是把4 代替j 的h e s s i a n 矩阵: 西南科技大学硕士研究生学位论文第1 1 页 日= 水甜v a 。i o w 陋 由于i o w 和v a 。是常量,故w 。罢和日都可以提前计算而且只需算一 出a n s 为c 扣形,既其中形= 鼍,争o p 肚詈o p ; o qo po qo q 篡裳瓣二+ 4 ( 6 , 踢c 班阻詈一喜陲纵小w 。詈卜, ,钏,川“ s t e p 6 :计算 观( x ) 口( ( ( x ;p ) ;g ) ) 一厶 ) 】 i = 1 ,n + 4 x e s 0 s t e p 7 :计算卸和g 西南科技大学硕士研究生学位论文第1 2 页 妒旷1 舟翁啪砝g ) ) 制】 g 坩1 xk l 鲫o qa 形( 蝴g ) ) _ 删】 ( 2 - 1 7 ) ( 2 - 1 8 ) - = 4 ( x ) 【,( ( 形( x ;p ) ;g ) ) 一厶( 工) 】 ( 2 1 9 ) j e 由于步骤s t e p 3 、s t e p 4 、s t e p 5 可以预先计算,因此可以大大提高算法 的计算效率。 2 2 支持向量回归机 2 2 1支持向量机分类机 由于以往的方法在小样本、高维模式识别、非线性和局部极小等问题上, 不能得到有效地解决。c o r i n n ac o r t e s 和v a p n i k 等在1 9 9 5 年提出了支持向量 机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 机器学习理论,支持向量机是一种基于结构 风险最小化和v c 维的机器学习的数据挖掘新方法,它与以往的方法相比, 在理论和实践上都存在明显的优势【28 1 。 ( 1 ) 在线性可分的情况下,假设存在一个超平面( w ,x ) + b = 0 ,使得 y ,t ( w ,x ,) + 6 1 ,i = 1 , 2 ,y f = 1( 2 2 0 ) 分类间隔为酾2 ,要使分类间隔最大,即等价于譬的最小化,于是求 变量w 和b 的最优问题的解: , 睁扣| :、 ( 2 - 2 1 ) s t y 。( ( w ,x 。) 十b ) 豺,i _ ,1 、 由于所分离的超平面不止一个,但是最优的只有其一,此时,力白l 为最 西南科技大学硕士研究生学位论文第13 页 大值。因此,l 卅i 的大小决定着其泛化能力。 据此可以构造如下算法: 假设已知训练样本集为t = ( x ,y 。) ,( x 。,y :) ,( x 。,y 。) ) ( 尺d y ) ”其中 x f r 4 ,y f y = 1 ,- 1 ,f = 1 , 2 ,z ; 构造并求取凸二次规划( 2 2 1 ) ,求得w ,b ; 构造最优分类面w + x + b = 0 ,并求得决策函数f ( x ) = s g n ( w x + b ) 直接求解最优化问题比较困难,因此把原始问题转换为它的对偶问题,通过 对偶问题来求解,因此引入了l a g r a n g e 函数 三( w ,b ,口) = 去4w | 1 2 一a 。( y ,( ( w x ,) + 6 ) 一1 ) ( 2 2 2 ) 二 i = 1 其中口= ( a l ,a 2 ,仅。) 为l a g r a n g e 乘子,于是最优化问题可以转化为对 偶问题 , 一 毋扣专;y ,y ,( x 。x j ) 伐i q ,手u 。 s t f l y 。0 【= 0 ( 2 - 2 3 ) 1 0 【劾i - j ,2 ,r l 对线性可分来说,最大间隔法中的凸二次二次规划问题( 2 2 1 ) 的解唯一。 证明如下: 根据凸函数定理:若民( x 。,x :) 分别是变量x 1 和x :的变量的严格凸函数核 凸函数,则该问题对x ,的解唯一。设它有两个最优解时( 嵋,6 7 ) 和( w ;,) ,问 题关于w 的解唯一,即嵋= w ;。 根据公式可以把两个最优解( w :,6 i ) 和( w ;,k ) 分别写为( w + ,6 i ) 和( w ,虻) 根据定理:对线性可分问题来说,最大间隔法中的凸二次规划问题的解存在, 而且满足3 个条件,根据第二个条件可知存在歹,j 1 1 ,oo ) 使得y ,= y ,= 1 r ( w 。x ) + 坼= 1 ( w 。x j ,) + 叫0 1 ( 2 - 2 4 ) ( 2 - 2 5 ) ( 2 2 6 ) 西南科技大学硕士研究生学位论文第1 4 页 ( w x ,) + 咙1( 2 - 2 7 ) 假设o t = ? ,a ;,口:) 是公式( 4 4 2 ) 的任意解,则可以计算出唯一解 ( w ,b + ) 。 w = a t y ,t ( 2 - 2 8 ) b + = y j 一a ? y ,( x ,y j ) ( 2 - 2 9 ) 构造分类面( w x ) + 6 = 0 ,由此可以得出最优分类函数为: 厂( x ) = s g n ( w x ) + 6 ) = s 印 a ? y ,( x ,x ) + 6 ( 2 - 3 0 ) r 一1 l i = i j 上式中s g n o 是符号函数,符号函数满足: s g n ( x ,= 。:二三三 c 2 - 3 , ( 2 ) 对于线性不可分,通常是在条件公式( 2 2 1 ) 中增加一个松弛变量 毒,0 ,f = 1 ,2 ,n ,此时条件公式变为: y j ( ( w x f ) + b ) 1 一考i ,f = 1 , 2 ,行( 2 3 2 ) 此时公式( 2 2 1 ) 变为: 啦扣吾o w 犷+ c 蒡亏; s t y j 【( wx 。) + b 亏。,i = j ,n( 2 - 3 3 ) 号劾, i = 1 , 2 ,n 其中c o 是惩罚因子。前面得到的最优分类函数为公式( 2 3 0 ) ,从此公式 可以看出,该式是分类样本与训练样本的内积运算,由此可以得出一个结论: 对于非线性问题,只要解决了这个空间中的内积运算,就可实现把非线性可 分问题转换为线性可。当我们把非线性可分的问题映射到高维空间,虽然变 的线性可分,但是很难找到最优分类面。通常是通过核函数来解决这一问题。 核是一个函数k ,对所有x 。,x ,x ,满足 k ( x ,工,) = ( x ,) 妒( x ,) ( 2 - 3 4 ) 这里西是从输入空间x 到特征空间f 的映射。根据泛函数的理论,当核 西南科技大学硕士研究生学位论文第1 5 页 函数k ( x ,x ) 满足m e r c e r 条件,它就对应某一变换空间中的内积,所以,选 择合适的核函数k ( x ,x ,) 使得非线性可分问题变的线性可分,同时计算复杂 程度还没有增加2 9 1 。此时相应的最优分类函数变为 r 竹、 ( x ) = s g n ( w x ) + 6 ) = s 盟 口? y ,k ( x ,x ) + 6 ( 2 3 5 ) li = lj ( 3 ) 核函数类型。目前核函数流行核函数的主要有【3 0 】: 线性核函数( 1 i n e a rk e r n e l ) : k ( x ,一) = ( x ) ( 2 - 3 6 ) 多项式核函数( p o l y n o m i a lk e r n e l ) :其中d 为参数。 k ( x ,x f ) = ( ( x x f ) + 1 ) 4( 2 - 3 7 ) 径向基核函数( r a d i c a lb a s i sf u n c t i o n ,r b f ) :其中) ,为参数。 k ( x ,x f ) = e x p ( 一) ,l x x ,l ) ( 2 - 3 8 ) s i g m o i d 核函数( s i g m o i dt a n h ) :其中s ,c 为参数。 k ( x ,x j ) = t a n h ( s ( x x ,) + c )( 2 3 9 ) 2 2 2 支持向量回归机 支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 是解决数据挖掘、分类和回归 估计等的高效方法。关于支持向量机在回归预测方面的研究也日渐增多且不 断深入【3 1 1 。 ( 1 ) 线性支持向量回归机 基于线性s 一不敏感损失函数的线性s 一支持向量回归机引入松弛因子 考p = ( 考。, i ,岛,爵) r 及惩罚参数c 。 原始最优化问题 , 嘴割w + c 噩+ 毛:) ( 2 - 4 0 ) 约束条件 ( w x 。) + b 一y j s + 考f ,f = l ,2 , y f 一【( w x f ) + b 】s + 告j ,i = 1 , 2 ,z 考j + 0 ,f _ 1 , 2 , 式中,( 幸) 是表示向量与有“ 与无“两种情况的简单记号。为推算 西南科技大学硕士研究生学位论文第1 6 页 出式( 2 - 4 0 ) 的对偶问题,引入拉格朗日( l a g r a n g e ) 函1 数: ( w ,6 ,考n ,a ( ) ,7 7 ) :丢l l w l f 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论