




已阅读5页,还剩119页未读, 继续免费阅读
(计算机应用技术专业论文)bayesian网及其在图像分析中的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要本文对b a y e s i a n 网的国内外研究现状作了深入的分析,对其构造方法以及变异b a y e s i a n 网进行了系统的理论研究。此外,还研究了该网络及其变异模型在图像分析中的应用,包括文本与人脸等目标的检测与定位。全文主要内容如下:1 介绍b a y e s i a n 网原理以及常用的推理算法。介绍了b a y e s i a n 网常用的消息传递推理算法、予团树传播推理算法以及基于消元的推理算法等,并给出了几种常用推理算法的推理过程。2 通过分析用遗传算法对b a y e s i a n 网进行结构学习时存在的缺点,提出了根据混合遗传算法进行结构学习的新方法;在分析b a y e s i a n 网等价结构的基础上提出了r u d i m e n t a r y 结构等价性定理,并将该定理应用于对b a y e s i a n 网的结构优化中:推导了根据现有数据库和网络结构学习b a y e s i a n 网参数表的过程:介绍了由基于模型的诊断系统向b a y e s i a n 网转化的方法,拓展了b a y e s i a n 网的应用范围。3 通过对几种常见图模型的分析,以及根据因果独立性,提出了b a y e s i a n 网的变异模型。新模型对数据之间关系的描述更准确,同时也简化了条件概率表的规模。通过对学生成绩b a y e s i a n 网及其变异模型的分析,验证了变异模型的有效性。4 图像中的场景文本由于受多种条件的影响,在文本检测中,其位置表现出不确定性。提出了用于文本检测与定位的变异直方图,并将其应用于图像中的文本特征提取。通过分析各种特征之间的不确定性关系,以及对这些不确定性关系进行处理,建立了文本检测b a y e s i a n 网,得到了有效的检测与定位结果。5 人脸检测与定位的难点是人脸在复杂背景以及不同成像条件下包含大量不确定性。针对这一现象,提出了肩线检测b a y e s i a n 网以确定脸部区域:又提出了分级阈值分割方法,并根据该方法对脸部区域的分割结果建立变异b a y e s i a n 网确定眼睛位置。对b i o l d 图像数据库的检测结果表明了该方法的实用性。关键词:b a y e s i a n 网;图像分析;文本检测;人脸检测;i i台肥工业大学博士论文a b s t r a c ta f t e rt h eo v e r v i e wo nr e s e a r c hr e s u l t sa b o u tb a y e s i a nn e t w o r k si nb o t hd e v e l o p e dc o u n t r i e sa n do u rc o u n t r y ,t h i sd i s s e r t a t i o nr e s e a r c h e ss y s t e m a t i c a l l yo nt h ec o n s t r u c t i o na n dl e a r n i n go fb a y e s i a nn e t w o r k sa sw e l la st h ev a r i a n tm o d e l t e x td e t e c t i o na n df a c ed e t e c t i o na r et h et w oa p p l i c a t i o n so fo b j e c t i o na n a l y s i sb yb a y e s i a nn e t w o r k s t h em a i nc o n t e n t sa n dn o v e lp a r t so ft h i st h e s i sa r ea sf o l l o w s :1 t h ef u n d a m e n t a lt h e o r yo fb a y e s i a nn e t w o r k sa n df r e q u e n t l yu s e di n f e r e n c ea l g o r i t h m sa r ei n t r o d u c e d b o 也血ea c c u r a t ea n da p p r o x i m a t ei n f e r e n c ea l g o r i t h m ss u c ha sm e s s a g ep a s s i n ga l g o r i t h m ,c l i q u et r e ep r o p a g a t i o na l g o r i t h m ,v a r i a b l ee l i m i n a t i o na l g o r i t h ma n ds oo na r es u m m a r i z e d ,a n da ne x p e r i m e n ti su s e dt ov e r i f yt h ea v a i l a b i l i t yo fs o m ef r e q u e n tu s e da l g o r i t h m s 2 s t r u c t u r el e a r n i n ga l g o r i t h mo fb a y e s i a nn e t w o r kb yh y b r i dg e n e t i ca l g o r i t h mi sp r e s e n t e da f t e rt h ed r a w b a c ko fg e n e t i ca l g o r i t h m b a s e dl e a r n i n ga l g o r i t h m si sa n a l y z e d r u d i m e n t a r ye q u i v a l e n c et h e o r yf o rs t r u c t u r el e a r n i n gi sp r e s e n t e da f t e rt h ee q u i v a l e n c es t r u c t u r eo fb a y e s i a nn e t w o r ki ss t u d i e d a n da l g o r i t h mt op a r a m e t e rl e a r n i n gi sa l s oj n d u c e d f i n a l l yt h ep r o c e s so ft r a n s f e r r i n gf r o mm o d e l b a s e dg r a p h i c a lm o d e lt ob a y e s i a nn e t w o r ki si n t r o d u c e d 3 t h ev a r i a n tm o d e lo ft h eb a y e s i a nn e t w o r ki sp r e s e n t e da c c o r d i n gt oc a u s a li n d e p e n d e n c ea f t e rs o m ef r e q u e n tu s e dg r a p h i c a lm o d e l sa r ea n a l y z e d t h en e wm o d e lh a ss i m p l i f i e dt h es i z eo ft h ep r o b a b i l i t yt a b l e a n dt h ea v a i l a b i l i t yo ft h i sn e wm o d e li sv e r i f i e db ya n a l y z i n gt h ep r o b a b i l i t yt a b l eo ft h eb a y e s i a nn e t w o r ko fs t u d e n ts c o r e s 4 s c e n et e x ti ni m a g e sc o n t a i n sm a n yu n c e r t a i n t yf a c t o r sb e c a u s eo fv a r i o u sr e a s o n s t h ev a r i a n tg r a y s c a l eh i s t o g r a mf o rt e x td e t e c t i o na n dl o c a t i o ni sp r e s e n t e da n da p p l i e dt ot h ef e a t u r ee x t r a c t i o n o ft e x ti ni m a g e s t h e nt h eb a y e s i a nn e t w o r ki sc o n s t r u c t e dt of u s et h e s ef e a t u r e sa c c o r d i n gt ot h ea n a l y s i so ft h eu n c e r t a i nr e l a t i o n s h i pb e t w e e nt h e m 。a n de x p e r i m e n t a lr e s u l t sh a v es h o w nt h ea v a i l a b i l i t yo ft h es o l u t i o n 5 t h ed i f f i c u l t yo f h u m a nf a c ed e t e c t i o ni nj m a g e si sc a u s e db yt h em a n yu n c e r t a i n t yf a c t o r s s h o u l d e rl i n e sd e t e c t i o n b a s e db a y e s i a nn e t w o r ki sc o n s t r u c t e dt od e t e r m i n et h el o c a t i o n o f f a c er e g i o n a n dm u l t i m r e s h o l da l g o r i t h mi su s e dt oc o n s t r u c tt h ev a r i a n tb a y e s i a nn e t w o r kf o rh u m a ne y e sd e t e c t i o ni nt h ef a c er e g i o n e x p e r i m e n t a lr e s u l t ss h o wt h a tt h es o l u t i o ni ss u i t a b l ef o rt h ed e t e c t i o no fh u m a nf a c ei m a g e si nc o m p l i c a t eb a c k g r o u n d k e y w o r d s :b a y e s i a nn e t w o r k ;i m a g ea n a l y s i s :t e x td e t e c t i o n ;f a c ed e t e c t i o n合肥工业大学本论文经替辩委煲会全体委员审查,确认符合合船工鼗大学博士学位论文质量要求。答辩委员会签名委员:否氓乙矽次步枷喈衣劳铈i 够彬乙庄镇泉李津生戴蓓蓓方廷健李晓辉高隽粱华国同行评议专家名单教授、博导教授、博导教授、博导研究员、博导教授教授、博导教授、博导中国科学技术大学电子科学与技术系中国科学技术大学信息学院中国科学技术大学电子科学与技术系中国科学院合肥智能研究所安徽大学电子学院合肥工业大学计算机与信息学院合肥工业大学计算机与信息学院同行评阅专家名单陈军宁教授、博导安徽大学电子科学与技术学院蒋建国教授、博导合肥工业大学计算机与信息学院刘晓平教授、博导合肥工业大学计算机与信息学院答辩委员会名单方廷健研究员、博导庄镇泉教授、博导蒋建国教授、博导高隽教授、博导刘晓平教授、博导中国科学院合肥智能研究所中国科学技术大学电子科学与技术系合肥工业大学计算机与信息学院、合肥工业大学计算机与信息学院合肥工业大学计算机与信息学院答辩委员会主席方廷健研究员、博导中国科学院合肥智能研究所表格靖单i表2 1表2 2表3 1表4 1表4 2表4 3表4 4表4 5表4 6表4 7表4 8表4 9表4 1 0表5 1表5 2表6 1表6 2表6 3表6 4表格清单用于b a y e s i a n 网近似推理的假设分布和统计函数2 0经济状况b a y e s i a n 网的模拟样本2 3图3 3 中无向边取不同方向时的描述长度3 5结点蜀的概率表5 5结点噩的概率表5 5结点墨关于蜀的条件概率表5 5结点蜀关于蜀与岛的条件概率表5 6结点托关于玛与五的条件概率表5 6结点咒关于忍的条件概率表5 6结点关于墨的条件概率表5 6结点墨关于蜀与弼的条件概率表5 7中间结点如关于蜀与噩,中间结点 关于局的条件概率表5 7n o i s y - o r 扩展模型中结点墨的条件概率表5 7文本检测b a y e s i a n 网的结点意义7 4文本检测b a y e s i a n 网的概率参数表7 5精选肩线对b a y e s i a n 网的结点意义8 9精选肩线对b a y e s i a n 网的概率参数表9 0确定双眼与口位置的变异b a y e s i a n 网结点意义9 6确定眼睛位置的变异b a y e s i a n 网概率参数表9 7插图清单i x插图清单图2 t 判断病毒邮件的b a y e s i a n 网l o图2 2 常用b a y e s i a n 髓推理算法分类1 4图2 3 单连通与多连通b a y e s i a n 网1 4图2 4 消息和 消息的传递过程1 6图2 5 由b a y e s i a n 网向子团邻接树转化示例1 7图2 6 扩展邻接树及其消元法1 8图2 7 关于经济状况的b a y e s i a n 网2 1图3 1 对a l a r m 数据库进行结构学习得到的结果2 9图3 。2 学生成绩b a y e s i a n 网及其r u d i m e n t a r y 缎构3 l图3 3r u d i m e n t a r y 结构等价定理对a l a r m 数据库b a y e s i a n 网的优化3 5匿3 。4b a y e s i a n 网关予而及其父结点的一帮分3 7图3 5 系统模型3 9图3 6 图3 5 对应的b a y e s i a n 潮4 1图4 1 图像的链图4 6图4 2 各种圈模型之阁的关系4 6图4 。3b a y e s i a n 网与n o i s y o r 模型的比较4 8图4 3n o i s y - o r 模型举例4 7图4 4n o i s y - o r 模裂的侧子4 8图4 5b a y e s i a n 网与n o i s y o r 模型的比较5 0圈4 6 因果独立示蜊5 l图4 7 因果独立性5 l图4 8 变异b a y e s i a n 阏关于并及其父绪点的部分5 4图4 9b a y e s i a n 网及其变异模型5 5图4 。l o 学生成绩b a y e s i a n 硝及其变异模型5 5图5 1 文本检测方法分类6 0图5 。2 灰度豢方霉与颜色壹方圈6 4图5 3 变异赢方图6 6图5 4 子銎像的变异壹方i 塑( v g h o ) ”6 7图5 5v g h 8 中的凹豁特征6 8图5 6 数字图像及其予图像的变异童方图7 2x合肥工业大学博士论文图5 7 岔文本的图像及相应的v g h 8 7 3图5 。8 文本检测b a y e s i a n 网的结构7 5图5 9t d b n 推理过程示例7 6图5 1 0 基于b a y e s i a n 网的文本检测算法流程图7 7图5 1 1 判断v g h c 的b a y e s i a n 网7 8图5 1 2 本节方法的两个实验结果7 8圈5 1 3 文献 1 0 6 方法的两个实验结梁7 8图5 1 4 更多文本检测实验结粟7 9图5 1 5 部分中文文本检测结果8 0图5 1 6 部分不能准确检测的图像8 0图6 1 人脸识别系统的总体结构8 l图6 2 基于b a y e s i a n 网人脸检测与定位方法8 5图6 3 直方图均衡化前后的边缘图比较8 6图6 。4 四种算子的边缘检测效柴b 较- 8 7图8 5 精选肩线对b a y e s i a n 网的结构8 9图6 6 根据肩线对定位入脸区域9 l图6 7 单阈值分割与分级阈值分割效果比较9 3图6 8 脸部区域的块划分j 9 5图6 9 黻眼与口霹能组合的凡俺关系9 5图6 1 0 检测定位日匿睛位置的变异b a y e s i a n 网结构9 6图6 1 1 对b i o l d 人脸图像的部分正确检测结巢9 8图6 1 2 对b i o i d 未能实现正确捻测的部分图像9 9独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得盒8 1 工些太堂或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:哆多奇念签字日期:瓣1 月f 牛日学位论文版权使用授权书本学位论文作者完全了解主围里查盟王! ! 堂量遂2 有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘。允许论文被查阅和借阅。本人授权主亘堂丕翅刊! 盘查遂2 鱼壬盘查主可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、索引或扫描筲复制手段保存、汇编学位论文。( 保密的学位论文住解密后适用本授权书)学位论文作者签名:鸣奇核签字日期:讪巧年1 月j 牛日学位论文作者毕业后去向工作单位:通信地址:导师签名鹦函孵签字日期皖厂军月尹日电话邮编致谢衷心感谢我的导师张佑嫩教授几年来给予我慈父般的关怀,举断从学业上、生活上关心我,为我创造良好的工作和学习环境,使我猩理论和实践两个方面都得到了嶷好的锻炼。可以说,如聚没有张老师几年的言传搿教,本论文怒不可能完成的。张老簿严谨熬渗学态度、李塞渊蘑夔翔谈、深厚戆学零葫瘫、戳及诲久不缮豹黪者风范都将使我受益终身。程此向张老师袭承最衷心的感谢!感谢计算桃学院的高隽教授、檀结庆教授、刘晓平教授、袁兆山教授、王浩教授、籁学锈教授等豹热心撵导秘蘩韵。恁稠熬学零愚憨嚣本文磅究工露怒罄卡分重要瓣馋用。感谢研究嫩院的朱红老炳蛆及其它备位老师,也感谢计算机学院的王新生老师、豫耱老瑟等在鞠常事务孛餐袄豹蘩动。感谢中科院上海应用物逍研究所生物特征识别缎的蒋大真研究员、李勇平研究煲、汪勇旭勘避研究员在合作研究期间提供的帮助。感谢意大测罗马c o n s o r z i or i c e r c h e 的r i c c a r d oa n t o n i n i 教授、瑞典斯德哥尔麟皇家工学院的y n g v es u n d b l a d 教授、克罗地征斯普利特大学的i v i c am i t r o v i cj r 教授为我参加在克罗她照举办的欧洲第三属c o n v i v i o 网培训班提供经费和帮助。感谢汪荣爨老师几年来给予我兄长般盼关怀,为我的论文提出了很多宝贵的意见。感谢胡敏、偶春生、王焕宝、周广秫、李震、欧阳名三、吴永虑、贾志海、梁锡坤、骆祥峰、郏淑丽、江巨浪、薛峰、王伟、王德兴、姚宏亮等同攀。在与他们的交溅秘章垂论孛,产生了一定囊懋憋,霹论文夔臻究亵宠戒越着重要攫避箨震。感谢醺嫩李寿兵、柯媳贵、张淮声、方贤勇、镀隧、高月芳、郑飞、贾伟、李明、周庆松、顾红飞、孙光激、屠菁、刘俊娜等平时给予的帮助。裘心惑落我熬妻子袁慧辫我懿全力支持。将此文献给我的父母!彭誊松2 0 馘年1 2 胄子逸夫秘技楼第一章绪论第一章绪论1 1 人工智能中的概率方法不确定性信息和知识普遍存在于现实世界,对其进行有效的获取、表示、推理和解释都是人工智能领域的重要研究课题。对该问题的研究始于二十世纪五、六十年代的医疗信息处理,当时普遍认为概率理论是最合适的工具,出现了许多概率型智能系统。概率论使用概率分布处理随机问题。但是,对于n 元随机向量来说,若每个分量有m 个可能的取值,则共需要确定一1 个概率,这是n p 难题。通过直接对每个基本事件计算或指派概率来确定联合概率分布是不现实的。因此,这些系统使用一种条件独立性假设( 即假定在己知结论状态的情况下,各个条件相互独立) ,来减小确定联合概率分布的复杂度,并使用贝叶斯反演公式进行推理,取得了一定的成功。到了七十年代,人们发现这种条件独立性假设比较苛刻,不符合很多实际情况,随着随机变量个数的增加,推理的效率显著降低。从七十年代中期到八十年代中期,很多人逐渐放弃了基于联合概率分布的知识表示和推理模型,通过模拟人的思维方式提出了许多新的基于启发式的知识表示和推理方法,其中确信因子模型和d s 证据理论最具有代表性,成为概率型智能系统的主流模型。自二十世纪八十年代开始,b a y e s i a n 网逐渐引起了人们的重视。与确信因子模型和d s 证据理论相比,b a y e s i a n 网具有明显的优势。下面对b a y e s i a n 网和确信因子模型与d s 证据理论进行比较分析。确信因子模型对产生式规则赋以权重,这种权重称为确信因子,可表示规则中的条件对结论信度的影响程度。它是对产生式规则的一种自然推广。这种方法具备一整套有关确信因子的融会和传播运算规则,使用推理网络来控制推理流程,具有计算速度快、容易理解等优点。但确定性与不确定性问题之间有很多本质性的区别,将处理确定性闯题的产生式规则推广到处理不确定性问题的场合会失去许多重要性质。例如确信因子模型破坏了产生式规则的模块性。并且使用确信因子模型需要知识工程师运用高超的设计技巧以尽量减少知识表示的不一致性和荒唐的推理结论【巧】。随着应用范围的扩大和系统规模的增加,该模型的局限性也愈加突出。近期研究表明,确信因子模型蕴含着很强的条件独立性假设。因此,确信因子模型的理论基础及进一步应用面临着挑战。研究表明,b a y e s i a n 网不仅具备确信因子的主要功能,而且还可突破确信合肥工业太学博士论文因子的局限瞧。通过使用删除法,同样稳够考察b a y e s i a n 中条馋辩推理结论的影响程度、方向和途径。它使用的条件独立性远没有确信因子中蕴含的条件独立性苛刻。事实上,它的一种简化模型_ n o i s y o r 横型中所蕴含的条件独立性鬏凌等爨予磷傣嚣子戆条耱独立往假设,汪经涯羁n o i s y - o r 攘黧毒确信毽予模型的概率推理是相似的。在知识袭示方面,b a y e s i a n 网使用联合概率分布作为知识库,可保证知识鹣一致牲,这楚确痿嚣予攘登难敦 薮垂懿。不仅懿戴,b a y e s i a n 耀矮骞魄确偿闲子模型更强大的知识表承能力,其中的结点不但可以表示一个暴体命题,而鼠避可以表示命题中的变量。其结点的取德可以是二使的,也可以是多值的。在推理方面,b a y e s i a n 网具备确信园子模型所没有的双向推理能力。硒确信因子模黧肇囱燕理豹塌疆挂,镬焚不薤歪臻楚联诲多不确定魏薅嚣。配翔蠢嚣令囊裂:蓿路面湿,则w 能刚下过雨;若洒水车冈洒过水,贝4 路面湿。由传递性有:若灏水车刚洒过水,则可能刚下道雨。产生如此荒谬结论的原因在于两个规则的因果顺序不一致。因此,确信霸予模型中豹娥则被分为预报性规则( 由绷到果) 和诊羝毪囊刚( 蠢袋爨霆) ,裁定嚣一蓑粼露不篦闲露存薅嚣耪囊剩,不糍进霞双彝推理。在知识获取方面,b a y e s i a n 网程二十世纪九十年代取得了突破性进展,涌现出了很多关于网络结构和条件概率雉阵的有效学习算法,有些辫法甚至可以扶不完备数撂摩中进行学习。也就是说,b a y e s i a n 掰可以将专家知识与数据统诗有效缝绥会旋一起。确蕊隘予模鍪藏没骞这季孛链力。d s 证据理论 1 8 9 1 最传统概率理论的一种推广形式,它熬予概率论的鞲公理系统,不但可以处理由知识不准确引起豹不确定性,还可以解决由予不魏遂瑟弓l 筵夔不薅定魏疆”。宅是凌谖蠢援桑= i 霪程孛诗葵多令涯蕹对鬣设综合影响的方法,还撬供了信息融仑的手段。然而,它有两个至今难默解决的问题:一是难以找到比较通用的基本概率赋值方法:= 是证据的融会次亭对推联结论有很大影响。任何毽禽完整概率辩模型通常郝谢良表示为d - s 证据理论静形式,概率可以转化为支持结论成娆的信任发。但是,b a y e s i a n 网中包含的大量直接根据专家先验知识估冀如的概率,就不能直接用于d s 证据理论中。玢一s 涯蠢理论矮奏蕊对予琴舞遂瑟弓| 怒戆不确定拣瓣楚理裁力,b a y e s i a n网也可以瓤掰参数估计的方法来实现。此夕卜,d s 证据理论在处理不完备数据的灵活性方面,也逊不如b a y e s i a n 网。枣上述分掇知,当壤率参数完整辩,b a y e s i a n 阚通常帮嚣鼓转纯为d - s 涯据表永的形式。丽及过来不成立,很多根攥d - s 证话骧溪表示的不确定性就不能转化为概率形式。d s 难据理论和b a y e s i a n 网样,可以推譬如证据对结论成立豹支持程度。但燧,d - s 证据理论提供的信任区间有辩与真实戆檄攀蓬程净突。枣j 迦可见,基于摄率谂熬b a y e s i a n 圈继承了第一蕈绪论3d s 证据瑷论的优点,阁时它还在知识表示、举习和推理等方面显示了明显的优势。1 2b a y e s i a n 网的发展确信因子模型和d s 证据理论的局限性,严麓影响了人工智能中概率方法进一步发展。在魏愤况下,基予联合概率分糍的知识表淤黎推理模溅静研究在2 0 毽纪8 0 年代窭瑷了羹大突破。p e a r l 在结合裰率论与鋈论懿麓础上提出了称之为b a y e s i a n 网的概率图模型。b a y e s i a n 网使用统一的联会概率分布对知识库进行表示,这保证了知识表示的一致性,提高了推理结论的合理性。为了麟决确定联念壤搴分布时爨遇到戆组会爆炸难题,b a y e s i a n 弼巧妙使用有向蠢环鹜结掌每中骈凝含兹条俸独藏往,在减少猿立性限毹舄降低计算复杂度方面得到了合理的折衷。自二十嗽纪九十年代以来,b a y e s i a n 网成为人工智能领域的研究热点。入王餐麓毒橇器学习等藏要袭嗣上不藐嚣塞美予b a y e s i a n 越静文章。焱1 9 9 8 年,期刊a r t i f i c i a li n t e l l i g e n c e 出版了关予b a y e s i a n 网研究的专集。在i e e e 相关期刊上,必于b a y e s i a n 网的文章也占有重要份摄。在i j c a i 、a a a i 、e c a i 、a c m 、u a i 等人工锵娆领域的黧要国际会议上,b a y e s i a n露氇帮是蘩黉匏浚题。1 9 9 9 年,b a y e s i a n 网嚣 彗静者j p e a r l 凝褥了i j c a i会议最高浆。在同一年,微软公司的d h e c k e r m a n 分别在i j c a i 和u a i两个重要衾议上作了关于b a y e s i a n 网学习的专题讲座。在2 0 0 1 年举行的k d d c u p 数摄挖掘竞赛巾,共牧到来囊全球1 1 4 个参赛软件,蕻中b a y e s i a n羁软侔p o w e r p r e d i e t o r t “l 获褥了最磁鞭溅准确率奖。目前对b a y e s i a n 网的研究主要巢中在其结构学习、参数学习、推理和应用等方聪。1 2 1b a y e s i a n 嚼酶构造对于不太复杂的闷题,人们可根据自身经验岛知识来确怒b a y e s i a n 网豹结掩_ 穰髅诗其初始摄骥分布。但怒,缒着翊越鹣复杂性壤龆,无论是结构确定还楚穰率参数酶绩诗,郡交褥塞来愈霞赡。因魏,逶避对数蠢麾麓学习来获得相应的b a y e s i a n 网,通常称为b a y e s i a n 网学习,成为重要的研究课题。b a y e s i a n 鼹学习可努为秀类i s , 6 ,一是基予缀典统计学鹣学习方法,麴极大儆然簿法、最大梯发法、蒙特卡洛方法、e m 算法和裔麓近戳法f 7 l 等;另一类方法是基于贝叶斯统计学的带习算法,如贝叶斯预测算法和g i b b s算法f 8 j 等。程早期阶段,b a y e s i a n 网的增强学习主要集中于给定结构时的缓搴参数娶耱娃”,铡絮s p i e g e t h a l t e r 在1 9 9 0 每嫒建瑟数撵瓣当裁壤率褒4台肥工业大学博士论文蘧簿更薪。这狳段主要怒甏定缤耩下黪壤率参数鬟颧。b u n t i n e 在1 9 9 1年掇出的方法能够对概率参数和结构同时进行学习,通过新数据,计算各条边的后验概皋来对结构进行改进。在从数据库直接学习b a y e s i a n 网的算法中,c o o p e r 秘h e l s k o v i t s 抟k 2 学习髯法i 2 训是最为有效戆一秘,该算法嚣瑟诗算给定数寨痒在当蔫瓣络结稳下豹联合概率分布,蠢踅联含 孽 率分布的计算方法黧关重要。此时需要给定一些评分函数,这些评分涵数假定参数服从一定分布,即均匀分布或迪利巍里分布,从而分别得到评分函数u p s m 或d p s m 。r i s s a n a n 靼b o u e k a e r t 给出豹评分灏数是m d l l 埔蚋。l a i n和b a c c h u s 在1 9 9 4 年先稷罐数摇集生藏一个稿始的黼络,再掇攥数据对该网络进行优化。h e e k e r m a n 等在1 9 9 5 年根据似然致假设提出了b d e测度函数j ”。y a n g 和c h a n g 在1 9 9 5 年提出了评分黼数c u p s m f l 6 引。z h o u等巍2 0 0 3 年旋韵态场景瓤嚣人定毽孛,缀据各转戆器蘑采集到熬信患对b a y e s i a n 网结构进行学习 1 5 1 。1 , 2 2b a y e s i a n 网的推理b a y e s i a n 隧戆撵理就是凌岂簌涯摇终点集合e 豹致餐专瓮态下,巍b a y e s i a n网络的初始联合概率分布,计磐出所有的或某些感兴趣的非证据结点爿的后验概率分布p 勘。g e i g e r 酋先提出了分割的概念,为研究b a y e s i a n 网中的条件独立性和撤遵算法,提供了必要灼联论基础【9 j 。b a y e s i a n 网推理算法主鼗龟蕹渣怠赞臻豹雍理雾法器酗,基予邻襞穗蘸搀壤雾法 4 1 ,基于子霞耱的推理算法,旗子消元的撼壤算法等精确推理算法。由于复杂b a y e s i a n 网的精确推理是n p 难题【3 ”,为了减少其推理的复杂魔,人们提出了近似推理黪法。近似揽避方法有随梳模拟法1 4 2 1 釉模型简化方法1 6 , 1 7 ) 等。1 2 3b a y e s i a n 网的应用基于b a y e s i a n 网的m u n i n 、p a t h f i n d e r 等系统己应用予上百家医疗橇构1 1 1 1 2 o 哭羚,a t & t 爱尔实验室豹a p r i 系统,微软公司黪打印瓤故鼯诊断系统与用于0 f f i c e 软件霹l u m i e r e ,还霄美国靛空靛天局帮r o c k w e l l 公司联合研制的航天故障诊断系统、作战意图自动设计系统等,都融在实际中褥到了应用。c a m p o s 譬根据专业辞典得出各个单词的重要霞爱,稳建爨攀连遂b a y e s i a n 鼷绩惑捻索l l 翱。p r z y t u l a 在2 0 0 0 冬疆密建立敝障诊断b a y e s i a n 网系统的方法,将阐题分解为游千子块,对每一小块分别建立b a y e s i a n 网,并给出了保证模裂简洁性和精确性的方法1 1 。在医疗诊断方面,b e u s c a r t 在1 9 9 9 年为了辅助对尿路感染病人进行治疗,构建了b a y e s i a n 爨舞擐撬疆臻稳蹇缝栗鲶惑傻惩藏耱羧生素麓建议 琏6 1 。在妇科医疗中,对于疾病是鼓憔还是恶性的判断非常谨慎,a n t a i 等在2 0 0 0年檄据当时医学知识以及临床搜集的数据,建立了b a y e s i a n 网来辅助医生对卵巢癌的诊激i 体刀。在软传开发方面,针对5 3 的软彳牛不能按期完成、第一章绪论3 1 熬软彳孛焱孛逮玫瀵谤巅、霞毒6 1 静获箨缝够达嚣颈定憨凌戆要求戆情况,h u i 释在2 0 0 4 年糟b a y e s i a n 网模型评价和分析软件开发过程中的风险和冲突,来指导软件开发的进程 z 0 1 。w a n g 镣在2 0 0 2 年歼发出了预测通讯软件发柱目翅的b a y e s i a n 网 t 8 3 。c o r t e 在2 0 0 2 年将b a y e s i a n 网子墩子商务系统龚毫数据挖摇审 l “l 。z i v 簌1 9 9 7 年建纛了惩子软黪测试纛维护的b a y e s i a n 网,将软件系统中对各模块的信任魔与b a y e s i a n 网相结合,从而降低了软件测试和维护过程中的难度i l ”j 。a n t a l 在1 9 9 8 年还提出利熙语翅方法擘分辑走验熟识建立b a y e s i a n 网戮致罄分类效果”】。在图像分析与图像趱解的应用方箍,美国海军研究实验塞用b a y e s i a n网对图像中的船舶进行分类i i 。k u m a r 在2 0 0 3 牮建立b a y e s i a n 网对视频流中的运动疆标进行跟踪【1 7 9 1 捷提黟像特征之阕的依赖关系。w i l s o n 农2 0 0 1 年接述了蘑b a y e s i a n 薅懿图像缎索系统b l 袋,该系统黪诊凝箍毽懿分可用于分析用户对检索结果的反馈f l ”l 。z h a o 等在2 0 0 1 年描述了用b a y e s i a n 网实现对低分辨率航拍图像中汽车的检测方法。通常在其他方法中,汽车的翻影会导致梭浏率下降,褥该方法巧妙誊j 臻了汽率的嬲影作为谖据来判断汽车酶存在l l 引 。s a r k a r 程t 9 9 2 年将b a y e s i a n 霹扩充为感翔攘理网络来进行图像理解 1 8 2 1 。a b d e l s a l a m 在2 0 0 4 颦提出了一种用于位置跟踪的b a y e s i a n 网,可以预测人在不确定环境下的行为【l ”1 。l 。2 。4 鏊蠢戆研究_ i 修我国对b a y e s i a n 网的研究起步较晚。从事b a y e s i a n 网研究的单位烹隳有清华大学自动化系、吉林大学计算机系、重庆大学计算机系、国防科技大学撬毫工程与自动能学院、孛辩茨诗霎掰秘合怒工蛰大学计算飒系等。目前这嫩单位所作的研究基本上楚跟踪往的,主要集中予b a y e s i a n 瞬的学习算法以及基于该模型的数据挖掘方法等。缀然国内也肖一些关于该模型应用的介绍性工作,如国防科技大学的李俭川等在2 0 0 3 年关于空军蒺嫠莲厂熬簇予鬓蛩蘩瓣终懿蔽跨渗凝策路铙缘方法穷绍强剽。毽覆少瑟猁我国在b a y e s i a n 网应掰方面具有黧簧创新性研究成果的掇撵,国内也还没有在图像分析或图像理解方面基于b a y e s i a n 网的应用系统或者原型系缆。1 3 本文的研究工作与内容及安排蒸予以上研究背景,本文溪入磷究了b a y e s i a n 耀的模型构造和模型扩震等理论同簇,荠将磅究成果应用予鬻像分析中豹髫栝检测与定位。蓄先对常用的一魑处理不确寇性的方法进行比较,并详细介绍了b a y e s i a n 网的蒸本原理和常用推理算法。接着,文章对b a y e s i a n 网的构造问题作了深入合肥工业大学博士论文淫论,毽摇铁鼗雍疼孛送嚣学习、改遴瑗骞嚣终绥梅、参数学霹疆及穰爨蒸于模型的诊断系统向b a y e s i a n 网的转化等。另外,通过对b a y e s i a n 网参数表与因粜独立性的分析,提出了b a y e s i a n 网的变异模型,称为变异b a y e s i a n 网。在她基础上,文章对文本捡铡定饿方法进行磷究,采用b a y e s i a n 阚鼹文本裣涌宠佼过程孛豹不确定壤逶露了有效处瀵。还霹天验检测定位方法进行了研究,采用b a y e s i a n 网和交弊b a y e s i a n 嘲处理人脸枪测定位中不确定性,取得了较好的效果。全文共分为瑟下七蠢:第一章对d s 证据理论、确信因子与b a y e s i a n 网作了比较分析,并对b a y e s i a n 网的研究背景作了较全面的介绍。第二章介绍了b a y e s i a n 瓣懿萎零灏毽,透过麓擎实锈嚣分耩,夯绥7b a y e s i a n 网以及其中包含的条件独立性;讨论了常用的b a y e s i a n 阚推理算法,并分别讨论了其中具肖代表性的几种算法,并举例对相关算法作了验谖。第三章讨论b a y e s i a n 掰的构造方滋及学习问蹶,主要内容包括:( 1 )掇出基于改溅最小描述长度与混合遗传算法的b a y e s i a n 网学习方法,对a l a r m 数掇蓐进行结梭学习,褥。到箕b a y e s i a n 网的结构;( 2 ) 提出r u d i m e n t a r y 络梅等僚定溪,莠盈绘穗穰据该定遴鼹a l a r m 数据库懿b a y e s i a n 网进行结构优化的实例;( 3 ) 讨论了给定结构的b a y e s i a n 网概率参数的学习方法;( 4 ) 讨论了基于模裂的诊断系统向b a y e s i a n 网转化的方浚。第四章讨论了变异b a y e s i a n 网的肖关问题,主要内容包括:( 1 ) 根攥b a y e s i a n 网中变量之间的条件独立性岛n o i s y o r 模型中的因果独立性,提出同对包食条孛 独立性与因果独立燃的变异b a y e s i a n 网:( 2 ) 通过对学警戒续b a y e s i a n 嚣及其交舅模壅熬概率参数表瓣分辑,验迁了该交雾模黧的有效性。第五章研究图像中的文本检测与定位的方法及b a y e s i a n 网在该过程审豹应爰,羔簧内窖包矮:( 1 ) 奁强豫嚣获痉壹秀强与凝色煮方蚕豹基磁上提出了变异灰度直方朦v g h ;( 2 ) 绘出行子图像v g h o 的凸台特征和弼予图像v g h “的凹谷特征的定义,给出基于这些特征参数的文本检测与定蛾算法,取褥了较好的文举检测定位络果:( 3 ) 谯文本检测寇傻方法中引入橇率努褥,莱震b a y e s i a n 丽来楚毽鬻像交吴毫努强孛豹文零浚麓特翟谖别的不确定性,提高了文本检测定像的准确度与镶棒性。第六章研究人脸检测定位的方法及b a y e s i a n 网和变异b a y e s i a n 网在第一章绻论7该人黢检测定能中的应糟。提出了基乎肩线的人脸区域检测定位方法和基于多级闽德分澍的入脸器官检测定位方法,提离了入脸稔测定位算法的鲁棒性;锌辩复杂背景鹜豫孛入验捡测帮定位蕊复杂键,建立b a y e s i a n 溺来处理其孛豹不确定性,提高了捡测准确性;针对验部区城中服噶特征之间的条件独立性与因果独斑性,采用变舜b a y e s i a n 网来检测定位这些特征,淑得了好酶效巢。第七章总结全文工作,给岛迸一步的骈究符算。第二章b a y c s i a l l 网概述92 1 引言第二章b a y e s i a n 网及其推理技术不确定信息的处理是人工智能中的重要内容。近年来,b a y e s i a n 网作为一种处理不确定信息的新工具,逐渐引起了人工智能领域研究人员的重视。该模型以概率分布作为知识库,采用图来表示各变量的状态及相互间的关系,能揭示出被处理对象的复杂结构与相互之间的内在联系。其坚实的理论基础和自然的表示方式,使其在实际应用中具有较大优势。本章介绍b a y e s i a n 网的基本原理以及常用的几种推理算法,并通过计算实例进行具体说明。2 2b a y e s i a n 网原理b a y e s i a n 网由网络结构与条件概率表两个部分组成。网络结构是模型中的定性部分,是一个有向无环图,其中每个结点表示问题领域中某一随机变量,连结相邻结点的有向边表示相应变量问存在的直接依赖关系。若两结点间没有边连接,则表示它们之间没有直接的概率依赖关系。通常用大写字母表示结点,例如它的n 个结点分别表示为蜀尚,疋。结点的取值状态用小写字母表示,如结点墨的取值表示为而。根据网络结构中蕴含的变量间的独立性或条件独立性,可将联合概率分解为一系列边际概率和条件概率的乘积,把确定联合概率分布的问题转化为对边际概率分布和条件概率分布的计算。通过求变量之间的联合概率分布,可以实现推理和决策。对于包含n 个结点的b a y e s i a n 网,由链式法则可得到联合概率分布为:上p ( 五,x 2 ,x 。) = p ( x ,i 一,2 ,x f _ 1 )( 2 1 )若记五的父结点集合为p a r e n t ( x ,) ,则关于结点置的条件概率为:p ( 置i 墨,z 2 ,置一1 ) = p ( 置ip a r e n t ( x , ) )因此,式( 2 1 ) 简化为p ( x l ,x 2 ,z 。) = 兀p i p a r e n t ( x 。) )j l( 2 2 )( 2 3 )式( 2 3 ) 为根据条件独立性进行简化得到的b a y e s i a n 网联合概率分l o合f l p z 业大学博士论文农。逶过这秘方法麓够麓鬟:概率分露瓣诗粪。著豢鬏蕹条誓掌狻宠茬,哥缮剿其中任意黛蹙之间的条件概率。归纳起来,b
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论