(信号与信息处理专业论文)基于模糊集的时空域差错掩盖技术研究.pdf_第1页
(信号与信息处理专业论文)基于模糊集的时空域差错掩盖技术研究.pdf_第2页
(信号与信息处理专业论文)基于模糊集的时空域差错掩盖技术研究.pdf_第3页
(信号与信息处理专业论文)基于模糊集的时空域差错掩盖技术研究.pdf_第4页
(信号与信息处理专业论文)基于模糊集的时空域差错掩盖技术研究.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(信号与信息处理专业论文)基于模糊集的时空域差错掩盖技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

:k “ 南京邮电大学 硕士学位论文摘要 学科、专业:工学信号与信息处理 研究方向:图像处理与多媒体通信 作 者:2 0 0 7 级硕士研究生骆华燕 指导教师:朱秀昌教授博导 题 i i i i t i i il h i i i h n i i i i i i s l l y 17 5 4 8 4 8 目:基于模糊集的时空域视频差错掩盖技术研究 英文题目:r e s e a r c ho ft e m p o r a la n ds p a t i a lc o m b i n e de r r o r c o n c e a l m e n ts c h e m ef o rv i d e oc o m m u n i c a t i o n b a s e do n f u z z ys e t s 主题词:视频解码、传输误码、差错掩盖、模糊集、模糊推理 k e y w o r d s :v i d e od e c o d i n g ,t r a n s m i s s i o ne r r o r , e r r o rc o n c e a l m e n t , f u z z ys e t s ,f u z z yr e a s o n i n g 南京邮电大学硕上研究生学位论文摘要 摘要 数字视频信号在传输过程中由于信道干扰等原因会出现误码,使得解码终端出现差错 块或丢失块,最终导致视频质量下降。除了采用纠错编码、遇错重传等方法外,往往还可 以在解码端利用正确接收的信息恢复丢失的信息,这就是基于解码端的差错恢复方法即差 错掩盖技术,主要是利用视频序列在时间和空间上的相关性,采用正确接收像素值来恢复 丢失块信息。模糊集理论用软计算方法代替传统的硬计算环境,适用于对那些不精确的信 息进行计算。正因为图像信息具有一定的模糊性和时空相似性,因此可以利用模糊集理论 进行图像处理和视频差错掩盖。 本论文首先研究了各种基于经典统计数学的帧内、帧间差错掩盖算法,包括帧内的基 于像素插值的方法和基于块匹配的方法,以及帧问块替换和运动矢量均值的方法等。另外, 分析了这些算法的优势和局限性。 然后,在研究模糊集理论的基础上,利用模糊推理的方法,提出了一种基于模糊集理 论的视频帧内、帧问差错掩盖算法。在这种差错掩盖方法中,将模糊推理应用于是否接受 初步差错掩盖结果的判决上,合理修正了掩盖的结果,提高视频掩盖质量。同时,论文详 细介绍了算法的基本思想和掩盖处理的流程,重点讨论了算法中的关键问题。 最后,在h 2 6 4 参考软件j m l 5 1 产生视频序列丢包的基础上,利用m t a l a b 仿真实 现各类差错掩盖算法,并在不同误码率的情况下对不同特性的视频序列进行了测试。此外, 在校园网平台上建立了视频传输误码发生和差错掩盖的实时实验p c 平台。 实验结果表明:文中提出的基于模糊集理论的帧内、帧间差错掩盖算法优于基于经典 数学的方法,改善了恢复图像的边缘细节和纹理信息,提高了图像的主观质量和p s n r ( 峰 值信噪比) 值。 关键词:视频解码传输误码差错掩盖模糊集模糊推理 d e g r a d a t i o na n dr e c o v e rt h ed a m a g e di m a g e s e r r o rc o n c e a l m e n tu t i l i z e st h es m o o t h n e s sa n d c o n t i n u i t yp r o p e r t i e si nt e m p o r a la n ds p a t i a ld o m a i nt or e c o v e rc o r r u p t e db l o c k sf r o mt h e s u r v i v e ds u r r o u n d i n g f u z z ys e t st h e o r yu s e st h es o f t c o m p u t i n g m e t h o dt o r e p l a c et h e t r a d i t i o n a lh a r dc o m p u t i n ge n v i r o n m e n ta p p l i e st ot h o s ef u z z ya n di m p r e c i s ei n f o r m a t i o n i ti s p r e c i s e l yb e c a u s et h ei m a g ei n f o r m a t i o nw i t hac e r t a i nd e g r e eo fa m b i g u i t ya n dt e m p o r a l s p a t i a l s i m i l a r i t y , i tc a nm a k eu s eo ff u z z ys e tt h e o r yf o ri m a g ep r o c e s s i n ga n dv i d e oe r r o rc o n c e a l m e n t f i r s t ,t h i sp a p e rb r i e f l yi n t r o d u c e sv a r i o u ss p a t i a la n dt e m p o r a le r r o rc o n c e a l m e n t a l g o r i t h m sb a s e do i lc l a s s i c a ls t a t i s t i c sm a t h e m a t i c s ,i n c l u d i n gt h ep i x e li n t e r p o l a t i o nm e t h o d s 、 t h eb l o c km a t c h i n gm e t h o d si n s p a t i a ld o m a i na n dt e m p o r a lr e p l a c e m e n t 、a v e r a g em o t i o n v e c t o r si nt e m p o r a ld o m a i n b e s i d e s ,t h el i m i t a t i o n sa n da d v a n t a g e so ft h e s ea l g o r i t h m sa r e r e s e a r c h e dd e e p l y t h e nt h ea l g o r i t h m sb a s e do nf u z z ys e t sa r ep r o p o s e d ,i n c l u d i n gt h ea l g o r i t h mb a s e do n f u z z yr e a s o n i n g t h et h e o r yb a s i s ,c o n c e a l m e n ts t e p sa n dt h ek e yp r o b l e m sa r ed i s c u s s e di n d e t a i l s f u z z yr e a s o n i n gi sa p p l i e dt oj u d g et h ei n i t i a le r r o rc o n c e a l m e n t i ft h ei n i t i a l c o n c e a l m e n ti sn o ta c c u r a t e ,w i e n e r i n t e r p o l a t i o n i se m p l o y e dt oi m p r o v et h eq u a l i t yo f c o n c e a l m e n t f i n a l l yt h ee x p e r i m e n t sa r ec a r r i e do u tb a s e do nt h er e f e r e n c es o f t w a r ej m15 1o fh 2 6 4a n d m a t l a b ,d i f f e r e n tv i d e os e q u e n c e sa r et e s t e d b e s i d e s ,r e a l t i m ec o m m u n i c a t i o np cf l a ti s e s t a b l i s h e df o re r r o rc o n c e a l m e n tb a s e do nc a m p u sn e t w o r k t h ee x p e r i m e n t a lr e s u l t ss h o wt h a t t h ea l g o r i t h m sp r o p o s e di nt h i sp a p e rs u r p a s st h ec l a s s i c a ls p a t i a la n dt e m p o r a la l g o r i t h m s ,c a n i m p r o v et h ee d g ea n dt e x t u r ed e t a i l so ft h ei m a g e ,a n di n c r e a s et h ep s n rv a l u ea sw e l l k e yw o r d s :v i d e od e c o d i n g ,t r a n s m i s s i o ne r r o r , e r r o rc o n c e a l m e n t ,f u z z ys e t s ,f u z z y r e a s o n i n g i i 南京邮电入学硕士研究生学位论文 目录 目录 第一章绪论j 一1 1 1 引言1 1 2 解码视频的差错掩盖技术1 1 2 1 视频传输的差错控制l 1 2 2 差错掩盖的约束条件2 1 2 3 视频差错掩盖的研究现状4 1 3 模糊集差错掩盖的背景6 1 4 主要研究工作和论文安排7 第二章模糊集理论及其图像处理简介一8 2 1 模糊数学基础8 2 1 1 经典集合以及特征函数8 2 1 2 模糊集与隶属度函数8 2 2 模糊推理( f u z z yr e a s o n i n g ) 9 2 2 1 模糊推理的基本思想1 0 2 2 2 模糊推理系统1 1 2 3 模糊推理在图像中的应用1 2 2 3 1 模糊集图像处理的特点12 2 3 2 基于模糊集的差错掩盖1 3 2 4 本章小结1 3 第三章基于经典数学的视频差错掩盖1 5 3 1 传统视频帧内差错掩盖1 5 3 1 1h 2 6 4 帧内掩盖算法1 5 3 1 2 帧内块匹配掩盖算法1 6 3 1 3 方向插值掩盖算法1 7 3 2 传统视频帧间差错掩盖2 0 3 。2 1 简单的块替换掩盖算法2 0 3 2 2 利用运动矢量均值的掩盖算法2 0 3 2 3 帧间块匹配掩盖算法2 l 3 3 本章小结2 2 第四章基于模糊集的帧内差错掩盖2 3 4 1 基于维纳插值的差错掩盖算法2 3 4 2 维纳插值与模糊推理的结合2 7 4 2 1 掩盖流程2 7 4 2 2 模糊推理规则及隶属度函数的选取3 3 4 3 算法的分析3 6 4 4 本章小结j 3 7 第五章基于模糊集的帧间差错掩盖3 8 5 1 基于局部最小均方估计的时域掩盖3 8 i i i 南京邮电 5 2 5 4 本章小结4 5 第六章实验结果分析4 6 6 1 仿真结果分析4 6 6 1 1 模糊集帧内差错掩盖结果分析一4 7 6 1 2 模糊集帧间差错掩盖结果分析5 2 6 2 差错掩盖p c 实验平台介绍一5 5 6 3 本章小结5 9 第七章总结与展望6 0 7 1 研究工作总结6 0 7 2 今后工作展望6 1 参考文献6 2 致谢:6 5 攻读硕士论文期间参加的科研项目和发表的论文一:6 6 i v 南京邮电大学硕_ 上研究生学位论文 第一章绪论 1 1 引言 第一章绪论 音频和视频是人类进行信息通信中最直接有效的方式。随着现代通信理论、计算机技 术、微电子技术和网络技术的快速发展,信息社会对于多媒体通信有迫切的需求,人们实 现a n yt i m e ,a n yw h e r e ,w i t ha n yp e r s o n 的多媒体通信也变得越来越接近现实。而图像和 视频的传输通信都是以海量数据、超高带宽的需求为特征。i p t v 、n g n 、3 g 、n g b w 、 i po v e rd v b 、三网融合等新技术也都是以高速度、高安全性、高可靠性的数据传输为基础, 对大量存储空间和高传输带宽的需求促进了视频编解码技术的飞速发展。因此,作为视频 业务及存储应用核心技术的高效率视频数字压缩编解码技术,越来越引起人们的关注,成 为目前广播、视频与多媒体通信领域中的热点与亮点。 压缩效率的提高与数据传输的鲁棒性是相互矛盾的,压缩率提高的同时导致了视频数 据的抗差错能力较为脆弱。压缩编码去除了图像信息中大量的空问和时间上的冗余信息, 导致在信道中传输的视频信息相关性降低【l i 。因此,抗误码性能急剧降低,误码在解压缩 以后又会产生差错扩散,最终导致视频质量下降。从而需要在通信系统中的上层,如在应 用层,或信源编码端中采用一定的差错控制技术来尽量降低这种影响。 1 2 解码视频的差错掩盖技术 1 2 1 视频传输的差错控制 对于普通数据的传输,往往要求无损传输,即要求数据传输准确、无差错。其实现手 段主要是信源和信道的差错控制编码、自动请求重传等。与普通数据传输不同,视频传输 往往更注重传输的效率和实时性,而对数据的失真有一定的容忍性,这是由人眼的视觉特 性决定的,因而可以有损传输。但是,压缩后的视频数据在传输时对码元错误非常敏感, 少量码元的错误就可能导致大批后续码元无法正确解码。视频传输的差错控制根据分类角 度的不同有不同的解决方案。大多数情况下,可分为如下三大类【2 l : 一、前向差错控制 在前向差错控制( f e c ,f o r w a r de r r o rc o n t r 0 1 ) 方法中,编码器扮演主要角色,通过 源编码算法或传输控制机制设计,使其受传输错误的影响最小,无需解码器的任何错误隐 藏,或使解码器端错误隐藏任务更有效。前向出差错控制包括前向纠错编码、信源信道联 i 南京邮电大学硕士研究生学位论文第一荦绪论 合编码和分层编码等。 二、解码器后处理差错控制 在解码器后处理差错控制方法中,解码器扮演主要角色,主要是利用视频信号在空间 和时间上的相关性,通过寻找一些相关数据来代替误码数据,提高解码后的图像质量,这 一种方法也正是本文研究的重点。 三、编解码器交互式差错控制 。 编解码器交互式差错控制方法主要是利用反馈信道改变编码策略,在保证较高编码效 率的同时,提升解码后的图像质量。包括基于解码器反馈的自动重传请求( a r q ,a u t o r e p e a tr e q u e s t ) 和选择性预测编码等。 在许多有传输效率、实时性等要求的应用场合,纠错编码f e c 、自动请求重传a r q 等 差错控制方法并不能很好地适用于视频传输。纠错编码f e c 差错控制方法会增加传输的数 据量,从而加剧网络的传输拥塞。自动请求重传a r q 贝3 要求反向信道存在,增加了网络的 传输时延。基于解码器后处理的视频差错控制方法,属于视频图像后处理方法,不占用额 外传输带宽,可与具体的编码标准无关,利用视频数据在时间和空间上的高度相关性来恢 复误码或差错块,这也就是所渭的差错掩盖( e r r o rc o n c e a l m e n t ) 技术。 1 2 2 差错掩盖的约束条件 图1 1 是一般视频通信的基本框架,原始的音视频信号( 视频一般为y u v 格式) 经过 信源编码、压缩、码流复用,将多路音视频信号合成一路信号,经过信道编码、传输、信 道解码、解复用、信源解码等一系列的传输变换重新得到接收的视频信号,送到显示终端 显示。 图1 1视频通信的一般框架 数字视频信号在传输过程中由于线路干扰等原因会出现传输q o s - f 降,尤其是在无线 南京邮电大学硕= l :研究生学位论文第一章绪论 信道和基于i p 的信道中表现更加严重。无线信道固有的多径效应、瑞利衰落损耗和抖动等 特点使得误码率高,稳定性差。视频信号在基于i p 的网络中传输,和其他业务流量共用网 络容易导致网络拥塞,此时会发生丢包现象,同时受到路由选择、信道容量和节电处理能 塑室业皇查兰堕主竺塞竺堂垡笙兰 笙二堡笙堡 四、边缘连续性( e d g ec o n t i n u i t y ) : 边缘连续性的假设是指图像中一个区域的边缘( 一般指线性边缘l 是连续的,这个假 设前提暗示:如果一个差错块周围的块内有边缘,而且其方向指示通过有差错的块,那么, 这条边缘线一定通过差错的块,需要进行掩盖。如基于凸集投影p o c s ( p r o j e c t i o no n t o c o n v e xs e t s )的差错掩盖方法就使用该假设进行掩盖。 五、运动矢量的连续性( m o t i o nc o n t i n u i t y ) 运动矢量的连续性假设是指差错块的运动矢量与空间和时间上相邻块的运动矢量是 相似或相同的。基于这种假设,用平滑滤波或边缘匹配来选择运动矢量,然后用候选运动 矢量在参考帧中找到相应的块来代替差错块,最后根据差错块与它周围块的边缘连续性进 行修正。 1 2 3 视频差错掩盖的研究现状 目前解码器后处理差错隐藏技术主要针对纹理信息和运动信息的恢复。纹理信息的恢 复主要是利用当前帧的空间信息进行恢复,即视频帧内差错掩盖算法。帧间差错掩盖算法 利用视频的时间相关性,借助差错块的运动信息来恢复误码块,其主要考虑的是丢失块运 动矢量的恢复。 一、帧内差错掩盖算法 顾名思义,帧内差错掩盖算法即丢失部分与用来掩盖它们的数据来自同一帧,利用图 像信息内在的空间相关性来恢复被损区域。视频序列或图像组g o p ( g r o u po f p i c t u r e s ) 的 第一帧是帧内编码的i 帧,与前后帧的相关性不大。在一般情况下,它不能利用时间方向上 的冗余信息进行恢复,只能利用当前帧内的相邻块的信息进行错误恢复。i 帧掩盖的不好会 导致掩盖误差传播至i j g o p 的其他帧,最终导致视频序列质量的下降。因此,帧内差错掩盖 算法具有重大的意义。 空间域的方法主要使用了块拷贝和插值方法,如m p e g 2 中的块匹配方法和h 2 6 4 中使用的加权平均插值方法。这些方法具有简单实用的特点,但只适用于平滑区域,对有 边缘或多细节的差错块,插值容易产生模糊,而匹配算法由于可能找不到最佳匹配块而造 成块效应。后续的改进方法有方向插值算法l 引、基于凸集投影( p o c s ) 的算澍6 1 和基于马 尔可夫随机场( m r f ) 的方法 7 等,这些方法可以恢复出图像的边缘信息。 这些算法都是以几何分析的方法解决图像的边缘问题,一个重要缺陷就是当差错块多 于一个边缘时,几何分析的可靠性将大大降低。自适应维纳滤波器插值采用八个方向结果 加权的序列误码掩盖技术1 8 1 取得了令人满意的效果,但其计算复杂度太大很难在实时环境 - 4 : 南京邮电大学硕上研究生学位论文 一 第一章绪论 中应用。因此,采用何种办法,如何进一步提高掩盖图像质量、降低算法的耗时,仍然是 一个急需研究和解决的技术难题。 二、帧间差错掩盖算法 帧间差错掩盖算法是利用视频时间相关性,用参考帧信息恢复误码块,如视频序列中 p 帧和b 帧,可有效恢复图像细节。传统的时域差错掩盖尽可能估计出丢失块原始运动矢量 ( m v ) ,差别仅在于m v 的估计算法不同。零运动矢量差错掩盖1 9 i ( 也称时域替代,t r ) 是最早的时域差错掩盖技术,只需将参考帧同一位置处图像块填补到当前帧丢失块的位置 即可,无需任何计算量,但只适合静止图像序列,如新闻联播的背景画面。当运动变化较 为剧烈时,效果很差。丢失块运动矢量为可用邻块运动矢量均值( a v ) 的恢复方法1 1 0 i 优 于时域替代,但当丢失块与邻域块运动矢量相关性不强时,效果不好。l a m 提出的边界匹 配算法( b m a ) i l l l ,克服了丢失块的运动矢量与其周围块运动矢量相关性不强时掩盖效果 不佳的缺点。但当丢失块的运动方向和周围块运动方向有不同时边界匹配算法产生严重的 方块效应。 以上这些方法主要考虑的是丢失块运动矢量的恢复,其本身就有着一定的局限性。因 为运动矢量的估计并不一定准确,即使能够准确估计出原始运动矢量,运动补偿后也极有 可能会出现方块效应。l i 提出了一种不需要估计m v 的方法1 1 2 i ,利用虚拟相机的概念,与 隐藏运动模型相结合,得到了非常好的掩盖效果,但其计算复杂度很大仍很难在实时环境 中应用。 三、帧内、帧间结合差错掩盖算法 帧内差错掩盖算法具有细节恢复不够的缺点。帧间差错掩盖在图像序列没有明显运动 或者运动程度比较平稳的时候效果较好,当运动比较剧烈,丢失块为前一帧的被遮挡物或 场景切换的时候,难以给出比较满意的效果。因此,综合考虑,可采用帧内帧间差错掩盖 相结合的算法。 受损宏块的掩盖方法可以根据受损宏块周围相邻宏块的编码模式来确定。当大多数相 邻宏块为帧内编码模式时,可认为当前受损宏块所在区域发生了场景切换,此时对受损宏 块采用空域掩盖否则对受损宏块采用时域掩盖。对于i 帧,由于其中的宏块全为帧内编码模 式,因此无法利用该方法。为此,可以利用受损i 帧的前一个p 帧中与当前受损宏块位置相 同的宏块的周围相邻8 个宏块的编码模式统计来决定i 帧中当前受损宏块的掩盖方法1 1 3 l 。此 外,还可以根据与当前i 帧的时间相邻的前后两个p 帧中相同位置处宏块的编码模式是否匹 配1 1 4 l ,来判断这两个p 帧是否处于相似的视频场景,从而决定出i 帧中受损宏块的掩盖方法。 根据受损宏块的估计运动向量的特征来选择受损宏块的掩盖方法1 1 5 l ,当估计运动向量的x 气 南京邮电火学硕七研究生学位论文第一苹绪论 分量或y 分量较大时,认为图像的空问相关性要大于时间相关性,此时对受损宏块利用 空间相邻像素进行掩盖就比利用运动补偿替代数据进行掩盖好,否则反之。另外,还可以 根据受损宏块的边界匹配误差来选择受损宏块的掩盖方法1 1 6 l 。当受损宏块的运动补偿替代 块与受损宏块的相邻宏块的边界匹配误差较大时,认为估计的运动向量无法为受损宏块找 到合适的替代块实现与相邻宏块的平滑连接,因此对受损宏块进步采用空域方法进行掩 , 皿o 1 3 模糊集差错掩盖的背景 由于目前的视频编码技术是建立在图像信号的统计特性基础上的,利用图像的空间或 ( 和) 时间上的相关性来进行压缩编码,它对要压缩的图像进行统计分析、计算和处理, 属于精确计算方法,是一种“硬”计算环境。与之相应的常见差错掩盖技术也是基于这样 的“硬”计算环境的。这种建立在信号的统计分析、计算机数值计算和问题求解基础上的 技术体系,对准确定、完全性的信息对象已形成了一系列传统的信息处理技术,传统的差 错掩盖技术也是其中之一。 然而,图像信息不同于数据信息或文本信息,它具有一定的模糊性和时空相似性,尤 其是用于观赏的视频更是如此。从理沦上说,在视频的图像序列中,每一帧图像内的相邻 像素或前后帧中的相应像素的相似性可以说是模糊的,不确定的,虽然两个像素的值和其 差值是确定的,但由于人眼的视觉特性,这种相似性对人眼来说是模糊的,也就是说其相 似性与否的度量在一定范围内变化,人眼是看不出的,其中体现着一个从量变到质变的过 程。因此,在允许一定的失真条件下,可以充分利用其模糊特性( 如模糊相似性) 进行推 理或分类,可以在尽量减少误码对人的视觉效果影响的前提下,达到掩盖差错、提高重建 图像质量的目的。 随着人们对各种信息对象研究的深入,就迫切需要一种能够有效针对那些非确定、不 完全类信息的处理手段,对这类信息处理的机制和过程更多地模拟了自。然界和人的某些自 适应行为和特征时,某技术范畴就从单纯的“硬”计算环境拓展至更为广阔的“软”计算 邻域,软计算( s c ,s o f tc o m p u t i n g ) 弥补了硬计算的不足。模糊数学( f u z z ym a t h e m a t i c s ) 或模糊集合( f u z z ys e t s ) 的理论和方法正是这类软计算的有效方法之一,它与人脑的功能 相对应,特别适用于对那些不确定、不精确的信息进行处理。所以基于模糊数学的图像处 理方法符合人眼的视觉特性这种认识,可以将其应用到基于解码端的差错掩盖中去。这是 一项很有应用价值的研究课题,和目前常用的基于统计信息的掩盖方法相比,采用模糊数 学的方法可以获得更好的重建图像效果。 6 南京邮电大学硕士研究生学位论文第一章绪论 1 4 主要研究工作和论文安排 本论文研究的重点是基于模糊数学的视频差错掩盖技术,主要是根据视频的图像像素 相关的模糊性质,利用模糊推理的方法进行分析和研究,获得性能更好的视频差错掩盖算 法,使得用它掩盖后的视频主客观质量比用传统方法掩盖后的视频质量要好。本论文的主 要工作是: 1 研究多个典型的帧内、帧间差错掩盖算法; 2 研究模糊数学的经典理论,并分析图像中存在的模糊性; 3 提出新的基于模糊数学的帧内、帧间差错掩盖算法: 4 实现基于模糊推理的视频差错掩盖程序,并与经典算法比较。 本文的结构如下:第一章主要介绍本文的研究背景。第二章给出了模糊数学( 模糊集) 的基本理论,重点阐述了模糊推理的基本理论,探讨了本论文研究的数学基础和研究方法。 第三章介绍几种经典的帧内、帧间差错掩盖算法并分析其优势及存在的局限性。第四章介 绍基于模糊推理的帧内差错掩盖算法,并讨论隶属度函数和推理规则的选取。第五章提出 基于模糊推理的帧间差错掩盖算法。第六章使用不同特性和误码率的序列进行实验,并介 绍了p c 差错掩盖实验平台。最后对全文做出总结,并提出了下一步工作的方向。 南京邮电大学硕士0 研究生学位论文 第二章模糊集理论及其图像处理简介 第二章模糊集理论及其图像处理简介 扎德( l a z a d e h ) 在1 9 6 5 年提出了模糊集的概念,在经典数学之外开拓了模糊数学的 先河。模糊数学是建立在模糊集合之上的,它是描述和处理人类语言中所特有的模糊信息 的理论。它是用精确的数学方法处理模糊对象。其中模糊推理是模糊集理论的一个重大分 支,在控制论和图像处理中获得广泛的应用。本论文主要研究了基于模糊推理的方法处理 视频的差错掩盖,以提高差错视频的掩盖质量。 2 1 模糊数学基础 2 1 1 经典集合以及特征函数 在数学上,概念的外延可以通过“集合”来表达,e p c a n t o r 集合理论1 1 7 l 。集合即“把 一定的并且彼此可以明确识别的东西东西可以是直观的对象,也可以是思维的对象一放 在一起”。例如全体自然数、全体有理数、全体实数都是集合,集合中的每一个具体的对 象( 成员) 称为该集合的元素。事实上,集合与一个概念在人脑中的形成密切相关。一个 概念的形成大致需要包含两个方面:一方面是从内在条件把握各个有关因素对这个概念所 作的规定,即这个概念的内在涵义,称之为概念的“内涵”:另外一方面就是这个概念所 包含的内容,换句话说就是符合此概念的事物全体,我们称之为概念的“外延”。内涵和 外延是描述概念的两个方面,它们是相辅相成的。 谢为集合,若具体对象a 是集合a 的元素,则称口a ,即日属于4 ,否则a 仨a ,即口不 属于a 。口与彳之间的隶属关系可以用a 的特征函数刻画,即 c 口,= 三三三 c 2 一, 其中( 口) 为元素a 相对集匍的特征函数。 从c a n t o r 集合论可以看出,在经典数学中,任何一个元素和一个集合只有一种关系, 即口属于么或者a 不属于彳,它是建立“二值逻辑”的基础上的,具有“非此即彼 的关系。 2 1 2 模糊集与隶属度函数 一个经典集合的“内涵”和“外延”都必须是明确的,所以对论域中的任何元素,或 者属于某一集合,或者不属于这个集合,两者必居其一且仅居其一。然而在现实世界中, 有许多概念并没有明确的“外延”,如“天气好”、“水温很低”、“个子很高”等都是 一8 一 堕塞些皇查兰堡主婴壅竺堂垡堡兰 笙三兰堡塑叁些笙丝些望堡竺里堕坌 模糊的概念。这样就使得经典集合沦对于这样的概念显得力不从心了,因为模糊概念很难 简单地用“属于”或“不属于”来表示,而只能通过属于的程度来描述。换句话说,就是 论域中的元素符合某一概念的程度不能仅仅用0 或l 来表示,而需要借助于介于0 到1 z 间的 实数来表示。 论域x 上的模糊集合”a1 1 8 1 1 1 9 i 定义为: a = ( x ,彳( 工) ) i 工x ( 2 - 2 ) 或者 a = ( 工,u 爿( 工) ) lx x ) ( 2 3 ) 其中4 ( x ) 或者心( 工) 称为“隶属度函数”,它满足: 彳:x 专m ,这里m 称为“隶属 空间”,最常见的隶属空问为nf 司 0 ,1 】。隶属度函数心( x ) 用于刻画元素x 对模糊集合a 的 隶属程度,即“隶属度”,所以模糊集合a 的每个元素( 工,心( 石) ) 都能明确地表现出工的隶 属等级。心( x ) 的值越大,x 的隶属程度就越高。当心( 工) = 1 时,说明x 完全属于4 ;而胁( x ) 。0 时,说明x 不属于爿;而心( x ) 值介于0 和1 之间时,说明隶属于a 的程度也介于“属于”与 “不属于”之间,是模糊的。与经典集合类似,在模糊集合的表示中,对于隶属度为o 的 元素可以不列出。 由定义可以看出,模糊集合a 是由隶属度函数心( x ) 唯一确定的,可以把模糊集合a 与 隶属度函数心( 工) 看成是等同的。隶属程度的思想是模糊数学的基本思想。当心( 工) 仅取值 o 和l 时,模糊集合退化为经典集合,可见经典集合是模糊集合的特殊情形。x 上的所有模 糊集合组成的集合称为x 的模糊幂集,记为r ( x ) 。 2 2 模糊推理( f u z z yr e a s o n i n g ) 推理就是根据已知的一些命题按照一定的法则去推断一个新的命题的思维过程和思 维方式,简言之从已知条件求未知结果的思维过程就是推理。模糊逻辑推理是一种不确定 性的推理方法,其基础是模糊逻辑,它是根据给定的行为规则集来得到输入信息对应的隶 属度值的过程。 模糊推理是对模糊信息进行处理的方法,也是模糊数学中除了隶属度函数之外的又一 个重要的组成部分2 0 1 1 2 。由于它在诸多工业生产领域上的成功应用,使它在近2 0 多年来模 糊系统理论的研究中始终占有重要的地位。z a d e h 于1 9 7 3 年第一次提出了模糊分离规则 f m p ( f u z z ym o d u sp o n e n s ) ,并被m a m d a n i 等人所发展,形成了如今被广泛使用的c r i ( c o m p o s i t i o n a lr u l eo fi n f e r e n c e ) 等方法1 2 2 i 。 q 南京邮电大学硕_ 上研究生学位论文第二章模糊集理论及其图像处理简介 模糊推理作为近似推理的一个分支,以数值计算而不是以符号推演为特征。正因如此, 它与经典逻辑有明显的不同。它不注重基于公理的形式推演,甚至也没有基于赋值的语义 运算。这也是模糊推理区别于人工智能方法的特征所在。 2 2 1 模糊推理的基本思想 一个系统的输出与预定的标准之间总是有误差的,以e 记此误差。这个误差又是随着时 间而变化的,以e o 记误差变化率。所谓推理就是要根据e 与e o ( 或许还要e 的多阶导数) 对系 统的输入进行调整。经典控制理沦中这个调整量是e 与p o 的函数f ( e ,e o ) 。在某些情况下, 这个厂是不易建立或不需要建立的,取而代之的是已知一组专家经验,即已知当误差为e 。且 变化率为e m 时应当采取的调整量为q ( f _ 1 ,2 ,棚) ,并要在这一组经典情况的基础上针对随 时测得的e 与e o 计算出相应的控制量c 来。模糊推理的基本原理是1 2 3 l : 第一步,把p 。,e 饥,c t ,e 与e 矿分别模糊化为x ,y ,z ,与y 上的模糊集4 ,e , c i ,a 与b ; 第二步,列出算式: 已知 4 且e 寸c l a n a b n 专c n 且给定4 且b + ( 2 4 ) 求 c 第三步,将c 去模糊( d e f u z z i f y ) 后就得到最终的数值控制量c 。以上的第二步就是 模糊推理。由于己知条件4 且en n 乘积, x x y 上的一个模糊集去取代,且九条规则可以通 过聚合( a g g r e g a t e ) 而成为一条超规则,或者可以分别使用这门条规则单独推理后将所得九个 中问结果以某种方式合成为最终的c ,所以模糊推理可归结为以下最基本的形式: 已知 ajb 且给定a+(2-5) 求 b + 这里a ,a 是牡的模糊集,召,b + 是肚的模糊集。 求解方程( 2 5 ) 的传统方式畏o z a d e h 于1 9 7 5 年提出的c r i 算法。z a d e h 提出了一种蕴 ,涵算子心: 0 ,1 2 一 o ,1 】如下: 62t 口八口 m = 6口 恐 堕室塑皇奎堂婴主堕壅竺兰竺笙奎 丝三童塑塑篓些笙垄茎望堡竺堡丝坌 这里口表示1 一a ,v 和a 分别表示取上、下确界运算。c r i 算法的第一步是利用蕴涵 算子彤把已知条件a 一曰转化为x x y 上的一个模糊关系r ,少) 如下: r ( x ,y ) = 之( 彳( x ) ,b ( y ) ) ,( 工,y ) x xy ( 2 7 ) 然后在第二步用么与r 复合就得出b ,即b + = a + 。r 。这里复合运算“。”的具体表 达式为 b ( j ,) = s u p a ( x ) ar ( x ,y ) 】 一x ( 2 8 ) = s u p a ( x ) a ( 彳( x ) ,b ( y ) ) 】, y y x e x 这样就求出了最终答案占。 2 2 2 模糊推理系统 模糊推理系统一般可以由模糊化、隶属度函数库、行为规则集、算法库、模糊推理和 反模糊化处理六个模块组成,如图2 1 所示。 图2 1模糊推理系统的一般模型 模糊化中首先确定输入模糊集合和对应的模糊隶属度函数。传统的集合是一种“非此 即彼”的思想,个元素是否属于该集合是确定的,可以用t r u e 或f a l s e 表示;而在模糊集合 中,一个元素属于该集合利用隶属度来表示,即该元素在多大程度上属于该模糊集,隶属 度取值在o 到t 2 _ 间。模糊隶属度函数定义了输入空间的某点与隶属度之间的映射关系。整 个模糊化的过程就是将输入的确定值用各个模糊集合的隶属度来表示。 模糊推理过程利用模糊逻辑将由模糊化过程得到的输入模糊集的隶属度映射到输出 模糊集的隶属度。经常用到的模糊逻辑有a n d 和o r 等,对于模糊集中的a n d 逻辑来说, 取隶属度最小,而o r 取隶属度最大。在模糊推理过程中要利用模糊规则,常用的是i f t h e n 结构,如“i f ( xi sa ) a n d ( yi sb ) t h e nzi sc ”,其中,a b 为输入模糊集,c 为输出模糊 集,利用模糊逻辑可以得到条件成立的隶属度,那么结论的隶属度与之相同。在一般应用 塑室堕皇奎兰堡主堕壅竺堂竺堡塞 笙三里堡塑堡型笙些塾望堡竺型塑坌 中有多个模糊规则,每个模糊规则确定了输出在某个输出模糊集的隶属度,在各个模糊集 的重合部分取隶属度最大值,这样得到最终输出的隶属度图形,这种推理方法称为最大一 最小法。 在模糊过程中,得到了输出的隶属度图形,反模糊化过程是要将不确定性映射到确定 的输出,如取隶属度图形的重心、二分法等。 行为规则集是由多条“i f - t h e n 形式的语句构成,代表推理规则;模糊子集隶属度函 数库是对行为规则中的模糊概念的数学理解和定义,用于对输入物理量的模糊化;算法库 则包含模糊推理过程中用到的模糊算子以及将模糊输出反模糊化为确定数值的算法;系统 的输出常常对应于可以改变系统状态的物理量。 一个实际的模糊推理系统的输入、输出变量可以有多个;规则的多少、规则的重叠程 度、隶属度函数的形状等都是可以灵活设置的。这虽然增加了控制上的灵活性,但是也使 得系统的建立和调整不容易把握,需要经过反复的修改和调整才嗡皂得到比较满意的结果。 2 3 模糊推理在图像中的应用 自1 9 6 5 年z a d e h 提出模糊集概念以来2 2 1 ,关于模糊系统的研究得到了迅猛的发展,这 种研究在理论与应用两方面都取得了丰硕的成果。基于模糊集的信号处理方法在诸多领域 获得了广泛的应用,并取得了满意的效果和可观的效益,其应用范围涉及到通信系统中的 信道均衡、矢量量化编码中码书设计、时间序列的预测、神经网络的训练、非线性系统辨 识、参数估计、医学诊断、天气预报、食品分类、水质分析等众多领域,取得了令人瞩目 的成功。 2 3 1 模糊集图像处理的特点 模糊集合的理论和方法是一种能够有效针对那些非精确、不完全类信息的有效处理手 段,从单纯的“硬”计算环境拓展至更为广阔的“软”计算s c ( s o f t w a r ec o m p u t a t i o n ) 领域,它与人脑的功能相对应。自从1 9 6 5 年z a d e h 提出模糊集理论之后,模糊集的理论和 方法在各方面取得了广泛的应用,特别是在控制和图像处理方面,其应用已经比较成熟, 如图像的模糊形态学处理、模糊增刮2 引、模糊分类和模糊边缘检测1 2 7 i 等。最近几年来, 将模糊集合理论和方法应用到对视频信号的处理和压缩方面也取得了进展1 2 8 l1 2 9 l 。 在模式识别中,两个最主要的分支为有监督分类和无监督分类两个方面,其中无监督 分类与聚类分析相对应。在没有训练样本的情况下,模糊聚类可根据数据集的内在结构通 过机器学习自动划分特征空间,达到自动分类的目的。基于模糊规则的推理是用人类推理 1 2 堕塞堂皇奎兰堡主型壅生兰垡堡壅 笙三童堡塑堡些笙垄苎鬯堡竺墨箜坌 的语言来描述如何处理的指示,即用普通语言形式描述处理的规则,并可以转化为数学算 子的结构,可以广泛应用于控制理论和数字视频的后处理中。 在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论