(通信与信息系统专业论文)基于ica的多媒体特征分析和信息隐藏技术.pdf_第1页
(通信与信息系统专业论文)基于ica的多媒体特征分析和信息隐藏技术.pdf_第2页
(通信与信息系统专业论文)基于ica的多媒体特征分析和信息隐藏技术.pdf_第3页
(通信与信息系统专业论文)基于ica的多媒体特征分析和信息隐藏技术.pdf_第4页
(通信与信息系统专业论文)基于ica的多媒体特征分析和信息隐藏技术.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东大学硕士学位论文 摘要 先进的信号处理方法与互联网技术的发展促进了多媒体技术的飞速发展与广 泛流传。与此同时人们对多媒体作品的需求也与日俱增,而这则更加需要先进的 信号处理方法来推动。随着多媒体作品的广泛传播,版权保护问题也成为当前亟 需解决的重点问题。版权保护可以采用传统加密技术与数字水印技术。其中数字 水印技术属于信息隐藏技术之中,是信息隐藏技术的一个重要应用,被视为版权 保护的先进的、主要的手段。信息隐藏技术同样需要先进的信号处理技术来满足 其鲁棒性、隐密性及高信息隐藏容量。 本文在研究多媒体信号处理方法及信息隐藏技术的基础上做出如下工作: l 、基于i c a 的多媒体特征分析方法研究 提出将下采样与i c a 相结合的信号处理方法,该方法在将多媒体信号采样的 基础上再进行i c a 处理。该方法不同于传统的基于分块的i c a 特征提取方法,传 统的分块法破坏了原始信号的全局特性,提取的特征只具有原始信号的局部特性, 表征的意义并不是很明显。而基于采用的i c a 信号处理方法提取的特征具有原始 信号的整体特性,并且与小波多尺度分析十分相似。在本文中我们称这种方法为 i c a t ( i n d e p e n d e n tc o m p o n e n ta n a l y s i st r a n s f o r m ) 。 一 2 、基于i c a t 的多媒体信号处理及在数字水印方面的应用 以小波多尺度分析为衡量标准讨论i c a t 方法的性能。这种i c a t 方法具有如 下优势:图像中提取的近似分量能量集中、提取边缘明显、细节分量含有方向信 息丰富等优势;视频中提取运动目标清晰、顺序与原始视频一致的优势。最后, 将i c a t 与数字水印理论相结合,讨论可行性和优劣性。 3 、基于语音隐藏的网络通信系统的方案 提出一种基于语音隐藏的网络通信系统的方案,该方案在语音网络电话软件 的基础上,加入低速语音编解码、纠错码编解码等模块,将要隐藏的语音进行编 码,然后采用经典的信息隐藏方案l s b 等隐藏于语音载体之中,以实现隐秘通信。 关键词:多媒体特征分析、i c a 、下采样、信息隐藏、语音网络通信 山东大学硕士学位论文 a b s t r a c t t h ed e v d o p m e n to fa d v a n c e ds i g n a lp r o c e s s i n ga n di n t e r n e tt e c h n i c a ln o to n l y a c c e l e r a t e st h er a p i d l yd e v e l o p i n ga n dw i d e l yb r o a d c a s t i n go fm u l t i m e d i a , b u ta l s oc a n s a t i s f y t h ep e o p l e s i n c r e a s i n gr e q u i r e m e n t o fm u l t i m e d i a w i t ht h e w i d e l y b r o a d c a s t i n g o ft h em u l t i m e d i aw o r k s ,t h e c o p y r i g h tp r o t e c t i o n b e c o m e sa c o n s i d e r a b l ec o n t e n tt ob es e t t l e d t h em e a s u r e so fc o p y r i g h tp r o t e c t i o nc o u l da d o p t e n c r y p t i o na n dd i g i t a lw a t e r m a r k i n gt e c h n i c a l a n dt h ew a t e f m a r k i n g , s u b o r d i n a t et o t h et e c h n i c a lo fi n f o r m a t i o nh i d i n g , i sc o n s i d e r e da st h em a i na n dt h ed 酬v ef a s h i o n o fc o p y r i g h tp r o t e c t i o n i tr e q u i r e sr o b u s t n e s s , i n v i s i b i l i t ya n dh i g hh i d i n gc a p a c i t y , w h i c h r e l yo na d v a n c e ds i g n a lp r o c e s s i n g a c c o r d i n gt ot h ea b o v ec o n t e n t s ,t h i st h e s i sr e l a t e dt h e s ep o i n t sa n dt h em a i n c o n t r i b u t i o ni n c l u d e st h ef o l l o w i n gp a r t 赞 1 r e s e a r c ho ni c a - b a s e dm u l t i m e d i af e a t u r ea n a l y s i sm e t h o d an o v e li c a - b a s e dm u l t i m e d i ap r o c e s s i n gm e t h o d , c a l l e di c at r a n s f o r m ( i c a t ) i sp r o p o s e d i n s t e a do ft h et r a d i t i o n a lb l o c k i n g , i c a td e r i v e sm o r et h a no n e s u b s i g n a l sf r o mo r i g i n a lo n eb yd o w n - s a m p l i n g , a n df e a t u r e sa r eo b t a i n e df r o mt h e s e s u b - s i g n a l sb yu s i n gi c a t h a th e l p si c a te x t r a c t s f e a t u r e sw i t ht h eg i o b a l c h a r a c t e r i s t i c so ft h eo r i g i n a l ,a n dt h ef e a t u r e sa r es i m i l a rt ot h o s ee x t r a c t e db yd w t 2 r e s e a r c ho nt h ep e r f o r m a n c ea n da p p l i c a t i o no ft h en o v e li c a - b a s e d m u l t i m e d i af e a t u r ea n a l y s i sm e t h o d t h ec o m p a r i s o nb e t w e e ni c a ta n dd i g i t a lw a v e l e tt r a n s f o r m w di s p e r f o r m e di nm u l t i m e d i ap r o c e s s i n g , w h i c he x h i b i t st h a tt h er e s u l t so b t a i n e db yu s i n g i c a th a ss o m e t h i n g s u p e r i o r h i g ho c c u p a t i o n r a t i oo fl o wf r e q u e n c yi nt h e a p p r o x i m a t ec o m p o n e n t ,m u l t i - d i r e c t i o n a lp r o p e r t i e si nd e t a i lc o m p o n e n t s ,t h em o t i o n o b j e c t sa n db a c kg r a n de x t r a c t i o ni nv i d e oa sw e l l f i n a l l y , t h ei c a - b a s e dm u l t i m e d i a p r o c e s s i n gm e t h o di sa p p l i e dt od i g i t a lw a t e r m a r k i n gt od i s c u s st h ef e a s i b i l i t yo ft h e i d e a 3 r e s e a r c ho nn e t w o r kc o m m u n i c a t i o ns y s t e mb a s e do ns p e e c hi n f o r m a t i o n h i d i n g 2 山东大学硕士学位论文 an e t w o r kc o m m u n i c a t i o ns y s t e mb a s e do ns p e e c hi n f o r m a t i o nh i d i n gi s p r e s e n t e di nt h i sp a r t i nt h i ss c h e m e , l o w - r o t e - a u d i oe n c o d h l g d e c o d i n gm o d u l ea n d e r r o r - c o r r e c te n c o d i n g d e c o d i n gm o d u l ea r oa d d e di n t on e t w o r ka u d i oc o m m u n i c a t i o n s o f t w a r e b yu s i n ga b o v em o d u l e st h ea u d i oi sp r o c e s s e da n de n c o d e d , a n dt h e nt h e e n c o d e da u d i od a t aw i l lb eh i d d e ni nc a l t i e l a u d i od a t ab ya p p l y i n gi n f o r m a t i o nh i d i n g t e c h n i c a l t l l i ss c h e m ec o u l da c h i e v et h es e c u r ea u d i oc o m m u n i c a t i o no nn e t w o r k k e y w o r d s :m u l t i m e d i as i 盟a lp r o c e s s i n g , i c a ,d o w n - s a m p l e , i n f o r m a t i o nh i d i n g , a u d i on e t w o r kc o m m u n i c a t i o n 3 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研 究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明 的法律责任由本人承担。 论文作者篷名:主挺j 星= 日 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学 校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论 文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段 保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:;隆;堡二导师签名: 山东大学硕士学位论文 第一章绪论 1 1 多媒体信息处理与信息隐藏技术 多媒体技术是计算机技术和社会需要的综合产物。计算机技术的飞速发展、 应用领域的不断扩展,在很大的程度上促进了多媒体技术的发展和完善。另一方 面,人们对多媒体信息的需求也越来越多,这使得多媒体技术由当初的单一媒体 形式逐渐发展到目前的文字、声音、图像、活动的视频等多种媒体形式。多媒体 技术是建立在计算机技术基础上的,它需要多媒体计算机硬件的支持,包括处理、 存储与传输。在多媒体技术早期应用申,是以存储和处理巨大的信息量作为代价 的;同时,多媒体信号的传输也经常存在着各式各样的干扰这给多媒体信号的 存储、传输带来了不便,阻碍多媒体技术的进一步发展和推广。多媒体技术发展 离不开高质量的信号处理技术。随着多媒体技术和相关技术的发展,促进了针对 ,多媒体数据的信号处理技术蓬勃发展。采用先进的信号处理技术可以使多媒体的 处理、存储与传输变得更加便利。从模拟信号到数字信号的转变,到今天广为应 用语音的m p 3 压缩技术、图像的j e p g 压缩技术、视频的m e p g 压缩技术等,这 些以先进的信号处理技术为基础的方法,提高了数字信息的传输的质量,同时也 使得存储变得更加方便【l 】。 随着多媒体信息处理技术和计算机网络的飞速发展,数字多媒体产品的存储、 复制、获得和传播变得越来越容易。这在最大限度地拓宽合法用户利益范围的同 时,也使出于不同目的的盗版和侵权行为有可乘之机。如何在网络环境中实施有 效的版权保护和信息安全手段,已经引起了国际学术届、企业以及政府部门的广 泛关注【2 羽。其中,如何防止数字产品,包括电子出版物、音频、视频、动画、图 像产品等被侵权、盗版和随意窜改,已经成为世界各国亟待解决的热门课题。 为解决信息安全和版权保护问题,首先应用的是传统的密码技术。密码技术 是信息安全技术领域的主要传统技术之一,是基于s h a n n o n 信息论及其密码学理 论的技术,一般采用将明文加密成密文的秘钥密钥系统或公钥密钥系统。基于私 4 山东大学硕士学位论文 用或公共密钥的密码技术可以用来控制数据访问,它将明文消息变换为旁人无法 理解的密文消息。但是,一旦信息被非法破解,就没有任何直接证据来证明信息 被非法复制和转发。为弥补密码技术的缺陷,人们寻求了一种新技术对加密技术 进行补充,从而使解密后的内容仍能受到保护,这就是信息隐藏技术。信息隐藏 技术:主要研究如何将某一机密信息秘密隐藏于另一公开的信息 载体) 中,然 后通过公开信息的传输来传递机密信息。第三方则难以从公开信息中判断机密信 息是否存在,难以截获机密信息,从而能保证机密信息的安全。这个机密信息一 方面可以作为我们要传递的重要信息,如军事指令、商业机密或者是密钥;另一 方面可以作为版权标志数字水印。隐秘通信与数字水印是信息隐藏的两个重 要分支。数字水印技术主要应用于数字产品版权保护中。它是指嵌入数字产品中 的数字信号,可以是图像、文字、符号、数字等一切可以作为标记、标识的信息。 数字水印分类的标准很多,其中用于版权保护的鲁棒性水印是目前研究的热点。 常用的多媒体信号有语音、图像等信号,这些种信号的数字作品通常被作为 版权保护的内容;同时,由于这些多媒体信号广泛流传,语音、图像与视频也被 作为隐秘通信的载f i r 。当前,信息隐藏方案研究成为热点,也出现了多种各种隐 藏方案。 对于语音信号,信息隐藏方案有:c o o p e r m a n 提出的最低有效位( l s b ) 方 法嘲,该方法隐秘容量大、实现简单,但鲁棒性较差。b e n d e r 等人提出相位编码 方法r 兀,该方法通过修改音频数据的傅立叶系数的相位值将信息隐藏到音频数据 中,鲁棒性较高;l e ec 等借鉴扩频原理,将通信信息作为噪声隐秘到载体数据 的频谱中,该方案具有较高的鲁棒性【8 】。回声隐藏法是由o r u u h l 等人提出的,该 算法是通过改变话音回声延时来隐秘信息,但隐秘信息量很少。此外,还有基于 融合技术的隐藏算法【9 1 和基于编码的信息隐藏算法【1 0 , 1 1 1 ,其他的方法都是这些方 法的改进算法。 对于图像信号,最初的方案为最低有效位( l s b ) 方法,将要隐藏的信息或 者数字水印隐藏在图像像素的最低有效位中,这种方法简单但不可靠。图像变换 域嵌入方法也有很多种如:c o x 等【1 2 】提出了基于全局d c t 变换的图像数字水印 算法,先对整个图像进行d c t ,然后将水印通过直接序列扩频的方法嵌入到d c t 5 山东大学硕士学位论文 系数上。z e n g 等提出基于分块d c t 的水印方法。r u a n a i d h 掣1 4 】提出了基于离 散傅立叶变换( d i s c r e t ef o u r i e rt r a n s f o r m ,d f t ) 的数字水印系统。b e r b e c e l 和 h s u 掣l $ , 1 6 贝l j 提出在离散小波变换( d i s c r e t ew a v e l e tt r a n s f o r m , d w t ) 域中来实 施水印的嵌入。g o n z a l e z - s e r r a n o 1 7 】首先把i c a 应用于图像信息隐藏,他将图像 分块进行i c a 分解,在获得的图像特征上嵌入水印,得到了一种易碎水印方案。 这些变换域的方法得到了很好的效果,也得到了进一步的研究和应用。 信息隐藏技术要求信息隐藏算法具有不可见性、鲁棒性、较高的信息容量。 这三个方面也是信息隐藏技术的三个最重要的特征。其中,不可见性( 透明性、 隐蔽性) :要求嵌入的信息( 数字水印) 对载体信号的质量没有影响,不易被人察 觉或感知到。鲁棒性( 稳健性、顽健性) :所谓鲁棒性是指在经历各种无意或有意 的信号处理过程后,隐藏的信息( 这里主要是指数字水印,隐秘通信鲁棒性要求 并不是很高) 仍能保持完整性或仍能被准确鉴别。可能的信号处理过程包括信道 噪声、滤波、数模与模数转换、重采样、剪切、位移、尺度变化以及有损压缩 编码等。信息容量就是指特定的载体信号,在满足一定信号质量的前提下,可以 容纳最大的数据隐藏量。这三个重要的方面同样需要先进的信号处理技术作为基 础,先进的信号处理方法可以促进信息隐藏算法发展,使得信息隐藏技术具有更 好的不可见性、鲁棒性和信息容量性 1 2经典多媒体信号处理方法 当前,常用的多媒体处理方法可分为基于时间域( 空间域) 的及变换域的处 理。时域( 空间域) 中处理技术通常有时延、尺度变换、插值、采样、旋转,滤 波等;变换域中信号处理的方法通常有傅立叶变换、小波变换等等。信号的变换 域处理技术是常用信号处理方法,这种技术的中心思想是将信号分解成基信号的 叠加。这些基信号可以表现出原始信号的特性,如频率特性、时频特性等。 傅里叶变换是将一个信号的时域表示形式映射到一个频域表示形式,对一个 信号做傅立叶变换,可以得到其频域特性,包括幅度和相位两个方面。傅立叶变 化的基为正弦或余弦信号。这些正弦或余弦信号相互正交,代表了信号的频域特 性。傅立叶变化对信号处理包括频谱分析、去噪声和数据压缩。傅里叶变换的压 6 山东大学硕士学位论文 缩,已经广泛应用了。它的简化版本就是离散余弦变换( d c t 变换) 。 离散余弦变换( d i s c r e t ec o s i n et r a n s f o r m ,简称d c t 变换) 是一种与傅立叶 变换紧密相关的数学运算。在傅立叶级数展开式中,如果被展开的函数是实偶函 数,那么其傅立叶级数中只包含余弦项,再将其离散化可导出余弦变换,因此称 之为离散余弦变换。离散余弦变换( d c t ) 被认为是对语音和图像信号进行变换 的最佳方法。由于近年来数字信号处理芯片( d s p ) 的发展,加上专用集成电路 设计上的优势,这就牢固地确立离散余弦变换( d c t ) 在目前图像编码中的重要 地位,成为h 2 6 1 、j p e g 、m p e g 等国际上公用的编码标准的重要环节。 信号通过傅立叶变换表现的是频率特性,但是不同的频率的基信号出现的时 间是无法确定,因此后来出现信号时频分析工具小波理论。对于数字信号分 析其视频特性采用的变换为离散小波变换( d 、t ) 。 离散小波变换( d w t ) 是当前研究和应用比较广泛的信号处理方法,经过十 一几年的探索研究,理论基础已经非常成熟。离散小波变换( d w t ) 是以相互正交 的母小波为基函数,是时间和频率的局域化的变换,因而能有效地从信号中提取 时频分布参数。通过伸缩和平移等运算可对函数或信号进行多尺度的细化分析, 解决了傅立叶变换不能解决的许多问题,被认为是时间尺度分析和多分辨率 分析的一种新技术【1 8 】。目前,它在信号分析、语音合成、图像识别、计算机视觉、 数据压缩、地震勘探、大气与海洋波分析等方面的研究都取得了有科学意义和应 用价值的成果。离散小波变换( d w t ) 用于信号特征提取与图象压缩是小波分析 应用的重要方面。在图像压缩中,它的特点是压缩比高,压缩速度快,压缩后能 保持信号与图像的特征不变,且在传递中可以抗干扰。基于小波分析的压缩方法 很多,比较成功的有小波包最好基方法,小波域纹理模型方法,小波变换零树压 缩,小波变换向量量化压缩等。当前,以小波分析为基础的j e p g 2 0 0 0 压缩技术 已经开始商用。另外,小波也作为了信息隐藏的主要手段,人们通常将秘密信息 或是数字水印隐藏于小波提取信号载体的特征中,研究结果也证明了,通过小波 变换隐藏信息可以得到高性能的隐藏方案。 当前,小波理论体系已经比较完备,与其他信号处理方法相比,小波分析也 具有明显的优势,也得到的很好应用。但是人们从来没有放弃其他的信号处理方 法的研究。独立分量分析( i c a ) 是近年来在信号分析与处理中发展起来的一种 7 山东大学硕士学位论文 新方法,通过独立分量分析( i c a ) 提取的信号特征相互独立。独立分量分析( i c a ) 作为一种有效的盲源分离技术( b s s ) 是信号处理领域的热点,其实质是寻求一种线 性变换,将一组随机变量表示成一组统计意义上相互独立变量的线性组合【1 9 1 。目 前这种方法已经广泛应用于特征提取、生理学数据分析、语音信号处理、图像处 理、人脸识别和数字水印等方面,并已取得很多研究成果,使得独立分量分析在 信号处理中的应用成为研究热点。 当前,多媒体信号研究蓬勃发展,各种多媒体信号处理的标准也孕育而生, 但其发展还远远满足不了人们的需求,人们也没有放弃继续研究新的处理技术。 先进的信号处理不仅可以促进多媒体的应用和传播,同时也能对多媒体信号作品 起到保护作用。 1 3 本文研究内容和主要贡献 本文主要研究信号处理及信息隐藏,在研究中采用了d c t 、d w t ,i c a 等信 号处理方法。其中,i c a 是当前信号处理研究的热点之一,一已经应用于信号处理 的各个方面,但是的当前利用i c a 方法提取信号特征的方法都是采用加窗法,尽 管这种方法应用十分广泛i 但存在特征意义不明确或者提取的特征只能代表信号 局部特性,本文在这个基础上做出如下工作: 1 将下采样法与i c a 结合,提出一种新颖的多媒体特征分析方法一i c a t 。 该方法通过采样因子为2 的下采样将图像分成大小相同、内容极为相似的四个子 图。再四个子图作为i c a 模型的观测信号进行i c a 处理,得到四个相互独立的四 个分量。再将这种i c a t 方法与小波多尺度分析进行比较,得到这种方法与小波 多尺度分析比较具有能量集中,稀疏性强,边缘提取效果好的特点,并指出该方 法更加适合于图像压缩方面。 2 将i c a t 这种方法应用于视频处理与数字水印中。通过实验发现这种方法 与小波分析理论相比在视频处理上的优势。在第二章和第三章介绍和讨论的基础 上将i c a t 应用于数字水印技术中,得到了这种方法的可行性,并指出该方案作 为一种新颖的版权保护方法与经典小波方案相比的优劣性。 3 隐秘通信是信息隐藏的另一个分支,本文设计一种基于信息隐藏安全技术 8 山东大学硕士学位论文 的语音网络电话系统方案。此系统实在v c 6 开发环境平台下,调用w i n d o w 底层 音频采样,w i n d o w s 套接字( s o c k e t s ) 进行开发实现网络通信,并在此基础上提出 通过开辟新的缓存读取音频载体,并添加低速语音编码模块,纠错码编码模块对 采集的秘密语音进行编解码,然后采用l s b 隐秘方案实现语音隐藏和提取方案。 除了本章的综述外,论文其余各章的主要结构如下: 第二章介绍了作为本文研究的数学工具独立分量分析,介绍包括模型、 和快速算法;另外,介绍了i c a 在信号处理的应用情况,最后重点介绍基于分块 法( 加窗法) 的i c a 特征提取方法。指出分块法i c a 特征提取的局限性,为第三 章打下伏笔。 第三章提出了一种新颖的基于i c a 的信号处理方法,该方法将采样法与i c a 相结合,在文中称为i c a t 。本章中介绍了这种方法的模型与应用,指出了其与小 波多尺度分析的相似性,并将这种方法与小波理论进行比较,得到了这种方法在 概貌分量能量集中性、细节分量稀疏性强、边缘提取效果好的优势。说明该方法 是一种有前途的多媒体信号处理方法。 第四章是这种方法在其他方面应用的研究。主要是集中于视频方面应用。最 后由于数字水印技术是基于信号处理算法的,因此我们将这种方法应用于研究热 点之数字水印理论中。讨论了这个方案的可行性与性能。 第五章中,由于对信息隐藏技术的研究,提出了一种基于信息隐藏安全技术 的语音网络电话系统方案,介绍了这个方案的结构与隐藏思路,分析了方案的语 音通信安全性与可实施性,并讨论这个方案的优劣性。 一 第六章在总结本论文主要研究内容基础上,分析展望了今后所需继续进行的 相关研究工作。 1 4 小结 本章回顾了一下多媒体信号处理技术及信息隐藏方面的研究,介绍了本文中 使用的经典多媒体信号处理方法。最后,概括阐述了本论文的研究内容和主要贡 献。 9 山东大学硕士学位论文 2 1 引言 第二章基于1 0 a 的多媒体信号处理 独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 是近年来在信号分析 与处理中发展起来的一种新方法,目前已经广泛应用于特征提取、盲源信号分离、 生理学数据分析、语音信号处理、图像处理和人脸识别加- 2 3 等方面,并已取得很 多研究成果,使得独立分量分析在信号处理中的应用成为研究热点。 独立分量分析不同于其他多媒体信号处理方法。一些方法对信号的分解的分 量只能保证是不相关的,并不能保证相互独立( 除非提取出的分量是高斯过程的, 因为高斯信号如果不相关就意味着独立) 。因此,这就使得这样的分解能够能多的 具有实际( 生理) 意义,提高了所提取特征的典型性。因此i c a 被视为一种具有 很好的应用前景的信号处理方法。 2 2 独立分量分析 独立分量分析可以看作是主分量分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 的 一种扩展,它不同于主分量分析把目光投注于信号的二阶统计量,研究信号间的 相关关系,而是基于信号的高阶,研究信号间的独立关系,它将数据变换到相互 独立的方向上j 使经过变换所得到的各个分量之间不仅正交,而且相互独立洲。 2 2 11 0 的数学模型 假设混叠系统是由m 个传感器和刀个源信号组成,源信号与观测信号满足: x a s( 2 一1 ) 其中源信号墨= 【而,屯,】t 的刀个分量是相互统计独立的,而观测信号 x = 喃,恐,】t 是源信号刀个分量的混叠,彳为m 刀维的混叠权系数矩阵。 盲源分离就是求解分离矩阵,通过下面的公式可以恢复源信号: l o 山东大学硕士学位论文 j ,( f ) = f v x ( t ) ( 2 2 ) 通常假设源信号各分量如,i = l ,2 ,刀 相互统计独立。利用假设,根据测度信号独 立性的准则获得分离矩阵,可以恢复出相互统计独立的源信号,因而这一过程称 为独立分量分析( i c a h l d e p 锄d e n tc o m p o n e n t a n a l y s i s ) 2 5 ,这个过程如图2 1 。 图2 1 信号混叠及盲源分离系统框图 2 2 2i c a 的约束条件和不确定性 1 约束条件 在i c a 模型中,由于源信号s 和混叠系统彳均未知,如果没有任何先验知识, 仅从观测信号z 通过i c a 恢复出源信号是极为困难的,因此为了能使i c a 问题可 解,一般需要做如下假设【1 9 】: ( 1 ) 混叠矩阵彳非奇异,从而要求它列满秩,即m n 。一般设m = n ; ( 2 ) 源信号各个分量,i = 1 , 2 , 相互统计独立; ( 3 ) 源信号中最多有一个高斯信号。 2 不确定性 在进行i c a 时,对混叠矩阵彳的辨识是一个病态问题,不可能实现对混叠矩 阵的完全辨识,即使在上述三个约束条件下,i c a 仍然存在两个不确定性: ( 1 ) 恢复出来的源信号幅度的不确定性; ( 2 )恢复出来的源信号各分量次序的不确定性。 对于第一个不确定性,在不考虑噪声时,对源信号分量( f ) 和对应混迭矩阵a 的列向量a ,分别乘和除以一个固定的标量因子d 豇r 对观测信号的值没有任何 山东大学硕士学位论文 影响。对于第二个不确定性,没有任何方法可以预先知道源信号各个分量的最初 排列顺序。对于源信号各分量相互独立的假设,估计的源信号各个分量的任何置 换仍是满足这一假设的解。一般地说,信号的绝大多数信息包含在其波形上,而 不是信号的幅度和次序。因此,i c a 的这两个不确定性不会阻碍其应用。 2 3 常用的ic a 算法及f a s t lc a 大多数i c a 算法都是由准则函数和优化算法这两部分组成,即从恢复源信号 的独立性出发来设计i c a 学习网络的准则函数,再通过一定的优化算法使准则函 数极大化或极小化,从而求得问题的解。其中,准则函数的选择决定i c a 算法的 统计特性,如算法的一致性、渐进性和鲁棒性;而优化算法主要决定i c a 算法的 算法特性,如收敛速度、存储要求和数值稳定性。 目前,i c a 的算法有很岁2 5 之7 】,如i n m a x 算法【2 6 1 、j a d e 算法阴等。 多媒体信号中,图像、视频信号主要是亚高斯信号,对图像视频分离和特征 提取效果较好的有m m i 算法、f 嬲t i c a 算法等。由于f 勰t i c a l 2 5 】的收敛速度很快, 是目前i c a 使用的主流算法。在下面的研究中我们就采用f 弱t i c a 算法来进行多 媒体信号处理研究,因此这里主要对这种算法进行介绍。 一 f 弱t i c a 算法是一种快速的定点独立分量分析法则。它首先对观察信号利用主 分量分析( p c a ) 进行预白化,将观察信号x 变换成y 窖强,使得y 的分量具有 单位方差且互不相关, ,的自相关矩阵是单位阵,z 为白化阵 f a s t i c a 利用基于峭度的目标函数: 加以r v ) :e i _ r v ) 4 】一3 扛晒r y ) 2 胪:e l p r v ) 4 一3 0 d l l 4 ( 2 - 3 ) 分离矩阵的训练公式为: d ) = e 卜p 一1 ) l ,) 3j 一3 d 一1 ) ( 2 4 ) 其中k 是迭代次数,整个的分离矩阵为c = d r t 。 f 邪t i c a 中用定点迭代的方法代替了传统的基于梯度的方法来获得分离矩 阵,它以三次方进行收敛,一般只需要5 1 0 次迭代就可以达到收敛,速度是传统 1 2 山东大学硕士学位论文 方法的1 0 1 0 0 倍。另外,f a s t i c a 在提取独立分量的时候,是逐个进行估计的, 并且在进行每个独立分量提取前,先将分离矩阵中对应的列向量进行正交归一, 然后再进行相应的提取,这样最后得到的分离矩阵是正交矩阵。 2 4lc a 在多媒体中的应用 独立分量分析算法由于具有处理后分量相互独立的特点,被作为一种信号处 理的新方法,在通信信号处理、语音信号处理、生物医学信号处理、金融数据分 析、阵列信号处理以及通用信号分析等方面有着非常重要的应用。这种方法最初 是被用于信号分离中,通常把一些信号视为相互的独立的信号相混叠得到的,经 过i c a 分解后可以得到这些相互独立的信号。如l e e 和b e l l 2 8 】将基于信息最大传 输或最大似然算法得出的盲源分离训练算法进行盲反卷积,并用于真实记录的语 音信号分离。实验证明经过分离后的语音,其识别率得到提高。m a k e i g 、j u n g 和 b e l l 等用i c a 的方法将从脑电信号中记录的事件相关的相应数据分解为与传感器 数量相等的成分,这一分解为在不同事件刺激下脑电信号的进一步研究提供了方 便。m c k e o w n 2 9 等还将i c a 用于分析核磁共振成像数据集。与主分量分析( p c a ) 比较表明,i c a 在与任务相关的活动数据的时空扩展估计方面起到改善作用。 s a h l i n 和b r o m a n t 3 0 】在移动通信的手机中增加一个麦克风,用i c a 算法来改善通 信中信号传输之前的信噪比。i c a 也被应用于金融数据中寻找潜在因素,研究者 指出i c a 有可能揭示一些其他方法无法找到的内在推动因素。 本章中我们主要关注i c a 在多媒体信号处理方面的特性。i c a 在多媒体信号 分析中的应用也得到了极大关注。首先,a b d a u a h 和p l u m b l e y t 3 1 】应用i c a 来进行 音频特征的提取;其次图像方面,芬兰学者k a r h u n e n 和h y a r i n e i l 3 2 】等将他们提 出的定点i c a 算法用于提取图像的特征和分离医学脑电信号。s e j n o w s k i 和b e l l e 3 3 】 也指出,图像边缘就是自然图像的独立成分,而一幅图像就是若干独立分量的线 性混叠,而且用i c a 进行图像分析在保持图像的局部性和方向性特征方面比p c a 更优越,更重要的是,用i c a 从输入图像中进行图像分析时是以一种完全无监督 方式。i c a 在人脸特征提取的研究中也得到了应用,并且取得了很多成果【3 4 1 。再 次,学者们的研究证明i c a 提取出来的图像特征与人类视觉上感知细胞感知的特 山东大学硕士学位论文 征有很大的相似性,进而展开了i c a 在视频方面的应用研究瞰】。最后,由于在多 媒体信号中提取特征的优越性,i c a 在数字水印研究中也已崭露头角。 g o n z a l c z s e r r a n o 3 6 】首先在这方面进行了尝试,他将图像分块进行i c a 分解,在 获得的图像特征上嵌入水印,得到了一种易碎水印方案。h a r o l ds z u 论述了i c a 在数字水印上应用的可行性,在图像、音频数字水印方面都进行了尝试【3 扪,并 展望了其广阔的应用前景。从此,i c a 在数字水印领域的应用更加引起了研究者 们的关注。其中,s b o u n k o n g 等【3 9 】利用了i c a 提取出基于图像块的特征,在分 析了特征的性质后将水印嵌入到这些特征上。该方案表现出了比基于d c t 、d w t 的水印方案更好的性能。 以上这些i c a 在多媒体信号的应用中,我们不难发现它们都有着共同的特点。 这就是都不离开信号的特征提取。基于i c a 的特征提取为各种多媒体信号处理提 供了很好的支持。基于i c a 的特征提取已经成为多媒体信号处理研究的重要内容。 2 5 多媒体信号基于i c a 的特征提取 i c a 在多媒体信号处理中的应用主要是基于i c a 对多媒体信号的特征提取。 特征提取的本质是将高维向量空间映射到一个低维子空间中,使得原来在高维空 间中表示的复杂信号投影到低维空间后,+ 其与分类有意义的主要特征得以显现。 特征提取的主要目的是找到对观测信号的一组特征表示设计对观测信号的统计 生成模型是信号处理的基本方法,生成模型中的各个分量组成了对观测数据的一 种表示,这种表示可以用于数据的压缩、去噪声和模式识别等任务中。 在著作【删中,h y v a r i n c n a 指出i c a 模型与特征提取的相似性:对于信号的 表示目前一般是基于对观测信号的离散线性变换来进行的。假设一个信号其在某 个采样点x 的信号值表示为j ( z ) 。信号处理中的许多基本模型将该信号,( 曲表示 为一系列的特征或几函数岛( 功的线性叠加的结果: ,( 功= q ( x ) 墨( 2 - - 5 ) 其中墨为随机系数,每一个信号,( x ) 对应的墨是不相同的。由此简化为对于信号 1 4 山东大学硕士学位论文 向量x = ( 毛,x 2 ,) r ,信号的表示为: x = a s( 2 6 ) 这种简洁的表示与基本的i c a 模型完全相同。我们可以假设变换后的表示成分的 数量与观测信号相同。这种线性叠加模型给出了一种信号在低阶的有效描述,这 里舍弃了高阶的非线性部分。 另一个方面,对于多媒体信号而言,其中大部分重要特征信息与信号的高阶 统计特性有着密切的关系,如图像的边缘信息等与图像的像素的高阶统计特性有 关,而独立分量分析算法提取的正是这些高阶信息,因此,独立分量分析算法在 多媒体特征的提取中能发挥着重要的作用。 2 5 1 基于分块的i c a 特征提取 在当前实际应用,并没有直接采用公式( 2 6 ) 来建模多媒体信号,通常是将 多媒体信号分块或是利用窗口将其分解。 对于图像,通常是将图像分成8 8 或是1 6 x1 6 像素块,如图2 2 ,并把这些 块作为i c a 模型中的观测信号,再通过i c a ,得到源信号;对于语音信号,通常 是将语音分成若干段,将这些段作为观测信号进行i c a 处理。 这里我们以图像作为实例来进行方法的说明。通过上述方法得到的这些源信 号是相互独立的,可以视为图像的特征,因此这一过程可以称作特征提取。而基 于分块法( 加窗口) 的这种方法我们称之为基于分块( 加窗口) i c a 特征提取法。 原始图像分成8 x 8 或1 6 1 6 的块 图2 2 分块法 图2 3 是自然图像采用基于分块( 加窗口) i c a 提取的基向量。通常为了更 能表现出特征,人们采用一些标准化手段。具体做法为:首先将图像进行线形标 1 5 山东大学硕士学位论文 准化,使得像素具有零均值、单位方差;然后将图像分成块,再进行f a s t i c a 方 法进行处理,最后得到i c a 的向量基。h y v m s n e n a 指t i l t e :这些基向量显然在 空间、频率、方向这三个方面都具有局部性。而且这些特征与g a b o r 函数十分相 似,并且也指出这些基向量与小波也有相似的联系。最后在另用i c a 模型去噪讨 论中,又把经过分块( 加窗口) i c a 信号处理方法得到的基向量与稀疏编码联系 起来,在实验中说明i c a 信号处理方法的具有的优势。另外,h 毗e r 也通过这 种方法提取特征。这些特征能被证明含有原始图像的一些方向边缘,因此被用作 图像重构的基h “。此外,h a t 脚 e n 证明了这些特征与人类视觉( h m n a nv i s u a lc o r t e x c a p t u r e s ) 相似,并且在视频中的实验结果也得到了相似的结论 4 2 5 。 图2 3 利崩分块i c a 提取自然闰像基向量 目前,i c a 提取特征方法为基于分块( 加窗口) 的方法,这种方法也被广泛 的应用脚4 6 1 。但是,这种方法提取出来的特征存在的问题。这些特征只能证实具 有多媒体信号局部的特征与小波多尺度分析提取的特征相比,其意义不明显。 小波多尺度分析提取的特征具有原始信号的全局特性。而这种将图像分块的方法 破坏了原始信号的整体特性,因为每一个图像块只代表了图像的局部。因此每个经 过i c a 提取出来的基向量只能代表信号的一个局部特征,而这个特征具体的来源 于多媒体信号哪部分却无法判定,因此意义也就不是很明显。 2 8 小结 本章首先介绍了i c a 的基本理论、基本算法,然后介绍了当前i c a 应用的情 况,其中重点介绍了i c a 在多媒体信号中的应用。当前i c a 对于多媒体信号处理 的主要方法是采用对原始信号分块( 加窗) 提取信号块( 段) 再进行i c a 处理的 方法。最后分析了这种方法存在的问题,为第三章提出基于采样的i c a 信号处理 山东大学硕士学位论文 方法作铺垫。 1 7 山东大学硕士学位论文 3 1 引言 第三章基于采样和ic a 的特征分析方法 采用i c a 处理图像、视频时,在i c a 模型中,至少需要两个观测信号。如何 从一个原始图像、视频中提取出多个观测信号应该是首先考虑的问题。上一章介 绍了当前主要的方法是基于分块的特征提取方法,并且这种提取特征的方法也已 经应用于很多领域。尽管这类特征在当前的研究中应用十分广泛附删,但是将信 号分块破坏了原始信号的全局特征,失去了原始信号的整体特性,因此,它们的 表征的意义是模糊的,最多也只能表示图像局部的一些特

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论