硕士学位论文-语音信号的盲源分离算法研究及应用.pdf_第1页
硕士学位论文-语音信号的盲源分离算法研究及应用.pdf_第2页
硕士学位论文-语音信号的盲源分离算法研究及应用.pdf_第3页
硕士学位论文-语音信号的盲源分离算法研究及应用.pdf_第4页
硕士学位论文-语音信号的盲源分离算法研究及应用.pdf_第5页
免费预览已结束,剩余59页可下载查看

硕士学位论文-语音信号的盲源分离算法研究及应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中山大学 硕士学位论文 语音信号的盲源分离算法研究及应用 姓名:吴其泽 申请学位级别:硕士 专业:计算机应用技术 指导教师:罗笑南 20100604 语音信号的盲源分离算法研究及应用 摘要 论文题目:语音信号的盲源分离算法研究及应用 专业:计算机应用技术 硕士生:吴其泽 指导教师:罗笑南教授 摘要 盲源分离问题即在不知道源信号和传输通道的先验信息的情况下,根据源信 号的统计特性,仅由观测到的混合信号恢复出源信号的过程。盲源分离应用领域 非常广阔,目前已广泛应用于语音信号处理,阵列信号,图像处理及医学信号处 理等许多领域。而语音信号的盲源分离是盲源分离技术的一个非常重要的分支, 是当前语音信号研究的热点。独立量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s , 简称i c a ) 是盲信号处理运用得最普遍的一类算法。本文深入细致地研究了盲源 分离的理论,包括盲源分离的现状、发展和盲源分离原理和处理方法等内容。在 盲源分离算法的研究中,重点研究了基于峭度和最大熵的盲源分离算法。 在传统的随机梯度算法中,一般需对源信号的概率密度函数预先做一个假 设。如果假设的概率密度函数与真实源信号差别较大的话,将对分离的结果产生 较大的影响。由此,本文提出了一种基于峭度的自适应调节算法,并不需要预先 假设源信号的概率密度函数,而是根据源信号的特性自动调节生成。在m a t l a b 上对该算法的仿真证明,该算法达到了良好的分离率。此外,在该算法中对噪声 存在的情况进行了研究。在最大熵算法中,发现传统的固定步长算法不能达到较 为理想的收敛速度和分离效果,从而在本文中提出了一种自适应变步长的方法, 使得分离的速度更快,效果更理想。并且,本文对该算法在卷积混合的情况下也 进行了实现。另外,本文给出了该算法在数字信号处理器( 简称d s p ) 上的实现。 在通过理论分析和语音信号仿真实验验证了该算法的可行性之后,本文创建了一 个以d s p 为核心的二维语音信号盲源分离硬件实验系统,把基于最大熵的自适应 步长算法嵌入到d s p 中去,探索了本算法在语音信号盲源分离中的实际应用。该 系统的硬件平台采用的是a d i 公司的b l a c k f i n 一5 3 3 开发板。实验表明,该实验 论文题目 摘要 系统在一定的条件下对混合语音信号达到良好的分离效果。这与基于最大熵的自 适应可变步长算法的理论分析相一致。本文提到的算法均在m a t l a b 上进行了大 量的仿真实验,测试和评价算法分离的效果,得到了较为满意的结果。 关键词:盲源分离、语音信号、独立量分析、峭度、最大熵 r e s e a r c ho i lb 1 i n ds o u r c es e p a r a t i o na l li t sa p p l i c a t i o ni ns p e e c h a b s t r a c t t i t l e : m a j o r : n a m e : r e s e a r c ho nb 1i n ds o u r c es e p a r a t i o na n d i t sa p p l i c a t i o n si ns p e e c h c o m p u t e ra p p l i c a t i o nt e c h n o l o g y q i z ew u s u p e r v is o t :p r o f x i a o n a nl u o a b s t r a c t b 1i n ds o u r c es e p a r a ti o n ( b s s ) p r o b l e mist os e p a r a t eo re x t r a c t i n d i v i d u a ls o u r c es i g n a lf r o mas e to fm i x e ds i g n a l s ,u n d e rt h ec o n d i t i o n o fn o tk n o w i n ga n yi n f o r m a t i o na b o u tt h es o u r c ea n dt h et r a n s f o r m c h a n n e l b l i n ds o u r c es e p a r a t i o nh a sw i d ea p p l i c a t i o n s ,i n c l u d i n g s p e e c hs i g n a lp r o c e s s i n g ,i m a g ep r o c e s si n g ,a r r a ys i g n a la n dm e d i c a l s i g n a l ,e t c s p e e c hb s si sah o t s p o t ti n ga m o n gt h ea p p li c a t i o n so fb s s i n d e p e n d e n tc o m p o n e n ta n a l y s is ,i c af o rs h o r t ,isa na l g o r i t h mo fb s s u s e dm o s tw i d e l y t h isp a p e rh a sd o n er e s e a r c hd e e pi n t ot h et h e s iso f b s s ,i n c l u d i n gt h ep r e s e n ts i t u a t i o n ,d e v e l o p m e n ta n db a s i sr e s e a r c h a p p r o a c h e s ,p l a c i n ge m p h a s i so nt h ek u r t o s i sa l g o r i t h ma n di n f o r m a x a l g o r it h m i nt h et r a d i t i o nk u r t o s i sa l g o r i t h m ,i ti sn e e d e dt oa s s u m et h e p r o b a b i l i t yd e n s i t yf u n c t i o no ft h es o u r c es i g n a la n dg e tt h ea c t i v a t i o n f u n c t i o n t h es e p a r a t i o nr e s u l t sw i1 1b eo u to fe x p e c t a t i o ni ft h e a s s u m i n gp r o b a b i i i t yd e n s i t yf u n c t i o ni sq u i t ed i f f e r e n tf r o mt h et r u e o n e s ot h a t ,t h i sp a p e rp r o p o s e sa ns e l f a d a p t a t i o na l g o r i t h mb a s i n g o nk u r t o s i s s i m u l a t i o n ss h o wt h a t t h i sa l g o r i t h mw o r k sr a t h e rw e l l b e s i d e st h a t ,w eh a v ed i s c u s s e dt h ea l g o r i t h l i l i nn o i s ee x i s t i n g o c c a s i o n i nt h et r a d i t i o ni n f o r m a xa l g o r i t h m ,af i x e ds t e pa l g o r i t h m c a nn o tg e ti d e a lc o n v e r g e n c es p e e da n ds e p a r a t i o nr e s u l t s s o ,i tg i v e s a na d a p t i v e s t e pa l g o r i t h mi nt h i sp a p e ra n ds i m u l a t e db o t hi n1 i n e a r i i i r e s e a r c ho nb 1 i n ds o u r c es e p a r a t i o na ni t sa p p l i c a t i o ni ns p e e c h a b s t r a c t a n dc o n v o l u t em i x i n gs y s t e m w h a t sn _ 1 1 3 r e ,t h i sp a p e rg i v e so u ti t s i m p l e m e n t a t i o no nd s p a f t e rs i m u l a t i o no nm a t i a b ,i t sb e e np r o o f e d t h a tt h ea d a p t i v e s t e pa l g o r i t h mb a s i n go ni n f o r m a xi sw o r k a b l e w eu s e b l a c k f i n 一5 3 3d e v e l o p i n gb o a r dp r o d u c e db ya d if o ro u re x p e r i m e n t a l l t h ea l g o r i t h m sm e n t i o n e di nt h i sp a p e ra r es i m u l a t e da n di m p l e m e n t e d o nm a t l a bf o rm a n yt i m e s ,a n dt h e i rp e r f o r m a n c e sa r ee v a l u a t e db a s i n g o nr e a ls p e e c hs i g n a l t h er e s u l t sa r eo fs a t i s f a c t o r y k e yw o r d s :b li n ds o u r c es e p a r a ti o n ,s p e e c hs i g n a l ,i n d e p e n d e n t c o m p o n e n ta n a ly sis ,k u r t o s is ,i n f o r m a x 论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下, 独立进行研究工作所取得的成果。除文中已经注明引用的内容外, 本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。 对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式 标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名: 孟整 学位论文使用授权声明 本人完全了解中山大学有关保留、使用学位论文的规定,即:学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版,有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆、院系资料室被查阅,有权将学位论文的内容编入 有关数据库进行检索,可以采用复印、缩印或其他方法保存学位论文。 学位论文作者躲双峄 日期:1 口a 年g 月y 日 新躲受确 日期:扣f o 年厶月7 日 语音信号的盲源分离的研究及应用究 第1 章综述 第1 章综述 本章讨论了盲源分离研究的背景、未来的发展方向,还包括盲源分离的方 法和可实现性。也提出了评价盲源分离算法的评估标准。提出了本论文的研究 内容和章节安排。 1 1 盲源分离研究的背景及意义 在我们的日常生活中,周围总会有各式各样的信号,信号中一般包含着很 多有用的信息,可以通过传感接收装置来获得这些包含信息的信号数据,然后 对这些数据进行处理,获得想得到的信息。但是,这些信号通常除了有用数据 外,还包括了噪声、无用信号等,所有的这些成分可能是预先己知的、部分己 知的或是完全未知的,因此,要想获得源信号中的真实有用成分是有一定难度 的,而且我们还要求保证获得信息的准确性和真实性。一般来说,获得有用成 分的方法有传感器检测和信号处理两种方法。在传感器检测中,各种新方法不 断涌现,例如形成传感阵列等措施检测真实的源信号。对接收到的信号进行分 析,从海量的数据中提取必要的信息,给信息接受者用以参考,这是信号处理 的主要任务。因为传感器检测的信号是混合信号,所以我们必须对源信号进 行分离。 盲源分离( b l i n ds o u r c es e p a r a t i o nb s s ) 是在上个世纪八十年代开始兴 起,特别是伴随着神经网络的热门而被越来越多人研究,目前已成为信息处理 领域研究的热点之一盲源分离问题最早起源于对鸡尾酒会效应问题的研究, 这其实是一个语音信号盲辨识的问题。目前在多个领域都有应用,包括图像、 通信、通信、振动工程、生物医学工程、阵列信号处理、遥感遥测等领域得 到了广泛的应用,尤其是它在声纳、通信、雷达、语音、图像处理等方面的应 用,对军事、国防科技的发展起着至关重要的作用n 】。 盲源分离最经典的在语音信号的应用例子就例子是通常所说的“鸡尾酒会 问题“ ,此问题是基于是这样一个场景n 3 :在个很多人参加的鸡尾酒会中,大 语音信号的盲源分离的研究及应用究 第1 章综述 家都在交谈着,各种各样的声音混在一起。假设我们用录音机录下当时酒会的 声音,现在要求我们从众多声音混合在一起的信号中分离得到某个人的说话 声。一般而言盲源分离是指从混合信号中分离出或提取出源信号的过程。“盲“ 的意思是源信号和混合系统的特征在分离之前是一无所知的。基于上述描述, 我们可以根据不同的标准将盲源分离进行分类:乜1 ( 1 ) 按混合方式:线性混合盲源分离和卷积混合盲源分离。 ( 2 ) 按混合通道的数目:多通道信号盲源分离与单通道信号盲源分离。 ( 3 ) 按信号恢复情况:完全的盲源分离和盲信号提取。 ( 4 ) 按源信号种类:语音信号或图像信号等。不同类型的信号一般来说具体 的处理方法会有差异。当然,知道了信号的种类也提供了一些关于源信号的先 验知识。盲源分离的特点决定了它的分离方法也是各种各样的。 我们常用的方法有: 独立分量分析法( i n d e p e n d e n tc o m p o n e n ta n a l y s isi c a ) 唧这是盲源分离 采用得最多的方法,也是最经典的方法。我们经常把盲源分离和独立量分析 ( b s s 与i c a ) 混起来用。区别在于,b s s 是一个实际应用实例,而i c a 是一个 数学模型,是个理论问题,而这个模型具有不同的应用。i c a 方法是解决盲源 分离的一类方法,但是不是唯一的方法。i c a 方法中又包括多种方法,如本文 研究的基于峭度算法和基于最大熵的算法都是属于i c a 算法。 联合对角化法口1 ( j o i n td i a g o n a l i z a t i o ne s t i m a t i o nj d e ) ,或称为特征 值分解问题,经过分析信号的特性,根据高阶累积量将盲源分离问题转为特殊 矩阵对角化问题。 状态空间法h 1 ( s t a t e s p a c ee s t i m a t i o ns s e ) 是一种比较新的方法。状态 空间法将盲源分离问题的数学模型重新构造通过调整状态空间方程中各个参 数矩阵达到分离效果。它具有比i c a 方法先进的地方,但是,目前来说还具有 不少难点,还是种不那么成熟的算法。 此外,在上述的算法中,或多或少得融合了自适应和神经网络的理论。这 些理论在盲源分离中有着广泛的应用。总的来说,盲源分离是一个新的研究方 向。它融合了信号处理、概率计算、过程处理、人工智能神经网络等多许学科 知识的 。来自h t t p :b a i k e b a i d u c o r n v i e w 2 6 6 1 3 6 h t m ? f r = a l a o _ l 2 语音信号的育源分离的研究及应用究 第1 章综述 1 2 盲源分离的研究现状 本节描述盲源分离的发展历史和研究前景。描述了从盲源分离问题被提出 以来的一路的发展历程。还对盲源分离问题未来的发展方向进行了憧憬。 1 2 1 盲源分离的发展历史 普遍认为,信号的盲源分离问题的最早研究是法国的j h e r a u l t 和 c j u t t e n 在1 9 8 5 年左右开始的进行的。1 9 9 1 年c h r i s t i nh u t t e nj e a n n y , h e r a u l ,p e r i e rc o m m o n 三人在s i g n a lp r o c e s s i n g 期刊上发表了标志着盲源 分离领域重大进展的几篇文章,在文章中提出了非常著名的h - j 盲分离算法 晦1 ,针对两个源信号,混合后形成两个混合信号的递归连接的人工神经网络, 经过利用梯度下降算法来调整网络权值,从而对网络输出信号的残差进行最小 化,进而实现了信号盲分离。他们还设计了专用的c m o s 集成芯来片实现他们 的算法。他们利用了仿生学的思想,基于神经网络模仿了耳朵神经,许多后来 的研究者采用了他们的思想。1 9 9 5 年,b e l l 和s e j n o w s k i 哺1 发表了独立量分析 发展史中的里程碑般的文献,其主要贡献在于:第一,观测信号的高阶统计关 联用神经网络的非线性特性来进行消除;第二,用信息最大化( i n f o m a x ) 准 则建立目标函数,从而将独立量分析方法和信息论方法结合在一起;第三,给 出了基于神经网络的最优权迭代的学习算法,这也成为了后来各种算法的基 础。这种方法当源信号与估计的线性信号比较接近时效果是很好的,但它只适 用于超高斯分布的源,所以此方法特别适合语音信号线性混合的情况。 h y v a r i n e nh 1 基于源信号非高斯性测度( 例如峭度) ,提出了定点 ( f i x e d - p o i n t ) 训练算法,该类算法能适用于单个具有正或负峭度的源信号。 当人们从神经网络的方向去研究自适应算法时,所用的随机梯度算法有一个缺 点,就是收敛速度比较慢,c i c h o c k i 等人3 提出了自然梯度的概念,自然梯度 的学习规则有效性高,计算简便。然后,a m a r i 旷1 0 对自然梯度算法做出进一步 的分析研究,而且证明了该算法的有效性。 c a n d o s o 和l a h o l d w l 从自适应信号分离必须具有等变化性( e q u i v a r i a n t ) 这个特点出发,对应于常规梯度( 绝对梯度) ,给出了相对梯度的概念,从而 。来自h t t p :b a i k e b a i d u c o r n v i e w 8 8 8 3 0 1 h m 3 语音信号的盲源分离的研究及应用究第1 章综述 得到的算法被称为随机相对梯度算法,这个算法被证明是和自然梯度算法等价 的,所以自然梯度算法也是具有等变化性的。 众多学者对这类算法进行了大量研究,目的是为了提高它们的速度和分离 效果,而且这些研究人员已经提出了很多有效的方法n 2 。1 引。 盲源分离问题的研究深度和广度都在不断扩展,一些学者开始对相关源信 号的盲分离问题进行研究,有人提出了时一频分析方法n7 1 。2 0 0 4 年z h i j i a ny u a n 与e r k k io j a 给出了一种基于独立分量分析的f a s t i c a 算法n 1 i 。近年来,状态 空间法n 1 得到了逐步的发展,这种方法是从控制工程的角度去描述混合矩阵和 解混矩阵,盲源分离的研究有了新的方向和思想。 国内对于盲源分离问题的研究就相对较晚n 引,直到近些年,国内关于盲源 分离的研究才逐渐多了起来。清华大学的张贤达教授在其1 9 9 6 年出版的时 间序列分析一高阶统计量方法书中,介绍了有关盲源分离的理论基础,其 后关于盲源分离的研究才逐渐多起来。1 9 9 9 年,张贤达和保铮町对盲源分离的 理论、方法以及应用作了综述。上海交通大学的胡光锐、虞晓瞳们等研究了盲信 号处理( b s p ) 在语音分离与识别领域的应用分析了最大熵算法和最小互信息算 法之后,提出了一种利用反馈结构的输出信号概率密度函数估计的增强算法, 新算法比传统算法具有比较好的性能,特别是对于解决卷积混合输入的盲源分 离。东南大学的何振亚、汪军乜提出基于高阶谱的信号盲分离,利用三阶、四 阶累计量对瞬时混叠信号盲源分离进行研究,而且提出了两种分离算法,并且 用实验证明了其是有效的,不过,该算法只适用于高信噪比信号分离情况。 刘丁、刘筱琰等人( 2 0 0 1 ) 根据信号二阶累积量特征,提出一种旋转矩阵盲 辨识算法妇扣。a n d r a s ,z i h e 等人也以二阶累积量为基础,从最小均方的角度 提出另一类对角化算法汹1 。其代表算法中的一种是j o d e 算法嘲3 。 1 2 2 盲源分离的发展前景 盲源分离发展了近二十年,其基本理论框架及相关算法已经基本完善, 也展现出诱人的应用前景,不过,还有一些难题需要解决。最主要的难题一般 包括含噪盲源分离问题、非线性混合问题、欠定问题和非平稳问题等。 纵观盲信号处理的发展过程,特别是2 0 世纪9 0 年代中期以来的积极研 究阶段,b s s 或i c a 所发展的计算方法综合了诸多的数学工具和处理思想, 4 语音信号的盲源分离的研究及虑用究第1 章综述 s d o u g l a s 的评价心5 1 :“这种汇合的影响已超越了该两项任务的边界。” 1 3 盲源分离的基本描述 本节给出了盲源分离的数学模型和按混合系统分类的两类盲源分离问题。 讨论了盲源分离的两种模型,包括线性混合模型和卷积混合模型。另外,讨论 了盲源分离问题可行性和约束条件,并给出盲源分离算法的评价标准。 1 3 1 盲源分离的数学模型 我们可以通过下面这个示意图来描述盲源分离嘲: 来知的 广 i i 1 t ) 图卜l盲源分离原理示意图 其中s ( t ) = s ( 1 ) ,s ( 2 ) s ( n ) 是n 维未知源信号向量,a 为未知混合 系统,x ( t ) = x ( 1 ) ,x ( 2 ) x ( m ) 是m 维的观测信号,它受到噪声 r l ( t ) = n ( 1 ) ,n ( m ) 的影响,w 是分离系统,y 是对源信号的估计。混合系统 是未知的,我们可以根据它的具体情况将盲源分离问题分类:一类是线性混合 问题,一类是卷积混合问题。下面讲述这两种系统的混合方式。 1 3 2 线性瞬时混合 我们用线性方程组来表示这种混合方式的混合过程( 不考虑噪声的影响) : x l ( t ) - - a l ls ( ,) + a t 2 s ( r ) + + 口,n s ( d 耽( f ) = a 2 1s ( f ) - - 0 2 2s ( f 汁+ a2 n s ( f ) ( 1 1 ) 。图片来自参考文献 2 7 】 5 语音信号的盲源分离的研究及应埘究 第l 章综述 o ) = 锄,s ( ,) + 2 so ) + + 口小心( 痧 写成矩阵形式为: x ( t ) = a s ( t )( 1 2 ) 其中a 为混合矩阵。 式( 1 2 ) 又可表示为: 薯( f ) = 口j s j ( t ) ( 1 3 ) j = l 于是,在线性瞬时混合情况下,盲源分离问题可以表述为n3 :在源信号波 形s ( t ) 未知,并且混合系统a 也未知的情况下仅根据传感器所接收到的混合信 号x ( t ) 对源信号向量s ( t ) 或混合矩阵a 进行估计。源信号盲源分离问题也可 以表述为:在源信号向量s ( t ) 和混合矩阵a 均未知的条件下,求一个n * m 的解混矩阵w ,使得w 对混合信号向量x ( t ) 的线性变换: y ( t ) = w x ( t )( 1 4 ) 为对源信号向量s ( t ) 的一个比较接近的估计。一般将矩阵w 称为分离矩 阵。 将式( 1 2 ) 和式( 1 4 ) 合并可得: y ( t ) = w x ( t ) = w a s ( t ) = c s ( t )( 1 5 ) 式中:c = w a 为n * n 的矩阵,称为混合一分离复合矩阵 1 3 3 卷积混合模型 瞬时线性混合模型的盲源分离经过2 0 年的发展,许多算法被提出来,并 在一些场合得到较好的应用。不过,这种算法也有它的局限性。那么什么是卷 积混合模型呢? 在我们的实验环境中,声音除了直接传过来的那一部分,还有 些要经过墙壁的反射或空气的折射传过来的,这是种多径效应,为了刻画这种 情况,人们提出了卷积混合模型。卷积混合模型可以用下面的公式来表示n 1 : 疗k - i ( f ) = a o ( k ) s j ( t 一后) + _ ( f ) i = 1 ,2 n ( 1 6 ) 6 语音信号的盲源分离的研究及麻用究第1 章综述 我们可以看出,观察信号x 是经过卷积混合的脉冲响应。a ;,( k ) 为第j 个 源到第i 个传感器的滤波器系数,式子里面的k 是滤波器的脉冲响应长度。式 ( 1 6 ) 还可以写为: k l x ( f ) = a ( k ) s ( t - k ) + v ( t ) ( 1 7 ) k = o 其中a ( k ) 是m n 的混合矩阵,里面包含着第k 个滤波器系数的,v ( t ) 是的噪声矢量维度为m * l 。 1 3 4 盲源分离的可行性 人们都会有个疑问:盲源分离的实现性是怎样的呢? 也就是说,分离信号 y 能在多大程度上接近与s 。盲源分离的“盲”是指未知源信号的特性和混合 系统地特性。但是,为了实现盲源分离,我们必须作出一个限制性虽然较强, 但是现实性仍然很大的假设:源信号各分量间是相互独立的,因此往往人们又 把盲源分离b s s 称为独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s , i c a ) n 1 。这里用x ( t ) = a s ( t ) 为例,分析盲源分离实现的可能性,换句话说, 我们想知道混合矩阵a 在多大程度上可以由混合信号x 推出。 先提出个非混合阵的概念:非混合阵是每一行每一列只有一个非零元素的 方阵。如果分离信号y ( t ) = t s ( t ) = w a s ( t ) ,t 为非混合阵,就称y ( t ) 是s ( t ) 的一个拷贝。y 和s 只不过是在在各分量的幅值和排列顺序上有所不同。那么, 我们就说我们完成了盲源分离。为何要有源信号相互独立这一假设? d a r m o i s 汹1 定理给出了解释:假设源信号s ( t ) 的各分量是相互独立的,其中至多一个为高 斯分量,t 为任意可逆阵。若y ( t ) = t s ( t ) 的各个分量也是独立的,则y ( t ) 是 s ( t ) 的一个拷贝。 从d a r m o i s 啪1 定理可以看出,除非矩阵t 为非混合阵,否则它将会把分量独 立的向量转化成分量不独立的向量,即就是只要设法使输出信号1 ( 的各分 量在统计上是相互独立的,就能做到信号的盲源分离。众多算法均以此为根据。 算法的最终目的就是设法使得经分离矩阵之后的输出信号的各分量独立性最 大,以此为依据来调整分离矩阵的参数实现信号盲分离h 1 。 1 3 5 盲源分离实现的约束条件 7 语音信号的盲源分离的研究及应用究 第1 章综述 盲分离问题的解并不唯一,也就是仅给出观测信号x ( t ) ,也许有很多组 不同的混合矩阵a 和源信号向量s ( t ) 都能满足式( 2 - 2 ) ,要想使这个课题的 研究具有现实性,做出一些合理的假设是必要的。 首先,假设各个源信号s ,s 。,s 。之间是统计独立,而这个假设是合 理的,因为这些信号来自不同的源。用p ( s ) 表示源信号向量s ( t ) 的联合概 率密度函数p d f ,而、用p 。( s ) ,p :( s :) ,p 。( s 。) 分别表示各源信号的边缘密度 函数,我们得到源信号向量每个分量问的统计独立性假设可以表述为: p ( s ) = p 。( s 。) p 2 ( s 。) p n ( s 。) = 兀p 。( s 。) ( 1 8 ) 也就是源信号向量s ( t ) 的联合概率密度函数为它各个分量的边缘概率密 度函数之积。目前大多数信号源盲分离算法都会有此假设。 上述独立性假设是最基本的假设,除此以外,我们还需要对混合矩阵a 作 出某些假设。需要保证混合矩阵a 的广义逆存在,也就是a 是列满秩的,才能 保证盲源分离问题总假设混合矩阵a 是列满秩的,才能使该问题具有可解性。 早期的该问题研究一般不考虑噪声的影响。要考虑噪声时,一般假设噪声n ( t ) 的各个分量是与信号源独立的白噪声随机过程。 基于以上,盲源分离问题通常有如下假设条件: l :混合矩阵a 为列满秩矩阵,即r a n k ( a ) = n 。 2 :源信号向量s ( t ) 是零均值的平稳随机向量过程,各个分量之间相互 统计独立,并且s ( t ) 的分量中,服从高斯分布的分量不超过一个。 3 :噪声向量n ( t ) 为零均值的随机向量,并且与源信号向量s ( t ) 相互 统计独立;或者假设噪声向量可以忽略不计,即n ( t ) = o 。 没噪声时,线性混合模型x = a s 其实就是对源信号向量s ( t ) 的线性变换, 假设1 保证了这个变换a 是可逆的。假设2 并不影响在此基础上得到的盲分离 算法的适用范围,因为当随机变量的均值不是零时,我们先把各随机向量减去 均值,也就是预处理中的零均值化。为何高斯分量不能多于一个呢? 因为高斯 随机的线性混合依旧是高斯分布,但是高斯分布是完全对称的,不包含混合矩 阵列方向的任何信息,所以当源信号服从高斯分布的分量不止一个的时候,盲 分离算法难以求解,所以需要假设2 对此作出限制。而假设3 中对噪声的假设 是是符合实际情况的大多数统计信号处理方法所采用的假设。 8 语音信号的亩源分离的研究及戍用究 第1 章综述 1 3 6 盲源分离结果的不确定性 p c o m o n 写了一部很经典的著作,叫i n d e p e n d e n tc o m p o n e n ta n a l y s i s a n e wc o n c e p t ) 。里面证明了独立量分析模型的分离矩阵与混合矩阵的乘积可分 解为一个排列矩阵和一个满秩对角阵的乘积,这其实表明分离信号y 是源信号 s 的一个估计,只不过y 的各分量的幅值和次序与源信s ;不相同,不过它们的 波形是相同的。也就是说盲源分离算法只能从混合信号中分离出波形和源信号 相同的独立信号,源信号在被恢复的过程中存在着一些不确定性n 7 1 们: 1 在符号上,也就是分离后的信号有可能与源信号的符号相同,也可能相 反。 2 在幅度上,分离后的信号在幅度上与源信号是比例关系。 3 在顺序上,分离后的信号与源信号的顺序有可能是不一致的。 但是,我们知道,有用的信息一般是包含在信号的波形里面的,所以说以上三 个方面的不确定性对盲源分离在实际中的应用影响并不大。 1 3 7 盲源分离算法的评价标准 有多种评价标准,如码间干扰、信噪比等。 在本文我们用性能指标( p e r f o r m a n c ei n d e x ) 来评价,定义为防1 : t 志椎 万伽一1 ) 智l i 钉 州善劫一- ( 1 9 ) 式中:g ;j 为全局传输矩阵g = w a 的元素;m a x ,ig 。ji 表示全局传输矩阵的第i 行元 素绝对值中的最大值;m a x ,lg ,。i 表示第i 列元素绝对值中的最大值。若分离出的 信号y 与源信号s 波形完全相同的话,则p i = o 。 1 4盲源分离研究的内容及研究方法 本节讨论盲源分离的研究内容和常用的研究方法。研究内容一般包括优化 准则、概率密度函数的估计、和评价准则等内容。根据对照函数的不同,提出 9 语音信号的盲源分离的研究及应用究第1 章综述 了有关对照函数的两种研究方法 1 4 1 盲源分离问题的研究内容 盲源分离一般来说,是选择某个目标函数,通根据一定的判据,通过调整 某些参数( 例如分离矩阵w ) ,来使目标函数达到或接近最值。一般调整参数的 过程可以通过迭代优化实现,这个过程的好坏优劣直接影响着分离结果的精度 和收敛速度。所以盲源分离研究的内容包括优化准则,源信号的概率密度的估 计、目标函数的确定,还有算法的性能评价指标等等内容汹2 8 3 。 1 优化准则 我们目前所采用的盲源分离算法中,一般的判据都是使得输出地信号分量 之间的独立性最大,而我们的优化准则大都是针对此而开发的。高阶统计量、 熵、非高斯性、互信息、表征分量概率密度函数之间距离的k u l l b a c k l e i b l e r 散度之类都可以用来衡量独立性。 2 源信号的概率密度函数的估计 目前采用的很多分离算法都需要知道源信号的概率密度函数,但是这在实 际中是不太可能的,因为盲源分离中所谓的“盲“ 之一意义就是对源信号先验 知识一无所知。所以我们只能通过对观测样本进行考察估计源信号的概率密 度。级数展开逼近法、核函数法,与目前热门的机器学习与神经网络相结合的 方法都是用得比较广泛的方法。 3 算法的性能评价 如果算法一开始就给定所有样本,就称为离线学习算法啪1 ,如果样本随着 每次迭代都会加入最新值,则称为在线的学习算法。我们一般要考察一个分离 算法的性能,可以从分离的效果、分离所需时间、算法是不是够稳定,对资源 的占用情况等进行分析。 1 4 2 盲源分离的研究方法 盲源分离最主要的方法是独立量分析( i c a ) 方法口司,它事实上是一种迭 代寻求最优的过程。在盲源分离领域,有很多重要的概念,如对照函数 1 0 语音信号的盲源分离的研究及应用究 第1 章综述 ( c o n t r a s tf u n c t i o n ,首先由p c o m m o n 提出1 9 9 3 ) 、目标函数( o b j e c t i v e f u n c t i o n ) 、损失函数( 1 0 s sf u n c t i o n ) 、估计函数( e s t i m a t i n gf u n c t i o n ) 、 风险函数( r i s kf u n c t i o n ) 和代价函数( c o s tf u n c t i o n ) 、品质函数( s c o r e f u n c t i o n ) 、激活函数( a c t i v a t i o nf u n c t i o n ) 等专业术语。这些函数其实互相 有着很大的关联,甚至有的可以互相代替的。这里给出最重要的对照函数的定 义: 记f = f 。,x r 。 为所有n 维随机向量的概率密度函数的集合,则独立分 量分析的对照函数矽( ) 为一个从f 到r 的映射,并且满足一下条件: i ( f ,) 的值与随机向量x 各个分量的排列顺序无关。即对任意排列矩阵 p 有:矽( f p x ) = ( f ,) ; 2 妒( f x ) 的值与随机向量x 各个分量的绝对幅度无关。即对任意满秩的对 角矩阵d 有:矽( f d ,) = 矽( f ;) ; 3 若随机向量x 的各个分量统计独立,则对任意的可逆矩阵a 有 ( f ,) = ( f 。) ; 4 若随机向量x 的各个分量统计独立,当且仅当矩阵a 存在分解:a = p d 时,其中p 为排列矩阵,o 为非奇异对角矩阵。矿( f ,) = ( f 。) 。 由对照函数的定义可知,只要找到一个合适的对照函数并对其进行最小化 就可以实现随机向量的独立分量分析,同时也就实现了信号源的盲分离。 以下列出几个常用的对照函数汹。 ( 1 ) 互信息极小化 最原始的判断依据就是根据独立量分析的原理b 目:如果估计信号y 的联合 概率密度函数等于各分量的边缘概率密度之积,也就是式子( 1 9 ) 成立,则各 分量互相独立,否则不是互相独立的n 1 。 p ( y ) = h p 0 。) d 给出互信息的定义: ( i 1 0 ) 语音信号的盲源分离的研究及应用究 第l 章综述 一 ,( ,) = x l p ( y ) ,r 瑚l p ( v t ) 】= jp ( y ) l o g i 暑l p ( y ) i - i p ( y i ) i i ( 1 1 1 ) 我们可以看出,这是个根据独立量分析原理给出的判据。互信息i ( y ) 总是 大于或等于0 的,只有各分量独立时互信息才为零。由此可以看出,最小化互 信息可以达到分离的目的。为了方便计算,我们可以把概率密度函数展开成高 阶统计量的级数来计算。 ( 2 ) 极大似然估计对照函数 已知分离过程的x 为混合信号,y 为估计信号。假定w 给出且各分量独立 的条件下,x 的对数似然函数是l o g p ( x | w ) 。又由于y = w x ,p ( y ) = p ( x ) 1 w l ,p ( y ) = l i p ( y ;) ,所以: l o gp ( xl 矿) = l o glw i + l o g p ( y f ) ( 1 1 2 ) 实际使用时用到上式的平均值,混合信号与估计信号通过采样来确定,调 整w ,使式子( 1 1 1 ) 取最大值。 1 5本论文主要研究内容和章节安排 本文对盲源分离算法进行了深入研究,对传统的算法进行了改进,通过在 m a t l a b 上的仿真实验和在d s p 上对具体语音的实现,证明了改进的有效性。 内容安排如下: 第1 章对国际、国内已有的解决盲源分离和盲信号提取的方法进行回顾和 研究。讨论盲源分离的发展现状和前景,介绍了盲源分离的基本原理。包括盲 源分离的可实现性、研究内容、研究方法等内容。并介绍了本文的结构安排。 第2 章详细讨论基于峭度的盲源分离算法。针对源信号概率密度函数比较 难获取的情况,给出一种自适应的调节算法。并且对该算法进行了仿真实验。 讨论了该算法在噪声存在下的运行情况。 第3 章详细描述了基本最大熵的盲源分离算法。针对常规算法收敛速度不 1 2 语音信号的盲源分离的研究及应用究 第1 章综述 够快的问题,给出一种自适应步长调整方法。并进行了仿真实验。另外,本章 给出了该算法在卷积混合的情况下的实现。 第4 章本章构建具体的d s p 运行环境,把第3 章算法移植到d s p 上,给出了 该算法在d s p 上针对两路语音信号的实现。 第5 章结论与展望。对本文所提出的算法作出一个总结,提出不足之处。 1 6本章小结 本章主要对盲源分离进行一个概述,讨论了盲源分离研究的背景及未来 的发展方向,对盲源分离的数学模型进行了描述,给出对盲源分离算法的研究 方法和盲源分离算法的评价标准。最后,提出了本论文的研究内容和章节安排。 语音信号的盲源分离的研究及应用第2 章摹丁峭度的白适应盲源分离算法 第2 章基于峭度的自适应盲源分离算法 本章提出了基于峭度的盲源分离算法。传统的盲源分离算法通常要用到源 信号的概率密度函数的估计。进而得到激活函数。不同的源信号的激活函数一 般来说是不完全相同的。在此,本文提出了一种基于峭度的自适应盲源分离算 法,不需要预先对源信号概率密度函数作出假设,而是利用信号高斯性的一种 测度一峭度,来自适应地学习算法中的激活函数。此算法经过仿真实验,证明分 离效果比传统算法有了一定的改进本章还对此算法在噪声存在的情况进行了 讨论,经仿真,得出了先进行高通滤波再进行盲源分离会得到更好的分离结果 的结论。 2 1 峭度、概率密度函数及激活函数 对源信号概率密度函数的一个比较好的估计是很多盲源分离算法成功的 关键一步嘲。如果已经知道各源信号概率密度函数都为超高斯函数或都为亚高 斯函数时,问题就好解决很多,我们可以首先根据信号的类型给出一个便于计 算的概率密度函数,进而求得重要的激活函数( s ) ,达到盲源分离的目的: 但是如果源信号根本不知道是超高斯的或者是亚高斯的,抑或两者都存在,针 对这种情况,我们就需要自适应地去学习它的激活函数。 双曲正割函数的平方、混合双曲正割的平方、修正的双曲正割函数的平方、 混合高斯函数( m o g ,m i x t u r eo fg a u s s i a n ) 等非线性函数口3 1 都是常用的概率 密度函数估计函数例如修正的双曲正割函数的平方为 眺) = 去e x p ( 一萼) s e c 铲( i ) ( 2 1 ) 这是针对源信号是超高斯的情况,它对应的激活函数是: 1 4 语音信号的盲源分离的研究及应用 第2 章肚丁i 峭度的自适府育源分离算法 讹) = 一业掣= s ,+ t a n h ( i ) ( 2 2 ) 混合高斯函数是: 删= 插唧 等 + 赤e x p 掣 3 , 这是针对源信号是亚高斯的情况,它对应的激活函数是: 谚( s ) = s i t a n h ( s 1 ) ( 2 4 ) 和源信号概率密度函数密切相关的一个概念是峭度,它的定义如下: k ( s ,) :_ 了m 4 3 ( 2 5 ) 式子里面m 2 和m 4 是信号s i 的二阶矩和四阶矩。峭度k ( s ) = 0 当且

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论