(通信与信息系统专业论文)基于短时综合相加法的语音盲信号分离的研究及其dsp实现.pdf_第1页
(通信与信息系统专业论文)基于短时综合相加法的语音盲信号分离的研究及其dsp实现.pdf_第2页
(通信与信息系统专业论文)基于短时综合相加法的语音盲信号分离的研究及其dsp实现.pdf_第3页
(通信与信息系统专业论文)基于短时综合相加法的语音盲信号分离的研究及其dsp实现.pdf_第4页
(通信与信息系统专业论文)基于短时综合相加法的语音盲信号分离的研究及其dsp实现.pdf_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

四川大学硕士论文 0 0 q j b j 基于短时综台叠接相加法的语音盲信号分离的研究硬其d s p 实现 基于短时综合的叠接相加法的语音盲信号分离的 研究及其d s p 实现 通信与信息系统专业 研究生:刘开文指导教师:何培宇 盲信号分离( b s s ) 在语音分离与识别、阵列处理与数据分析、生物信号处 理、数字通信以及图像增强等多种领域正得到目益广泛的应用。这一方向的 研究也因此成为信号处理领域近年来的热点之一。盲信号的混合方式有瞬时 混合和卷积混合两种形式,目前瞬时混合的研究已经比较成熟并且产生了很 好的分离效果,其主要方法有独立分量分析( i c a ) s g l 主分量分析( p c a ) 。但是, 在真实的物理声学环境中,由于多径效应,信号的传输具有延迟性,因此语 音的混合为卷积混合形式。语音盲信号分离系统的实现由于以下三个原因的 影响而变得非常复杂和特殊:冲击响应有大约数百毫秒的持续时间;没有任 何其它先验信息,仅根据源信号之闻的统计独立性质;系统必须是自适应的。 因此实现高质量的语音盲信号分离系统仍是一个极赋挑战性的课题。 为实现语音盲信号分离,人们提出了各种方法,在这些方法中,从频域 分析研究得较多。时域的卷积混合变换到频域就成了瞬时混合,因此我们可以 在频域中用瞬时混合的方法( 如:i c 舢对时域的卷积混合进行盲信号分离。但 用传统的频域方法将产生频率分辨率降低和信号间频谱相互干扰的矛盾,矛盾 的任何一方突出时都会影响分离效果。为了解决这一矛盾,我们把短时综合叠 接相加法引进到语音盲信号分离,这一方法有效地缓解了这一矛盾。因为传统 的方法是窗函数的长度等于f f t 变换的长度,而我们用的短时综合叠接相加法 是f f t 变换的长度等于窗函数的长度的两倍( f f t 变换的序列由加窗序列和霉 巴! ! ! 查兰塑主堡兰墨三堑! ! 堡垒垦堡塑型鎏塑量童童堕三坌曼塑竺要垦基! 望墨翌 序列组成) ,如果在窗函数的长度相等的情况下,由于本方法f f t 变换的长度等 于传统方法的两倍,因此频谱分辨率也是传统方法的两倍,所以产生了较好的 分离效果。并且本方法具有数字表达式简单,计算复杂度低等优点。适合语音 盲信号分离的实时处理。 同时,我们用t i 公司的浮点d s p ( t m s 3 2 0 c 6 7 0 1 ) 作算法处理,用f p g a ( f l e x 】o k ) 设计外围电路( 麦克风阵列的时分多路和帧同步信号的 产生) ,以及用其他相应外设组成的语音盲信号分离系统,使短时综合叠接 相加法应用到实时语音盲信号分离中成为可能。 关键词:语音盲信号分离,频谱分辨率,信号源间频谱,叠接相加法,d s p 四川大学硕士论文基于短时综台叠接相加法的语音盲信号分离的研究及其d s p 实现 o nb l i n ds p e e c h s e p a r a t i o n b a s e do ns h o r t t i m e s y n t h e s i so v e r l a p a d d a n di t sd s p i m p l e m e n t m a j o r i nc o m m u n i c a t i o na n di n f o r m a t i o ns y s t e m g r a d u a t e :l i uk a i w e n s u p e r v i s o r :h ep e i y u b l i n ds i g n a ls e p a r a t i o n ( b s s ) i sa p p l i e de x t e n s i v e l yi ns p e e c hs e p a r a t i o na n d a c o u s t i c r e c o g n i t i o n ,b i o l o g _ i c a ls i g n a lp r o c e s s i n g ,d i 醉a 1 c o m m u r f i c a t i o na n d i m a g ee n h a n c e m e n te t e t h u si t h a sb e c o m eah o ts p o ti ns i g n a lp r o c e s s i n gf i e l d r e c e n t l y t h em i x i n gs t y l e o fb l i n d s i g n a l s i n c l u d e sc o n v o l u t i v em i x i n ga n d i n s t a n t a n e o u s m i x i n g c u r r e n t l y ,t h e r e s e a r c ho fi n s t a n t a n e o u s m i x i n g i s f u l l y d e v e l o p e d ,a n ds e p a r a t i o n r e s u l t si s v e r yw e l l ,i t sm a i nm e t h o d si n c l u d e i n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) a n dp r i m a r yc o m p o n e n ta n a l y s i s ( p c a ) h o w e v e r ,t h es p e e c hm i x i n gi s c o n v o l u t i v em i x i n gi nr e v e r b e r a t i n go re c h o i n g e n v i r o n m e n t t h u st h ei m p l e m e n t a t i o no fb s si s e x t r e m e l yc o m p l i c a t e dd u et o t h r e ef a c t o r s :t h ei m p u l s er e s p o n s eo fr e v e r b e r a t i n go re c h o i n ge n v i r o n m e n th a sa d u r a t i o no fs e v e r a lh u n d r e dm i l l i s e c o n d s ;t h et e r m “b l i n d r e f e r st ot h ef a c tt h a t v e r yl i t t l ei sk n o w n a b o u tt h es o u r c es i g n a lo rt h ew a yt h a tt h e ya r em i x e d t o g e t h e r ; t h es y s t e mh a st ob ea d a p t i v e s ot h er e s e a r c ho f b l i n ds p e e c hs e p a r a t i o ni sa l a r g e c h a l l e n g i n g p e o p l ed e v e l o p al o tm e t h o d sa b o u tb l i n ds p e e c h s e p a r a t i o n t h er e s e a r c ho f f r e q u e n c yd o m a i ni sm o r ec o i i i i i l o n t h et i m e - d o m a i nc o n v o l u t i v em i x i n gc a r lb e t r a n s f o r m e dt oa n i n s t a n t a n e o u sm i x i n gi nt h e f r e q u e n c y d o m a i nb yf o u r i e r t r a n s f o r m w ec a nu s et h em e t h o d so fi n s t a n t a n e o u sm i x i n gi nt i m e d o m a i n ,i n o r d e rt oc a r r yo u tt h eb s so fc o n v o l u t i v em i x i n g b u tt h ec o n t r a d i t i o no f s p e c t r a l 四川大学硕士论文基于短时综合叠接相加法的语音盲信号分离的研究及其d s p 实现 r e s o l u t i o na n dp e r m u t a t i o na l i g n m e n tw i l la p p e a ri nb l i n ds p e e c hs e p a r a t i o no f f r e q u e n c yd o m a i nw h e nu s i n gi c a a n ys i d eo f t h ec o n t r a d i t i o nw i l ld e g r a d et h e s e p a r a t i o np e r f o r m a n c e i n o r d e rt os o l v et h e c o n t r a d i t i o n ,w ei n t r o d u c et h e s h o r t - t i m es y n t h e s i so v e r l a p a d dm e t h o dt ob s s ,w h i c ht r a d e so f fe f f e c t i v e l yt h i s c o n t r a d i t i o na n de n h a n c e se v i d e n t l yt h es e p a r a t i o np e r f o r m a n c e t h el e n g t ho f w i n d o wi se q u a lt ot h el e n g t ho ff f tt r a n s f o r i l li nc o n v e n t i o n a lm e t h o d s b u tt h e l e n g t ho ff f tt r a n s f o r mi st w ot i m e sl o n g e rt h a nt h et h a to f w i n d o wi ns h o r t t i m e s y n t h e s i so v e r l a p a d dm e t h o d s ot h es p e c i a lr e s o l u t i o ni sa l s ot w i c e w e v a l i d a t e t h es i m p l i c i t ya n df e a s i b i l i t yo ft h em e t h o da n ds h o wv e r yg o o ds e p a r a t i o nr e s u l t s t h r o u g h t h ee x p e r i m e n t so f s i m u l a t i o n f u r t h e r m o r e ,a b l i n d s p e e c hs e p a r a t i o ns y s t e m h a sb e e nm a d e u s i n g t m s 3 2 0 c 6 7 0 1i nd e v e l o p i n ga l g o r i t h m sa n df p g a ( f l e x l o k l o ) i nd e s i g n i n g p e r i p h e r a l c i r c u i t sa n do t h e rd e v i c en e e d e d s oi th a sb e e n p o s s i b l e t ot h e s h o r t t i m es y n t h e s i so v e r l a p - a d dm e t h o db e e ni m p l e m e n t e dt ob s si nr e a l t i m e k e y w o r d s :b l i n d s p e e c hs e p a r a t i o n ;s p e c t r a l r e s o l u t i o n ; p e r m u t a t i o n a l i g n m e n t ;s h o r t - t i m es y n t h e s i so v e r - l a pm e t h o d ; d s p 四川大学硕士论文基于短时综合叠接相加法的语音盲信号分离的研究及其d s p 实现 1 前言 在许多情况下通过多传感器测量得到的信号都是由若干个随机 信号混迭而成的,如雷达接收的阵列信号、多传感器测量的生物电信 号以及通过话筒接收到的多说话人的混迭语音信号等如果没有任 何其他先验信息,仅根据源信号相互之间的统计独立性质,利用观测 信号把混迭在一起的源信号分开,称为盲源分离盲信号分离问题可 以应用在许多领域:如语音分离与识别、阵列处理与数据分析、生 物信号处理、数字通信以及图象增强等。这一方向的研究已成为信 号处理领域近年来的热点之一 盲信号的混合方式有瞬时混合和卷积混合两种形式。目前瞬时混 合的研究已经比较成熟并且产生了很好的分离效果,其主要方法有 独立分量分析( i c a ) 和主分量分析( p c a ) 。在真实的物理声学环 境中,由于多径效应,信号的传输具有延迟性,因此语音的混合为 卷积混合形式。本文讨论真实声学环境中的语音盲信号分离问题。 我们知道时域的卷积混合转变到频域就成了瞬时混合,因此我们可 以在频域中用瞬时混合的方法( 如:i c a ) 对时域的卷积混合进行盲 信号分离。但用传统的方法在频域中进行b s s 将产生频谱分辨率降 低和信号源问频谱相互干扰这对矛盾。因为频域中的b s s 是在每一 频点用瞬时混合的方法进行盲信号分离,从2 2 节用i c a 对时域的 瞬时混合进行盲信号分离的仿真实验可以看出其幅度和次序与源信 号相比都发生改变。因此在频域中分离后信号在每一频点的排列顺 序的也具有不确定性,不确定性将产生信号源间频谱相互干扰,如 果每次取的数据块越大,干扰也就越大,但数据块减小,频谱分辨 率也就随之而将低。因此为了提高分离性能,就有很多去信号源间 频谱相互干扰的算法,如:波束形成法和级连法等。但这些方法都 是在i c a 的基础上额外引进相应算法来去干扰,因而计算复杂度急 里型查兰堡主婆塞量三堑盟堡宣至堡塑婴鎏竺堕童童堕量坌蔓塑竺窒垦茎! 竺壅翌 剧增加。本文用短时综合的叠接相加法在频域中直接改进i c a 来缓 解频谱分辨率降低和信号源间频谱相互干扰这对矛盾,从而改善了 分离性能。因为传统的方法是窗函数的长度等于f f t 变换的长度, 而我们用的短时综合的叠接相加法是f f t 变换的长度等于窗函数的 长度的两倍( f f t 变换的序列由加窗序列和零序列组成) ,如果在窗函 数的长度相等的情况下,由于本方法f f i 变换的长度等于传统方法 的两倍,因此频谱分辨率也是传统的方法的两倍,所以产生了较好 的分离效果。并且具有数字表达式简单,计算复杂度低等优点。适 合于b s s 的实时处理。 在b s s 的实时处理方面,用t i 公司的浮点d s p ( t m s 3 2 0 c 6 7 0 1 ) 进行分 离算法的开发,用f p g a ( f l e x l 0 k ) 设计外围电路( 麦克风阵列的时 分多路和帧同步信号的产生) 。并且我们成功地用单片机( m c s 5 1 ) 对 f p g a 进行配置,节省了开发成本,具有较高的工程应用价值。使用我 们设计的硬件平台,将短时综合叠接相加法应用到实时语音盲信号分 离中,经现场验证,不仅达到了实时处理的要求,而且对盲信号分离 达到了满意的效果。 2 四川大学硕士论文基于短时综合叠接相加法的语音盲信号分离的研究及其d s p 实现 2 算法 2 1 瞬时混合 2 1 1 问题描述 设有r n 个信号源和传感器,测量信号和源信号之间有如下关系 式: x ( t ) = a s ( t ) + n ( t )( 2 1 ) 其中观测信号x ( t ) = x 。( t ) ,x 。( t ) ,x 。( t ) 。,它是n 个未 知源信号s ( t ) = s ,( t ) ,s 。( t ) ,s 。( t ) 1 的瞬时线性混 迭,s 。( t ) ,i = l ,2 ,n 为i - 1 个相互独立的随机信号混迭矩阵为 a :( a 。j ) ,i = l ,2 ,m ;j = l ,2 ,n 式中n ( t ) 为加性观测噪声由 于有噪声存在时的盲分离是困难的,一般不考虑它的影响因此,我 们只研究如下无噪声信号混迭模型公式: x ( t ) = a s ( t ) ( 2 2 ) 源分离问题就是要估计系统b ,使x ( t ) 通过b 时的输出为y ( t ) , 即有: y ( t ) = b x ( t )( 2 3 ) 对这样一个模型,如果没有关于a 和源信号的任先验信息仅从观 测信号x ( t ) 恢复出s ( t ) 是不可能的一般对模型作如下假设: ( 1 ) s ( t ) ,i = 1 ,2 ,1 3 为平稳随机过程,且相互统计独立: ( 2 ) a 为满秩的,即d e t a v 0 : ( 3 ) s ;( t ) 的三、四阶累积量存在: ( 4 ) 为计算方便,设m = 1 3 :对所有s ;( t ) ,其均值为零,方差为1 文献。1 对上述模型的可辨识性进行了讨论并指出,如果能从观测 信号恢复出各个源信号,则y ( t ) = y 。( t ) ,y 。( t ) 一,y 。( t ) 的各分 量相互独立,那么对任意一个矩阵h ,当h 的每一行和每一列有且仅 有一个元素为非零时,h y ( t ) 的分量也会相互独立矩阵h 可以分解为 粤型查兰塑主笙塞 苎王望堕堡鱼至堡塑塑鎏塑至重皇焦兰坌曼塑坚塞垦墨! ! ! 壅婴 h 2a p ,其中a 为任一可逆对角阵,p 为任一置换阵+ 所以当且仅当 c = ba 2a p 时,y ( t ) 的分量相互独立,原信号得以分离,即有: y ( t ) = b x ( t ) = b a s ( t ) = ap s ( t )( 2 4 ) 由于人、p 为任意,因此分离信号与源信号存在不确定性即和源 信号s ( t ) 相比,y ( t ) 的幅度和排列次序是不确定的,而在实际应用中。只 要保持波形的形状不变,这两个不确定性都是可以接受的, 2 1 2 信息传输最大化及算法 图21 ic a 盲分离网络结构 图2 1 为独立分量分析网络的结构框图通过稍后的分析我们 会看到,最大信息传输等价于最大化输出的熵,而对u = b x ,u 的熵将发 散至无穷因此,为得到最大信息传输,把每个神经元输出经过一个 台适的非线性函数y = g ( u ) 这里选择非线性函数为y = t a n h ( u ) ,u = b x 以使输入概率密度p ( x ) 峰值映射到非线性函数的最陡部分对随机 矢量x ,设其概率密度为p ( x ) ,则它的熵定义为: 日( 肖) = 一f p ( x ) 1 n p ( x ) d x ( 2 5 ) 随机变量的互信息是用两概率密度之间的k u l l b a c k le i b l e r 散度来定义的: 皑耻郴( 础功= 脚1 1 1 静 ( 2 6 ) 由信息传输的定义,输入输出互信息为: 4 、 璺型查兰堕圭笙塞至王堕堕堡鱼窆堡塑垫鎏塑堡童塞! ! 三坌蔓塑堡窒塾薹! ! ! 兰堡 l ( x ,y ) = h ( y ) - h ( y i x ) ( 2 7 ) 其中h ( y ix ) 为条件熵,它是指没有从输入端传出的熵如果存在噪声 即对模型y = g ( x ) + n ,有:h ( y lx ) = h ( n ) 互信息通常为正,而且有:0 i ( x ,y ) h ( x ) ,因此,最大化互信息就是使 日( z ) 一l ( x ,y ) = 0 ( 2 8 ) 由于后面将用梯度方法求解,为讨论方便,这里我们只考虑互信息对 权系统b 的导数警h ( y i x ) 圳蚋b 无关,1 0 h ( x r , y ) _ 0 ,所 o b o b 以: o x ( x ,y ) a 日( y ) o h ( yjx )o h ( y ) a b8 ba b8 b 可见,互信息对权系数求导等价于输出熵对权系数求导,最大化信息 传输等价于最大化输出熵,文献5 1 指出,最大化信息传输可降低统计 相关性,对正峭度信号,最大输出联合熵通常降低输出分量之间的互 信息,亦即使输出分量趋于独立,因此,可以定义输出和输入之间互信 息作为统计独立的测度,由( 2 8 ) ,最大传输信息为h ( x ) 定义第一判 据函数: ( 君) = ( 并) 一z ( x ,y ) = h ( x ) 一日( y ) 十h ( y l ) ( 2 9 ) 但信息传输最大化并不总能保证输出各分量的相互独立,对源信号要 求峭度为正,而源的峭度在得到正确分离之前是未知的,因此算法为 实际应用带来困难为此,在最大化信息传输的同时,用另一信息理论 判据来使输出各分量信号独立,即输出互信息最小化定义输出矢量 与其各分量的平均互信息作为统计独立的测度: ( m ,y 2 ,虬,y ) = 日( 乃) 一日( y ) ( 2 1 0 ) 其中h ( y ) 、h ( y i ) 女n ( 2 5 ) 式定义,分别为联合熵和边缘熵当输出各分 量相互独立时,( m ,y z ,以,y ) = 0 根据互信息具有的交换( 单调函数, 标量乘和置换) 不变性,【6 即对变换y = i ( g 。) ,g :( “:) ,岛( z ) n 存在 有:i ( y l ,y 2 ,y ) = i ( u l ,2 ,u ) 定义第二判据: 五( 丑) = ,( ,“2 ,u n ,u ) = 日( ) 一日( y ) ( 2 1 1 ) 四川大学硕士论文基于短对综台叠接相期法的语音盲信号分离的研究及其d s p 实现 自p ( 盼器m 盼啷脚( 删陋佃 也( b ) = h ( u ,) 一h ( x ) - i nj d e t b ( 2 12 ) 结合( 2 9 ) 和( 2 1 2 ) 式,我们得到可以进行盲源分离的新准则函数: j ( b ) = ( b ) 一五( 口) = h ( u , ) - i n t d e t b l - h ( y ) + h ( y x ) ( 2 13 ) 需要指出的是,利用第二判据( 2 1 2 ) 可以直接使输出独立,但由于输出 是未知的,输出的概率密度及分布函数更难以估计,所以往往只能得 到近似的判据函数,用( 2 13 ) 同时最大化信息传输和输出互信息最大 化,为解决此类问题提供了又途径 2 1 3 盲源分离算法及特陡分析 ( 2 1 3 ) 式的最小化可求得分离阵b 利用梯度下降法,需求j ( b ) 对b 的导数,式中最后一项与b 无关,求导后可以略去 旦o b i n ( d e t b ) = i ( a d j 万b ) r = 【b r 】- 1 ( 1 。1 4 ) 对h ( y ) ,由输出概率密度p ( y ) = 高劈斋而j o c o b i a n 行列式 堑:d e t 弘 朝 苏 饥 挑 勃 眠 饥 俄 ( d e t b ) 尊鼍 ( 21 5 ) 利用( 2 5 ) 熵的定义: h ( y ) = 一e k p ( 】,) = 一f p ( x ) 1 n 衢 = p ( x ) h a lo y o x t d x - f p ( x ) t n p ( x ) d = e l i n i 砂融| 一e i n p ( x ) ( 2 1 6 ) 式中第二项与b 无关,对b 求梯度时可以略去,因此有: 6 璺型查兰婴圭垄苎 兰三望堕茎鱼至堡塑塑垄塑堕童宣堕呈坌曼塑塑壅墨苎! 竺壅婴 对胪t a n h 似,) 由器= l - y 2 ,可得昙l i l 尊善o u = - 2 掰,再由( 2 1 4 ) 硼。o bi 则: 笔笋= 刍刚n a y ,硝胪岳h c a e t d + 去,n 冉羞= 眵卜z 7 ( 2 17 ) 对( 2 13 ) 中第一项,利用基于概率密度的e d g e w o r t h 展开或g r a m c h a l i a r 展开拍1 的熵估计截断在四阶累积累可得由于归一化,式中 的高次项所起作用已经很小,我们用塑圣盟:“,来简化,令 “哳 g ( 【,) = g ( u 。) g ( 毪) ,g ( u 。) 】7 贝q : o 日( m ) 。= b - = g ( u ) x 2 ( 2 1 8 ) 船 、7 于是: 塑o b = 一2 b t g ( u ) x r + 2 搿7 ( 2 1 9 ) 利用随机自然梯度算法 5 : 警= 叫o ) o j 础( b ) b r b = 2 加) ( i - g ( u ) u r 2 - 阿徊 ( 2 2 。) 因此,权系数b 的迭代更新公式: 日( f + 1 ) = 曰o ) + ( f ) ( ,一g ( u ) u 7 1 2 一y u 2 ) 曰( 2 2 1 ) 式中t 为离散量,表示迭代次数 2 1 3 4仿真实验及分析 设三个未知源信号分别为s 。( t ) 零均值e 一1 ,1 之间均匀分布的 白噪声,s 2 ( t ) = s i g n ( s i n ( t + r a n d ( o ) c o s ( 1 0 0 t ) ) ) ,r a n d ( o ) 为 o ,i 之间取值的 随机数s 3 ( t ) = 2 s i n ( x t 1 0 ) ,图2 2a 为源信号的波形图经混合矩阵 f o 0 6 0 6 o 516 3 o - 4 9 4 0 a 2 j 0 9 0 4 70 3 1 9 0 0 2 6 6 1 混合后的混迭信号x i ( ,) ,j 2 ( f ) ,墨( f ) ,的波形 l0 5 0 4 5 0 9 8 6 6 0 0 9 0 7 j 璺业奎兰塑主笙塞 墨三望堕堡鱼至丝塑塑鲨塑堕童重堕兰坌曼堕塑塞墨苎! 竺窭堡 如图2 2 b 所示,a 为 0 ,1 之间均匀分布的随机数我们选择n ( t ) = 0 0 3 ,为简单选g o q ) ) = y ( t ) ,经1 0 0 0 次迭代,得到 ro 2 1 7 32 2 5 1 70 1 3 5 3 、 il b = l o 5 2 7 2 一o ,1 6 5 7 1 4 6 1 7i :,可以看出,它是一个广义置换阵图 一3 3 6 0 9 0 4 6 2 9 o ,0 3 1 l 2 2 c 为分离输出的信号,可以看出其幅度和次序与源信号相比都发 生改变 2 2 短时综合的叠接相加法 短时傅立叶变换的定义为 疋( 8 一”) = w ( n m ) x ( m ) e 一” ( 2 2 2 ) 式中w 0 一脚) 是一个实数窗序列,假设置( 口。) 在时间域n 上用 周期为r 的抽样速率对短时变换抽样,因此我们有: z ( 8 “) = ( 9 7 “)( 2 2 3 ) 其中r 为整数,n = r r ,0 k l - l ,l 为频率取样点数。叠接相加法 以下式为基础 一1 y ( n ) = ( p ”。,“l ( 2 2 4 ) k = l 这就是说,为了要恢复信号,对不同的r 值算出r ( p 一) 的反变 换,得到下面的序列 ”( m ) = x ( m ) w ( r r m ) 。:m = x ( m ) w ( r r m )( 2 2 5 ) 然后将在时间n 上叠接的所有序列y r ( m ) 在各个时间n 上的值相 加就能得到在时间n 上的信号值,即 y ( n ) = ”) = j :o 归2 - “l 。 “1 ( 2 2 6 ) m 、 , = x ( n ) w ( r r 一 ) = 工( 订) w ( , - r 一行) 式( 2 2 6 ) 说明,y ( n ) 仍是x ( n ) 和w ( n ) 的卷积,只是在求卷积中的 步进值是每隔r 个样点才步进一次。 四川大学硕士论文基于短时综台叠接相加法的蔷膏盲信号分离的研究及其d s p 实现 圈22 ( a ) 源信号s ( t ) :( b ) 混迭信号x ( t ) :( c ) 分离输出信号y ( t ) 将式( 2 2 6 ) 的w ( r r m ) 视y 9 序列w ( r ) 被降低抽样率r 倍后 并移序m 来得到的。令w ( r ) 降低抽样率r 倍后的序列 w ( ,) = w ( 旭一m ) ,设w ( r r 一棚) 的傅立时变换为w ( e 一) 矽( b ”) 2 壶矿( 口俐8 ) 再将w ( r ) 移序m 点后的序列为( r ) = p m ) 。 ( r ) 的傅立叶变换为: 互w ( r r - m ) 72 去( e j w l r ) e ” 在式( 2 2 8 ) 中,当国= 0 时有: w ( r r 一肌) = 1 r z ( e j 。) 二一一 , ,:一一, 此式代人式( 2 2 6 ) ,即有: y = 竿砌) ( 2 2 7 ) 根据移序特性, ( 2 2 8 ) ( 2 2 9 ) ( 2 3 0 ) 这就是说,通过对波形叠接部分的相加,利用式( 2 2 6 ) 就能准确恢 复出x ( n ) ( 仅差一个常数) 。 9 四川大学硕士论文基于短时综合叠接相加法的语晋旨信号分禹的研冤及其d s p 实现 本文我们取h a m m i n g 窗,对于h a m m i n g 窗,疋( g ”- ) 的时域最小 采样率为r = 4 z , 此时窗w ( i i - m ) 每次移动的样点数 r = r ,= n 4 ,即最多每输入n 4 个语音样值计算一次短时频谱。 假设n c p u 中断9 d 淞通道2 一 c p 【l 中断1 1 d m a 通道3 一 c p u 中断1 2 f ) 将d m a 置于停止状态,清除d m a 的r w s t a t 标志位。 g ) d m a 初始化,进行下列设置将d m a 设置为需要的模式。 源地址= d r r 或要写入的地址 目标地址= 读出的存储器地址或者d x r 传输计数= 要传输的数据单元个数 接收同步事件,r w s y n c = r e v t ( 对于读) 发送同步事件,r w s y n c = x e v t ( 对于写) d m a 通道结束中断使能,t c i n t = i 优先级,p r i = i h ) 程序指令启动d m a 。 i ) 如果收发端不是帧信号主控端( 帧同步由外部输入) ,置x r s t 或 r r s t = i ,使之退出复位状态,此时作为从属的收发端已准备好接收帧同步信 号。新的帧同步中断信号( ( r x ) i n t m = i o b ) 将唤醒该收发端。 j ) 使帧信号主控端退出复位态。 k ) 如果f s g m = i ( 帧同步由采样率发生器产生) ,置f r s t = i ,使能帧同步产 生,8 个c l k g 周期后开始输出第1 个帧同步信号。如果f s g m :o ,将在每次 d x r 向x s r 中拷贝数据时产生同步信号,f r s t 位无效。不管怎样,此对主控 端开始传输数据。 3 0 四川大学硕士论文 基于短时综合叠接相加法的语音盲信号分离的研究及其d s p 实现 采用d m a 传输形式的m c b s p 的初始化流程图如图4 3 所示。 4 2 4 软件设计的技术细节 4 2 4 1d o u b ie in d e x in g 排序 d o u b l e i n d e x i n g 是d m a 所特有的一种从交叉存取的数据中提 取同类数据并按顺序排列技术。使用d o u b l e - i n d e x i n g 是因为从 m c b s p 输入和输出的是两路信号,我们需要把两路信号分别存在两个 区域。d m a 利用d o u b l e - i n d e x i n g 特征自动排序接收的数据,而 不需要d s p 的介入。 4 2 4 2p in g p o n g 缓冲 p i n g p o n g 缓冲是种同时利用两个数据缓冲区的数据传输技 术。使用该缓冲是因为在传输和处理数据过程中单个缓冲区数据很 容易被覆盖。p i n g p o n g 缓冲方式的连续执行,总是保持一个缓冲 区激活用于数据传输,而另一个缓冲区保持静态稳定的由d s p 处理 数据。 在本系统中,d m a 首先配置使用p i n g 缓冲,当该缓冲区满时, d m a 中断c p u 处理该缓冲区的据。同时,d m a 利用自动初始化功能 自动装载p o n g 缓冲初始化设置并启动p o n g 缓冲区传输数据。同样, 当p o n g 缓冲区满时,d m a 中断c p u 处理该缓冲区的数据并启动 p i n g 缓冲区传输数据,如此反复。这样,缓冲区中的数据可以保 证不被覆盖的条件下由d s p 来处理,数据的传输也是连续的。同 时使用p i n g p o n g 缓冲实现数据接收和发送,所以需要四个逻辑 缓冲区。 4 2 4 3 中断处理 在实际通信应用中,个发送( 接收) 之后,程序必须为下一 个发送( 接收) 作准备。本系统采用串口的d m a 多帧方式进行发送 ( 接收) ,在中断处理程序中或停止发送或加载数据。但在串口以d m a 四川大学硕士论文 基于短时综合叠接相加法的语音盲信号分离的研究及其d s p 实现 图4 3 采用d m a 传输形式的m c b s p 的初始化流程图 方式传输数据时却有一些问题要讨论。首先d m a 的传输同步事件应 四川大学硕士论文垂干短时绿台叠挺 且加法的语晋百信号分禹的研究及其o s p 买现 设为m c b s p 的传输事件即x e v t ,这样一字节传输后会自动准备另一 字节( m c b s p 的r e a d y 上升沿触发d m a 传输) 。中断发生时意味着一个 块己传完,这时d m a 的使能自动关闭,m c b s p 的r e a d y 将一直保持高 状态。但是在下一次突发传输直接使能d m a 时却启动不了传输。这 是因为无法产生m c b s p 触发启动所需的r e a d y 上升沿。解决办法是 在中断程序中先关闭m c b s p 的发送,使r e a d y = o ,随后在程序中发送 使能d m a ,再打开m c b s p 的发送既可。如先打开m c b s p 的发送后打开 d m a ,也是不会工作的。因为m g b s p 的r e a d y 已经由0 变到l 了,无 法再产生r e a d y 上升沿。 4 3 算法设计 频域内的语音盲信号分离算法的流程图如图4 4 所示。 c 6 0 0 0 系列d s p 具有8 个并行执行的功能单元,每次取址取一个指令包, 每个指令包最多包含8 个能并行执行的功能包。c 6 7 0 i 可以达到 1 0 0 0 m f l o p s ( 百万次浮点操作秒) 的峰值性能。为了充分运用c 6 7 0 l 的运算 能力使算法能达到实时处理,在算法设计中我们采用了以下的设计技巧。 1 c 语言和汇编语言相结合的混合编程方式,分离算法计算量大线性汇编, 系统初始化用c 语言编写。 2 c 6 0 0 0 系列每个指令包的最多8 条指令必须能并行执行,即每条指令必 须相互独立。d s p 两通道的f f t 和i f f t 是相互独立的,因此把两通道的f f t 和i f f t 合并在一起,能充分应用d s p 的8 个并行执行的功能单元。 3 数的定标就是由程序员决定一个数的小数点处于d s pj 卷片字长 的第几位,q 表示法是一种常用的定标方法。浮点数与定点数的转换 关系可表示为:浮点数x 转换为定点数y ,y = ( i n t ) x * 2 。;定点数y 转换为浮点数x ,x = ( f l o a t ) y * 2 一。 四川太学硕士论文基于短时综台叠接相加法的语音盲信号分离的研究及其d s p 实现 图4 4 频域内的语音盲信号分离算法的流程图 l 点 四川大学硕士论文基于短时综合叠接相加法的语音盲信号分离的研究及其d s p 实现 结束语 本文讨论了基于短时综合叠接相加法的语音盲信号分离的算法 及其实时处理,该算法有效地缓解了频率分辨率降低和信号间频谱相互干 扰这对矛盾,产生较好的分离效果。但由于硬件设计时考虑不周导致 硬件调试时所用飞线过多使系统出现不稳定现象,并且由于时间的 关系,我们还没来得及对实际产生的分离效果给出一个定量地表示, 只是靠耳朵听分离效果。我们将在后面的工作中进一步完善。并且 要完全满足实际应用中对盲信号分离的要求,本文讨论的算法和d s p 实时处理系统都还有需要改进的地方,这也正是我们的后续工作。 从图2 2 的瞬时混合的分离图我们可以得到两个结论:1 1 分离 出的信号的幅度和次序与源信号相比都发生改变。2 ) 混叠信号其中 一路如占源信号的某一路成分多,则对应的分离后的信号就是源信 号的这一路信号。我们把时域的瞬时混合应用到频域的卷积混合, 因为1 ) 将产生信号间频谱相互干扰,虽然我们用短时综合叠接相加法使 之得到有效的缓解,但没有最终消除。要使之更有效地缓解并消除, 2 1 为我们提供了一个契机。 在后续工作中,我们将在基于短时综合叠接相加法的语音盲信 号分离的算法前加基于麦克风阵列的波束形成做预处理。波束形成 的基本思想是:通过将各阵元输出进行加权求和,在一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论