版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、到达时差估计的频域模型JesperRindomJensen1,JesperKj况rNielsen23,MadsGr代sb0llChristensen1,S0renHoldtJensen31AalborgUniversity2Bang&OlufsenA/S3AalborgUniversitAudioAnalysisLab,AD:MTStruer,DenmarkDept.ofElectronicSystemsjrj,mgccreate.aau.dkjkn,shjes.aau.dkt摘要到达时差(TDOA)估计是音频信号处理应用中的一类重要问题,以前可以通过互相关方法解决。但本文表明,互相关方法实际
2、上是通用的方法中的一个受约束的特例。因此,本文设置了条件使互相关方法成为统计有效的估算方法。其中一项条件是源信号为基本频率是2Nrad/样本的周期信号,其中N是数据点的个数或已知的谐波个数。而更通用的方法只要求源信号具有周期性,因此在对合成数据以及人工延迟的语音信号的估计准确度方面优于互相关方法。仿真代码可在网上获取。索引词(分数)到达时差估计,基频估计,广义互相关1.引言在许多应用中,对一个未知信源的角度和位置的估计是一项重要课题。例如,在音频应用中,此类估计可用于区分说话人、抑制非所需的背景噪声和估算房屋的几何结构1-3。此类对到达方向和信源位置的估计问题可以归结为估算一个传感器阵列中各个
3、传感器之间的到达时差,文中考虑两个传感器之间的到达时差。传感器对的到达时差估计通常需要将它输入用于处理至少两个扩音器记录的数据的算法(譬如流行的SRP-PHAT算法1)中2。目前,在语音应用中计算到达时差估计最广泛应用的方法是基于相关方法的集合,或称广义互相关4(GCC)方法。与雷达和声呐应用相比,此处的源信号是典型的宽带信号,因此一些对于窄带信号统计有效的算法不能在这直接使用,例如MUSIC和ESPRIT。另外,宽带版MUSIC方法的计算代价7比GCC方法的更高,并且当采用快速傅里叶变换算法的GCC方法在频域得以论证后,这类方法能够高效地应用。构建信号频域模型的另一项优势在于可以从源信号中提
4、取延迟参数并将其模拟成连续参数。因此,大多数关于音频应用中的到达方向的估计和信源定位的论文都从频域模型开始研究。如果考虑最简单的到达时差估计参数模型,则本文的主要观点可以简单阐述。x(n)二s(n)+e(n)11(1)x(n)二ps(n耳)+e(n)22n=0,1,.,N1,其中信号x(n),s(n)和e(n)分别为第i个传感器信号、源信号和传感器iii上的噪声。标量00,耳丘-N2N2分别是样本源信号从传感器1到2的衰减和相对延迟。如果源信号是一个基频为2兀;Nrad/样本(或其整数倍)的周期信号,则公式(1)中的模型在频域内可写成:X(k)二S(k)+E(k)11(2)X(k)=0S(k)
5、exp(-j2kkq/N)+E(k)丿22k=0,1,.N1,其中X(k),S(k),E(k)分别为是信号x(n),s(n)和e(n)的离散傅里叶iii变换系数。公式(2)中的频域模型存在一些问题。首先是局限性太强,虽然音频应用中的信号源通常在较短的时间范围内近似具有周期性,但实际中,该假设在基频上通常难以令人满意,会产生边缘效应8-10。通过适当地补零可以避免边缘效应,但是会通过一个秩亏相关矩阵丰富噪声频谱8。另一个问题是,由于一个实数源信号中的非整数延迟会产生一个复数的传感器信号,公式(2)中的频域模型没法用于分数TDOA估计!针对这些问题,本文提出一种不同的模型,假定源信号具有周期性但基
6、频不是2兀JNrad/样本。将基频模拟成一个未知的参数并联合TDOA和DOA对其估计已经不是新思想-。然而本文表明,该模型比传统频域模型更具广泛性,因为后者是前者的一个特例。本文还设立了条件使互相关方法成为统计有效的估计方法。由此,本文为联合基频和到达时差估计提出了一种新型的近似最大似然估计方法,在处理合成数据和人工延迟的声音数据方面的性能均优于互相关方法。相比于传统互相关算法,该估计方法无需使用内插方法就能产生分数延迟估值。2.联合基频与到达时差估计正如引言中所提到的,本文不对基频信号的模型做任何假设。如下文中详述,本文假定源信号是具有一个未知基频和数量未知的谐波成分的周期性信号。本文还假定
7、噪声为高斯白噪声。尽管可能导致对大混响音频的估计性能不佳,这些假设已经足以论证本文的主要观点。2.1模型任意一个平均值为0的实数周期性源信号可以写成TOC o 1-5 h z HYPERLINK l bookmark18 o Current Document s(n)=艺Acos(kn+)=Saexp(/tokn)k0kk0k=1k=-L其中A0,0e-兀,兀),toe(0,兀/Z),a=a*=Aexp(j)/2分别是幅度、相位、基kk0kkkk频和复振幅。记A=0,相当于实际中源信号无直流分量。如果将源信号延迟1,得0s(n-q)=Saexp(jtokn)exp(-jgk)k=-L(9)此处
8、定义g叩。公式(1)中的信号模型可写成矩阵向量形式x1x2Z()00Z()D(g)0a+e=H(0,g,)a+e0(5)此处定义zg)1exp(jto)exp(je(N-1)TZ()z(L)00z(一)z()z(L)000D(g)diag(exp(jL),,exp(L),exp(jg),exp(jL)aaaL1aaT1LH(0,g,o)二Z()00Z()D(g)0另外,假设噪声是方差为G2的高斯白噪声,则观测模型符合标准正态分布,概率密度函数(pdf)为P(X1,0,g,0,2)=N(H(0,g,叩212J其中I是2Nx2N的单位矩阵。2N2.2一种近似最大似然估计方法公式(6)中的观测模型包
9、含2L线性参数,噪声方差G2和非线性参数0,o和g。如果观测模型关于这些参数进行最大化,可以得到这些参数的最大似然估计。线性参数和噪声方差容易从最优化问题中分离出来,还剩下非凸函数最优化的问题八八(7)(0,g,)=argmaxJ(0,g,)0O,geK,兀),0E(0L)此时代价函数如下(0,g,叩=XHH(0,g,o)HH(0,g,叩日(0,g,o)-1XHH(0,g,叩X这个代价函数有时也称为非线性最小平方(NLS)代价函数。虽然对公式(8)中高度非线性的代价函数进行3D搜索寻求全局最大值在理论上是可行的,但是计算上并不合适。但是可以采用下文所述的一种更快的近似方法。当基频不在0或兀(与
10、N有关)附近时,Zh()Z()的积近似于一个缩放的单位矩阵00Zh()Z()uNI002L该近似值精确渐进于N或者如果基频位于傅里叶栅点2“kNN-1。k=0在该近似关系下,有Hh(P,g,)H(卩,g,)沁(1+卩2)NI(10)002L并且公式(8)中的代价函数的结果可以写成J(P,g,叫)二1N(1+P2)xhz()Zhg)x+p2xhz(e)Zhg)x10012002(11)+2PxhZ(e)D*(g)Zh(e)x1002建议代价函数按以下步骤进行优化:1.若所有非线性参数均未知,可通过一个多通道距估计函数16估得基频的初始估计值。若谐波的数量L也未知,联合基频和模型阶数估计函数17可
11、以通过模型比较框架18进行扩展,用来处理多通道数据。若衰减卩和g已估得(见以下两步),可以同过对公式(11)中的代价函数求最大值来重新估计基频。2若基频已知或已经估得,g的代价函数不依赖于卩,且减小到(12)J(g)Z(e)D(g)Zh(e)x2001可以用一种带有一维线性搜索(比如斐波那契搜索)的快速傅里叶变换算法进行有效地优化。3若基频已知或已经估得并且g的估值已经算出,衰减参数的估值可通过解关于P的二阶方程0刃(卩,g,叫)U=c邻=PxhZ(e)Zh(e)x一xhZ(e)Zh(e)x20021001+(1一P2)xHZ(e)D*(g)ZH(e)x(13)1002求得。重复以上三个步骤,
12、就可以得到最大似然估计值。实验发现,迭代一次的结果已经可以接受,下一章仿真时也会这样设置。2.3一个重要的特例当基频设为e=级N,谐波数量设为L=Nj2-1,公式(9)中的近似值是精确的,且n=ge的代价函数于卩无关,写成J们)=xhZ(22N)Zh(22N)x=歹-1X*(k)X(k)exp(j2kkq;N)(14)k=-N!2+1其中X()=X()=。12如果耳是整数,X(N2)=X(N2=0,N是偶数,则代价函数可写成12J们)=匸X:(k)X?(k)exp(j2kN)(15)k=0即互相关到达时差估计方法的代价函数。互相关估计函数15是一种最大似然估计方法,且在满足以下条件时是一种有效
13、的估计函数:源信号是均值为0的周期信号源信号的基频为2k/Nrad/样本源信号的谐波数量为L=n:2-1延迟是整数对于N为偶数,X1(N2)丰0,X2(N2丰0的特例,互相关估计方法是一种次优估计方法。然而在实际应用中,抗锯齿滤波器几乎可以确保X1(N2)沁X1(N7)沁0,因此该特例不符合实际情况。2.4.分数到达时差估计公式(15)的互相关函数也可以从公式(2)中的频域模型中得到。但是,如引言中所述,即便耳是连续参数,代价函数也不能用于估算分式到达时差。为了证明这一点,假设没有噪声,则X(k)=X(k)exp(-j2kkn/N),fork=0,1,N-1210其中n0是真实延迟。如果将其代
14、入公式(15)并利用X1(k)=X:(N-k),代价函数变成复数,除非n-n是整数。这个的问题可以采用不同的插值法妙21】、分数延迟滤波器匚2,23和分数傅0里叶变换24解决。但是用公式(14)的代价函数可以不用这些启发式算法,因为它对任意延迟n的结果都是实数。3.仿真本文提出的达到时差估计方法(以下表示为AML)在合成数据和人工延迟语音数据上与其他估计方法进行了评估和对比,用以实验性地展示该方法与传统估计方法的差异。其他方法包括NLS0,以及分别带有单位和相位变化(PHAT)加权的广义互相关(GCC)4方法。这几种GCC方法已经过修正,比如考虑到分数到达时差估计,代价函数中带有对称指数14,
15、下文中称为GCC和GCCPo近似最大似然估计法与NLS的不同在于NLS没有求出公式(9)中的渐进近似值,但是假定信号源在远端(例如0=1)。这几种方法的基音和谐波模型阶数都可以用文献17的方法估得。首先对合成数据进行评估。实验中,选取的100个实数周期样本信号包含5个带有单位振幅和随机相位的谐波分量,基频从u(0.1,0.15)中采样。然后将所选取信号延迟约0.6个样本并乘以0=0.75,产生一个附加信号来得到一段合成立体声音信号。两个信号都在高斯白噪声中进行观察,高斯白噪声的方差与首通道信噪比对应。设置完成后,对不同的首通道信噪比进行100次Monte-Carlo仿真,结果如图1a所示。标签
16、“NLS(oracle)”和“CRB”分别代表装配有oracle基音信息和克拉美罗界的NLS方法。(a)(b)(c)图.1(A)NLS和GCC(P)分别在不同信噪比下的立体声谐波信号(a)、不同信噪比下的立体声咼斯白噪声(b)和不同基频偏移(c)情况下的性能结果显示,不管使用的是真实的还是估计的基音,NLS性能都差不多(除了低信噪比)。另外,NLS比ANLS性能略好。更重要的是对于传统频域模型来说,这些方法都比GCC(P)性能好。这清楚地表明了采用本文提出的模型的优点。(A)NLS信噪比高于30dB,原因是ANLS使用了公式(9)中的大样本近似值,NLS方法中采用了远场假设(例如卩=1)。接下
17、来的实验中选取的信号是宽带高斯白噪声信号(以N为周期),对应叫=2兀/N和一个NJ2-1阶谐波模型。与之前同样通过延迟和衰减得到一段立体声片段。在每个频道上加高斯白噪声,首通道信噪比各不相同。设置完成后,得到的结果如图1b所示。这种情况下,所有方法效果类似,在信噪比超过10dB时达到克拉美罗界,表明公式(2)中广泛应用的频域模型只是本文提出的到达时差估计模型的一个特例,印证了本文的观点,。此外,实信号不可能严格以N为周期,因此在实际应用中GCC(P)方法通常无法达到最佳效果。还需注意,在类似这样的宽带情况下,基频很低且难以估计26。尽管如此,在基频已估得时,AML和NLS方法也能取得最佳效果。
18、最后一次实验和第一次对合成数据的实验一样带有谐波信号。但是本次试验中,基频1Hz加上了一个变化的频偏,首通道的信噪比也随之改变,采样频率f为8kHz。对不同的频偏进行Monte-Carlo仿真,结果如图1c所示。当基频位于Ns点频率栅格点(例如无频偏)时,GCC、AML和NLS方法效果相似,且都到达克拉美罗界。现实场景中,随着频偏增大,所有方法效果都会下降。频偏超过5Hz时,AML和NLS的效果明显好于GCC(P)。无衰减(卩=1)情况下,即使有频偏,NLS也能达到克拉美罗界,因此具有衰减系数估值的NLS在一切情况下效果都明显优于GCC(P)。a110.5IL.52TimesVCCIL一由图2
19、用(A)NLS和GCC(P)方法得到的真实语音合成信号的到达时差估计GCCGCCPAMLNLS均方根误差样本0.1480.2010.0560.036表1.对应图2中估值的均方根误差本文还用人工延迟语音数据对该方法进行了评估,所用的数据集是一段女性说“Whywereyouawayayear,Roy?”的语音信号。为了评估所获得的到达时差估计值的精确度,用RIR发生器囚将这段语音延迟,合成了立体声片段,这样实际的到达时差约为0.75个样本。整个过程中没有回声和额外的噪声。用上述方法每12.5ms从两个频道内对100个样本区进行采样,采样频率为8kHz。估值结果如图2所示,对应表1中的均方根误差。这
20、些结果表明,在现实场景中GCC(P)会产生许多虚假的TDOA估值,AML和NLS效果明显优于GCC(P)。这说明本文提出的达到时差估计模型在实际应用中确实有效。4.结论本文将传统互相关方法和一种通用的最大似然估计方法联系在一起,其中最大似然估计方法中周期信号的基频设置成一个参数未知且连续的模型。在此联系中设立了四个条件使互相关方法成为统计学上有效的估计方法,并实验证实了采用最大似然估计方法能取得显著的提升。条件十分苛刻,要求未知源信号的基频为2QNrad/样本,其中N是数据点的个数,谐波数量为N::2-1,且延迟是一个整数值。本文说明了用零点附近的对称频率指数就能推翻后一种假设。自然而然地引出
21、本文提出的模型,基频和谐波数量都是未知参数。此外,证实了由此推导得来的该模型的近似最大似然估计方法在合成数据和现实数据上均优于互相关方法。5.参考文献1J.H.DiBiase,H.F.Silverman,andM.S.Brandstein,“Robustlocalizationinreverberantrooms,”inMicrophoneArrays-SignalProcessingTechniquesandApplications,M.S.BrandsteinandD.B.Ward,Eds.,chapter8,pp.157180.Springer-Verlag,2001.2J.Chen,J
22、.Benesty,andY.A.Huang,“Timedelayestimationinroomacousticenvironments:Anoverview,”EURASIPJ.onAdvancesinSignalProcess.,vol.2006,pp.1-19,May2006.J.Benesty,J.Chen,andY.A.Huang,Microphonearraysignalprocessing,Berlin,Germany:Springer-Verlag,2008.C.KnappandG.Carter,“Thegeneralizedcorrelationmethodforestima
23、tionoftimedelay,”IEEETrans.Acoust.,SpeechSignalProcess.,vol.24,no.4,pp.320-327,Aug.1976.R.O.Schmidt,“Multipleemitterlocationandsignalparameterestimation,”IEEETrans.AntennasPropag.,vol.34,no.3,pp.276-280,Mar.1986.A.Paulraj,R.Roy,andT.Kailath,“Estimationofsignalparametersviarotationalinvariancetechniq
24、ues-ESPRIT,”Rec.AsilomarConf.Signals,Systems,andComputers,pp.83-89,Nov.1985.7J.P.Dmochowski,J.Benesty,andS.Affes,“BroadbandMUSIC:opportunitiesandchallengesformultiplesourcelocalization,”inProc.IEEEWorkshoponAppl.ofSignalProcess.toAud.andAcoust.IEEE,2007,pp.18-21.J.C.Chen,R.E.Hudson,andK.Yao,“Maximum
25、-likelihoodsourcelocalizationandunknownsensorlocationestimationforwidebandsignalsinthenear-field,”vol.50,no.8,pp.1843-1854,2002.Y.IsbiandA.J.Weiss,“DFTmodelerrorsforfinitelengthobservationswithspatiallydistributedsensors,”inIEEEConv.ElectricalandElectronicsEngineersinIsreal.IEEE,2008,pp.080-084.A.Ye
26、redor,“Analysisoftheedge-effectsinfrequency-domainTDOAestimation,”inProc.IEEEInt.Conf.Acoust.,Speech,SignalProcess.,2012,pp.3521-3524.X.QianandR.Kumaresan,“Jointestimationoftimedelayandpitchofvoicedspeechsignals,”Rec.AsilomarConf.Signals,Systems,andComputers,vol.1,pp.735-739,Oct.1995.G.Liao,H.C.So,a
27、ndP.C.Ching,“Jointtimedelayandfrequencyestimationofmultiplesinusoids,”inProc.IEEEInt.Conf.Acoust.,Speech,SignalProcess.,May2001,vol.5,pp.3121-3124.L.Y.Ngan,Y.Wu,H.C.So,P.C.Ching,andS.W.Lee,“Jointtimedelayandpitchestimationforspeakerlocalization,”inProc.IEEEInt.Symp.CircuitsandSystems,May2003,vol.3,p
28、p.722-725.14J.X.Zhang,M.G.Christensen,S.H.Jensen,andM.Moonen,“JointDOAandmulti-pitchestimationbasedonsubspacetechniques,”EURASIPJ.onAdvancesinSignalProcess.,vol.2012,no.1,pp.111,Jan.2012.M.WohlmayrandM.Kepesi,“Jointposition-pitchextractionfrommultichannelaudio,inProc.Interspeech,Aug.2007,pp.1629-163
29、2.M.G.Christensen,“Multi-channelmaximumlikelihoodpitchestimation,”inProc.IEEEInt.Conf.Acoust.,Speech,SignalProcess.IEEE,2012,pp.409-412.J.K.Nielsen,M.G.Christensen,andS.H.Jensen,“DefaultBayesianestimationofthefundamentalfrequency,”IEEETrans.Audio,Speech,Lang.Process.,vol.21,no.3,pp.598-610,Mar.2013.
30、J.K.Nielsen,M.G.Christensen,A.T.Cemgil,andS.H.Jensen,“Bayesianmodelcomparisonwiththeg-prior,IEEETrans.SignalProcess.,vol.62,no.1,pp.225-238,2014.G.JacovittiandG.Scarano,“Discretetimetechniquesfortimedelayestimation,”IEEETrans.SignalProcess,vol.41,no.2,pp.525-533,Feb.1993.M.M.McCormickandT.Varghese,“Anapproachtounbiasedsubsampleinterpolationformot
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安徽省肿瘤医院医护人员招聘考试试题附答案详解
- 2026山西晋城康宁骨科医院招聘10人备考题库及参考答案详解1套
- 2026年西安市雁塔区雁祥学校教师招聘笔试备考题库及答案详解
- 2026年长沙市中心医院医护人员招聘考试参考试题及答案详解
- 2026云南红河州蒙自市森邦人力资源有限责任公司就业公共服务人员招聘6人备考题库及答案详解一套
- 2026广西玉林市北流市人民医院赴广西医科大学双选会招聘专业技术人员28人备考题库带答案详解
- 2026浙江台州市玉环市招聘事业编制教师98人备考题库(第二批)及完整答案详解一套
- 2026年鹤岗鹤矿医院医护人员招聘笔试备考题库及答案详解
- 2026年浙江省肿瘤医院浙江中医药大学附属肿瘤医院医护人员招聘笔试参考题库及答案详解
- 2026年成飞医院医护人员招聘笔试参考试题及答案详解
- 《TCW-32 ZK温控器使用说明书》
- 新生儿异常情况识别与处理
- 如何写好一份医学教案
- 食堂运营与管理计划
- 民营医院工资薪酬方案
- 2025年移动初级解决方案经理认证理论考试指导题库-下(多选、判断题)
- 2024年湖北水利发展集团有限公司招聘笔试冲刺题(带答案解析)
- (正式版)JBT 9229-2024 剪叉式升降工作平台
- 新药研发毒理学安全性评价
- 外科学教学课件:下肢骨关节损伤
- 2023年潍坊市初中学业水平考试地理试题附答案
评论
0/150
提交评论