




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一种labview环境下的语音跟踪系统语音技术6晌响0文章编号:10028684(2008)12005404一种labview环境下的语音跟踪系统肖光华.方勇(上海大学通信与信息工程学院,上海200072)?论文?【摘要】针对室内应用场合,提出了一种基于时延的传声器阵列定位模型.该模型由4个三角阵列组成并根据每个阵列的估计角度按面积逼近方式求得说话人的位置,最后在labview环境下给出了系统实现方案.实验结果表明,该系统能弥补传统基于时延的定位方法在测距性能上的不足,对说话人进行有效跟踪定位.【关键词】语音跟踪;labview环境;信号采集【中图分类号】tn912【文献标识码】aaspeechsourcetrackingsystembasedoillabviewplatformxiaoguanghua,fangyong(schoolofcommunicationandinformationengineering,shanghaiuniversity,shanghai200072,china)【abstract】alocationmodelofmicrophonearraybasedontimedelayestimationisproposedforsmallsizechambers,whichiscomposedoffourtrianglearrays.inordertotrackthespeaker,theanglesestimatedfromeacharrayandareaapproximatingmethodsareimplementedonlabviewplatform.experimentsshowthatthesystemisusefultoovercomethedisadvantageofdistanceprecisionandspeaker-tracking.【keywords】speechsourcetracking;labviewplatform;signalacquisition1引言语音跟踪技术在视频电话会议,大型会议场所记录,语音识别预处理装置,助听设备等场合具有广泛的应用前景.在声源定位方法中,以基于时延的定位方法运算量小,易于实时实现而得到广泛研究,然而其定位算法在距离估计精度上受环境噪声和混响的影响较大i1l,使得阵列的定位性能大大下降.笔者针对室内应用场合,提出了一种基于时延的传声器阵列定位模型,该模型由4个i角阵列组成并根据每个阵列的估计角度按面积逼近的方式求得说话人的位置,从而避免了单个角阵列在测距性能上的不足,并在labview环境下提出了整个语音跟踪系统的实现方案.实验结果表明,该系统能对说话人进行有效跟踪定位.2系统定位原理由于说话人在室内垂直方向上的移动距离很小.所以系统只在二维平面上对说话人进行跟踪定位.假设在dmxd111的”会议室内,在其四周分别设置一组角形状的传声器阵列(高度尽量与说话人处于同一水平面),组成一个2d平面阵列,三角阵列的具体放置如图1所示.设说话人位置为(.,yo),三角传声器阵列位置如a,a2,a,a所示.根据图1所示,假设阵列a的三个传声器坐标分别为(0,0),(,y1),(,y:);声源的极坐标形式为(r,);声音速度为c;声源到达3个传声器的时间分别为丁,2,3,它们之间的时间差toi=r1一r0,o2=r2一r0,则根据声源和传声器阵列a之间的距离关系方程,可求得声【基金项目】国家自然科学基金(60872114);上海市优秀学科带头人项目(05xp14027):高等学校博士学科点专项科研基金(20060280003)国堕室熊生蔓丝鲞蔓塑源相对阵列4的方向角0.,即i.一i=arccos(1)va+b其中.a-x一(cto1).一c7”02)(2)b=y2一(c)_yl一(c7”02)(3)d=(c)?一(c)一(c).2+(c)(4)=arctan(b/a)(5)同理,根据声源和传声器阵列的a,a,4之间的相对位置,采用坐标旋转的方式,即可求出02,03,04.理论上,这4条方向直线应交于一点,即(.,y.),但由于各种误差因素的存在.每2个阵列就会有1个声源位置估计值.为了寻找声源的最优估计,可以采用一种面积逼近的算法,即假设阵列a,a,a估计位置(交点)分别为g:,g,g:,;阵列a,a,a估计位置分别为g.2,g14,g24;阵列a,a估计位置分别为,g24,g其中各位置交点坐标分别为g12:a一2d,暑),fd(1-a3)aid(1-a3)fdaid1g13:i一j,g14:ia1-a4j,g23:fd(az-a3+1)a2d/d(a2+1)a2d(a4+1)la2-a3/:l:/g,a3d,-aa3,a一4add),ai为阵列ai(i=1,2,3,4)方向直线的斜率.它们分别可以构成一个三角形,通过迭代或比较,从中选出面积最小的三角形,则认为它的中心(一般为重心)坐标(互,)就是声源的估计位置.相对于其他平面定位阵列,这种系统阵列布局的优点在于:(1)每个三角阵列所求得的声源目标角度都是解析解.在近场范围内其各个位置的角度误差近似呈均匀分布31.即使某一个阵列受到较大干扰也不会出现较大误差.(2)如图2(a)所示,声源在”阴影”区域内,阵列估计的2组时延正负是保持不变的,其中q点为传声器.和中垂线的交点.由此可知,在室内如图2(b)阴影”范围内,4组阵列所估计的时延正负都保持不变.从而有效避免了因时延出现正负而产生的误差.降低了时延估计的计算复杂度.虽然其有效跟踪区域比室内面积要小.但由于阵列中传声器的间距相6豌响0=f语音技术对较小,其缩小的面积几乎可以忽略不计.(3)系统只需要知道室内房间的长和宽就可以进行跟踪定位,能适应不同类型的室内场合.(4)安装方便,4组传声器阵列算法和结构完全一样,安装时没有顺序要求,便于维护.3系统设计labview作为一个优秀的图形化编程平台.它在数据采集,虚拟仪器软件框架,通用接口总线及串口仪器控制,图像处理,运动控制,数据分析和图表显示方面都具有强大的优势,特别是对于一些基于实时数据的采集和分析的应用系统或虚拟仪器的设计.ijabview更是无可替代41.而本系统采用labview来实现,不仅可缩短设计时间,还可检测系统在实际应用中的性能.3.1语音信号的预处理一般室内环境的噪声比较小,当环境中没有语音信号时,为了防止系统把噪声”误认为”语音信号,需要对信号进行预处理.图3是三角阵列对采集信号预处理的后面板设计流程,其中:(1)先利用采集卡pxi4472将传声器接收到的语音信号按一定的采样率和采样方式进行采集翻,笔者使用的语音信号采样频率为44100hz,同时采集3个通道的语音信号.(2)将采集到的信号进行分帧,并对每一帧(<0.1s)信号分别进行滤波(3003400hz的带通滤波),ffti1变换求功率谱密度,再对每一个频率上的值累加,即得到这一帧信号的能量.(3)根据现场环境设定”噪声门限”,即采集的一帧信号能量低于这一门限的均认为是噪声.门限值可以通过前面板的滑块进行调节.(4)当有足够多帧的连续信号能量超过门限时,存储采集信号用于定位分析,具体帧数可根据现场环境和系统反应速度来决定.这样不仅可避免突发噪声!妻熊塑圭蔓鲞蔓塑国语音技术6响响0(如咳嗽,桌椅挪动等)造成系统的误判,还可防止语音采样信号不充分(采样信号中存在无语音段)而造成的误差.3.2基于时延的三角阵列定位模块设计将储存的采样信号通过时延估计和几何定位.最终得到所需的定位角度.图4为语音定位部分的后面板流程设计,其中:(i)调出采样信号波形,分出每个通道的语音波形送人相应的端口.labview中波形数据是按矩阵的方式存储的,因此利用索引的方式可以很方便地调出任意一个通道的波形.(2)构建lms自适应滤波器模块来估计传声器之间的时延并封装成vi的形式方便调用.其中三角阵列定位算法中需要知道2组时延信息,因此设计时要用2个时延模块来估计时延陶.(3)构建几何定位模块并根据时延结果得出声源的位置角度并从串口发出数据.按同样的方式将定位模块封装成vi的形式,留出输入输出端口,使得设计流程更加简洁明了.3.32d平面跟踪系统设计流程根据4个阵列所估计出的角度,就可求出声源在2d平面上的坐标位置.虽然阵列a2,a,a传声器坐标已经改变,但不需要重新列方程求解,由于笔者只需巨堕塞鲢生蔓墼堂蔓塑要求出声源相对阵列的偏角,所以通过变换坐标系就可很方便地求出在4个阵列在各自坐标系的声源角度0,02,03,o4.图5示出系统的整体设计流程,其中:(1)系统初始化.包括室内房间的长和宽,阵列的阵元间距,信号采样频率,采样时间及滤波器设置等.(2)信号采集同步.每个阵列都有各自的信号预处理模块,当跟踪区域内存在语音信号时,由于位置关系并不一定能触发所有的阵列同时进行语音信号采集,所以必须对信号采集作同步处理,即只有在4个阵列都”认为”有稳定语音信号存在的条件下才能同时对语音信号进行采集.这会对说话人的跟踪有一些延迟.但对于室内说话人移动速度和移动范围都不大的情况下,实时跟踪的要求是可以达到的.(3)根据所得到的声源估计位置,采用面积逼近的算法,从而求出声源估计位置(互.).4实验结果为能直观的测试系统定位性能,首先必须给出初始条件.即在安静的环境(噪声在30db左右)条件下,系统在一个7mx7m的区域内进行测试.三角阵列的阵元间距为1m并且4个阵列中传声器的型号一样.则说话人的活动范围应该在6.5mx6.5m的范围内(由图2可知).由于nipxi4472采集卡最多只能同时采集8路语音信号,而系统需要能同时采集12路语音信号,所以对每个阵列的信号采集只能分时处理,即在每个位置,说话人至少要进行2次语音信号的采集.其中信号的采样频率为44100hz,每段语音信号采集的时间为0.5s.图6是说话人部分位置的定位结果,其中说话人的位置坐标是随机的.”表示说话人真实位置,“o”表示声源估计位置.u;一l一口口丑;经过大量测试.系统每个三角阵列的定位精度基本可以在5.范围内.图7为误差范围内估计位置和真实位置距离标准差的仿真结果.从图7中可以看出.结果基本能反映出说话人的真实位置,其误差也在可接受的范围内.当角度误差在5.范围内.其距离误差不超过1.5m,说明系统对于室内噪声和混响的影响具有较强的鲁棒性.而系统跟踪运算时间主要是耗在对信号时延估计的迭代算法上,实验是在pc配置为amdathlon(tm)xp1700+1.47ghz,256mb内存的条件下进行的.一组时延估计大约每次在0.3s以内,如果整个系统都由一个处理器来完成运算.则系统给出一次结果大约需要3s,对于室内说话人有限的移动速度和移动范围来说.基本能达到实时跟踪的要求.5结束语笔者针对室内应用场合设计了一套完整的语音跟6嗡0翊=/语音技术踪系统并给出了具体实现方案.实验表明该系统能够满足室内小型会议场合的需要,具有较好的实时性和定位精度.如果每个三角阵列都由独立的处理器来完成运算,终端通过有线或无线的传输方式控制数据的同步接收和发送,系统的实时性能将会有更大的提高.此外,如果能进一步提高阵列定位精度以及降低环境噪声,还可以实现三维空间的语音跟踪定位.参考文献1】antonaccif,lonoced,motyam,eta1.efficientsourcelocalizationandtrackinginreverberantenvironmentsusingmicrophonearraysc/proceedingsof2005ieeeinternationalconferenceonacoustics,speech,andsignalprocessing.s.1.:ieeepress,2005,4:1061-1064.【2梁家惠,王成云,饶宇.声源定位实验一个具有明确应用背景和前沿技术特点的综合性实验j.物理实验,2000,20(1):57.【3】hangy,benestyj,eikogw,passiveacousticsourcelocalizationforvideocamerasteeringc/procee-dingsof2005ieeeinternationalconferenceonacoustics,speech,andsignal
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025河南航空港投资集团有限公司25人招聘考前自测高频考点模拟试题完整答案详解
- 2025年甘肃祁连山水泥集团有限公司招聘30人考前自测高频考点模拟试题及完整答案详解
- 2025广东广州城建职业学院选聘机电工程学院院长1人模拟试卷及答案详解(名校卷)
- 2025-2026学年度四川省雅安神州天立高级中学高二上学期第一次月考历史试题(含答案)
- 2025-2026学年度贵州省贵阳市观山湖区第一高级中学高二上学期9月月考历史试题(含答案)
- 2025年甘肃甘南玛曲县人民法院司法警务辅助人员模拟试卷及完整答案详解一套
- 2025北京首都医科大学附属北京中医医院招聘22人(第二批)考前自测高频考点模拟试题及答案详解(历年真题)
- 2025年湖南省烟草专卖局系统公开考试聘用工作人员考前自测高频考点模拟试题及答案详解(新)
- 2025年湖南省烟草专卖局系统公开考试聘用工作人员模拟试卷有答案详解
- 2025年度延吉市中小学教师专项招聘116人模拟试卷含答案详解
- 2025年抗菌药物合理使用培训
- 杜仲种植深加工项目可行性研究报告-备案立项
- 2025年乡村文化旅游发展报告:文旅融合下的乡村旅游生态旅游规划与实施研究
- 2025-2030智慧养老行业竞争格局分析及投资前景与战略规划研究报告
- 2025-2030中国在线总有机碳(TOC)分析仪行业市场现状供需分析及投资评估规划分析研究报告
- 合伙购买墓地协议书
- 英语教学课件Unit 2 Different families课件9
- 医学综述研究进展汇报
- 2025年福建省泉州市中考二模历史试题(原卷版+解析版)
- 2025春 新人教版美术小学一年级下册致敬平凡
- 危险废物分析制度
评论
0/150
提交评论