版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第第页基于最长序列的虚拟3D音效的实现摘要:为了在多媒体移动终端里实现3D音效,一个头部相关的传递函数首先被获取,然而一般的头相关传递函数的计算是把头当作一种球体来建立一个数学模型,这种模型的数学的计算复杂,不适合在嵌入式终端的实现.本文提出一种基于最长序列的测量系统脉冲响应的方法,该方法基于互相关技术,具有很高的抵抗噪声干扰能力,得到结果精度高,可重复性强,计算复杂度低,便于在嵌入式终端的实现。
关键词:最长序列;头部相关传递函数;三维音效
中图分类号:TP393文献标识码:A文章编号:1009-3044(2015)02-0187-05
Abstract:Toimplementvirtual3Dauditoryinmobilemulti-mediatermination,ahead-relatedtransferfunction(HRTF)needbecalculated,butinconventionalstudies,thecalculationsareperformedapproximatelybasedonthemathematicalmodelbyregardingtheheadasthesphereshape.Thismathematicalmodelcomputationiscomplex,notvalidtoapplicationfortheembeddedtermination.Thispaperhasproposedthewaywhichcalculatesystemimpulseresponsebymaximumlengthsequence(MLS),itisbasedonthecross-correlationtechniqueandthushighlyimmunetoextraneousnoiseofallkinds,andmeasurestheimpulseresponsewithgreatamountofaccuracyandrepeatability.Foritssimplycomputation,itisconvenienttoimplement3Dauditoryeffectintheembeddedtermination.
Keywords:maximumlengthsequence(MLS);head-relatedtransferfunction(HRTF),3Dauditory
在移动多媒体终端中,因为只有一组喇叭或者是耳机,为了让用户体验到逼真的3D音效,需要定位出环绕使用者身边不同位置的音源。这种音源追踪的能力,就叫做定位音效,它使用当时的HRTF[[1]]的功能来达到这种神奇的效果。HRTF的全名是Head-RelatedTransferFunction(头部相关传递函数),就是在三度立体空间中,人耳是如何监测和分辨出声音来源的方法。简单地说,就是声波会以几百万分之一秒的差距先后传到你的耳朵里面,而我们的大脑可以分辨出那些细微的差别,利用这些差别来分辨声波的形态,然后在换算成声音在空间里的位置来源。
在目前多数的虚拟3D音效的技术中,都是使用HRTF的换算法来转换游戏里的声音效果,误导你的大脑听到声音是来自不同地方的。支持声源定位的耳机将声音与游戏的物件、人物或是其他的声音的来源结合在一起,当这些声音与你在游戏中的位置改变时,耳机或喇叭就将依据相对位置来调整声波讯号的发送。
1MLS介绍
最长序列[2]就是一串伪随机2进制序列作为系统的响应源[x(k)],根据信号处理的理论,输入信号[x(k)]与线性系统的输出[y(k)]之间的互相关输入信号[x(k)]的自相关与系统的脉冲响应卷积得到[3]:
2HRIR的测量与3D声效实现
利用MLS测量头相关脉冲响应(HRIR)[7],它的数据的采用空间坐标如图1所示。
声源的空间方向由坐标([θ],[φ])所决定。仰角[-90°≤φ≤90°]为方向矢量与水平面的夹角,[φ]=[-90°]、[0°]和[+90°]分别表示正下方、水平面与正上方。方位角[0°≤θ
虚拟3D信号的产生是通过原始语音与HRIR之间的卷积产生[10],如果声源信号与HRIR卷积的结果在双耳之间精确地产生,听者就能感知声源的方向,这就是所谓的虚拟的3D的声效。
2.1HRIR数据
2.2DSP上实现
TMS320C6201是TI公司的TMS320系列的新一代高性能定点DSP芯片,芯片的工作频率可达200MHz。TMS320C6201处理器由3个主要部分组成:CPU内核、外设和存储器。芯片内有8个并行处理单元,分为相同的2组,并行结构突破了传统设计而使得芯片具有很高的性能;其体系结构采用超长指令字结构(VLIW)结构,单指令字长为32b,8个指令组成一个指令包,总字长为256b,即每秒钟可以执行8条指令;芯片内部设置了专门的指令分配模块,可以将每个256b的指令包同时分配到8个处理单元,并由8个单元同时执行;CPU有2组寄存器,每组寄存器由16个32b寄存器组成;外设包括直接存储器访问(DMA)、低功耗逻辑、外部存储器接口(EMIF)、串口、主机口(HPI)和定时器。该DSP采用了具有独立程序和数据总线的修正的哈佛总线结构,即1套256b的程序总线、2套32b数据总线和一套32b的DMA专业总线,大大提高了数据的传输效率。专用的硬件乘法器提高了运算过程中的乘法运算,硬件乘法器是DSP区别于通用微处理器的一个重要标志;采用了先进的超长指令字结构(VLIW),每个指令周期内同时执行8条32b指令,大大地提高了程序的执行效率。的占用CPU的时间,有效地减少了寻址时间;流水处理使得8条并行指令同时通过流水线的每个节拍,大大提高了机器的吞吐量。DSP系统上分配一片内存来存储HRIR数据,并预留一个上层通讯接口,如果有最新的HRIR数据可以在线烧录新数据,这样可以让用户有更好的3D体验。
时域卷积可以通过频域相乘快速实现,如图2所示,整个DSP系统的软件流程如图3,由于该系统的HRIR已经离线烧录在DSP里[12],这样省去在线计算HRIR的时间,这样大大方便了在嵌入式系统终端的实现。
3HRIR分析
头部相关的传递函数用于描述人的听觉系统对不同方向的声音产生不同频谱特性的一种数学关系。它包含了双耳之间的声源的声压与到达时间的差别信息。
3.1时域和频域基本特性分析
人工头HRIR的左耳数据与镜像方向的右耳数据是完全相同的,即左耳[θ=θ0]的数据与右耳[θ=360°-θ0]的数据相同,也即是说左、右镜像方向的数据仅仅是左、右互换而已[13]。因此,在下面的分析中,只给出一半空间方位,即[θ]=[0°]、[45°]、[90°]、[135°]、[180°]的结果。
图4到图8分别是基于MLS测量到的水平面方位角[θ]=[0°]、[45°]、[90°]、[135°]、[180°]的HRIR。从图中可以看出,HRIR的主体部分长度大约为50~60个采样(对于44.1kHz采样,相当于1ms左右),反映了声波与头部、耳廓以及躯干的作用。当声源偏离正前方时,由于声源到两耳的传输距离不同,左、右耳的起始延时不同,形成双耳时间差。并且当声源处于耳的异侧(例如[θ]=[90°],左耳),脉冲的幅度明显降低,这是头部对声波的阴影作用所致。
图9到图13基于MLS测出的头部在水平面上[φ=0°],方位角[θ]=[0°]、[45°]、[90°]、[135°]、[180°]的频域归一化HRTF(头相关传输函数,是HRIR的傅立叶变换形式)幅度谱,对[θ]=[0°]和[180°],由于左右耳是一样,所以图中左、右耳的曲线重合5。
在低频(0.5kHz),头部等的散射作用可以略去,归一化的HRTF的幅度20log10|H|应该接近0dB,基本与频率无关(图中大约150Hz以下,幅度的下降是由测量扬声器的低频下限所引起,并非HRTF本身的特性)。
随着频率的增加,|H|表现出与、[θ]复杂的函数关系,这是头部、耳廓、躯干、耳道等的综合作用的结果。其中在2至3kHz附近HRTF幅度的峰是由于KEMAR人工头的耳道模拟器共振所引起。而头部作用使得在大于3至4kHz的高频,声源位于耳的异侧时(例如[θ]=[90°],左耳),HRTF幅度明显下降,因而头部的阴影近似起到低通滤波的作用。而声源位于耳的同侧时(例如[θ]=[90°],右耳),平均来说,高频HRTF幅度较低频有一定的提升(虽然存在一些谷点)。这部分是由于高频的情况下,头部对同侧声源近似起着一种镜像反射面的作用,因而可提高同侧耳的声压(理论上,无限大镜像反射面表面上的声压较自由场提高6dB)。
从图9和图13还可以看出,正前方[θ]=[0°]和正后方[θ]=[180°]的高频HRTF幅度并不完全相等。这是由于耳廓对后方声波的衍射作用和头部的非前后对称形状所引起。这种前后幅度谱的差别是区分前后镜象位置声源的一个因素。
3.2HRTF谱特征分析
在频率高于5至6kHz时,耳廓对声波的散射和反射所带来的双耳声压频谱的特征是声源定位的一个因素。利用HRTF可以对这些谱特征进行分析。在耳廓所产生各种谱特征中,耳廓谷点的频率随仰角的变化有最引人注目,且许多研究将其作为中垂面上的一种重要的定位因素[14]。研究表明,当声源仰角从[φ]=[-40°]变化到[60°]时,耳廓谷的频率大约从5到6kHz变化到约10至12kHz。并且许多研究把这看成是普遍的规律。
4结论
本文提出的MLS测量头部相关脉冲响应的方法便于用户根据自己的头部特征测量出适合自己的HTIR,从而得到精确的虚拟3D声效的感知效果。
参考文献:
[1]DouglasD.RifeandJohnVanderkooy,"Transfer-FunctionMeasurementwithMaximum-LengthSequences",JournaloftheAudioEngineeringSociety,1989,37(6):419.
[2]李平友,用最长序列测量扬声器的脉冲响应[J],应用声学,1993(1):3.
[3]MiaoB,ZaneR,MaksimovicD.SystemIdentificationofPowerConverterswithDigitalControlThroughCross-CorrelationMethods[J].IEEETransactionsonPowerElectronics,2005,20(5):1093-1099.
[4]Paulo,J.,Martins,C.R.,BentoCoelho,J.L.,"RoomImpulseResponseMeasurementinthePresenceofHighNoiseLevelsusingMaximumLengthSequences(MLS)".Proc.7thICSV,Germany,2000.
[5]赵跃英,盛胜我,刘海生.室内声学测量中数字化声源性能的分析[J].声学技术,2003,22(3):143-146.
[6]黄帆,李晓峰用幅度矢量合成定位法改进HRTF的定位效果[J].电声技术2007(1)
[7]赵自力,黄成伟,HRTF在虚拟3D立体声中的应用及实验[J].清华大学学报2001.
[8]黄玺瑛,赵定海.基于DirectSound的战场环境三维音效实现[J].系统仿真学报,2006(s2).
[9]吴鸣,林志斌,邱小军,等.相干平均法测扬声器频率响应的偏差分析[J].南京大学学报:自然科学版,2006,42(1):44-53.
[10]王红星,许增朴,周聪玲,等.一种基于高阶频率能量均值的扬声器异音故障诊断方法[J].天津轻工业学院学报,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年辽宁省凌海市高二生物下册期末考试考试卷带答案(培优A卷)
- 2026年贵州省赤水市高二生物下册期末考试检测卷AB卷附答案
- 2025年江苏省仪征市高二生物下册期末考试测试卷附答案(精练)
- 2026年云南省芒市高二生物下册期末考试试卷附答案【突破训练】
- 2026年吉林省公主岭市高二生物下册期末考试模拟卷(A卷)附答案
- 2026年云南省文山市高二生物下册期末考试测试卷带答案AB卷
- 2026年浙江省建德市高二生物下册期末考试模拟卷含答案(夺分金卷)
- 2026年吉林省双辽市高二生物下册期末考试考试卷附答案【典型题】
- 2026年四川省彭州市高二生物下册期末考试试卷带答案(满分必刷)
- 2026年河北省沙河市高二生物下册期末考试试卷及参考答案【培优】
- 部编版三年级语文下册《标点符号》测试题及答案
- 铁路通信工(高级技师)技能鉴定理论考试题库(浓缩400题)
- 植入型皮下给药装置产品营销计划书
- 二次函数压轴题练习附详解(中考真题)
- 船舶防碰撞桥梁应急预案
- BQ40Z50 软件界面翻译
- 不确定度计算表-附计算公式
- 肩关节置换围手术期护理
- 湖北省普通高中学业水平合格性考试模拟政治试题(四)
- 《 岩石圈的组成及物质循环》示范课教学课件【高中地理】
- 包装危险货物技术说明书
评论
0/150
提交评论