(声学专业论文)前向掩蔽的空间去掩蔽研究.pdf_第1页
(声学专业论文)前向掩蔽的空间去掩蔽研究.pdf_第2页
(声学专业论文)前向掩蔽的空间去掩蔽研究.pdf_第3页
(声学专业论文)前向掩蔽的空间去掩蔽研究.pdf_第4页
(声学专业论文)前向掩蔽的空间去掩蔽研究.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 本文首先对时域掩蔽和空间去掩蔽现有的理论和实验结果做了详细的阐述。 然后从实验上探讨了掩蔽和被掩蔽声源在水平面方向分离时的前向掩蔽效应并作 出r 新的理论探索。 第一部分实验采用扬声器重发的方式,考察双扬声器布置与单扬声器布置两 种情况下,三种频率( 2 5 0 h z ,1 1 7 0 h z ,4 0 0 0 h z ) 的被掩蔽纯音信号的掩蔽闽值随该 频率所在的临界带窄带掩蔽噪声5 种声压级( 3 0d b ,4 0d b ,5 0d b ,6 0d b ,7 0 d b ) 变化的曲线。实验结果表明:声源空间分离时,除了个别情况之外,双扬声器重 发时的掩蔽阈值都比单扬声器重发时有较大幅度的降低。对这种现象,文中提出 其主要原因是掩蔽和被掩蔽声源在空间分离之后,由于人头传输函数的影响,会 造成单耳信掩比的提高。实验结果还提示,高层听觉系统对双耳声信息综合处理 也是空间去掩蔽的一个原因。 第二部分实验采用耳机虚拟声重发的方法,得到了耳机重发情况下前向掩蔽 效应的实验结果:这些结果不仅重现了扬声器重发实验的结果,为前向掩蔽的空 间去掩蔽提供了又一例证,而且发现了在耳机重发的情况下,掩蔽闽值差值随频 率增大而增大的规律,并且随着时间间隔的增大,掩蔽阈值差值逐渐减小,在7 0 d b 时,2 0 - - 4 0 m s 间掩蔽阈值差值出现上升现象。这一结果可以用时间积分效应及基 底膜对输入声信号的非线性响应作出合理解释。 根据本文的实验研究结果,我们认为基于掩蔽的音频压缩算法如果要考虑时 域掩蔽的效果,就必须同时考虑到掩蔽声和被掩蔽声在空间上的分开会造成信掩 比的下降。否则,声音重放时就有可能造成一些未被掩蔽掉的声音没有编码的情 况,从而丢失了有用信息,进而影响声音质量。也因此,有必要重新确立用于感 知编码器的考虑了空问分离效应的时域掩蔽曲线。本研究的结果可以作为这方面 进一步研究的实验基础。 关键词:掩蔽;空间去掩蔽;双耳效应:时间积分器 华南理t 大学硕士学位论文 一_ _ - - _ - _ _ _ _ _ _ _ _ _ _ _ _ - _ _ _ - _ _ _ _ _ _ _ _ _ _ - _ l _ - _ _ _ _ - _ _ _ _ _ _ _ _ - - _ _ _ - - _ _ - _ 一 a b s t r a c t i nt h ef i r s t ,t h ed i s s e r t a t i o ni l l u s t r a t e dt h et h e o r i e so ft e m p o r a lm a s k i n ga n d s p a t i a lu n m a s k i n g t h e nt h ep h e n o m e n o n so fs p a t i a l l ys e p a r a t e df o r w a r dm a s k i n g w e r es t u d i e dt h r o u g he x p e r i m e n t s i nt h ef i r s tp a r to ft h ee x p e r i m e n t ,f o r w a r dm a s k i n ge f f e c tw a ss t u d i e dw h e na m a s k e ra n dam a s k e ew e r er e p r o d u c e dr e s p e c t i v e l yb yt w ol o u d s p e a k e r sw h i c hw e r e s p a t i a l l ys e p a r a t e di na z i m u t h ,a n dt h eg r o w t ho fm a s k i n gw a sc o m p a r e dw i t ht h e s i n g l e l o u d s p e a k e rr e p l a y i n gc o n d i t i o n t h r e s h o l d s f o r t h ed e t e c t i o no fb r i e f s i n u s o i d a ls i g n a l s ( 2 5 0 ,117 0 ,a n d4 0 0 0 h z ) m a s k e dr e s p e c t i v e l yb yt h r e en a r r o w b a n d n o i s ef o r w a r dm a s k e r sw e r em e a s u r e da saf u n c t i o no fm a s k e rl e v e l s ( 3 0 ,4 0 ,5 0 ,6 0 , 7 0 d a ) f o rs p a t i a ls e p a r a t i o nc o n d i t i o n ,t h et h r e s h o l d st e n d e dt od r o pb yar e l a t i v e l a r g ea m o u n tw i t ho n l y v e r yf e we x c e p t i o n s t h er e s u l t sw e r ea n a l y z e db yt h e c o m b i n a t i o no fb e t t e r - e a rc o n t r i b u t i o n ,b i n a u r a le f f e c te t c o v e r a l l ,i tc a nb e c o n c l u d e dt h a tt h es p a t i a ls e p a r a t i o no ft h es o u r c e so fm a s k e ra n dm a s k e ei nf o r w a r d m a s k i n gw i l lw e a k e nt h em a s k i n ge f f e c t i nt h es e c o n dp a r to ft h ee x p e r i m e n t ,w eo b t a i n e dm o r ei d e a la n de x a c tr e s u l t sb y t h em e a n so fh e a d p h o n er e p r o d u c i n g b yu s i n gv i r t u a lr e p r o d u c t i o n ,n o to n l yt h e s i t u a t i o ni nt h ef r e es p a c ew a ss i m u l a t e da n dt h er e s u l t so ft h el a s tp a r to fe x p e r i m e n t w e r er e p e a t e d ,b u ta l s oaf u r t h e rd i s c o v e r yi sm a d e :t h ed i f f e r e n c eo ft h et h r e s h o l d s i n c r e a s e da st h em a s k e ef r e q u e n c yg r e w , a n dd e c r e a s e da st h ed e l a yt i m eg r e w t h e l a t t e rr e s u l tw a se x p l a i n e db yt h et e m p o r a li n t e g r a t i n ge f f e c ta n dt h ei n p u t o u t p u t c u r v eo nb a s i l a rm e m b r a n e n o w a d a y s ,i nt h ed i g i t a la u d i oc o m p r e s s i o ns c h e m e sb a s e do nm a s k i n gc u r v e , t h es p a t i a lu n m a s k i n ge f f e c ti nt e m p o r a lm a s k i n gh a v en o tt a k e ni n t oa c c o u n t ,s o w h i l er e p r o d u c i n gs t e r e op r o g r a m ,s o m eu s e f u ls i g n a lm a yb ed i s m i s s e da n dt h e q u a l i t yo ft h es o u n dm a yb en o ts og o o d i no r d e rt os o l v et h i sp r o b l e m ,an e w t e m p o r a lm a s k i n gc u r v ew h i c hc a nb eu s e di np e r c e p t u a lc o d i n gs h o u l db ed e v e l o p e d t h ec o n c l u s i o no ft h ed i s s e r t a t i o nc a ns e r v ea sat h e o r e t i cb a s et oi m p r o v e d i g i t a l a u d i oc o m p r e s s i o ns c h e m e k e yw o r d s :r w a r dm a s k i n g ,s p a t i a lu n m a s k i n g ,b e t t e r - e a re f f e c t t e m p o r a li n t e g r a t o r 华南理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研 究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文 不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研 究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完 全意识到本声明的法律后果由本人承担。 作者签名:晶日期:a 邯卉6 月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定, 同意学校保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和借阅。本人授权华南理工大学可以将本学位论文的 全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存和汇编本学位论文。 保密口,在年解密后适用本授权书。 本学位论文属于 不保密口。 ( 请在以上相应方框内打“”) 公b 作者签名: 阳 日期:莎够月争日 导师签名:1 萧妓日期:沙。蛑6 月年日 第一章绪论 1 1 掩蔽效应概述 第一章绪论 日常生活中常有这样的经验,一个声音在与其他声音同时出现的时候有可能 听起来模糊不清,甚至完全听不到。例如,汽车内的收音机播放音乐的音量假如 稍微强一些的话,也许会掩盖汽车引擎所发出的声音。这种一个声音( 掩蔽声) 的存在令另一个声音( 被掩蔽声) 的闻闽提高的听觉现象被称为掩蔽效应。根据 1 9 6 0 年美国标准协会的规定:掩蔽被定义为: l 、由于另一个声音( 掩蔽音) 的出现而导致一个声音的听闽被提高的过程。 2 、由于另一个声音( 掩蔽音) 的出现而导致一个声音的听阈被提高的数量, 通常使用分贝作为单位。 在掩蔽声存在的条件下,最小可闻的被掩蔽声声压级称为掩蔽阈值。一个影 响掩蔽的重要物理参数是时间,信号与掩蔽音同时出现的掩蔽现象称为同时掩蔽 ( 频域掩蔽) ,反之则为异时掩蔽( 时域掩蔽) 。时域掩蔽又可进一步分为前向掩 蔽和后向掩蔽。其中前向掩蔽是指掩蔽声在时间上超前于被掩蔽信号声的一种掩 蔽现象。尽管它长久以来被认为是人耳时间分辨率的一种体现形式或者听觉系统 对快速变化的声音的响应,然而前向掩蔽现象的产生机理至今仍没有定论。后向 掩蔽指被掩蔽信号声被滞后于它的掩蔽声所掩蔽的一种现象。虽然许多关于后向 掩蔽现象的研究被公布,但是这一现象仍不能被很好的理解,而且实验结果很大 程度上依赖于参与实验的聆听者听力受训的程度。因此目前对时域掩蔽的进一步 研究主要集中在对前向掩蔽的探讨。 1 2 时域掩蔽的研究现状及其应用 从上世纪5 0 年代开始,国外就开始对声音的掩蔽效应进行研究,得出了许多 重要成果,如将掩蔽分为同时掩蔽和异时掩蔽。异时掩蔽又进一步分为前掩蔽和 后掩蔽。进一步还区分了单声掩蔽和噪音掩蔽的不同及掩蔽效应经验曲线的提出 等。在此基础上,建立了有关掩蔽的心理声学模型。而近十多年来,由于在数字 声频信号压缩等方面的重要作用,声音的掩蔽效应又再次成为国际的热门课题, 并有了许多新进展。例如,把心理声学实验得到的掩蔽效应的定量结果用相应的 物理模型表示,建立掩蔽效应的心理声学模型。并把它应用在声频信号的压缩传 输,存储和处理方面。这种方法使用人类听觉系统的特性以去除音频信号中听觉 华南理工大学硕士学位论文 系统不能感觉到的部分,目的是减少数据量。如m p e g ( m o v i n gp i c t u r ee x p e r t s g r o u p ) 和d o l b yd i g i t a l ( a c 一3 ) 声音压缩标准等,掩蔽效应的心理声学模型还被应 用到d v d ( d i g i t a lv i d e od i s c ) ,数字声音广播,互联网和i p ( i n t e r n e tp r o t o c 0 1 ) 电话 等领域。尤其近年来,时域掩蔽效应在数字音频领域的应用日趋广泛和重要。例 如,前向掩蔽现象在语音合成技术中的应用f i l ,时域掩蔽在音频水印技术中的应 用 2 1 ,以及在以小波信息包为基础的音频编码的应用【3 1 等等。因此对于时域掩蔽 的研究日趋深入。 有别于同时掩蔽,时域掩蔽中的前向掩蔽最显著的特性就是它的非线性效应, 这使得定量分析并解释这种掩蔽现象的难度大大增加。迄今为止已有很多研究论 文探讨过前向掩蔽现象的非线性效应,如被掩蔽卢阂值随着掩蔽声声压级的变化 的非线性变化规律,掩蔽声和被掩蔽声之间的时间延迟对信掩比的影响1 4 】等等。 在本人阅读文献的范围内,目前尚未有时域掩蔽实验研究掩蔽声和被掩蔽声来自 不同声源位置的情况。但在实际情况当中,掩蔽声和被掩蔽声在空间上可能是分 离的。饲如,多通路环绕声系统使用多个布置在不同方向的扬声器重发声音信号。 特别是目前最广泛应用的5 1 通路环绕声,采用了前方左l 、中c 、和右r 以及 左环绕l s 、右环绕r s 共5 个独立通路( 以及一个可选择的低频效果通路) ,这 些通路在空间是分开的。而在信源编码方面,5 1 通路环绕声通常使用d o l b y d i g i t a l ( a c 一3 ) 编码方法( 这种编码方法的一大特点是使用了心理声学模型中的 掩蔽效应) 。事实证明 5 1 1 6 1 ,多通路情况下的掩蔽阈值即声源分布在不同空间位置 时的掩蔽阈值与单通路情况下的掩蔽闽值确实有所不同。如果使用单通路情况下 的掩蔽阈值进行编码,有可能使重建环绕( 立体) 声的声音质量下降。因此,有 必要对使用扬声器重发时掩蔽声源和被掩蔽声源在空间方向上有一定的分离时的 掩蔽效应作更加广泛的研究。 目前已有许多作者对同时掩蔽的空间去掩蔽现象作了研究,信号形式也多种 多样,例如语言、脉冲串和复合音等【_ 【8 l 。许多同时掩蔽效应的研究表明当掩蔽 声源和被掩蔽声源在空间方向上有一定的分离( 尽管掩蔽实验通常采用耳机重发 方式,但部分研究用扬声器来做实验【9 】 ”1 ) ,会各自产生不同的双耳时间( 相位) 差和声级差的情况时,双耳听觉系统可利用这些和空间听觉有关的因素,从而更 容易地感知到被掩蔽声的存在。因此我们预测在时域掩蔽中也会出现类似情况。 本文的主要研究内容就是时域掩蔽的前向掩蔽声源空间分离时与同一声源位置情 况下被掩蔽声阈值是否存在类似于同时掩蔽效应的差异。 1 3 本文的主要工作 本文的主要工作为: 2 第一章绪论 1 总结了关于空间去掩蔽效应的理论基础和研究现状, 2 用扬声器重发方式对声源水平位置上分离的前向时域掩蔽进行研究,并对 实验结果进行了分析和解释。 3 用耳机重发方式虚拟自由场声像,对卢源水平位置上分离的前向时域掩蔽 进行研究,并对实验结果进行了分析解释。 本文的研究对多通路环绕声信号压缩编码等具有现实意义,因为现有的基于 掩蔽的音频压缩算法【l l l 并未考虑到时域掩蔽时如果掩蔽声和被掩蔽声在空间上 分开会造成信掩比的下降,所以声音重放时有可能造成一些未被掩蔽掉的声音没 有编码的情况,从而丢失了有用信息,进而影响声音质量。因此,为了解决这一 问题需要重新确立用于感知编码器识别的,研究空间分离效应的时域掩蔽曲线。 本研究的结果可以作为这方面进一步研究的基础。 华南理上大学硕士学位论文 第二章时域掩蔽与空间去掩蔽效应 21 听觉滤波器与临界带 研究掩蔽效应必然要涉及到听觉系统对声信号的处理过程。图2 一l 是人耳的 结构图。其中,外耳起着线性滤波作用,中耳起着传导声信号到内耳的作用,而 内耳对声信号起着非线性滤波以及将声刺激转为神经脉冲的作用。内耳的基底膜 对声信号的作用相当于一系列的带通听觉滤波器【4 1 ( a u d i t o r yf i l t e r ) ,滤波器的带 宽就是临界带宽( c b - - - c r i t i c a lb a n d w i d t h ) 。临界带宽与频率有关,频率越高,其 对应的带宽就越宽,可用下式计算【1 2 1 : c b = 2 5 + 7 5 ( 1 + 1 4 f 2 ) o 6 9 f 2 - 1 1 其中,f 为临界带宽的中心频率。 图2 - 1 人耳结构图 f i g 2 - 1t h es t r u c t u r eo f h u m a ne a r 心理声学实验表明,掩蔽声主要对落在本临界带内的被掩蔽声起作用,对不 在本临界带内的被掩蔽声作用很弱1 1 3 1 。基于这个事实,本文实验不采用全频带噪 声作为掩蔽声,而是用频带宽度为c b 的窄带噪声。 4 第二章时域掩蔽与空间去掩蔽效应 2 2 掩蔽机理 目前针对发生掩蔽的机理主要有两种看法。第一种是掩蔽包含了对由信号引 起的神经活动的淹没。如果掩蔽音相对于信号而言在通道中( 听觉滤波器或者临 界频带) 产生了总量显著的活动时,那么由信号叠加起来的活动可能就无法检测 了。例如,考虑一个与宽带白噪声混合的被掩蔽音,当中频的信号音刚好处于它 的掩蔽阈值时,那么它的声级就比以信号音中心频率为中心的听觉滤波器所输出 的噪声声压级低4 d b 。而由信号和噪声组合产生的激励强度比噪声单独产生的激 励强度高1 5 d b 。因此,有人会认为,1 5 d b 表示了检测一个音调所必须的最小激 励增量。例如,如果声级相差2 0 d b ,那么激励强度增量低于0 0 5 d b 。因此,由 音调产生的激励就被噪声产生的激励“淹没”。 掩蔽的另外一种可能的机理就是单独出现的掩蔽音会抑制信号活动【1 4 】。当信 号频率较高或者较低于掩蔽音频率时,这个机理可能适合。简单的解释就是类似 于在听觉神经中独立神经元中发现的“双音抑制”:对一个处于神经元中心频率的 信号,其神经响应可能会被另个本身不会在该神经元中产生激励的信号所抑制。 这个抑制可能足以使神经元的激发率降低到它的自然比率,因而被认为与中心频 率的音调的掩蔽有关。 现今更普遍的看法是,一个掩蔽声可能会对在神经元中的信号产生激励和抑 制,并且掩蔽可能会与淹没和抑制的混合有关1 1 5 j 【l6 1 。 以上的理论是频域掩蔽和时域掩蔽的普遍基础。但对于时域掩蔽,上述理论 还不足够,情况也更复杂一些。虽然许多关于后向掩蔽的研究论文已经被发表,但 该现象很难理解。所获得的后向掩蔽总量较强地依赖于听者有多少经验,且有经 验的听者通常感觉不出后向掩蔽【1 7 j 。对于没有经验的听者而言,会有更多的掩蔽 效应产生,这可能反映出一些携带有掩蔽音的信号的混乱情况。因此在以下的研 究中,我们将重点集中在前向掩蔽上,因为它的性质甚至能在拥有较高经验的人 中保持一致。虽然前向掩蔽的机理并未十分清晰,但是总结起来大概有4 个方面 的原因【4 】: 1 掩蔽音在基膜中的响应在掩蔽音结束后仍会继续持续一段时间,这个效应 被称为“振铃响应”【i 耵。如果振铃响应与信号的响应重叠,那么这就可以归结成 信号的掩蔽了。振铃响应的延时在调整到高频处时较短,因为高频处的带宽比低 频处要大。 2 掩蔽音在听觉神经或在听觉系统较高中心处产生一个短期的适应或者疲 劳,这些会使刚好出现在掩蔽音之后的信号响应下降 3 由掩蔽音引起的神经活动在听觉神经更高的听觉系统中的一些层次上持 续,且这样的持续性掩蔽了信号f 1 9 】。 华南理工大学硕士学位论文 4 掩蔽音可能在中央听觉系统中引起抑制,且这种抑制在掩蔽音之后段 h , j 间内持续。 23 前向掩蔽性质和现象解释 前向掩蔽是指掩蔽声信号掩蔽跟在其后的被掩蔽声信号的现象,它与听觉适 应和疲劳在表现形式上有一定程度的相似,区别主要在于掩蔽音的作用持续时间 相对是很短的( 通常为几百个毫秒) ,并且前向掩蔽现象受到出现在掩蔽音之后持 续大约2 0 0 毫秒的限制。在早期时域掩蔽研究中,人们总结出前向掩蔽具有以下 一些基本性质【4 】( 见图2 2 ) : 1 掩蔽量随掩蔽声声压的增长总体上是非线形的,如图2 - 2 右面所示掩蔽声 声压级的增大并不能使被掩蔽声的闽值有等量的提高,即被掩蔽声闽值作为掩蔽 声声压级的函数其斜率通常是小于1 的( 在同时掩蔽情况下该斜率近似为1 ) ,且 该斜率随着信号与掩蔽音之间时间延时的增长而逐渐下降。 2 对于掩蔽持续时间至少在5 0 毫秒之上而言,随着掩蔽声持续时间的延长 前向掩蔽量也跟着增长。 3 前向掩蔽受被掩蔽声和掩蔽声频率之间的关系影响( 这与同时掩蔽情况一 样) 。 4 从前向掩蔽中恢复的速率对于更高强度的掩蔽音而言会更大。无论前向掩 蔽初始大小有多大,掩蔽在1 0 0 2 0 0 毫秒之后都会衰减到0 。 5 前向掩蔽在被掩蔽声与掩蔽声在发生时间上较接近时效果较强,如图2 - 2 左面所示,时间间隔短的时候掩蔽量大。 o x e n h a m 和m o o r e 提出建议【2 l 】认为,如图2 2 右图所示的掩蔽函数中,缓慢 增长的斜率至少定性上可以用基膜的输入输出函数的收缩形式来解释。图2 3 是 这样一个输入输出函数的图示。从图中可看出,对于中等强度的输入,输出响应 曲线有一个较平缓的斜率,但是对于非常低强度的输入,斜率会更陡一些。在图 2 - 3 中,如果用a m 表示掩蔽音强度的增加量,则输出响应会产生一个相对较小 的响应增加量a o 。此时为使被掩蔽音信号重新达到阈值,被掩蔽音信号的强度 也必须要增加,且增加量的输出响应也必须为a o 。然而,当被掩蔽音信号的强 度是落在输入输出函数斜率相对较陡的范围内时,使输出增加a o 所需要的输入 增长量a s 就比较少了。因此,掩蔽函数拥有一个较慢的斜率增长。 根据这个解释,掩蔽函数的斜率的缓慢增长来源于这样一个事实即信号的强 度低于掩蔽音的强度,所以掩蔽音要比信号遭受更多压缩。基膜上的输入输出函 数拥有一个随着强度在0 到大约5 0 d b 范围内增长而逐渐下降的斜率。因此,掩 蔽函数的斜率应随着掩蔽音和信号在强度上增长的不同而降低。这也可以用来解 释掩蔽函数的斜率随着信号与掩蔽音之间时间延时的增长而逐渐下降( 参考图2 2 6 第二章时域掩蔽与空间去掩蔽效应 右图) 的原因,因为长时间的延迟是与信号和掩蔽音之间在强度上的巨大差异相 联系的。另外一种猜想是对于一个给定信号延迟的掩蔽函数而言,如果信号的强 度足够大以至于落在输入一输出函数压缩区时,其斜率应该会上升。这样的效应可 以从图2 2 中观察到,图中显示的是对于最短延时时间的掩蔽函数的发展情况: 函数在信号的最高强度时变得陡峭。 鼍 蔓 萱 葛 耋 s i 辩id 尊瓣( i 博姒i ) k 沁r 聊酞聃i 躺l 。幽 t h el e f tp a n e ls h o w st h ea m o u n to ff o r w a r dm a s k i n go fab r i e f4 - k h zs i g n a l 。p l o t t e da s a f u n c t i o no ft h et i m ed e l a yo ft h e s i g n a la f t e rt h ee n do ft h en o i s em a s k er e a c hc u r v es h o w s r e s u l t sf o rad i f f e r e n tn o i s es p e c t r u ml e v e 】( 1 0 - 5 0 d b ) t h er e s u l t sf o re a c hs p e c t r u ml e v e lf a l i r o u g h l yo nas t r a i g h tl i n ew h e nt h es i g n a ld e l a yi sp l o t t e do nal o g a r i t h m i cs c a l e a sh e r e t h e r i g h tp a n e ls h o w st h es a m et h r e s h o l d sp l o t t e da saf u n c t i o no fm a s k e rs p e c t r u ml e v e l e a c hc u r v e s h o w sr e s u l t sf o rad i f f e r e n ts i g n a ld e l a yt i m e ( 1 7 5 ,2 7 5 ,o r3 7 5 m s ) n o t et h a tt h es l o d e so f t h e s eg r o w t ho fm a s k i n gf u n c t i o n sd e c r e a s ew i t hi n c r e a s i n gs i g n a l d e l a y a d a p t e df r o mm o o r e a n dg l a s b e r g ( 1 9 8 3 钔 图2 - 2 前向掩蔽阈值与时间间隔和掩蔽声声压关系【4 】 f i g 2 _ 2t h et h r e s h o l d so ff o r w a r dm a s k i n ga st h ef u n c t i o no ft h e t i m ed e l a ya n d t h em a s k e rs p e c t r u ml e v e l 4 】 7 华南理工大学硕士学位论文 蕾 象 c o 参 粼 三 _ = _ 图2 - 3 基膜的输入输出函数曲线4 1 f i g 2 3t h ei n p u t o u t p u tf u n c t i o no n t h eb a s i l a rm e m b r a n e 【4 】 然而,目前前向掩蔽潜在的处理过程并未完全被理解。对于其某些性质也未 有充分理解。 2 4 空间去掩蔽现象及研究现状 空间掩蔽效应是指掩蔽音和被掩蔽音分布在空间不同位置时的掩蔽效应,它 与掩蔽和被掩蔽声源的空间分布有非常密切的关系。在掩蔽声源和被掩蔽声源与 倾听者的距离都相等时,对两者在空间方向上分开的情况,掩蔽效果( 掩蔽闽值) 将较两者在同一方向时下降,这种现象叫空间去掩蔽( s p a t i a lu n m a s k i n g ) 。 目前对于空间去掩蔽效应的研究主要局限于同时掩蔽的情况【2 2 】【2 卦。研究结果 表明:掩蔽和被掩蔽声源在水平面方向上空间分离会使掩蔽阈值下降,产生空间 去掩蔽现象,并且这一现象主要是由较优耳朵效应造成的,但并不完全,双耳效 应以及其高层听觉系统处理也有一定影响。在进一步对同时掩蔽的研究i lo 】中发 现,空间去掩蔽与频率有关,频率越高,空间去掩蔽现象越明显,而且,扬声器 在空问分离得越开,空间去掩蔽现象随频率升高而升高的现象就越明显。如图 2 4 所示。 8 第二章时域掩蔽与空间去掩蔽效应 盆 3 删 n 趔 屉 摧 蜒 f i 面 o24 bb1 0 位* 蕾盘鲁王 频鞋妇站 图2 - 4 掩蔽阈值差与频率的关系1 0 】 f i g 2 - 4t h ed i f f e r e n c eo ft h et h r e s h o l d sa saf u n c t i o no ff r e q u e n c y l l o 】 也有人对双通路立体声条件下同时掩蔽的空间去掩蔽效应进行了研究1 9 】即采 用立体声重发使掩蔽和被掩蔽声在主观感觉空间方向上的分离,研究结果表明: 与单通路重发比较,立体声重发时,掩蔽和被掩蔽声在主观感觉空间方向上的分 离也会导致掩蔽阈值的降低。即双耳处的掩蔽噪声声压级提高,被掩蔽声的可闻 阈值反而下降,其原因是高层听觉系统对双耳声信息综合处理的结果。而且在 o 2 5 - 4k h z 的频率范围内,立体声条件下的信掩比要比单通路条件下的低3 - 6 d b , 如图2 - 4 所示。这意味着立体声重发系统的语言清晰度要比单通路系统高。 0 0 2040 80 8 24 掩蔽声带宽中心频率( k hz ) 图2 4 信掩比差值的实验结果【9 】 f i g 2 - 4t h ee x p e r i m e n t a lr e s u l to ft h ed i f f e r e n c eo fs m r t 9 1 9 号_)州n犁屉捶鞭 e 2 0 一p)掣撇丑冁姆 华南理工大学硕+ 学位论文 这一研究进一步为双耳掩蔽是听觉系统的高层一一神经单元对双耳信号处 理的假设提供了例证。 在以上这些对同时掩蔽进行的空间去掩蔽现象研究的基础上,我们可以预测 在时域掩蔽中也有类似的空间去掩蔽现象。掩蔽声和被掩蔽声空间上的分离以及 主观感觉空间上的分离会影响时域掩蔽阈值。考虑到时域掩蔽在实际应用中的重 要性,对它的空间去掩蔽效应进行研究是十分必要的。 2 5 本章小结 本章对全文最重要的理论基础一一时域掩蔽和空间去掩蔽做了详细的阐述。 首先介绍了听觉滤波器和临界带及掩蔽机理和影响因素,讨论了时域掩蔽的性质 并对这些性质做出了解释。然后介绍了空间去掩蔽的定义,并通过对同时掩蔽的 空间去掩蔽现象的研究的讨论,预测了时域掩蔽中空间去掩蔽现象发生的可能性, 提出了对此进行研究的必要性。 1 0 第三章扬声器重发时声源空间分离对前向时域掩蔽阂值的影响 第三章扬声器重发时声源空间分离对前向时域掩蔽阈 值的影响 3 1 扬声器重发条件下的空间去掩蔽研究 在单扬声器重发实验中,掩蔽声和被掩蔽声都由同一扬声器( 布置在听音者 正前方o 。方向) 重发,声压级是测试者不在的情况下头中心所在位置的声压级 ( 以下实验测量数据中,掩蔽声和被掩蔽声声压级都为头中心位置声压级) 。采用 的掩蔽信号和被掩蔽信号为窄带噪声和纯音。在这种情况下,左右耳处声压级近 似相等,且左右耳处信掩比与头中心位置信掩比近似相等。而在双扬声器重发条 件下,掩蔽声和被掩蔽声分别由水平位置上分开,但到头中心位置等距的两扬声 器重发。声压级的确定与单扬声器重发情况相同,但是此时双耳处声压级不再相 等。也就是说人实际感觉到的掩蔽声和被掩蔽声声压大小与单扬声器重发时不同。 由于人头部等对声波的散射和绕射作用,造成双耳时间差和声级差,这必然会造 成掩蔽声和被掩蔽声在双耳处的差异变化( 可能趋于明显,也可能趋于不明显) 。 可以肯定的是这将对掩蔽情况造成一定的影响。 3 。2 实验原理与方法 3 2 1 实验信号 掩蔽声信号采用以等效带宽临界带e r b ( e q u i v a l e n tr e c t a n g u l a rb a n d w i d t h ) 为 带宽的矩形滤波器滤波的粉红噪音信号,共有三种频率范围:2 0 0 h z 3 0 0 h z , 1 0 8 0 h z 1 2 7 0 h z 和3 7 0 0 h z 4 4 0 0 h z ,每段信号有5 m s 的上升沿、5 m s 的下降沿和 2 0 0 m s 的平稳状态时间。被掩蔽声信号是频率为2 5 0 h z ,1 1 7 0 h z ,4 k h z 的正弦信号, 按图3 1 所示方法处理信号使2 5 0 h z 的信号有5 m s 的上升余弦平方过渡区、5 m s 的下降余弦平方过渡区和2 0 m s 的平稳状态时间( 信号总长度为3 0 m s ) ,1 1 7 0 h z 和4 k h z 的信号有2 m s 的上升余弦平方、2 m s 的下降余弦平方过渡区和2 6 m s 的平 稳状态时间( 信号总长度为3 0 m s ) 。掩蔽声声压级从3 0 d b 变化到7 0 d b ( 间隔为 1 0 d b ) 。正弦被掩蔽声信号紧跟在窄带噪声之后( 延迟时间为0 m s ) 。信号中上升 沿和下降沿的选取是为了减小人耳对由短信号突然发生和突然消失而产生爆破声 的觉察能力。处理前后的掩蔽信号和被掩蔽信号如图3 1 所示。 华南理上火学硕士学位论文 ( a ) 原始掩蔽声信号 ( b ) 处理后的掩蔽声信号 ( c ) 原始被掩蔽声信号 ( d ) 处理后被掩蔽声信号 图3 - l 实验信号示例 f i g 3 - 1ad e m o n s t r a t i o no f t h ee x p e r i m e n t a ls i g n a l 第三章扬声器重发时声源空间分离对前向时域掩蔽闷值的影响 实验信号分组如表3 - i 所示 表3 - 1 实验信号分组 t a b l e 3 1t h ed i v i s i o no ft h ee x p e r i m e n t a ls i g n a l 第一组 第二组第三组 被掩蔽声2 5 0 h z1 1 7 0 h z4 0 0 0 h z 掩蔽声 2 0 0 h z 3 0 0 h z1 0 8 0 h z 一1 2 7 0 h z3 7 0 0 h z 4 4 0 0 h z 3 2 2 实验方法 实验分为两个部分;第一部分为单扬声器重发实验,掩蔽声和被掩蔽声都由 一个0 。的扬声器重发。第二部分为双扬声器重发实验,掩蔽声由一3 0 。方向( 左 前方向) 扬声器重发,被掩蔽信号由+ 3 0 。方向( 右前方向) 扬声器重发。两部 分实验都按信号的频率分为3 组( 见表1 ) 。每组实验又按掩蔽声声压级不同划分 为5 小组( 3 0 7 0 d b ) 。掩蔽阈值的测量是采用两段信号随机选择并结合三上一下 的适应调整程序的方法1 2 钔,这种方法在心理测量学上能达到7 9 4 的正确率。 每个小组实验信号包括两段作为掩蔽声的窄带噪声信号,中间有4 0 0 m s 的时 间问隔将它们分隔开,作为被掩蔽声的纯音信号随机的插在这两段掩蔽声其中之 一的后面( 延时为0 ) ,而听音者被要求判断两段信号中哪一段包含了纯音信号( 被 掩蔽声信号) 。实验开始时,纯音信号的声压级是以5 d b 的幅度进行调整( 当昕 音者连续3 次判断正确就增大实验难度即将纯音信号减小5 d b ,而每当听音者1 次 判断错误实验难度都降低即纯音声压级增大5 d b ) ,当这一粗调进行了2 个回合 后,再以同样的方法以2 d b 的幅度进行调整3 个回合,然后该小组实验结束,记 录下来的掩蔽阈值为最后两个回合声压级的平均值。 实验是在低混晌昕音室内进行。听音室进行了强的吸声处理,其混晌时间少 于0 1 秒。实际对房间脉冲响应的测量表明,对中心频率为2 5 0h z ,1 1 7 0 h z , 4 0 0 0 h z 的临界频带,反射声的总能量分别比直达声低1 3d b 、1 6d b 和2 0d b ,因 此可认为基本上满足自由场的条件。听音室的本底噪声如表3 2 所示( 以1 3 倍 频程测量) 。 实验时,在计算机中产生所需的信号,经多通路声卡( w a m i r a c k2 4 ) 和功放 后,馈给k e fq 1 同轴全频带扬声器重发。单扬声器重发实验时,扬声器布置在 0 。方向,与头中心的距离为1 8 m 。双扬声器重发实验时,左、右扬声器布置在 3 0 。的方向,与头中心的距离为1 8 m 。采用爱华a w a 6 2 7 0 噪声频谱分析仪测 量头中心位置( 原点,倾听者不存在时) 处声压。 华南理工大学硕士学位论文 表3 - 2 昕音室的本底噪声 t a b l e3 - 2t h eb a c k g r o u n dn o i s eo ft h er o o m 中心频率( h z ) 2 5 0 1 0 0 0 1 2 5 04 0 0 0 声压级( d b ) 1 5 2 1 8 31 3 o 1 5 5 参加实验的倾听者共4 人( 2 男2 女) ,分别记为s 1 至s 4 ,年龄2 l 2 9 岁 听力正常,其中有3 人( s 1 ,s 2 ,s 3 ) 曾有心理声学实验经验。 3 3 实验结果和讨论 3 3 1 实验结果 4 名聆听者在不同情况下的个人数据分别在图3 - 2 中给出。 一 号 一 捌 匿 粗 栏 寝 藉 掩蔽声为2 0 0 3 0 0 h z 窄带噪声,被掩蔽声为2 5 0 h z 纯音信号 ( a ) 1 4 第三章扬声器重发时声源空间分离对前向时域掩蔽阈值的影响 号 一 蚓 暖 队 摧 耀 划 掩蔽声为1 0 8 0 1 2 7 0 h z 窄带噪声,被掩蔽声为1 1 7 0 h z 纯音信号 ( b ) 一 曲 日 一 迥 匿 牝 摧 耀 籍 卜单扬声器重发 双扬声器重发 3 04 05 06 07 0 掩蔽声为3 7 0 0 4 4 0 0 h z 窄带噪声,被掩蔽声为4 0 0 0 h z 纯音信号 ( c ) 图3 - 2 被掩蔽声阈值与掩蔽声声压的关系 f i g 3 - 2t h et h r e s h o l d sa st h ef u n c t i o no ft h em a s k e rl e v e l 1 5 加柚 加铀 扑 华南理丁大学硕士学位论文 图示中单扬声器重发情况的结果( 实心矩形表示) 与早期时域掩蔽研究的 结果是致的:掩蔽量的增长总体上是非线形的,掩蔽声声压级的增大并不能使 被掩蔽声的阈值有等量的提高,即被掩蔽声阈值作为掩蔽声声压级的函数其斜率 通常是小于1 的( 在同时掩蔽情况下该斜率近似为1 ) 。另外,图中数据显示当掩 蔽声声压缎增大到某一值( 如5 0 d b ) 后继续增大其斜率将逐渐增大接近于1 ,甚 至会大于1 。这一变化规律与人耳基底膜对较大输入声信号的非线性响应相符。 图示中双扬声器重发时( 空心矩形表示) 掩蔽声阂值随掩蔽声声压级增长的 趋势也基本与这一结论相符。而且用3 0 。方向两个扬声器重发进行时域掩蔽实 验时,对各个不同的频率( 2 5 0 h z ,1 1 7 0 h z ,4 0 0 0 h z ) 和不同的掩蔽声声压级 ( 3 0 d b ,4 0 d b ,5 0 d b ,6 0 d b ,7 0 d b ) ,被掩蔽声阈值相比于0 。单扬声器重发时都有明 显下降的总趋势。除了个别情况( 如被掩蔽声为2 5 0 h z 时,s 2 在掩蔽声6 0 d b 处 及s 3 在掩蔽声4 0 d b ,7 0 d b 处的结果) 被掩蔽声阈值不变或稍有提升外,其余 情况下4 名聆听者都显示出被掩蔽声阈值明显降低的结果,其中降低量最大达到 2 1 d b ( 倾听者s 1 在被掩蔽声为1 1 7 0 h z 时,掩蔽声为7 0 d b 处的结果) 。因此尽管4 位聆听者个人心理、生理状况上不同,如个人的h r t f ( 人头传输函数) 不同, 从而造成阈值的差值不同。但是我们仍可以认为:时域掩蔽时掩蔽声和被掩蔽分 离会造成被掩蔽声阈值的降低。 上述结果,可能是由较优耳效应和双耳效应【2 2 】【2 3 】等原因造成的。 3 3 2 较优耳效应( b e t t e r - e a re f f e c t ) 分析 当双耳处的信掩比( 被掩蔽声与掩蔽声的声级差) 不一样时,听觉系统会利 用信掩比较高的耳来决定这种情况下的被掩蔽声闽值。信掩比较高的耳被称为较 优耳,而听觉系统的这种特性称为较优耳效应。在自然的听觉条件下,当掩蔽声 和被掩蔽声声源在空间上分离时,人头的作用使得靠近掩蔽声源的耳处掩蔽声声 压级较另一耳处大,而靠近被掩蔽声源的耳处被掩蔽声声压级较另一耳处大,因 此双耳处的信掩比不一样,从而产生较优耳效应。一般来说,较优耳作用与声源 分离的角度有关,且声信号的频率越高,较优耳效应越明显。 在我们的掩蔽实验中,假设( 头移开后) 头中心位置处掩蔽声( 噪声) 的声 压为p 。,被掩蔽声( 信号声) 所对应的头中心位置( 头移开后) 的声压为p s o , 重发信掩比的定义为; 黜= 2 0 l o g i p s o ( d b ) ( 3 - 1 ) 假设p s o 对应的左、右耳处的信号声压分别为p s l ,p s r ,左、右耳处噪声( 掩 蔽声) 的声压分别为p n l ,p n r 则左、右耳处的信掩比可定义为: 1 6 第

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论