(声学专业论文)基于人耳感知模型的厅堂音质分析的研究.pdf_第1页
(声学专业论文)基于人耳感知模型的厅堂音质分析的研究.pdf_第2页
(声学专业论文)基于人耳感知模型的厅堂音质分析的研究.pdf_第3页
(声学专业论文)基于人耳感知模型的厅堂音质分析的研究.pdf_第4页
(声学专业论文)基于人耳感知模型的厅堂音质分析的研究.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

(声学专业论文)基于人耳感知模型的厅堂音质分析的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 厅堂音质评价是建筑声学研究领域的个重要内容,它主要通过主观评价 量和客观参量以及它们之间的比较来进行研究。但是随着研究的深入,在一些 厅堂现场测试中发现,目前现有的一些客观参量并不能完全反映主观感觉上的 差别,即客观参量和主观评价量之间的联系还不是十分紧密。试图寻找更深层 的客观参量以及更切合实际的表示方法己成为室内声学研究的一个热点。 鉴于厅堂音质评价最终将通过人耳听觉感知,本文在分析厅堂脉冲响应的 过程中引入了人耳听觉模型,其结果将更接近与主观评价。本文在听觉生理学 和心理学成果的基础上,建立了针对厅堂音质研究的人耳感知模型。该模型模 拟了基底膜的频率选择特性,内毛细胞的半波整流特性以及神经纤维的时域累 积特性等一系列人耳感知过程。同时根据室内声场分析的特点,对先前的研究 成果作了改进,使结果更符合入耳对厅堂音质评价的感受,这些改进主要包括 模型各环节中参数的确定、基底膜频率选择的划分方法、基底膜滤波的能量补 偿以及时域积分窗有效时间的确定等。 通过对厅堂脉冲响应的实例分析发现,基于人耳感知模型的厅堂脉冲响应 分析具有明显的优点。首先,它的结果与主观感觉之间的联系更为紧密;其次, 它以时频图的形式表现,包含了信号在时频域上所有的信息;最后,相比其它 的时频分析方法如短时傅里叶变换( s t f t ) ,它在低频段具有很高的分辨率, 能反映出厅堂低频的精细结构。由于低频成分对音质评价的影响十分重要,因 此这一特点对厅堂音质评价非常有利。 关键字:厅堂音质评价,人耳感知模型 a b s t r a c t ab s t r a c t t h ea c o u s t i c a lq u a l i t yo fa na u d i t o r i u mi sa ni m p o r t a n ta s p e c ti nt h er e s e a r c h f i e l do fr o o ma c o u s t i c s i ti su s u a l l yd e s c r i b e db yo b j e c t i v ep a r a m e t e r sa sw e l la s s u b j e c t i v ee v a l u a t i o n s t h er e l a t i o n sb e t w e e nt h e mh a v eb e e ni n v e s t i g a t e da n ds o m e c o n c l u s i o n sh a v e b e e np r e s e n t e di np r e v i o u sr e s e a r c h e s q u e s t i o n s ,h o w e v e r , s t i l l r e m a i n i ns o m eo n t h e s p o tt e s t s i ti sf o u n dt h a td i f f e r e n c e sb e t w e e nt w oh a l l sc a n b ed i s t i n g u i s h e dt h o u g ht h e i ro b j e c t i v ep a r a m e t e r ss h o wt h a tt h e ya r ea l m o s te q u a l i nt h i sp a p e r , g i v e nt h ef a c tt h a ta c o u s t i c a lp e r f o r m a n c eo fa na u d i t o r i u mi s f i n a l l yd e t e r m i n e db yh u m a np e r c e p t i o n , a na u d i t o r ym o d e li si n t r o d u c e dd u r i n gt h e a n a l y s i so f r o o mi m p u l s er e s p o n s e s a n dt h er e s u l t ss e e mm o r ea d a p t e dt os u b j e c t i v e e v a l u a t i o n s t h ea u d i t o r ym o d e l ,p r o p o s e do nt h eb a s i so fp r e v i o u sp h y s i o l o g i c a la n d p s y c h o p h y s i c a lr e s e a r c h e s ,s i m u l a t e sas e r i e s o fp r o c e d u r e sd o n eb yh u m a ne a r s , i n c l u d i n gt h ef r e q u e n c ys e l e c t i v i t y o fb a s i l a rm e m b r a n e ( b m ) ,t h eh a l f - w a v e r e c t i f i c a t i o no fi n n e rh a i rc e l l sa n dt h et e m p o r a lp r o c e s s i n go fn e l n e c e n t e r m e a n w h i l e ,s o m em o d i f i c a t i o n sa r ei n t r o d u c e df o ram o r er e a s o n a b l ea n a l y s i sa n da c l o s e ri i n kw i t hs u b j e c t i v ee v a l u a t i o n s t h em o d i f i c a t i o n si n c l u d ed e t e r m i n a t i o n so f s e v e r a lp a r a m e t e r s ,ar e c t i f i c a t i o no ff r e q u e n c ys e l e c t i v i t ya c c o m p l i s h e do nb m , e n e r g yc o m p e n s a t i o na n dd e t e r m i n a t i o no fe f f e c t i v et e m p o r a li n t e r v a l 。 f i n a l l y ,t w or o o mi m p u l s e s a r ea n a l y z e dw i t ht h ep r o p o s e dm e t h o da n d s h o r t 。t i m ef o u r i e rt r a n s f o r m ( s t f t ) i ti sf o u n dt h a ta u d i t o r ym o d e lp r o v i d ea b e t t e rl i n kw i t hs u b j e c t i v ee v a l u a t i o n s f u r t h e r m o r e ,r e s u l t sd e r i v e db ya u d i t o r y m o d e lc o n t a i nm o r ei n f o r m a t i o nt h a no b j e c t i v ep a r a m e t e r s ,p r o v i d i n gad e e p e r u n d e r s t a n d i n go fa c o u g i c a lq u a l i t yo fa na u d i t o r i u m b yc o m p a r i s o nw i t hs t f t ,w e a l s of i n dt h a ta u d i t o r ym o d e ld e m o n s t r a t e sab e t t e rr e p r e s e n t a t i o ni nl o w f r e q u e n c y d o m a i nd u et oi t sh i g hr e s o l u t i o n ,w h i c hp l a y sa ni m p o r t a n tr o l ei na c o u s t i c a l e v a l u a t i o nt h a nt h a to fh i g hf r e q u e n c i e s k e yw o r d s :a u d i t o r i u ma c o u s t i c s ,a u d i t o r ym o d e l i i 学位论文版权使用授权书 本人完全了解同济大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供 本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名: 融杏 l p 呕年具8 日 经指导教师同意,本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名:学位论文作者签名: 年月日年 月 日 同济大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、己公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 签名:矽夯 山酊年弓月莎日 第1 章引言 第1 章引言 在室内声学中,厅堂的音质通常通过主观评价量和客观参量两种方法来评 价。自从上世纪初s a b i n e 提出混响时间r t 以来,很长段时间内混响时间一 直作为厅堂音质的主要客观参量。随着研究的深入,不断有新的客观参量提出, 从而丰富和完善了客观参量系统。其中主要的客观参量包括以下几个:早期衰 变时间e d t 、相对强感g 、清晰度c 、明晰度d 、侧向反射声能l f 以及双耳互 相关系数i c c a 等等。通过对一个厅堂的各种客观参量的分析,可以大致了解该 厅堂的声学特性。可以说,客观参量是了解厅堂音质的重要途径之一。 主观评价量也是评价厅堂音质的手段之一。与客观参量相比,主观评价龄 一般通过调查问卷的形式发放给听众、乐队成员以及指挥等,调查的问题一般 都是定性描述的;即便如此,不同的被调查者之间对同一个问题的结果差异较 大。许多学者也提出的不同的主观评价方法来研究厅堂内的声学特性。很明显, 主观评价量更容易让一些非声学专业的人员理解和接受,一套完整的主观评价 系统同样能大致反映出厅堂的音质特性。 客观参量的定量化和主观评价量的定性化之间并不是独立和矛盾的。主观 评价量通常可以通过对应的客观参量反映,而客观参量在数值上的变化一般表 现为主观感觉上存在差异。b e r a n e k 曾对主客观参量之间的关系作过一些研究【1 1 , 他指出:主观评价量和客观参量之间并不是简单的一一对应的,一个主观评价 量的变化通常是几个客观参量的变化的综合反应,比如丰满度较好的音乐厅通 常混响时间较长并且后期反射声较丰富;另外不同类型的厅堂要获得同样的主 观感觉,客观参量的值也不尽相同,比如建于18 世纪亲切感好的音乐厅初始时 延问隙一般较短,而建于1 9 世纪晚期的亲切感好的音乐厅具有中等的初始延时 间隙,如果是大教堂,则需要很长的初始时延间隙才能获得很好的亲切感。 1 。1 室内声学测量分析技术的发展与现状嘲 从客观参量的发展来看,测量技术和分析技术或方法的发展起了相当重要 的作用。测量技术的改进带动分析技术或方法的发展,也使得新提出的客观参 第1 章引言 量很容易计算得到。 自从s a b i n e 提出混响时间以来,它一直是表征房间声学特性的重要指标, 也是声学测量中最重要的客观参量。传统的测量方法一般是采用白躁声作为声 源,当室内建立起稳态声场后,突然停止发声使其自然衰减,根据测点处声压 级随时间降低的斜率,求出室内的混响时间。由于白噪声随机起伏的影响较大, 实际测量需要重复多次进行时问和空间上的平均,才能获得比较满意的结果, 因此这种测量方法工作量相对庞大。除了混响时间的测量外,通过发射噪声来 测量声场强度,从而可以得到声场的空间分布,以此来判断声场均匀性。另外, 丘j 予在实地测量时本底噪声比较高,声场很难达到6 0 d b 的衰减量,i s 0 3 3 8 2 将 混响时间定义为:声场开始衰减5 d b 到衰减2 5 d b 所需要的时间乘以系数3 。 随着研究的深入发现,仅仅一个混响时间r t 是很难描述厅堂音质的状况 的。因此学者们有提出了其它的客观参量,比如相对强感g 、清晰度c 、明晰度 d 等等。这些参量是不能通过稳态声自然衰减法得到的,它们都是建立在室内脉 冲响应的基础上计算得出的,都有自己严格的数学表达,i s 0 3 3 8 2 对这些参量的 计算提出了相应的要求。 上世纪6 0 年代起,计算机技术已在室内声学测量中得到应用。1 9 6 5 年 s c h r o d e r 提出了采用猝发声测量混响时间的技术【3 】。设声源发出万脉冲,此脉冲 经过壁面发射后形成反射脉冲,将直达声到达测量点的时刻作为时间的开始点, 测点先后接收到的直达声脉冲和反射声脉冲序列称为室内对万脉冲的瞬态响应 函数在时域上从f 至o o 作能量积分 m 一 e ( f ) = ip 2 ( f 矽r = ip 2 ( f y ( 一f ) ( 1 1 ) 它随时间的衰减规律与室内白噪声声场随时间自然衰减的相应规律是等价 的,因此通过对室内的万脉冲响应进行反向积分后,就能得到声能随时间的衰减 曲线,从而方便地求出混响时间。脉冲响应反向积分法具有传统方法不具备的 很多优点。它表征了房问的固有声学特性,即当声源与测点的位置固定时,脉 冲响应是个确定的函数,因此,它可以更准确细致地反映室内声场衰减的物理 过程及其瞬态响应变化特性。另外,由于其本身的声学特性,通过它除了能获 取混响时间外,借助于相应的信号处理技术,还能获得其它的客观参量,比如 早期衰变时间e d t 、明晰度d 、清晰度c 、相对强感g 等等。因此混响时间 r t 的测量和计算同其他的客观参量的计算在方法上实现了统一,室内声学也进 2 第1 章引言 入了现代测量和分析的阶段。 在此基础上,针对猝发声的不稳定、不可重复性等缺点,学者们结合相关 测量原理提出了赝噪声信号脉冲响应测量法【4 】【5 】( 6 】和线性调频信号脉冲响应法 7 1 , b e r a n e k 就是利用线性调频信号对2 3 个音乐厅的音质参量进行分析和计算 【8 【9 】,并且取得满意的结果。 可以说,基于脉冲响应测量方法已经非常成熟,如今已被广泛地应用于室 内声学测量中,通过脉冲响应可以计算得到各种客观参量,让人们对厅堂的音 质状况有了更全面的了解。 1 2 问题的引出 随着对厅堂音质的深入分析,学者们发现目前的这些客观参量还不能完全 描述厅堂的音质状况。比如说在客观参量大致相同的情况下,很难通过这些参 量反映出的信息来区分两个厅堂之间的差异,而人们的主观感觉能明显察觉出 两者之间的差异。这个缺陷是由于分析方法自身的不足所造成的:首先,客观 参量都是以倍频程或1 3 倍频程的方式滤波的,所覆盖的频率范围很少,而厅堂 脉冲响应的频谱成分是非常丰富的,它包含了厅堂对于所有频率的信号的反射 和能量衰减特性,这样的处理方式使得厅堂中的很多频率的特征信息丢失;同 时,评价厅堂音质的好坏最直观的方法是让听众在这个厅内欣赏一场音乐会或 歌剧,而脉冲响应是通过实验仪器记录下来的,通过它分析得到的客观参量中 并没有考虑到人在厅堂音质评价中所扮演的角色,因此计算得到的客观参量与 主观感觉之间的联系并不是十分紧密。 随着时频分析技术的发展和广泛应用,上文提及的第一个缺陷得到了一定 程度的解决。时频分析的特点就是在将时域和频域的信号在一个平面内通过三 维图形或者色块图表现出来,它可以分析整个频率范围内的信号的变化情况, 但是有一个前提:这两个频率之差要大于时频分析的频率分辨率。显然时频分 析所包含的信息量要远远大于客观参量包含的信息量,两者结合起来分析有助 于进一步认识厅堂音质状况。 最典型的时频分析方法是短时傅里叶分析。它的时域分辨率和频域分辨率 在整个时频域内保持不变,在分析高频的时候能较细致地表现频率组成和时域 分布状况,但是低频时的频率分辨率显得不够细致,在分析脉冲响应的低频部 3 第1 章引言 分时,不能很好的体现频率成分只能表现一个粗略的范围,由于低频成分对音 质评价地影响十分重要,这对于室内音质分析来说是个很大的不足。 1 3 本文的主要研究内容 结合上文提到的人的主观因素以及短时傅里叶分析低频表现不理想的实际 情况,我们提出了一种基于人耳感知模型的时频分析方法。它可以有效地弥补 两者的不足。 客观参量和主观评价量之问到底存在怎样一个联系已经成为学者们研究的 热点问题。一方面以倍频程表述的客观参量包含的信息量不足以表现厅堂音质 的整体情况。另一方面客观参最和主观评价量之间的联系是通过大量的实验数 据得出的,两者之间的联系并不是很紧密;同时这些数据是通过实验仪器采集 的,它并不能代替人们在厅堂中听到的声音。因为人们在感受外界声信息的时 候,人耳会采取一系列的处理方式对接收到的信息进行“加工”。从信息系统 角度讲,声音是经过了人耳系统的响应后才被人感知的,显然仅仅用仪器接收 是不能表现人耳的一些处理过程的,例如基底膜的非线性滤波、毛细胞的半波 整流、神经中枢系统的处理等等。显然实验接收的信号还需要卷积这些响应才 能表现观众在厅堂中听到的感觉。 听觉模型是生物医学的热点研究领域,其应用也主要侧重于医学方面,比 如人工耳蜗等等。它在室内声学方面的应用极少,国内更是没有相应的研究。 本文的研究内容主要分为: 1 分析短时傅里叶变换在厅堂音质评价中的优点以及存在的缺陷。 2 借鉴生理学和心理学的研究成果,建立适用于厅堂音质分析的人耳感知 模型。针对室内声学研究的具体情况,修改已有人耳感知模型的处理过 程,包括频带的选择、滤波器的能量补偿,时域积分的简化等。 3 通过实例验证人耳感知模型在室内声学处理分析中的优越性,将主观感 觉同客观分析更紧密地联系起来,从而表明该方法的可操作性和优越性。 4 第2 章短时傅里叶分析在厅堂音质评价中的应用 第2 章短时傅里叶分析在厅堂音质评价中的应用 在厅堂现场测量过程中,通常选取些自相关函数为万函数的信号作为声源 ( 例如线性调频信号等) 。这样做的优势在于,只需要将接收信号与声源信号 作互相关运算就能方便地获得厅堂的脉冲响应,在此基础上按照i s 0 3 3 8 2 国际 标准计算得到各种客观参量。 然而这些客观参量都是通过倍频程或者l 3 倍频程表示的,包含的频率信息 量十分有限,在对厅堂音质进行现场分析过程中,往往有些能量很强的频率成 分并不处于倍频程或1 3 倍频程的中心频率附近。而时频分析包含有大量的时域 和频域信息,可以弥补客观参量的不足。 2 1 短时傅里叶分析 2 ,1 1 短时傅里叶变换原理 短时傅里叶分析( s t f t ) 是在傅里叶变换( f t ) 的基础上,将信号加窗分 割分布进行傅里叶变换的过程。它给出了一个信号在时域和频域上的能量分布 状况。短时傅里叶变换在数学上定义为: 鼍鼍 s ( t ,桫) = l x ( f ) w t , o ( r ) d r = l x ( f ) w ( f - t ) e 耐d r ( 2 1 ) 曲 其中,w ( f ) 为分割时域信号的窗函数,常见的有海明窗( h a m m i n g ) 、汉宁 窗( h a r m i n g ) 等。s ( t ,缈) 为短时傅里叶分析的结果,它包含了时间和频率两维 信息。下图为短时傅里叶变换处理过程示意图。图2 1 为短时傅里叶分析处理过 程示意图,其中浅色的分割窗沿时域按照一定的步长每移动一次就进行一次傅 里叶变换,并将傅里叶变换的结果作为这个时间段内的频谱分布。 5 第2 章短时傅里叶分析在厅堂音质评价中的应用 w i t 图2 1 短时傅里叶分析处理过程示意图 但是根据海森堡测不准原理,时间窗划分信号的时间间隔不能无限小,这是 因为短持续时间信号有固定的大带宽,而当时间间隔变窄到一定程度之后所得的 短持续时间信号几乎与原信号的特性没有关系。一个很宽的窗可用来得到好的 频率局部化,但一般不能得到好的时域局部化,而用一窄的窗口情况则相反。同时, 当我们选定某一特定窗后所得频率分辨率和时间分辨率便固定不变了。然而在 室内声学的研究过程中低频部分频率分布对厅堂的影响要比高频的明显得多, 6 2 i ”博g 叶* * 目i 庸砰十日 这就要求在低频具有较高的分辨率而高频的分辨率可以相应降低。短时傅里叶 分析相比客观参量虽然提供了更多的信息量,但是并不能满足低频高分辨率n 勺 要求,这也限制了短时傅里叫变换在室内声学中的应用。 212 短时傅里叶分析在厅堂音质评价中的应用实例 图2 2 为一普通房间的脉冲响应,采样率为1 6 k h z 。从图上我们很难辨别脉 冲响应中的主要频率成分咀及时域变换情况。图23 为该脉冲响应的短时傅里叶 分析,其中曲的时域窗长度为2 5 6 点( 1 6 m s ) ,步长为1 2 8 点,重最部分为窗 li 的一半长度:b ) g j 日, j 域窗长度为5 1 2 ( 3 2 m s ) 点,步长为2 5 6 点,重叠部分州 样是窗u 的一半长度。 圈22 昔通房间脉冲响应 按照叫频分析等时带积原理,时域窗口越大频率分辨率越高反之亦然。 从图2 3 可以看到a ) 在时司轴方向较为细致但频率分布比较粗糙,而b ) 很好 地反映了脉冲响应中的频率分布状况但是从时域来看图形也十分租糙。仔细 比较两图的开始时刻附近部分的频谱分布,a ) 能大致反映出直达声的时刻而b ) 由于时域分辨率低( 3 2 m s ) ,不能将其区分开。从图中可咀看到该脉冲的频率 成分主要集中在5 0 0 l - l z 、2 k h z 、55 k h z 和7 k h z 的早期,其中2 k h z 和53 k h z 两部分能量在整个时间范围内都比较强,而29 k h z 和65 k i - i z 两部分能量则正 好相反。 * 2 $ 目 丹析在厅m * 厦* * 十庸用 至 a ) 时域甜长度为2 5 6 点b ) 时域窗长度为5 1 2 点 阁23 短时博里叶分析 通过实例分析我们发现,短时傅里叶分析由于在整个时频域范剧内分辨率 保持币变造成了低频部分胸频率分布不够细致,与厅堂音质评价的要求还有 一段距离。此外其滤波方式也与人耳的感知方式完全不同,因此只能作为一种 辅助分析方法。 22 本章小结 在客观参量分析的基础上,短时傅里川变换能够提供更全面的时问衰减和 频率分布信息。但是由于其时间窗在整个处理过程中保持不变,其分辨率在时 频域内慊持不变,这就使得它不能细致地描述厅堂内低频部分的频率分布及能 晕衰减状况,这制约了短时傅里叶分析在厅童音质分析中的应用。 第3 章人耳听觉感知机理简介及其模型发展概述 第3 章人耳听觉感知机理简介及其模型发展概述 人耳感知模型如今已广泛应用于语音识别、医学等领域,而在室内声学中 的应用还很少见。本章将简单介绍入耳的构造以及听觉感知原理和过程,并概 述人耳感知模型的进展情况。 3 。1 人耳听觉感知机理 3 1 1 人耳构造及听觉感知机理简介n 0 人耳具有十分复杂和巧妙的生理结构,它能对信号进行有目的的“过滤”, 比如母亲能在嘈杂的环境中听到自己孩子的哭声,从实验预算,人耳可以从信 噪比为一1 2 d b 的含噪语音信号中提取出有用信息。这是一般的信号处理方法包 括室内声学的测量及处理方法所不能及的。近半个世纪以来,研究人员一直致 力于研究人耳是如何感受的外界的声音并形成自己的感受,他们从心理学、生 理学以及神经学的各个角度加以研究,不断地加深对人耳的认识。大体上说, 人的听觉系统由外耳、中耳、及内耳( 耳蜗) 构成包括从耳蜗神经末梢至大脑 的这一段听觉神经及中枢神经构成,人耳构造如图3 1 。 中耳内耳 j 锤骨砧臂 j i1 镫骨骨半规管 溺 暨鞭 彰熟 势。 赣 骈经 图3 1 人耳结构图 外耳主要包括耳廓和外耳道,主要起集声的作用。人的外耳道平均直径约 9 胆a,厂翠,厶;。” 第3 章人耳听觉感知机理简介及其模型发展概述 为8 m m ,长度约为2 5 m m 。它对1 4 波长( 2 5 k h z 一3 5 k h z ) 与之相当的声波 有共振作用。 中耳主要有鼓膜和听骨链组成,构造也较为复杂。其中听骨链由三块听小 骨组成,分别称为锤骨、砧骨和镫骨,其中锤骨柄与鼓膜相连,镫骨底板与耳 蜗的前庭窗相连。声音经鼓膜传至内耳的过程主要由听骨链来完成。 听骨链将声音压迫鼓膜产生的气体振动地转化为液体运动,所以它实际上 起到了阻抗匹配的作用。由此可以看出,整个中耳的主要生理功能是传卢,即 将声音由外耳高效地传入耳蜗【。 内耳的主要功能器官是耳蜗。耳蜗是外围听觉系统中最重要的组成部分, 它是听觉的收纳器,把声音的机械运动转化为神经系统信号,产! 卜听神经发放 信号。耳蜗长约3 5 c m ,最宽处约0 3 2 c m ,呈螺旋状盘旋2 5 2 7 5 圈。它是一 根密闭的管子,内部充满了淋巴液。耳蜗由鼓阶、蜗管和前庭阶三部分组成, 蜗管又成为中阶。前庭阶和鼓阶在蜗底各有一窗,窗上有膜。前庭阶与鼓阶内 充满外淋巴液,蜗管内充满内淋巴液,内外淋巴液互不相连。听觉器官的重要 结构都分布在蜗管内,图3 2 为耳蜗的构造示意图。 听神经 图3 2 耳蜗构造图 毛 胞 分隔蜗管和鼓阶的膜状结构称为基底膜,又称耳蜗隔膜。由感受细胞、听 神经末梢及支持细胞等结构组成的听觉感受装置( 螺旋器) 就在基底膜上。人 耳基底膜平均长度为3 2 m m ,它在直径较大的蜗底反而较窄,宽约8 0 o n ,结构 较薄而紧密;蜗顶处反而宽,约5 0 0 b u n ,结构较厚而松弛,当中依次渐变。基 底膜各处由于质量和张力的不同,决定了其不同部位具有不同的声学特性,特 别是近蜗底接受高频、近蜗顶接受低频的频率定位特性。 1 0 第3 章人耳听觉感知机理简介及其模型发展概述 简单地说,入耳感受声音的过程就是听觉的产生过程。听觉的产生过程是 个复杂的生理过程,它包括3 个基本过程:1 ) 声波在外耳的传递过程;2 ) 声波在传递过程中引起的机械振动转变为生物电能,同时通过化学递质的释放 而产生神经冲动的过程。3 ) 听觉中枢对传入信息进行综合加工处理的过程。 声波是通过空气传导和骨传导两种途径传人内耳的。正常情况下以空气传导为 主,也就是说声波通过这两种途径传人内耳使螺旋器中的毛细胞兴奋,毛细胞 又和听神经的末梢相接触,毛细胞兴奋后激发化学物质的释放,使蜗神经产生 冲动。冲动通过蜗神经传导路径传入大脑,经大脑皮质听觉中枢的综合分析, 最后才使我们感觉到声音,即听到声音。 3 1 2 耳蜗在听觉感知中所起的关键性作用n 2 1 声音经过外耳道传入中耳,镫骨的运动引起耳蜗内流体压强的变化,从而 引起行波沿基底膜的传播。不同频率的声音产生不同的行波,其峰值出现在基 底膜的不同位置上。频率较低时,基底膜振动的幅度峰值出现在基底膜的顶部 附近。如果接收是一个多频信号,则产生的行波将沿着基底膜在不同的位置产 生最大幅度,而且不同声音沿着基底膜呈非线性分布。在每一个频率上,随着 强度的增加,基底膜运动幅度增大,并且带动更宽的部分振动。从这个意义上 讲,耳蜗就像一个频率分析仪,将复杂信号分解成各种频率分量。 基底膜的振动引起毛细胞的运动,使得毛细胞上的绒毛发生弯曲。绒毛向 一个方向的弯曲会使毛细胞产生去极化,即开肩离子通道产生向内的离子流, 从而使传入神经开放增加。而当绒毛向另一方向弯曲时,则会引起细胞的超极 化,即增加细胞的膜电位,从而导致抑止效应。因此,内毛细胞对应流体运动 速度而言,就像一个自动回零的半波整流器。在基底膜不同部位的毛细胞具有 不同的电学和力学特征。在耳蜗的基部,基底膜宽而柔软,毛细胞及其绒毛也 较长而柔和。这是由于这些结构上的差异,因此它们具有不同的机械谐振特性 和电谐振特性。有些学者认为这种差异可能是确定频率选择性的最重要的因素。 外毛细胞可在中枢神经系统的控制下调节螺旋器的力学特性,内毛细胞则负责 声音的检测并激励传入神经发放。这样外毛细胞性质的变化可以调节内毛细胞 的调协。位整个耳蜗的动态功能处于大脑的控制之下。 第3 章人耳听觉感知机理简介及其模型发展概述 3 2 人耳感知模型发展概述 听觉系统的研究主要集中在以下三个方面:1 听觉系统的实验研究,2 听 觉系统的建模,3 听觉模型的应用。听觉系统的实验研究主要指听觉系统在医 学、生理学及心理学方面的研究。由于耳蜗深植于颅骨中,而且它的尺寸极小, 蜗管的直径只有l m m ,而网状板和覆膜间的距离只有6 o n ,所以耳蜗的实验研 究是一项非常艰臣和复杂的工作。 3 2 1 人耳感知数学模型发展概述 g v b e k e s y 是这一研究领域的先驱者,他借助于频闪观测仪,观察到了基底 膜上的行波现象,并由此建立了最早的耳蜗一维传输模璎【13 1 ,随着先进的测量技 术和电予技术的改进,耳蜗的实验也大为改观了,j o h n s t o n e 和b o y l e 最先采用 m o s s b a u e r 技术对耳蜗中的基底膜振动进行了测量,得到了比b e k e s y 更精确的 实验结果【1 4 1 【1 5 】【1 6 1 。继j o h n s t o n e 之后,r h o d e 采用同样的测量技术获得了更好的 的实验结果,他首次发现了基底膜振动的非线性特性【l7 1 ,从而为耳蜗的研究开 辟了一个全新的领域。 随着研究的深入,人们发现耳蜗的一维模型已不能较为全面的反映耳蜗的 真实特性。l e s s e r 和b e r k l e y 提出了二维耳蜗模型的构想,随后l i e n 采用g r e e n 函数法建立了一个二维耳蜗模型f 1 引。在此基础上,a l l e n 和s o n d h i 在把耳蜗近似 成个二维矩形管腔后,获得了耳蜗的l a p l a c e 方程,并用g r e e n 函数法求解, 最后得到了一个更为精确的二维耳蜗模型,这一模型在耳蜗建模史上有着深远 的意义【1 9 】。至此,耳蜗建模主要集中在基底膜的振动上,而耳蜗的听觉感受实 际上是通过基底膜的振动和耳蜗毛细胞的转换才能最后转变成神经纤维的脉冲 发放。 3 2 2 人耳感知计算模型发展概述 目前应用较多的是耳蜗的计算模型,它与数学模型不同,它主要是一剩,算 法。其优点是:许多难以在数学模型中得以描述的听觉特性在计算模型中很容 易表现出来,它是一种面向应用的耳蜗模型。 l y o n 在1 9 8 2 年提出了种计算模型【2 0 】f 2 1 】【2 2 1 ,它由三部分组成。第一部分 1 2 第3 章人耳听觉感知机理简介及其模型发展概述 是基底膜的振动模型,它由许多二阶网络组成的串,并联成滤波器组构成。这 一部分的功能主要是将输入的声音信号在频域上分解,从而在某一部分滤波器 的输出端可得到较高信噪比的被分解了的信号输出。第二部分是毛细胞模型, 利用半波整流器加上一个低通滤波器来模拟单个细胞的检测功能。半波整流器 是用来模拟毛细胞的单向开关特性,由于采用的是理想半波整流器,所以其后 必须用一低通滤波器来消除整流后的高频分量。第三部分是神经纤维模型,耳 蜗神经纤维具有非线性压缩特性,因为听觉系统可允许的输入信号的动态范围 是1 0 1 2 ,而听觉神经上发放的脉冲速率其动态范围只有1 0 2 ,因此他用一耦合a g c 压缩网络来模拟神经纤维的这l 特点。整个模型共有6 4 个通道,系统的输出是 一个类似于语谱图的信号。 a l l e n 于1 9 8 5 年提出的计算模型也是由三部分组成【2 3 】,除了传统的基底膜 模型之外,采用了经典的d a v i s 毛细胞转导模型2 4 1 1 2 5 1 ,最后一部分是初级听觉 神经系统模型,这一听觉神经系统模型的作用是求出信号的频域直方图,然后 把每相邻两路信号所对应的直方图信号逐点相加,再把所有的乘积点逐点相加, 最后得到一种类似于语谱图的信号。由于听觉神经系统的生理功能一直不太清 楚,所以这一部分的建模大多数是根据一些合理的猜测进行的,很大程度上取 决于整个听觉模型的应用场合。 为了更好地模拟耳蜗的实际特性,不断弥补旧耳蜗模型存在的种种弊端, s t e e l e 等人再1 9 8 1 年曾提出了三维耳蜗模型【2 引。尽管模型的维数在增加,但性 能并没有得到大的改进。 1 3 第4 章应用于室内声学的人耳感知模型的建立及改进 第4 章应用于室内声学的人耳感知模型的建立及改进 尽管对人耳感知模型的研究已经取得了一定的成果并且在语音处理等领域 已经得到了应用,但是在室内声学中人耳感知模型的研究还处于起步阶段。本 章将阐述人耳感知模型各部分的处理方法,同时针对室内声学这个特殊的研究 对象,对先前在其它领域建立的人耳感知模型作一定的改进。 4 1 人耳感知模型在声学中的应用及本文所采用的模型的建立 4 1 。1 人耳感知声学中的应用概述 人耳感知模型有着良好的应用前景,所以人耳模型的研究也倍受学者的关 注。针对人耳听觉特性提出的各种处理方法本质上还是时频分析的过程。信号 处理关注的是信号在时域内的变化、在频域内的能量分布以及精细构成。从最 最初的傅里叶变换( f t ) 到短时傅里叶分析( s t f t ) ,信号的时频特性可以通 过一个平面内表示出来,随着研究的深入,短时傅里叶变化的缺点也开始暴露 出来,随后又提出了小波变换等等处理方法。针对语音等被听觉直接感知的信 号的研究,学者又提出了建立人耳感知模型,力求更符合人的主观感觉。 人耳感知声音的过程十分复杂,涉及到心理声学、生理声学以及信号处理 等各方面的内容,声波传入耳道带动基底膜产生机械振动,而后转为生物电, 最后变为神经中枢活动和大脑活动,最终形成主观感觉。正是由于其处理过程 的复杂性,特别是后期的神经中枢活动以及大脑活动,到目前为止人们还没有 完全了解听觉感知的全部过程和其中蕴藏的奥秘。因此目前提出的人耳模型也 不是最完善的,是对中间某几个过程的一些模拟,其中包括耳道、基底膜以及 早期的神经活动等等。至于后面的处理过程已经成为心理声学和生理声学专家 们研究的热点。 人耳感知模型的应用目前主要集中在语音处理,医学等方面。在语音识别 等研究领,p a t t e r s o n 领导的研究小组作过很多研刭2 7 】【2 8 】,主要是针对语音中元 音和辅音的特点进行研究,如何在实际环境中更好地识别语音。国内的学者也 做过相应的研究【2 9 】【3 0 】【3 1 1 ,主要是通过人耳感知模型来提高语音信号的抗干扰能 1 4 第4 章应用于室内声学的人耳感知模型的建立及改进 力,提高语音信号的信噪比。医学声学的研究更侧重实际应用,主要包括人工 耳蜗的研究以及相应的移植技术的发展等等。 人耳模型在室内声学中的应用还是处于起步阶段,国内还没有相关方面的 研究,只有几个国外学者曾经发表过相关的文章。法国学者n a d i n em a r t i n e 等人 将c a p o n 算法弓l 入厅堂音质分析过程中【3 2 1 ,他们针对客观参量不足以表现人耳 的主观上的差异为出发点,提出了近似人耳分辨率的倍频程的滤波方式对室内 脉冲相应进行滤波,频率分辨率得到了改进,该方法近似于人耳的滤波方式但 是严格来讲其频率选择方式于人耳工作机理存在明显的差别。 日本学者t a p p i ol o k k i 提出在分析室内脉冲响应的过程中加入g a m i n a t o n e 滤波器组p 3 1 ,使得频率的选取更符合人耳的工作机理并给出了最后的结果,首 次把这个概念带入了室内声学的研究过程中。人耳感知模型在室内声学巾的应 用已经渐渐被国外的学者重视,但是由于还是处于起步阶段,相应的参考文献 较少。作为以演出为主的观演建筑,最终的目的是为了得到一个让听众满意的 主观感受,因此将人耳感知模型弓l 入厅堂音质的分析过程中是合乎情理的,也 应该更容易贴近人们的主观感觉。 4 1 2 应用于室内声学的人耳感知模型的建立 目前在很多研究领域并不需要实现听觉系统的硬件模型,随着计算机的飞 速发展许多学者都提出了基于人耳听觉感知的计算模块。通过这些模块我们可 以借助计算机对各种声音信号进行处理和分析,这对研究带来了极大的便利。 根据人耳结构,以及它感受声音的工作原理,本文结合有关参考文献 3 4 1 驺j 建立 了一个基于人耳听觉感知的计算模型。整个模型有三个主要部分组成:第一部 分是模拟基底膜对频率的选择特性,这一部分的功能主要是将输入信号在频域 上分解,其中涉及到中心频率的选择、滤波器的选取以及滤波器能量补偿等闻 题;第二部分是毛细胞模型,这部分的主要功能是模拟毛细胞的单向开关特性 和非线性压缩特性,其中涉及到信号的半波整流、低通滤波等问题;第三部是 模拟人耳在时域上的“累积”效应,信号通过“累积”会变得更为“稳定”, 其中涉及到有效积分区间的确定等问题。最后是针对具体的要求对数据进行综 合的整理分析获取有价值的信息,图4 1 为模型处理过程示意图。 1 5 第4 章应用于室内声学的人耳感知模型的建立及改进 入耳处理过程 图4 1 模型处理过程示意图 l l j 蟊期分析处理 需要指出的是,室内声学与语音处理、及医学声学的研究侧重各有不同, 针对室内声学研究的实际情况,本文提出了上述模型,它与国外学者提出的模 型在内容上有所不同:1 频率选择方式的不同。在本文的研究过程中增加了中 心频率的个数,这种处理方式的优势在于其结果能更精确地表现厅堂内各频率 成分的信号随时间的分布状况。2 滤波器的能量补偿。在语音处理等研究领域, 往往对滤波器进行幅值归一化,然而在室内声学的研究中发现,幅值归一化将 使高频部分信号的能量锐减;本文中采用能量归一化的方法可以避免这一问题。 3 有些人耳感知模型已经将神经中枢活动以及后期的大脑刺激考虑进去,并提 出了相应的处理方法。本文将其作了简化,一方面考虑到目前相关研究还没有 定论,而且相关文献表明1 3 刨,这些处理方法十分复杂,得到的数据有一个“累 积”效应,相应的分析也由时间一频率一幅度的三维数据变为时间一频率一幅 度一“累积”效应的四维数据,另外这种“累积”效应的运算量也相当庞大, 以1 6 k 采样率为例,只适合计算长度在2 0 0 m s 以内的声音信号,而该方法多用 于语音处理的研究中:而在厅堂音质评价中,脉冲响应属于“长信号 ,不适 合也没有必要作这样的处理。本文参考m o o r e 提出的简化计算模型来研究室内 脉冲响应,在确保计算结果的可靠度的基础上能有效地节省计算时间。 至此,应用于室内声学的人耳听觉感知系统已经搭建完成,具体流程见图 1 6 第4 章应用于室内声学的人耳感知模型的建立及改进 4 2 。下面本文将详细讨论针对上文提到的3 个不同点对模型的某些过程作相应 的改进。实验表明,在其它研究领域建立的模型并不完全适合于室内厅堂音质 分析,对其作合理的修改是为了使它能更好地应用于厅堂音质的分析过程中。 这些改进可以概括为中心频率选择方式的改进、滤波器的改进以及时域积分的 改进。 图4 2 人耳感知模型流程图 4 2 人耳频率选择方式的改进 前文曾指出,基底膜相当于一个滤波器组对外界信号进行滤波并且信号在 入耳的基底膜上呈现非线性分布,它既不同于一般的数字滤波方式,也不同于 倍频程或1 3 倍频程滤波方式。在听觉生理学研究中,一般用临界带宽( c r i t i c a l b a n d ,c b ) 来表征人耳的频率选择方式。 用一个中心频率为厂,带宽为v 的白噪声来掩蔽一频率为厂的纯音,先将 这个白噪声的强度调节到使被掩蔽纯音恰好听不见为止。然后由大到小逐渐减 小,而保持单位频率的噪声强度( 即噪声谱密度) 不变,起初这个纯音一直是听不 见的,但当矽小到某个临界值时,这个纯音就突然可以听见了。如果再进一步 减小矽,被掩蔽音厂会越来越清晰。这里刚刚开始能听到被掩蔽声时的可宽的 频带,叫做频率厂处的临界带宽( c b ) 。临界带宽是随其中心频率而变的,被 掩蔽纯音的频率( 即临界带的中心频率) 越高,临界带宽也越宽。不过二者的变化 关系不是一种线性关系。目前常用的临界带宽有b a r k 尺度和等效矩形宽度 ( e q u i v a l e n t r e c t a n g u l a rb a n d w i d t h ,e r b ) 尺度。 4 2 1b a r k 尺度与e r b 尺度的比较与分析口刀町1 b a r k 将2 0 1 6 0 0 0 h z 范围内的频率可分成2 4 个频率群( 又称b a r k 尺度) , 1 7 第4 章应用于室内声学的入耳感知模型的建立及改进 频率群的划分相应于基底膜分成许多很小的部分,每一部分对应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论