(信号与信息处理专业论文)房间混响消除的方法研究.pdf_第1页
(信号与信息处理专业论文)房间混响消除的方法研究.pdf_第2页
(信号与信息处理专业论文)房间混响消除的方法研究.pdf_第3页
(信号与信息处理专业论文)房间混响消除的方法研究.pdf_第4页
(信号与信息处理专业论文)房间混响消除的方法研究.pdf_第5页
已阅读5页,还剩78页未读 继续免费阅读

(信号与信息处理专业论文)房间混响消除的方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号 tn911 7 密级 621 39 编号 工学硕士学位论文 房间混响消除的方法研究 硕士研究生 行鹏程 指导教师 梅铁民 学科 专业 信号与信息处理 沈阳理工大学 2013 年 3 月 分类号 tn911 7 密级 621 39 编号 工学硕士学位论文 房间混响消除的方法研究 硕士研究生 行鹏程 指导教师 梅铁民 学位级别 工学硕士 学科 专业 信号与信息处理 所在单位 沈阳理工大学 论文提交日期 2012 年 12 月 13 日 论文答辩日期 2013 年 03 月 07 日 学位授予单位 沈阳理工大学 classification index tn911 7 u d c 621 39 a thesis for the master degree of engineering the research of room reverberation elimination method candidate hang peng cheng supervisor prof mei tie min academic degree applied for master of engineering speciality signal and information processing date of submission december 13th 2012 date of examination march 7th 2013 university shenyang ligong university 沈阳理工大学 硕士学位论文原创性声明 本人郑重声明 本论文的所有工作 是在导师的指导下 由作者本 人独立完成的 有关观点 方法 数据和文献的引用已在文中指出 并与参考文献相对应 除文中已注明引用的内容外 本论文不包含任 何其他个人或集体已经公开发表的作品成果 对本文的研究做出重要 贡献的个人和集体 均己在文中以明确方式标明 本人完全意识到本 声明的法律结果由本人承担 作者 签字 日 期 年 月 日 学位论文版权使用授权书 本学位论文作者完全了解沈阳理工大学有关保留 使用学位论文 的规定 即 沈阳理工大学有权保留并向国家有关部门或机构送交学 位论文的复印件和磁盘 允许论文被查阅和借阅 本人授权可以将学 位论文的全部或部分内容编入有关数据库进行检索 可以采用影印 缩印或其它复制手段保存 汇编学位论文 保密的学位论文在解密后适用本授权书 学位论文作者签名 指导教师签名 日 期 日 期 沈阳理工大学硕士学位论文 摘 要 在封闭的房间内 使用免提电话时 当麦克风和声源之间距离较远时 由于混 响较强 音节之间会产生掩蔽效应 严重时会影响通话质量 通过去混响后置滤 波将有效地改善语音通话质量 国内外对免提电话通信混响消除方面的研究近些年有很快的进展 但大多数 研究都集中在使用信道均衡的方法 即通过对房间冲激响应的逆滤波处理 恢复 出语音源信号的方法来达到去除混响的目的 但它的缺点也很明显 房间冲激响 应一般高达几千点 对其进行逆滤波处理会产生很大延迟 增加系统处理压力 虽然可懂度很好 但有时也会对通话双方交流造成很大影响 本文提出一种自适 应部分均衡去混响系统 即在多通道自适应盲辨识算法基础上 利用听觉掩蔽效 应设计部分去混响后置滤波器 只要全局系统的冲激响应 房间冲激响应加后置 滤波器响应 衰减足够快 低于听觉掩蔽效应曲线 则后置去混响滤波器将使语 音信号中混响部分被掩盖掉 让人完全感觉不出有混响的迹象 本论文主要做了三个方面的工作 1 理论方面 阐述了混响的产生机理 特征和数学模型等理论 并且介绍了 封闭房间中声场仿真技术 2 本文针对多通道自适应盲辨识算法 nmcflms 算法 收敛方面的缺陷 通过各通道信号之间的相对时延估计 房间冲激响应的直达主脉冲符号估 计及对观测信号的预白化的处理 提出了基于线性预测的类 dp nmcflms 算法 仿真结果表明 改进算法的收敛性能更好 3 将房间冲激响应自适应盲估计算法与部分去混响算法 reshaping 算法 相结 合 实现自适应去混响 关键词 去混响 房间冲激响应 听觉掩蔽效应 多通道盲辨识算法 reshaping 算 法 沈阳理工大学硕士学位论文 abstract in a closed room using a hands free phone when the distance from microphone to sound source is large due to the reverberation is strong between the two or more syllables can produce a masking effect when the masking effect is serious the quality of communication will be affected seriously through to post dereverberation filter can effectively improve the quality of voice as for the hands free telephone communication dereverberation aspects of research domestic and foreign has very rapid progress in recent years but most research has focused on the method of channel equalization which is inverse filtering of the room impulse response restoration of the speech signal and method to achieve the purpose of dereverberation but its shortcomings are obvious the room impulse response is usually up to thousands of points the inverse filtering can produce large delay and increasing system pressure although the intelligibility is very good but sometimes it could couse a great influence on talk exchange with each other this paper presents an adaptive equalizer portion dereverberation system in other words based on the multi channel adaptive blind identification algorithm we use auditory masking effect to design post dereverberation filter as long as the impulse response of the global system which is consists of the value of the room impulse response convolute with the post filter response decay fast enough and below the auditory masking curve then the post dereverberation filter makes the reverberation part of speech signals to be masked off so we can t hear the reverberation in this paper we have research the following three aspects 1 in theory we expound the generation mechanism characteristics of reverberation and mathematical model theory and introduces the closed room sound field emulation technology 2 as for the convergence flaws the multi channel adaptive blind identification algorithm nmcflms algorithm through the time delay estimation of each channel signal the main pulse symbol estimation of the room impulse response and the pre whitening processing of the observation signals we forward the similar dp nmcflms algorithm which based on linear prediction the simulation results 沈阳理工大学硕士学位论文 show that the convergence performance of the improved algorithm is better 3 we combined the room impulse response adaptive blind estimation algorithm with portion dereverberation algorithm reshaping algorithm which realized adaptive dereverberation key words dereverberation room impulse response auditory masking effect multi channel blind identification algorithm reshaping algorithm 目 录 目 录 第 1 章 绪论 1 1 1 课题研究的目的及意义 1 1 2 国内外研究现状及发展趋势 2 1 3 论文结构 3 第 2 章 混响与去混响的方法 5 2 1 混响 5 2 1 1 室内声音的传播 5 2 1 2 混响的产生 5 2 1 3 混响的影响 6 2 1 4 混响的特征 7 2 1 5 混响半径 8 2 1 6 混响时间 8 2 1 7 混响数学模型 12 2 2 混响消除方法 12 2 2 1 从声源模块方面考虑混响消减 13 2 2 2 从信道模块方面考虑混响消减 13 2 2 3 从采集模块方面考虑混响消减 14 2 2 4 从信号处理模块方面考虑混响消减 14 2 3 本章小结 15 第 3 章 房间冲激响应模型分析 16 3 1 室内仿真模型分析 16 3 1 1 室内声场仿真技术概述 16 3 1 2 室内声场仿真技术研究发展历程 16 3 2 房间冲激响应模型分析 18 3 2 1 概述 18 3 2 2 镜像源法 19 3 3 本章小结 21 第 4 章 多通道盲系统辨识自适应算法的研究 22 4 1 信道模型描述 22 4 2 可辨识性条件 23 4 2 1 零点和模式 23 4 2 2 盲辨识信道的一般可辨识性条件 24 4 3 线性时不变信道盲辨识算法 25 4 3 1 cr 算法 25 4 3 2 信道参数估计的性能评估 27 沈阳理工大学硕士学位论文 4 4 多通道时域 lms 盲辨识算法 28 4 4 1 信道模型 28 4 4 2 算法描述 29 4 4 3 收敛性分析 31 4 5 多信道频域 lms 算法 31 4 5 1 算法描述 31 4 5 2 收敛性分析 34 4 6 归一化多信道频域 lms 算法 37 4 6 1 算法描述 37 4 6 2 仿真效果 40 4 7 nmcflms 改进算法 46 4 7 1 类 dp nmcflms 算法 46 4 7 2 输入信号相关性方面的改进 47 4 7 3 仿真效果 48 4 8 本章小结 52 第 5 章 混响消除算法研究 53 5 1 听觉掩蔽效应描述 53 5 1 1 听觉掩蔽现象 53 5 1 2 噪声环境下声信号的辨识 53 5 1 3 听觉掩蔽阈值的计算 54 5 2 后置去混响滤波器设计 54 5 2 1 概述 54 5 2 2 算法描述 56 5 3 本章小结 60 结 论 61 参考文献 63 攻读学位期间发表的论文及取得的研究成果 67 致 谢 68 第 1 章 绪论 1 第 1 章 绪论 1 1 课题研究的目的及意义 在封闭房间内 当麦克风与声源的距离较远时 如使用免提电话 助听器 举行电话会议时 以及要处理有些带混响的语音音信号时 由于在室内 墙壁 天 花扳 地面 等硬质界面存在反射 到达接收点的语音信号除了直达部分的信号之 外还存在着许多其它路径反射过来的回响语音信号 由于声音中混杂这些回响 会使人混淆不清 难以分辩 严重影响通话质量 本文主要在免提电话通信应用中对消除混响算法作出研究 如果说话人离麦 克风太远 通常在声音信号采集或录制的情况下 麦克风除了接收到声源直达的 部分外还会接收声源信号通过在封闭房间内多径传播而到达的语音信号以及混杂 着该房间中其它声源产生的干扰噪声 在声学上延迟时间达到约 50ms 以上的反射 波称为回声 除直达声以外的其余的反射波产生的效应称为混响现象 将对期望 声信号的接收效果产生影响 35 可以通过对拾取的信号进行后置去混响滤波处理来 实现混响的消除 图 1 1 封闭空间语音混响形成过程 沈阳理工大学硕士学位论文 2 如图 1 1 所示当说话人离麦克风一定距离时 直达信号会被一些反射信号叠 加 受到这种房间冲激响应的影响后 形成的混响语音经扩音器放大 如果直接 被接收端接收会严重影响通话质量 本文通过多通道麦克风阵列接收经过房间冲 激响应滤波的带混响的语音信号 通过多通道盲辨识自适应算法估计当前的房间 冲激响应 利用此估计值加窗整形处理设计的后置去混响滤波器 对混响语音信 号滤波即可得到无混响效果的语音信号 在图 1 2 中详细描述了处理流程 图中 s 表示声源信号 hi表示各路房间冲激响应 mici表示各个麦克风 m 表示麦克风个 数 mic 1 mic 2 mic m s h1 s h2 s h3 s hm 利用利用c n 设计的后置去混响滤波器设计的后置去混响滤波器 多通道自适应盲辨识算法多通道自适应盲辨识算法 估计房间冲激响应估计房间冲激响应c n 经处理后的无混响经处理后的无混响 的语音信号的语音信号 图 1 2 系统设计流程图 1 2 国内外研究现状及发展趋势 本文在免提电话去混响问题中利用多通道自适应盲辨识算法和去混响滤波器 的设计两种技术来处理带混响的语音信号 早期的关于盲系统辨识和盲均衡的文献主要有 41 42 等 由于系统输出数据包含 的信息丰富 具有高阶统计特性 在早期 盲信道辨识算法主要是基于高阶统计 特性进行展开的 在单输入单输出信道中 如果用非最小相位系统作为参考系统 要获取相位信息就必须用到接收端语音信号中的高阶统计量信息 但用高阶统计 量方法得到的观测数据一般较长且计算量较大 容易收敛到局部极点 收敛速度 也会比较慢 因此对于跟踪快速衰落信道就处于劣势了 后来 文献 24 中 l tong 等证明了 可以利用系统输出数据的二阶统计特性来 解决盲系统辨识问题 由于计算复杂度降低 就使快速盲系统辨识成为可能 由 于利用对接收端输入信号数据在时间结构上过采样的循环平稳特性 基于二阶统 计量盲系统辨识方法才得以推出 对于单输入单输出的平稳系统 如果对输出端 数据经过过采样 那么此系统就具有循环平稳特性 通过输出数据的二阶统计特 性 该系统就能得到信道的幅度和相位信息 并且该系统也可以扩展为单输入多 第 1 章 绪论 3 输出的系统模型 这样利用二阶统计特性就可以对多信道模型进行辨识 本文中 就是利用该多通道模型 2 来对输入的带混响的语音信号做处理后得到房间冲激响 应的估计值 并以此来展开对后置去混响滤波器设计的 去混响滤波器设计方面的研究 近些年有很快的进展 但大多数研究都集中 在使用信道均衡的方法 通过对房间冲激响应的逆滤波处理 恢复出语音源信号 的方法来达到去除混响的目的 但它的缺点也很明显 由于声源信号的容量一般 很大 处理过程会有很大的延迟效果 这样增加处理难度 虽然有很好的语音清 晰度 但会对通话双方交流造成很大影响 alfred mertins 等 34 在此方向提出了信道补偿的方法 并设定了最优化处理的 一系列标准 通过引入掩蔽效应方法作为标准 将混响控制在掩蔽阈值一下 对 房间冲激响应做整形处理 只需要使通话双方感知不到混响的存在即可 类似于 部分均衡 通过后置滤波处理之后 会使处理过程更高效 1 3 论文结构 本文分为六章 第一章是绪论 简明阐述了语音去混响的研究目的和意义以及在国内外研究 现状及其发展趋势 第二章介绍了混响的产生机理 混响的一些特征 混响时间及混响的数学模 型 对语音通信过程中声源模块 信道模块 采信模块和信号处理模块分别在回 避混响和消减混响两个方向来去混响 第三章通过对房间仿真模型的建立来设计出房间冲激响应模型 并通过镜像 源法来模拟房间冲激响应 第四章介绍了多通道自适应盲系统辨识算法 通过信道模型的描述及信道可 辨识条件的考量来合理建立信道模型 通过对多通道 lms 自适应盲辨识算法性能 逐步优化推导后得到归一化多通道频域lms算法 并针对该算法收敛方面的缺陷 本文提出线性预测 类 dp nmcflms 算法 使对房间冲激响应的估计过程更快捷 更有效 第五章本文提出基于听觉掩蔽效应的混响消除算法 通过对前一章得到的房 间冲激响应的估计值进行 整形 之后 设计出后置去混响滤波器 并通过仿真 说明算法的可行性 沈阳理工大学硕士学位论文 4 最后总结全文 指出研究工作中存在的问题以及本领域研究的展望 本论文的仿真实验 1用镜像源法模拟仿真特定环境下的房间冲激响应 2通 过设定封闭房间模型以及声源与五个麦克的位置之后 利用多通道自适应盲辨识 算法分别得到这五路信号的房间冲激响应的估计值 并依次与原值相比较 3通 过设计后置去混响滤波器来处理麦克接收到的语音信号 通过听觉掩蔽曲线来衡 量处理效果 本文创新点在于 1首次将房间冲激响应自适应盲估计与部分去混响算法相结 合实现了自适应去混响及实时去混响 2对多通道自适应盲辨识算法进行了改进 通过时延估计 符号估计 以及白化处理过后 使算法收敛更快 效果更好 第 2 章 混响与去混响的方法 5 第 2 章 混响与去混响的方法 2 1 混响 2 1 1 室内声音的传播 声音在室内传播时 不但遵循室外大气中传播的规律 还会被房间天花 地 面 墙面反射回来 声源不断发声时 入射声波与反射声波相叠加 形成复杂的 室内声场 大的平表面会象镜面一样反射声音 而且入射角等于反射角 内凹型 的表面会聚拢声音 形成声聚焦 外凸的表面能够使声音发散 形成扩散 当房 间表面起伏不平 而且起伏尺寸接近或小于声音波长时 声音入射后将不会形成 定向反射 而是向各个方向无规则地反射 形成扩散 就象光 表面平整的镜子 能够反射出人像 这是镜面反射的结果 如果使用磨石将镜子磨毛 将成为乌玻 璃 就是因为玻璃表面出现坑凹不平 尺寸与光的波长接近 形成光散射 各个 角度都能看到入射的光 玻璃变得 发乌 了 声音入射到房间表面一部分能量进入材料内部 一部分能量穿透材料到对面空 间 这种能量损失的过程是吸声 完全没有吸声的房间被称为理想混响室 如果 在里面拍一下掌 声音将不断反射 在无限时间内回响 现实情况下不存在这种 房间 墙壁坚硬且光滑的房间混响时间很长 接近混响室 房间中声音会加强 接近混响室的房间中噪声比在一般房间内可能高 15db 声音完全没有反射的房间 被称为理想消声室 房间中只有声源的直达声 这样的声场叫做 自由场 在自 由场中 距点声源距离增大一倍 声压级严格下降 6db 现实情况下也不存在理想 消声室 对房间进行强吸声处理可以近似看作消声室 因房间中只有直达声 声 压级比普通房间可以降低 10db 2 1 2 混响的产生 产生混响的主要原因是可闻声波波段在室内 墙壁 天花扳 地面 等硬质界面 存在反射 并且可闻声波波段在这种反射界面以及传播路径的吸收衰减都比较小 反射信号和原声信号波形相似 只不过相比后的幅度仍然很大 而且相位不相同 沈阳理工大学硕士学位论文 6 由于后续源信号的多次反射波面与前期语音产生的各反射波面在各空间点叠加 因此对后续声音信号辨析度影响很大 在相对封闭的空间 语音信号的传播过程 中由于反射等原因 到达接收点的语音信号除了直达的语音信号之外还存在着许 多由其它路径反射过来的回响语音信号 这种现象称为混响 其中这些非直达信 号之和构成了混响信号 3 房间冲激响应 rir room impulse response 体现了混响 通过在一个真实房 间里进行实时的 rir 测试 得到该房间的一幅房间冲激响应 如图 2 1 所示 由图 可见 房间冲激响应的开始阶段 由于开始阶段的能量较大 这表示许多脉冲 这 里的一个脉冲代表一个反射信号 比较稀疏分散 接着一部分 响应的幅度会按指 数规律不断衰减 而脉冲却会越来越密以至最后密不可分 图中延迟最小 幅度 最大的一根脉冲表示直达声 由于其传播路径较短 所以能量损失很少 幅度就 很强 相比后续信号幅度 幅度明显较大的线条是语音信号在距离麦克最近的物 体上反射而得来的 叫做前期反射声 是由一次或经过多次反射的声波所构成 此时声波的能量会因为被房间表面吸收而有所减少 之后的一段比较密集的线条 是由于语音信号经过房间界面经过多次反射后叠加形成的 叫做末期反射声 其 声波的能量会呈指数不断递减 4 01002003004005006007008009001000 0 2 0 0 2 0 4 0 6 0 8 1 1 2 图 2 1 房间冲激响应 rir 效果图 2 1 3 混响的影响 混响的会影响人的心理感觉 如果混响时间太短的时侯 在屋子里讲话就好 像在旷野里讲话一样 听起来会显得低弱无力 声音生硬 枯燥 干涩 甚至听 第 2 章 混响与去混响的方法 7 不清楚 尤其是欣赏音乐时感到音乐的声音不丰满 枯躁乏味 对声音的色泽有 很大影响 但如果混响时间太长时 语音音节之间会产生掩蔽效应 masking 会 觉得声音 发嗡 使人的理解能力下降 例如 如果在混响时间较长的室内发出 同样的四个音节 前一个音节在室内衰减的时间间隙 后面的几个音节己在此时 到来 于是前一个音节的 混响声 就会掩蔽后几个音节 这是后几个音节几乎 被掩盖了一样 混响时间越长 掩蔽越大 而且发音速度越快 即各音节之间的时 间间隔越小 掩蔽现象就会越严重 如果某个音节由于时间间隔长 受前面几个音 节的混响掩蔽效果才会大幅度的下降 如果将室内的混响时间不断缩短 掩蔽效 果就会明显改善 曾有人用实验得出混响时间与语言清晰度的关系 混响时间越 短 语言清晰度越高 混响其实也有很多益处 室内适当的混响能使语音或者音 乐的声音音色优美动听 节奏清楚 层次明显 明朗响亮 声音丰富 温暖而亲 切 有烘托作用 3 能明显的改善音质 美化音乐的音色和风格 2 1 4 混响的特征 由混响的产生可知 混响信号是声源信号经反射后的一种变体 是一种有规 律可循的干扰 其实本质上不同于随机的于扰 混响信号的频谱除相位和幅值外 与声源信号有很大的关系 因此混响信号与声源信号是强相关的 混响大小与声 波在空气中传播的衰减率为4m db km 它与墙面吸收率有关 4m常态下为0 2 100db km 它与声源频率的平方 2 f 成正比 与空气温度 r 和湿度 rh 成反比 即 2 4 mft rh 墙面吸收率 与墙面的厚度 材质 形状及声源的频率有关 普 通建筑材质为 1 3 混响具有以下四个特征 由于声源信号经过反射后产生的混响信号会产生频率和相位的偏离 混 响信号更容易影响到声源信号中的低频分量 原因是墙壁 地面等反射体对反射 信号的低频分量的吸收系数相对较小 并且反射信号在空气中传播的衰减系数也 比较小 导致反射信号 含多次反射 中的低频分量损耗很少 混响会随着声源信号强度的增大而增大 由于混响的谱结构与发射信号 具有一定的相似性 混响常被看作是一种非平稳的有色干扰噪声 但由于人的口 腔肌肉运动时 相对于语音频率来说是非常缓慢的 我们一般会认为在 10 30ms 的短时间内 混响的特性是基本保持不变 即混响也看成是准稳态过程 短时平稳 沈阳理工大学硕士学位论文 8 性 由于声波的波长与房间的尺寸是同数量级或者会较短些 声波一经声源 发出将往返反射于各墙壁之间多次后 会形成驻波 因此在有些远处声源的声强 会比近声源处还高 在文献 10 中 作者利用统计的观点对混响信号进行了特征分析 得出了混 响信号在时频域的三个特征 混响信号的瞬时值服从高斯分布 而混响信号的包 络则会服从瑞利分布 混响包络的时间相关半径反比于声源信号的带宽 混响信 号和声源信号的频谱具有一致性 2 1 5 混响半径 直达声与距离有关 如果直达声距离声源越远时 声音在房间中扩散的面积就 会越大 能到达并被麦克接收的直达声就越小 混响声是由于反射而形成的 经 过反射后混响声波会弥散于房间各处 而且反射方向不可预测 但可以认为房间 中所有位置的混响声具有相同的声压级 因此 在封闭房间中声源距离麦克等接 收设备的距离一定时 这时的直达声与混响声会具有相同的声压级 这个距离被 称为混响半径 28 混响半径属于房间的属性 与房间吸声情况有关 与声源无关 以声源为中心 小于混响半径范围内的声音主要是直达声 而在混响半径以外的 区域 主要是混响声 如果房间表面附着吸声材料之后能够大大降低混响声 5 估计混响半径的公式 1 2 0 0 s r 2 1 其中 0 r为混响半径 s 为房间的总表面积 为房间各表面平均吸声系数 但 是 由于房间内的混响声不是绝对的均匀 声源也不是理想的点声源 因此公式 2 1 的精度不高 只能对混响半径做粗略的估算 混响半径可以判断出加入吸声材料 之后吸声处理的大概有效区域范围 但是如果混响半径已经明显超过房间的尺寸 此时表明再加入吸声材料吸声处理已经没有降噪效果了 2 1 6 混响时间 混响时间 在声音停止发声后 室内的声能立即开始衰减 声音自稳定声压 级衰减 60db 所经历的时间称为混响时间 混响是由于房间中声音被各界面不断反 射之后而不断积累的结果 混响能够使室内的声音声压级增加 15db 同时也会降 第 2 章 混响与去混响的方法 9 低语言的清晰度 对于演奏音乐的场所 如音乐厅 剧场等 需要混响效果使音 乐更加悦耳动听 对于如同电影院 教室 礼堂 录音室等场所则需要减少混响 使讲话呈现得更加清晰 因此 对声音效果需求不同的房间需要不同的混响效果 描述混响效果的指标主要是混响时间 比混响其实反映了室内声音能量的衰变 这种衰变与室内的吸声 反射和散射等有关 100 多年前 美国物理学教授 w c 赛宾首先提出了用声音能量衰减 60db 所需时间 即通过混响时间来衡量房间的音 质 并提出了计算室内混响时间的经验公式 60 0 163 rt v s s 2 2 其中 v 为体积 a s 为总吸声量 后来 eyring 发现了大房间的 60 rt混响时 间 对公式 2 2 进行了修改 公式如下 60 55 2 rt 4ln 1 v s mvcsc 2 3 公式 2 3 考虑了空气的吸声和温度的影响 是一个很精确的计算公式了 其 中 m 为空气衰减系数 s 为表面积 a 平均吸声系数 v 为体积 c 为声速 声速 会随温度的变化而变化 当声速为常温时取 344m s 这便是精确公式 如体育馆 等体积巨大的场所 如果不对它们进行吸声处理的话 混响时间就会很长 语言 清晰度会严重受到影响 室内吸声与频率也有关系 在不同频率下的混响时间也 不同 房间音质指标常指的就是中频混响时间 据研究称 较理想的混响时间 中 频 在不同场所的表现为 音乐厅为 1 8 2 2 秒 剧院为 1 3 1 5 秒 多功能礼堂为 1 0 1 4 秒 电影院为 0 6 1 0 秒 教室为 0 4 0 8 秒 录音室为 0 2 0 4 秒 体育馆 为低于 2 0 秒 在建筑设计时如果正确地应用吸声材料来控制混响时间 就可以保 证音质效果满足使用要求 6 混响时间计算公式的适用范围 上述混响理论以及由此导出的混响时间计算公 式 将复杂的室内声场处理得十分简单 7 其前提条件是 1 声场应是一个完整 的空间 2 声场应是完全扩散的 那么衰减曲线可以用一个指数曲线描述 8 用 db 刻度衡量衰减曲线时 它就为一条直线 而在实际声场中 不能经常完全满足 上述假定 衰减曲线也有不呈直线的情况 混响时间难于以一个单值加以表示 例如在室内的地面和天花板如果是强吸声的且侧墙的为强反射的情况下 上下方 向的声波就会很快衰减 水平方向的反射声则会较慢衰减 混响曲线便不会是直 沈阳理工大学硕士学位论文 10 线 而是发生曲折 类似的情况也可以在细长的隧洞 走廊及天花很低的大房间 中出现 此外 在剧场中 观众厅与舞台成一个互相连通的耦合空间 如果声能 在两个空间衰减不同 也会出现衰减曲线形成曲折的情况 在剧场 礼堂等场景 的观众厅中 观众席上的吸收材料的吸收系数一般要比墙面 天花板的大得多 有时为了消除回声 往往会在后墙上做强吸声的处理 这会使室内吸声分布很不 均匀 这样的声场往往不是一个充分扩散声场 这就是混响时间的计算值与实际 值之间会产生偏差的主要原因之一 再有 代入公式的数值 主要是各种材料的 吸声系数 一般选自各种资料或是自己测试所得到的结果 由于实验室与现场条 件不同 吸声系数也有误差 最突出的是观众厅的吊顶 在实验室中是无法测定 的 因为它面积很大 后面空腔一般为 3 5 m 实际上是一种大面积 大大空 腔的共振吸声结构 在现场也很难测出它的吸声系数 因为观众或座椅以及舞台 的影响 存在几个未知数 同样 观众与座椅的吸收值也不是精确的 综上所述 混响时间的计算与实际测量结果有一定的误差 但并不能以此否定其存在的价值 因为这是我们分析声场最为简便也较为可靠的唯一方法 引用参数的不准确性可 以使计算产生一定误差 但这些是可以在施工中进行调整的 最终以设计目标值 和观众是否满意为标准 因此 混响时间计算对 控制性 地指导材料的选择和 布置 预测将来的效果和分析现有建筑的音质缺陷等 均有实际意义 经过后来很多科学家研究 从扩散声场中的声音能量的密度随时间的衰减的 规律出发 在理论上推导出混响时间的表达式 发现赛宾提出的公式正是平均吸 声系数 a 0 2 时理论公式的近似值 从而 使我们对赛宾公式有了进一步的认识 尽管 100 多年来 科学工作者们提出了许多能够影响房间声音质量的声学参量 但是 至今混响时间仍然是房间声学设计中惟一一个能够定量计算的参量 也是 一个公认的最为成熟的房间声音质量的评价参量 混响时间 9 是建筑声学的一个重 要的物理量 它反映了室内声音能量随着时间的衰减 以及在不同频率的声音能 量的衰减特性 尽管在一个房间内的不同位置测得的混响时间可能有所不同 可 是世界著名的音乐厅内的混响时间的空间标准的偏差都很小 基本小于 0 1s 在不 同位置的混响时间基本相差无几 说明此房间内的声场是很均匀的 所以混响时 间是一个很好的房间声学设计的评价参量 它与测量用的声源是无关的 房间混响时间是否适当 不仅仅关系到声音的清晰度 而且还直接关系到声音 第 2 章 混响与去混响的方法 11 是否真实 是否悦耳动听 都与混响时间是否合理息息相关 要想把混响时间控 制最恰当 首先要知道最合理的混响时间是多少 又受是么因素的影响 通过对 房间声音质量及混响时间的大量测试和统计分析 以及主管听音评价的声学家提 出了 最佳混响时间 的概念 语言清晰度就是最佳混响时间的可选范围 最佳混响时间是对大量音质效果评价认为最好的对各种用途的房间 最佳混响 时间不应过长 但也不是越短越好 房间的容积不同 用途不同要求的最佳的混 响时间也不同 同时还受人们的主观感觉及民族风格等因素影响 因此不同地方 发表的数据也是不同的 1 不同的用途对混响时间的要求不同 音乐厅用途的房间要求最佳混响 时间应长一些 语言用途的房间 要求最佳混响时间短一些 2 房间体积的不同要求不同的混响时间 如果房间较大混响时间应该长一 些 3 最佳混响时间除了与房间容积和声音类别相关外 相对于各种情况 可能有 10 20 变化范围 然而 随着时代的发展 房间面积会不断扩大 电子技术不断进步 房间内不 可避免的会需要用到扩声系统 扩声与混响有什么关系呢 它对音质有没有影 响 首先 扩声系统主要的功能是放大从声信号转变来的电信号 再把电信号通 过扬声器转变成声信号传播出去 所以它没有混响时间 但是 并不是说它与混 响无关 在一个混响时间很长的房间内交谈时 如果两人的距离较远 大声讲话 时反而听不清楚 而如果两人靠近时 讲话轻一点也能听懂 这是因为两人靠近 时 直达声就加强了 尽管房间的混响并没有变 这就说明在混响很长时 可以 通过增加直达声来提高语音的可懂度 有一个例子 在西欧的教堂中 牧师讲经 时声音洪亮 往往因教堂内吸声不足 使得混响时间很长 在大教堂的后座的听 众就会听不清楚 后来 电声工作者在教堂内柱子的侧面安装了由小扬声器组成 的声柱 并且是朝向听众的 效果就明显变好了 从声学角度来看 小声柱增加 了扩声器系统的指向性 并且扩大了覆盖区域 使直达声增强了 从传输频率范 围上来看 小扬声器辐射的频率范围会比较窄 基本上没有低频辐射 也就不会 激发出低频混响效果 满足了语言传输的要求 从辐射功率方面来看 小扬声器 沈阳理工大学硕士学位论文 12 的辐射功率会比较小 很快衰减后就不足以激发室内的混响效果 这样就避免了 长混响对语音的干扰 在房间内增加直达声的强度可以减小厅内混响的影响 2 1 7 混响数学模型 混响的数学模型 3 0 kk k x nu ns nkn 2 4 其中 s n 表示纯净语音声源信号 kn 表示经过第 0 1 2 kl 次反射后语音 信号的延时单元数 k s nkn 表示经过第 k 次反射后的语音信号 k 是第 k 次反 射时的反射系数 u n 是加性噪声信号 x n 是到达传声器 麦克 的直达语音信号 和所有的回响语音信号求和构成的混响信号 之前的定义中混响信号不包括直达 声 为了阐述主要的混响的机理方便 在这里就不考虑噪声 因此混响的模型简 化为 0 kk k x nnkns nh n 2 5 其中 号表示卷积 n 表示冲激函数 h n表示该房间的房间冲激响 应 它等于位置分别为 k kn 并各自衰减 k 倍之后的连续的冲激函数 n 的和 混响信号 x n就为纯净语音信号 s n与房间冲激响应 h n的卷积 由上式可知 其实混响也可以看作是一种噪声 只不过它不是我们常见的加性噪声 而是一种 卷积噪声 从此模型可以看得出混响语音信号 x n是到达麦克的直达语音信号和经 过其它路径传来的所有回响语音信号之和 在不考虑噪声信号 u n时可以表示为纯 净语音信号 s n与房间冲激响应 h n的卷积 所以混响的消除就是要从 x n中对 h n的做相关处理才能奏效 2 2 混响消除方法 由于声音的传播涉及到许多如 音乐声学 生理声学 心理声学 听觉声学 语言声学 噪音等多方面综合的因素 混响信号与声源信号的相关度较大 所以 采用传统的频率滤波方法无法消除混响 1 11 12 为了说明消除混响的方法 如下图 2 2 所示 根据语音通信的几个阶段得出消 第 2 章 混响与去混响的方法 13 除混响各阶段的示意图 声 源 背景噪声 混响声 直达声 信 号 采 集 模 块 信 号 处 理 模 块 信 号 重 构 模 块 图 2 2 混响消除各阶段示意图 从语音通信过程中声源模块 信道模块 采集模块和信号处理模块四个阶段分 别在回避混响和消除混响两个方面考虑室内混响的消减 2 2 1 从声源模块方面考虑混响消减 声源有即时发声和延时发声两种声源 即时发声声源指即时对话与现场直播 等场景中实时发送和接收情况 而延时发声声源指电话会议等场景先采集声源信 号过后再重放等情况 3 对于即时发声声源情况 可以采用其它采集的方式来采 集语音信号 例如在人体喉结等发声器官处采用贴片接触式装置来采集人发声时 的振动波或对人类在发声时某些体征的变化用振动 位移 图像等检测装置来采 集以得到语音信号 从而可以回避语音采集中存在的混响的影响 对于延时发声 声源信号 可以采用反相抵消装置减弱声音的混响 即由于事先已经获得纯净声 源 在重放时可以通过对纯净声源的反相衰减信号采用延时播放方式来抵消或减 弱声音中的混响 例如对于电话会议中直接利用远端传来的己知信号通过抵消装 置 在该装置中利用调节延迟混响时间和衰减率等参数 并反相输出达到抵消混 响的目的 但这些操作的前提是需要有房间冲激响应 rir 的先验知识 因此 对于即时发声声源就必须加装自适应装置才能通过抵消装置起到反相抵消混响的 作用 2 2 2 从信道模块方面考虑混响消减 由于语音信号的频率比较低 而波长却比较大 并且声波波长与室内房间的 尺寸在同一量级时 会很容易产生反射等现象 如果通过利用射频 红外等载波 沈阳理工大学硕士学位论文 14 或有线传输等传输方式来提高载波的频率 12 这种传输方式一方面可以减少反射 另一方面载波波长也比较小 波长相对于室内房间的尺寸差别会较大 在室内容 易被很快吸收衰减 因而可以回避语音信道中的的声波混响影响 2 2 3 从采集模块方面考虑混响消减 采用方向性强的超指向性麦克接收器 可以在采集模块回避混响问题 超指 向性麦克采用声干涉原理或抛物面反射原理设计 目前最常用是干涉管式超指向 麦克 它的优点就在于它的方向性极强 12 可以从三个方面来达到减弱声音混响 的效果 一是减少接收者与声源的距离 麦克接收到的声音中直达声的比重就会 占得很大 二是采用麦克风阵列 由多通道麦克风阵列可以获得一些参考信号 通过采用波束形成方法中的空间阵列处理技术 可调整最大指向到声源 且设备 简单 针对混响污染的鲁棒性较强 但是在采信的早期需要知道声源的大致方向 三是采用自适应麦克装置 自动辨识音源方向并将采集到的幅度最大处信号做为 直达声音信号 此后反相抵消混响的作用 这需要对房间冲激响应 rir 有先验 知识 2 2 4 从信号处理模块方面考虑混响消减 从信号处理模块方面考虑声音的混响消减是现在研究得最多的方面 也是本 文研究的主要方向 由于传声装置中已经接收到混响语音信号 所以采用回避声 音混响的方式去处理混响是行不通的 则必须应用减弱混响 11 12 的方式来解决 出 于信号处理的方面考虑 消减混响的方法有很多 而采用语音信号混响消减将归 类于稳健语音识别 13 所涉及的问题 其中一部分也与电话系统回声问题相关联 在 远程会议和电话系统等场合 对使用的扬声器和麦克风 它们之间将存在声波传 递途径 进而产生回声干扰 国内众多的关于电话系统回声问题的研究报告表明 消除回声干扰不同于还原原始声源信号 该原始信号为在混响环境下所检测到的 声源信号 出于系统响应辨识方面考虑 消除回声干扰系统的输入为已知 而混 响环境下声源的还原系统的输入为未知 11 13 14 对免提电话通信混响消除方面的研究 大多数研究都集中在使用simo 单输 入多输出 盲系统辨识的方法 通过对房间冲激响应做系统辨识估计后逆滤波处 理 恢复出语音源信号的方法来达到去除混响的目的 但它的缺点也很明显 如 果声源信号的容量很大时 处理过程会有很大的延迟效果 增加系统处理压力 第 2 章 混响与去混响的方法 15 虽然可懂度很好 但有时也会对通话双方交流造成很大影响 在本文中采用alfred mertins等 34 提出的部分均衡的思想 通过多通道自适应盲辨识算法与部分去混响 算法结合 设计后置去混响滤波器来处理带混响语音信号 这种方法处理效果同 样很好 并且更重要的是可以实现自适应去混响以及实时去混响 更有利于实际 应用 2 3 本章小结 本章介绍混响及混响的产生的机理 特征 混响时间和数学模型 本文从语音 通信过程中声源模块 信道模块 采信模块和信号处理模块四个阶段分别着眼于 回避混响和减弱混响两个方向考虑去混响 沈阳理工大学硕士学位论文 16 第 3 章 房间冲激响应模型分析 3 1 室内仿真模型分析 3 1 1 室内声场仿真技术概述 室内声场仿真的技术核心是应用各种计算方法获取房间脉冲响应 并在此基础 上实现聆听其仿真声场的效果可听化 18 20 模型房间声场的模拟研究有助于人们了 解室内声音传播的物理规律 从而可以应用到其他各种封闭声学设计中 从 20 世 纪 30 年代起 室内声场模拟主要依靠经典缩尺模型来完成 该技术已发展得较为 成熟 至今仍应用比较广泛 此后长期以来 房间设计常常采用缩尺模型实验的 方法 所谓缩尺模型就是按房间建筑实际尺寸大小的 1 10 或 1 20 制作一个模型 在该模型内部研究声波的传播和声学特性 并按比例关系折算到实际房间中 从 而可知其声学特性情况 模型与实物尺寸之比为 1 n 测量频率之比就为 n 1 声音传播之比为 1 1 模 型在测量频率下的材料的吸声系数与实物材料的吸声系数为 1 1 的比例 因此在模 型中要采用特殊设计制作的扬声器传声器 另外在模拟模型测量高频率下的吸声 系数也需要在模型混响室中对各种可供选用的吸声材料和结构进行相应的测试 从中选出与实物相近的来使用 n 值也有一定的限度 因为它的值越高 可用来与 实物相近的吸声材料和结构就越难找到 而相应的扬声器和传声器的制作难度会 更大 可以看出缩尺模型实验的要求很苛刻 所付出的经济成本也很高 在这样 的模型中完成所有的实验是很困难的 这种技术往往只会在一些重要的建筑和结 构的设计中才会使用 3 1 2 室内声场仿真技术研究发展历程 随着计算机技术的发展 计算机数学模型开始替代缩尺模型 计算机模拟仿真 是利用数字式方法 可以有效的弥补缩尺模型技术的不足之处 从 20 世纪 60 年 代至今 室内声场计算机模拟仿真技术已在建筑声学 心理声学方向受到很广泛 的重视并已开始步入实际应用阶段 第 3 章 房间冲激响应模型建立 17 以下分为发展过程 分支研究方向 应用领域和室内声场计算机模拟的发展过 程及研究规模 在过去 40 年的发展历程大致划分为以下 3 个阶

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论