版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音增强Speechenhancement请输入您的学校名称目录CONTENTS01信号模型与评价指标02单通道方法03多通道方法04混响环境下的语音增强请输入您的学校名称信号模型与评价指标PART01麦克风信号模型信号模型与评价指标单通道方法多通道方法混响环境下的语音增强麦克风接收信号模型的数学表达式为:
语音信号评价指标信号模型与评价指标单通道方法多通道方法混响环境下的语音增强优点缺点评价指标举例特点主观评价指标直接、易于理解需要大量测试者,耗时耗力MOS测试者打分,然后求平均客观评价指标快速便捷非直接感受SNR整段语音信号中语音与噪声强度比值SegSNR分段语音信号中语音与噪声强度比值PESQ与MOS分相关度最高STOI计算原始语音与增强语音的相似度请输入您的学校名称单通道方法PART02谱减法信号模型与评价指标单通道方法多通道方法混响环境下的语音增强时频域麦克风信号可表示为:
计算信号功率:
引入功率谱概念:
可估计信号功率谱!谱减法信号模型与评价指标单通道方法多通道方法混响环境下的语音增强谱减法流程图:谱减法效果维纳滤波法信号模型与评价指标单通道方法多通道方法混响环境下的语音增强
维纳滤波法信号模型与评价指标单通道方法多通道方法混响环境下的语音增强维纳滤波法流程图:维纳滤波法效果深度学习方法信号模型与评价指标单通道方法多通道方法混响环境下的语音增强
提取声学特征定义训练目标:纯净语音/掩蔽定义损失函数设计合适的神经网络时域深度学习方法U-Net信号模型与评价指标单通道方法多通道方法混响环境下的语音增强U型网络结构:编码器提取语音特征/
解码器对特征上采样编码器与解码器对称,跳跃连接每层编码器由卷积层、ReLU层、池化层组成每层解码器由反卷积层、ReLU层、池化层组成时域深度学习方法SEGAN信号模型与评价指标单通道方法多通道方法混响环境下的语音增强结构与U-Net类似采用跨步卷积频域深度学习方法:基于映射信号模型与评价指标单通道方法多通道方法混响环境下的语音增强以对数功率谱为训练目标的神经网络方法流程图:频域深度学习方法:基于掩蔽信号模型与评价指标单通道方法多通道方法混响环境下的语音增强掩蔽类型名称特点理想二值掩蔽(IBM)语音主导记为1;噪声主导记为0理想比值掩蔽(IRM)比值在0与1之间复值理想比值掩蔽(cIRM)针对复数信号的IRM频域幅度掩蔽(SMM)纯净语音和含噪语音的能量比值相位敏感掩蔽(PSM)SMM+纯净语音与含噪语音相位差信号近似(SA)评估目标语音频谱与估计频谱之间的均方误差频域深度学习方法:基于掩蔽信号模型与评价指标单通道方法多通道方法混响环境下的语音增强FullSubNet模型结构图:训练目标为cIRM全带/子带结构建模宽带/窄带信号请输入您的学校名称多通道方法PART03麦克风阵列信号模型信号模型与评价指标单通道方法多通道方法混响环境下的语音增强
麦克风阵列信号特征信号模型与评价指标单通道方法多通道方法混响环境下的语音增强
波束形成信号模型与评价指标单通道方法多通道方法混响环境下的语音增强
最小方差无失真响应波束形成信号模型与评价指标单通道方法多通道方法混响环境下的语音增强
频域麦克风信号表达式:
使用拉格朗日乘子法构造目标函数:
最小化目标函数求得最小方差无失真响应的权值最优解为:
最小方差无失真响应波束形成信号模型与评价指标单通道方法多通道方法混响环境下的语音增强
MVDR波束形成方法流程图:线性约束最小方差波束形成信号模型与评价指标单通道方法多通道方法混响环境下的语音增强核心思想:提取目标方向的信号,并使经过波束形成滤波器输出的信号中来自于与目标信号方向不同方向的其他干扰信号或噪声的功率最小化。与MVDR不同之处:多个线性约束。线性约束最小方差(LCMV)波束形成数学表达式:
线性约束最小方差波束形成信号模型与评价指标单通道方法多通道方法混响环境下的语音增强求解拉格朗日算子可得LCMV滤波器表达式:
LCMV波束形成方法流程图:与MVDR不同之处:结合神经网络的波束形成信号模型与评价指标单通道方法多通道方法混响环境下的语音增强借助IBM与IRM等掩蔽模式更好地估计麦克风信号协方差矩阵:
其中:核心思想:有用的时频点加大权重;无用的时频点减小权重!神经网络方法举例1:信号模型与评价指标单通道方法多通道方法混响环境下的语音增强Beam-GuidedTasNet:/hangtingchen/Beam-Guided-TasNet神经网络方法举例2:信号模型与评价指标单通道方法多通道方法混响环境下的语音增强MCNET:/Audio-WestlakeU/McNet神经网络方法举例3:信号模型与评价指标单通道方法多通道方法混响环境下的语音增强SpatialNet:GitHub-Audio-WestlakeU/NBSS:TheofficialrepoofNBC&SpatialNetformultichannelspeechseparation,denoising,anddereverberation请输入您的学校名称混响环境下的语音增强PART04信号模型信号模型与评价指标单通道方法多通道方法混响环境下的语音增强
另一种表达方式:去混响算法信号模型与评价指标单通道方法多通道方法混响环境下的语
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 项目十三 绘画与雕塑之美
- 学前教育理论课
- 料灌溉制品回收再生资源化项目可行性研究报告模板-拿地立项申报
- 山东省济宁市兖州区2025-2026学年高一下学期期中考试物理试卷
- 2025年常德市烟草系统事业单位人员招聘笔试备考试题及答案解析
- 2025年江苏省综合评标评审专家库专家考试(公共基础知识)综合试题及答案
- 2025年江苏省综合评标评审专家库专家考试(公共基础知识)在线题库全真模拟试题及答案
- 2025年监理工程师真题试卷(含答案)
- 广播电视编辑记者、播音员主持人资格考试(综合知识)模拟题库含答案(山东省莱芜市2025年)
- 陵水县2026年广播电视播音员主持人资格考试(广播电视播音主持业务)复习题库含答案
- 互联网营销师培训知识课件
- 撤回执行申请书
- 《人工智能通识课》全套教学课件
- 蒙汉文并用管理办法
- 《焊条电弧焊》课件-项目二 焊条电弧焊基本技能
- 【真题】苏教版五年级下册期末教学质量监测数学试卷(含解析)2024-2025学年海南省海口市
- 钻孔攻牙培训
- 2025年甘肃省庆阳市中考地理试卷及答案
- 2025年中国浮萍项目投资可行性研究报告
- 仓库消防安全台账
- 新闻记者职业资格考试题库含答案2025年
评论
0/150
提交评论