已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音增强原理及应用的讨论 内容 语音增强相关概念语音增强基本原理及应用 语音增强的定义 语音增强是指当语音信号被各种各样的噪声干扰 甚至淹没后 从噪声背景中提取有用的语音信号 抑制 降低噪声干扰的技术 一句话 从含噪语音中提取尽可能纯净的原始语音 语音增强的目标 改进语音质量 消除背景噪音 提高语音可懂度 两者往往不能兼得 所以实际应用中总是视具体情况而有所侧重的 语音噪声类型 带噪语音的噪声类型按与信号关系可以分为加性噪声和非加性噪声 加性噪声有宽带的 窄带的 平稳的 非平稳的 白噪声 有色噪声 等 非加性噪声如乘性噪声 卷积噪声等 语音噪声类型 加性噪声 一般指热噪声 散弹噪声等 它们与信号的关系是相加 不管有没有信号 噪声都存在 信号与噪声是相互独立的 加性噪声来源一殷可以分为三方面 1 人为噪声 2 自然噪声 3 内部噪声 语音噪声类型 乘性噪声 一般由信道不理想引起 它们与信号的关系是相乘 信号在它在 信号不在他也就不在 一般通信中把加性随机性看成是系统的背景噪声 而乘性随机性看成系统的时变性 如衰落或者多普勒 或者非线性所造成的 其他常见噪声名词 白噪声 表示在全频域内单位频域下都分布有相同的能量密度 在线性空间内它具有平坦的频谱 换句话说 一定频域内的白噪声在其中任意给定的带宽内都具有相等的功率 随机噪声 噪声波形是随机的 不可预测的 平稳噪声 是指分布参数或者分布律随时间不发生变化的噪声 语音噪声特性 一般 语音增强处理的噪声指环境中的噪声 而这些噪声主要是高斯白噪声 这种噪声一般符合如下的假设 1 噪声是加性的 2 噪声是局部平稳的 局部平稳是指一段加噪语音中的噪声 具有和语音段开始前那段噪声相同的统计特性 且在整个语音段中保持不变 也就是说 可以根据语音开始前那段噪声来估计语音中所叠加的噪声统计特性 3 噪声与语音统计独立或不相关 到底什么是傅立叶变换 有时信号在时域特征不明显 我们通常的将它变换到频域 这时会用到傅里叶变换 那么傅里叶变换到底是什么呢 傅里叶变换是将时域信号分解为不同频率的正弦信号或余弦函数叠加之和 连续情况下要求原始信号在一个周期内满足绝对可积条件 离散情况下 傅里叶变换一定存在 到底什么是傅立叶变换 一个恰当的比喻是将傅里叶变换比作一个玻璃棱镜 棱镜是可以将光分解为不同颜色的物理仪器 每个成分的颜色由波长 或频率 来决定 傅里叶变换可以看作是数学上的棱镜 将函数基于频率分解为不同的成分 当我们考虑光时 讨论它的光谱或频率谱 同样 傅立叶变换使我们能通过频率成分来分析一个函数 到底什么是傅立叶变换 在频域中 频率越大说明原始信号变化速度越快 频率越小说明原始信号越平缓 当频率为0时 表示直流信号 没有变化 因此 频率的大小反应了信号的变化快慢 高频分量解释信号的突变部分 而低频分量决定信号的整体形象 l 语音增强常用方法 根据语音和噪声的特点 出现了很多种语音增强算法 语音增强方法有噪声对消法 谱相减法 维纳滤波法 卡尔曼滤波法 FIR自适应滤波等 其中谱相减法 wiener滤波 卡尔曼滤波是常用增强方法 下面简单介绍下其原理 维纳滤波 维纳滤波 卡尔曼滤波 卡尔曼滤波的基本思想 采用信号与噪声的状态空间模型 利用前一时刻的估计值和当前时刻的观察值来更新对状态变量的估计 以求现时刻的估计值 其特点 无需采用全部过去的观察值进行估计 适合于实时处理 用状态方程和量测方程表示信号和噪声 采用递推法进行计算 适合于计算机求解 适用范围广 平稳或非平稳 时变或非时变系统 谱减法的基本原理 将含噪语音信号和有声 无声判别得到的纯噪声信号进行FFT变化 从含噪语音幅度谱的平方中减去纯噪声的幅度谱的平方 然后开方 得原始语音谱幅度的估值 再借用含噪语音的相位 进行IFFT变化 得到增强的语音 含噪语音 纯噪声 原始语音谱幅度的估值 DFT 插入相位 DFT IDFT 原始语音的频谱的估值 谱减法流程图 谱减法假设 噪声叠加 噪声与语音不相关 对纯净语音无先验知识 对统计噪声有先验知识 带噪语音模型 y n s n v n 式中 y n 是带噪语音 s n 是纯净语音 v n 是噪声 谱减法 对语音模型公式两边进行傅立叶变换 得Y k X k N k 由于对噪声的统计参数的未知 所以在实际应用中 通常使用非语音段噪声谱的均值来作为对噪声谱N k 的估计 谱减法 则对纯净语音幅度谱的估量表示为 谱减法实现步骤 根据已知的平台噪声进行FFT 计算噪声功率谱谱平均值N k 对含噪语音进行FFT计算得到其功率谱X k 保留含噪语音相位 用含噪语音功率谱X k 减去噪声功率谱N k 得到原始语音的功率谱估计值S k 利用S k 以及含噪语音相位进行IFFT 这样就得到原始语音的估计值 谱减法缺点 由于噪声的随机分布的范围广 因此相减时 若该帧某频率点上的噪声幅度谱分量大时 就会有很大一部分残留 在频谱上呈现随机起伏的尖峰 在听觉上形
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 35460-2026机织弹力裤
- 香港金融管理局 2025年可持续发展报告
- 2026年突破试点-香港氢能发展策略-团结香港基金
- 第六章++计数原理+大单元章节讲解 高二下学期数学人教A版选择性必修第三册
- 火灾基础技术2
- 湖南省娄底市2026年中考历史模拟试卷附答案
- GEO优化系统深度评测:2026年传声港、传新社、怪兽智能三大平台对比分析与选购指南
- 心电监测-护理试题及答案
- 肩袖损伤规范化诊治临床指南 (2026 版)
- 建筑起重机械安装拆卸使用管理规程
- 2026江苏苏州市健康养老产业发展集团有限公司下属子公司招聘15人(第二批)笔试参考试题及答案解析
- 2026贵州黔西南技师学院公开招聘事业单位工作人员14人考试备考试题及答案解析
- 历史(四川卷)(考试版)-2026年高考考前预测卷
- 2026年佳木斯富锦市市政设施管护中心公开招聘一线工程技术人员3人笔试备考试题及答案解析
- 2026年江苏泰州市初二学业水平地生会考试卷题库及答案
- 瑞幸咖啡2025品牌年终报告
- 初中化学九年级下册“化学与社会·跨学科实践”单元整体建构教案
- 2026年广西事业单位招聘面试真题及答案
- 2026年高性能医用新材料研发与生物安全性评价
- 党员之家内部管理制度
- (完整版)机械工程专业英语课件
评论
0/150
提交评论