




已阅读5页,还剩53页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2 3语音的产生模型和LPC声码器 3 人的发声系统由声带 声门 声道以及次声门组成 次声门又由肺和气管等组成 是语音的激励源 次声门系统产生的气流作用于声带 通过声道后就产生声音 根据发音机理 声音信号可分为清音和浊音 一 语音信号的基本特性 4 一 语音信号的基本特性 当声带震动产生一个准周期空气脉冲激励声道时就产生浊音 浊音具有明显的准周期性 声带震动的频率称为基音频率 周期为基音周期 基音频率一般在70 450Hz范围内 相当于周期为2 15ms 基音周期是语音信号的主要特征之一 5 一 语音信号的基本特性 6 一 语音信号的基本特性 如果声道在某处发生收缩 迫使空气以高速冲过这一收缩部位而产生湍流 就得到清音 发清音时声带不振动 是由湍流建立的宽带噪声源激励声道而发声 清音波形类似于白噪声 7 一 语音信号的基本特性 8 一 语音信号的基本特性 9 一 语音信号的基本特性 语音信号的基本特性语音信号是非稳态信号 特征随时间变化 但在一个很短的时间段内 约5ms 50ms 具有相对稳定的特征 称为准平稳信号 语音信号通常可以分为浊音 清音和混合音 浊音在时域上具有准周期性 在频域上 精细谱具有周期性起伏的谐波特性 谱包络具有共振峰结构 清音类似于随机噪声 其频带较宽 浊音段的信号能量要比清音段的能量高 这一特点可用于判断区分清 浊音 10 一 语音信号的基本特性 11 激励源等效为基音频率的周期性脉冲或具有平坦频谱的白噪声 声道等效为时变线性数字滤波器 当激励源采用周期脉冲源时 声道输出的是浊音 采用白噪声源时 声道输出的是清音 二 语音信号的产生模型 12 二 语音信号的产生模型 13 二 语音信号的产生模型 14 产生语音信号s n 的参量清 浊音类型 基音周期TP 代表声道的时变滤波器的系数 aj 及滤波器阶数p 增益系数G 说明 根据语音信号慢变化的特点 可以每隔10 30ms左右预测一次上述各参数的值 即以每10 30ms为一帧传送一次参数样值的编码 并不传送话音样值的编码 因此比特速率低得多 二 语音信号的产生模型 15 三 LPC声码器的工作原理 16 1 全极点数字滤波器参数的确定阶数P模型阶数P的选择 应该从频谱估计精度 计算量 存储量等多方面综合进行考虑 P取很大值时 可以获得很好的信号谱估计 但增加的计算量和存储量代价太大 语音谱估计时主要关心的是声道的谐振特性 P值过大 估计的谱中保留许多信号谱细节 反而使共振峰分析效果变坏 阶数P的经验值在8 12之间 通常采用10个极点的滤波器 模型就能正确描述共振峰特性和谱的基本形状 三 LPC声码器的工作原理 17 滤波器系数 aj 三 LPC声码器的工作原理 设计的滤波器系数 aj 就是使得误差e n 在某个预定的准则下最小 通常是根据最小均方误差准则求解 aj 在LPC模型中 信号s n 的估计误差e n 为 18 三 LPC声码器的工作原理 根据最小均方误差准则通过求解P个方程来得到P个未知数aj 19 三 LPC声码器的工作原理 2 基音检测根据语音信号的特性检测基音周期的方法有 利用时域特性检测 利用频域特性检测 同时利用时域和频域特性检测 这里只介绍利用时域特性检测 20 基本原理 利用语音信号的时域波形的相似性 通过比较原始信号和它的移位信号的相似程度来寻找基音周期 如果移位的距离等于基音周期 则两个信号之间将具有最大的相似性 常用方法 短时自相关函数和短时平均幅度差函数AMDF 利用时域特性检测 三 LPC声码器的工作原理 21 三 LPC声码器的工作原理 基于求短时自相关函数的基音周期估计 22 三 LPC声码器的工作原理 sw n 的自相关函数称为语音信号s n 的短时自相关函数 用Rw l 表示 如果s n 是浊音 其短时自相关函数Rw l 呈现出明显的周期性 其周期等于s n 的基音周期 基音周期就是第一个峰值点到零点之间的距离 23 三 LPC声码器的工作原理 24 设sw n 是一段加窗的语音信号 它的非零区域为 n 0 N 1 sw n 的短时平均幅度差函数rw l 定义为 三 LPC声码器的工作原理 基于短时平均幅度差函数 AMDF 的基音周期估计 25 三 LPC声码器的工作原理 如果s n 是浊音 其AMDF也呈现出明显的周期性 其周期等于s n 的基音周期 与Rw l 不同的是在基音周期的各个整数倍点上 rw l 具有谷值而非峰值 要通过寻找最深谷值点的位置来确定基音周期 26 三 LPC声码器的工作原理 27 两种基音周期估计方法比较AMDF方法计算简单 只需减法和取幅度运算 不需要乘法运算 AMDF的动态范围较小 易于算法的定点实现 AMDF在基音周期点上 它的谷点锐度较之短时自相关函数的峰点锐度更尖锐 估值精度更高 更稳健 但信号不够平稳时 这个特点不明显 短时自相关函数法的特点是对相位不敏感 在信号有相位失真时能较好地检测基音 三 LPC声码器的工作原理 28 窗长为了使较好地反映sw n 的周期性 窗长N至少应大于两个基音周期 一般取长度为10 30ms 克服共振峰特性造成的干扰由于共振峰的干扰 会出现Rw l 的第一最大峰值点或rw l 的第一最深谷值点与基音周期不一致的情况 当基音周期性和共振峰周期性混在一起时 检测出来的周期可能是Np Nf Np是基音周期 Nf是第一共振峰的周期 三 LPC声码器的工作原理 讨论 29 克服上述干扰有两种方法 用低通滤波器 60Hz 900Hz 对语音信号进行滤波 去除大部分共振峰的影响 基音频率最高约450Hz 滤波后可以保留其一 二次谐波 先对语音信号进行非线性变换 例如 中心削波 然后再求Rw l 或rw l 这样可以明显地改善基音估计的效果 基音周期点上 峰值点或深谷值点比削波前得到的要尖锐 突出 三 LPC声码器的工作原理 30 中心削波中 为了保证表征基音周期的峰值不被削掉 削波电平CL的选择很重要 由于语音信号的电平变化很大 不宜选择固定电平 通常是找到语音帧的前1 3和最后1 3内的最大幅度 选取二值中较小的幅值 削波电平取其60 80 即可 通常定为68 三 LPC声码器的工作原理 31 对于加窗的语音信号sw n 当窗的起点n 0时 语音信号sw n 的短时能量用E表示 短时平均幅度用M表示 计算公式如下 三 LPC声码器的工作原理 3 浊音 清音及无声的判别根据语音信号的短时能量 短时平均幅度和短时过零率来判断当前帧的语音信号是浊音 清音 还是无声 32 语音信号的过零率用Z表示 它表示一帧语音信号中波形穿过横轴 零电平 的次数 它可以用相邻两个取样改变符号的次数来计算 三 LPC声码器的工作原理 33 浊音 V 的M最大而Z最低 当采样率为8kHz 帧长为20ms时 Z的平均值约为20 清音 U 的M居中而Z最高 当采样率为8kHz 帧长为20ms时 Z的平均值约为70 无声 S 的M最低而Z居中 判断当前帧是浊音 清音 无声的依据如下 三 LPC声码器的工作原理 34 三 LPC声码器的工作原理 在S U V三种情况下 短时平均幅度M和短时过零率Z的条件概率密度函数示意图 35 四 LPC10声码器 复习 LPC声码器的工作原理 36 1 LPC10声码器概况LPC 10声码器采用10阶线性预测分析滤波器 编码速率为2 4kb s 被美国在1981年作为联邦标准FS 1015用于窄带保密通信 其语音质量清晰可懂 但抗噪声的能力和自然度尚有欠缺 四 LPC10声码器 37 四 LPC10声码器 2 LPC10编码器 38 LPC 10编码器的特点 1 采样采样率8kHz 每个样本量化为12bit得到数字化语音 每180个样点分为一帧 22 5ms 以帧为处理单元 四 LPC10声码器 预加重的目的是加强语音谱中的高频共振峰 使语音短时谱以及线性预测分析中的余数 残差 频谱变得更为平坦 从而提高了谱参数估值的精确性 2 预加重在提取声道参数之前 先进行预加重 高频提升 处理 预加重滤波器的传输函数Hpw z 为 39 传输函数Hpw z 的幅频和相频特性 四 LPC10声码器 40 3 声道滤滤器参数RC该编码方案中采用协方差法计算预测系数 ai i 1 P P 10 预测系数不适于直接量化 因为它的微小变化会导致LP综合滤波器极点位置很大的变化 很可能造成滤波器不稳定 为了保证滤波器的稳定性 要求有相当高的量化精度 每个系数需要8 10bits 四 LPC10声码器 41 四 LPC10声码器 为了降低量化比特数 采用了在数学上完全等价的P个反射系数 RC ReflectionCoefficient ki i 1 P代替预测系数进行量化编码 滤波器稳定的条件是参数ki满足下式 此条件在量化时容易保证 可以通过Levinson Durbin算法求得部分相关系数 PartialCorrelation 部分相关系数与RC在理论上是互为相反数 42 4 增益RMS增益RMS由下式计算 Si是经过预加重后的数字语音信号样本 N是分析帧长度 对于浊音帧 其分析帧长取为130个样本以内的基音周期整数倍值 对于清音帧 其分析帧长取为长度为22 5ms的整个帧的中点为中心的130个样点 四 LPC10声码器 43 清 浊音判决是利用模式匹配技术 基于低带能量 AMDF函数的最大值与最小值之比 过零率三个因素判别 最后对基音值 清浊音判决结果用动态规划算法 在三帧范围内进行平滑和错误校正 从而给出当前帧的基音周期 清浊音判决参数V U 5 提取基音周期和检测清 浊音采用基于短时平均幅度差函数 AMDF 法提取基音周期 四 LPC10声码器 44 6 参数编码对10个反射系数RC 增益RMS 基音周期 U V判决标志以及同步信号共编码成每帧54bits 帧长22 5ms 因此编码速率为2 4kb s 各比特分配如下表 四 LPC10声码器 45 四 LPC10声码器 46 四 LPC10声码器 3 LPC10译码器 47 LPC 10声码器的缺点 1 采用过分简化的二元激励 合成的语音自然度较低 2 稳健性 Robustness 差 3 LPC 10的语音谱共振峰的位置以及带宽估值有时会产生很大的失真 从而影响语音的质量 当浊音的基音频率接近谱包络中的第一共振峰时 LPC谱估计在共振峰位置上出现极其尖锐的峰值 估计失真 使得相应得在合成语音中会出现尖峰或较大的毛刺 影响语音质量 四 LPC10声码器 48 采用混合激励代替简单的二元激励 使合成语音的质量得到改善 激励脉冲加抖动 对每个基音周期的长度乘上一个0 75 1 25之间均匀分布的随机数以改善语音的自然度 4 LPC 10e声码器LPC 10e声码器采用针对LPC 10声码器的缺点加以改进的算法 并能与LPC 10声码器兼容 用于美国第三代保密电话 四 LPC10声码器 1 激励源的改善 49 2 基音提取方法的改进LPC 10提取基音采用的是AMDF 它的显著特点是不需要乘法 计算较小 LPC 10e中采用LPC的残差信号或语音信号的短时自相关函数 利用动态规划的平滑算法来更准确地提取基音周期 四 LPC10声码器 50 3 声道滤波器参数量化的改进线谱频率LSF LineSpectrumFrequency 或称为线谱对 LineSpectrumPair 是数学上与线性预测系数 ai i 1 P 和反射系数 ki i 1 P 完全等价的另一种表示方式 LSF参数集 i i 1 P 都在单位圆上 它们在频域描述全极点滤波器H Z LSF在数学上有良好的量化特性 四 LPC10声码器 51 四 LPC10声码器 在求取LSF参数及量化过程中 如果保持LSF参数的有序有界性质 即 就可以保证全极点滤波器H Z 是稳定的 LSF参数有序有界性 52 LSF误差相对独立性某个频率点的LSF偏差只对该频率附近的语音频谱产生影响 而对其它LSF频率上的语音频谱影响不大 这有利于LSF的参数量化和插值 四 LPC10声码器 53 LSF参数的量化在标量量化时 通过设计最佳的LSF参数的非均匀标量量化器 可以用较少的量化比特达到较高的量化精度 例如 对10个LSF参数 根据每个参数所起的作用 分配的量化比特数为 3 4 4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- LED设备买卖合同经典版4篇
- 报建代理协议4篇
- 农业种植产业信息化与智能化融合发展研究报告
- 琵琶行课件专家评价
- 理财经验讲解课件
- 理疗护理安全管理培训课件
- 东莞方案工程师(3篇)
- 球阀维护保养课件
- 电采暖工程安装方案(3篇)
- 安全文明施工培训安排课件
- 舌癌手术护理配合
- 《纪录片创作理论与实践》- 教学大纲(48学时)
- 江西美术出版社(赣美版)美术四年级上册全册课件
- 泌尿系结石 课件
- 【正版授权】 IEC 60512-26-100:2008/AMD1:2011 EN-FR Amendment 1 - Connectors for electronic equipment - Tests and measurements - Part 26-100: Measurement setup,test and reference arrangements and
- JBT 11699-2013 高处作业吊篮安装、拆卸、使用技术规程
- 屁屁辅助脚本
- 【顺丰集团财务共享中心运作问题与优化建议探析15000字(论文)】
- 食药环侦知识讲座
- GB/T 19520.21-2023电气和电子设备机械结构482.6 mm(19 in)系列机械结构尺寸第3-109部分:嵌入式计算设备的机箱尺寸
- 山东省海洋知识竞赛(小学组)考试题库大全-上(单选题汇总)
评论
0/150
提交评论