



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.3带宽扩展的基本方法 首先有个待限语音信号snb(n),和窄带激励信号enb(n),然后从窄带激励信号enb(n)中生产处宽带激励信号ebb(n).下一步就是用估计的宽带谱包络来对宽带激励信号进行频谱整形。原始信号是窄带语音信号,因此需要一个高通滤波器来除掉冗余的频率分量。最后,估计得到的高频成分结合原始窄带信号中的低频成分得到宽带语音信号,实现了带宽扩展。3.1线性预测分析 基本思想:语音信号的每个取样值都能够用过去若干个取样值的线性组合(预测值)来逼近,通过最小化是基于语音信号取样值和线性预测值之间的均方误差,赖觉决定一组预测器的系数。为明确语音信号的时段和平均平方误差,本文提供了两种方法:方法自相关方法协方差方法适用条件限制输入的语音信号限制平均平方误差做法用长度是N的矩形窗用长度是N的矩形窗矩阵特性对称并且是Toeplitz结构对称;在计算误差范围外的语音采样点也是需要的 3.2谱包络的参数表示1.自回归系数(AR):用离散时变滤波器来模拟嘴和鼻窍,适用于语音编码和语音分析,2倒谱系数:语音信号是激励信号和声道响应卷积得来的,利用倒谱法可以分别计算每个源信号和参数对语音的影响,倒谱法是对语音信号求FFT,然后在对其求对数,再求逆运算。3.MFCCs:是利用人的听觉系统,人类对单个音调的感知强度与MEL频域的对数成正比;当同时发出两个频率相近的音调时,人类只能识别一个,一次两个频率必须相差一定带宽时,一定要有临界带宽。MFCC求取过程:a、语音信号的预处理:对语音进行预加重、有音无音检测、分帧及加窗处理、得到可以用于提取特征参数的语音向量。b、对已经预处理的语音向量进行DFT;c、将上步得到的离散频谱用序列三角滤波器进行滤波处理,得到一组系数;d、利用DCT将滤波器输出变换到倒谱域。MEL尺度把声音信号的频域空间向人的感知的频域空间进行映射,以使滤波器的空间尺度接近人类听觉的感知尺度。在语音频带扩展方面,MFCCs不如LPC及倒谱系数;在语音识别方面MFCCs却比LPC及倒谱系数更有优势。4、线谱频率:在对频率量化时LFS的稳定性要好于LPC33标量语音特性这些特性独立于谱包络:过零率:包含了一帧内信号穿过过零电平的次数信息,清音和噪音的过零率较高,浊音的过零率较低。梯度指数:这个特型描述了关于信号方向改变的信息,在没有很大起伏的浊音帧时,梯度指数的值很小,在清音帧时,梯度指数很大。基音频率:其语发音者的性别有关,提取基频的基本方法是自相关法:语音的短时自相关函数在基音周期的整数倍点上有很大的峰值,只要找到最大峰值点的位置,便能估计出基音周期。问题是最大峰值点的位置有时不能同基音周期相吻合,原因是a、可能是因为窗的长度太短,一般认为窗长至少应大于两个基音周期,才有好效果,语音中最长基音周期约为20ms,因此窗长应大于40ms。b、可能是声道特性的影响,主要是省道共振峰的影响,解决问题是用电平消波法,消波电平的确定方法:将输入的语音数据分为3个等长的子帧,分别在第一和第三子帧中寻找最大波峰值,消波电平取为两个峰值中较小的峰值和一个比例因子的乘积。峰度:无量纲,一般浊音的峰度较低,在爆破音和元音的开始,局部峰度有很大的峰值,局部峰度很难区分强的浊音和清音,因此一般不用这个特性。谱质心:谱质心定义为带限语音幅度谱的重心,谱质心的取值范围是01,谱质心的大小主要取决于语音的浊音,对于浊音,谱质心的值是0.28左右。基于能量特征:主要是在标量上可以整个语音的平均值。能够区分语音与停顿;能够区分元音和擦音,元音擦音;可以运用在标量和矢量上。归一化帧能量:在长期的估计中通过归一化短时能量,可以消除由于不同说话人、不同的记录和传播环境带来的能量差别。相对帧能量:依于噪声检测,主要应用于背景噪声。归一化相对帧能量:独立于短时能量的差异高通能量与低通能量的比值:用于区分清浊音,对清音此值很增大,应用的是高通滤波器与低通滤波器的比值,来保证系统的稳定性。3.4距离测量 在语音质量的测评,语音编码的码本训练,频带扩展和码书的研究都有重要作用。对数谱偏差:主要比较谱包络对数谱的均方根偏差:倒谱距离:似然比距离:其他的谱距离测量:人类感觉系统的特性:频率越高,人类的分辨率越低;如果估计谱的幅度高于原始谱的幅度,就会有人工语音的产生4激励信号的扩展4.1窄带激励信号的估计从窄带语音信号中提取出窄带激励信号,首先运用低阶的预测误差滤波器来移动谱包络,也可以估计出窄带谱包络,窄带激励信号运用在时间域内,若要要运用在频域,可以运用DFT/FFT来转换到频域4.2用非线性特性扩展窄带激励信号1、Half-way rectificationa、信号的平均值不在为0;b、不在节省能量;c、可能产生含有基带频率的谐波。2、Full-way rectificationA、信号的平均值不在是0;B、可节省能量;C、产生不包含基带频率的谐波信号。3、Quadratic characteristic(二次特征)A、输出平均值不再是0;B、改变信号的能量;C、产生不含基带频率的谐波信号。4、cubic characteristic(立方特性)A、如果输入信号是0均值且是对称的密度分布,则其输出也是0均值;B、不能节能;C、产生包含基带频率的三次谐波、5、Tanh characteristic(双曲正切)A、如果输入是0均值且是对称密集分布,则其输出也是0均值;B、函数不是能量节省;C、产生包含基带频率的几次谐波。6、Benesty characteristic()A、不能节能;B、即使输入是0均值且对称密度分布,其输出也不是0均值;C、产生包含基带频率的谐波信号。7、Adaptive quadratic characteristic(自适应二次特征)自适应二次特征是应用线性和二次方的组合,其目的是限制输出的最大值和最小值。A、 由于输入信号的幅度是跟踪的,则其就不会被裁剪;B、 低功率和高功率的输入都会被相同的非线性方式处理C、 自适应二次特征超越其他的方式。4.3应用频谱迁移或调制技术来进行扩展4.3.1固定频谱偏移固定频谱偏移也就是用一个固定的频谱偏移量进行迁移,在高的和低的扩展区域内可以各自选择重复的频域段。然而选择高频域段扩展的开始频域指针时,需要注意的是不要超过电话带宽所允许的最高带宽限制和乃奎斯特限制。它的一个缺点是在宽展范围内相位信息也需要扩展,但可能不正确就会产生听觉的人工制造。4.4应用函数发生器进行扩展1、用正弦发生器对浊音进行扩展2、用白噪声发生器对清音进行扩展4.4.1正弦发生器1、需要进行基音信号估计,工作在时间域2、正弦发生器的参数(幅度、频率)的获得:如果不是白信号的话,采用估计的带宽品谱包络来决定幅值、基音频率、谐波。正弦发生器的优点:A、幅值和频率的实际值和幅值和频率的理想值是不同的;B、由于是时间域处理,则在低频率阶段相位的节约产生的假音不会出现;C、不需要每个采样点或帧的基带频率的估计值,而是需要任何可靠地估计值。4.4.2白噪声发生器用于扩展清音信号,不需要任何的基音信息,由于清音信号在低的扩展区域内有较低的功率,所以用于扩展较低的区域是不合适的,但如果用于浊音(较低区域内),也会产生令人烦恼的人噪音,白噪声发生器是由一组移位寄存器产生的合适的长度的伪噪声序列,其值的范围是(0,1)。4.5功率调整运用非线性特性的算法都不是节省功率的,因此调整宽展激励信号的功率是必要的。4.6总结扩展激励信号的最重要的问题是功率调整,估计宽带激励信号的功率与真实的稍微有点偏差就会影响听觉,并产生烦人的人工音。在上部延伸区域与基音的不匹配不会影响质量,但是在低扩展区域内的估计宽带激励信号的基音不匹配将会严重影响语音质量。在低扩展区的另一个问题是合成信号的相位。由于本算法是基于块处理,那么在语音从一帧到另一帧是就会出现香味的不连续
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家庭农场市场准入与竞争力提升路径
- 幼儿教师心理素质与情感教育能力的提升途径
- 促进钢铁产品多元化与高附加值发展
- 项目驱动教学法在工程力学课程中的实施策略
- 石油化工企业创新资源配置与市场竞争力提升机制
- 农产品冷链物流成本管控与效益提升策略
- 促进招标投标过程中的利益相关方协同机制
- 优化固定资产盘点数据采集与记录的准确性
- 工程力学教学中消防救援技能培养的实践路径
- 钢铁产业生产与管理信息化升级
- 激光SLAM中的动态物体剔除算法研究及其性能评估
- 膝关节鹅足炎诊断
- 超声在肾结石中的诊断
- 基层应急管理培训课件
- 2024年司法协理员招聘考试题库及答案
- DB61-T 5061-2023 民用建筑有线电视系统工程技术规程
- 质量保障方案文案(3篇)
- 产科分娩风险管理制度
- DB61T-建设项目使用草地现状调查技术规范
- 安徽省房屋建筑和市政基础设施工程施工应用BIM技术招标投标评标办法实施导则(2025版)
- JG/T 375-2012金属屋面丙烯酸高弹防水涂料
评论
0/150
提交评论