VQ语音信号处理第4章.ppt_第1页
VQ语音信号处理第4章.ppt_第2页
VQ语音信号处理第4章.ppt_第3页
VQ语音信号处理第4章.ppt_第4页
VQ语音信号处理第4章.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

矢量量化的基本原理问题分解,第四章矢量量化,1.矢量量化基本原理,量化分为两类:*标量量化:将取样后的信号值逐个地进行量化。*矢量量化:将若干取样信号分成一组,即构成一个矢量,然后对此矢量一次进行量化。矢量量化(VQ,VectorQuantization)是一种极其重要的信号压缩方法。VQ在语音信号处理中占十分重要的地位。广泛应用于语音编码、语音识别和语音合成等领域。凡是要用量化的地方都可以采用矢量量化。,VQ的定义,K维欧几里德空间中的任意矢量X到K维空间有限子集Y的映射,术语,码本Codebook码字CodeWord码本大小CodebookSizeVoronoiCell胞腔,矢量量化简约历史早在50和60年代就被用于语音压缩编码。70年代线性预测技术被引入语音编码后,矢量量化技术才活跃起来。70年代末,Linda,Buzo等人解决了码本生成问题80年代初,矢量量化技术的理论和应用研究得到迅速发展。,采用矢量量化的压缩作用对信号波形或参数进行压缩处理,可以获得很好的效益,使存储要求、传输比特率需求或和计算量需求降低.量化压缩案例10KHz,16-bitPCM160,000bps100spectralvectorsofdimensionp=101001032=32,000bps51VQ:1024codebook10010=1000bps321,采用矢量量化的效果优于标量量化的原因?,矢量量化能有效的应用矢量中各分量之间的四种相互关联性质来消除数据中的冗余度。线性依赖(相关性)非线性依赖(统计不独立)概率密度函数的形状矢量量化的维数而标量量化仅能利用线性依赖和概率密度函数的形状来消除冗余度。,矢量量化研究的目的?,针对特定的信息源和矢量维数,设计出一种最优化的量化器,在R(量化速率)一定的情况下,给出的量化失真尽可能接近D(R)(最小量化失真)。,矢量量化的形象说明以K2进行说明:当K2时,所得到的是二维矢量。所有可能的二维矢量就形成了一个平面。记为(a1,a2),所有可能的(a1,a2)就是一个二维空间。如图7-1(a)所示,图7-1矢量量化概念示意图,图7-2矢量量化系统的组成,工作过程:在编码端,输入矢量Xi与码书中的每一个码字进行比较,分别计算出它们的失真。搜索到失真最小的码字的序号(或该码字所在码书中的地址),这些序号就作为传输或存储的参数。在恢复时,根据此序号从恢复端的码书中找出相应的码字。由于两本码书完全相同,此时失真最小,所以就是输入矢量Xi的重构矢量。,特点:传输存储的不是矢量本身而是其序号,所以据有高保密性能收发两端没有反馈回路,因此比较稳定矢量量化器的关键是编码器的设计,译码器只是简单的的查表过程。,VQ的优、劣势,自由构造量化区域的形状码本大小可随意选择量化失真码本存储,一、如何划分M个区域边界方法是:将大量欲处理的信号的矢量进行统计划分,进一步确定这些划分边界的中心矢量值来得到码书。二、类中心计算方法三、两矢量的相似度测度这个测度就是两矢量间的距离,或以其中某一矢量为基准时的失真度。它描述了当输入矢量用码书所对应的矢量来表征时所付出的代价。四、如何准备码本训练集完备性:根据具体应用而定,2.VQ问题分解,失真测度是矢量量化和模式识别中一个十分重要的问题,选择合适与否直接影响系统的性能。,失真是将输入信号矢量用码书的重构矢量来表征时的误差或所付出的代价。这种代价的统计平均值(平均失真)描述了矢量量化器的工作性。,3.失真测度,失真度选择必须具备的特性必须在主观评价上有意义,即小的失真应该对应于好的主观语音质量;必须是易于处理的,即在数学上易于实现,这样可以用于实际的矢量量化器的设计;平均失真存在并且可以计算;易于硬件实现失真测度主要有均方误差失真测度(即欧氏距离)、加权的均方误差失真测度、板仓斋藤(ItakuraSaito)距离,似然比失真测度等,还有人提出的所谓的“主观的”失真测度。,一、欧氏距离均方误差设输入信号的某个K维矢量X,与码书中某个K维矢量Y进行比较,xi,yi分别表示X和Y中的各元素,则定义均方误差为欧氏距离:,几种其他常用的欧氏距离:,r方平均误差,2.r平均误差,3.绝对值平均误差,4.最大平均误差,二、线性预测失真测度,用全极模型表示的线性预测方法,广泛应用于语音信号处理中。它在分析时得到的是模型的预测系数.仅由预测系数的差值,不能完全表征这两个语音信息的差别。应该直接由这些系数所描述的信号模型的功率谱来进行比较。,当预测器的阶数,信号与模型完全匹配时,信号功率谱为:,信号的功率谱,预测误差能量,预测逆滤波器的频率响应,相应的,设码书中某重构矢量的功率谱为,则定义Itakura-Saito距离为,这种失真测度是针对线性预测模型、用最大似然准则推导出来,所以特别适用于LPC参数,描述语音信号的情况,常用于LPC编码中。我们由此又推导出两种线性预测色失真测度,他们比上述具有更好的性能,即,对比似然比失真测度,模型失真测度,注:这两种失真测度都仅仅比较两矢量的功率谱,而没有考虑其他能量信息。,三、识别失真测度,失真测度的定义,加权因子,输入信号矢量的归一化能量,码书重构矢量的归一化能量,当两矢量的能量接近时(即),忽略能量差异引起的影响;当两矢量能量相差很大时,即进行线性加权;而当能量差超过门限时,则为固定值,4.最佳矢量量化器和码本的设计,最佳设计就是使失真最小,1、最佳划分,2、最佳码书,一、矢量量化器最佳设计的两个条件,最佳矢量量化器满足的两个必要条件,1)Voronoi分割条件(最近邻准则),对信号空间的分割应满足,根据该条件可以对信号空间进行最佳划分,得到的称为一个胞腔,2)Centroid质心条件,子空间分割固定后,Voronoi胞元的质心就是量化器的码字,对于一般的失真测度和信源分布,很难找到质心的计算方法,但对于一般的分布和常用的均方失真测度,可以证明,是中包含的矢量个数,二、LBG算法K-meansclusteringalgorithm,1980年由Linde,Buzo和Gray提出,它是标量量化器中Lloyd算法的推广,在矢量量化中是一个基本算法。,LBG算法由于其理论上的严密性、应用上的简便性以及较好的设计效果,得到了广泛的应用,并常被作为各种改进算法的基础,LBG算法步骤,第一步:初始化,给出训练VQ码书所需的全部参考矢量X,X的集合用S表示;设定量化级数,失真控制门限,算法最大迭代次数L以及初始码书;设总失真;迭代次数的初始化为m1,第二步:迭代,2)计算失真:,1)根据最近邻准则将S分成N个子集,即当时,下式成立:,4)计算相对失真改进量:,3)计算新码字,将与失真门限值进行比较。若则转入6)否则转入5);,5)若则转至6),否则m加1,转至1),第三步:结束,6)得到最终的训练码书,,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论