成年人与老年人语音转换中期检查幻灯片_第1页
成年人与老年人语音转换中期检查幻灯片_第2页
成年人与老年人语音转换中期检查幻灯片_第3页
成年人与老年人语音转换中期检查幻灯片_第4页
成年人与老年人语音转换中期检查幻灯片_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1. 语音转换的定义2. 语音信号预处理3.语音参数提取4.语音训练5.转换后的语音 语音转换技术(VT, voice transform)是指改变一个说话人(源说话人,source speaker)的语音个性特征,是之具有另一个说话人(目标说话人, target speaker)的语音个性特征。语音包含许多信息,其中主要的是语义信息,另一个最重要的信息为语音的个性化信息。语音转化就是要保留语音的语义信息不变而改变语音的个性化信息。 根据左图,语音转换需要两个过程(1)训练过程:输入语音信号经过预处理后,语音信号的特征被提取出来,首先在此基础上建立的模板,这个过程叫做训练(2) 转换过程:系统

2、利用训练后的转换规则,用源说话人的参数来预测目标说话人的参数,最后利用预测参数来合成出转换后的语音。左图为预经过预加重处理的一段语音信号预加重处理的目的是为了对语音的高频部分进行加重,去除口唇辐射的影响。通过传递函数为H(z)=1-az-1的一阶FIR高通数字滤波器来实现语音信号的预加重处理(a为预加重系数,0.91.0)分帧一般采用交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移,帧移与帧长的比值一般取为01/2。Function Sn=enframe(s)% 计算语音分帧后的帧数 nf=fix(length(xx)-256+80)/80)% 设定

3、分帧后的帧长和步长Sn=zeros(nf,256)Indf=80*(80;(nf-1)Indf=(1:256)Sn(:)=S(indf(:,ones(1,256)+inds(ones(nf,1),:1)% 加入汉明窗For i=1:nfSn=sn(i,:).*hamming(256)end 实现语音转换的核心在于提取语音特征参数各声学参数对语音个性特征的贡献大小,学术内部也是各述己见。Matsumoto 研究认为基音频 率的贡献最大,其次是共振峰频率;Furui则认为由倒谱系数得到的平均谱包络贡献最大,其次为基音频率;Itoh等认为频谱包络贡献最大,基音频率位列第二。 s(n) 声声 道道 参

4、参 数数 清清 音音 / /浊浊 音音 开开 关关 G 周周 期期 脉脉 冲冲 发发 生生 器器 随随 机机 噪噪 声声 发发 生生 器器 基基 音音 周周 期期 时时 变变 数数 字字 滤滤 波波 器器 图图6.2 语语 音音 产产 生生 的的 数数 字字 模模 型型 简简 化化图图 本次毕业设计,我所提取的是线性预测参数(LPC)线性预测参数不仅反映了它的预测功能,而且它提供了一个非常好的声道模型及模型参数估计方法 从语音信号中分辨出语音信号和非语音信号,是语音处理的一个基本问题。利用基于能量和过零率的语音端点检测方法两级判决法及程序实现通过转换算法进行语音分析,提取语音模型参数,之后将相

5、同的参数聚集在一起作为训练数据。转换函数描述的是源说话人与目标说话人参数之间的统计关系。在孤立词语音识别中,最为简单有效的方法是采用DTW算法,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法,用于孤立词识别。HMM算法在训练阶段需要提供大量的语音数据,通过反复计算才能得到模型参数,而DTW算法的训练中几乎不需要额外的计算。所以在孤立词语音识别中,DTW算法仍然得到广泛的应用 首先用wavread函数读入wav文件,用lpc函数获得其lpc参数,用vad函数对其进行端点检测,并保存语音部分的lpc参数到参考模板的结构数组ref(i).lpc中或测试模板的结构数组tes

6、t(i).lpc中。 模板匹配阶段,计算所有测试模板和参考模板之间的距离,保存到距阵dist中,将最后的匹配分数用min 函数找到最小值对应的模板。 通过DTW算法对每个孤立字进行操作,分别得到这些孤立字的最小欧氏距离模板,以这个模板作为转换规则替换保存原孤立字LPC参数的矩阵,合成出转换后的语音转换后的老年人声音 :syn_old man.wav转换后的成年人声音:syn_young man.wav【1】吴晓平 .基于DTW的语音识别系统【J】.电子与信息学报.2004 【2】王华鹏. 利用MATLAB提取MFCC系数【J】.中国人民公安大学学报.2008 【3】杨洪辰. 声纹识别特征MFCC提取方法研究【J】.中国人民公安大学学报.2005【4】柳春. 语音合成技术研究【J】.西北工业大学学报. 2008 【5】赵博. MATLAB 在语音分析中的应用【J】.计算机系统应用.2005【7】蔡莲红. 用于语音合成的算法简介【

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论