数字信号处理--变声器报告_第1页
数字信号处理--变声器报告_第2页
数字信号处理--变声器报告_第3页
数字信号处理--变声器报告_第4页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品文档数字信号处理 - 变声器报告1 项目目标:把自己(男)的声音分别变成小孩的声音、女人的声音和老人的声音。2 变声原理 : 语音科学家将人类发声过程视作一个由声门源输送的气流经以声道、口、鼻腔组成的滤波器调制而成的。人类语音可分为有声语音和无声语音, 前者是由声带振动激励的脉冲信号经声腔调制变成不同的音, 它是人类语言中元音的基础,声带振动的频率称为 基频。无声语音则是声带保持开启状态,禁止振动引发的。一般来说,由声门振动决定的基频跟说话人的性别特征有关, 如下表,而无声语音则没有体现这个特征。 说话人的个性化音色和语音的另外一个声学参数 共振峰频率的分布有关。 儿童由于声道短,其共振峰

2、频率高于成年人, 成年女性的声道一般短于成年男性,所以女性的共振峰频率一般高于男性。表 男声、女声和童声基频、共振峰频率关系表人群基频分布 Hz共振峰频率分布男声50,180偏低女声160,380中童声400,1000偏高由上可知,在进行性别变声时, 主要考虑基频和共振峰频率的变化。当基频伸展,共振峰频率也同时伸展时,可由男声变成女声,女声变成童声;反之,基频收缩,共振峰频率也同时收缩时,则由童声变女声,女声变男声。为了获得自然度、真实感较好的变声效果,基1欢迎下载。精品文档频和共振峰频率通常必须各自独立地伸缩变化如图 1。v1 童女声区率男声频v2峰声区振共区基频V1男声变童声V2男声变女声

3、图 1 基频和共振峰频率分布的变化共振峰频率的改变是基于重采样实现的 ,从重采样原理知道,这也同时引发了基频的变化, 为保证基频变化和共振峰频率变化的独立、互不相关, 在基频移动时必须考虑抵消重采样带来的偏移,理论上只要基频检测足够精确, 确实可以保证基频改变和共振峰频率改变间的互不相关。3 设计方案:1 录入自己(小孩、女人、老人)的一段声音 2 用 MATLAB 做 fft 得到其频谱 3 做 fft 频谱分析 4 搬移和改变基频、语速,实现变声4 程序流图2欢迎下载。精品文档5 程序清单:元语音信号s,fs,nbits = wavread(wo.wav);%载入语音 ss = s/max

4、(s);%归一化L = length(s);%读入语音长度S=fft(s,L);pigureubplot(2,1,1);plot(s);title(原语音信号波形 );ubplot(2,1,2);plot(abs(S);title(原语音信号频谱 );3欢迎下载。精品文档变声:小孩的声音clear all,close all, clc;% 定义常数FL =80;%帧长WL = 240;%窗长P = 10;%预测系数个数s,fs,nbits = wavread('wo.wav');%载入语音s4欢迎下载。精品文档s = s/max(s); %归一化L = length(s);%读

5、入语音长度FN = floor(L/FL)-2;%计算帧长% 预测和重建滤波器exc = zeros(L,1);%激励信号zi_pre = zeros(P,1);%预测滤波器的状态s_rec = zeros(L,1);%重建语音zi_rec = zeros(P,1);% 变调不变速滤波器exc_syn_t = zeros(L,1);%合成的激励信号s_syn_t = zeros(L,1);%合成语音last_syn_t = 0;%存储上一个(或多个)段的最后一个脉冲的下标zi_syn_t = zeros(P,1);%合成滤波器的状态hw = hamming(WL);%汉明窗% 依次处理每帧语音

6、 for n = 3:FN% 计算预测系数s_w = s(n*FL-WL+1:n*FL).*hw;%汉明窗加权后的语音A E = lpc(s_w, P);%用线性预测法计算P 个预测系数% A 是预测系数, E 会被用来计算合成激励的能量s_f = s(n-1)*FL+1:n*FL);%本帧语音,下面就要对它做处理5欢迎下载。精品文档% (4) 用 filter 函数 s_f 计算激励,注意保持滤波器状态exc1,zi_pre = filter(A,1,s_f,zi_pre);exc(n-1)*FL+1:n*FL) = exc1; %计算得到的激励% (5) 用 filter 函数和 exc

7、重建语音,注意保持滤波器状态s_rec1,zi_rec = filter(1,A,exc1,zi_rec);s_rec(n-1)*FL+1:n*FL) = s_rec1; %计算得到的重建语音% 注意下面只有在得到 exc 后才会计算正确s_Pitch = exc(n*FL-222:n*FL);PT = findpitch(s_Pitch);%计算基音周期PTG = sqrt(E*PT);%计算合成激励的能量G% (13)将基音周期减小一半,将共振峰频率增加7000Hz,重新合成语音PT1 =floor(PT/2);%减小基音周期poles = roots(A);deltaOMG = 700*

8、2*pi/8000;for p=1:10%增加共振峰频率,实轴上方的极点逆时针转,下方顺时针转if imag(poles(p)>0 poles(p) = poles(p)*exp(j*deltaOMG);elseif imag(poles(p)<0 poles(p) = poles(p)*exp(-j*deltaOMG);endendA1=poly(poles);tempn_syn_t = 1:n*FL-last_syn_t'exc_syn1_t = zeros(length(tempn_syn_t),1);exc_syn1_t(mod(tempn_syn_t,PT1)=0

9、) = G; %某一段算出的脉冲exc_syn1_t = exc_syn1_t(n-1)*FL-last_syn_t+1:n*FL-last_syn_t);6欢迎下载。精品文档s_syn1_t,zi_syn_t = filter(1,A1,exc_syn1_t,zi_syn_t);exc_syn_t(n-1)*FL+1:n*FL) = exc_syn1_t;%计算得到的合成激励s_syn_t(n-1)*FL+1:n*FL) = s_syn1_t;%计算得到的合成语音last_syn_t = last_syn_t+PT1*floor(n*FL-last_syn_t)/PT1);endS=(s_s

10、yn_t,L)%变调不变速figure;subplot(2,1,1), plot(exc_syn_t), xlabel('n (samples)'), ylabel('Amplitude'), title('合成高调激励信号 ') ,XLim(0,length(exc_syn_t);subplot(2,1,), plot(abs(S)) ), title('合成高调语音信号频谱'), XLim(0,length(s_syn_t);sound(s_syn_t);7欢迎下载。精品文档女人的声音把上面程序中的(deltaOMG = 70

11、0*2*pi/8000;)改为( deltaOMG = 100*2*pi/8000;)8欢迎下载。精品文档老人的声音clear all,close all, clc;% 定义常数FL =80;%帧长9欢迎下载。精品文档WL = 240;%窗长P = 10;%预测系数个数s,fs,nbits = wavread('wo.wav');%载入语音ss = s/max(s); %归一化L = length(s);%读入语音长度FN = floor(L/FL)-2;%计算帧数% 预测和重建滤波器exc = zeros(L,1);%激励信号zi_pre = zeros(P,1);%预测滤波

12、器的状态s_rec = zeros(L,1);%重建语音zi_rec = zeros(P,1);% 变速不变调滤波器v=.38;exc_syn_v = zeros(vL,1);%合成的激励信号s_syn_v = zeros(vL,1);%合成语音last_syn_v = 0;%存储上一个(或多个)段的最后一个脉冲的下标zi_syn_v = zeros(P,1);%合成滤波器的状态hw = hamming(WL);%汉明窗% 依次处理每帧语音 for n = 3:FN% 计算预测系数(不需要掌握)s_w = s(n*FL-WL+1:n*FL).*hw;%汉明窗加权后的语音A E = lpc(s_

13、w, P);%用线性预测法计算P 个预测系数% A 是预测系数, E 会被用来计算合成激励的能量s_f = s(n-1)*FL+1:n*FL);%本帧语音,下面就要对它做处理% (4) 用 filter 函数 s_f 计算激励,注意保持滤波器状态exc1,zi_pre = filter(A,1,s_f,zi_pre);exc(n-1)*FL+1:n*FL) = exc1; %计算得到的激励% (5) 用 filter 函数和 exc 重建语音,注意保持滤波器状态s_rec1,zi_rec = filter(1,A,exc1,zi_rec);。10欢迎下载精品文档s_rec(n-1)*FL+1:

14、n*FL) = s_rec1; %计算得到的重建语音% 注意下面只有在得到 exc 后才会计算正确 s_Pitch = exc(n*FL-222:n*FL);PT = findpitch(s_Pitch);%计算基音周期PT(不要求掌握)G = sqrt(E*PT);%计算合成激励的能量G(不要求掌握)% (11)不改变基音周期和预测系数,将合成激励的长度增加一倍,再作为filter% 的输入得到新的合成语音,听一听是不是速度变慢了,但音调没有变。FL_v = floor(FL/v);tempn_syn_v = 1:n*FL_v-last_syn_v'exc_syn1_v = zero

15、s(length(tempn_syn_v),1);exc_syn1_v(mod(tempn_syn_v,PT)=0) = G; %某一段算出的脉冲exc_syn1_v = exc_syn1_v(n-1)*FL_v-last_syn_v+1:n*FL_v-last_syn_v);s_syn1_v,zi_syn_v = filter(1,A,exc_syn1_v,zi_syn_v);last_syn_v = last_syn_v+PT*floor(n*FL_v-last_syn_v)/PT);exc_syn_v(n-1)*FL_v+1:n*FL_v) =exc_syn1_v; %计算得到的加长合成

16、激励s_syn_v(n-1)*FL_v+1:n*FL_v) = s_syn1_v;%计算得到的加长合成语音endS=fft( s_syn_v,L ) ;%变速不变调figure;subplot(2,1,1), plot(s_syn_v), xlabel('n (samples)'), ylabel('Amplitude'), title('合成慢速语音信号 '),subplot(2,1,2), plot(abs(S) ), title('合成慢速语音信号频谱'),sound(s_syn_v);。11欢迎下载精品文档6 操作界面操作说明。12欢迎下载精品文档操作界面如上图( 1)点击按钮“录音”表示开始录音; “原声”按钮表示播放录入的声音;( 2)“小孩

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论