数字变声器设计方案_第1页
数字变声器设计方案_第2页
数字变声器设计方案_第3页
数字变声器设计方案_第4页
数字变声器设计方案_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于FFT算法的数字喇叭河北北方学院宣化教部河北宣化。摘要本数字变声器是一个男性变性人性、女性变性人性、以及同性的系统。设计本数字变声器的目的是锻炼自己的学习实践能力。通过Matlab程序修改语音参数,实现男性女性之间的转换。关键词变音算法数字滤波器语音信号数字滤波器频谱分析MATLAB1引言变声器在现实生活中广泛使用,变声器是改变输入音频的音调、音调、变音后输出音频的工具。根据变声器材料,变声器分为变声器硬件和变声器软件。变声器硬件,即通过硬件实现变声的工具;变声器软件,即通过软件实现变声的工具、软件类变声器、操作平台都是电脑系统。无论是硬件变声还是软件变声,其原理都是通过改变输入声音频率,

2、改变声音的音调、音调,使输出声音在感官上与原来的声音不同。我们每个人的声音都有不同的音调,所以我们说的男中音,男高音,音调不同,但是即使音调一致,我们仍然能分辨两个不同人的声音或不同乐器的声音。这就是音色的差异。变声器是通过对声音的音调和音调的双重复合变化实现输出声音的变化。我们这里的变声就是实现MATLAB牙齿变声。2数字语音转换器原理和算法包括发音方法、发音时喉、口、鼻切除气流的方式和状态、发音时形成障碍和克服障碍的方式、棋类强弱、声带是否震动等多个茄子方面。人的声音可以分为380个声音和静音语音,前者由声带振动刺激的脉冲信号通过声腔徐璐变成其他音,它是人类语言的元音基础,声带振动的频率称

3、为基本频率。无声的声音是声带打开,禁止振动引起的。一般来说,声门振动决定的基本频率与说话者的性别特性有关,无声的声音没有反映牙齿特性,如下表所示。说话者的个性化音调与语音的另一个音响参数共振峰频率的分布有关。儿童频道短,因此谐振杆频率高于成人,成年女性的频道通常比成年男性短,因此女性的谐振杆频率一般高于男性。本实验根据男生录制的声音提取相关参数,修改接近女声、同音、老人音的声音,实现音调的高低和速度的1。变星原理进行性别变声时,主要考虑基音周期、基波、共振峰频率的变化。如果基音周期发生变化,基音频率和共振峰会同时发生变化,如果拉伸现有的男女,就会成为女性变动,反之亦然。本实验是根据男生录制的声

4、音提取相关参数,修改接近女性化的声音,实现从男性到女性的转换。音调特征:描述声音的音调特征。特征参数主要包括俯仰频率、共振峰位置,共振峰带宽,基音频率,能量等。超音速:描述语音的韵律特征。特征参数主要包含元素长度、螺距频率变化(吨)、能量等语言特征:包括习语、方言、语调等。音高是指发出浊音时声带震动移动引起的周期性,俯仰周期是指声带振动频率的倒数。俯仰周期是语音信号最重要的参数之一,并描述了语音激励的重要特征。每个人,还有同一个人,不同的年龄组有不同的基音周期。人唱歌时,音调频率范围大约是儿童音高音频率范围260-880Hz,低音频率范围是196-700Hz,女性高音频率范围是220-1.1K

5、Hz,低音频率范围是200-700Hz,男性性高音频率范围是160-也称为声调首先,讨论了如何通过实时基音频率的变化实现语音变性,并讨论了Matlab实现算法。男性基本频率分布(HZ):50-180共振峰频率分布:低群众女性基本频率分布(HZ):160-380共振峰频率分布:中提取参数(1)语音时变傅里叶变换:低通滤波器使用巴特沃斯滤波器。(2)巴特沃斯低通滤波器的构建根据人的说话特征,设定相应的指标参数,对牙齿段落的语音设计,标准化巴特沃斯模拟滤波器的顺序、截止频率、低通原型系统函数。牙齿语音设计按如下方式计算巴特沃斯模拟滤波器的阶N牙齿5,3dB截止频率,0.175,正则化低通原型系统函数

6、:其中带人去取低通滤波器。各种理想数字滤波器的幅度和频率响应流程图3数字喇叭软件实现和模拟结果代码部分选择音频档案filename,pathname=uigetfile (* .wav,all files,select voice file);ifise qual(文件名路径名,0,0)Return终端str=pathname filename;temp,fs=音频前导码(str);Temp1=resample(temp,80,441);Handles.y1=tempHandles.y=temp1Handles。Fs=FsGuidata(hObject,handles);原音播放C=handl

7、es。fs;Sound(handles.y1,c);Plot(handles.axes1,handles.y1)标题(handles.axes1,时区);ysize=size(handles . y1);Y1=FFT (handles.y,length(handles . y1);ysize=size(y1);Plot (handles.axes2,ABS(y1(13360 ysize/2);Xlabel(handles.axes2,频率);Ylabel(handles.axes2,振幅);标题(handles.axes2,频率特性);男性声音变成女性FL=80WL=240P=10X1=han

8、dles.yFs=handles。fs;X1=resample (x1 (:1),8000,fs);Fs=8000X1=x1 0。* randn(长度(x1),1);x1=x1/max(x1);L=长度(x1);FN=floor(L/FL)-2;Exc=零(l,1);Zi _ pre=零点(p,1);X1 _ rec=零点(l,1);Zi _ rec=零点(p,1);Exc _ syn=零(l,1);X1 _ syn=零点(l,1);last _ syn=0;Zi _ syn=零点(p,1);Exc _ syn _ t=零(l,1);X1 _ syn _ t=零点(l,1);last _ sy

9、n _ t=0;Zi _ syn _ t=零点(p,1);Hw=汉明(wl);For n=3:FNx1 _ w=x1(n * FL-WL 13360n * FL)。*硬件;A E=lpc(x1_w,P);x1 _ f=x1(n-1)* FL 13360n * FL);exc1,zi _ pre=过滤器(a,1,x1 _ f,zi _ pre);exc(n-1)* FL 13360n * FL)=ex C1;x1 _ rec1,zi _ rec=过滤器(1,a,exc1,zi _ rec);x1 _ rec(n-1)* fl 13360n * fl)=x1 _ re C1;x1 _ pitch=

10、exc(n * fl-223360n * fl);PT=find Pitch(x1 _ Pitch);g=sqrt(E * PT);PT1=floor(PT/2);poles=roots(A);delta OMG=190 * 2 * pi/8000;For p=1:10ifimag(poles(p)0 poles(p)=poles(p)* exp(j * delta OMG);else ifimag(poles(p)0 poles(p)=poles(p)* exp(-j * delta OMG);终端终端A1=多边形(保罗);tempn _ syn _ t=1:n * fl-last _ sy

11、n _ t;Exc _ syn1 _ t=zeros(长度(tempn _ syn _ t),1);Exc _ syn1 _ t (mod (tempn _ syn _ t,pt1)=0)=g;exc _ syn 1 _ t=exc _ syn 1 _ t(n-1)* fl-last _ syn _ t 13360n * fl-last _ synx1 _ syn1 _ t,zi _ syn _ t=filter (1,a1,exc _ syn1 _ t,zi _ syn _ t);exc _ syn _ t(n-1)* fl 13360n * fl)=exc _ syn 1 _ t;x1 _

12、 syn _ t(n-1)* fl 13360n * fl)=x1 _ syn 1 _ t;last _ syn _ t=last _ syn _ TP t1 * floor(n * fl-last _ syn _ t)/pt1);终端Sound(x1_syn_t,fs)Plot(handles.axes1,x1 _ syn _ t);标题(handles.axes1,时区);Grid onysize=size(x1 _ syn _ t);Y=FFT (x1 _ syn _ t,长度(x1 _ syn _ t);ysize=size(y);Plot (handles.axes2,ABS(y(1

13、3360 ysize)Xlabel(handles.axes2,频率);Ylabel(handles.axes2,振幅);标题(handles.axes2,频率特性);女人的声音变成男人FL=80%帧长度WL=240%窗口长度P=10预测系数%数C=handles。fs;fs=c;S=handles.yS=resample(s(:1),8000,Fs);Fs=8000S=s 0。* rannn (length (s),1);s=s/max(s);规范化%l=length(s);读取%语音长度FN=floor(L/FL)-2;%计算帧数%预测和重建筛选器Exc=零(l,1);%激励信号Zi _

14、pre=零点(p,1);预测筛选状态%S _ rec=零点(l,1);%语音重建Zi _ rec=零点(p,1);%变速变速过滤器Exc _ syn _ t=零(l,1);%合成激发信号S _ syn _ t=零(l,1);%合成语音last _ syn _ t=0;%存储一个或多个上一段中最后一个脉冲的下标Zi _ syn _ t=零点(p,1);%复合滤镜状态Hw=汉明(wl);按%顺序语音处理For n=3:FN计算预测系数%s _ w=s(n * FL-WL 13360n * FL)。*硬件;% 1名窗口权重后的语音A,E=lpc(s_w,P);s _ f=s(n-1)* FL 133

15、60n * FL);%牙齿帧语音%计算激励exc1,zi _ pre=过滤器(a,1,s _ f,zi _ pre);exc(n-1)* FL 13360n * FL)=ex C1;%计算的重新配置的语音s _ rec1,zi _ rec=过滤器(1,a,exc1,zi _ rec);s _ rec(n-1)* fl 13360n * fl)=s _ re C1;s _ pitch=exc(n * fl-223360n * fl);PT=find Pitch(s _ Pitch);%节距周期pt计算g=sqrt(E * PT);%合成激发能量计算PT1=floor(PT/0.50);poles=roots(A);delta OMG=80 * 2 * pi/8000;for p=1336010 if imag(poles(p)0,poles(p)=poles(p)* exp(1i * delta OMG);Elseifimag (poles (p) 0,poles(p)=poles(p)* exp(-1i * delta OMG);终端终端A1=多边形(保罗);tempn _ syn _ t=(1:n * fl-last _ syn _ t);Exc _ syn1 _ t=zeros(长度(tempn _ syn _ t),1);Exc _ s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论