




已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
xxxx数字信号处理课程设计报告题目:基于matlab 的语音信号的特技处理 系 (院): 计算机工程学院 专 业: 通信工程 班 级: 通信xx班 学 号: xxxxxxxx 姓 名: xxx 指导教师: xxx 学年学期: 2009 2010 学年 第 1 学期2009年12月 18 日设计任务书课题名称基于matlab 的语音信号的特技处理设计目的1. 巩固所学的数字信号处理理论知识, 理解信号的采集、处理、传输、显示和存储过程;2. 综合运用专业及基础知识,解决实际工程技术问题的能力;3. 学习资料的收集与整理,学会撰写课程设计报告。实验环境1. 微型电子计算机(pc);2. 安装windows 2000以上操作系统,matlab等开发工具。任务要求1. 选择一个语音信号作为分析的对象,或录制一段各人自己的语音信号,并对其进行频谱分析; 然后在时域用数字信号处理方法将信号加入延时和混响, 再分析其频谱,并与原始信号频谱进行比较;最后设计一个信号处理系统界面。2. 利用课余时间去图书馆或上网查阅课题相关资料,深入理解课题含义及设计要求,注意材料收集与整理;3. 在第15周末之前完成预设计,并请指导教师审查,通过后方可进行下一步工作;4. 结束后,及时提交设计报告(含纸质稿、电子稿),要求格式规范、内容完整、结论正确,正文字数不少于3000字(不含代码)。工作进度计划序号起止日期工 作 内 容12009.12.142009.12.14在预设计的基础上,进一步查阅资料,完善设计方案。22009.12.142009.12.17设计总体方案,构建、绘制流程框图,编写代码,上机调试。32009.12.172009.12.18测试程序,完善功能,撰写设计报告。42009.12.18参加答辩,根据教师反馈意见,修改、完善设计报告。指导教师(签字): 年 月 日 摘要语音是人们交流思想和进行社会活动的最基本手段,我们要对语音信号进行测定并将其转变为另一种形式,以提高我们的通信能力。语音信号数字特技与时基压扩的概念近年来,随着计算机及大规模数字集成电路的迅速发展,语音数字信号处理得到了相应的发展。语音信号分析模拟、语音合成、语音识别等的研究已较成熟。各种声码器、声控器、语声识别系统、语声合成器等已逐渐有商品出现。语音数字特技处理是从语音信号数字处理中发展出来的一个新的分支,近年来开始逐渐为人们所重视。语音数字特技处理是一种用数字信号处理方法对语音信号进行某种变换、组合、压缩、扩展、合成、仿真的处理技术,以求得特殊的语音效果,如:语音变速重放、音调变换、语声伪造、仿真合成等等。语音数字特技处理作为一种新技术在国外广泛地被应用于广播、教育、文艺、公安等各个领域。关键词 matlab 语音信号 特技处理 频谱分析 目 录1 引言12 课题综述12.1 课题来源12.2 预期目标12.3 面对的问题及需解决的关键技术23 系统分析及设计23.1设计的总体方案图23.2涉及的基础知识33.2.1混响与延时33.2.2离散傅立叶变换43.2.3滤波器设计53.3解决问题的基本思路53.4 详细流程图54 代码编写65 程序调试95.1 调试过程与步骤95.2 发现的问题95.3 解决的办法96运行与测试106.1运行程序10结 论13致 谢14参 考 文 献15数字信号处理课程设计报告1 引言数字信号处理是随着计算机技术的发展而迅速发展起来的一门新兴而古老的学科,它在新的领域如生物医学工程、声学、雷达、地震不、语音通信、数据通信、核科学等学科发挥着重要的作用,而它所采用的各种方法及众多应用已有悠久的历史;同时也是一门具有很强的理论性与实践性,且理论和技术发展都十分迅速的前沿性学科。随着数字化时代的来临,科学技术的进步而生产发展需求的与日俱增,促进了数字信号处理学科的发展,产生了各种巧妙的信号处理算法;特别是计算机技术的飞速发展,为数字信号处理增添了巨大的生命力。数字信号处理主要是研究用数字或符号序列表示和处理信号。处理的目的可以是削弱信号中的多余内容,滤除混杂的噪声和干扰,或者是将信号变换为容易分析和识别的形式,便于估计和选择它的特征参数。例如通过分析和运算,可以估计脑电图或心电图中的某种特征参数,帮助医生查找病因和分析病情,确定合理的治疗方案;又如,信号在传输时,要受到各种干扰,包括失真、衰落和混入的背景噪声,信号处理要排除这些干扰。声音信号是一维连续信号,而计算机只能处理离散信号。为了从离散信号还原连续信号,根据采样定理,可以确定采样频率的最小值。wav文件是一种数字声音文件格式,本课程设计基于matlab分析了wav声音文件频谱与声音的关系。通过采集个人的一段声音进行频谱分析等处理,然后设计数字滤波器处理这个原始声音的wav文件,并比较滤波以后输出声音信号与原声音信号的异同。2 课题综述2.1 课题来源近年来,随着计算机及大规模数字集成电路的迅速发展,语音数字信号处理得到了相应的发展。语音信号分析模拟、语音合成、语音识别等的研究已较成熟。、各种声码器、声控器、语声识别系统、语声合成器等已逐渐有商品出现。2.2 预期目标选择一个语音信号作为分析的对象,或录制一段各人自己的语音信号,并对其进行频谱分析; 然后在时域用数字信号处理方法将信号加入延时和混响, 再分析其频谱,并与原始信号频谱进行比较;最后设计一个信号处理系统界面。2.3 面对的问题及需解决的关键技术1研究语音信号的特点;2探讨语音分析与识别、处理的基本理论基础、关键技术;3写出各步骤的matlab的程序代码;4分析采集的语音信号的时域波形与频谱;分析滤波前后语音信号的波形与频谱;5滤波器的设计可采用图形化设计工具fdatool和图形化信号处理设计工具sptool;3 系统分析及设计3.1设计的总体方案图利用windows下的录音机或其他软件,录制一段自己的语音信号,时间控制在1s左右,并对录制的信号进行采样语音信号的频谱分析,画出采样后语音信号的时域波形和频谱图将信号加入延时和混响,再分析其频谱,并与原始信号频谱进行比较几种特殊类型的滤波器:无限个回声滤波器,全通结构的混响器,并画出滤波器的频域响应。用自己设计的滤波器对采集的语音信号进行滤波分析得到信号的频谱,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化回放语音信图3-1 语音信号的特技处理设计方案框图3.2涉及的基础知识3.2.1混响与延时(1)混响效果主要是用于增加音源的融合感。自然音源的延时声阵列非常密集、复杂,所以模拟混响效果的程序也复杂多变。常见参数有以下几种:混响时间:能逼真的模拟自然混响的数码混响器上都有一套复杂的程序,其上虽然有很多技术参数可调,然而对这些技术参数的调整都不会比原有的效果更为自然,尤其是混响时间。高频滚降:此项参数用于模拟自然混响当中,空气对高频的吸收效应,以产生较为自然的混响效果。一般高频混降的可调范围为0.11.0。此值较高时,混响效果也较接近自然混响;此值较低时,混响效果则较清澈。扩散度:此项参数可调整混响声阵密度的增长速度,其可调范围为010,其值较高时,混响效果比较丰厚、温暖;其值较低时,混响效果则较空旷、冷僻。预延时:自然混响声阵的建立都会延迟一段时间,预延时即为模拟次效应而设置。声阵密度:此项参数可调整声阵的密度,其值较高时,混响效果较为温暖,但有明显的声染色;其值较低时,混响效果较深邃,切声染色也较弱。频率调制:这是一项技术性的参数,因为电子混响的声阵密度比自然混响稀疏,为了使混响的声音比较平滑、连贯,需要对混响声阵列的延时时间进行调制。此项技术可以有效的消除延时声阵列的段裂声,可以增加混响声的柔和感。调治深度:指上述调频电路的调治深度。(2)延时就是将音源延迟一段时间后,再欲播放的效果处理。依其延迟时间的不同,可分别产生合唱、镶边、回音等效果。当延迟时间在335ms之间时人耳感觉不到滞后音的存在,并且他与原音源叠加后,会因其相位干涉而产生梳状滤波效应,这就是镶边效果。如果延迟时间在50ms以上时,其延迟音就清晰可辨,此时的处理效果才是回音。回音处理一般都是用于产生简单的混响效果。延时、合唱、镶边、回音等效果的可调参数都差不多,具体有以下几项:*延时时间(dly),即主延时电路的延时时间调整。*反馈增益(fb gain),即延时反馈的增益控制。*反馈高频比(hi ratio),即反馈回路上的高频衰减控制。*调制频率(freq),指主延时的调频周期。*调制深度(depth),指上述调频电路的调制深度。*高频增益(hf),指高频均衡控制。*预延时(ini dly),指主延时电路预延时时间调整。*均衡频率(eq f),这里的频率均衡用于音色调整,此为均衡的中点频率选择。由于延时产生的效果都比较复杂多变,如果不是效果处理专家,建议使用设备提供的预置参数,因为这些预置参数给出的处理效果一般都比较好。3.2.2离散傅立叶变换在matlab的信号处理工具箱中函数fft和ifft用于快速傅立叶变换和逆变换。下面介绍这些函数。函数fft用于序列快速傅立叶变换。函数的一种调用格式为 y=fft(x)其中,x是序列,y是序列的fft,x可以为一向量或矩阵,若x为一向量,y是x的fft。且和x相同长度。若x为一矩阵,则y是对矩阵的每一列向量进行fft。如果x长度是2的幂次方,函数fft执行高速基2fft算法;否则fft执行一种混合基的离散傅立叶变换算法,计算速度较慢。函数fft的另一种调用格式为 y=fft(x,n)式中,x,y意义同前,n为正整数。函数执行n点的fft。若x为向量且长度小于n,则函数将x补零至长度n。若向量x的长度大于n,则函数截短x使之长度为n。若x 为矩阵,按相同方法对x进行处理。经函数fft求得的序列y一般是复序列,通常要求其幅值和相位。matlab提供求复数的幅值和相位函数:abs,angle,这些函数一般和fft同时使用。函数abs(x)用于计算复向量x的幅值,函数angle(x)用于计算复向量的相角,介于 和 之间,以弧度表示。函数unwrap(p)用于展开弧度相位角p ,当相位角绝对变化超过 时,函数把它扩展至 。用matlab工具箱函数fft进行频谱分析时需注意:(1) 函数fft返回值y的数据结构对称性。(2) 频率计算。(3) 作fft分析时,幅值大小与fft选择点数有关,但不影响分析结果。3.2.3滤波器设计单回声滤波器的系统函数:h(z)= 1 (3-1)无限个回声滤波器的系统函数:h(z)= 1 (3-2)全通结构的混响器的系统函数:h(z)= 1 (3-3)函数filter函数filter的调用格式为 y=filter(b,a,x)该格式采用数字滤波器对数据进行滤波,既可以用于iir滤波器,也可以用于fir滤波器。其中向量b和a分别表示系统函数的分子、分母多项式的系数,若a1,此时表示fir滤波器,否则就是iir滤波器。该函数是利用给出的向量b和a,对x中的数据进行滤波,结果放入向量y。3.3解决问题的基本思路(1)利用windows下的录音机或其他软件,录制一段自己的语音信号,时间控制在1s左右,并对录制的信号进行采样。(2)语音信号的频谱分析,画出采样后语音信号的时域波形和频谱图。(3)将信号加入延时和混响,再分析其频谱,并与原始信号频谱进行比较。(4)设计几种特殊类型的滤波器:单回声滤波器,多重回声滤波器,无限个回声滤波器,全通结构的混响器,并画出滤波器的频域响应。(5)用自己设计的滤波器对采集的语音信号进行滤波。(6)分析得到信号的频谱,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化。(7)回放语音信号。3.4 详细流程图用wavread从自己的电脑导入windows下1s语音信号画出采样后语音信号的时域波形与频谱图。n=2001,和调用fft函数快速傅里叶变换。对采样后语音信号进行延时30,在调整采样信号的长度,两者相加,就得到混响。无限个回声滤波器bz=0,0,0,0,0,0,0,0,0,0,1;az=1,0,0,0,0,0,0,0,0,0,-a;yy1=filter(bz,az,x);yy1=fft(yy1,2001);全通结构的混响器bz1=a,0,0,0,0,0,0,0,0,0,1;az1=1,0,0,0,0,0,0,0,0,0,a;yy2=filter(bz1,az1,x);yy2=fft(yy2,2001);单回声滤波器a=0.5;y2=x+z*0.5;y2=fft(y2,2001);sound(yy1,fs,bits);sound(yy2,fs,bits);sound(y2,fs,bits);图3-2 语音信号的特技处理设计程序流程图4 代码编写%原始信号x1=wavread(wlx.wav); %读取信号figure;plot(x1);title(原始信号);sound(5*x1,40000); %对原始声音的回放%采样信号x,fs,bits=wavread(wlx.wav,10000 40000);x=x(:,1); %只取单声道sound(5*x,fs); %对声音的回放n1=0:2000;n=size(x,1);figure;subplot(2,1,1);plot(x);title(采样后语音信号的时域波形);y=fft(x,2001); subplot(2,1,2); %对信号做2001点fft变换plot(n1(1:1000),y(1:1000); title(采样后语音信号的频谱图); %信号幅度 %延时的信号x,fs,bits=wavread(wlx.wav,10000 40000);x=x(:,1); %只取单声道n1=0:2000;z=zeros(200,1);x; figure(2); %信号的延时subplot(2,1,1);plot(z); title(延时后的时域图); %画出延时后的信号时域图 z=fft(z,2001); subplot(2,1,2);plot(n1(1:1000),z(1:1000); %延时后的信号频谱图 title(延时后的频谱图 ); sound(5*z,fs);%混响后信号x,fs,bits=wavread(wlx.wav,10000 40000); %读取语音信号x=x(:,1); %只取单声道n1=0:2000;z=zeros(200,1);x; %对语音信号进行延时x=x;zeros(200,1); %使语音信号与延时后信号同等长度y1=x+z; %信号的混响figure(3);subplot(2,1,1);plot(y1); title(混响的时域图); %混响时域图y1=fft(y1,2001); %对混响信号2001点的fft变换subplot(2,1,2);plot(n1(1:1000),y1(1:1000); %混响频谱图title(混响的频谱图);sound(5*y1,fs); %回放混响后的信号%单回声滤波器x,fs,bits=wavread(wlx.wav,10000 40000); %读取语音信号x=x(:,1); %只取单声道n1=0:2000;a=0.5; %a取小于等于1z=zeros(200,1);x; %对语音信号进行延时x=x;zeros(200,1); %使语音信号与延时后信号同等长度y2=x+z*0.5; %信号经单回声滤波figure;subplot(2,1,1);plot(y2);title(单回声滤波器时域图);y2=fft(y2,2001); %对单回声信号做2001点的fft变换subplot(2,1,2);plot(n1(1:1000),y2(1:1000); %单回声信号频谱图title(单回声滤波器频谱图);sound(5*y2,fs,bits); %回放经单回声滤波器后的语音信号 %无限回声滤波器x,fs,bits=wavread(wlx.wav,10000 40000); %读取语音信号x=x(:,1); %只取单声道n1=0:2000;a=0.5; %a取小于等于1bz=0,0,0,0,0,0,0,0,0,0,1; %分子的系数az=1,0,0,0,0,0,0,0,0,0,-a; %分母的系数yy1=filter(bz,az,x); %fir滤波器进行滤波figure(5);subplot(2,1,1);plot(yy1); %无限回声滤波器时域波形title(无限个回声滤波器时域波形);yy1=fft(yy1,2001); %经无限回声滤波器后的信号做2001点的fft变换subplot(2,1,2);plot(n1(1:1000),yy1(1:1000); %无限回声滤波器频谱图title(无限个回声滤波器频谱图 );sound(5*yy1,fs,bits); %回放经无限回声滤波器后的语音信号pause(2); %延时2秒%全通结构的混响器x,fs,bits=wavread(wlx.wav,10000 40000); %读取语音信号x=x(:,1); %只取单声道n1=0:2000;a=0.5; %a取小于等于1bz1=a,0,0,0,0,0,0,0,0,0,1; %分子的系数az1=1,0,0,0,0,0,0,0,0,0,a; %分母的系数yy2=filter(bz1,az1,x); figure(6); %fir滤波器进行滤波subplot(2,1,1);plot(yy2); title(全通应的时域图)%全通结构的混响器时域波形yy2=fft(yy2,2001); %经全通结构的混响器后的信号做2001点的fft变换subplot(2,1,2);plot(n1(1:1000),yy2(1:1000); %全通结构的混响器频谱图title(全通应的频谱图)sound(5*yy2,fs,bits); %回放经全通结构的混响器后的语音信号5 程序调试5.1 调试过程与步骤首先用计算机的声音编辑工具录制一段语音,生成.wav文件。再在matlab的m文件中书写代码,逐步调试。待运行成功后,设计界面,使代码与界面结合。设计界面时修改按钮的string属性设计按钮,在对每个按钮的功能编写代码,调试并运行。5.2 发现的问题1.根据不同录制的声音,信号采样的频率不一样,有时采样出来回放的信号没有声音,这就说明信号采样频率有误。2.变量未设置初值。3.wavread()函数运用错误。4.界面设计时不能运行。5.3 解决的办法1.由于自己录制的声音频率较高,所以必须先试验不同频率的采样,找到合适的频率。2.变量设置初值。3.wavread()函数运用应注明文件类型并且放进work文件夹下。4.界面设计时不能运行,检查代码,每段需要先读取声音文件在运行下面的代码。6运行与测试6.1运行程序图6-1 界面设计图图6-2 原始信号图图6-3 采样后信号图图6-4 延时后的信号图图6-5 混响后的信号图图6-6 单回声滤波后的信号图图6-7 无限个回声滤波后的信号图图6-8 信号经全通结构的混响器后的图结 论 通过这次的课程设计,熟悉并掌握了matlab中有关语音信号的读取,频谱分析,在时域用数字信号处理方法将信号加入延时和混响, 再分析其频谱,并与原始信号频谱进行比较。通过在图书馆以及网上查找资料,我大体知道了怎么设计的各个步骤。在做界面的过程中,也学到了很多,掌握了句柄的用法,各个按钮如何实现其功能。做matlab的界面过程中,最重要的一个经验就是:最好是把代码先用脚本文件的形式写完,然后在做界面,因为在添加控件的过程中本来写好的程序会出问题的。这个是一个软件的问题。否则有时候就会浪费很多时间。另外值得注意的一个问题是:命名最好用“匈牙利命名法”,否则函数太多了,就不知道名字代表什么意思,有时候,这样子也会节省很多时间。在录制声音文件时,因为我的录制的声音频率较高,所以在采样时经过很多次的变换才能够采到适合的频率,在代码分析设计时,我认识到自身有很多不足,如何让声音加入到matlab中,如何设计各个滤波器等。开始都毫无头绪,但经过查阅资料,以及组员之间的相互讨论,最后让这个课程设计能够圆满的完成了。经过这次的课程设计,我对理论知识的掌握更加牢固了,而且把理论与实践联系在一起,提高了自己的实践能力,也从中找到了乐趣。而且我认识到同学之间的相互合作的重要性,还有学到了自己通过各种途径搜集的资料应该具有把它们如何联系运用起来的能力。我们想要把所学的内容融会贯通,只是学习课本好不够,要把所学习的知识加以利用,这次的课程设计就给了我们很好的机会。让我们在学习基本知识后,不仅能加以巩固,还能从理论上升到实践中去。致 谢经过一周的课程设计,我渐渐对数字信号处理和matlab得应用更加的了解。我的课程设计能够成功完成,这要感谢xx计算机工程学院为我们提供一周的机房条件,感谢指导老师的悉心指导,感谢组员的诚挚帮助。让我对数字信号处理有了更进一步的熟悉,实际操作和课本上的知识有很大联系,但又高于课本,一个看似很简单的程序,要动手把它设计出来就比较困难了,因为是设计要求我们在以后的学习中注意这一点,要把课本上所学到的知识和实际联系起来,同时通过本次课程设计,不但巩固了所学知识,也使我们把理论与实践从真正意义上结合起来
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年及未来5年中国高端物业管理行业市场调查研究及投资战略咨询报告
- 2025福建福州文教职业中专学校招聘1人考前自测高频考点模拟试题及答案详解(网校专用)
- 2025贵州省职工医院第十三届贵州人博会引进高层次人才和急需紧缺人才招聘13人模拟试卷附答案详解(完整版)
- 2025广东省农业科学院设施农业研究所招聘劳动合同制人员1人模拟试卷带答案详解
- 2025湖南省社会科学院(湖南省人民政府发展研究中心)招聘高层次人才14人模拟试卷及答案详解(新)
- 2025年甘肃省兰州新区石化产业投资集团有限公司急需紧缺专业技术岗位招聘14人模拟试卷附答案详解(考试直接用)
- 2025辽宁鞍山立山区教育局招聘2人模拟试卷及完整答案详解一套
- 2025广东清远市英德市招聘教师222人模拟试卷及一套答案详解
- 2025航天六院内蒙古航天红峡化工有限公司招聘30人模拟试卷及1套参考答案详解
- 2025江苏盐城工学院招聘7人模拟试卷及完整答案详解
- 新版中华民族共同体概论课件第十二讲民族危亡与中华民族意识觉醒(1840-1919)-2025年版
- 2025-2026学年人教版(2024)九年级物理全册第十四章 内能的利用(单元同步检测练习)(含答案)
- 第1课时 10的加、减法(教学设计)-2024-2025学年一年级上册数学人教版
- 2025至2030中国聚烯烃行业项目调研及市场前景预测评估报告
- 2025四川达州宣汉县国有资产管理服务中心县属国有企业招聘劳动合同职工26人笔试历年参考题库附带答案详解
- 新教科版小学1-6年级科学需做实验目录
- 传染病学课件:霍乱完整版
- 《电子商务法律法规》课程标准
- 医院关于印发《即时检验临床应用管理办法》的通知
- 三年级下册书法练习指导全册教案(湖南美术出版社)
- GB/T 17880.5-1999平头六角铆螺母
评论
0/150
提交评论