




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验一、用MATLAB实现语音信号的时域分析学院:信息与通信工程学院专业:通信工程班级:通信144学号:2014136410姓名:刘新雨指导教师:崔艳秋1. 实验目的观察并验证语音信号的时域特性,理解并掌握典型的语音信号时域分析方法和时域特征,为深入学习语音信号处理的各种应用奠定基础。2. MATLAB程序代码(1)由麦克风采集语音数据,将采集的数据存成WAV文件(采样率为8000Hz),存在本人的文件夹中。所用程序代码为:clear;close all;Fs=11025;y=wavrecord(5*Fs,Fs,double);wavwrite(y,D:lxy);soundview(y,Fs);(2)读取WAV文件,显示语音信号的波形。所用程序代码为:clear;close all;x = wavread(D:lxy.wav); figure;plot(x);axis(0,size(x,1),-0.35,0.3);title(语音信号时域波形);xlabel(样点数); ylabel(幅度);(3)读取WAV文件,计算并显示语音的短时能量(窗函数为矩形窗,帧长为50,200,400,600)。所用程序代码为:clear;close all;x = wavread(d:k.wav);x = double(x);f1= enframe(x,50, 50); energy1 = sum(abs(f1), 2); subplot(2,2,1);plot(energy1); title(语音信号的短时能量); legend(帧长LEN =50);f2= enframe(x,200, 200); energy2 = sum(abs(f2), 2); subplot(2,2,2);plot(energy2); title(语音信号的短时能量); legend(帧长LEN = 200);f3= enframe(x,400, 400); energy3 = sum(abs(f3), 2); subplot(2,2,3);plot(energy3); title(语音信号的短时能量); legend(帧长LEN = 400);f4= enframe(x,600,600); energy4 = sum(abs(f4), 2); subplot(2,2,4);plot(energy4); title(语音信号的短时能量); legend(帧长LEN = 600);(4)读取WAV文件,计算并显示语音的短时过零率(窗函数为矩形窗,帧长为256,帧移为128),所用程序代码为:clear;close all;x = wavread(D:lxy.wav); x = double(x);LEN = 300;INC= 150;f = enframe(x, LEN, INC); % 计算短时过零率z = zeros(size(f,1),1); difs =0.01; for i=1:size(f,1) s=f(i,:); for j=1:(length(s)-1) if s(j)* s(j+1)difs; z(i)= z(i)+1; end endendsubplot(2,1,1); plot(x); axis(0,size(x,1),-0.35,0.3);title(语音信号时域波形); xlabel(样点数); ylabel(幅度);subplot(2,1,2);plot(z); title(语音信号的短时过零率);xlabel(帧数); ylabel(短时过零率);(5)读取WAV文件,计算浊音与清音的短时自相关函数所用的程序代码为:clear;close all;x = wavread(D:lxy.wav);x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC); ff=f(15,:); N=LEN; R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1);endfor k=1:NR1(k)= R(k)/R(1); endsubplot(2,1,1);plot(ff); axis(0,N,-0.5,0.75)title(加矩形窗的语音帧); xlabel(样点数); ylabel(幅度);subplot(2,1,2); plot(R1); axis(0,N,-1,1)title(加矩形窗的短时自相关函数); xlabel(k); ylabel(R(k);clear;close all;x = wavread(d:k.wav);x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC); ff=f(124,:); ff=ff.*hamming(length(ff); N=LEN; R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1);endfor k=1:NR1(k)= R(k)/R(1); endsubplot(2,1,1);plot(ff); axis(0,N,-0.5,0.75)title(加汉明窗的语音帧); xlabel(样点数); ylabel(幅度);subplot(2,1,2); plot(R1); axis(0,N,-1,1)title(加汉明窗的短时自相关函数); xlabel(k); ylabel(R(k);clear;close all;x = wavread(D:lxy.wav);x = double(x);LEN = 10;INC= 10;f = enframe(x, LEN, INC); ff=f(500,:); N=LEN; R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1);endfor k=1:NR1(k)= R(k)/R(1); endsubplot(2,1,1);plot(ff); axis(0,N,-0.05,0.05)title(加矩形窗的语音帧); xlabel(样点数); ylabel(幅度);subplot(2,1,2); plot(R1); axis(0,N,-0.5,0.5)title(加矩形窗的短时自相关函数); xlabel(k); ylabel(R(k);clear;close all;x = wavread(D:lxy.wav);x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC); ff=f(25,:); N=LEN; R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1);endfor k=1:NR1(k)= R(k)/R(1); endsubplot(2,1,1);plot(ff); axis(0,N,-0.05,0.05)title(加矩形窗的语音帧); xlabel(样点数); ylabel(幅度);subplot(2,1,2); plot(R1); axis(0,N,-0.5,0.5)title(加矩形窗的短时自相关函数); xlabel(k); ylabel(R(k); 3. 实验结果及其分析(1)本实验利用11025Hz的采样频率对输入的语音信号进行采样,采样点数为55125个,持续时间为5秒,存储格式为double。之后将数字语音数据写入D盘的a.wav文件,并通过放音设备进行回放。回放的GUI界面如图1所示,通过该界面可以观察采集的语音信号。图1 用soundview函数显示的语音信号(2)本实验将D盘的lxy.wav文件读取出来,并显示文件中的语音信号波形,显示的波形如图2所示。该波形是汉语拼音“Xu”的时域波形。从图2可以看出,X是清音,它的波形幅值较小,且没有周期性;u是浊音,它的波形幅值较大且有明显的周期性起伏结构。图2 语音“Xu”的时域波形(3)本实验将D盘的lxy.wav文件读取出来,当帧长取不同值时计算语音信号的短时能量,如图3所示。从图3可以看出,浊音短时能量大,短时平均幅度大,短时过零率低,浊音具有较强的能量值,音段内隐藏信息的能力高。轻音短时能量小,短时平均幅度小,能量值较低,音段内隐藏信息的能力较低。图3 不同帧长对应的短时能量(4)本实验首先读取lxy.wav中的语音数据,之后计算每一帧的短时过零率,最后将原始语音信号和短时过零率显示出来,如图4所示。从图4可以看出,清音的过零率较高,浊音的过零率较低。图4 短时过零率(5)本实验首先读取lxy.wav中的语音数据,之后对数据进行分帧加窗处理,帧长为256,帧移为128。选取其中的一帧浊音(第15帧)并计算这帧的短时自相关函数。当窗函数分别为矩形窗和汉明窗时,截取的语音信号和短时自相关函数如图5和图6所示。从图5和图6可以看出,矩形窗能够比汉明窗更明显的显示出第一个峰值。当窗函数为矩形窗,不同帧长(帧移=帧长)的一帧浊音对应的短时自相关函数如图7和图8所示。从图7和图8可以看出,帧长越长,越容易区分其最大值。当窗函数为矩形窗,帧长为256,帧移为128
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《防火卷帘基本原理与应用》课件
- 新质生产力吉林旅游
- 弥漫大B细胞型淋巴瘤的临床护理
- 砌体施工工艺流程详解
- 小儿柞蚕蛹性脑病综合征的临床护理
- 《仓储物流管理》课件
- 《現代企业管理信息系统》课件
- 网络安全技能培训
- 2022-2023学年湖南省长沙市长沙县三年级上学期期末语文试卷及答案
- 2025合同最短期限规定
- 泰勒斯威夫特英文介绍演示文稿
- 超星尔雅学习通《带您走进西藏》章节测试答案
- 有源医疗器械产品有效期验证报告2019
- 施工监理投标报价单
- 阳江海上风电项目建议书
- 大学本科毕业设计毕业论文-网上药店管理系统的设计与实现
- DBJ∕T 13-264-2017 福建省石砌体结构加固技术规程
- 洞口县黄桥镇污水处理厂入河排污口设置论证报告
- T∕CGMA 081001-2018 整体式高速齿轮传动装置通用技术规范
- 核事故现场处置中的洗消问题
- FeNO测定及应用
评论
0/150
提交评论