《语音信号处理》上机实验指导书.doc_第1页
《语音信号处理》上机实验指导书.doc_第2页
《语音信号处理》上机实验指导书.doc_第3页
《语音信号处理》上机实验指导书.doc_第4页
《语音信号处理》上机实验指导书.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京信息科技大学语音信号处理实验指导书李红莲 编光电信息与通信工程学院二九年二月目 录实验一 语音信号的时域特征与频域特征.3一、实验目的. 3二、实验内容. 3三、实验原理. 3四、实验方法与实验步骤. 3 五、思考题.4六、实验报告要求.4实验二 语音信号的基本参数提取与矢量量化.5一、实验目的. 5二、实验内容. 5三、实验原理. 5四、实验方法与实验步骤. 5 五、思考题.6六、实验报告要求.7实验一:语音信号的时域特征与频域特征实验项目:语音信号的时域特征与频域特征实验项目性质:验证性实验课程:语音信号处理计划学时:4学时一、实验目的使学生通过本实验观察语音信号在时域和频域的基本特征(语音波形、基音频率、过零数、共振峰),验证教材中关于语音信号在时域和频域的基本特征的概念与论述;通过采集语音数据与在实验中记录每个元音的基音周期、过零数、共振峰等环节熟悉这些语音的基本特征,为今后深入学习语音信号处理奠定基础。二、实验内容学习音频编辑软件Cool Edit的使用方法及语音文件的建立;采集语音数据;观察语音波形;记录每个元音的基音周期(其倒数为基音频率)、过零数、共振峰;观察语音频域特征;分析不同元音的共振峰模式的特点(频率、相对振幅)。三、实验原理元音与辅音在发音方法有如下基本区别:发元音时气流顺利通过声腔,声带颤动,形成的声波是周期性的;发辅音时气流暂时被阻不能通过或只能勉强挤出去。元音具有基音与共振峰结构,辅音则不具有这两者。基音由声带振动频率产生,决定语音的音高、音调。在语音波形中表现为准周期峰值。共振峰是语音频谱上的强频区,表现为频谱上呈峰状。共振峰由声腔形状的变化决定,不同的声腔形状有不同的固有频率,产生不同的共振峰模式。每个元音有特定的共振峰模式。四、实验方法与实验步骤(一)音频编辑软件Cool Edit的使用方法及语音文件的建立 点击桌面上“cool edit”图标,选不同项可激活cool edit菜单中不同功能。 点击“file”菜单中的“new”,设抽样频率为8KHz,单声道“mono”,“8 bit”。 点击“Record”录音,将录音存成“.wav”文件。 点击菜单中“View”中的“Spectral View”可观看语谱图。 点击菜单中“Analyze”中的“Frequence Analysis”可分析频谱。 点击菜单中“Effects”中的“Amplitude”可改变幅度。其它菜单功能可通过点击试验熟悉。(二)观察语音时域特征在E盘或D盘建立实验者本人的文件夹,然后做以下实验。 发【a】、【i】、【e】、【u】这四个元音,由麦克风采集语音数据,分别存成“a.wav”、“i.wav”、“e.wav”、“u.wav”文件,存在本人的文件夹中。 利用Cool Edit打开并观察以上语音数据的波形。元音波形中的准周期结构与声带振动频率对应,其周期称为“基音周期”(其倒数为基音频率),利用Cool Edit观察元音的波形,记录每个元音的前部、中部和后部的各一个基音周期。记录每个元音的任意一个基音周期中的过零数。 共振峰是语音频谱的峰状区域,利用Cool Edit观察上述每个元音的频谱,记录每个元音的前三个共振峰的数值。(三)观察语音频域特征对你发的【a】、【i】、【e】、【u】这四个元音中每一个元音,分别选取稳定段的256个抽样,利用 Matlab 的 FFT计算其频谱,并利用subplot命令以波形和频谱对应的形式画出图形。部分参考程序如下y = wavread(e.wav);t=1:length(y)y2 = wavread(e.wav,4000 4512);y2F=fft(y2);subplot(3,1,1)plot(t,y,-b,4000,0.2:0.005:0.4,-r,4512,0.2:0.005:0.4,-r)subplot(3,1,2)plot(y2);grid onsubplot(3,1,3)plot(log(abs(y2F);grid on五、思考题(1)共振峰与语音波形有什么相关之处?(2)基音周期与音调的高低有什么对应关系?六、实验报告要求(1)简述实验目的、实验原理和实验任务;(2)逐个说明本人所发的【a】、【i】、【e】、【u】这四个元音的基音频率、稳定段的256个抽样的过零数及共振峰。设计适当的表格,包括发音人姓名、发的哪一个元音,将记录下来的基音频率、过零数、共振峰以表格的形式列出。(3)分析不同元音的共振峰模式的特点(频率、相对振幅)。(4)对你发的【a】、【i】、【e】、【u】这四个元音中每一个元音,分别选取稳定段的256个抽样,利用 Matlab 的 FFT计算其频谱。画出每一个元音的波形图与频谱图。(5)收获与体会。实验二:语音信号的基本参数提取与矢量量化实验项目:语音信号的基本参数提取与矢量量化实验项目性质:综合性实验课程:语音信号处理计划学时:4学时一、实验目的使学生通过本实验掌握提取并观察线性预测系数(lpc)、倒频谱(cep)、反射系数(k)等几种常用的语音参数;熟悉特征矢量、矢量形成、矢量空间、区域边界、距离测度、码本、聚类等概念,加深理解矢量量化(VQ)的原理;掌握基本的VQ实现方法,为进一步掌握语音识别等实际应用技术奠定基础。 二、实验内容(1) 利用Matlab对元音提取并观察线性预测系数(lpc)、倒频谱(cep)、反射系数(k)等几种常用的语音参数。对比不同元音之间的参数。(2) 比较标量量化与矢量量化的异同点,熟悉特征矢量、矢量形成、矢量空间、区域边界、距离测度、码本、聚类等概念,加深理解矢量量化(VQ)的原理。(3) 通过编程实现简单的VQ过程,掌握基本的VQ实现方法。三、实验原理(1) 线性预测系数(lpc)、倒频谱(cep)、反射系数(k)是几种常用的语音参数,可以形成特征矢量,矢量量化的码本中的码字就是由特征矢量构成的;(2) 矢量量化是将若干个标量数据构成一个矢量,然后在矢量空间中给以整体量化;(3) 矢量量化的方法:确定包含M个码字的码本,每个码字是由P个参数构成一个特征矢量;将语音信号的每一帧提取与码本中的码字相同形式的由P个参数构成的特征矢量;将输入信号的特征矢量与码本中的每一个码字相比较并被量化为距离最小的码字的矢量值,将该码字的下标(标号)作为输出。(4) 在本实验中码本是给定的。(5) 矢量量化的原理框图:码本Yj (j=1,2,.码本Yj (j=1,2,. Yj min=min-1 d( X, Yj )矢量形成XYj min图1 矢量量化的原理框图四、实验方法与实验步骤(1) 语音参数提取参考如下程序,利用Matlab编程对每个元音提取并观察线性预测系数(lpc)、倒频谱(cep)、反射系数(k)等几种常用的语音参数,以适当的表格将数据记录下来。画出便于观察与对比不同元音之间参数的图形。xa=wavread(a.wav,501 756);ca=rceps(xa); % 提取倒频谱(cep)aa,ea,ka=aryule(xa,8); % 提取反射系数(k)aa2=lpc(xa,8); % 提取线性预测系数(lpc)subplot(4,4,1);plot(xa)subplot(4,4,2);plot(ca)subplot(4,4,3);bar(aa)(2) 本实验中给定的矢量量化的码本本实验中给定的矢量量化的码本有4个码字,特征矢量采用线性预测系数(LPC参数),分析阶数P8,码字矢量维数K9,给定码本中的码字如下: Y1 ()Ya= (1,-1.77891, 1.43475,-0.87491, 0.51574, -0.35793, 0.25688, 0.22895, -0.27550) Y2 ()Ye= (1, -1.74811, 1.44779,-0.42867,-0.72046, 0.43426,0.31352,-0.70315, 0.50096) Y3 ( )Yi= (1,-1.88931, 1.68912,-1.20478, 0.72695,-0.81863, 1.14223,-0.92035 0.33845) Y4 ()Yu= (1,-1.97814, 1.40744,-0.52973, 0.10981,-0.68175, 1.37006,-0.87356, 0.20293)(3) 发【a】、【i】、【e】、【u】这四个元音,由麦克风采集语音数据,分别存成“a.wav”、“i.wav”、“e.wav”、“u.wav”文件,存在文件夹YINSU中。(4) 对文件夹YINSU中每个语音取一段提取8阶线性预测系数(LPC参数),形成特征矢量。(5) 采用欧氏距离(d=sum(a-b).2)),对文件夹YINSU中每个音素进行矢量量化,记录每个音素与码本中各个码字的距离与量化结果。(6) 采用最大似然比失真测度,对文件夹YINSU中每个音素进行矢量量化。记录每个音素与码本中各个码字的距离与量化结果。 五、思考题矢量量化在高度压缩信息方面的高性能是有代价的,其代价是什么?

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论