语音信号处理实验报告实验二_第1页
语音信号处理实验报告实验二_第2页
语音信号处理实验报告实验二_第3页
语音信号处理实验报告实验二_第4页
语音信号处理实验报告实验二_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

通信工程学院 12 级 1 班 罗恒 2012101032 实验二实验二 基于基于 MATLAB 的语音信号频域特征分析的语音信号频域特征分析 一 实验要求 要求根据已有语音信号 自己设计程序 给出其倒谱 语谱图的分析结果 并根据频域分析方法检测所分析语音信号的基音周期或共振峰 二 实验目的 信号的傅立叶表示在信号的分析与处理中起着重要的作用 因为对于线性 系统来说 可以很方便地确定其对正弦或复指数和的响应 所以傅立叶分析方 法能完善地解决许多信号分析和处理问题 另外 傅立叶表示使信号的某些特 性变得更明显 因此 它能更深入地说明信号的各项红物理现象 由于语音信号是随着时间变化的 通常认为 语音是一个受准周期脉冲或 随机噪声源激励的线性系统的输出 输出频谱是声道系统频率响应与激励源频 谱的乘积 声道系统的频率响应及激励源都是随时间变化的 因此一般标准的 傅立叶表示虽然适用于周期及平稳随机信号的表示 但不能直接用于语音信号 由于语音信号可以认为在短时间内 近似不变 因而可以采用短时分析法 三 实验设备 1 PC 机 2 MATLAB 软件环境 四 实验内容 1 上机前用 Matlab 语言完成程序编写工作 2 程序应具有加窗 分帧 绘制曲线等功能 3 上机实验时先调试程序 通过后进行信号处理 4 对录入的语音数据进行处理 并显示运行结果 5 依次给出其倒谱 语谱图的分析结果 6 根据频域分析方法检测所分析语音信号的基音周期或共振峰 五 实验原理及方法 1 短时傅立叶变换 由于语音信号是短时平稳的随机信号 某一语音信号帧的短时傅立叶变换的定义为 jwjwm n m Xex m w nm e 其中 w n m 是实窗口函数序列 n 表示某一语音信号帧 令 n m k 则得到 jwjw n k n k Xew k x nk e 于是可以得到 jwjwnjwk n k Xeew k x nk e 假定 jwjwk n k Xew k x nk e 则可以得到 jwjwnjw nn XeeXe 同样 不同的窗口函数 将得到不同的傅立叶变换式的结果 由上式可见 短时傅立 叶变换有两个变量 n 和 所以它既是时序 n 的离散函数 又是角频率 的连续函数 与离散傅立叶变换逼近傅立叶变换一样 如令 2 k N 则得离散的短时傅立叶吧如下 2 2 01 jk N nn jkm N m X eX k x m w nm ekN 2 语谱图 水平方向是时间轴 垂直方向是频率轴 图上的灰度条纹代表各个时刻的语音短时谱 语谱图反映了语音信号的动态频率特性 在语音分析中具有重要的实用价值 被成为可视 语言 语谱图的时间分辨率和频率分辨率是由窗函数的特性决定的 时间分辨率高 可以看 出时间波形的每个周期及共振峰随时间的变化 但频率分辨率低 不足以分辨由于激励所 形成的细微结构 称为宽带语谱图 而窄带语谱图正好与之相反 宽带语谱图可以获得较高的时间分辨率 反映频谱的快速时变过程 窄带语谱图可以 获得较高的频率分辨率 反映频谱的精细结构 两者相结合 可以提供带两与语音特性相 关的信息 语谱图上因其不同的灰度 形成不同的纹路 称之为 声纹 声纹因人而异 因此可以在司法 安全等场合得到应用 3 复倒谱和倒谱 复倒谱是 x n 的 Z 变换取对数后的逆 Z 变换 其表达式如下 n x 1 ln ZZ x n x 倒谱 c n 定义为 x n 取 Z 变换后的幅度对数的逆 Z 变换 即 1 ln c nzX z 在时域上 语音产生模型实际上是一个激励信号与声道冲激响应的卷积 对于浊音 激励信号可以由周期脉冲序列表示 对于清音 激励信号可以由随机噪声序列表示 声道 系统相当于参数缓慢变化的零极点线性滤波器 这样经过同态处理后 语音信号的复倒谱 激励信号的复倒谱 声道系统的复倒谱之间满足下面的关系 s ne nv n 由于倒谱对应于复倒谱的偶部 因此倒谱与复倒谱具有同样的特点 很容易知道语音 信号的倒谱 激励信号的倒谱以及声道系统的倒谱之间满足下面关系 sev nnn ccc 浊音信号的倒谱中存在着峰值 它的出现位置等于该语音段的基音周期 而清音的倒 谱中则不存在峰值 利用这个特点我们可以进行清浊音的判断 并且可以估计浊音的基音 周期 4 基因周期估计 浊音信号的倒谱中存在峰值 它的出现位置等于该语音段的基音周期 而清音的倒谱 中则不存在峰值 利用倒谱的这个特点 我们可以进行语音的清浊音判决 并且可以估计 浊音的基音周期 首先计算语音的倒谱 然后在可能出现的基因周期附近寻找峰值 如果 倒谱峰值超过了预先设置的门限 则输入语音判断为浊音 其峰值位置就是基因周期的估 计值 反之 如果没有超出门限的峰值的话 则输入语音为清音 5 共振峰估计 对倒谱进行滤波 取出低时间部分进行进行逆特征系统处理 可以得到一个平滑的对 数谱函数 这个对数谱函数显示了输入语音段的共振峰结构 同时谱的峰值对应于共振峰 频率 通过此对数谱进行峰值检测 就可以估计出前几个共振峰的频率和强度 对于浊音 的声道特性 可以采用前三个共振峰来描述 清音不具备共振峰特点 六 程序及结果 倒谱求取基音周期 clc clear x fs wavread C Users ML Desktop 语音信号 aa x 1 16000 对 a 进行截短处理 取前 2s t1 1 length aa t 1 length aa fs frameSize 256 帧长 startIndex round 5000 从 0 5s 第 5000 个点 开始取 点 endIndex startIndex frameSize 1 frame aa startIndex endIndex 截取一帧的长度 加汉明窗 求倒谱 frameSize length frame frame2 frame hamming frameSize rwy rceps frame2 求倒谱 ylen length rwy cepstrum rwy 1 ylen for i 1 ylen 2 cepstrum1 i rwy ylen 2 1 i end for i ylen 2 1 ylen cepstrum1 i rwy i 1 ylen 2 end 基音检测 Lf floor fs 500 Hf floor fs 70 基音周期的范围为 70 500Hz cn cepstrum Lf Hf mx cep ind max cn if mx cep 0 05 else a 0 end pitch a 绘图 subplot 311 plot frame title 一帧语音 xlabel 样点数 ylabel 幅度 axis 1 frameSize 0 4 0 4 subplot 312 t2 ylen 2 1 1 0 ylen 2 plot t2 cepstrum1 title 一帧语音的倒谱 xlabel 样点数 ylabel 幅度 axis ylen 2 1 ylen 2 2 1 语谱图 subplot 313 specgram x 256 fs 100 spectrogram x hamming frameSize frameSize 2 0 0 01 5 fs title 语谱图 xlabel 时间 s ylabel 频率 Hz 五 结果分析及心得体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论