小波变换在语音识别的基音检测中的应用.ppt_第1页
小波变换在语音识别的基音检测中的应用.ppt_第2页
小波变换在语音识别的基音检测中的应用.ppt_第3页
小波变换在语音识别的基音检测中的应用.ppt_第4页
小波变换在语音识别的基音检测中的应用.ppt_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

小波变换在语音识别的基音检测中的应用 吕志锋210150772011年1月10日 目录 第一部分语音识别与基音检测第二部分小波变换在基音检测中的应用 1 语音识别技术 一 语音识别及基音检测 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术 语音识别内容主要包括特征提取技术 模式匹配准则及模型库三个方面 2 声学特征 一 语音识别及基音检测 声学特征指的是从语音信号中提取出来的某方面的特征或者数值 它能客观的反应语音在某方面的信息或者语音某几方面的相互关系 声学特征的提取与选择是语音识别的一个重要环节 声学特征的提取既是一个信息大幅度压缩的过程 也是一个信号解卷过程 目的是使模式划分器能更好地划分语音信息 在语音以及语音情感识别中使用的特征参数有基频 Pitch 能量 Energy 语速 SpeechRate 共振峰频率 Formant 单个音节的持续时间 Duration 音节之间的停顿时间 Pause 线性预测系数 LPC Mel倒谱系数 MFCC 等 以及它们的各种变化形式 如最大值 最小值 均值 范围 变化率等等 这些参数主要体现的是人体的声门和声道的特征 因此和人的生理构造有着密切的关系 在不同的个体上显现出较强的相异性 3 基音检测人在发浊音 m n l r 韵母 时 气流通过声门使声带产生张弛振荡式振动 产生一股周期脉冲气流 这一气流激励声道就产生浊音 又称有声意淫 它携带着语音中的大部分能量 这种声带振动的频率称为基频 相应的周期称为基音周期 它的大小语音与个人声带的长短 厚薄 韧性和发音习惯有关 还与发音者的年龄 性别 发音力度以及情感有关 是语音识别中的重要参数之一 基音检测是语音识别的重要方法 它的最终目标是找出与声带振动频率完全一致或者尽量吻合的基音周期变化轨迹曲线 它也广泛应用于其它语音信号的处理过程 比如语音压缩编码和解码 语音情感识别等等 一 语音识别及基音检测 二 小波变换在基音检测中的应用 对于 定义其小波变换为 其中 s为尺度因子 若取尺度 j为整数 则函数 在尺度 和位置x上的 小波变换为 其中 1 小波变换 2 小波变换的优点 二 小波变换在基音检测中的应用 1 小波分解可以覆盖整个频域 提供了一个数学上完备的描述 2 小波变换通过选取合适的滤波器 相对带宽恒定 可以极大的减小或去除所提取得不同特征之间的相关性 3 小波变换具有 变焦 特性 在低频段可用高频率分辨率和低时间分辨率 宽分析窗口 在高频段 可用低频率分辨率和高时间分辨率 窄分析窗口 3 小波变换的突变检测 二 小波变换在基音检测中的应用 一个实函数 x 我们称为光滑函数 只要满足 O x 表示x的阶数 光滑函数的能量通常集中在低频段 因此 x 也可看成一个低通滤波器的冲激响应 如果选择小波为光滑函数的一阶导数 即 同样取 3 小波变换的突变检测 二 小波变换在基音检测中的应用 则小波变换可以写成 即小波变换Wsf x 可表示成信号f x 在尺度s被 s x 平滑后的一阶导数 由图比较可知小波变换可以有效检测信号f x 的突变点 4 小波变换检测基音周期 二 小波变换在基音检测中的应用 人发音时 在声门闭合瞬间 气流会急剧增加 对于在语音波形上即为在该瞬间又一个明显的跳变 可认为是信号的奇异点 每相邻两次声门闭合时间间隔即为瞬态基音周期 而大量瞬态基音周期的均值即为基音周期 小波变换为检测这类信号突变提供了强有力的工具 由信号的突变检测原理可知 可选择光滑函数的一阶导数作为小波 通过定位语音信号的幅值极大值点位置 就可精确检测到因声门闭合产生的语音波形突变 4 小波变换检测基音周期 二 小波变换在基音检测中的应用 为了检测信号的突变 要求小波应为某一光滑函数的一阶导数 样条函数就是一种适用于小波快速算法的光滑函数 我们可以得到构造的小波 尺度函数 光滑函数的傅里叶变换分别为 4 小波变换检测基音周期 二 小波变换在基音检测中的应用 如果选择2n 1 3 则我们可以得到样条小波函数所对应的滤

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论