版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章第三章 3.1 3.1 概述概述 语音信号处理包括语音通信、语音合成、语音识语音信号处理包括语音通信、语音合成、语音识 别、说话人识别和语音增强等,基础知识是对语音信别、说话人识别和语音增强等,基础知识是对语音信 号的分析。号的分析。 语音处理的目的:语音处理的目的: 一、对语音信号进行分析,提取特征参数。一、对语音信号进行分析,提取特征参数。 LPC参数编码参数编码,清清/浊音信息浊音信息,增益常数增益常数,基音周期基音周期,反射反射 系数系数,共振峰等共振峰等. 二、加工语音信号二、加工语音信号 语音分析的重要性 n语音信号分析是语音信号处理的基础,只有分 析出可表示语音信号本质特征
2、的参数,才有可 能利用这些参数进行高效的语音通信,语音合 成,语音识别等处理 n语音合成的音质好坏,语音识别率的高低,都取 决于对语音分析的准确性和精确性 n语音分析有举足轻重的作用 3.1 3.1 概述概述 语音信号分析方法:语音信号分析方法: 时域分析时域分析 频域分析频域分析 倒谱域分析倒谱域分析 线性预测分析线性预测分析 3.1 3.1 概述概述 时域分析时域分析:最简单、最直观的方法,它直接对:最简单、最直观的方法,它直接对 语音信号的语音信号的时域波形时域波形进行分析。进行分析。 提取的特征参数:提取的特征参数: 短时平均能量短时平均能量 短时平均幅度短时平均幅度 短时平均过零率短
3、时平均过零率 短时自相关函数短时自相关函数 短时平均幅度差函数短时平均幅度差函数 3.1 3.1 概述概述 频域分析频域分析 以输入信号的频率为变量,在频率域,研究以输入信号的频率为变量,在频率域,研究 语音信号的特征参数与信号之间的关系。语音信号的特征参数与信号之间的关系。 3.1 3.1 概述概述 语音信号具有时变特性,是一个非平稳的随机过程;语音信号具有时变特性,是一个非平稳的随机过程; 但是,语音信号又具有但是,语音信号又具有“短时平稳性短时平稳性”,即在一个短时,即在一个短时 间范围内其特性基本保持不变。间范围内其特性基本保持不变。这是语音信号处理的这是语音信号处理的 一个重要出发点
4、。即一个重要出发点。即“短时分析短时分析”。 “ “短时分析短时分析” 对语音信号采用分段或叫分帧来处理。对语音信号采用分段或叫分帧来处理。 短时分析技术:短时分析技术: 注:语音通常在注:语音通常在1030ms1030ms内保持相对平稳,所以帧长内保持相对平稳,所以帧长 取为:取为: 1030ms1030ms 3.1 3.1 概述概述 3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 一、取样率和量化字长的选择一、取样率和量化字长的选择 模拟语音模拟语音 数字语音,须经过数字语音,须经过取样、量化取样、量化 电话带宽语音:电话带宽语音: 3003400Hz3003400Hz
5、通信系统中,数字化取样率一般为通信系统中,数字化取样率一般为8KHz8KHz, 语音信号处理中,取样率为语音信号处理中,取样率为 10KHz10KHz 取样率的选择取样率的选择 2. 量化字长的选择量化字长的选择 量化过程量化过程:将整个幅度值分割为有限个区间,:将整个幅度值分割为有限个区间, 落入同一个区间的样本都赋予相同的幅度值落入同一个区间的样本都赋予相同的幅度值 。 量化过程不可避免会产生量化误差。量化过程不可避免会产生量化误差。 可以证明量化信噪比为:可以证明量化信噪比为: )lg(2077. 402. 6)lg(10)( max 2 2 x e x X BdBSNR 量化字长量化字
6、长输入语音信号的方差输入语音信号的方差 噪声序列的方差噪声序列的方差 信号的峰值信号的峰值 3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 若语音信号服从拉普拉斯(若语音信号服从拉普拉斯(Laplacian)Laplacian)分布,则:分布,则: 可见,每比特对可见,每比特对SNRSNR贡献贡献6dB6dB。 2 . 702. 6)( BdBSNR B=7Bit时,时,SNR=35dB,可满足一般通信系统要求;可满足一般通信系统要求; 实际中,因语音波形变化的动态范围可达实际中,因语音波形变化的动态范围可达55dB,所以,应,所以,应 取取B 10Bit 3.2 3.2 语
7、音信号的数字化和预处理语音信号的数字化和预处理 二、预处理二、预处理 预处理:预处理:模拟语音的数字化、放大及增益模拟语音的数字化、放大及增益 控制、反混叠滤波、预加重等。控制、反混叠滤波、预加重等。 反混叠滤波反混叠滤波:在取样前,为预防混叠失真和噪声干:在取样前,为预防混叠失真和噪声干 扰,采用的一个截止性能良好的模拟低通滤波器。扰,采用的一个截止性能良好的模拟低通滤波器。 反混叠滤波器一般与反混叠滤波器一般与A/D做在一块集成片内。做在一块集成片内。 预加重:预加重:因语音信号高频端因语音信号高频端800Hz以上按以上按6dB/倍频倍频 程下降,所以程下降,所以在在A/D前,可以采用预加
8、重方法。即提前,可以采用预加重方法。即提 升高频部分,使信号的频谱变得平坦,便于频谱分析升高频部分,使信号的频谱变得平坦,便于频谱分析 和声道参数分析。和声道参数分析。 3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 对重构的语音波形的高次谐波起对重构的语音波形的高次谐波起 平滑作用,去除高次谐波失真平滑作用,去除高次谐波失真 注:注: 预加重也可预加重也可在在A/DA/D后进行,此时可采用数字后进行,此时可采用数字 滤波器实现:滤波器实现: 1 1)( zzH 预加重后的信号在分析后,还需要进行去预加重后的信号在分析后,还需要进行去 加重处理还原为原来的语音信号。加重处理还
9、原为原来的语音信号。 3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 短时加窗、分帧处理短时加窗、分帧处理 通过加窗、分帧处理,把语音信号分割成一帧通过加窗、分帧处理,把语音信号分割成一帧 一帧短时信号,然后再把一个短时帧看成平稳的随一帧短时信号,然后再把一个短时帧看成平稳的随 机信号进行处理。机信号进行处理。 分帧方法:分帧方法: 连续分段连续分段 交叠分段交叠分段 3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 加窗分帧方法: 交叠交叠 连续连续 3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 3.3 3.3 短时能量分析短时能量分析
10、语音信号的能量分析是语音信号的能量分析是基于语音信号能量随时间基于语音信号能量随时间 有很大的变化,清音段的能量一般比浊音段的能量有很大的变化,清音段的能量一般比浊音段的能量 小得多。小得多。 能量分析包括两方面:能量分析包括两方面:能量、幅度能量、幅度 短时能量分析:短时能量分析:信号流的处理采用分帧或分段来信号流的处理采用分帧或分段来 实现。实现。 分帧:分帧:可用移动的有限长窗口加权来实现可用移动的有限长窗口加权来实现。如:。如: 采用直角窗采用直角窗 其其他他 10 0 1 )( Nn nw 一、短时平均能量的定义一、短时平均能量的定义 2 2 1 ( ) () ( ) () n m
11、n m n N Ex m w nm x m w nm 注意:注意:E En n以以n n为标志。因为窗序列是沿着平方值的序列逐段移为标志。因为窗序列是沿着平方值的序列逐段移 动。见图动。见图3-63-6 3.3 3.3 短时能量分析短时能量分析 图图3-73-7短时能量序列的计算方法短时能量序列的计算方法 22 ( ) ()( )* ( ) n m Exm h nmxnh n 表明表明:短时平均能量相当于语音信号平方通过一短时平均能量相当于语音信号平方通过一 个单位脉冲响应为个单位脉冲响应为h(n)h(n)的线性滤波器的输出。的线性滤波器的输出。 3.3 3.3 短时能量分析短时能量分析 图3
12、-6短时平均能量计算说明 图3-7 短时平均能量计算方框图 窗口的形状窗口的形状 窗函数:窗函数:直角窗、汉宁窗、海明窗、布莱克曼窗等直角窗、汉宁窗、海明窗、布莱克曼窗等 直角窗和海明窗的频率特性比较直角窗和海明窗的频率特性比较 3.3 3.3 短时能量分析短时能量分析 第一个零值频率第一个零值频率 NTN f f s 1 01 采样频率采样频率 窗口长度窗口长度 海明窗的第一个零值频率比直角窗要大海明窗的第一个零值频率比直角窗要大1倍倍 左右,即带宽约增加左右,即带宽约增加1倍。同时其带外衰减也倍。同时其带外衰减也 比直角窗大的多。比直角窗大的多。 3.3 3.3 短时能量分析短时能量分析
13、2. 窗口的长度窗口的长度 窗长对能否反映语音信号的幅度变化起决定窗长对能否反映语音信号的幅度变化起决定 性作用。性作用。 若若N N很大很大,等效为带宽,等效为带宽很窄很窄的低通滤波器,的低通滤波器, 反映波形细反映波形细 节的高频部分被阻碍,短时能量很小节的高频部分被阻碍,短时能量很小 若若N N很小很小,等效为带宽,等效为带宽很宽很宽的低通滤波器,的低通滤波器, 短时能量变短时能量变 化很剧烈,不能得到语音信号的平滑能量函数。化很剧烈,不能得到语音信号的平滑能量函数。 窗口的长短是相对语音信号的基音周期而言。窗口的长短是相对语音信号的基音周期而言。 通常认为:通常认为:一个语音帧内应含有
14、一个语音帧内应含有1717个基音周期。但不同个基音周期。但不同 人的基音周期变化很大;折中选取:人的基音周期变化很大;折中选取: 在取样频率为在取样频率为10KHz10KHz时,时,N=100-200N=100-200 即即1020ms1020ms持续时间持续时间 3.3 3.3 短时能量分析短时能量分析 图3-9 各种宽度海明窗时的短时平均能量函数 窗选太窄,窗选太窄,En随语音信随语音信 号波形变化而很快起伏号波形变化而很快起伏 窗选太宽,窗选太宽,En随语音信随语音信 号波形变化而缓慢起伏号波形变化而缓慢起伏 En随语音信号波形变化随语音信号波形变化 而快速变化,充分体现而快速变化,充分
15、体现 出信号的特征。出信号的特征。 二、短时平均能量的主要用途二、短时平均能量的主要用途 可以区分清音段和浊音段。可以区分清音段和浊音段。 浊音的浊音的E En n比清音比清音En大的多大的多 可以区分声母和韵母的分界,无声和有声的分界,可以区分声母和韵母的分界,无声和有声的分界, 连字的分界。连字的分界。 可以用于语音识别可以用于语音识别 注:注: E En n值对于高电平信号比较灵敏,此时可采用:值对于高电平信号比较灵敏,此时可采用: “短时平均幅度短时平均幅度M Mn n”, ,其定义为: 其定义为: 0 ( )()( ) *( ) n m Mx m w nmx nw n 3.3 3.3
16、 短时能量分析短时能量分析 Mn x(n)x(n) w(n)w(n) x(n) x(n) 图图3-10 3-10 语音信号短时平均幅度语音信号短时平均幅度M Mn n的实现框图的实现框图 短时平均幅度的动态范围(最大值与最小值之比)短时平均幅度的动态范围(最大值与最小值之比) 比短时平均能量小。比短时平均能量小。 3.3 3.3 短时能量分析短时能量分析 3.4 3.4 短时过零分析短时过零分析 一、过零分析的概念一、过零分析的概念 过零过零就是信号通过零值。就是信号通过零值。 对于对于离散信号离散信号,相邻的取样值改变符号则称,相邻的取样值改变符号则称 为过零。为过零。 过零数过零数就是样本
17、改变符号的次数。就是样本改变符号的次数。 单位时间内的过零数为单位时间内的过零数为平均过零数平均过零数。 语音信号语音信号x(n)的短时平均过零数定义为的短时平均过零数定义为 1 0 sgn ( )sgn (1)() sgn ( )sgn (1) *( ) N n m Zx mx mw nm x nx nw n 1( )0 sgn( ) 1( )0 x n x x n 二、短时平均过零数的定义和实现二、短时平均过零数的定义和实现 3.4 3.4 短时过零分析短时过零分析 三、短时平均过零数的应用三、短时平均过零数的应用 用于语音信号分析用于语音信号分析 2. 用于从背景中找出语音信号用于从背景
18、中找出语音信号 清音和浊音的过零分布是不同的:清音和浊音的过零分布是不同的: 清音具有较高的过零数,而浊音则具有较低的过零数。清音具有较高的过零数,而浊音则具有较低的过零数。 3.4 3.4 短时过零分析短时过零分析 3.5 3.5 短时相关分析短时相关分析 相关分析是最常用的时域分析方法。相关分析是最常用的时域分析方法。 相关函数用于测定两个信号在时域内的相似性。相关函数用于测定两个信号在时域内的相似性。 互相关函数可测定两个信号间的时间滞后。互相关函数可测定两个信号间的时间滞后。 若两个信号波形完全不同,则互相关函数为零;若两个信号波形完全不同,则互相关函数为零; 若两个信号波形相同,则在
19、超前、滞后处出现峰值若两个信号波形相同,则在超前、滞后处出现峰值 自相关函数用于研究信号本身。自相关函数用于研究信号本身。 1. 1. 自相关函数的定义和性质自相关函数的定义和性质 一、短时自相关函数一、短时自相关函数 对于确定性信号序列,自相关函数定义为对于确定性信号序列,自相关函数定义为 3.5 3.5 短时相关分析短时相关分析 m kmxmxkR)()()( 对于随机性信号序列或周期性信号序列,自相关函数定义为对于随机性信号序列或周期性信号序列,自相关函数定义为 N Nm N kmxmx N kR)()( 12 1 lim)( 自相关函数有一系列有用的性质自相关函数有一系列有用的性质:
20、(1 1) 如果如果x(n)x(n)是周期信号是周期信号( (设周期为设周期为N NP P ) ),则,则R(k)R(k)也是周也是周 期性信号,而且其周期与期性信号,而且其周期与x(n)x(n)相同。即:相同。即:R(k)R(k)R(k+NR(k+NP P) ) (2 2) 偶函数:偶函数:R(k)R(k)R(R(k)k)。 (3 3) R(0) = |R(k)| , R(0) = |R(k)| , 即零滞后自相关值最大。即零滞后自相关值最大。 (4 4) R(0)R(0)等于确定性信号序列的能量或随机性序列的平均功率。等于确定性信号序列的能量或随机性序列的平均功率。 3.5 3.5 短时相
21、关分析短时相关分析 )()()()()(kmnwkmxmnwmxkR m n )()()()(kmnwmnwkmxmx m 2. 2. 短时自相关函数的定义短时自相关函数的定义 3.5 3.5 短时相关分析短时相关分析 )()()-()()()( )()( kmnwmnwkmxmxkRkR kRkR m nn nn )()()( )( )()()( nhknxnx mnhkmxmxkR k k m n x(n)x(n) 延时延时 k k h hk k(n)(n) R Rn n(k)(k) 图图3-17 3-17 短时自相关函数的实现框图短时自相关函数的实现框图 x(n-k)x(n-k) 3.5
22、 3.5 短时相关分析短时相关分析 若定义若定义 )()()(knwnwnhk 则则 10KHz取样,计算取样,计算 时的自相关值时的自相关值 2500 k 1、短时自相关函、短时自相关函 数可以明显地反映数可以明显地反映 浊音信号的周期性浊音信号的周期性 2、清音的短时自、清音的短时自 相关函数没有周期相关函数没有周期 性,不具有明显突性,不具有明显突 起的峰值,其性质起的峰值,其性质 类似于噪声。类似于噪声。 二、修正的短时自相关函数二、修正的短时自相关函数 窗口长度的选择窗口长度的选择 N值至少要大于基音周期的两倍,否则找不到第二个值至少要大于基音周期的两倍,否则找不到第二个 最大值点最
23、大值点 N值要尽可能的小;因为语音信号的特性是变化的,值要尽可能的小;因为语音信号的特性是变化的, 如果如果N过大将影响短时性。过大将影响短时性。 为此提出了修正的自相关函数为此提出了修正的自相关函数 思路:思路:用两个长度不同的窗口,截取两个不等长的序列进行乘用两个长度不同的窗口,截取两个不等长的序列进行乘 积和,窗口长度相差最大延迟点数为积和,窗口长度相差最大延迟点数为K,这样始终保持乘积和的这样始终保持乘积和的 项数不变项数不变。 3.5 3.5 短时相关分析短时相关分析 修正的短时自相关函数的定义修正的短时自相关函数的定义 其他值其他值m Nm mw 0 )1(01 )( 1 其其他他值值m KNm mw 0 )1(01 )(2 其中其中 3.5 3.5 短时相关分析短时相关分析 )()()()()( 21 kmwkmnxmwmnxkR m n 这里,这里, 和和 采用不同长度的窗口采用不同长度的窗口 语音
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 聚醚醚酮医用材料生产项目可行性研究报告
- 2025年建设工程质量检测人员建筑材料能力验证试题及答案
- 智能化建筑机械设备制造项目规划设计方案
- 六孔施工方案(3篇)
- srtp管施工方案(3篇)
- 景观河堤施工方案(3篇)
- 黄铜喷漆施工方案(3篇)
- 超大混凝土施工方案(3篇)
- 健康管理App合同
- 光储充一体化电站项目技术方案
- 私人司机合同范本
- 农村房屋安全排查培训
- 2025年河北体育学院竞争性选调工作人员14名(第三批)考试模拟卷附答案解析
- 《资源与运营管理》期末机考资料
- 股权抵押分红协议书
- 《数字化测图》实训指导书
- 电影监制的合同范本
- 2025年高级农艺工考试题及答案
- 铁路工务安全管理存在的问题及对策
- 2025广东茂名市高州市市属国有企业招聘企业人员总及笔试历年参考题库附带答案详解
- 2023年考研历史学模拟试卷及答案 古代希腊文明
评论
0/150
提交评论