版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章第三章3.1 3.1 概述概述 语音信号处理包括语音通信、语音合成、语音识语音信号处理包括语音通信、语音合成、语音识别、说话人识别和语音增强等,基础知识是对语音信别、说话人识别和语音增强等,基础知识是对语音信号的分析。号的分析。语音处理的目的:语音处理的目的:一、对语音信号进行分析,提取特征参数。一、对语音信号进行分析,提取特征参数。 LPC参数编码参数编码,清清/浊音信息浊音信息,增益常数增益常数,基音周期基音周期,反射反射系数系数,共振峰等共振峰等.二、加工语音信号二、加工语音信号语音分析的重要性n语音信号分析是语音信号处理的基础,只有分析出可表示语音信号本质特征的参数,才有可能利用
2、这些参数进行高效的语音通信,语音合成,语音识别等处理n语音合成的音质好坏,语音识别率的高低,都取决于对语音分析的准确性和精确性n语音分析有举足轻重的作用3.1 3.1 概述概述 语音信号分析方法:语音信号分析方法: 时域分析时域分析 频域分析频域分析倒谱域分析倒谱域分析线性预测分析线性预测分析3.1 3.1 概述概述 时域分析时域分析:最简单、最直观的方法,它直接对:最简单、最直观的方法,它直接对语音信号的语音信号的时域波形时域波形进行分析。进行分析。提取的特征参数:提取的特征参数:短时平均能量短时平均能量短时平均幅度短时平均幅度短时平均过零率短时平均过零率短时自相关函数短时自相关函数短时平均
3、幅度差函数短时平均幅度差函数3.1 3.1 概述概述 频域分析频域分析 以输入信号的频率为变量,在频率域,研究以输入信号的频率为变量,在频率域,研究语音信号的特征参数与信号之间的关系。语音信号的特征参数与信号之间的关系。 3.1 3.1 概述概述 语音信号具有时变特性,是一个非平稳的随机过程;语音信号具有时变特性,是一个非平稳的随机过程; 但是,语音信号又具有但是,语音信号又具有“短时平稳性短时平稳性”,即在一个短时,即在一个短时 间范围内其特性基本保持不变。间范围内其特性基本保持不变。这是语音信号处理的这是语音信号处理的 一个重要出发点。即一个重要出发点。即“短时分析短时分析”。 “ “短时
4、分析短时分析” 对语音信号采用分段或叫分帧来处理。对语音信号采用分段或叫分帧来处理。短时分析技术:短时分析技术:注:语音通常在注:语音通常在1030ms1030ms内保持相对平稳,所以帧长内保持相对平稳,所以帧长取为:取为: 1030ms1030ms3.1 3.1 概述概述 3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 一、取样率和量化字长的选择一、取样率和量化字长的选择 模拟语音模拟语音 数字语音,须经过数字语音,须经过取样、量化取样、量化 电话带宽语音:电话带宽语音: 3003400Hz3003400Hz 通信系统中,数字化取样率一般为通信系统中,数字化取样率一般为8K
5、Hz8KHz, 语音信号处理中,取样率为语音信号处理中,取样率为 10KHz10KHz取样率的选择取样率的选择2. 量化字长的选择量化字长的选择 量化过程量化过程:将整个幅度值分割为有限个区间,:将整个幅度值分割为有限个区间, 落入同一个区间的样本都赋予相同的幅度值落入同一个区间的样本都赋予相同的幅度值 。 量化过程不可避免会产生量化误差。量化过程不可避免会产生量化误差。 可以证明量化信噪比为:可以证明量化信噪比为:)lg(2077. 402. 6)lg(10)(max22xexXBdBSNR 量化字长量化字长输入语音信号的方差输入语音信号的方差噪声序列的方差噪声序列的方差信号的峰值信号的峰值
6、3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 若语音信号服从拉普拉斯(若语音信号服从拉普拉斯(Laplacian)Laplacian)分布,则:分布,则:可见,每比特对可见,每比特对SNRSNR贡献贡献6dB6dB。2 . 702. 6)( BdBSNRB=7Bit时,时,SNR=35dB,可满足一般通信系统要求;可满足一般通信系统要求;实际中,因语音波形变化的动态范围可达实际中,因语音波形变化的动态范围可达55dB,所以,应,所以,应取取B 10Bit3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 二、预处理二、预处理 预处理:预处理:模拟语音的数字化、
7、放大及增益模拟语音的数字化、放大及增益控制、反混叠滤波、预加重等。控制、反混叠滤波、预加重等。 反混叠滤波反混叠滤波:在取样前,为预防混叠失真和噪声干:在取样前,为预防混叠失真和噪声干扰,采用的一个截止性能良好的模拟低通滤波器。扰,采用的一个截止性能良好的模拟低通滤波器。反混叠滤波器一般与反混叠滤波器一般与A/D做在一块集成片内。做在一块集成片内。 预加重:预加重:因语音信号高频端因语音信号高频端800Hz以上按以上按6dB/倍频倍频程下降,所以程下降,所以在在A/D前,可以采用预加重方法。即提前,可以采用预加重方法。即提升高频部分,使信号的频谱变得平坦,便于频谱分析升高频部分,使信号的频谱变
8、得平坦,便于频谱分析和声道参数分析。和声道参数分析。3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 对重构的语音波形的高次谐波起对重构的语音波形的高次谐波起平滑作用,去除高次谐波失真平滑作用,去除高次谐波失真注:注: 预加重也可预加重也可在在A/DA/D后进行,此时可采用数字后进行,此时可采用数字滤波器实现:滤波器实现:11)( zzH 预加重后的信号在分析后,还需要进行去预加重后的信号在分析后,还需要进行去加重处理还原为原来的语音信号。加重处理还原为原来的语音信号。3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 短时加窗、分帧处理短时加窗、分帧处理 通过加
9、窗、分帧处理,把语音信号分割成一帧通过加窗、分帧处理,把语音信号分割成一帧一帧短时信号,然后再把一个短时帧看成平稳的随一帧短时信号,然后再把一个短时帧看成平稳的随机信号进行处理。机信号进行处理。 分帧方法:分帧方法: 连续分段连续分段 交叠分段交叠分段3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 加窗分帧方法:交叠交叠连续连续3.2 3.2 语音信号的数字化和预处理语音信号的数字化和预处理 3.3 3.3 短时能量分析短时能量分析 语音信号的能量分析是语音信号的能量分析是基于语音信号能量随时间基于语音信号能量随时间有很大的变化,清音段的能量一般比浊音段的能量有很大的变化,清
10、音段的能量一般比浊音段的能量小得多。小得多。 能量分析包括两方面:能量分析包括两方面:能量、幅度能量、幅度 短时能量分析:短时能量分析:信号流的处理采用分帧或分段来信号流的处理采用分帧或分段来实现。实现。 分帧:分帧:可用移动的有限长窗口加权来实现可用移动的有限长窗口加权来实现。如:。如:采用直角窗采用直角窗其其他他1001)( Nnnw一、短时平均能量的定义一、短时平均能量的定义221 ( ) () ( ) ()nmnm n NEx m w nmx m w nm 注意:注意:E En n以以n n为标志。因为窗序列是沿着平方值的序列逐段移为标志。因为窗序列是沿着平方值的序列逐段移动。见图动。
11、见图3-63-63.3 3.3 短时能量分析短时能量分析 图图3-73-7短时能量序列的计算方法短时能量序列的计算方法22( ) ()( )* ( )nmExm h nmxnh n表明表明:短时平均能量相当于语音信号平方通过一短时平均能量相当于语音信号平方通过一个单位脉冲响应为个单位脉冲响应为h(n)h(n)的线性滤波器的输出。的线性滤波器的输出。3.3 3.3 短时能量分析短时能量分析 图3-6短时平均能量计算说明图3-7 短时平均能量计算方框图窗口的形状窗口的形状窗函数:窗函数:直角窗、汉宁窗、海明窗、布莱克曼窗等直角窗、汉宁窗、海明窗、布莱克曼窗等直角窗和海明窗的频率特性比较直角窗和海明
12、窗的频率特性比较3.3 3.3 短时能量分析短时能量分析 第一个零值频率第一个零值频率NTNffs101 采样频率采样频率窗口长度窗口长度 海明窗的第一个零值频率比直角窗要大海明窗的第一个零值频率比直角窗要大1倍倍左右,即带宽约增加左右,即带宽约增加1倍。同时其带外衰减也倍。同时其带外衰减也比直角窗大的多。比直角窗大的多。3.3 3.3 短时能量分析短时能量分析 2. 窗口的长度窗口的长度 窗长对能否反映语音信号的幅度变化起决定窗长对能否反映语音信号的幅度变化起决定性作用。性作用。若若N N很大很大,等效为带宽,等效为带宽很窄很窄的低通滤波器,的低通滤波器, 反映波形细反映波形细节的高频部分被
13、阻碍,短时能量很小节的高频部分被阻碍,短时能量很小若若N N很小很小,等效为带宽,等效为带宽很宽很宽的低通滤波器,的低通滤波器, 短时能量变短时能量变化很剧烈,不能得到语音信号的平滑能量函数。化很剧烈,不能得到语音信号的平滑能量函数。 窗口的长短是相对语音信号的基音周期而言。窗口的长短是相对语音信号的基音周期而言。通常认为:通常认为:一个语音帧内应含有一个语音帧内应含有1717个基音周期。但不同个基音周期。但不同人的基音周期变化很大;折中选取:人的基音周期变化很大;折中选取:在取样频率为在取样频率为10KHz10KHz时,时,N=100-200N=100-200 即即1020ms1020ms持
14、续时间持续时间3.3 3.3 短时能量分析短时能量分析 图3-9 各种宽度海明窗时的短时平均能量函数窗选太窄,窗选太窄,En随语音信随语音信号波形变化而很快起伏号波形变化而很快起伏窗选太宽,窗选太宽,En随语音信随语音信号波形变化而缓慢起伏号波形变化而缓慢起伏En随语音信号波形变化随语音信号波形变化而快速变化,充分体现而快速变化,充分体现出信号的特征。出信号的特征。二、短时平均能量的主要用途二、短时平均能量的主要用途 可以区分清音段和浊音段。可以区分清音段和浊音段。 浊音的浊音的E En n比清音比清音En大的多大的多 可以区分声母和韵母的分界,无声和有声的分界,可以区分声母和韵母的分界,无声
15、和有声的分界, 连字的分界。连字的分界。 可以用于语音识别可以用于语音识别注:注: E En n值对于高电平信号比较灵敏,此时可采用:值对于高电平信号比较灵敏,此时可采用: “短时平均幅度短时平均幅度M Mn n”,其定义为:其定义为:0( )()( ) *( )nmMx m w nmx nw n 3.3 3.3 短时能量分析短时能量分析 Mn x(n)x(n) w(n)w(n) x(n) x(n) 图图3-10 3-10 语音信号短时平均幅度语音信号短时平均幅度M Mn n的实现框图的实现框图短时平均幅度的动态范围(最大值与最小值之比)短时平均幅度的动态范围(最大值与最小值之比)比短时平均能
16、量小。比短时平均能量小。3.3 3.3 短时能量分析短时能量分析 3.4 3.4 短时过零分析短时过零分析 一、过零分析的概念一、过零分析的概念 过零过零就是信号通过零值。就是信号通过零值。 对于对于离散信号离散信号,相邻的取样值改变符号则称,相邻的取样值改变符号则称 为过零。为过零。 过零数过零数就是样本改变符号的次数。就是样本改变符号的次数。 单位时间内的过零数为单位时间内的过零数为平均过零数平均过零数。语音信号语音信号x(n)的短时平均过零数定义为的短时平均过零数定义为10sgn ( )sgn (1)()sgn ( )sgn (1) * ( )NnmZx mx mw nmx nx nw
17、n1( )0sgn( )1( )0 x nxx n二、短时平均过零数的定义和实现二、短时平均过零数的定义和实现3.4 3.4 短时过零分析短时过零分析 三、短时平均过零数的应用三、短时平均过零数的应用用于语音信号分析用于语音信号分析2. 用于从背景中找出语音信号用于从背景中找出语音信号清音和浊音的过零分布是不同的:清音和浊音的过零分布是不同的:清音具有较高的过零数,而浊音则具有较低的过零数。清音具有较高的过零数,而浊音则具有较低的过零数。3.4 3.4 短时过零分析短时过零分析 3.5 3.5 短时相关分析短时相关分析 相关分析是最常用的时域分析方法。相关分析是最常用的时域分析方法。相关函数用
18、于测定两个信号在时域内的相似性。相关函数用于测定两个信号在时域内的相似性。 互相关函数可测定两个信号间的时间滞后。互相关函数可测定两个信号间的时间滞后。 若两个信号波形完全不同,则互相关函数为零;若两个信号波形完全不同,则互相关函数为零; 若两个信号波形相同,则在超前、滞后处出现峰值若两个信号波形相同,则在超前、滞后处出现峰值自相关函数用于研究信号本身。自相关函数用于研究信号本身。1. 1. 自相关函数的定义和性质自相关函数的定义和性质一、短时自相关函数一、短时自相关函数对于确定性信号序列,自相关函数定义为对于确定性信号序列,自相关函数定义为3.5 3.5 短时相关分析短时相关分析 mkmxm
19、xkR)()()(对于随机性信号序列或周期性信号序列,自相关函数定义为对于随机性信号序列或周期性信号序列,自相关函数定义为 NNmNkmxmxNkR)()(121lim)(自相关函数有一系列有用的性质自相关函数有一系列有用的性质:(1 1) 如果如果x(n)x(n)是周期信号是周期信号( (设周期为设周期为N NP P ) ),则,则R(k)R(k)也是周也是周 期性信号,而且其周期与期性信号,而且其周期与x(n)x(n)相同。即:相同。即:R(k)R(k)R(k+NR(k+NP P) )(2 2) 偶函数:偶函数:R(k)R(k)R(R(k)k)。(3 3) R(0) = |R(k)| ,
20、R(0) = |R(k)| , 即零滞后自相关值最大。即零滞后自相关值最大。(4 4) R(0)R(0)等于确定性信号序列的能量或随机性序列的平均功率。等于确定性信号序列的能量或随机性序列的平均功率。3.5 3.5 短时相关分析短时相关分析 )()()()()(kmnwkmxmnwmxkRmn )()()()(kmnwmnwkmxmxm 2. 2. 短时自相关函数的定义短时自相关函数的定义3.5 3.5 短时相关分析短时相关分析 )()()-()()()()()(kmnwmnwkmxmxkRkRkRkRmnnnn )()()()( )()()(nhknxnxmnhkmxmxkRkkmn x(n
21、)x(n)延时延时 k k h hk k(n)(n)R Rn n(k)(k)图图3-17 3-17 短时自相关函数的实现框图短时自相关函数的实现框图x(n-k)x(n-k)3.5 3.5 短时相关分析短时相关分析 若定义若定义)()()(knwnwnhk 则则10KHz取样,计算取样,计算 时的自相关值时的自相关值2500 k1、短时自相关函、短时自相关函数可以明显地反映数可以明显地反映浊音信号的周期性浊音信号的周期性2、清音的短时自、清音的短时自相关函数没有周期相关函数没有周期性,不具有明显突性,不具有明显突起的峰值,其性质起的峰值,其性质类似于噪声。类似于噪声。二、修正的短时自相关函数二、
22、修正的短时自相关函数窗口长度的选择窗口长度的选择 N值至少要大于基音周期的两倍,否则找不到第二个值至少要大于基音周期的两倍,否则找不到第二个最大值点最大值点 N值要尽可能的小;因为语音信号的特性是变化的,值要尽可能的小;因为语音信号的特性是变化的, 如果如果N过大将影响短时性。过大将影响短时性。为此提出了修正的自相关函数为此提出了修正的自相关函数 思路:思路:用两个长度不同的窗口,截取两个不等长的序列进行乘用两个长度不同的窗口,截取两个不等长的序列进行乘积和,窗口长度相差最大延迟点数为积和,窗口长度相差最大延迟点数为K,这样始终保持乘积和的这样始终保持乘积和的项数不变项数不变。3.5 3.5 短时相关分析短时相关分析 修正的短时自相关函数的定义修正的短时自相关函数的定义 其他值其他值mNmmw0)1(01)(1 其其他他值值mKNmmw0)1(01)(2其中其中3.5 3.5 短时相关分析短时相关分析 )()()()()(21kmwkmnxmwmnxkRmn 这里,这里, 和和 采用不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 分级护理的护理全球化视野
- 电信行业网络信息安全保障措施方案
- 电力中断应急方案
- 安宁护理:关注长者生命故事与回顾
- 2026年海洋与极寒环境6G模组可靠性强化设计
- 2026年基于大数据的精密磨床预测性维护系统
- 2026年消防安全培训配套
- 唐宋至明清时期的法律制度特征
- 社区护理中的健康生活方式
- 2026年社区安全知识普及培训
- 2026年室内装修水电合同(1篇)
- GB/T 24015-2026环境管理环境尽职调查评估指南
- 康复医学XX康复康复医学实习生实习报告
- 2026广东江门市新会银湖产业投资集团有限公司招聘15人考试参考试题及答案解析
- 2026年佳木斯职业学院单招综合素质考试题库含答案详解(完整版)
- 2026年九江职业大学单招职业技能测试题库附参考答案详解(达标题)
- 高考英语重点不及物动词汇编
- 中国地质调查局局属单位2026年度公开招聘工作人员(第一批)【714人】考试参考题库及答案解析
- 医疗设备维修与售后服务规范
- 部编版三年级语文下册第三单元教材分析
- 2026年考研政治理论与时事政治试题
评论
0/150
提交评论