已阅读5页,还剩57页未读, 继续免费阅读
(控制理论与控制工程专业论文)语音特征值提取方法的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 论文题目: 学科,专业 研究生姓名 导师姓名: 语音特征值提取方法的研究 控制理论与控制工程 方杰 李英 摘要 语音信号特征提取在语音信号处理中具有举足轻重的地位。语音信号具有很强的时变 特性,只有在较短的时问间隔中语音信号的特征可看作基本保持不变,这是语音信号处理 的一个重要出发点。本文在熟悉已有的短时时域特征提取方法的基础上,并进行分析行总 结,结合实验分析这些短时时域特征参数所包含的语音信息,找到了它们在端点检测和基 音周期检测中的应用的优缺点以及内在联系和适用条件。另外,本文还对语音短时频域特 征、倒频域特征以及线性预测分析了进行了深入研究。 端点检测不但是有效提取语音特征参数的前提和保证,而且是语音有关特征参数的重 要应用。在深入研究短时能量和短时过零特征的基础上,提出了一种基于语音相对自相关 序列短时平均幅度端点检测法,收到很好效果。另外,提出了不变门限三次搜索连续词端 点检测法,有效解决了连续词端点检测由于信号幅度变化很大而带来的门限设置等问题。 语音识别拥有可观的应用前景,同时也具有很高的理论研究价值,本文对语音识别中 用到的三种特征参数l p c c 、m f c c 和r a sm f c c 提取方法进行了分析,并对它们的差分 参数的提取方法及特征提升技术作了进一步研究,分别以这几种特征参数在不同信噪比下 做了大量的识别实验,对实验结果进行了分析比较,得出一系列重要结论。 关键词:语音特征;短时过零率:端点检测;差分系数;特征提升 a b s t r a ( 了 h o wt oe x t r a c tt h ev o i c i n gf e a t u r e so fs p e e c hs i g n a lp l a ya n i m p o r t a n tr o l ei ns p e e c hs i g n a l p m c e s s i n g s i n c et h es p e e c hs i 印a l sh a v es 昀n gt i m ev a r j a n c e ,i ti sa ni m p o r t a n ts p r i n g b o a r do f s p e e c hs i g n a lp r o c e s s i n gt h a tt h ev o i c i n gf e a t u r e sc a no n l yb ec o n s i d e r e di n v a r i a b l ei nl i t t l et j m e i n t e a 1 i nt h i st h e s i s ,t h r o u g hs t u d y i n ge x i s ts h o n t i m ev o j c i n gf e a t u r e si nt i m ed o m a i na r es t u d i e d a i i dt h ei n f 0 咖a t i o ni n v o l v e di nt h e s ef e a t u r e sb yt h ee x p e r i m e n t s ,a n a l y z i n gt h ea d v a n t a g e sa l l d d i s a d v a n t a g e so ft h e s ef b a t u r e sa p p l y i n gi nt h ee n d p o i n ta n dp i t c hd e t e c t i o na n dt h ei n t e r n a li l a t i o n a n dl i m i t a t i o no ft h e s ef e a t u r e sa r ef o u n do u t w h a t sm o r e ,i nt h i sp a p e rm a n yr e s e a r c h e sh a v e b e e nd o n eo nt h es h o r t t i m ev o j c j n gf c a t u r c si nf r e q u e n c yd o m a i n ,c e p s t r i l md o m a i na n dl i n e a r p r e d i c t i o na n a l y s i s e n d p o i n td e t e c t i o ni sn o to n l yt h ep r e c o n d i t i o na n dg u a r a n t e eo fe x t r a c t j n gv o i c i n gf e a t u r e s e f f e c t i v e l yb u ta l s ot h ei m p o r t a n t 印p l i c a t i o no ft h e m an e wm e t h o do fs p e e c he n d p o i n td e t e c t i o n b a s e do ns h o n t i m ea v e r a g em a 印i t u d eo fr e l a t i v ea u t o c o r r e l a t j o ns e q u e n c e si sp r o p o s e do nt h e b a s i so fs t u d y i n gt h ef c a t u r e so fs h o r t - t i m ea v e r a g ee n e r g ya n ds h o n - t i m ea v e r a g ez e m c r o s s i n g r a t e ,t h ee x p e r j m e n t ss h o wi to b t a i n e dg o o de f f 色c ti ne n d p o i n td e t e c t i o nu n d e rn o i s e dc o n d i t i o n i n o r d e rt oo v e r c o m et h ed i f f i c u l t yo fd e c j d i n gt h ev a l u eo ft h ee n d p o i n td e t e c t i o nt h r e s h o l do ft h e c o n t i n u o u ss p e e c h ,t h et h r e e t j m es e a r c h i n ge n d p o i n td e t e c t i o ni sp r o p o s e d a ss p e e c hr e c o g i l i t i o nh a sb m a d 印p l j c a t i o nf o r e g r o u n da n di ta l s oh a st h e o r c t i c a l l yr e s e a r c h v a l u e ,t h ee x t r a c t i o na l g o r i t h mo ft h et h r e ei m p o r t a n tf e a t u r e sn a m e dl p c c ,m f c ca n d r a s m f c ca r cs i u d i e da n dt h e i rd j 虢r e n t i a lc o e f ! f i c i e n t sa n df e a t u r el i f i e rt e c h n i q u ea r ea l s o p r e s e n t e d u n d e rd i f ! f e r e n ts i g n a ln o i s er a t i o ,m u c hr e c o g n i t i o ne x p e r i m e n t su s i n gt h ed i f f c r e n t f e a t u r e sr e s p e c t i v e l yh a v eb e e nd o n ea n das e r i e si m p o n a n tc o n c l u s i o nf r o mt h ec o m p a r i s o no ft h e r e s u l t sa r ed r a w n k e yw o r d s :v o i c i n gf e a t u r e ;s h o n t i m ez e mc r o s s i n g ;e n d p o i n td e t e c t i o n ;d i a c r c n t i a lc o e f f i c i e n t s ; f e a t u r el i f t e r 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果尽我所知,除了文中特另| i 加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 本人为获得江南大学或其它教育机构的学位或证书而使用过的材料 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 盏至;日期。带口6 年;月砂日 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规 定:江南大学有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、编印或扫描等复制手段保存、 汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 签名:毒幺、导师签名:之遂 日期:1 唯年乏月2 庙日 第一章绪论 1 1 课题提出 第一章绪论 语音信号的特征分析是语音信号处理的前提和基础,只有分析出可以表示出语音信 号本质特征的参数,才能对这些参数进行高效的语音通信,语音合成,和语音识别等处理。 并且语音合成的好坏,语音识别率的高低,也都取决于语音特征的准确性和鲁棒性。因此 语音信号特征提取在语音信号处理应用中具有举足轻重的地位。众所周知,语音信号具有 很强的时变特性,只有在较短的时间问隔中才可以为语音信号的特征基本保持不变,这是 语音信号数字处理的重要一个出发点。根据所分析的参数的性质不同,可将语音信号分析 分为时域分析,频域分析和倒频域分析等方法。语音信号时域分析方法具有简单,计算量 小,物理意义明确等优点,缺点是鲁棒性差,主要有短时能量,短时平均幅度,短时过零 率,短时自相关函数和短时平均幅度差函数等。但语音信号最重要的感知特性主要体现在 功率谱当中,而牛日位变化只起很小的作用,所以相对于时域分析来说频域分析更为重要。 近几十年来人们在这方面研究了很多的特征参数,如l 临界特征矢量,线谱对( l s p ) ,线性 预测系数f l p c ) 旧】等,目前,语音识别技术中最流行的特征参数时基于声道模型和听觉机理 的l p c c ( l i n e a rp r e d j c t i v ec e p s t r a lc o e f f i c i e n t s ) 和m f c c ( m e lf r e q u e n c yc e p s t r a l c o e f f i c i e n t s ) 参数【2 l 而m f c c 在低频断具有较高的谱分辨率,对噪声的鲁棒性优于l p c c ,鬣 因此更适合语音识别。虽然说l p c c 和m f c c 在语音识别尤其是在高噪比的情况下具有很 高的识别率,但是信噪比较低的时候识别效果还远不能达到我们预期效果。近年来一些学 者对这些方法进行来一系列的改进,但是基于语音信息的多变型,模糊性,地域性以及环 境的干扰和噪声的影响,还远不能获取一个有效的语音特征参数,使语音识别水平达到一 个能使人与计算机之间能够自然交流的这个终极目标。故语音特征提取方法研究一直是近 几十年来热点问题,它是各利,语音信号处理技术的基础。 1 2 国内外研究历史及现状 语音处理技术的发展可以从1 8 7 6 年的贝尔发明电话算起,贝尔第一次采用电讯号将语 音传输到远方。1 9 3 9 年h d u d l e v 首次成功设计出了声码器,它是将语音提取参数后,传 输语音的参数,然后在接收端重新生成语音。它的发明中所孕育的伟大思想是对语音信号 的建模。1 9 4 7 年b e l l 实验室发明了语谱图仪,它是对连续的语音信号,按时间顺序作重叠 或不重叠的、以帧为单元的短时傅立叶变换( s t f t ) ,形成时间一频谱的二维图来表示语音 信息。进一步的研究进展是将语谱图转换为声音讯号输出,这是1 9 4 8 年由h a s k i n s 实验室 研制的“语谱回放机”完成的。虽然重生的语音效果并不好,但却是人类首次人工合成语 言。后来的共振峰合成法合成语音,就是源于此思想的。在对语音基本特性有所了解后, 人们开始尝试对语音进行机器识别。b e l l 实验室的d a v i s 等人根据语音帧信号的第一、第二 垩塑奎兰堡:! 堡苎 共振峰位罱提取特征,利用模拟电路得出测试语音和参考语音的相互关系,实现了英文十 个数字的识别。d e n e s 和m a t h e w 在1 9 6 0 年用数字计算机实现自动语音识别,引入了时间 规整算法改进匹配性能的方法。数字计算机成为语语音处理研究的重要工具。此后时期语 音识别的主要研究方向和方法都是利用硬件提取语音的频谱信息,使用计算机进行匹配计 算和判决。对语音处理技术产生决定性的影响的是在上个世纪7 0 年的三项研究成果:7 0 年 代初期的将动态规划法用于语音识别及隐马尔可夫模型,为语音识别在匹配算法上提供了 新的方法:中期的线性预测法,在语音识别、语音编码等方面获得了极大成功,成为现代 语音处理的主要方法,随后在七十年代末期的矢量编码量化技术,更推进了语音处理技术 的发展。1 9 8 0 年后是语音处理技术走向市场化、商品化的黄金时期,i b m 公司在1 9 8 5 年 研制成功了5 0 0 0 单词的英语听写机t a n g o r a 一5 ,在此基础上又推出了t a n 9 0 r a - 2 0 ,其识别率 可达到9 4 6 9 6 ,且有自适应说话人的特性。1 9 9 7 年1 b m 公司又推出了汉语听写机产品。 国内的研究较之国外起步较晚,主要的研究单位有清华大学、中科院声学所和西安电 子科技大学等单位。无限词汇汉语听写机首先由清华大学于1 9 8 8 年研制成功,四达公司等 单位在9 0 年代初使之产品化、商品化。但从目前的市场应用范围来看,语音产品的实际应 用还很狭窄,这说明语音技术产品还存在缺陷,达不到市场化、商品化的要求,在技术上 许多工作要做。近几年,汉语言识别成为研究的重点,国外公司投入巨资进行研究,国家 “8 6 3 ”计划也在这方面加大了投资。 1 3 语音信号特征提取方法国内外研究综述 近几十年来人们语音信号特征的研究大体可分为两个方面:基于语音信号的短时平稳 特性为前提的短时平稳分析法和语音信号的非平稳分析法。 1 短时平稳分析法 基于短时分析技术语音信号可分为短时时域特征和短时频域特征。语音信号的短时时 域特征有短时能量、短时平均幅度、短时过零率、短时自相关函数、短时平均幅度差函数 等。其中语音信号的短时能量、短时平均幅度和短时过零率是语音信号的一组最基本的短 时参数,在语音信号的端点检测中,这组参数得到广泛应用,并取得了很好的效果。语音 信号短时时域特征还有短时自相关函数,短时平均幅度差函数,短时平均幅度差函数和短 时自相关函数包含有语音基音周期信息,因此可以用它们来进行语音周期估计。对短时时 域特征是研究几十年前就非常成熟,但并不是说它近年来就停滞不前,有很多学者对上面 的方法提出了改进,取得了一系列的成果。另外,对短时时域分析和短时频域分析以及其 它的语音分析方法综合运用的语音处理技术也是当今国内外学者的研究热点。 语音信号最重要的频域特征为短时频谱( 或短时功率谱) ,短时功率谱可以由短时自相关 函数进行傅立叶变换获得,但常用的方法则是基于语音信号的产生模型,用线性预测编码 ( c ) 分析来表征。常用的l p c 分析参数包括线性预测系数线性预测系数、l p c 倒谱系数、 p a r c o r 系数、线谱对( l s p ) 、线谱频率( l s f ) 参数、f f t 倒谱以及差分倒谱等。l p c 预测 系数口f ( ,= d p ) 共p + 1 个,其中o o ( p ) = 1 ,。f ( 口可以由德宾递推算法利用短时自关函 2 数获得,也可由p a r c o r 系数k ( f ) ( i = l p ) 导出。线谱对分析是一种线性预测分析方法, 只是它求解的模型参数事“线谱对”( l i n es p e c t r u mp a j r 简称l s p ) ,它是频域参数,因而 和语音信号谱包络的峰有着更紧密的联系;同时它构成合成滤波器h ( z ) 容易保证其稳定性, 合成语音的数码率也比用格型法求解要低,另外,通过一定的计算,可以实现l s p 参数和 线性预测系数之问的转换。现在的语音识别算法的主流算法是“倒谱+ h m m ”算法,常用 的倒谱系数有:直接经过f f t 系列运算而得到的倒谱;经过l p c 变换来的l p c 倒谱系数 ( l p c c ) 以及l p c 美尔倒潜系数f l p c c m c c ) ;还有基于听觉模型的美尔特征参数m f c c 。 为了提高语音特征鲁棒性,利用环境噪声及干扰与语音帧之问相关性不强或者不相关的原 理,在识别过程当中通常把倒谱特征和它的差分倒谱一起作为语音信号的特征,很大程度 上提高了语音信号的识别率,差分倒谱是一种反映语音信号谱包络变化,即语音信号动态 特征的参数【3 l ,引进差分倒谱有利于增强特征参数对环境的鲁棒性。怎样对倒谱特征参数的 改进是近年来国内外学者研究得热点问题,除了以动态差分作为语音特征这一普遍得做法 以外,还有对m f c c 倒谱系数进行加权提升,常用的有线性提升、统计提升、正弦提升、 指数提升”。为了防止信道失真和噪声干扰w e jw e nh u n g 等人提出带通滤波器加权的方 法d w f b a 和f w f ba i ”l 取得一定成效。还有学者着眼于语音单边自相关序列的抗噪性, 提出了o s al p c c 和r a sm f c c 【7 _ 9 】。当信噪比较低或者噪声不平稳时,对于自相关没有 处理掉的噪声部分信息,一些学者也对它的补偿技术作了一定的研究,提出了l a i ”1 1 啤h 偿 技术,大大降低了这部分的影响 说话人识别系统近年研究的热点,在说话人识别系统中特征提取是最重要的环节,它 与一般的语音识别不同在于它需要提取说话人的个性特征,因此难度较大,但根据人脑的 识别机理和人的语谱特性的唯一性,国内外学者共同认为随着语音信号处理技术的发展, 完全有可能使这项技术走向成熟。目前说话人识别系统常用的特征参数有:语音短时能量、 基音周期( 现已证实基音周期及其派生参数携带有较多的个人信息) 、语音短时谱或b p f g 特征( 包括1 4 1 6 个b p f l 、线性预测系数l p c 、共振峰频率及带宽、l p c 倒谱等,以及反 映这些特征动态变化的线性回归系数等,其它的特征还包括鼻音联合特征的、谱相关特征、 相对发音速率特征、基音轮廓特征等。另外,在此基础上一些学者对这些特征进行加工变 换,如k l 变换等,而得到加工后的能很好反映说话人个性特征二次特征。其中倒谱特征 和基音特征是较常用的特征,根据日本人m a t u i 和f u n l i 两人的工作,两者混合使用取得了 很好的识别效果。也有学者通过对倒谱二次特征进行加权、组合、微分、筛选等的综合运 用,也取得了很好的识别效果| 1 2 】。 2 语音信号非平稳分析 前述语音的特征表征在语音分析中一直占据着主导地位,取得了一系列的重要成果,但 是它们是以信号短时平稳特性为前提的,这就使得传统的语音分析技术在语音特征的更精 细刻画及分辨率的提高上遇到了难以逾越的障碍,从而影响了后续相关技术的发展。时频分 析法【1 3 】是目前发展迅速的一种新的信号处理技术,它注意到了信号的时变特性,把时频域 的概念引入进来,将信号从一维l 2 ( r ) 空间转换到l 2 ( r 2 ) 空间进行分析,从而为非平稳信号的 处理研究打开了新的篇章。常用的时频率分布包括w i g l l e r 分布、短时傅立叶变换等,它们 垩塑查兰堡圭堡苎 可用来提取信号的瞬态时频信息。最近的研究表明,许多新型的时频分布均可归结为c o h e n 类时频表示,它们可看作是由w j g l l e r 分布经过核函数的平滑滤波后产生的一种移不变的二 次型分布。各种时频分布的特性与所采用的核函数紧密相关,取不同的核函数就会得到不 同的时频表示目前较常用的有: w i g i l e r 、r i c h a c z e k 、c h o iw j l l i a m s 、c o n e 分布和能量密 度谱( s p e c t m 掣a i n ) 等。这些时频分析法都有其优缺点,主要表现在时频分辨率与交叉干扰的 矛盾上,因此,在时频域或扩展到时间尺度域寻找一种性能优良的核函数,以达到既降低 交叉项又能提高时频集中的信号表示方法,是目前广泛研究的课题。 小波变换i “】是八十年代末期在国外首先发展起来的一种理论,在语音信号处理领域具广 泛的应用前景。信号x ( t ) 在尺度a ,o 情况下的小波变换为:w l ( a ,t ) = ( x ( t ) ,、l ,。,( t ) ) ,其中 、l ,。( t ) = 1 a 1 ”、l ,( ( t t ) a ) ,、| ,。( t ) 称为基本小波,、i ,。( t ) 是基本小波的移位与伸缩。小波变换 将信号从一维l 2 ( r ) 空间转换到时间尺度域空间,它实质上是时频分析方法的广义化,适当 选择、l ,( t ) 就可使其在时域和频域都具有很好的局部特性。小波变换在短数据语音信号的频 谱估计以及语音信号的基音检测等方面己得到初步应用,这方面的深入研究有待于继续进 行。 1 4 本课题主要研究的内容 本课题的主要目的是为语音识别、语音编码、语音合成等语音处理技术提供有效的特 征参数。 虽然,长期以来短时分析技术是语音信号的主要分析技术,并且几十年来人们它进行 了广泛的研究,并取得显著成效,但并不是说它已经完全成熟,事实上它还远没有达到我 们预期要求,它仍然存在很多生长点和未知领域值得我们去探索,国内外学者近年也从没 有停止过这方面的研究。因此,基于语音信号短时分析技术仍是本课题研究的重点,具体 研究工作包含: ( 1 ) 在熟悉前人研究的基础上,对前人做过的工作进行总结,结合实验分析这些特征 参数的包含的语音信息以及优缺点,并找出它们的内在联系以及适用条件,获取鲁棒性更 强的语音特征。 ( 2 ) 端点检测是有效提取语音特征参数的前提和保证,在深入研究短时能量和短时过 零特征的基础上,提出了一种基于语音相对自相关序列端点检测法,收到很好效果。并提 出了不变门限三次搜索连续词端点检测法,有效解决了连续词端点检测由于信号幅度变化 很大而带来的门限设置问题。 ( 3 ) 对语音识别中用到的特征参数l p c c ,m f c c ,r a sm f c c 进行了深入的研究, 并结合具体实验来分析特征提升和差分参数对识别率的影响。 4 第二章语音信呼衙时时域特征 第二章语音信号短时时域特征 语音的时域特征就是分析和提取语音信号的时域特征参数。进行语音分析时,最先接触 的并且也是最直观的就是它的时域波形。语音信号本身就是时域信号,因而时域分析是最早 使用也是最广泛使用的分析方法,这种方法直接利用语音信号的时域波形基于短时分析技术 的语音信号特征的可分为短时时域特征和短时频域特征,短时时域特征有短时能量、短时平 均幅度、短时过零率、短时自相关函数、短时平均幅度差函数口。l i ”j 等。这是语音信号的最基 本的短时参数,在各种语音信号数字处理技术尤其是端点检测和基音周期检测中有重要应用。 2 1 短时能量及短时过零率特征 到。 短时能量特征和短时过零特征是语音信号的基本特征参数,在语音端点检测中会经常用 2 1 1 短时能量和短时幅度差 设语音波形的时域信号为工( f ) 、加窗分帧处理后得到的第n 帧语音信号为x 。) ,则) 满足下式: x ( 用) = w ( 埘p 0 + ,1 ) 0s 埘s 一1( 2 1 1 ) 其中的n = 0 ,l l2 丁,并且j v 为帧长,丁为帧移长度。w ) 为矩形窗表达式为: 。( 。) :1 ”2 ( ! 二! 二1 ( 2 1 2 ) ) 2 o ;其它值 “卅 设第n 帧语音信号h ( ) 的短时能量用巴表示,则其计算公式如下: e 。= x :( m ) ( 2 1 3 ) 匕是一个度量语音信号幅度值变化的函数,但它有个缺陷,即对高电平非常敏感( 因为 它在计算的时用的是信号的平方) 。因此在某些领域内可以用一个度量语音信号幅度值变化的 函数,即短时平均幅度 厶来代替,它和短时能量的区别在于信号的小取样值和大取样值不会 因取平方而造成较大差异,在某些领域会带来一些好处,它定义为: m 。= k 仰) 1 ( 2 工4 ) 图2 1 和图2 2 是“八”的短时能量和短时幅度的归一化幅度: 江南大学硕:t 论文 图2 1 “八”短时平均能量图2 2 “八”短时平均幅度 可见浊音段段的短时平均能量和短时平均幅度要比清音段的高的多,因此可以利用此特 点来区分声母与韵母的分界,无声和有声的分界,练字( 字间无间隙) 的分界等。 2 1 2 短时过零率和短时过门限率 短时过零表示一帧语音信号波形穿过横轴( 零电平) 的次数。过零分析是语音时域分析 中最简单的一种。对于连续语音信号,过零意味着时域波形通过时间轴;而对于离散信号, 如果相邻的取样值的改变符号称为过零。过零率就是样本改变符号次数。 定义语音信号h ) 的短时过零率乙为: z 。= 吉晒k ( m ) 卜s g n h 一1 ) 】| ( 2 1 5 ) 其中s g i l 【】为符号函数,即: s 卧,= 忙高 眨, 清音的能量多集中在较高的频率上,它的平均过零率要高于浊音,故短时过零率可以用 来区分清音、浊音以及无声。但在实际应用时,过零率容易受到刖d 转换时的直流偏移、5 0 h z 交流电源干扰以及噪声的影响。减少这些干扰可以有两种方法:一种是采用带通滤波其消除 信号中的直流和5 0 h z 低频分量;另一种方法市用过门限率来修改过零率,减少随机噪声的 影响。在零电平附近设置门限r ,定义短时平均过门限率为: z 。= 吉i s 印【) 一t 卜s g i l f _ ( m 一1 ) 一r 】1 + i s g i l 【( m ) + ,一s g l l 【) + t 】| ( 2 1 7 ) 图2 3 和图2 _ 4 是一段语音“我爱北京”的短时过零率和短时过门限率在无噪和信噪比 s n r = 1 0 d b 情形下的波形图,由图2 - 3 可以看出短时过零率虽然在纯净状态下语音段的检测 要好于短时过门限率,但是它极易受噪声影响( 图2 4 第b 个图) 而失去效果,短时过门限 笙三皇堕萱笪芏堑堕盟堡鲨! ! : 率就有很好的噪声鲁棒性( 图2 - 4 第c 个图) ,因此在实际应用中常用短时平均过门限率来代 替短时平均过零率配合短时平均幅度来进行端点检测。 刨 = 4 0 型2 0 翟 0 2 0 划 罂1 0 0 时问,抽样数 。 , 。 。 1 l ,。j 。- 二一,1 。:! :,j 05 01 0 01 5 02 0 02 5 03 0 03 5 0 帧数,个 o5 01 0 01 5 02 0 02 5 03 0 03 5 0 帧数个 b 图2 3 ( a ) 一段语音“我爱北京”波形图( b ) 语音“我爱北京”短时过零率 ( c ) 语音“我爱北京”短时过门限率 划 罂 4 0 世 粤2 0 0 3 0 釜z o 1 0 o 时间抽样数 05 010 0 15 0 2 0 0 2 5 03 0 03 5 0 帧数,个 05 01 0 0 1 嵌价2 0 0 2 5 03 0 03 5 0 b 图2 4 ( a ) 一段语音“我爱北京”波形图( s n r = 2 0 d b ) ( b ) 语音“我爱北京” 短时过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年青海辅警招聘考试题库及1套参考答案详解
- 2025年黔南布依族苗族自治州辅警招聘考试题库附答案详解
- 2025年衡阳辅警招聘考试真题附答案详解(b卷)
- 2025年玉溪辅警招聘考试真题及一套答案详解
- 2025年黄南州辅警协警招聘考试备考题库附答案详解(研优卷)
- 2025年铁岭辅警招聘考试题库及答案详解(有一套)
- 2025年鄂州辅警协警招聘考试真题及答案详解(名师系列)
- 2025年海西州辅警协警招聘考试备考题库含答案详解(考试直接用)
- 2025年盘锦辅警协警招聘考试备考题库附答案详解
- 2025年海西州辅警协警招聘考试真题附答案详解(能力提升)
- 2025贵州毕节市金沙县国有资本投资运营集团有限公司招聘笔试及笔试历年备考题库附带答案详解2卷
- 福建省厦门市大同中学2025-2026学年高二物理第一学期期末统考试题含解析
- 分期购车的合同范本
- 2025至2030废旧手机行业项目调研及市场前景预测评估报告
- 箱变移位施工合同协议
- 智启氢程:AI技术在氢能领域的应用研究
- 全国大学生职业规划大赛《运动训练》专业生涯发展展示【高职(专科)】
- IPC7711C7721C-2017(CN)电子组件的返工修改和维修(完整版)
- 学堂在线 护理研究方法 期末考试答案
- GB/T 9116-2010带颈平焊钢制管法兰
- 第二课美术作品与客观世界(2)课件-高中美术湘美版(2019)美术鉴赏
评论
0/150
提交评论