(信号与信息处理专业论文)语音变调算法研究及其在语音合成中的作用.pdf_第1页
(信号与信息处理专业论文)语音变调算法研究及其在语音合成中的作用.pdf_第2页
(信号与信息处理专业论文)语音变调算法研究及其在语音合成中的作用.pdf_第3页
(信号与信息处理专业论文)语音变调算法研究及其在语音合成中的作用.pdf_第4页
(信号与信息处理专业论文)语音变调算法研究及其在语音合成中的作用.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(信号与信息处理专业论文)语音变调算法研究及其在语音合成中的作用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东大学硕士学位论文 摘要 随着信息技术和多媒体技术的发展,普通的音视频素材已经不能满足人们生产 活动和娱乐生活的需求。应运而生的语音变调技术,是在保持音频文件播放速度 不变的前提下,按照某种算法对说话人的音调进行调整,从而实现音调的升高或降 低,而语音音调的不同主要是由基音频率和共振峰频率来决定,因此音调的改变 可以通过改变原始语音信号的基音频率和共振峰频率来实现。目前存在的语音变 调方法都还不是很完善,还存在着各种各样的缺点。 语音合成技术是随着人们对人机交互提出要求而发展起来的一种语音信号处理 技术,是将计算机输出的或人为输入的一些非语音信息如文字、数字、标点符号 等转换为清晰自然可懂的语音输出,这种技术又称为文语转换技术( t e x tt o s p e e c h ,简称t t s ) 。较早的文语转换系统在合成模块一般采用参数合成法,其中 共振峰合成法和l p c 合成法应用较多。对参数合成法的研究起步比较早,所以参 数合成法已具有相对成熟的理论基础,而且实现起来较简单,但实际合成的连续 语音不自然,有明显的机器腔。二十世纪九十年代初,基音同步叠加技术的研究 开始兴起,并成功运用到了r 兀s 系统中。基音同步叠加( p s o l a ,p i t c hs y n c h r o n o u s o v e r l a pa d d ) 技术不同于简单的波形拼接技术,它在对语音基元拼接的时候,首 先对音频文件分析得到基音标注,然后以基音周期为单位对拼接单元的基频、音 长和音强等韵律特征做出适合的调整,在不改变原始语音基元音质的基础上,灵 活地改变语音的韵律特征。本文通过分析研究现有语音合成方法存在的优缺点, 在p s o l a 算法的基础上,提出了一种时长和基频分步处理的语音合成方法,并 通过实验证实了其有效性。 本文主要工作如下:l 、对现有变调方法作了分类分析,主要分析了3 种典型方 法的变调原理和特点,即时域同步叠加固定合成法( s y n c h r o n i z e do v e r l a p a d df i x v d s y n t h e s i s ,s o l a f s ) 、频域插值法和相位声码器法,并通过分析研究指出了它们 的优缺点。然后在s o l a f s 算法的基础上,提出了一种改进的基于s o l a - f s 的 变调方法,仿真实验发现该变调方法不仅能在保持音频播放时间不变的前提下改 变音调,而且降低了算法复杂度,并在一定程度上减少了噪音,并给出了改进前 山东大学硕士学位论文 后运行时间的比较,以及改进前后对应的语谱图。实验发现改进的s o l a f s 方 法在自然度上的优势明显优于其他变调方法,然后给出了三种不同变调算法下变 调结果的主观测昕对比。结果表明:不论对语音音调的升高还是降低,在相同变 调系数下,改进的s o l a f s 方法均具有虽好的变调效果。 2 、将改进的s o l a - f s 变调方法与波形拼接技术相结合,提出了一种音高、时长 分步处理的语音韵律拼接合成方法,既保持了语音拼接单元的清晰度和自然度, 也在一定程度上提高了合成语音的韵律修改能力。文中给出了在不同的音高调整 参数下,传统的t d - p s o l a 方法与时频分步合成法在基频修改时所对应的合成语 音的时域图和基频轨迹图,并在最后给出了算法复杂度的比较。实验证明,传统 的t d p s l o a 方法在音高修改时,其合成语音对应的基频轨迹的包络与语音样本 的基频包络有较大出入,尤其是当基频修改幅度较大时,会造成叠加单元的混叠 或遗漏,从而影响合成语音的效果。而时频分步法在音高修改时,其合成语音对 应的基频包络相对语音样本基本不变,而且当音高变化幅度较大时仍能达到较好 的语音合成效果。但是,本文提出的合成方法在时间复杂度上会增加,但随着计 算机技术和数据存储技术的发展,算法的复杂度将不会是一个大问题。论文最后 对所做的全部工作进行了总结,并给出了论文中存在的不足和下一步要研究的方 向。 关键字:语音变调:s o l a f s ;语音合成;t d p s o l a ;时频分步 2 山东大学硕士学位论文 a b s t r a c t w i t ht h ed e v e l o p m e n to fi n f o r m a t i o na n dm u l t i m e d i at e c h n o l o g y , n o r m a la u d i oa n d v i d e om a t e r i a l sc a n n o ts a t i s f yp e o p l e ss p e c i f i cr e q u i r e m e n t ,s u c h 邵f o rp e r i o d i c i t y a n de n t e r t a i n m e n t t h e n , t h ep i t c hs h i f t i n gt e c h n o l o g yr i s ei nr e s p o n s et ot h ep r o p e r t i m ea n dc o n d i t i o n s p i t c hs h i f t i n gi sam e t h o dt h a tn o to n l ya l t e r st h et o n eb u ta l s on o t c h a n g et h ed u r a t i o na c c o r d i n gc e r t a i na l g o r i t h m d i f f e r e n tt o n ei sm a i n l ye m b o d i e di n d i f f e r e n tp i t c hp e r i o da n df o r m a n tf r e q u e n c y s ow ec a nc h a n g et h ep i t c hp e r i o da n d f o r m a n tf r e q u e n c yi no r d e rt oa c h i e v ep i t c hs h i f t i n g t h ep i t c hs h i f t i n gm e t h o d s p r e s e n t e dn o wa l w a y sh a v ek i n d so f d e f e c t s s p e e c hs y n t h e s i st e c h n o l o g yi sa k i n do fs p e e c hs i g n a lp r o c e s s i n gt e c h n o l o g yt h a t d e v e l o p e d 、) l i t ht h er e q u i r e m e n to fh u m a n - c o m p u t r ri n t e r a c t i o n s p e e c hs y n t h e s i s t e c h n o l o g yi sa m e t h o dt h a tc o u l dc o n v e r tt h et e x tt on a t u r a ls p e e c hs i g n _ a l ,w h i c hi s g e n e r a l l yc a l l e dt t s e a r l yt t sm a i n l ya d o p t sp a r a m e t e rs y n t h e s i sm e t h o d s ,s u c h 弱 f o r m a n ts y n t h e s i sm e t h o da n dl p cm e t h o d p a r a m e t e rs y n t h e s i sm e t h o di sm a t u r ei n t h e o r ya n de a s yt ob ei m p l e m e n t e d , b u tt h es y n t h e s i v a x is p e e c hs i g n a li sn o tn a t l l g a la n d h a sa l lo b v i o u sa r t i f i c i a lf e e l i n g i nt h ee a r l y19 9 0 s ,t h ep s o l am e t h o dh a sb e e nu s e d i ns p e e c hs y n t h e s i s d i f f e r e n t 、i t l lt h et r a d i t i o n a ls p l i c i n gm e t h o d , t h ep s o l am e t h o d f i r s t l yh a s 锄a n a l y s i so nt h es p e e c hs i g n a l ,i no r d e rt 0a c q u i r et h ep i t c hm a r k s , a n d t h e nh a saf l e x i b l ea d j u s t m e n to nt h ep r o s o d yf e a t h e r s ,s u c h 鹳f u n d a m e n t a lf r e q u e n c y , d u r a t i o na n di n t e n s i t y b a s e do nt h es t u d yo fk i n d so fs p e e c hs y n t h e s i sm e t h o d sa n d t h ep s o l am e t h o d ,t h i sp a p e rd e v e l o p sas p e e c hs y n t h e s i sm e t h o dt h a tc o u l dd e a l w i t ht h ep i t c ha n dd u r a t i o ni n f o r m a t i o np a r t l y t h e n , w eh a v eas i m u l a t i o no nt h e t d p s o l am e t h o da n dt h e s p e e c hs y n t h e s i sm e t h o dd e v e l o p e di nt h i sp a p e r a c c o r d i n gt h er e s u l t so ft h es i m u l a t i o n , w ef i n d t h a tt h em e t h o dd e v e l o p e di nt h i s p a p e ri se f f e c t i v e t h em a i nw o r k so ft h i sp a p e ri s 懿f o l l o w :l 、i nt h i sp a p e r , t h ep r e s e n t e d p i t c h s h i f t i n gm e t h o d sa r cs t u d i e da n di m p l e m e n t e d ,e s p e c i a l l yt h et h r e et y p i c a lp i t c h 3 山东大学硕士学位论文 s h i f t i n gm e t h o d s ,w h i c ha s o l a - f sm e t h o d , i n t e r p o l a t i o n - o n - f i - e q u e n c ym e t h o d , a n dt h ep h a s ev o c o d e rm e t h o d m e a n w h i l e ,t h em e r i t sa n df a u l t sa l eo v e na l u mt h e m a l s o ,t h ea u t h o rp r o v i d e sa ni m p r o v e dp i t c hs h i f d n gm e t h o d sb a s e do ns o l a f s m e t h o d , t r o u g ht h ee x p e r i m e n t s , w ef i n dt h a tt h ep i t c h - s h i t ! t e da u d i os i g n a ln o to n l y a l t e r st h et o n e ,b u ta l s on o tc h a n g et h ed u r a t i o n ,a n da l s og a i nc e r t a i ni m p r o v e m e n to n t h ed e c r e a s i n gn o i s e sa n dt h ec o m p u t a t i o nc o m p l e x i t y a c c o r d i n gt ot h es i m u l a t i o n , w e f o u n dt h a tt h ei m p r o v e ds o l a f sm e t t h o dc o u l da c q u i r em o r en a t u l ms p e e c hs i g n a l t h a no t h e rp i t c hs h i f t i n gm e t h o d s a l s o ,t h es o u n dq u a l i t ye v a l u a t i n g0 1 1t h r e 2 d i f f e r e n tm e t h o d si sg i v e ni nt h i sp a p e r t h er e s u l t so fa u d i t o r ye v a l u a t i n gt e s t ss h o w t h a t , u n d e rt h eo v e np i t c h - s h i f t i n gr a t i o ,w h e t h e ru po rd o w n , t h es o u n dq u a l i t y p r o c e s s e db yt h ei m p r o v e ds o l a f sm e t h o di st h e b e s to fa 1 1 2 、c o m b i n gt h e i m p r o v e ds o l a - f sm c 噎h o da n dt h et r a d i t i o n a lp s o l am e t h o d , t h ea u t h o rp r o v i d e sa n e ws p e e c hs y n t h e s i sm e t h o d ,d u r i n gw h i c ht h ep i t c ha n dt h ed u r a t i o ni sd e a l tw i t h p a r t l y t h i sm e t h o dc a l ln o to n l yk e e pt h ev o i c eu n i t c l e a ra n dn a t u r a l ,b u ta l s oi m p r o v e t h ec a p a b i l i t yo fa l t e r i n gp r o s o d y a te n d , t h es i m u l a t i o nr e s u l t si so v e na b o u t t d - p s o l am e t h o da n dt h em e t h o dp r o v i d e di nt h i sp a p e r u n d e rt h ed i f f e r e n tp i t c h s c a l er a t i o ,t h et i m ed o m a i nc l l a na n dt h ep i t c hc o n t o u rc h a l ti s 咖e na b o u tt h et w o s p e e c hs y n t h e s i sm e t h o d , a l s ot h ec o m p a r i s o no ft h ec o m p l e x i t yo ft h et w om e t h o d si s g i v e 几a c c o r d i n gt ot h ee x p e r i m e n t s ,w ef i n dt h a tt h et r a d i t i o n a lt d - p s o l am e t h o d h a sab i g g e rd i f f e r e n c ef r o mt h ee n v e l o p eo ft h eo d g i n a lp i t c hc o n t o u rt h a nt h em e t h o d p r o v i d e di nt h i sp a p e r 9e s p e c i a l l yw h e nt h ep i t c hs c a l er a t i oi sb i g g e r b u tw h e n t h e r a t i oi sb i g g e r , t h en e wm e t h o dc 觚a l s og a i nb e t t e re f f e c t m e r e l y , t h en e wm e t h o dh a s ab i gc o m p l e x i t y , b u t 、 i lt h ed e v e l o p m e n to ft h ec o m p u t e ra n dd a t as t o r et e c h n o l o g y , t h ec o m p l e x i t yw o u l dn o tb ea q u e s t i o n k e yw o r d s :p i t c hs h i f t i n g ;s o l a - f s ;s p e e c hs y n t h e s i s ;t d p s o l 吣d e a l t 晰t 1 1 d u r a t i o na n dp i t c hp a r t l y 4 山东大学硕士学位论文 算术符号 【】 m o d ( ,) n 均 丁 f f l r , m i n i li e x p ( ) 兀 l n d 一1 f 1 符号说明 意义 累加 取整 取余 求最大值 求根方 求傅里叶变换 求矩阵共轭 求最小值 求积分 求绝对值 求e 指数 求连乘 求卷积 相乘 求对数 求矩阵的逆 求傅里叶逆变换 山东大学硕士学位论文 缩略词英文全称中文 t r st e x tt os p e e c h文语转换 l p cl i n e a rp r e d i c t i o nc o d i n g线性预测合成 p s o l ap i t c hs y n c h r o n o u so v e r l a pa d d基音同步叠加 l m a l o gm a g n i t u d ea p p r o x i m a t e幅度对数估计 s o l a f s s y n c l l r o m z e do v e r l a p - a d df i x e c ! s y n t h e s i s 时域同步叠加固定合成 s 叮s h o r t - t i m ef o u r i e rt r a n s f o r m短时傅里叶变换 r d - p s o l at t m e o m a i np i t c hs y n c h r o n o u so v e r l a pa d d 时域基音同步叠加 f d p s o l a f r e q u e n c y - d o m a i np i t c hs y n c h r o n o u so v e r l a pa d d 频域基音同步叠加 l p c - p s o l al p cp i t c hs y n c h r o n o u so v e r l a pa d d线性预测基音同步叠加 t f i t u n e f i e q u e n c yi n t e r p o l a t i o n时频插值 p c mp u l s ec o d em o d u l a t i o n脉冲编码调制 6 山东大学硕士学位论文 1 1 研究背景 第一章绪论 语言是人类沟通最重要的工具,它方便有效,是人类特有的功能。但是随着多 媒体技术的发展和人们生活水平的提高,正常的音视频材料已经不能满足人们的 生活需求,语音变调技术是为解决这一问题而兴起的一种语音信号处理技术。目 前已有的变调方法主要分为两大类:一类是时域插值拼接法,例如时域同步叠加 固定合成法1 1 川;另一类是频域方法,如相位声码器法( p h a s e - v o c o d c r ) 5 - 7 】。时域 处理方法的优点是计算量小,而且变调结果自然度很好,但是由于拼接处理会带 来相位不连续,产生噪音;频域方法由于要进行时频转换、估计相位和计算真实 频率,需要的运算量较大,而且变调后语音不自然,有金属声。现今,普遍应用 的变调方法为可变重放速率方法。例如雅马哈公司生产的大规模集成电路 y s s 2 2 2 d 和y s s 2 1 6 b 就是采用可变重放速率法来实现数字变调功能的,其内部 集成了a d 、d a 和数字信号处理器,根据采样和数据重放时速度的不同来实现 变调,重放比采样速度快则升调,反之则降调。此外,为了保持播放时间与原语 音相同,还需要进行语音的时长调整,由于涉及到商业保密,其具体实现方法并 未向外界公开。而据可查询资料中的变调方法也都存在着变调范围小、音质差、 复制或删除数据时带来相位不连续等弊端i s 2 0 】。因此对变调方法的进一步研究是 具有现实意义的。 当前,各种机器逐渐渗透到了人类的生产活动和社会活动中,因此进一步改善 人和机器之间的关系,使人机交互更加和谐是我们近期一直要努力的目标。随着 计算机和一些智能设备的广泛应用,为了更好的实现与机器之间的通信,人们对 人机之间的语言通信提出了需求,而语音是语言的声学表现形式。让机器“听”得 懂人说话,并可以像人一样“说话”,可以使人的手和脚在很大程度上得到解放, 大大提高工作效率和生活质量,尤其对于有听觉障碍或发音障碍的人,其意义更 重大,这就是科学工作者研究了几十年的语音识别和语音合成技术 2 1 - 2 7 1 。 就语音合成而言,其发展较语音识别技术要成熟一些,已经在许多方面得到了 7 山东大学硕士学位论文 实际应用,发挥了很好的效益脚- 3 0 l 。2 0 世纪6 0 年代,首先实现了英文t t s 系统。 近几十年来,语音合成领域中的大量新技术和新设计开始出现。从2 0 世纪7 0 年 代末开始,出现了一种称为文语转换系统的新型计算机口语输出系统,这种系统 的特点是用最基本的语音单元,比如音素、双音素、半音节或音节,作为合成单 元建立语音库,通过合成单元拼接达到无限词汇的合成。为了保证合成器的输出 具有良好的音质,在这种系统中除了语音库外,还有一个相当庞大的规则库对合 成语音的音段特征和超音段特征( s u p e r - s e g m e n t a lf e a t u r e ) 进行控制。目前世界 上任何一种文语转换系统都是针对某一种或几种特定语言的。英语文语转换系统 起步早,成绩也最好。其中一个具有代表性的成果是d e c t a l k ,它由m i t 的d k l a t t 博士于1 9 8 2 年研制完成,d e c t a l k 可以发出可供用户选择的七种不同音色的语 音,在发音速度增加到每分钟3 5 0 词时也可以达到清晰自然的效果。这是目前世 界上享誉最高的产品,并在进一步发展中。瑞典皇家理工学院f a n t 实验室研制成 功的多语种文语转换系统是另一个成功的例子。从二十世纪8 0 年代开始,国内一 些科研机构对语音合成投入了大量的研究,如中科院声学所,社科院语言所、清 华大学、中国科技大学等科研单位相继展开了对语音合成系统的研究。虽然起步 晚了些,但进展很快。1 9 9 8 年,在国家8 6 3 ”智能计算机计划的推动下,中国科 技大学研制成功了一种新型的基于语音数据库的k d 一8 6 3t r s 系统,并先后应用 在了深圳华为技术公司设计的“1 1 4 自动电话报号系统”和国家工商总局设计的“工 商企业语音( 传真) 查询系统”中。该系统首先通过截取自然语音设计出具有成千 上万汉语韵律变化信息的语音基元库,在语音合成时,从语音库中选取合适的基 元,然后通过相应的韵律调节来实现语音的合成。至此,国内汉语1 r s 技术取得 了可观的进步。 随着人们认知水平和需求的提高,语音合成技术正在逐步走向成熟,它从参数 合成法发展到传统的拼接合成法,再到基音同步拼接合成法,不仅逐步提高了合 成语音的清晰度和自然度,还提高了合成语音的韵律修改能力。目前常用的语音 合成技术有:共振峰合成法、l p c 合成法、p s o l a 拼接合成法、l m a 声道模型 技术。在实际应用中,人们通常将多种技术结合运用,以实现较好的合成音效。 目前语音合成技术已达到了无限词汇合成的目标,但在自然度方面还没有达到令 3 山东大学硕士学位论文 人满意的效果,尤其当韵律参数变化幅度比较大时,还存在着很多限制,合成语 音不够理想。因此对语音合成技术的进一步研究是具有实际意义的。 1 2 语音变调 1 2 1 语音变调基本原理 语音变调技术是通过修改原始语音信号的基音频率和共振峰频率来实现音调的 改变的,是语音合成的基本应用。声音是由物体的振动产生的。乐音体系根据振 动频率的不同,将乐音分成音级,基本音级广泛采用c d e f g a b c 这8 个字母命 名,某音级与往上数8 个音级之间的距离称为一个“纯八度”,世界上普遍采用的 1 2 平均律将一个纯八度分成1 2 个均等的半音,相邻两个半音间的振动频率相差 2 1 n 2 倍,一个纯八度频率相差2 倍p 。 根据十二平均律和标准音,将信号中的所有频率成分升高或降低2 m z 倍,就能 实现音调升高或降低一个半音。设原信号频率为 ,变调后频率为f ,则二者的 关系满足( 1 2 1 ) 式: = 兀2 ( 1 2 1 ) 其中d = 士l ,士2 ,士3 ,。当d 0 时,实现升调;反之,降调。 1 2 2 语音变调的应用 随着信息技术和多媒体技术的发展,我们面对的音视频信息越来越多,有时正 常的音视频素材己经不能满足人们特定的需求,例如在动画片中,为了刻画一些 奇人怪物,就要用奇声怪调对人物个性进行修饰,正常语音无法满足这种需求。 又如广播电台变声热线节目,为了保护个人隐私,必要时需要对人物声音进行修 饰,这里就要用到本文研究的语音变调技术。另外变调技术在语音邮件、多媒体 音效处理、军事保密通信等领域也有重要应用,其中运用最广泛的应属k t v 等 娱乐场所的卡拉o k 机装置,人们在唱歌时,总希望伴奏音乐的音调适合自己的 嗓音。在一些卡拉o k 机中就有相应的变调装置,通过专门的硬件来完成这一功 能。另外,声卡已成为计算机的基本配置,但无变调功能,为弥补这一缺憾,可 山东大学硕士学位论文 以采用软件方法对声音文件重新编码,使声卡回放时声调改变。因此语音变调具 有很实际的研究价值。 另外,变调技术还可用于语音合成中来实现音高的变化。通过采用变调技术来 改变原始语音的基音频率,从而得到音高改变了的目标语音。因此如何将语音变 调技术适当的运用于语音合成中,达到较好的语音合成效果,也是本文研究的内 容之一。 1 3 语音合成 1 3 1 语音合成的基本原理 人在发出声音之前,大脑要进行一段高级神经活动,即先有一种说话的意向, 然后围绕这种意向生成一系列相关的概念,最后将这些概念组织成语句通过口腔 发音输出。日本学者f u j i s a k i 根据人在说话过程中所用到的各种知识,将语音合 成由浅到深分成3 个层次。它们是:按规则从文本到语音的合成( t e x t - t o - s p e e c h ) 按规则从概念到语音的合成( c o n c e p t - t o s p e g c h ) ;按规则从意向到语音的合 成( i n t e n t i o n - t o - s p e e c h ) 。目前语音合成的研究只局限在从文本到语音的合成上, 其示意图如图1 1 。 , j 蔓i 岛 :j j f ) ” :“一 一蜘仁, 图1 1 语音合成系统示意图 语音合成,又称文语转换( t e x tt os p e e c h ,t r s ) 技术,是语音学与数字信号 处理技术相结合的交叉学科,涉及认知科学、心理学、语言学、计算机科学、模 l o 一厨一叠挚 山东大学硕士学位论文 式识别和人工智能等学科。t t s 主要解决如何将文字信息转化为可听的音频信息, 即让机器“说话”。但t t s 系统所完成的“说话”功能与传统的声音回放有着本质的 不同。录音机等传统的声音回放设备是经过预先录制声音,然后回放来让机器“说 话”的。t t s 系统则可以实现在任何时候将任意文本转换为可读语音,真正实现机 器“像人一样开口说话”。 在许多以西方语言为母语的人听起来,中国人讲出的汉语,抑扬顿挫、轻重相 随、缓急相间,节奏分明,像在听音乐一样。语流中这种由音高,音长和音强等 方面的变化所体现出来的特征,称为“韵律特征( p r o s o d i cf e a t u r e ) ”,也叫“超音段 特征 。这些特征反应了语音在基频,共振峰,能量以及谱分布特性上的差异。对 于同一个基元,由于语境不同和重音的表现不同,其声学特征有很大的差别。通 过对语音数据的基频,音长、音强等韵律特征的修改,可以实现语速、调高和音 响的变化。韵律特征主要包括声调语调、重音等。其中声调属于音节层的韵律, 汉语是一种“声调语言”。在用汉语相互交谈中,人们不但凭不同的声母,韵母来 辨别字和词的意义,还需要从不同的声调来区别它们,这就是“声调语言”的特点。 如:树木、书目,北京、背景,中药、重要等的区别,就是靠声调来实现的。汉 语音节的声调主要体现在信号的基音频率随时间而变化的规律上。声调的调值用 音高或基音的变化来描写。就不同人来说,妇女和儿童的声音高一些;老年男人 的低一些,同一个人的音高也会有不同,兴奋时的声音略高升,情绪低落时声音 略低沉。基音频率不仅是反映说话人特点的重要参数,而且其随时间的变化模式 也反映了汉语语音中的声调变化圈。因此语音合成技术就是在保持语音内容不变 的前提下,对合成基元的韵律特征进行修改,以达到音高、音长以及音强等韵律 参数的修改,以满足不同语境的要求。 1 3 2 语音合成的基本应用 语音合成的主要目的是让机器能说话,以便使一些其他存储方式的信息能够转 化成语音信号,让人能够简单的通过听觉就可以获得大量的信息。语音合成技术 除了在人机交互中的应用外,在自动控制,测控通信系统办公自动化,信息管 理系统、智能机器人等领域也有着广泛的应用前景。目前各种语音报警器,语音 报时器,公共汽车上的自动报站,股票信息的查询、电话查询业务,以及打印出 山东大学硕士学位论文 版过程中的文本校对等均已实现商品化。另外,语音合成技术还可以作为听觉、 视觉和语音表达有障碍的伤残人的通信辅助工具。图1 2 给出了语音合成的基本 应用电子文档的有声输出的原理框图。 图1 2电子文档有声输出原理框图 图1 - 2 所示的系统中包括文本输入,有声制作,电子文库管理、语音合成等模 块。可以通过扫描仪输入进行文档的录入,经o c r 识别后形成文本文件,经过 文语转换系统将文本文件转换为语音输出。 1 4 本文主要工作以及章节安排 本文首先介绍了语音变调算法的研究背景及其常用方法,重点分析了三种主要 的语音变调方法,并在s o l a f s 变调方法的基础上,提出了一种改进的变调方 法。此外,又将语音变调技术运用到了语音合成中,针对目前语音合成算法的优 缺点,提出了一种基于p s o l a 的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论