6第六章_语音合成.ppt_第1页
6第六章_语音合成.ppt_第2页
6第六章_语音合成.ppt_第3页
6第六章_语音合成.ppt_第4页
6第六章_语音合成.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第六章 语音合成 6.1 概述 6.2 语音合成方法 6.3 TTS合成技术,2,第六章 语音合成 6.1 概述 一、语音合成定义,解决如何让机器象人说话的问题。 其目的:能将任意文本实时地转换为自然语音输出,且输出的语音清晰可懂。,3,二、语音合成技术的应用,语音是信息传播的一大媒介。近年来,提供语音服务的语音系统迅速发展起来。传统的语音系统一般采用预录音回放技术,由于这种方法必须对信息文本事先进行录音,并存为声音文件,因此,所占用的存储空间很大。另外,一个更大的缺点是不能实时反映信息的更新,应用范围有很大的局限性。,6.1 概述,4,录音 wav,回放,传统的语音系统,语音 压缩编码,

2、输入语音,恢复语音,6.1 概述,5,现在的语音合成技术,无需对大量的信息进行录音,极大地减少了工作量和节省了存储空间,尤其是在信息内容需要经常变动的动态查询场合,如股市行情查询、有声Email系统,都是传统的预录音技术无法代劳的。结合其他技术,语音合成技术可以广泛应用于金融、邮电、工商、 政府机关、交通、教育、游戏等领域。,6.1 概述,6,采用数字存储技术存储基本的语音信息。 在合成时采用恰当的技术手段挑选出所需的语音单元拼接起来,生成高自然度的语句,这就是波形拼接的语音合成方法。为了节省存储容量,在存入机器之前还可以对语音信号先进行数据压缩。,三.语音合成技术方法,以语句、短语、词或音节

3、为合成单元,这些单元分别被录音后直接进行数字编码,经过适当的数据压缩,组成一个合成语音库。,1. 语音信号的波形合成(录音合成技术),7,语音库 (语音单元) 语音的波形 编码,输入语音,挑选 组合,回放,合成语音,1.波形合成方法,三.语音合成技术方法,合成单元越大, 合成的自然度越好,系统结构简单,价格低廉,合成语音的数码率较大,存储量也大,因而合成的词汇有限。在自动报时、报号、报站或报警等装置中,多采用这种技术.,8,2. 语音信号的参数合成,根据语音产生的数学模型,利用短时平稳性,提出每帧语音信号的参数,这些参数经编码后组成一个语音参数库。 输出时,从语音参数库中取出相应的参数,利用语

4、音产生的数学模型恢复语音。共振峰合成和线性预测合成是该类合成技术中的重要方法。,三.语音合成技术方法,9,按照语音理论,对所有合成单元的语音进行分析,一帧一帧提取有关语音参数,这些参数经编码后组成一个合成语音库。 输出时,根据待合成的语音的信息,从语音库中提取出相应的合成参数, 经编辑和连接顺序送入语音合成器中,在合成器中合成参数的控制下,一帧一帧的重新还原语音波形。,三.语音合成技术方法,2. 语音信号的参数合成,10,三.语音合成技术方法,2. 语音信号的参数合成 主要的合成参数有:控制音强的幅度、控制 音高的基频和控制音色的共振峰参数。 这种方式的速码率比波形编辑方式小的多, 但是系统结

5、构也复杂些,合成音质也差些。目前 已有专用的芯片.,11,3.语音的规则合成,这种合成方法以通过语音学规则来产生任何语音为目的,规则合成系统存储的是较小的语音单位的声学参数以及由音素组成音节,再由音节组成词或句子的各种规则。当输入字母符号时,合成系统利用规则自动将它们转换为连续的语音声波。 由于语音中存在协同发声效应,单独存在的元音和辅音与连续发音中的元音和辅音不同,所以合成规则是在分析每一语音单元出现在不同环境中的协同发音后,归纳其规律而制定的。如共振峰的频率规则、时长规则、声调和语调规则等。,三.语音合成技术方法,12,3. 语音信号的规则合成,系统中存储的是音素的声学参数,以及由音素组成

6、音节、由音节组成词、由词组成句子的规则;控制音调、轻重音等韵律的各种规则。 规则合成方法的语音库的存储量更小,这是以牺牲音质为代价的,这种方式涉及到许多语音学和语音学模型,系统结构复杂。目前合成规则还不完善。(p76,P177表12.1),三.语音合成技术方法,13,Av,冲激序列 发生器,声门脉冲 模型G(z),随机噪声 发生器,基音周期TP,AN,线性系统 声道V(z),辐射 模型 R(z),清/浊音开关,语音的生成模型,一、共振峰合成法,6.2 语音合成方法,14,利用语音信号的生成模型,将声道视为一个谐振腔,利用腔体的谐振特性,共振峰频率及其带宽,为此构造一个共振峰滤波器。对激励信号进

7、行处理,可到合成语音。,Av,冲激序列 发生器,声门脉冲 模型G(z),随机噪声 发生器,基音周期TP,AN,共振峰滤波器,清/浊音开关,一、共振峰合成法,15,一、共振峰合成方法,鼻腔 共振峰 滤波器,浊音激励,清音激励,第一 共振峰 滤波器,第二 共振峰 滤波器,第三 共振峰 滤波器,摩擦音 共振峰 滤波器,FV,AH,AF,AN,AV,LF1,LF2,LF3,FF,16,可控制的参数共有10个: (1)4个幅值控制AV、AN、 AH、 AF (2)5个频率控制FV(浊音基频)、LF1、LF2、LF3、FF (3)1个清/浊音开关,一、共振峰合成方法,6.2 语音合成方法,17,二. 线性

8、预测合成法(LPC编码),将语音生成模型简化,将辐射、声道和声门激励进行组合,用一个时变数字滤波器来表示。,冲激 序列 发生器,随机 噪声 发生器,x(n),u(n),18,线性 预测 分析 基音频率 清/浊音判别,参数 合成,k2,kp,基音频率,输入语音x(n),清/浊音标志,G,k1,格型滤波器语音合成技术框图,合成 语音,二. 线性预测合成法(LPC编码),19,6.3 TTS合成技术,文语转换系统(Text-to-Speech ),文-语转换是语音合成技术的延伸,它能把计算机内的文体转换成连续自然的语音流。 若采用这种方法输出语音,应预先建立语音参数数据库、发音规则库等。 需要输出语

9、音时,系统按需求先合成语音单元,再按语音学规则或语言学规则,连接成自然的语流。文-语转换的参数库不随发音时间增长而加大;但规则库却随语音质量的要求而增大。,20,文本,文本分析,韵律控制,合成模块,语音数据库,输出,一、TTS系统的构成,对输入文本进行分析切割出字词以后,通过语音合成方法把这些字词的发音合成出来,并串接起来,通过韵律调整,就可以得到较为自然的语句的发音。,6.3 TTS合成技术,21,二.文本分析,主要功能是使计算机能够识别文字,并根据文本的上、下文关系在一定程度上对文本进行理解,将发音的方式告诉计算机;另外,还要让计算机知道文本中哪些是短语、句子,发音时到哪儿应该停顿,停顿多

10、长等等。,1.文本分析的主要功能:,6.3 TTS合成技术,22,2.文本分析工作的三个主要步骤:,(1)将输入的文本规范化,处理用户可能的拼写错误,并将文本中出现的一些不规范或无法发音的字符滤掉; (2)分析文本中的词或短语的边界,确定文字的读音。 (3)根据文本的结构、组成和不同位置出现的标点符号,来确定发音时语气的变换以及不同音的轻重方式。,二.文本分析,23,3.文本分析系统的基本框图,自动分词,多音字处理,声调判断,特殊声调调整,特殊符号,停顿处理,系统词库,多音字词库,变调规则库,特殊声调 规则,24,自动分词,对句子以系统词库为模板用最大匹配的方法进行分词,从系统词库中提取相应的

11、读音、声调和时长信息作为控制参数。,多音字处理,对自动分词处理后的句子中余下的字,首先查找多音字表,若不是多音字,则检索标准字库,取得该字的读音和声调;若是多音字,则根据在多音字库中得到的信息从特征词库中读取相应的信息,选择恰当的读音和声调。,25,声调调整,根据变调规则库中的规则,对每个字的声调做一些调整,在词与词之间加入适当的停顿信息。,4.文本分析的输出,将输入的文字转换成计算机能够处理的内部参数(每个词的发音声母韵母声调),便于后续模块进一步处理并生成相应的信息。 常见的文本分析方法:二元文法、HMM和神经网络法等。,26,三、语音合成方法,首先合成字的声母,再合成它的韵母,然后将韵母的声调调整到所需要的声调上,然后将声母和韵母连接起来得到最终合成的语音。,1. 语音合成部分的主要功能:,27,单独发声的一个音节或是语音流中的任何一个音节都可能由7部分组成。,无声段,28,2.语音数据库,(2)声母表:22个声母的波形 (3)韵母表:38个韵母的波形(基音同步帧、过渡音和鼻音) (4)声调曲线:不同声调的声调曲线 。,(1)汉字拼音库: 每个汉字的拼音信息是一个二进制文件,其形式为:声母韵母声调标号。,29,3.语音合成步骤,拼音信息,声母,韵母,声调,基音同步帧、 过渡音和鼻音库,声调曲线库

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论