CN113870828B 音频合成方法、装置、电子设备和可读存储介质 (维沃移动通信有限公司)_第1页
CN113870828B 音频合成方法、装置、电子设备和可读存储介质 (维沃移动通信有限公司)_第2页
CN113870828B 音频合成方法、装置、电子设备和可读存储介质 (维沃移动通信有限公司)_第3页
CN113870828B 音频合成方法、装置、电子设备和可读存储介质 (维沃移动通信有限公司)_第4页
CN113870828B 音频合成方法、装置、电子设备和可读存储介质 (维沃移动通信有限公司)_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

号子设备和可读存储介质,属于语音合成技术领2使用目标发音人的历史音频数据获取所述目标发音人的韵律对所述目标信息进行分析,得到文本特征参数,所述文本特征参数包括第一音将所述文本韵律对应的韵律概率作为节点概率,将所述停顿长度参获取所述目标发音人的第一音频数据,所述第一音频数据为5.根据权利要求1所述的方法,其特征在于,所述韵律特性参数包括停顿长度参考向3第二获取模块,用于使用目标发音人的历史音频数据获生成模块,用于对所述声学特征信息进行转换,生成与所述将所述文本韵律对应的韵律概率作为节点概率,将所述停顿长度参第三获取模块,用于获取所述目标发音人的第一音频数所述声学预测模型用于根据第二音频特征得到4或指令被处理器执行时实现如权利要求1至5任一项所述5性化语音合成(PersonalTexttoSpeech)是指通过录音设备录取某个人的某些语音片段6人的韵律特性参数影响声学特征信息的生成,可以根据不同发音人的说话风格和韵律特象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互[0028]请参见图1,其是本申请实施例提供的一种音频合成方法,该方法应用于电子设7[0035]在一些可选的实施例中,获取语速参考向量,可以进一步包括:步骤2100-步骤[0041]第一平均语速可以根据目标语句的时长和目标语句所包含的音素的个数进行确人在朗读一句话时习惯每朗读两三个字停顿换气,某些发音人在朗读完整句话时停顿换8人的停顿长度参考向量,可以使用较多的音频数据获取目标发音人的个性化韵律特性参输出的音频特征X,与输入的音频特征X之间的差值小于预设阈值。基于优化后的风格向量9[0059]声学特征信息可以是输入声码器以生成音频数据的特征信息。根据声码器的需二音素序列。人的韵律特性参数影响声学特征信息的生成,可以根据不同发音人的说话风格和韵律特人的韵律特性参数影响声学特征信息的生成,可以根据不同发音人的说话风格和韵律特计算机(ultra-mobilepersonalcomputer,UMPC)、上网本或者个人数字助理(personaldigitalassistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network[0097]本申请实施例提供的音频合成装置能够实现图1的方法实施例实现的各个过程,人的韵律特性参数影响声学特征信息的生成,可以根据不同发音人的说话风格和韵律特[0111]应理解的是,本申请实施例中,输入单元604可以包括图形处理器(Graphics606可包括显示面板6061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板述调制解调处理器也可以不集成到处理器6[0112]本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论