CN114141227B 音频语料扩充的方法、装置以及存储介质 (北京中科金得助智能科技有限公司)_第1页
CN114141227B 音频语料扩充的方法、装置以及存储介质 (北京中科金得助智能科技有限公司)_第2页
CN114141227B 音频语料扩充的方法、装置以及存储介质 (北京中科金得助智能科技有限公司)_第3页
CN114141227B 音频语料扩充的方法、装置以及存储介质 (北京中科金得助智能科技有限公司)_第4页
CN114141227B 音频语料扩充的方法、装置以及存储介质 (北京中科金得助智能科技有限公司)_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

司WO2022250724A1,2022.12.012从录音语料库中获取预定数量的录音样本数据,生成与录音样本数利用生成对抗网络的编码器对样本音频特征x进行计算,确定与样本音频特征对应的从录音语料库中获取预定数量的录音样本数据,生成与所述录音样从服从正态分布的样本中获取预定数量的第一利用所述双向生成对抗网络(BiGan)的编码器对所述样本音频特征进行计算,确定与利用所述双向生成对抗网络(BiGan)的解码器对所述第一特征向量进行计算,确定与将所述样本音频特征和对应的所述第二特征向量进行配对,将所述3根据所述判别器的识别结果对所述双向生成对抗网选择相似度小于预定阈值的录音数据中的预定数量的数据作为所述录音样数据获取模块,用于获取第一音频语料,确定与所述第一从录音语料库中获取预定数量的录音样本数据,生成与录音样本数从录音语料库中获取预定数量的录音样本数据,生成与录音样本数45进行录制。因此采用端到端的语音合成方式录制与维护语料的过程过于依赖人力且繁琐,[0003]针对上述的现有技术中存在的语音合成过程中的语料录制与维护过于依赖人力6[0012]图2是根据本公开实施例1的第一个方面所述的音频语料扩充的方法的流程示意7[0021]本实施例所提供的方法实施例可以在服务器或者类似的计算设备中执行。图1示可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件[0022]应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可扩充的方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器[0025]显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与8可以根据第一音频特征生成第二音频特征,例如将上述的40000条语料的第一音频特征输9[0038]具体地,基于双向生成对抗网络(BiGan)的语音生成模型一般性地可以包括编码器encoder、解码器decoder(也可以称之为生成器Generator)以及辨别器Discriminator。在利用预先训练的音频生成模型对第一音频特征进行计算,生成第二音频特征的操作中,间的相似度。[0066]图5示出了根据本实施例所述的音频语料扩充的装置500,该装置500与根据实施录音语料库中获取预定数量的录音样本数据,生成与录音样本数据对应的样本音频特征;从服从正态分布的样本中获取预定数量的第一特征向量;利用双向生成对抗网络(BiGan)生成对抗网络(BiGan)的解码器对第一特征向量进行计算,确定与第一特征向量对应的生[0075]图6示出了根据本实施例所述的音频语料扩充的装置600,该装置600与根据实施特征;从服从正态分布的样本中获取预定数量的第一特征向量;利用双向生成对抗网络用双向生成对抗网络(BiGan)的解码器对第一特征向量进行计算,确定与第一特征向量对[0088]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论