CN113851113B 模型训练方法及装置、语音唤醒方法及装置 (维沃移动通信有限公司)_第1页
CN113851113B 模型训练方法及装置、语音唤醒方法及装置 (维沃移动通信有限公司)_第2页
CN113851113B 模型训练方法及装置、语音唤醒方法及装置 (维沃移动通信有限公司)_第3页
CN113851113B 模型训练方法及装置、语音唤醒方法及装置 (维沃移动通信有限公司)_第4页
CN113851113B 模型训练方法及装置、语音唤醒方法及装置 (维沃移动通信有限公司)_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

号2通过待训练的生成对抗网络模型的编码器,以及所述第一特征信息,根据所述第一特征信息和所述第二特征信息,对所述声学模型和所述对所述声学模型和所述生成对抗网络模型进行训练,直至所对所述生成模块和所述声学模型进行训练,直至通过所述生成模对所述鉴别模块进行训练,直至所述第一特征信息与通过所通过待训练的所述声学模型,以及所述第一特征信息,输出所述音通过待训练的所述生成对抗网络模型,以及所述第一特征信息,第一获取模块,用于获取音频训练数据的第一特征信3第二输出模块,用于通过待训练的所述生成对抗网络模训练模块,用于根据所述第一特征信息和所述第第一训练单元,用于对所述声学模型和所述生成对一特征信息与所述第二特征信息之间的第一误差率满足第二训练单元,用于对所述生成模块和所述声学模型进行训练第三训练单元,用于对所述鉴别模块进行训练,直成模块输出的所述第二特征信息之间的第二误差率第四输出模块,用于在所述第一音素信息与所述唤醒音频述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的模型训练方法或者权利要求6所述的语音唤醒方或指令被处理器执行时实现如权利要求1-5任一项所述的模型训练方法或者权利要求6所4用于获取音频训练数据的第一特征信息,所述音频训练数据包括唤醒音频和非唤醒音频;5序或指令,所述程序或指令被处理器执行时实现如第一方面或第二方面所述的方法的步6[0038]可选地,本实施例中的生成对抗网络模型以变分自动编码器(Conditional7是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中的至少两个模块:生成模块(GenerativeModel)和鉴别模块(DiscriminativeModel)的互相博弈学习产生[0046]在该步骤中,将声学模型的输出(即音频训练数据的音素信息)和编码器的输出8[0063]在本申请另一个实施例的模型训练方法的流程中,在步骤120之前,该方法还包[0068]本实施例中的匹配率是基于音频训练数据中的各个帧的音素概率序列与对应帧pppppppp9qφ(z|x)和真实后验概率p(z|x)之间的φ[0097]基于以上内容,继续解释声学模型A(x)和VAWGAN如何同时训练,使得声学模型A256,激活函数采用LReLU函数。网络结构如图3所示。训练过程中利用随机梯度下降法[0128]参见图4,示出了本申请另一个实施例的语音唤醒方法的流程图,应用于电子设[0135]将提取的Fbank特征输入前述实施例训练好的声学模型进行推理,得到对应的第[0164]第四输出模块70,用于在第一音素信息与唤醒音频的预设音素信息匹配的情况[0167]本申请实施例中的模型训练装置/语音唤醒装置可以是装置,也可以是终端中的[0168]本申请实施例中的模型训练装置/语音唤醒装置可以为具有动作系统的装置。该[0169]本申请实施例提供的模型训练装置/语音唤醒装置能够实现上述对应方法实施例[0173]该电子设备1000包括但不限于:射频单元1001、网络模块1002、音频输出单元[0174]本领域技术人员可以理解,电子设备1000还可以包括给各个部件供电的电源(比直至所述第一特征信息与所述第二特征信息之间的第一误差率满足第一预块输出的所述第二特征信息之间的第二误差率满足第三预[0183]应理解的是,本申请实施例中,输入单元1004可以包括图形处理器(Graphics图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频处理的图像数据进行其他输入设备10072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键[0184]本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述模型训练方法/语音唤醒方法实施例的各个过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论