CN114141237B 语音识别方法、装置、计算机设备和存储介质 (招联消费金融股份有限公司)_第1页
CN114141237B 语音识别方法、装置、计算机设备和存储介质 (招联消费金融股份有限公司)_第2页
CN114141237B 语音识别方法、装置、计算机设备和存储介质 (招联消费金融股份有限公司)_第3页
CN114141237B 语音识别方法、装置、计算机设备和存储介质 (招联消费金融股份有限公司)_第4页
CN114141237B 语音识别方法、装置、计算机设备和存储介质 (招联消费金融股份有限公司)_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

质基于音素对齐损失值调整语音识别模型的模型2对所述音频集合的每个音频进行时序特征和频率特征提取处理,在使用所述音频集合迭代训练语音识别模型的过程中,针对基于所述音素概率分布矩阵和针对所述音频标注的文本语句,确定得到所基于所述音素对齐损失值调整所述语音识别模型的模型参数以继针对随机抽取出的所述音频执行以下至少一种模拟不同发音人说话的声音大小之间的第一差异,针对随机抽取的所模拟的不同发音人的说话语速之间的第二差异,针对随机抽取的模拟不同发音人在说话过程中语速韵律变化的第三差异,针对随机抽取的所述音频,模拟不同发音人的音色频率大小之间的第四差异,针对随机抽取的所基于多个具有三角滤波特征的带通滤波器,计算所述音频在将所述梅尔频谱矩阵数据进行降维处理得到特将所述梅尔频谱矩阵数据输入至各层所述卷积神经网络,触发每层卷所述基于所述音素损失值调整所述语音识别模型的模型参数以继基于所述音素损失值调整所述语音识别模型的各层卷积神经网络针对每个音频,将所述音频对应的所述特征矩阵数据输入所述语3将所述多头注意力模型中各层所提取的特征进行拼接,得到所根据所述音频中每一时间帧的音素概率分布,生成包括所有时间帧的将所述音频标注的文本语句和所述音素概率分布矩阵进行音素特征计算模块,用于对所述音频集合的每个音频进行时序特征和频率特征提取处理,得到所述音频对应的包括时序和频率特征信息的特损失值计算模块,用于在使用所述音频集合迭代训练语音识别优化模块,用于基于所述音素对齐损失值调整所述8.一种计算机设备,包括存储器和处理器,所述存储器处理器执行时实现权利要求1至6中任一项所述的方4[0003]目前的语音识别技术是通过基于概率统计的语音识别模型或循环神经网络模型5律和音色频率提取各自对应的在所述业务场景下将所述梅尔频谱矩阵数据进行降维处理得到特征[0028]基于所述音素损失值调整所述语音识别模型的各层卷积神经网络的参数以继续67[0053]终端110可以将对音频集合的音频进行采样率转换,得到具有相同采样率的音频布矩阵和针对音频标注的文本语句,确定得到语音识别模型前向传播的音素对齐损失值,并基于音素对齐损失值调整语音识别模型的模型参数以继续迭代,直至满足迭代停止条识别模型对音频对应的特征矩阵数据进行编码,得到音频中每一时间帧的音素概率分布,8[0066]在一个实施例中,语音识别模型为Transformer模型(一种引入注意力机制的模[0067]在一个实施例中,服务器可以基于Transformer模型的七层带卷积的多头注意力文本音素标签和音素概率分布矩阵中与标签对应的所有正确路径对齐处理后所计算出来文本语句的音素执行音素对齐处理后计算得一种可以避开输入与输出人工对齐的、用于解决时序类数据的分类问题的算法)算法计算[0073]S208,基于音素对齐损失值调整语音识别模型的模型参数以继续迭代,直至满足9时序和频率特征信息的特征矩阵数据。在使用音频集合迭代训练语音识别模型的过程中,[0083]具体地,服务器在对音频集合的每个音频进行时序特征和频率特征提取处理之率特征信息的梅尔频谱矩阵数据,并将梅尔频谱矩阵数据进行降维处理得到特征矩阵数[0103]在一个实施例中,服务器可以对语音识别模型的卷积神经多头注意力模型,以基于多头注意力模型的每层依次针对该层所关注的信息进行特征提[0106]其中,多头注意力模型是指对输入的梅尔频谱矩阵数据具有多种不同注意力处[0116]在一个实施例中,服务器可以是基于CTC算法来处理音频标注的文本语句和音素[0117]在本实施例中,通过对音频标注的文本语句和音素概率分布[0123]特征计算模块404,用于对音频集合的每个音频进行时序特征和频率特征提取处[0125]优化模块408,用于基于音素对齐损失值调整语音识别模型的模型参数以继续迭值调整语音识别模型的各层卷积神经网络的每层依次针对该层所关注的信息进行特征提取;多头注意力模型中的每层关注的信息不非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论