CN111783939B 声纹识别模型训练方法、装置、移动终端及存储介质（厦门快商通科技股份有限公司）

上传人：1*** IP属地：山西上传时间：2026-05-02 格式：DOCX 页数：26 大小：965.54KB 积分：10.2 举报 版权申诉

CN111783939B 声纹识别模型训练方法、装置、移动终端及存储介质（厦门快商通科技股份有限公司）_第2页

CN111783939B 声纹识别模型训练方法、装置、移动终端及存储介质（厦门快商通科技股份有限公司）_第3页

CN111783939B 声纹识别模型训练方法、装置、移动终端及存储介质（厦门快商通科技股份有限公司）_第4页

CN111783939B 声纹识别模型训练方法、装置、移动终端及存储介质（厦门快商通科技股份有限公司）_第5页

已阅读5页，还剩21页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

xvector声纹识别模型对训练数据进行特征提练特征向量进行类型识别得到预设特征向量和特征向量分别对应输入第二全连接层和第三全第一损失概率和第二损失概率对第二全连接层提高了模型训练后xvector声纹识别模型对文本2基于所述xvector声纹识别模型对所述训练数据进行特征提取，所述xvecto接层和所述第三全连接层共用所述xvector声纹识别模型中的所述TDNN网络、所述池化层通过所述第一全连接层对所述训练特征向量进行类型识别，得到预将所述预设特征向量和所述动态数字特征向量分别对应输入第二全连接层和第三全使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别进行损失计算，根据所述第一损失概率对所述第二全连接层进行训练，并根据所述2.如权利要求1所述的声纹识别模型训练方法，其特征在将所述训练数据输入所述xvector声纹识别模型中的TDNN网络，并控制所述TDNN网络述第二全连接层和所述第三全连接层的输出分别进行损失计算根据预设损失函数和所述预设特征向量对所述第二全根据所述预设损失函数和所述动态数字特征向量对所述第三全连接层的输出进行损根据所述第一损失概率在所述xvector声纹识别模型中进行反向传播，并根据所述第二损失概率在所述xvector声纹识别模型对每个所述TDNN网络输出的所述训练特征向量进行池化处将每个所述TDNN网络输出的所述训练特征向量进行累计，根据向3控制所述xvector声纹识别模型对所述待识别声纹数据进行识别，并将所述第一全连接层的输出结果作为所述xvector声纹识别根据欧式距离公式计算所述输出向量与本地预存储的样本向量之间训练数据获取模块，用于获取训练数据，并将所述训练数据输入xvector声纹识别模接层，所述第二全连接层和所述第三全连接层共用所述xvector声纹识别模型中的所述特征类型识别模块，用于通过所述第一全连接层对所述训练特征向量进行类型识别，特征输出模块，用于将所述预设特征向量和所述动态数字特征损失计算模块，用于使用损失计算层对所述第二全连接层和模型训练模块，用于根据所述第一损失概率对所述第二全连接层进行4景一般有文本无关,文本相关(固定口令)及文本半相关(动态数字),但现有的xvector模[0007]基于所述xvector声纹识别模型对所述训练数据进行特征提取，获得训练特征向[0009]将所述预设特征向量和所述动态数字特征向量分别对应输入第二全连接层和第[0010]使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别进行损失[0012]更进一步的，所述基于所述xvector声纹识别模型对所述训练数据进行特征提取[0013]将所述训练数据输入所述xvector声纹识别模型中的TDNN网络，并控制所述TDNN5[0016]根据预设损失函数和所述预设特征向量对所述第二全连接层的输出进行损失计[0017]根据所述预设损失函数和所述动态数字特征向量对所述第三全连接层的输出进所述第二损失概率对所述第三全连接层进行训练[0019]根据所述第一损失概率在所述xvector声纹识别模型中进行反向传播，并根据所述第二损失概率在所述xvector声纹识别模型中进[0026]控制所述xvector声纹识别模型对所述待识别声纹数据进行识别，并将所述第一全连接层的输出结果作为所述xvector声纹识别[0028]当判断到所述编号值大于编号阈值时，判定所述待识别声纹数据的声纹识别合[0031]特征提取模块，用于基于所述xvector声纹识别模型对所述训练数据进行特征提6字特征向量对第三全连接层进行训练的设计，提高了模型训练后xvector声纹识别模型对7[0059]步骤S40，将所述预设特征向量和所述动态数字特征向量分别对应输入第二全连续该第一全连接层能针对不同的类型的特征进行识别，提高了第一全连接层和该xvector[0062]步骤S50，使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别8[0065]优选的，当该第二全连接层和第三全连接层达到预设迭代次数时，自动停止该征向量对第三全连接层进行训练的设计，提高了模型训练后xvector声纹识别模型对文本声纹识别模型能对文本半相关起到有效的声纹识9[0082]步骤S61，将预设特征向量和动态数字特征向量分别对应输入第二全连接层和第[0084]步骤S71，根据预设损失函数和预设特征向量对第二全连接层的输出进行损失计二损失概率在xvector声纹识别模型中进行反向传播，直至第二全连接层和第三全连接层接层的输出结果作为xvector声纹识别特征向量对第三全连接层进行训练的设计，提高了模型训练后xvector声纹识别模型对文[0098]请参阅图3，是本发明第三实施例提供的声纹识别模型训练装置100的结构示意[0101]特征提取模块11，用于基于所述xvector声纹识别模型对所述训练数据进行特征入第二全连接层和第三全连接层，所述第二全连接层和所述第三全连接层均对应一个输[0108]根据所述预设损失函数和所述动态数字特征向量对所述第三全连接层的输出进别模型中进行反向传播，并根据所述第二损失概率在所述xvector声纹识别模型中进行反述均值和所述标准差作为所述训练特征向量池化处[0116]控制所述xvector声纹识别模型对所述待识别声纹数据进行识别，并将所述第一全连接层的输出结果作为所述xvector声纹识别[0118]当判断到所述编号值大于编号阈值时，判定所述待识别声纹数据的声纹识别合征向量对第三全连接层进行训练的设计，提高了模型训练后xvector声纹识别模型对文本所述存储设备用于存储计算机程序，所述处理器运行所述计算机程序以使所述移动终端[0122]本实施例还提供了一种存储介质，其上存储有上述移动终端101中所使用的计算[0124]基于所述xvector声纹识别模型对所述训练数据进行特征提取，获得训练特征向[0126]将所述预设特征向量和所述动态数字特征向量分别对应输入第二全连接层和第[0127]使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别进行损失对所述第三全连接层进行训练，直至所述第二全连

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN111783939B 声纹识别模型训练方法、装置、移动终端及存储介质（厦门快商通科技股份有限公司）

文档简介

温馨提示

最新文档

评论

CN111783939B 声纹识别模型训练方法、装置、移动终端及存储介质 （厦门快商通科技股份有限公司）

文档简介

温馨提示

最新文档

评论

相关文档

CN111783939B 声纹识别模型训练方法、装置、移动终端及存储介质（厦门快商通科技股份有限公司）