版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
xvector声纹识别模型对训练数据进行特征提练特征向量进行类型识别得到预设特征向量和特征向量分别对应输入第二全连接层和第三全第一损失概率和第二损失概率对第二全连接层提高了模型训练后xvector声纹识别模型对文本2基于所述xvector声纹识别模型对所述训练数据进行特征提取,所述xvecto接层和所述第三全连接层共用所述xvector声纹识别模型中的所述TDNN网络、所述池化层通过所述第一全连接层对所述训练特征向量进行类型识别,得到预将所述预设特征向量和所述动态数字特征向量分别对应输入第二全连接层和第三全使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别进行损失计算,根据所述第一损失概率对所述第二全连接层进行训练,并根据所述2.如权利要求1所述的声纹识别模型训练方法,其特征在将所述训练数据输入所述xvector声纹识别模型中的TDNN网络,并控制所述TDNN网络述第二全连接层和所述第三全连接层的输出分别进行损失计算根据预设损失函数和所述预设特征向量对所述第二全根据所述预设损失函数和所述动态数字特征向量对所述第三全连接层的输出进行损根据所述第一损失概率在所述xvector声纹识别模型中进行反向传播,并根据所述第二损失概率在所述xvector声纹识别模型对每个所述TDNN网络输出的所述训练特征向量进行池化处将每个所述TDNN网络输出的所述训练特征向量进行累计,根据向3控制所述xvector声纹识别模型对所述待识别声纹数据进行识别,并将所述第一全连接层的输出结果作为所述xvector声纹识别根据欧式距离公式计算所述输出向量与本地预存储的样本向量之间训练数据获取模块,用于获取训练数据,并将所述训练数据输入xvector声纹识别模接层,所述第二全连接层和所述第三全连接层共用所述xvector声纹识别模型中的所述特征类型识别模块,用于通过所述第一全连接层对所述训练特征向量进行类型识别,特征输出模块,用于将所述预设特征向量和所述动态数字特征损失计算模块,用于使用损失计算层对所述第二全连接层和模型训练模块,用于根据所述第一损失概率对所述第二全连接层进行4景一般有文本无关,文本相关(固定口令)及文本半相关(动态数字),但现有的xvector模[0007]基于所述xvector声纹识别模型对所述训练数据进行特征提取,获得训练特征向[0009]将所述预设特征向量和所述动态数字特征向量分别对应输入第二全连接层和第[0010]使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别进行损失[0012]更进一步的,所述基于所述xvector声纹识别模型对所述训练数据进行特征提取[0013]将所述训练数据输入所述xvector声纹识别模型中的TDNN网络,并控制所述TDNN5[0016]根据预设损失函数和所述预设特征向量对所述第二全连接层的输出进行损失计[0017]根据所述预设损失函数和所述动态数字特征向量对所述第三全连接层的输出进所述第二损失概率对所述第三全连接层进行训练[0019]根据所述第一损失概率在所述xvector声纹识别模型中进行反向传播,并根据所述第二损失概率在所述xvector声纹识别模型中进[0026]控制所述xvector声纹识别模型对所述待识别声纹数据进行识别,并将所述第一全连接层的输出结果作为所述xvector声纹识别[0028]当判断到所述编号值大于编号阈值时,判定所述待识别声纹数据的声纹识别合[0031]特征提取模块,用于基于所述xvector声纹识别模型对所述训练数据进行特征提6字特征向量对第三全连接层进行训练的设计,提高了模型训练后xvector声纹识别模型对7[0059]步骤S40,将所述预设特征向量和所述动态数字特征向量分别对应输入第二全连续该第一全连接层能针对不同的类型的特征进行识别,提高了第一全连接层和该xvector[0062]步骤S50,使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别8[0065]优选的,当该第二全连接层和第三全连接层达到预设迭代次数时,自动停止该征向量对第三全连接层进行训练的设计,提高了模型训练后xvector声纹识别模型对文本声纹识别模型能对文本半相关起到有效的声纹识9[0082]步骤S61,将预设特征向量和动态数字特征向量分别对应输入第二全连接层和第[0084]步骤S71,根据预设损失函数和预设特征向量对第二全连接层的输出进行损失计二损失概率在xvector声纹识别模型中进行反向传播,直至第二全连接层和第三全连接层接层的输出结果作为xvector声纹识别特征向量对第三全连接层进行训练的设计,提高了模型训练后xvector声纹识别模型对文[0098]请参阅图3,是本发明第三实施例提供的声纹识别模型训练装置100的结构示意[0101]特征提取模块11,用于基于所述xvector声纹识别模型对所述训练数据进行特征入第二全连接层和第三全连接层,所述第二全连接层和所述第三全连接层均对应一个输[0108]根据所述预设损失函数和所述动态数字特征向量对所述第三全连接层的输出进别模型中进行反向传播,并根据所述第二损失概率在所述xvector声纹识别模型中进行反述均值和所述标准差作为所述训练特征向量池化处[0116]控制所述xvector声纹识别模型对所述待识别声纹数据进行识别,并将所述第一全连接层的输出结果作为所述xvector声纹识别[0118]当判断到所述编号值大于编号阈值时,判定所述待识别声纹数据的声纹识别合征向量对第三全连接层进行训练的设计,提高了模型训练后xvector声纹识别模型对文本所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端[0122]本实施例还提供了一种存储介质,其上存储有上述移动终端101中所使用的计算[0124]基于所述xvector声纹识别模型对所述训练数据进行特征提取,获得训练特征向[0126]将所述预设特征向量和所述动态数字特征向量分别对应输入第二全连接层和第[0127]使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别进行损失对所述第三全连接层进行训练,直至所述第二全连
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 技术创新工作室创建与发展
- 2026山东潍坊润丰化工股份有限公司西厂区招聘42人备考题库有答案详解
- 2026广东佛山市第二人民医院服务中心招聘18人备考题库及答案详解一套
- 2026广东省能源集团有限公司数字化管理办公室首席架构师招聘1人备考题库附答案详解(能力提升)
- 2026重庆科瑞制药(集团)有限公司招聘1人备考题库完整参考答案详解
- 2026广西南宁良庆区玉龙社区卫生服务中心诚聘妇产科医生1人备考题库及一套完整答案详解
- 2026上海市血液中心上半年专业技术人员招聘12人备考题库含答案详解(能力提升)
- 2026中国科学院微生物研究所科技岗位助理研究员(正式编制)招聘备考题库(长期有效)含答案详解(能力提升)
- 2026青海省核工业核地质研究院非编工勤岗人员招聘2人备考题库及完整答案详解一套
- 2026广西现代职业技术学院招聘8人备考题库及答案详解(名校卷)
- 2026年上海市黄浦区初三语文二模试卷及答案
- 航天军工行业从海外看中国商发产业链前景
- 2026公司级新员工安全培训教材
- 2026年各地算力统筹与算电协同精细化政策汇编解读
- 配电架空线路标准施工工艺课件
- 医疗器械网络经营培训
- (完整版)钢结构厂房施工组织设计(含土建)
- 最高人民法院实施民法典继续有效适用的司法解释文件汇编(下)
- 2023年广西二造《建设工程计量与计价实务(安装)》高频核心题库300题(含解析)
- GB/T 36501-2018土壤制图1∶25 000 1∶50 000 1∶100 000中国土壤图用色和图例规范
- 套管强度校核全解课件
评论
0/150
提交评论