CN113889146B 音频识别方法、装置、电子设备和存储介质 (北京小米移动软件有限公司)_第1页
CN113889146B 音频识别方法、装置、电子设备和存储介质 (北京小米移动软件有限公司)_第2页
CN113889146B 音频识别方法、装置、电子设备和存储介质 (北京小米移动软件有限公司)_第3页
CN113889146B 音频识别方法、装置、电子设备和存储介质 (北京小米移动软件有限公司)_第4页
CN113889146B 音频识别方法、装置、电子设备和存储介质 (北京小米移动软件有限公司)_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

从预设库中选取与所述查询内容对应的预设数息的目标片段信息和所述目标片段信息所在的可从预设库中识别出相匹配的目标音频片段和2从预设库中选取与所述查询内容对应的预设数量的候选音频;所述候选将所述候选音频片段输入已训练的检测模型中,得到包含所述候选音频片段中每个语素分别位于起始位置和结束位置对应的第一概率数据和第二概率确定所述片段信息的语素与所述预设库中每个音频的文本基于所述排序结果确定排序位置靠前的预设数量个音频为所述候选选音频包括与所述片段信息的语素相匹配的至少一个从每个所述候选音频的至少一个音频片段中获取包含连续匹配语素最长的音频片段,得到每个所述候选音频与所述片段信息相匹配的根据所述片段信息和所述候选音频片段获取每个所述候选音频对将每个所述候选音频对应的待检测向量输入到所述检测模型,得根据所述检测结果数据获取包含所述片段信息的目标片段信息和所述目标片段信息将所述片段信息分别与每个候选音频的候选音频片段进行拼接,得其中,每个所述待检测向量至少包括第一标识符和第二标识符在所述起始位置小于所述结束位置的情况下,基于所述第将所述目标音频片段作为从所述查询内容中识别出的目标片段信息以及将所述目标3第二概率数据的乘积最大时确定起始位置的起始确定所述起始语素和所述结束语素之间的全部语素构成查询内容获取模块,被配置为执行获取查询内容;所述候选音频获取模块,被配置为执行从预设库中选取与所述查询内输出的检测结果数据包括表示所述候选音频片段中每个语素分别位于起始位置和结束位4[0008]在一些实施例中,从预设库中选取与所述查询内容对应述候选音频包括与所述片段信息的语素相匹配的至少一[0012]从每个所述候选音频的至少一个音频片段中获取包含连续匹配语素最长的音频[0014]根据所述片段信息和所述候选音频片段获取每个所述候选音频对应的待检测向[0016]根据所述检测结果数据获取包含所述片段信息的目标片段信息和所述目标片段5位于起始位置和结束位置对应的第一概率数[0021]根据所述检测结果数据获取包含所述片段信息的目标片段信息和所述目标片段概率数据的乘积从所述候选音频片段中确定出目标[0023]将所述目标音频片段作为从所述查询内容中识别出的目标片段信息以及将所述[0030]目标音频获取模块,被配置为执行将所述候选音频片段输入已训练的检测模型6位于起始位置和结束位置对应的第一概率数[0045]目标片段获取单元,被配置为执行在所述起始位置小于基于所述第一概率数据和所述第二概率数据的乘积从所述候选音频片段中确定出目标音78候选音频包括与所述片段信息相匹配的候选索引可以包括音频辅助性标签信息,该辅助性标签信息可以包括但不限于音频的文本信9[0088]在步骤32中,电子设备可以将每个候选音频对应的待检素位于结束位置作为结束语素的第二概率数据和表征查询内容是否有相匹配音频片段的可以确定目标音频片段对应的辅助性标签信息,并根据上述辅助性标签信息确定目标音量经过全连接层和Softmax计算后得到每个片段单元(Token)作为答案时起始词语和终止大且起始词语的位置start小于终止词语的位置end的组合,将此时起始位置start和终止[0117]目标片段获取单元,被配置为执行在所述起始位置小于基于所述第一概率数据和所述第二概率数据的乘积从所述候选音频片段中确定出目标音或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器[0128]电源组件706为电子设备700的各种组件提供电力。电源组件706可以包括电源管[0129]多媒体组件708包括在电子设备700和目标对象之间的提供一个输出接口的屏在一些实施例中,屏幕可以包括液晶显示屏(LCD)和触摸面板(TP)。如果屏幕包括触摸面[0131]I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可如组件为电子设备700的显示屏和小键盘,传感器组件714还可以检测电子设备700或一个[0133]通信组件716被配置为便于电子设备700和其他设备之间有线或无线方式的通一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信息变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论