CN113851110B 音频处理方法、装置、计算机设备及存储介质（深圳市声扬科技有限公司）

上传人：1*** IP属地：山西上传时间：2026-06-24 格式：DOCX 页数：47 大小：2MB 积分：9.6 举报 版权申诉

CN113851110B 音频处理方法、装置、计算机设备及存储介质（深圳市声扬科技有限公司）_第2页

CN113851110B 音频处理方法、装置、计算机设备及存储介质（深圳市声扬科技有限公司）_第3页

CN113851110B 音频处理方法、装置、计算机设备及存储介质（深圳市声扬科技有限公司）_第4页

CN113851110B 音频处理方法、装置、计算机设备及存储介质（深圳市声扬科技有限公司）_第5页

已阅读5页，还剩42页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

区前湾一路1号A栋201室(入驻深圳市质出现的开始时间和结束时间以及目标音频对应位文本以及单位文本出现的开始时间和结束时2对目标音频进行语音识别，获取所述目标音频中包含的所有音素、所个音素出现的开始时间和结束时间以及所述目标音频根据所述每个音素出现的开始时间和结束时间，获取所述文本基于所述文本信息、所述文本信息中的单位文本以及所述单位文本若所述文本信息中存在多个相同的单位文本，则获取所述多将所述频率与其对应的单位文本之间的对应关系添加至所述接收用户基于所述提示信息输入的待识别的单位文本的类型，所述根据所述每个音素出现的开始时间和结束时间，获取所述文本根据所述每个音素出现的开始时间和结束时间，获取所述文本按照所述开始时间递减的顺序，将所述文本信息中的每个文字与所述音素将与所述每个文字相匹配的音素出现的开始时间和结束时间，作为对所述文本信息进行分词，得到多个词组，所述多个词组中每个词按照时间递减的顺序，将所述词组序列中的每个词组与所述音素序列中将与所述每个词组相匹配的音素出现的开始时间和结束时间，作为3若所述文本信息中存在所述多个相同的单位文本，将所基于所述语谱图，获取所述目标文本中每个单位文本对应的音将所述相似度大于预设相似度阈值的音频片段作为同一用户发分组输出所述每个用户标识对应的所有单位文本，以若接收到用户基于所述分析结果输入的目标用户标识，则获取若接收到用户基于所述分析结果输入的针对指定单位文本的查所述所有音素中每个音素出现的开始时间和结束时间以及所述目标音频对时间获取模块，用于根据所述每个音素出现的开分析结果确定模块，用于基于所述文本信息、所述文本信4一个或多个程序，其中所述一个或多个程序被存储在所述一个或多个处理器执行，所述一个或多个程序配置用于执行如权利要求1-8中任意一项所5一个或多个处理器执行，所述一个或多个程序配置用于执行第一方面提供的音频处理方介质中存储有程序代码，所述程序代码可被处理器调用执行第一方面提供的音频处理方6[0018]图9是本申请实施例的用于执行根据本申请实施例的音频处理方法的计算机设备[0019]图10是本申请实施例的用于保存或者携带实现根据本申请实施例的音频处理方将结合图1对本申请实施例提供的音频处理方法进行详细阐述。该音频处理方法可以包括7所有音素中每个音素出现的开始时间和结束时间以及所述目标音频对根据音素的开始时间和结束时间更为准确地确定目标音频中单位文本出现的开始时间和的开始时间最早的时间作为单位文本出现的开始时间，将多个音素中出现的结束时间最晚8位文本出现的开始时间和结束时间作为针对目标面将结合图2对本申请实施例提供的音频处理方法进行详细阐述。该音频处理方法可以包所有音素中每个音素出现的开始时间和结束时间以及所述目标音频对9个文字对应的拼音与音素序列中的每个音素进行匹配，以得到与每个文字相匹配的音素。面将结合图5对本申请实施例提供的音频处理方法进行详细阐述。该音频处理方法可以包所有音素中每个音素出现的开始时间和结束时间以及所述目标音频对[0075]步骤S360：将所述频率与其对应的单位文本之间的对应关系添加至所述分析结之间的对应关系添加至分析结果中。其中，文本信息中可以存在一种单位文本存在多个相现的频率为2；[0083]步骤S380：若接收到用户基于所述分析结果输入的针对指定单位文本的查看请[0087]请参照图6，图6为本申请又另一实施例提供的一种音频处理方法的流程示意下面将结合图6对本申请实施例提供的音频处理方法进行详细阐述。该音频处理方法可以所有音素中每个音素出现的开始时间和结束时间以及所述目标音频对过上述方式进行相似度的比较，任取其余单位文本中的任一单位文本作为指定单位文本，并获取其余单位文本中除指定单位文本的每个单位文本对应的音频片段与指定单位文本频也会不一样，因此也可以基于语谱图对同一用户标识对应的多个音频片段进行语音分的信息整合，用户可以根据用户标识和/或情绪标识来查看其想要查看的单位文本对应的对应的所有单位文本中每个单位文本的开始时[0108]请参照图7，图7为本申请再又一实施例提供的一种音频处理方法的流程示意对音频数据进行语音识别引擎解码，解码的最终结果可以得到音频数据的文字识别内容，可以让用户了解到针对目标音频中的更多细节信息，如某个文字或某个词组出现的频率，[0113]语音识别模块510用于对目标音频进行语音识别，获取所述目标音频中包含的所[0114]时间获取模块520用于根据所述每个音素出现的开始时间和结束时间，获取所述[0115]分析结果确定模块530用于基于所述文本信息、所述文本信息中的单位文本以及类型作为目标类型。时间获取模块520可以具体用于根据所述每个音素出现的开始时间和可以用于将所述频率与其对应的单位文本之间的对应关系添加至所述分析并被配置为由一个或多个处理器601执行，一个或多个程序配置用于执行如前述方法实施实现下述各个方法实施例的指令等。存储数据区还可以存储计算机设备600在使用中所创[0136]请参考图10，其示出了本申请实施例提供的一种计算机可读存储介质的结构框以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN113851110B 音频处理方法、装置、计算机设备及存储介质（深圳市声扬科技有限公司）

文档简介

温馨提示

最新文档

评论

CN113851110B 音频处理方法、装置、计算机设备及存储介质 （深圳市声扬科技有限公司）

文档简介

温馨提示

最新文档

评论

相关文档

CN113851110B 音频处理方法、装置、计算机设备及存储介质（深圳市声扬科技有限公司）