版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
万博二路79号万博商务区万达商业广质一音频的频谱能量特征由线性时域转换到Bark频的Bark特征输入预先训练得到的目标神经网2对所述第一音频进行预处理,以将所述第一音频的频谱能量特征由线性时域转换到将所述Bark特征输入预先训练得到的目标神经网络模将所述Bark特征输入预先训练得到的目标神经网络模型,得到所述语音信号在所述对所述Bark频域的频谱幅值比例进行Bark特征逆转换基于所述线性时域的频谱幅值比例以及所述第一音频在线性时域的频谱能量计算所对每个窗内的所述第一音频信号进行短时傅立叶变换将所述Bark特征输入所述分离门卷积层,再将所述分离3将所述第二因果卷积层的输出分别输入至所述第三卷积层以将所述第三卷积层的输出输入至所述第一激活函数模块将所述第一激活函数模块的输出与所述第二激活函数模块将所述语音信号以及背景噪声信号按照预设信噪比在线性时域上第一获取模块,用于获取第一音频,所述第一音频为混第一计算模块,用于将所述Bark特征输入预4的音频;继而对第一音频进行预处理,以将第一音频的频谱能量特征由线性时域转换到5[0010]图1示出了适用于本申请实施例提供的语音降噪的方法中的分离门卷积层的网络[0011]图2示出了适用于本申请实施例提供的语音降噪的方法中的长短时记忆网络的结[0017]图8示出了本申请实施例的用于保存或者携带实现根据本申请实施例的语音降噪6计算量,提升音频的降噪效果,发明人发现,将音频的频谱能量由线性时域转换至频域核的学习视野的同时减少神经网络计算量的增加,同时增加神经网络模型的非线性程度,[0024]请参阅图1,为本申请实施例提供的语音降噪的方法中的一种示例性的分离门卷[0025]其中,第一激活函数模块可以采用Relu(RectifiedLinearUnit,线性整流函7(即上述的声音信号)做短时傅里叶变换后得到的值(即音频的频谱特征或者叫做音频的频记忆层用于根据纹理特征输出去噪后的音频特征,即目标语音在Bark域的频谱特征(包括频谱幅值以及频谱能量)。其中,长短期记忆层即长短时记忆网络(LongShort-Term[0044]请参阅图2,为适用于本申请实施例提供的语音降噪的方法中的长短时记忆网络8[0054]可选的,LSTM可以包含多层如图2所示的结构,每一层均接受上一层的隐藏层输[0058]其中,第一音频可以为混合有目标采样率的语音信号以及背景噪声信号声音的电磁干扰或者是周围环境等,背景噪声可以使许多语音处理系统的性能急剧下降,么在这种情况下,电子设备可以将任意一段音频(包括视频中的音频数据)识别为第一音类应用程序在运行过程中的视频播放音效、或者是获取电子设备在启动过程中的启动音9频的语音信号的幅值减少失真;使目标神经网络模型可以按照上述的包括3个分离门卷积门卷积层的输出输入到长短期记忆层,可输出得到Bark特征比例参数(目标神经网络模型神经网络模型可以输出频谱幅值为0.8的语音信号,即该目标神经网络出来,得到表征语音信号的频谱幅值特征在Bark频域中所占的比例的Bark特征比例参数,再基于Bark特征比例参数计算语音信号的幅值参数,基于幅值参数获取目标语音(即消除[0082]其中,本申请实施例的训练样本集中包括预设时长的语音信号以及背景噪声信信号,也可以将不连续的预设时长内的不同类型的背景噪声作为预设时长的背景噪声信的值(即stft值)。本实施例中所采取的Bark特征的维度为48维,那么stft_energy转换到Bark特征的转换矩阵stft2bark_matrix的维度为1[0104]其中,Bark特征被输入分离门卷积层后每个分离门卷到带噪歌声在线性时域的频谱能量(stft_energy),再将带噪歌声的频谱能量做Bark特征出得到带噪歌声的歌声信号在Bark频谱的频谱幅值比例(Bark_mask),然后对频谱幅值比频谱幅值比例(mask)以及对带噪歌声进行反傅立叶变换时计算出的带噪歌声在线性时域的频谱能量(stft_energy)计性时域的相位(stft_phase)合成歌声信号降噪后在线性时域的波形,从而得到歌声信号,语音信号在Bark频域的频谱幅值比例,再对Bark频域的频谱幅值比例进行Bark特征逆转的相位值获取目标语音。实现了通过全新的分离门卷积结构对输入的Bark特征进行处理,[0127]作为一种方式,第一计算模块330具体可以用于将Bark特征输入预先训练得到的计算语音信号的幅值参数;然后基于幅值参数获取目标语音。本方法通过将第一音频的执行前述语音降噪的方法的电子设备12。电子设备12包括存储器122以及相互耦合的一个122中存储有可以执行前述实施例中内容的程序,而处理器124可以执行存储器122中存储编程门阵列(Field-ProgrammableGateArray,FPGA)、可编程逻辑阵列(Programmable该计算机可读存储介质400中存储有程序代码,所述程序代码可被处理器调用执行上述方算机可读介质(non-transitorycomputer-readablestoragemedium)。计算机可读存储以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 产后出血子宫按摩护理查房
- 小商店消防安全制度
- 2026日喀则市护士招聘考试题库及答案
- 2026曲靖市专职消防员招聘考试题及答案
- 环境管理考试题目及答案
- 《项目探究:创建数字作品素材库》教案-2025-2026学年鲁教版(新教材)小学信息技术三年级下册
- 2026年微笑幼儿园中班
- 2026年幼儿园使用剪刀的
- 2026年无领导故事幼儿园
- 2026年幼儿园教师考核制
- 2026年上海市徐汇区初三语文二模试卷及答案(详解版)
- 2026贵州黔晟投资有限公司第一批社会招聘8人建设考试备考试题及答案解析
- (正式版)DB32∕T 2940-2016 《鲜食玉米品种 苏玉糯11》
- 视频监控系统监理实施细则
- (2025年)宁波市江北区辅警考试题《公安基础知识》综合能力试题库附答案
- 安宁疗护评价与考核制度
- 内科主治医师神经内科学考试历年真题章节题库及答案
- 损害管制课件
- 元素周期律说课稿课件
- 新22J01 工程做法图集
- 安全隐患排查整改台账
评论
0/150
提交评论