版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
照预设规则分别将第一特征信息划分为N个第一特征片段、将第二特征信息划分为N个第二特征一个第一特征片段和一个第二特征片段;计算N个特征组各自的融合特征;根据N个特征组各自2通过终端设备上的麦克风采集目标场景下第一预设时长的音频数据,提取所述第一音频片段的第一特征信息和第二特征信息,其中,所按照预设规则分别将所述第一特征信息划分为N个第一特征片段、将所述第二特征信按照所述预设规则将所述N个第一特征片段和所述N个第二特征片段划分为N个特征在所述原始音频的音量大于预设阈值的情况下,判断所述原始音若所述原始音频中存在目标声音,则滤除所述原始音频中对所述N个特征组各自的第一特征片段的频域特征和第二特征片段的时域特征进行融3.如权利要求1所述的音频场景分类方法,第一特征片段的频域特征和第二特征片段的时域特征进行融合处理,得到所述N个特征组按照预设权值将所述N个特征组的每个特征组中的第一特征片段的频域特征和第二特4.如权利要求1所述的音频场景分类方法,其特3将所述最终概率矩阵中数值最大的元素所属的类别标签确定为所述第一音频片段的5.如权利要求1所述的音频场景分类方法,其根据所述第一音频片段的第一场景分类结果和所述第二音频片段的第二场景分类结第一采集模块,用于通过终端设备上的麦克风采集目标第三处理模块,用于按照所述预设规则将所述N个第一特征片段划分为N个特征组,其中,每个所述特征组中包括一个第一特征片段和一个第二特征片其中,所述采集模块具体用于采集所述目标场景下第一对所述N个特征组各自的第一特征片段的频域特征和第二特征片段的时域特征进行融7.一种终端设备,包括存储器、处理器以及48.一种计算机可读存储介质,所述计算机可读存储介质于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的音频场景分类方5到的外界音频信号进行处理,具体的方式是通过对音频场景分类实现对环境声的有效判法是通过音频的频率特征计算得到音频场景分类[0008]按照预设规则分别将所述第一特征信息划分为N个第一特征片段、将所述第二特[0009]按照所述预设规则将所述N个第一特征片段和所述N个第二特征片段划分为N个特[0011]根据所述N个特征组各自的融合特征,确定所述第一音频片段的第一场景分类结6[0015]第二处理模块,用于按照预设规则分别将所述第一特征信息划分为N个第一特征计算机程序时实现上述第一方面中任一项所述的音频场示以频率为基准的时间特征信息;按照预设规则分别将第一特征信息划分为N个第一特征一音频片段的频域特征和时域特征进行了融合,得到了一组同时具有时频特性的特征表78含一个表示频率特征的第一特征片段和表示时间特征的第二特征片段,将二者进行融合,[0060]本步骤中,具体可通过将N个特征组的每个特征组的融合特征分别输入训练后的9[0061]这里,该分类模型可以是梯度提升模型,如XGBoost(ExtremeGradient[0072]S1013,若所述原始音频中存在目标声音,则滤除所述原始音频中的所述目标声[0088](4)可分离卷积层dsConv1:该可分离卷积层为2D深度可分离卷积层,包括深度对输入层的每个通道独立进行运算,不能有效利用不同通道之间的空间信息,所以需要pointwise卷积操作对pointwise生成的特征的结果将被输入到可分离卷积层dsConv1,在可分离卷积层dsConv1中,卷积核个数为16,[0093](7)可分离卷积层dsConv3:该可分离卷积层为2D深度可分离卷积层,Dropout层[0100]这里,该512维的向量后续会与通过时序特征信息提取模型提取的单个音频片段[0116]这里,该128维的向量后续会与通过频谱特征信息提取模型提取的单个音频片段[0120]按照预设权值将所述N个特征组的每个特征组中的第一特征片段的频域特征和第第一预设权值,将N个特征组的每个特征组中的第二特征片段的时域特征乘以第二预设权[0142]S1063,将所述最终概率矩阵中数值最大的元素所属的类别标签确定为所述第一[0144]在应用中采集目标场景下的音频数据是实时进行的,由[0148]步骤S108中得到第二音频片段的融合特征的具体实现方式可参见步骤S102~[0151]将所有场景分类结果中出现次数最多的分类结果确定为所述目标最终场景分类终场景分类结果通过双重判定得到,这里具体采集几次音频片段可以根据实际情况设定,音频片段整体可以理解为上述实施例中所述的第一音频片段,对应图5中wav_index=8),征,按照预设时间间隔进行划分得到8个特征组,其中8个特征组相当于分别对应时长为8个特征组的融合特征各自的融的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限[0164]对应于上文实施例所述的方法,图6示出了本申请实施例提供的音频场景分类装[0172]第三计算单元,用于对所述N个特征组各自的第一特征片段的频域特征和第二特[0175]按照预设权值将所述N个特征组的每个特征组中的第一特征片段的频域特征和第[0177]将所述N个特征组各自的融合特征分别输入训练后的分类模型,得到N个概率矩[0179]将所述最终概率矩阵中数值最大的元素所属的类别标签确定为所述第一音频片行的计算机程序,所述处理器310执行所述计算机程序时实现上述任意各个方法实施例中通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(Field_分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器部设备互连(PeripheralComponent,PCI)总线或扩展工业标准体系结构(Extended[0198]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用[0199]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用存储器、只读存储器(ROM,Read_OnlyMemory)、随机
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年大学第四学年(品牌运营)品牌口碑管理测试题及答案
- 浙江省宁波市象山县2026届初三考前训练生物试题试卷含解析
- 云南省昆明市石林县重点名校2026届初三年级模拟考试(5月)数学试题含解析
- 内蒙古满洲里市2026届初三第四次月考(英语试题)试题含解析
- 山东省泰安市肥城市湖屯镇初级中学2025-2026学年初三下学期第五次模拟(期末)语文试题含解析
- 四川省德阳中学江县重点达标名校2026届初三第一次综合测试语文试题含解析
- 山西省阳泉市平定县重点中学2026届初三下学期期末质检数学试题含解析
- 四川省成都实验外国语校2025-2026学年初三适应性月考(九)英语试题含解析
- 2026年运输系统在自动化生产线中的作用
- 2026年自动化仓储的典型挑战与应对策略
- 电冰箱的使用课件
- 公司驾驶员安全培训课件
- 总支问题清单及整改措施范文
- 2024-2025学年度西安科技大学高新学院单招《语文》模拟试题重点附答案详解
- 参数论证管理办法
- 环保物料管理办法
- FBS-JG-008工程竣工移交书
- 美国公司注册运营协议书
- GB/T 192-2025普通螺纹牙型
- 深海热液生态系统-洞察及研究
- 公司文印室保密管理制度
评论
0/150
提交评论