版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
A,2018.05.15A,2020.12.18A,2020.12.11A,2019.09.06媒体信息进行解析以实现分离出多媒体信息中形成与目标音频的时域特征和频域特征相匹配2获取目标多媒体信息,并对所述目标多媒体信息进行解析以对所述目标音频进行转换处理,形成与所述目标音频的时域特征根据所述灰度图像,通过多媒体信息处理模型中第一子模基于所述梅尔频谱图的数量,确定所述第一子模型网络中的门控循环单元的通道数基于所述第一子模型网络中的门控循环单元通道数量和所述通过所述第一子模型网络中的循环神经网络确定所述目标音频对应的第一音频特征基于与所述目标音频的时域特征和频域特征相匹配的梅尔频息处理模型中的第二子模型网络中的残差网络确定根据所述平均池化层网络的输出信息,对所述第二子模型网络通过所述第二子模型网络中的图像分类网络,基于与所述目标音频的时基于所述第一音频特征向量和所述第二音频特征向量,确定所根据所述目标多媒体信息的时序信息,对所述目标多媒体信息所基于所述目标多媒体信息对应的播放时长参数与音轨信息参基于与所述多媒体信息处理模型相对应的加窗函数,对所述单声根据所述时长参数,对所述频谱图进行处理,形成与所述目标音频的3获取第一训练样本集合,其中所述第一训练样本集合为通过通过多媒体信息处理模型对所述第二训练样本集合进行处理,根据所述多媒体信息处理模型的更新参数,通过所述第二训确定所述多媒体信息处理模型的使用环境相匹配根据所述动态噪声类型,对所述第一训练样本集合进行噪声添加,将所述第二训练样本集合中不同音频样本,代入所述多媒体信息处理确定所述损失函数满足相应的收敛条件时对应所述多媒体信息处理模型中第一子模将所述第一子模型网络和第二子模型网络所分别对应的参数作为所述多媒体信息处参数,通过所述第二训练样本集合对所述多媒体信息处理模型的网络参数进行迭代更新,确定与所述多媒体信息处理模型中第一子模型网络和第二子模型网络所分别相匹配对所述第一子模型网络和第二子模型网络所分别对应的参数进行第一子模型网络和第二子模型网络所分别对应的损失函数满足对所述第一音频特征向量和所述第二音频特征向量进行向量4信息传输模块,用于获取目标多媒体信息,并对所述目信息处理模块,用于对所述目标音频进行转换处理,形所述信息处理模块,用于将所述梅尔频谱图转换为相对应的灰度图像;基于所述梅尔频谱图的数量,确定所述第一子模型网络中的门控循环单元的通道数所述信息处理模块,用于基于与所述目标音频的时域特征和频域特所述信息处理模块,用于基于所述第一音频特征向量和所述第二音处理器,用于运行所述存储器存储的可执行指令时,实现权利要求156[0016]所述信息处理模块,用于基于所述第一音频特征向量和7[0039]所述训练模块,用于通过多媒体信息处理模型对所述第二训练样本集合进行处所述多媒体信息处理模型的第一子模型网络和第二子模型网络所分别对应89块链的状态数据库进行操作,包括更新操作(终端10_1和终端10_2)通过网络300从相应的服务器200中利用不同的业务进程获取不同的端10_2)既可以通过网络300从相应的服务器200中获取长视频(即视频中携带视频信息或器400中获取短视频进行浏览。服务器200和服务器400中可以保存有不同类型的视频。其短视频播放中通常会对不同数据来源的不同短视频进行处理,最终在用户界面UI(User进程(例如网页多媒体信息推荐进程、小程序多语音信号频域分析(Speechsignalfrequencyanalyzing)、语音信号特征提取(Speechsignalfeatureextraction)、语音信号特征匹配/识别(Speechsignalfeature包括人工神经网络(artificialneuralnetwork),例如卷积神经网络(Convolutional仅仅示出了电子设备的示例性结构而非全部结构,根据需要可以实施图2示出的部分结构非易失性存储器两者。本发明实施例中的存储器202能够存储数据以支持终端(如10_1)的译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,ApplicationSpecificIntegratedCircuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic明实施例所提供的多媒体信息处理装置可以直接体现为由处理器201执行的软件模块组205的其他组件)完成本发明实施例提供的多媒程逻辑器件(PLD,ProgrammableLogicDevice)、复杂可编程逻辑器件(CPLD,ComplexProgrammableLogicDevice)、现场可编程门阵列(FPGA,Field_ProgrammableGateArray)或其他电子元件执行实现本发明实施例提供的多媒体信[0117]本发明实施例中的存储器202用于存储各种类型的数据以支持电子设备20的操现本发明实施例的从多媒体信息处理方法的程序可以包含在可执执行时,将实现本发明实施例提供的多媒体信息处理方法,下面对多媒体信息处理装置[0125]结合图2示出的电子设备20说明本发明实施例提供的多媒体信息处理方法,在介由于landmark中的组合hash依赖于dt(t2_t1),倍速慢速的dt改变,会导致生成的hash不行解析以实现分离出所述多媒体信息中所包括的后获取对应的播放时长参数与音轨信息参数可以通过解析音频同步包中的音频头解码数Hann窗口对音频进行短时傅里叶变换得到相应的频谱图;通过将频谱图映射到64阶的mel[0134]进一步地,将音频数据转换为梅尔频谱图中的数据时,由于频率的单位是赫兹[0137]将与所述目标音频的时域特征和频域特征相匹配的梅尔频谱图转换为相对应的所述第一子模型网络中的循环神经网络确定所述目标音频对应的第一音频特(NetVladNetVectoroflocallyaggregateddescriptors)聚类编码,得到音频特征向谱映射到64阶梅尔滤波器组中计算梅尔频谱,得到N个从Hz映射到梅尔频谱图的三元组样[0143]步骤405:多媒体信息处理装置基于所述第一音频特征向量和所述第二音频特征[0144]其中,可以对所述第一音频特征向量和所述第二音频特征向量进行向量融合处[0153]在本发明的一些实施例中,当确定所述目标多媒体信息[0154]在本发明的一些实施例中,当确定所述目标多媒体信息与源多媒体信息不相似[0155]继续结合图2示出的电子设备20说明本发明实施例提供的多媒体信息处理方法,条件时对应所述多媒体信息处理模型中第一子模型网络和第二子模型网络所分别对应的对所述多媒体信息处理模型的网络参数进行[0173]接收所述区块链网络中的其他节点的数据同步请求;响体信息的第一音频特征向量、第一音频特征向量和所述目标多媒体信息的目标音频的类备(例如终端/服务器)可以接入区块链网络200,[0178]区块链网络200中的共识节点接收来自不同业务主体(例如前序实施中示出的业务主体400和业务主体500)的客户端节点(例如,前序实施例中示出的归属于业务主体400网络200中特定的组织/通道中发生的交易,由共识节点210推送相应的交易通知到客户端[0180]下面以多个业务主体接入区块链网络以实现对指令信息以及与所述指令信息相行的客户端都可以向区块链网络200请求接入而成为客频特征向量、第一音频特征向量和所述目标多媒体信息的目标音频的类型填充至新区块,音频特征向量和所述目标多媒体信息的目标音频的类型发送至区块链网络200,可以预先特征向量和所述目标多媒体信息的目标音频的类型自动发送至区块链网络200,也可以由功后签署共识节点210自己的数字签名(例如,使用共识节点210_1的私钥对交易的摘要进新操作/查询操作的交易,在交易中指定了实现更新操作/查询操作需要调用的智能合约、以及向智能合约传递的参数,交易还携带了客户端节点510的数字证书、签署的数字签名及相应的进程触发信息存储于分布式文件系统或数据库。客户端节点510从分布式文件系[0191]资源层205封装了实现区块链网路200中的各个共识节点210的计算资源、存储资[0192]数据层204封装了实现账本的各种数据结构,包括以文件系统中的文件实现的区保证了交易在区块链网络200中的传播,数据验证机制用于基于加密学方法(例如数字证据实际的业务场景对加入区块链网络200的业务主体的身份进行认证,并在认证通过时赋予业务主体接入区块链网络200的权限;业务主体身份管理用于存储允许接入区块链网络[0195]共识层202封装了区块链网络200中的共识节点210对区块达成一致性的机制(即[0196]交易管理用于验证共识节点210接收到的交易中携带的数字签名,验证业务主体当交易包括查询操作时查询状态数据库中的键值对并向业务主体的客户端节点返回查询[0199]由此,经过相似性识别的目标多媒体信息的版权信息可所述目标音频对应的第一音频特征向量;通过多媒体信息处理模型中的第二子模型网络,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年针织机行业分析报告及未来发展趋势报告
- 2026年阿坝市农业机械系统事业单位人员招聘考试备考试题及答案详解
- 2026年足疗连锁店行业分析报告及未来发展趋势报告
- 2026年包头市城管协管人员招聘考试备考试题及答案详解
- 2026年三氯生行业分析报告及未来发展趋势报告
- 2026年迪庆市农产品检测中心人员招聘考试备考试题及答案详解
- 2026广东广州花山侨韵文旅产业投资有限公司第二次招聘1人考试参考题库及答案解析
- 2026年新型电池行业分析报告及未来发展趋势报告
- 2026年液晶行业分析报告及未来发展趋势报告
- 2026年包头市市场监督管理系统事业单位人员招聘考试备考试题及答案详解
- 第四章 《金瓶梅》
- 传感器技术与应用-说课
- GB/T 3452.4-2020液压气动用O形橡胶密封圈第4部分:抗挤压环(挡环)
- GB/T 13816-1992焊接接头脉动拉伸疲劳试验方法
- 2022年养老护理员理论考试题库(600题)
- 碳捕集、利用与封存技术课件
- 翰威特-绩效管理理论与操作实务
- 新生儿听力筛查(共29张)课件
- 《消防安全技术实务》课本完整版
- (精心整理)数学史知识点及答案
- 王家岭煤矿初设说明书201204
评论
0/150
提交评论