


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于深度学习的视频内容描述研究人工智能大体可分为两个研究方向 : 感知智能和认知智能。感知 智能研究进展讯速 ,比如图片分类、自然语言翻译 , 但认知智能发展速 度有限, 比如看图说话、视觉描述等。将自然语言和计算机视觉结合 起来研究,有利于搭起人类和机器之间沟通的桥梁 , 促进认知智能的 研究。由于近些年深度学习技术的发展 , 建立起视频和自然语言的连 接将被视为视频理解的终极目标。 视频内容描述不同于视频分类、 物 体检测等标签式的粗粒度视觉理解任务 , 而是需要用通顺准确的一句 话来描述视频内容。这不仅需要识别出视频中的物体 , 还需要理解视 频中物体之间的相互关系 ,同时由于视频内容描
2、述风格多样 , 比如对 场景的抽象描述 , 对各物体之间关系的描述 , 对视频中物体行为和运 动的描述等 , 这将给视频内容描述研究带来很大的挑战性。传统的视 频内容描述算法主要采用基于语言模板的方法或基于检索的方法。 基 于语言模板的方法 ,由于受到固定语言模板的限制 , 只能生成形式单 一缺乏灵活性的句子。 而基于检索的方法过于依赖检索视频库的大小 当数据库中缺少与待描述视频相似的视频时 , 生成的描述语句将和视 频内容存在较大的偏差。 同时这两种方法都需要在前期对视频进行复 杂的预处理过程 , 而对后端的语言序列部分优化不足 , 从而导致生成 的语句质量较差。随着深度学习技术的进步 ,
3、基于编码解码器的序列 学习模型在视频内容描述问题中取得突破性的进展。 本文将对视频内 容描述的算法进行相关研究 , 主要工作总结如下 :1. 提出一种新的基 于多模态语义注意力机制的视频内容描述方法。 视频内容描述问题的 关键首先在于视频特征的提取 , 由于视频中不同模态信息能够互相辅 助, 对视频多模态信息进行编码有助于挖掘更多的语义信息。同时由 于通常的视频内容描述算法只考虑视频特征而忽略了视频高级语义 属性信息,为了提高生成描述句子的质量 , 本文还探讨了如何提取高 层语义属性以及将语义属性运用到视频内容描述任务上来。 本文主要 设计了一个融合多模态语义属性的编码解码器网络 ,在编码阶段
4、 ,从 多模态信息出发 , 采用视频帧、光流帧和视频片段相结合的方法得到 视频特征向量。同时检测和生成视频的高级语义属性标签 , 为了获得 更有效的视觉特征和语义属性 , 将语义属性标签生成阶段的辅助分类 损失和解码器网络损失进行同时优化。在解码阶段 , 我们提出结合语 义属性的注意力机制算法 , 将语义属性向量融入到传统的循环神经网 络权重矩阵中 , 并且在生成句子单词的每一时刻 , 采用注意力机制来 关注特定的语义属性。 最后在两个流行的视频描述数据集上进行充分 地实验来验证所提出新模型的性能。 2. 对解码器端语言生成部分优化 不足的问题进行分析与研究。 当前大部分的视频内容描述算法以及
5、本 章所提出的新模型都采用最大似然对语言序列建模 , 用交叉熵损失进 行训练优化 , 这将带来两个明显的缺陷 : 一是曝光偏差问题 ,模型在训 练的时候,解码器每个时刻的输入来自训练集中真实词 , 而模型测试 的时候, 每个时刻输入来自上一时刻预测到的单词。如果其中某一个 单词预测不够准确 ,错误可能会向下传递 , 导致后面生成的单词质量 越来越差。 二是训练指标和评价准则不统一的问题。 训练阶段采用交 叉熵损失函数来最大化后验概率 , 而评价阶段采用 BLEU、METEO、RCIDER等客观评价准则,这种不一致导致模型无法充分对视频内容描 述生成的评价指标充分优化。 为了解决上述两个问题本文引入基于自 判别序列
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 发电考试题及答案
- 中级微观经济学(浙江大学)知到智慧树答案
- 中文写作(山东联盟)知到智慧树答案
- 银行会计习题及答案
- 2025年度内衣品牌企业信息化建设合作合同模板
- 2025年度泵车租赁及运输保险服务合同范本
- 2025年别墅房屋建设与室内外装饰一体化服务合同
- 2025年汽车质押借款合同车辆保险权益转让范本
- 2025年照明产品进出口贸易合同
- 2025版智能生产线全套设备交易及维护服务合同
- 2025年毕节市农业发展集团有限公司招聘考试笔试试题(含答案)
- 供应链安全管理知识培训课件
- 牛鼻子引流技术
- 严禁燃放烟花炮竹课件
- 宫颈息肉课件
- (2025年标准)班组承包协议书
- 2025国家能源投资集团有限责任公司审计中心社会招聘12人笔试参考题库附带答案详解(10套)
- 2025年全国I卷高考地理试题和答案
- 深圳微利房管理办法
- 生产安全会议纪要
- 护理文书书写PDCA案例
评论
0/150
提交评论