




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
体育视频的内容标注和解析技术研究工作报告 一,开展本课题研究的意义 近年来,数字视频的应用日趋广泛。诸如视频点播,数字电视,数字图书馆,视频会议,远程教育等等,已经为越来越多的人所接受和熟悉。面对大量涌现的视频数据,如何找到所需的视频信息就成为一个急需解决的问题。 简单的视频名查询和类似录像机的播放功能已不能满足人们的需要。正如一本书通常会有目录和索引帮助人们迅速浏览和查询内容,一部视频同样需要有效的目录和索引。传统的方法需要由人对视频内容进行标注,十分费时费力。尤其是当视频资源的数量达到海量级,或是处理的速度要求接近实时的时候,完全采用人工的方法都会遇到难以克服的困难。为了解决这一问题,九十年代以来,出现了基于内容的视频分析和检索。其核心就是通过对视频内容进行计算机分析理解,建立结构和语义索引,以方便用户检索。 巨大的商业前景和重要的学术价值,吸引了于业界和学术界不同领域的研究人员在这一问题上开展研究。一些原型系统先后被提出,主要有ibm的qbic/cuevideo,virage公司的videoengine,卡内基梅隆大学的informedia,哥伦比亚大学的videoq等。这些努力最终促成了国际标准mpeg7(多媒体内容描述接口)的诞生。但是随着问题的深入,研究人员面临了更大的障碍:视觉/听觉内容的机器理解,即难以建立底层特征与高层语义的联系。同样的难题困扰了人工智能领域多年。一般认为,寻找通用的解决方法是异常艰难的。因此,一些研究转而专注于解决特定领域的应用问题,如新闻,电影等。在这些特定领域,结合相应的领域知识,是可能将底层特征与高层语义建立某种联系的。 体育视频,即体育比赛的电视转播,作为一个重要的应用领域,一直备受关注。体育比赛一般很漫长,但对于大多数观众来说,真正关心并有可能反复观看的只是其中的一小部分。例如一场跳水比赛常常需要持续几个小时,而其中的精彩部分运动员从起跳到入水的过程却只有短短几分钟。人们需要一种方便快捷的手段来访问体育视频的内容。 与其他视频相比,体育视频具有自己的特点。首先,体育视频中存在一些领域相关的语义事件,如跳水比赛中运动员的跳水,足球比赛中的射门等。这些语义事件往往是视频中最有价值的部分,需要进行标注以便于检索。其次,体育比赛一般有较强的结构性,如跳水比赛由若干轮组成,每轮又由若干选手组成等。为了便于对视频内容的浏览,原始的视频数据应按这些结构进行解析并组织成层次目录。本课题的目标就是研究针对体育视频内容的语义标注和结构解析技术。 尽管限于当前的技术水平,完全自动的,通用的视频内容理解是不太可能的,但是本课题的研究将证明部分的解决是有可能的和有价值的,此外我们的研究也将为最终的全面解决奠定基础。除了学术上的意义,本课题的研究还可以有以下一些直接的应用: 1,视频资料库:适用于各类体育专业人士或爱好者对收集的体育比赛视频资料进行查询,浏览和管理。目前,我们已申请到国家体育总局的科研项目跳水训练图像分析软件系统研制。通过对跳水比赛视频的内容标注与解析,能够方便快捷的实现一个典型动作的视频数据库。 3,个人移动业务:适用于无线服务提供商为个人提供定制的多媒体消息服务(multimediamessageservice,简称mms)。我们的内容标注和解析技术,可以为冗长的体育视频生成摘要,从而可以根据用户的个人喜好和终端能力,向移动设备发送体育多媒体消息。 二,国内外研究现状分析 国际上对于体育视频的研究是从90年代中期开始的,属于视频检索领域的一个子课题。与新闻视频领域取得的成功相比1011,体育视频的研究相对较少也更为困难。这主要是因为新闻视频有一个基本一致的时域结构和场景语义,即先是播音员镜头,然后是新闻报道,最后再回到播音员镜头进行下面的新闻报道,而对于体育视频则不存在这样统一的结构和语义。目前体育视频的研究尚处于初期探索阶段,对于其过程和方法还没有统一的结论,也还没有可以投入实用的系统。 1,镜头检测 通常在对体育视频进行分析前,需要将其分割成镜头。所谓镜头,是指摄像机不间断拍摄的一组帧序列,它常被看成一部视频的最小结构单元。为了将镜头分割出来,需要进行镜头边界检测。镜头与镜头之间的边界有两种类型:突变和渐变。突变时,镜头直接切换到下一个;渐变时,从一个镜头到下一个镜头会有一个持续多帧的变化过程,常见的主要有淡出淡入(fadeoutandfadein),溶解(dissolve),擦变(wipe)等。淡出淡入是指视频帧逐渐隐去直到完全黑屏,再逐渐显现后一镜头的帧图像。溶解是指在前一镜头帧图像逐渐模糊的同时,后一镜头的帧逐渐增强,并且产生前后帧图像的重叠。擦变表现为后一镜头帧图像的区域逐渐变大把前一镜头的图像擦掉。 镜头检测的关键问题是如何区分镜头之间的切换和因为摄像机或物体运动造成的镜头内变化。由于这个原因,渐变比突变更难以检测。早期的工作主要在突变检测,近来更多的研究集中到对渐变的分析。 镜头检测的方法可以分为两类:非压缩域的和压缩域的。在1213中,对各种非压缩域的镜头检测算法进行了实验评价。与非压缩域的方法相比,基于压缩域的方法不需要对视频编码流进行解码,而是直接使用如dct系数,运动矢量,宏块(macroblock)信息等压缩域特征进行分析,从而提高了处理速度14151617。今天大量的视频数据是以压缩格式(如mpeg)存储的,因此基于压缩域的方法往往具有更大的实用价值。 2,语义标注 所谓语义标注,是指对体育视频中的语义事件进行检测和标注,其实质就是依据事先定义好的类别对视频片段进行识别。当前,国内外对体育视频研究实际上主要集中在这个方面,下面介绍一下相关工作。 y。gong等首先提出了对足球比赛视频的分析18。他们结合足球比赛的领域知识,通过场地白线识别,摄像机运动检测,足球和运动员检测等分析,对视频内容进行推断,包括处在球场什么位置,射门,角球等。例如,如果场景接近球门区域而且足球有一个向球门的运动,则可以推断这是一个射门。实验结果表明,系统对于球场位置的识别较为准确,达到90%,但是射门和角球的识别率只有53%,这主要是因为高速运动和遮挡关系,使得足球的检测较为困难。 哥伦比亚大学的pengxu等观察到足球比赛可以划分为两种状态:进行和暂停(如因为球在界外或裁判暂定比赛)。他们开发了一个能够检测视频中的足球比赛是在进行还是暂停的系统19。该系统对足球视频分析分为两步。首先,根据颜色分析得出每一帧中的草地颜色比率,使用这个特征将帧标注为三种:全景(globeview),近景(zoominview)和特写(closeu
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届江苏省苏州吴江市青云中学化学九上期中联考试题含解析
- 浙江省诸暨市荣怀小学2024-2025学年二年级上学期期末考试英语试题
- 吉林省白山长白县联考2026届化学九上期中达标测试试题含解析
- 2026届江西省吉安市吉水外国语学校九年级英语第一学期期末检测模拟试题含解析
- 水力学实验试题及答案
- 2025年文化馆美术教师招聘面试题及答案
- 执法迎检方案范本
- 教育培训机构合作协议书5篇
- 纺织行业离职员工技术秘密及商业秘密保密协议
- 离婚时子女抚养保险权益分割协议
- (青岛2024版)科学二年级上册2.6 春夏秋冬 课件(新教材)
- 彩虹 第一课时 课件
- DB63-T 1921-2021 交通运输专业空间数据分类与编码规范
- (完整版)铝合金门窗施工方案
- 宽带基础培训知识课件
- Unit 2 School life单元测试卷(含答案) 2025-2026学年译林版(2024)八年级英语上册
- 2025年国家电投黄河公司毕业生招聘考试笔试试题(含答案)
- 茶叶与咖啡混合饮品创新创业项目商业计划书
- 节点评审管理办法
- 来华留学生管理办法
- GJB2489A2023航空机载设备履历本及产品合格证编制要求
评论
0/150
提交评论