视频有效视觉特征提取与实验研究_第1页
视频有效视觉特征提取与实验研究_第2页
视频有效视觉特征提取与实验研究_第3页
视频有效视觉特征提取与实验研究_第4页
视频有效视觉特征提取与实验研究_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-范文最新推荐- 视频有效视觉特征提取与实验研究 视频有效特征的提取是视频检索系统中的重要组成部分,它对于视频的检索、分析以及多媒体行业的发展具有积极的意义。本文以中外视频有效特征提取技术的发展现状为背景,简单阐述了本文的研究目的和意义,以及发展过程中存在的技术瓶颈,对视频有效特征的提取进行了系统的阐述。 本文首先从视频的有效特征入手,对视频的图像特征、文本特征和音频特征进行了简单的阐述。接着,着重的介绍了基于图像特征的视频提取,图像特征主要包括颜色特征、纹理特征、文字识别、运动特征和其他特征。在这章本重点阐述了图像直方图的特征检索,对颜色特征直方图、颜色累加直方图、颜色局部累加直方图和改进的

2、颜色直方图进行了详细的研究,并使用MATLAB等软件对图片进行了相关图像检索。与此同时,文本也介绍了纹理、运动等特征以及基于他们的视频特征提取技术。其次,本文也介绍了基于文本特征的视频提取,主要有文本区域定位和视频文本识别。最后,对本文进行了总结与展望,为今后的视频有效特征提取技术的发展提供一些参考。8340关键词视频特征 颜色特征 颜色直方图 文本特征TitleExtraction and experimental research about effectivevisual feature of video AbstractExtraction and experimental resea

3、rch about effective visual feature ofvideois an important part in the retrieval systemofvideo.It has positivesignificance for retrievalandanalysisofvideo and multimedia industry.We have a simple explanation about the image features, text features andaudio features of video. Then we focus on the vide

4、o extraction based on 4.3文字识别.214.4运动特征.234.4.1活动轮廓技术.244.4.2帧间跟踪原理.254.4.3利用活动轮廓技术进行帧间跟踪.264.5其他特征.274.5.1形状特征274.5.2空间关系特征.285基于文本特征的视频提取295.1文本区域定位.295.2视频文本识别.305.2.1图像二值化.315.2.2视频文本识别.316总结与展望326.1总结326.2展望32致 谢.33参考文献.341引言1.1研究背景随着信息化社会的到来以及信息高速公路的实施,人们越来越多的接触到大量的视频信息,大容量高速存储系统为视频的海量存储提供了基本保

5、障,各行各业对视频的使用越来越广泛,视频信息资源的管理和检索显得日益重要。视频数据库的研究对多媒体数据库、电子图书馆、医疗学图像管理、罪犯识别系统、卫星遥感图像、地理信息系统、商标版权管理等方面提供有力的支持。在传统的数据库系统中,信息的检索一般以数值和字符型为主,而在多媒体数据库中集成图像、视频、音频等非格式化信息,它们具有数据量大、信息不定长、结构复杂等特点。每一种媒体数据都有一些难以用字符和数字符号描述的内容线索,如图像中某一对象的形状、颜色和纹理,视频中的运动,声音的音调等。当用户要利用这些线索对数据进行检索时,首先要将其人工转化为文本或关键词 度和精确度的提高。第三,由于视频表现方式

6、复杂,为适合不同用户的要求,必须以可视化和多层次的用户查询接口来帮助用户浏览和检索,同时需具备导航功能,使得用户能在需要的时候进入适当的视频片断、视频镜头乃至代表帧。第四,随着英特网的迅速发展,网络上的信息越来越丰富,视频必将成为网上一种很重要的资源,为了让人类能够在浩如烟海的信息海洋中自如的畅游,基于网络的视频检索技术将成为一个研究的主要内容。因此网络信息的有效组织和存储管理将为基于内容的多媒体信息检索提供方便的途径。2视频检索技术的现状目前国内外已经开发出多种视频数据检索系统,这些系统虽然大多没有成为商用化系统,但也反映了视频数据检索系统研究的主要成果。目前国内外开发的视频检索系统有:2.

7、1QBIC 系统QBIC 系统是 IBM Almaden 研究中心研究开发的基于内容的检索系统,此系统提供了对静止图像及视频信息基于内容的检索手段,是第一个功能齐全的视频数据库系统,对视频数据库发展有较深远的影响1。在 QBIC 系统中,静态图像经过对象识别模块以自动、半自动方式由场景中识别出对象,场景与对象均送入特征提取部分,从中提取出相关特征(如颜色、纹理、形状、草图等)与图像一并送入数据库中,视频序列送入镜头提取模块,由此模块把视频流分割为镜头,并从中提取出代表帧及运动对象,然后送入特征提取部分,从视频镜头及对象中提取有关特征(由代表帧中提取颜色、纹理、形状等特征及从镜头中提取的有关对象

8、运动特征)送入数据库中。在进行查询时, 基于内容的视频检索仍然是一门新兴学科,还有许多关键技术没有被很好的解决。目前这些关键技术主要包括:2.5综合多特征的检索技术视频信息包括颜色、纹理、运动等多种特征,即使对于同一种特征,也有不同的表示方法。这些特征从不同的角度表示视频特征,而如何有机地组织这些特征,使应用能够调用合适的特征和特征表示来支持查询,并按照用户的查询要求合并各种特征的检索结果,是一个值得研究的问题。综合利用两种和多种视觉特征,容易达到较高的检索率3。2.6高层概念和低层特征的关联人们在日常生活中习惯使用简便的事物概念,例如用词语“树林、汽车、海滩”等概念表达具体的含义,在查询中,很多情况下也是使用这些概念,它们属于多媒体数据的高层内容。如果能够建立视频数据底层特征与高层语义概念的关联,就能够使计算机自动抽取视频数据的语义。对于一般性的特征,建立起这种关联是非常困难的。但是针对多媒体信息检索而言,可以采用语义模板、机器学习、神经网络等方法,以及在用户交互的辅助下,突破从底层特征获取语义的壁垒。2.7高维索引技术因为视频内容的特征极其丰富,对于索引能力的要求大大大于常规数据库,因此需要研究新的索引结构和算法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论