(计算机应用技术专业论文)抗闪光的镜头检测算法研究与应用.pdf_第1页
(计算机应用技术专业论文)抗闪光的镜头检测算法研究与应用.pdf_第2页
(计算机应用技术专业论文)抗闪光的镜头检测算法研究与应用.pdf_第3页
(计算机应用技术专业论文)抗闪光的镜头检测算法研究与应用.pdf_第4页
(计算机应用技术专业论文)抗闪光的镜头检测算法研究与应用.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(计算机应用技术专业论文)抗闪光的镜头检测算法研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,帮羲 i 。 : r ad i s s e r t a t i o ns u b m i t t e dt og u a n g d o n gu n i v e r s i t yo f t e c h n o l o g y f o r t h ed e g r e eo fm a s t e ro fe n g i n e e r i n gs c i e n c e r e s e a r c ha n da p p l i c a t i o no fa n t i - f l a s hs h o td e t e c t i o n a l g o r i t h m c a n d i d a t e :z h e n gh u i j u n s u p e r v i s o r :a s s o c i a t ep r o f z h a n gw e i m a y 2 0 10 f a c u l t yo fc o m p u t e r g u a n g d o n gu n i v e r s i t yo ft e c h n o l o g y g u a n g z h o u ,g u a n g d o n g ,p r c h i n a ,5 10 0 9 0 毛 摘要 摘要 随着信息技术的突飞猛进,产生了大量的视频文档。视频压缩、视频编解码、计 算机海量存储和信息高速传输等技术的发展解决了日益膨胀的视频信息传输和存储问 题,如何对海量的视频数据进行高效的计算机处理,实现视频内容的索引、查找、分 析、语义描述和压缩等成为现在关注的焦点。 目前一致公认的视频检索手段是视频内容结构化,即镜头检测,目前的镜头检测 主要分为两大类,基于压缩域的镜头检测和基于非压缩域的镜头检测,由于基于压缩 域的镜头检测计算较为复杂,而且准确率不高,目前研究较多的是基于非压缩域的镜 头检测。先把视频解压,提取视频的帧特征,然后进行帧特征的比较,计算出帧间差 值,根据帧间差值来判断镜头切换的位置。 本文研究和分析了视频镜头检测的多种算法,镜头切换分为渐变和突变,渐变又 有很多种,一般的镜头检测算法对突变检测率较高,但是对于镜头的渐变,因为帧间 差是缓慢变化的,帧间差异值较小,导致检测阈值难以确定,相比于突变检测,渐变 检测率较低。目前的镜头检测研究主要是针对镜头渐变的检测,其中许多镜头检测算 法只能针对某些视频有效,检测出某一类或几类镜头变换,有些只能检测突变,而不 能准确的检测出渐变。由于视频复杂,渐变形式多,检测技术不成熟,目前还没有一 个比较高效、检测率高的镜头检测算法普遍适合于所有视频,因此镜头检测还在不断 的发展完善之中。 本文分析了当前镜头检测算法存在的问题,给出了自己的检测方法,提出融合多种 特征的镜头检测,特别针对闪光问题,给出了相应的检测方法,论文主要工作归结为 以下几点: 1 比较和分析了现有的基于像素、基于直方图、基于边缘检测等视频镜头检测算 法的优点和不足; 2 将基于像素匹配的镜头检测算法与基于分块直方图的镜头检测算法相结合,给 出了算法的模型,模型分为四个功能模块:视频解码、特征提取、闪光过滤和融合中 心: 3 根据算法模型进行了算法设计,基于像素的特征能够很好的反应局部变化,基 于分块直方图的特征能够很好的反应全局变化,通过结合两种特征进行检测以得到更 广东x - , 1 k 大学硕士学位论文 准确的镜头切换位置; 4 过滤镜头中的闪光帧,对视频中出现闪光的帧进行了过滤,避免了因闪光而造 成的误检; 5 最后对以上给出的镜头检测方法,用四段视频进行了实验结果与分析,分析了 算法查全率、准确率和误检率。验证了本文方法的有效性; 关键字:镜头检测,直方图,闪光,时间序列分析 i i a b s t r a c t a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fi n f o r m a t i o n t e c h n o l o g yg e n e r a t e dal o to fv i d e o d o c u m e n t a t i o n v i d e oc o m p r e s s i o n 、v i d e oc o d e c 、i n f o r m a t i o no nc o m p u t e rm a s ss t o r a g e a n dh i g h s p e e dt r a n s m i s s i o nt e c h n o l o g yt os o l v ea ne v e r - e x p a n d i n gv i d e od a t at r a n s m i s s i o n a n ds t o r a g ei s s u e s ,h o wt ou s ec o m p u t e re f f i c i e n t l yp r o c e s sv a s ta m o u n t so fv i d e od a t a , a n d v i d e oc o n t e n ti n d e x i n g 、s e a r c h 、a n a l y s i s 、s e m a n t i cd e s c r i p t i o na n dc o m p r e s s i o n ,b e c o m et h e f o c u so fa t t e n t i o n a tp r e s e n t ,w i d e l yr e c o g n i z e dm e a n so fv i d e or e t r i e v a li sv i d e oc o n t e n ts t r u c t u r e ,t h a ti s s h o td e t e c t i o n ,s h o td e t e c t i o n c u r r e n t l ym a i n l y d i v i d e di n t ot w oc a t e g o r i e s ,b a s e do n c o m p r e s s e dd o m a i ns h o td e t e c t i o na n db a s e do nn o n c o m p r e s s e dd o m a i ns h o td e t e c t i o n , b e c a u s et h es h o td e t e c t i o nb a s e do nc o m p r e s s e dd o m a i ni sm o r e c o m p l e xi nc a l c u l a t i n ga n d a c c u r a c yi sn o tv e r yh i g h ,m o r ec u r r e n tr e s e a r c hi sb a s e do nn o n c o m p r e s s e dd o m a i n t h e s t e p sf o rs h o td e t e c t i o na r e :f i r s tv i d e od e c o m p r e s s i o n ,v i d e of r a m e sf e a t u r ee x t r a c t i o n , f e a t u r ec o m p a r i s o no ft h ef r a m ea n dt h e nc a l c u l a t et h ef r a m ed i f f e r e n c e ,a c c o r d i n gt ot h e d i f f e r e n c eb e t w e e nf r a m e st od e t e r m i n et h el o c a t i o no ft h es h o tp o s i t i o n t h i sp a p e rs t u d i e sa n da n a l y z e sav a r i e t yo fv i d e os h o td e t e c t i o na l g o r i t h m ,s w i t c h i n g t h es h o t si n t og r a d u a ls h o ta n dc u ts h o t ,g r a d u a ls h o ti sd i v i d e di n t om a n yt y p e s ,t h eg e n e r a l s h o td e t e c t i o na l g o r i t h mc a nd e t e c tc u ts h o t ,b u tf o rt h eg r a d u a ls h o t ,b e c a u s et h ef r a m e d i f f e r e n c ei st h es l o wc h a n g ed o e sn o ts u d d e n l ys h o wg r e a td i f f e r e n c e sb e t w e e nf r a m e s ,s o i sm o r ed i f f i c u l tt od e t e c tt h a nc u ts h o td e t e c t i o n c u r r e n ts h o td e t e c t i o na l g o r i t h mi sm a i n l y f o rt h ed e t e c t i o no f g r a d u a ls h o t m a n yo ft h ec u r r e n ts h o td e t e c t i o na l g o r i t h m sc a nd e t e c ta c e r t a i nk i n do fs h o t ,a n ds o m ec a no n l yd e t e c tc u ts h o t ,a n dc a nn o ta c c u r a t e l yd e t e c tt h e g r a d u a ls h o t b e c a u s eo fi t st h e o r yi sn o tv e r ym a t u r e ,t h e r ei sn o ty e tam o r ee f f i c i e n ta n d a c c u r a t es h o td e t e c t i o na l g o r i t h m ,s ot h es h o td e t e c t i o nc o n t i n u e st od e v e l o pp e r f e c t i o n t h i sp a p e rs t u d i e sc u r r e n ts h o td e t e c t i o na l g o r i t h mp r o b l e m s ,g i v e no u ro w n p r o p o s a l s , p r o p o s e dt h ei n t e g r a t i o no fav a r i e t yo ff e a t u r e st od e t e c ts h o t ,e s p e c i a l l yi nt h ef l a s hc a u s e d b yt h ef a l s ed e t e c t i o nh a v eb e e ns t u d i e d ,o u rm a i nw o r k sa r ea sf o l l o w s : i i i 广东工业大学硕士学位论文 1 c o m p a r i s o na n da n a l y s i st h es t r e n g t h sa n dw e a k n e s s e so fe x i s t i n gp i x e l b a s e d 、 h i s t o g r a mb a s e da n de d g ed e t e c t i o nb a s e ds h o td e t e c t i o na l g o r i t h m ; 2 c o m b i n e dp i x e lm a t c h i n gb a s e da l g o r i t h mw i t hb l o c kh i s t o g r a mb a s e ds h o td e t e c t i o n a l g o r i t h m ,g i v e nt h ea l g o r i t h mm o d e l ,t h i sm o d e li sd i v i d e di n t of o u rf u n c t i o n a lm o d u l e s : v i d e od e c o d i n g ,f e a t u r ee x t r a c t i o n ,f l a s hf i l t e r i n ga n df u s i o nc e n t e r ; 3 d e s i g n e dt h ea l g o r i t h ma c c o r d i n gt ot h ea l g o r i t h mm o d u l e p i x e lb a s e dc h a r a c t e r i s t i c s a r eg o o dr e s p o n s eo fl o c a lc h a n g e s ,t h ec h a r a c t e r i s t i c so fb l o c kh i s t o g r a mr e s p o n s et og l o b a l c h a n g e si sw e l l ,t h r o u g hac o m b i n a t i o no ft w of e a t u r e st ob ea c c u r a t e l yd e t e c t e dp o s i t i o no f t h es h o tp o s i t i o n ; 4 i nt h es h o td e t e c t i o np r o c e s s ,t h ef l a s hf r a m ei nn e w sv i d e oi sf i l t e r e d ,t oa v o i dt h e f a l s ec a u s e db yf a l s ef r a m e s ; 5 f i n a l l y , w et e s t t h ea b o v es h o td e t e c t i o nm e t h o do nf o u rv i d e o s ,a n a l y s i st h e a l g o r i t h mr e c a l l ,a c c u r a c ya n de r r o rr a t e v e r i f yt h ev a l i d i t yo ft h em e t h o d k e y w o r d s :s h o td e t e c t i o n ,h i s t o g r a m s ,f l a s h ,p i x e l i v 目录 目录 摘要l a b s t r a c t ii i 第一章绪论。1 1 1 研究背景及意义1 1 1 1 研究背景1 1 1 2 研究意义2 1 1 3 几种典型的c v b r 系统。3 1 3 镜头检测现状及存在的问题4 1 3 1 研究现状4 1 3 2 存在的问题6 1 4 论文主要工作7 1 5 论文章节安排7 第二章镜头检测相关技术9 2 1 镜头检测相关概念9 2 1 1 视频结构9 2 1 2 镜头分类1 0 2 1 3 颜色空间。1 1 2 1 4 直方图1 2 2 1 5m p e g 压缩标准简介1 3 2 2 镜头检测的一般过程1 4 2 2 1 视频解码1 5 2 2 2 特征提取1 5 2 3 镜头检测算法分类及综述1 6 2 3 1 基于压缩域的镜头检测算法1 7 2 3 2 基于非压缩域的镜头检测算法。1 9 2 4 本章小结2 3 第三章镜头检测算法模型2 4 3 1 镜头特点2 4 v 广东工业大学硕士学位论丈 3 1 1 突变镜头特点2 4 3 1 2 渐变镜头特点2 5 3 2 镜头检测相关分析2 7 3 2 1 基于像素比较法的优缺点2 7 3 2 2 基于直方图比较法的优缺点2 7 3 2 3 闪光对镜头检测的影响2 8 3 3 模型建立2 8 3 4 本章小结2 9 第四章算法设计。3 0 4 1 算法基本思想3 0 4 2 视频解码。3 0 4 3 特征提取3 2 4 3 1 基于像素的帧间差特征提取3 2 4 3 1 基于分块直方图的帧问差特征提取3 3 4 4 闪光过滤。3 5 4 5 融合中心3 7 4 6 本章小结 3 9 第五章实验与结果分析4 0 5 1 实验环境4 0 5 2 实验数据4 0 5 3 实验分析4 1 5 3 1 算法评价标准4 1 5 3 2 实验结果分析4 1 5 3 3 误检分析4 3 5 4 本章小结4 4 展望与总结4 5 参考文献4 7 攻读硕士学位期间发表的论文及参加的项目5 2 独创性声明5 3 v i 目录 致谢5 4 v 1 1 广东工业大学硕士学位论文 c h i n e s ea b s t r a c t c o n t e n t s e n g u s ha b s t r a c t 。 c h a p t e r1i n t r o d u c t i o n 。i i i i l 1 1b a c k g r o u n da n ds i g n i f i c a n c e 1 1 1 1r e s e a r c hb a c k g r o u n d 1 1 1 2r e s e a r c hs i g n i f i c a n c e 2 1 1 3s e v e r a lt y p i c a lc v b r s y s t e m 3 1 3s h o td e t e c t i o ns t a t u sa n dp r o b l e m s 4 1 3 1c u r r e n tr e s e a r c h 4 1 3 2e x i s t e n c ep r o b l e m s a 6 1 4m a i nw o r ko ft h i sp a p e r 7 1 5o r g a n i z a t i o no ft h i sp a p e r 7 c h a p t e r2r e l a t e dt e c h n o l o g i e so fs h o td e t e c t i o n 9 2 1r e l a t e dc o n c e p t so fs h o td e t e c t i o n 9 2 1 1s t r u c t u r eo ft h ev i d e o 9 2 】【2c l a s s i f i c a t i o no ft h es h o t s 1 0 2 1 3c o l o r s p a c e 1 1 2 1 4h i s t o g r a m 1 2 2 1 5m p e g c o m p r e s s i o ns t a n d a r d 1 3 2 2g e n e r a lp r o c e s so fs h o td e t e c t i o n 1 4 2 2 1v i d e od e c o d i n g 1 5 2 2 2f e a t u r ee x t r a c t i o n 1 5 2 3c l a s s i f i c a t i o na n ds u r v i v eo fs h o td e t e c t i o na l g o r i t h m 1 6 2 3 1c o m p r e s s e dd o m a i ns h o td e t e c t i o na l g o r i t h m 1 7 2 3 2n o n c o m p r e s s e dd o m a i ns h o td e t e c t i o na l g o r i t h m 1 9 2 4s u m m a r y 2 3 c h a p t e r 3s h o td e t e c t i o na l g o r i t h mm o d e l 2 4 3 1c h a r a c t e r i s t i c so ft h es h o t :1 4 v i i i c o n t e n t s 3 1 1c h a r a c t e r i s t i c so ft h ec u ts h o t 2 4 3 1 2c h a r a c t e r i s t i c so ft h eg r a d u a ls h o t 2 5 3 2c o r r e l a t i o na n a l y s i so fs h o td e t e c t i o n 2 7 3 2 1t h ea d v a n t a g e sa n dd i s a d v a n t a g e so fp i x e l b a s e dc o m p a r i s o n 2 7 3 2 2t h ea d v a n t a g e sa n dd i s a d v a n t a g e so fh i s t o g r a mc o m p a r i s o n 2 7 3 2 3i n f l u e n c eo ft h ef l a s ht os h o td e t e c t i o n 2 8 3 3b u i l dt h em o d e l 2 8 3 4s u m m a r y 2 9 c h a p t e r4d e s i g no ft h ea l g o r i t h m 3 0 4 1t h eb a s i ci d e ao fa l g o r i t h m 3 0 4 2v i d e od e c o d i n g 3 0 4 3f e a t u r ee x t r a c t i o n 3 2 4 3 1f r a m ed i f f e r e n c ep i x e l - b a s e df e a t u r ee x t r a c t i o n 3 2 4 3 1f r a m ed i f f e r e n c eb a s e do nb l o c kh i s t o g r a mf e a t u r ee x t r a c t i o n 3 3 4 4h a s hf i l t e r 3 5 4 5f u s i o nc e n t e r 3 7 4 6s u m m a r y 3 9 c h a p t e r5e x p e r i m e n t sa n dr e s u l t sa n a l y s i s 4 0 5 1e x p e r i m e n t a le n v i r o n m e n t 4 0 5 2e x p e r i m e n t a ld a t a 4 0 5 3e x p e r i m e n t a la n a l y s i s 4 1 5 3 1e v a l u a t es t a n d a r do ft h ea l g o r i t h m 4 1 5 3 2e x p e r i m e n t a lr e s u l t sa n a l y s i s 4 1 5 3 3e r r o rd e t e c t i o na n a l y s i s 4 3 5 4s u m m a r y 4 4 c o n c l u s i o na n dp r o s p e c t 4 5 r e f e r e n c e s 4 7 p a p e r sp u b l i s h e dd u r i n gt h em a s t e rd e g r e e 5 2 o r i g i n a ls t a t e m e n t 5 3 i x 广东工业大学硕士学位论文 a c k n o w l e d g e m e n t 5 4 x 第一章绪论 1 1 研究背景及意义 1 1 1 研究背景 第一章绪论 随着信息技术的突飞猛进,产生了大量的视频文档。在文本、图形图像、音频、视 频等各种媒体信息中视频信息属于一种比较特殊的视觉媒体信息,具有直观性、生动 性、容易被理解和接受等特点,因而更加受到人们的关注。如今视频信息的来源不断 扩大,视频压缩、视频编解码、计算机海量存储和信息高速传输等技术的发展解决了 日益膨胀的视频信息传输和存储问题,如何对海量的视频数据进行高效的计算机处理, 实现视频内容的索引、查找、分析、语义描述和压缩等成为现在关注的焦点船- 。 视频图像的一个特点是数据量很大,但视觉冗余度较大。为访问视频内容,需要对 视频进行浏览和对视频信息定位,这需要将视频分解。基于内容的视频检索 ( c o n t e n t b a s e dv i d e or e t r i e v a l ,c b v r ) 是指根据描述的视频对象内容及上下文联系,在 大规模视频数据库中进行各种特征检索,找到具有指定特征内容的视频数据。其研究 目标就是在没有人参与的情况下能自动识别或理解视频的重要特征。基于内容的视频 检索在将来可能的应用包括:数字图书馆,医学图像诊断,地理信息系统和遥感,视 频点播,地质勘探,用于环保、减灾、和天气预报的地球卫星图像系统、网络搜索引 擎、网络购物等等。 目前一致公认的视频检索手段是视频内容结构化。视频内容结构化就是对视频流中 的连续帧序列进行切分,把一个连续视频流按其内容展开的不同,将它分成若干语义 段落单元。视频流的结构化能够从一部很长的视频中抽象出视频内部隐含的情节发展 结构,它为大数据量视频的导航和浏览提供了一种非常好的手段。随着数字视频的使 用越来越广泛,自动视频内容分析技术的需求也越来越大。对视频节目,一般可将其 分解为一系列基本的单元镜头( s h o o ,在这样分解的基础上可对视频进一步组织, 以进行非线性的浏览和基于内容的查询检索等。作为视频结构化处理的基本步骤 镜头检测,它的工作性能与效果将直接影响后续的处理。用传统的手工方法来切割视 频非常耗时,对- - d 时的视频有时需要十个小时的工作来切割,所以需要一种自动的 广东工业大学硕士学位论文 方法来切割视频镜头。 1 1 2 研究意义 目前,随着网络的发展越来越多的视频出现在互联网上,同时每天都有大量的图像 和视频信息在不断的产生,因此互联网正在成为一个巨大的视频仓库,如何有效的对 视频进行搜索已经成为目前急需解决的问题b ,。视频检索要求在大量的视频数据中找到 所需要的视频片断,但由于视频内容繁多,且复杂对视频的检索十分困难。视频是目 前包含信息量最丰富的数据,对视频的检索已是实际生活中的一个突出的问题,它的 用途非常广泛,包括新闻视频信息的检索、各类比赛节目的检索、卫星云图变化情况 的检索等等。 对于日益增长的视频数据,如果不对其进行有效的管理,将会造成数据混乱的局面。 在信息的组织、管理和检索方面,传统上应用最广泛的是数据库技术,传统数据库采 用基于关键词查找的检索方式,适于处理结构化的文本类和数值类的记录信息检索。 然而,视频数据和文本数据有很大的不同,这种方法用于多媒体信息管理则有相当大 的局限性。多媒体信息与文本的数值信息存在着本质上的不同,它具有如下特点: 1 非结构化特性 在传统数据库中,记录信息具有明显的结构化特性,它反映的是现实世界中对象间 的关系,可通过实体关系模型抽象得到,与此相比,多媒体对象具有较强的非结构化 特性,许多多媒体信息都以流的形式存在( 如视频流,音频流) 。对这类多媒体对象检索, 首先要对其结构化处理,提取出某种特征,这种处理不能仅仅通过简单的抽象来完成, 还需要相应的媒体和组织技术。 2 内容多义性 在传统数据库中,每个记录所包含的语义信息确定而且有限。而对多媒体对象来说, 其内容往往在不同的应用中具有不同的解释,即具有多义性的特点,这样其内容的含 义就难以仅仅通过几个属性来充分描述。此外,一般对多媒体对象的检索往往都是根 据内容相似程度进行检索即查找库中内容描述与检索要求最接近的目标,这就要 求建立的内容描述支持内容相似程度的定量比较,而这也是数据库中采用的定性描述 所不能满足的。 视频的检索和传统数据库的检索有很大的不同,目前网络上对视频库中视频信息片 2 第一章绪论 断进行寻找时一般的检索方法还是基于关键字的检索,最后查询出来的视频非常多, 还需要我们再查找。它的优点是对查询请求描述简洁、查询速度快、可以表达复杂的 高级语义等。但它也有一些重要缺陷,首先人们为视频数据添加文本型的内容描述数 据将是一项非常耗时的劳动,因为他将对大量的待标注的视频内容进行细致地观看和 理解,并抽取出合适的供检索用的关键字,其次产生的描述文字往往带有很强的主观 性、不准确性、不完整性。使得当用户输入关键字后,查询结果较多,而且不能很好 的搜索到用户所需要的视频,还需要用户二次查找。为了解决基于关键字检索存在的 问题,必须引入基于内容的视频检索技术。所谓基于内容的视频检索是指根据视频的 语义特征进行检索,以提取出与特征相符或相似的视频数据,视频数据的外观表现及 特点常常难以用符号化方法加以描述,人们虽然通过视觉理解其特点及含义,但要根 据这些特征及语义线索建立视频数据库,并从中检索出某些特定的视频信息,则需要 在建立数据库时能够自动或半自动的完成对视频数据特征及其语义的描述。这需要综 合运用图像处理、图像理解、知识处理数据库等技术建立新的视频数据模型,把原始 视频信息以独立的结构化的单元有机的存储起来,采用可靠有效的查询算法使用户在 智能化查询接口的辅助下完成视频检索工作。要实现基于内容的视频检索首先必须进 行视频镜头分割,关键帧提取。因此,视频的镜头检测是进行基于内容的视频检索的 基础。镜头检测结果的好坏将直接关系到视频检索的准确性、高效性、充分性。 1 1 3 几种典型的c v b r 系统 近年来,c v b r 系统的研究成为很多科研机构和研究团体的研究热点,也取得了一 些进展,到目前为止,已经出现了一些比较成熟的c v b r 系统,主要都是一些大型公司 和研发机构,有代表性的系统有i b m 公司a l m a d e n 实验室设计开发的q b i c 系统,美国 哥伦比亚大学图像与高等电视实验室开发的v i d e o q 系统,清华大学计算机系和中共中 央办公厅警卫局联合研制开发完成的基于内容的视频信息管理系统t h c v i m s 。 q b i c 系统根据颜色纹理形状建立相似性准则,其中颜色的提取采用基于颜色直方 图的算法,纹理的提取基于改进的t a m u r a 纹理提取算法,形状特征主要包括面积连通 性、偏心率、主轴方向以及一些矩估计量。q b i c 结合了多种查询方式,如标准的系统 查询方式、选择特征查询和草图查询以及利用镜头和镜头内部目标运动等信息对大型 图像和视频数据库进行查询。视频方面主要利用了颜色纹理形状摄像机和对象运动来 3 广东工业大学硕士学位论文 描述内容j ,。 v i d e o q 是一个基于w e b 的视频检索项目是第一个支持基于对象自动索引和时空关 系查询的在线式视频检索引擎,它采用c s ( 客户端j j 侵务端) 结构扩充了传统的基于文本 关键字和主题导航的查询方法,允许用户使用视觉特征和时空关系来检索视频数据m 1 。 基于内容的视频信息管理系统t h c v i m s ( t s i n g h u ac o n t e n t b a s e d v i d e o i n f o r m a t i o nm a n a g e m e n ts y s t e m ) l 妇清华大学计算机系和中共中央办公厅警卫局联合研 制开发完成。该系统集成了当前基于内容检索中的多项先进技术,为视频库的有效管 理提供了灵活、直观的解决方案,并且在镜头检测、视频特技检测、长镜头分割、主 运动估计算法等方面取得了重要的研究突破。t h c v i m s 系统目前已经实现了建库、 视频分割入库、视频节目生成、标注和检索等功能,提供了对镜头切变、渐变以及特 技镜头转换的检测、基于摄像机操作的长镜头分割、新闻标题条的检测等先进功能。 该系统目前已成功地应用在中央办公厅警卫局,系统中存储与管理的视频资料涉及国 内外重大政治事件、重大活动以及监控视频等超过l o o o d 、时n ,。 1 3 镜头检测现状及存在的问题 1 3 1 研究现状 多媒体信息的计算机处理始于2 0 世纪9 0 年代前后,近年来已得到来自不同学科( 计 算机、物理学、声学、地图学、信息管理等) 的众多专家学者的重视,并已成为2 1 世纪 信息处理领域的重要研究课题。当然,目前所取得成果和进步主要得益于计算机技术、 网络技术以及相关学科的发展。对数字视频而言,无论是标引、分类还是摘要均涉及 到镜头的分割、关键帧的选取。由于视频数据甚为复杂这些技术尚处在研究和实验阶 段。 镜头是视频流在编辑制作及检索中的基本结构单元,因此镜头的自动分割是视频结 构化的基础,也是视频分析和检索过程中的首要任务。镜头分割的效果将直接影响到 更高一级的视频结构化以及后续的浏览和检索。一个镜头由一个摄像机连续拍摄得到 的时间上连续的若干帧图像组成。基于内容检索的视频处理,首先要把视频自动地分 割为镜头。所以,镜头检测也可以看作是一个分割问题。视频时域的镜头分割是进一 步对视频进行分析的基础,目前对视频图像的时域分割大都是采用基于边界的方法, 4 第一幸绪论 即设法确定从一个镜头到另一个镜头的转换处,也就是镜头边界( s h o tb o u n d a r y ) ,从而 确定镜头。 镜头之间的转换方式主要有两大类,即突变( c u tt r a n s i t i o n ) 和渐变( g r a d u a l t r a n s i t i o n ) 。镜头检测的主要研究内容是镜头突变和渐变的检测方法。镜头突变是将两 个镜头直接连接在一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论