(系统工程专业论文)体育视频中运动目标的检测与跟踪.pdf_第1页
(系统工程专业论文)体育视频中运动目标的检测与跟踪.pdf_第2页
(系统工程专业论文)体育视频中运动目标的检测与跟踪.pdf_第3页
(系统工程专业论文)体育视频中运动目标的检测与跟踪.pdf_第4页
(系统工程专业论文)体育视频中运动目标的检测与跟踪.pdf_第5页
已阅读5页,还剩58页未读 继续免费阅读

(系统工程专业论文)体育视频中运动目标的检测与跟踪.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕十论文体育视频中运动目标的检测与跟踪 摘要 体育视频因为其特有的魅力,在现今社会中广受大众的欢迎。因此,对体育比赛视 频数据的分析研究,具有很高的实际意义和商业价值。本文以足球比赛视频为例,研究 了比赛视频中运动目标球员和足球的检测、识别与预测跟踪。 本论文分成四个部分:运动目标的检测、识别、足球跟踪和球员跟踪。每部分的主 要工作和研究成果如下: ( 1 ) 首先采用改进的k 均值聚类算法分割出球场区域;然后采用h s v 结合r g b 的 阈值法消除掉球场区域;最后采用h o u g h 变换提取直场地线、曲线拟合提取椭圆场地线, 并消除掉场地线,实现运动目标的检测; ( 2 ) 采用7 个归一化的h u 不变矩作为目标特征来实现运动目标的识别,通过求取样 本与模板之间的特征距离,判断出样本的类别,具有很好的鲁棒性; ( 3 ) 采用k a l m a n 滤波实现足球的跟踪。针对足球发生遮挡的情况,采用最小二乘法 拟合运动轨迹,预测出遮挡时刻的足球位置,实现了足球的遮挡跟踪; ( 4 ) 球员的跟踪采用基于颜色模型的c a m s h i f i 算法实现,充分利用球员的颜色信息, 实现了实时性。针对在跟踪中出现球员间相互遮挡的问题,采用c a m s h i f i 结合k a l m a n 算法,通过搜索窗口确定遮挡因子,根据遮挡程度加权k a l m a n 和c a m s h i f f 来得到跟踪 结果。 本文提出的算法以v i s u a lc + + 6 0 为开发平台,结合o p e n c v 类库来实现。实验表 明,本文提出的运动检测和跟踪算法具有令人鼓舞的效果。 关键词:足球视频,k 均值聚类,目标识别,k a l m a n ,c a m s h i r a b s t r a c t硕上论文 a b s t r a c t n o w a d a y s ,s p o r tv i d e o sa r eb e c o m i n gm o r ea n dm o r ep o p u l a r t h e r e f o r e ,i ti su s e f u la n d h a sc o m m e r c i a lv a l u et oa n a l y s es p o r tv i d e o s i nt h i sp a p e r , s o c c e rv i d e oi st a k e na sa n e x a m p l e ,d e t e c t i o n ,r e c o g n i t i o na n dt r a c k i n go fm o v i n gt a r g e t sp e o p l ep a ya t t e n t i o nt o i n c l u d es o c c e rp l a y e r sa n df o o t b a l li nt h es o c c e rv i d e o sa res t u d i e d t h i sp a p e ri sd i v i d e di n t of o u rp a r t s :m o v i n gt a r g e t sd e t e c t i o n ,r e c o g n i t i o n ,f o o t b a l l t r a c k i n ga n dp l a y e r st r a c k i n g a n dt h em a i nw o r ka n dr e s e a r c hr e s u l t sa r ea sf o l l o w i n g s : ( 1 ) t h i sp a p e ra d o p t st h ei m p r o v e dk - m e a n sc l u s t e r i n ga l g o r i t h m t os e g m e n tt h ec o u r t a r e a t h e n h s v 、析t l lr g bm o d e li su s e dt oe l i m i n a t ec o u r ta r e a a n de l l i p s ec o u r tl i n e sa le e x t r a c t e db yt h ec u r v ef i t t i n gm e t h o d ,s t r a i g h tc o u r tl i n e sb yt h ec l a s s i ch o u g ht r a n s f o r m a t l a s tm o v i n gt a r g e t sa r ed e t e c t e da f t e re l i m i n a t i n gc o u r tl i n e s ( 2 ) o nt a r g e tr e c o g n i t i o n ,t h i sp a p e rs e l e c t st h e7n o r m a l i z e da n di n v a r i a n t sh um o m e n t s a sc h a r a c t e r i s t i c so f t a r g e t s t a r g e t sc a nb ed e t e r m i n e dw h e t h e ro rn o tb e l o n g i n gt ot h es a m e c a t e g o r ya st h es a m p l eb yc o m p a r i n gt h ec h a r a c t e r i s t i c so ft a r g e t sa n ds a m p l e ( 3 ) f o rs o c c e rt r a c k i n g ,t h i sp a p e ra d o p t sk a l m a nf i l t e rt op r e d i c tt h ee s t i m a t e d t r a j e c t o r i e si no r d e rt oa c h i e v et h et r a c k i n go ff o o t b a l l a n dt h i sp a p e ru s e st h el e a s ts q u a r e m e t h o dt od e a lw i t ht h ef o o t b a l lo c c l u s i o n ( 4 ) f o rp l a y e r st r a c k i n g ,c a m s h i f ta l g o r i t h m ,b a s e do i lc o l o rm o d e l ,c a nt a k ef u l l a d v a n t a g eo fp l a y e r sc o l o ri n f o r m a t i o n ,t oa t t a i nt ob er e a l t i m e t od e a lw i t ht h ep l a y e r o c c l u s i o nb yo t h e rp l a y e r s ,c a m s h i f ta l g o r i t h mw i t hk a l m a nf i l t e ri ss u g g e s t e d t h i sp a p e r d e t e r m i n e sa no c c l u s i o nf a c t o rb a s e do nt h es e a r c hw i n d o ws i z e ,a n dw e i g h t st h er e s u l t so f k a l m a na n dc a m s h i f la c c o r d i n gt ot h eo c c l u s i o nf a c t o r a l g o r i t h m sp r o p o s e di nt h i sp a p e ra r er e a l i z e db yv c a n do p e n c v t h ee x p e r i m e n t s s h o wt h a tt h ed e t e c t i o na n d t r a c k i n ga l g o r i t h m sb yt h i sp a p e r ,a r er o b u s ta n de f f i c i e n t k e yw o r d s :s o c c e rv i d e o s ,k m e a n s ,t a r g e tr e c o g n i t i o n ,k a l m a nt r a c k i n g ,c a m s h i f l a l g o r i t h m n 声明尸明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在本 学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发表或 公布过的研究成果,也不包含我为获得任何教育机构的学位或学历而使 用过的材料。与我一同工作的同事对本学位论文做出的贡献均已在论文 中作了明确的说明。 研究生签名:丕尘! j ! 挞 夕参9 1 年;月3 。e l , 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅或 上网公布本学位论文的部分或全部内容,可以向有关部门或机构送交并 授权其保存、借阅或上网公布本学位论文的部分或全部内容。对于保密 论文,按保密的有关规定和程序处理。 硕士论文体育视频中运动目标的检测与跟踪 1 引言 1 1 研究背景和意义 体育视频是一类重要的媒体数据,它拥有广大的观众群体和巨大的应用前景而受到 学术和工业界的广泛关注。从对体育视频的需求方面来分,用户可以分为两类:普通用 户和专业人士【l j 。其中,普通用户一般指观众,专业用户包括运动员、教练员和体育评 论者。他们需要准确提取球队和运动员的某些信息以制定比赛计划、评估队员的表现或 者分析比赛策略。这些用户对目标检测与跟踪,运动轨迹提取以及在此基础之上的语义 分析感兴趣。因此这些人对体育比赛视频的关注焦点也侧重于体育的运动目标,球或者 球员。 在运动员训练视频中,教练们可以通过对训练视频采用相关处理手段如分割和跟 踪,来获取人体运动参数【2 l 。通过收集高水平运动员在平时训练和比赛中大量视频图像 资料信息,对这些资料信息进行有效分析,通过对运动员进行实时跟踪,分析运动员的 运动轨迹,能够改变教练员仅凭人工观察和经验对运动员的技术动作进行指导的训练方 式,完善其动作的规范性【3 l 。与传统的在运动员身上加装传感器来获取相关参数的方法 相比,由于传感器会对运动员技术动作产生一定的干扰,新的方法能够更好地获取运动 员的运动参数。 在各种比赛视频中,一个令专业人士关注的任务是目标检测、跟踪与轨迹分析。检 测这些语义目标的目的,一方面是为了分析高级语义事件,得到视频摘要;另一方面是 为了比赛体育策略分析,行为分析与判罚分析等,比如比赛阵形、进攻路线、配合动作 以及一些争议判罚等。 体育视频分析中另一个比较重要的方向是精彩事件的检测,通过对体育视频的分割 和跟踪,可以辅助精彩事件的检测,以及语义和策略分析。我们可以通过目标的检测和 跟踪分析,来判断出一些特定事件的检测。比如足球比赛中的越位事件,我们可以通过 跟踪球和球员,得到球和球员的位置后,可以在重建的全景图中表示出传球路线与过程, 从而检测出越位事件。球与球门之间的距离还可以用于判断可能的射门事件的发生【4 】。 通过对比赛视频的目标检测和跟踪,专业人士可以得到需要的相关数据。如球队教 练需要提取出比赛视频中相关数据来协助教练进行战术研究,可以通过运动员检测、跟 踪和分类以及场地配准,将运动员的轨迹映射到球场模型上,从而分析球队阵形,进攻 路线,传球路线等行为与策略等1 5 j 。 同时,随着比赛的激烈程度加剧,以及对比赛的关注度升高,如何在比赛中体现公 平、公正也成了摆在裁判员面前的一道难题。而通过摄像机拍摄到镜头,并利用这些镜 头进行相关视频分析,从中提取出裁判员感兴趣的目标,可以很好地帮助裁判员们更加 1 1 引言 硕上论文 准确地做出判罚。比如,在实况跳水比赛中,通过对运动员的跳水动作轨迹进行分析, 判断运动员起跳,翻腾,入水等动作是否正确和连贯,有助于裁判员的准确判罚1 6 j 。 体育视频分析在不同需求的推动下产生了很多有价值的应用,包括精彩片断提取与 传输,视频摘要,视频浏览与检索,球和运动员的检测与跟踪,行为与动作分析及索引, 战术统计与策略分析,虚拟内容插入,以及虚拟场景构造等等。而这些应用往往都和目 标的检测与跟踪有关,因此快速有效地分割出视频中的对象,并实现对感兴趣目标的跟 踪,是后续视频图像分析的基础。 随着奥运时代的来临,体育会越来越收到人们的关注,而发展更多更先进的体育视 频处理技术也已经成为当务之急。在众多的体育比赛中,足球比赛拥有的观众人数最多, 受关注程度最高。因此,对足球比赛视频中的运动目标进行检测、提取、定位和跟踪, 有着很高的实用价值和现实意义。本文就是基于这一背景环境来进行研究的。 1 2 国内外现状 近年来,国内外研究人员在运动目标检测和跟踪方面做了大量的研究工作,主要包 括场地检测、球员检测、球检测以及球员和球的跟踪,下面介绍一些相关工作。 1 2 1 目标检测现状 e k n i 在文献 7 】提出了一种通过获取自适应的场地颜色来检测出球场区域的方法。 这篇文献是场地检测中的奠基性文章,在它出现以前,所有的人都为不同球场的场地颜 色不同而无法建立颜色模型而苦恼。它提出了在直方图中找到主要区域,然后对这个区 域的均值和方差进行估计。文章的另一个创新之处是作者利用了两个色彩空间互相补 充,其中一个作为控制空间,另一个作为基本空间。当两者检测差异在一定范围时,则 用控制空间的检测结果来更新基本空间的统计结果;当两者差别很大时,则恢复基本空 间的最初统计。作者给出的结论是,r g b + h s v 的结果最好,前者作为控制空间,后者 作为基本空间。w a n g t 8 】提出了一种自动在体育视频中提取场地颜色的方法,与前人研究 不同的是,w a n g 利用高斯混合模型,用e m 算法对参数进行求取,进行的实验与前面 的相似。 y u l 9 】的球检测算法包括三个关键组成部分:首先作者通过球员的区域的大小推断出 球的区域大小;其次,把非球区域滤除掉;最后利用k a l m a n 滤波进行轨迹跟踪找到可 能含有球的区域。y u 的这项工作改变了以往人们都是用k a l m a n 滤波器进行跟踪已知目 标,而是利用其时序上的最佳匹配能力在多个候选区域上找到球的位置。 d i s t a n t e 等【1 0 l 提出一个两阶段的球检测与识别算法:第一阶段,作者用到了一个有 方向的圆的h o u g h 检测算法,将那些最有可能包括球的区域检测出来;第二阶段是确认 阶段,用神经网络分类器来找到真正含有球的区域。为了进一步提高速度,背景消减和 2 硕上论文 体育视频中运动目标的榆测与跟踪 球跟踪技术被应用进来。同时作者考虑了大量的光照问题。对于第一阶段,作者考虑了 阴影影响,也就是说,球的图像可能是半圆形的,通过改进的h o u g h 变换解决了这一问 题。在确认阶段,作者提出利用小波变换和神经网络去掉那些假区域。而作者在文献【1 1 】 中利用支持向量机进行检测,后两项工作是在高速相机上进行的。 在运动员的识别方面,l w a n g 1 2 l 等初步试探了两方球员球衣颜色的自动建模与检 测。l i u 1 3 】等用场地分割图像作为掩模,采用a d a b o o s t 方法检测球员,性能较之前的方 法提高很大。还通过自动的运动员检测搜集样本,利用无监督聚类学习球衣颜色,然后 对运动员进行分类。这个方法实现了对双方球员和裁判的自动高性能分类。 1 2 2 跟踪现状 在跟踪足球方面,t o n gb 4 】采用一种基于轨迹的方法跟踪足球,用v i t e r b i 算法检测 并跟踪球,应用最t b 一- - 乘法得到球运动轨迹的插值函数,基于所得到的插值函数,剔除 v i t e r b i 算法检测与跟踪球过程中的一些误检,同时补充漏检处的球位置信息。该算法无 需球的精确模板,具有很好的鲁棒性,而且在发生球的遮挡时也能得到很好的效果。 在跟踪单个球员方面,i n t i l l e 和b o b i c k ”j 针对具有较复杂背景的美式足球场地,提 出了封闭空间( c l o s e d w o r l d ) 的概念,依据场地背景的相关特征,实现了无遮挡情况下单 个球员的跟踪;s e o 和c h o i 1 6 j 将卡尔曼滤波与模板匹配相结合实现了球员的跟踪,用直 方图后投影法发现了遮挡情形,但仅仅解决了两个不同队的队员发生遮挡的情况,而且 稳定性差。 为了解决遮挡球员的跟踪问题,更多的研究人员求助于多部静止相机,但这对于广 播视频分析来说重要性大为减低。1 w a s e j 在多部相机上利用平面间的对应关系跟踪匹 配各个相机中的队员,对于遮挡处理不错。f i g u e r o a t 博j 首先在图像中分割球员区域,通 过图论方法建立两帧图像中区域的合并与分裂过程,从而解决遮挡。 由于粒子滤波器对遮挡的跟踪有着极佳的效果,所以近年来基于粒子滤波器的跟踪 算法的研究也硕果累累。粒子滤波器算法是基于模拟蒙特卡罗方法来实现贝叶斯滤波, 由于它的“多峰性特点,所以粒子滤波的抗干扰能力很强,目前已经有很多基于粒子 滤波器的研究成果。m a c c o r m i c kj 在文献 1 9 】中系统地总结了粒子滤波器方法在计算机 视觉中的应用。粒子滤波器有很好的鲁棒性,跟踪的效果很好,但是由于其运算量大, 因此对机器配置的要求就高,而且实时性也差。 n i n g 等【2 0 】运用三维建模的方法来进行跟踪,利用广义锥台、椭圆柱、球等三维模 型来描述人体的结构细节,可以精确地恢复目标的运行轨迹和形状,也可以很好地恢复 目标遮挡情况下的三维信息。但是建立三维目标模型需要大量的模型参数,并且模型匹 配的过程也较为复杂。因此,这种方法适合少量的、特定类型的目标跟踪,例如人体跟 踪等。 l 引言硕十论文 v a nr h e e d e d ndr t 2 1 1 采用了k a l m a n 滤波器组实现了多个目标的跟踪,它既能跟踪 新出现的目标,又能跟踪原有的目标,并且还采用最小二乘法对轨迹进行校正,但是该 算法运算量大,并且极易受到干扰。 1 3 存在的问题 体育视频中运动目标分割的问题主要如下: ( 1 ) 如何可靠地、准确地并快速地从体育视频中获得运动目标。体育视频中的运动目 标姿态变化、所处环境变化、甚至是目标之间的遮挡以及自遮挡都将导致当前帧时刻运 动目标检测失败,而且在实际的视频中,背景的多样性以及光照条件的不同都将增加检 测运动目标的难度。 ( 2 ) 算法通用性问题。体育视频的拍摄角度不同,远近不同,有远镜头、中镜头、近 镜头、特写镜头等,目前所研究的分割算法往往都是针对某一种镜头的,当镜头出现变 换时,分割算法通常不能准确地分割出目标。 ( 3 ) 感兴趣目标的识别问题。当分割出运动目标后,如何从它们中找到感兴趣的目标 是一个相当困难的问题。对于大部分体育视频来说,目标与目标之间往往大体上相似, 在细节上略有不同,比如球员之间,如何通过细节来区分出感兴趣的目标值得深入研究。 体育视频中跟踪的问题主要如下: ( 1 ) 遮挡问题。遮挡一直是视频跟踪问题的研究重点,体育视频中通常会出现运动目 标与静止物体、运动目标之间的遮挡,目前该问题还远远没有得到很好的解决。 ( 2 ) 如何实时地实现运动目标的跟踪。一个实用的视频跟踪系统或是视频智能分析系 统对运动目标的快速实时跟踪要求比较高,但由于视频跟踪算法涉及巨大数据量的图像 和复杂的处理流程,因此需要大量的运算时间,很难达到实时处理的要求。 ( 3 ) ! t h 何实现镜头发生变化时的跟踪。体育视频是一个编辑过的视频,它是根据导演 的指示从多个摄像机中选取出来的,当镜头类型变化时,原来的跟踪目标会发生较大的 形变,导致原跟踪算法失效。 1 4 论文的研究内容 本文所做的工作如下: ( 1 ) 采用了改进的k 均值聚类算法分割球场。针对k 均值聚类算法不能自动选取聚 类数以及聚类结果依赖于初始聚类点的缺点,提出了一种基于模糊集理论的k 均值聚类 算法,根据原图像的直方图确定出聚类数以及初始聚类点,实现了聚类数和初始聚类点 的自动选取,取得了不错的分割效果。 ( 2 ) 在提取球场线方面,针对h o u g h 检测椭圆存在着占用内存大、耗时长的缺点, 根据足球椭圆场地线的实际特征,本文采用了一种曲线拟合的方法,实现了椭圆场地线 4 硕十论文体育视频中运动日标的检测与跟踪 的提取,从而大大减少了h o u g h 变换提取椭圆所需的时间。 ( 3 ) 在目标识别方面采用7 个h u 不变矩来识别球员和球,改进了原有的识别方法无 法对旋转、大小变化的物体正确识别的缺点。7 个h u 特征矩被证明是对图像进行缩放、 旋转和反射操作的不变量,所以h u 不变矩对球员和球的识别具有很好的鲁棒性,而且 对遮挡的球员也具有鲁棒性。 ( 4 ) 采用k a l m a n 滤波实现了足球的跟踪。k a l m a n 滤波器是一种对动态系统的状态序 列进行线性最小方差误差估计的算法,采用递归滤波的方法计算,具有计算量小,可以 实时计算的特点,并且对于近似匀速运动的物体有相当好的跟踪效果。针对足球的遮挡, 采用最小二乘法拟合足球轨迹,通过轨迹外推出遮挡帧的位置,实现遮挡的跟踪。 ( 5 ) 采用c a m s h i f i 跟踪球员。针对c a m s h i f t 易受周围环境的干扰的缺点,采用了加 权的背景直方图,降低了干扰。另外采用c a m s h i f i 结合k a l m a n 的算法来处理遮挡,通 过搜索窗大小确定遮挡因子,实现了遮挡的处理。 本文所提出的算法均采用v c 和o p e n c v 2 2 6 0 1 1 6 1 】【6 2 】实现,o p e n c v 是i n t e l 开源计 算机视觉库。它由一系列c 函数和少量c + + 类构成,实现了图像处理和计算机视觉方面 的很多通用算法,是理想的图像二次开发工具,故本文采用v c 和o p e n c v 来实现算法 的仿真。 1 5 论文的结构 本文共分为六章,各章的内容和组织如下: 第一章绪论。介绍了本课题研究的目的、意义,本课题领域面临问题以及国内外 研究现状,并给出了本文的主要工作。 第二章运动目标检测。以足球为例,介绍了本文关于运动目标检测的思路。首先 采用改进的k 均值聚类分割出球场区域,其次用h s v 结合r g b 的阈值法消除场地,得 到运动目标和场地线,然后采用h o u g h 提取直场地线、曲线拟合提取椭圆场地线,并消 除掉提取的场地线,实现运动目标的检测。 第三章基于h u 不变矩的目标识别。通过判别7 个h u 不变矩,实现了球员和球的 识别。另外还提出了一种多个人体粘连的分割和判别方法。 第四章基于k a l m a n 滤波的足球跟踪。首先介绍了k a l m a n 算法在足球跟踪方面的 运用,然后针对遮挡情况,采用曲线拟合法预测出遮挡帧中的位置,实现遮挡处理。 第五章基于c a m s h i f i 的球员跟踪。介绍了c a m s h i f i 在球员运动方面的跟踪,并且 针对c a m s h i f t 的缺点,提出了改进方法。然后采用c a m s h i f i 与k a l m a n 结合的方法, 处理球员之间的遮挡。 第六章总结与展望。对全文的工作进行总结并提出仍然存在的问题,指出下一步 的研究方向。 5 硕士论文 体育视频中运动目标的检测与跟踪 2 运动目标检测 现有的足球分割文献中,大部分的方法都是基于阈值分割的,比如主色调法1 7 j ,先 进行阈值分割,分割后提取球场区域就能得到球员区域了。但是该方法颠倒了次序。因 为足球视频图像中包括球场、观众席以及球员等,当统计整幅图像的直方图分布来确定 分割阈值时,会将观众席的颜色影响增加进去,导致求出的阈值产生偏移,也就是,求 出的分割阈值是关于整幅图像的,不是针对球场区域的。因此更理想的方法是:先分割 出球场区域,再统计球场区域的颜色直方图,求出分割阈值。这样减少了非球场区域对 分割阈值的影响。另外,观众席的存在也会对后续的目标识别产生影响。故本文采用先 分割出球场区域,再通过阈值分割出球员的方法。 一般来说,采用阈值进行分割的算法,都会涉及到颜色模型的转换,下面先介绍一 下颜色模型。 2 1 颜色模型 根据计算机色彩理论,对每一种颜色两言,在各种理论中有不同的表达方式,这就 形成了各种不同的色彩空间,常见的色彩空间有:r g b 、c m y k 、y c r c b ( y u v ) 、h s v 。 每一种色彩空间都有它们各自的产生背景或者应用领域等,应该根据具体的情况来采用 不同的色彩空间。下面就简单介绍一下在视频图像处理的研究中经常用到的两种色彩空 间:r g b 空间和h s v 空间瞄j 。 r g b 空间。r g b 空间是按照光谱理论形成的,在r g b 色彩空间,所有的颜色是通 过红( r ) 、绿( g ) 、蓝( b ) 这三个分量按照一定的比例混合实现的,红( r ) 、绿( g ) 、蓝( b ) 三种颜色是构成所有色彩的三基色,其中的每一个分量被称作一个色彩通道( c h a n n e l ) 。 在r g b 模型中,光的色度如下面的比例关系: ,:墨一:一堡 6 : 垒 ) 厂2 r + g + b g 2 r + g + b 勿2 r + g + b ( 2 1 ) ,+ g + 6 = 1( 2 。2 ) 由式( 2 1 ) 和式( 2 2 ) 可知只有两个颜色分量是独立的,三个分量之间存在联系。 h s v 空间。h s v 空间反映了人们感知色调的方式,h s v 将亮度( v a l u e ) 和反映色调 本质特性的两个参数色度( h u e ) 和饱和度( s a t u r a t i o n ) 分开。当我们对彩色图像进行分析的 时候,直接利用能够反映色彩本质的色度和饱和度会获得比较好的效果。后面介绍的 c a m s h i f i 算法主要运用的就是h s v 空间中的色度( h u e ) 信息。 7 c y a n 18 0 。厂 硝: 姗i t e 誓 么, nn 图2 1h s v 颜色模型 由于视频图像大多是以r g b 为色彩空间的,要求取图像的h s v 空间信息就涉及到 将r g b 空间转换成h s v 空间,o p e n c v 规定r g b 和h s v 的空间范围是:r g b ( 0 - 2 5 5 , 0 - 2 5 5 ,0 - 2 5 5 ) ,h s v ( 0 - 3 6 0 ,0 - 2 5 5 ,o - 2 5 5 ) 。 r g b 转化到h s v 的算法如式( 2 3 ) 至式( 2 6 ) 所示。 v = m a x ( r ,g ,动 ( 2 3 ) - s : ! 二二坚笋矿( 矿o ) ( 2 4 )s = 歹一矽l p w r 24 、 l 0 f ( y = o ) ( g b ) x 6 0 h = 1 8 0 + l 1 2 4 0 + s b r 1 s r g ) s 矿( 矿= j j c ) 矿( y = g ) ( 2 5 ) 矿( y = 动 i f ( h 0 ) t h e nh = h + 3 6 0 ( 2 6 ) 值得指出的是,1 扪:3 6 0 。的色度超过一个色彩通道8 位二进制的表达范围,o p e n c v 提供的库函数在作r g b 到h s v 色彩空间转换时会将色度( h u e ) 从0 。虱j3 6 0 。映射到0 。到 1 8 0 。的范围,后继处理时要注意这个变化。 2 2 球场区域分割 一般来说,球场区域的颜色特征相当明显,大部分球场的颜色单一,几乎都是绿色。 因此,我们可以根据颜色特征来分割出球场区域。k 均值聚类算法具有运算简单、实时 性好、分割稳定的特点,因此本文选取k 均值聚类算法来分割球场区域。在进行k 均 值聚类分割前,需要先对图像进行预处理,采用图像均衡化,增强图像的对比度。 2 2 ik 均值聚类 k 均值算法由m a c q u e e n 2 4 】首先提出,是解决聚类问题的一种经典的模式识别算法。 8 硕士论文 体育视频中运动目标的检测与跟踪 k 均值聚类具有计算简单、快速,能够有效地处理大量数据,能够动态聚类,自适应性 强等特点,有着广泛的应用领域,尤其解决模式分布呈现类内团聚状的问题时,该算法 能取得很好的聚类结果。该算法是一种最普遍的不断迭代调整髟个聚类质心的算法。 算法的中心思想是取定k 类,并选取k 个初始聚类中心,按最小距离原则将各模 式分配到x 类中的某一类,之后不断地计算类心,同时调整各模式的类别,最终使各模 式到其判属类别中心的距离平方之和最小。算法步骤如下: s t e p l 任选k 个模式特征矢量作为初始聚类中心:z n ( m ,z 2 ( o ) 9o - ,0 0 ) ,令萨o 。 s t e p 2 将待分类的模式特征矢量集 x i 中的模式逐个按最小距离原则分划给k 类中 的某一类,即如果d ,) = m i n 盼j ,汪1 ,2 ,n ,则判断t 硝肘,式中d o h ) 表示t 和q 的中心z ? 的距离,刀表示迭代次数。于是产生新的聚类缈,u :1 , 2 ,c ) 。 s t e p 3 计算重新分类后的各类心: z 夕+ 1 ) = 了,j = l ,2 ,k ,式中n ,( n + o 为国夕“) 类中所含模式的个数。 仃j 再e 砂“l r 2 定义误差平方和准则以值:以( 以) = 而制p ,忙一z 列 ,= 1 ,2 ,k 。 j = l 。 s t e p 4 如果k + 1 ) 一j c ( n ) i 4 a c ,则该二次曲线是椭圆,记 为巨一,。再将互一,的参数与第6 个边缘像素点只一起代入椭圆公式,得到下式( 2 1 9 ) : 吨= i + b x , y 6 + 碱+ 瓯+ 眺+ 1 i ( 2 1 9 ) 其中,比代表只到椭圆巨一,的距离的绝对值。如果点只在椭圆巨一,上,那么吨的值 等于0 ,则把可能椭圆记为e 。但是实际中,待检测的图像是数字图像,以的值一般不 为0 ,所以我们给出一个很小的阈值乃 0 ,当以 乃时就认为p 中6 个点位于同一个 椭圆上。当任意挑选的6 个点尸,相隔的距离太小时,则得到的可能椭圆可能并不是真 实椭圆。为了避免这种情况发生,使得随机挑选出的边缘点满足一定的空间分布,我们 给出任意两个像素点之间的距离最小阈值。 检测到可能椭圆之后,此时需要椭圆点收集过程以进一步确定可能椭圆是否为真实 椭圆。 确定真实椭圆的过程如下: 首先,初始化计数器c = 0 ,它用来统计有多少边缘点在可能椭圆上。我们遍历所 有边缘点集d 中的点,计算每个点到可能椭圆的距离以。如果以 乃,则计数器c 加 1 ,并将该边缘点从d 中去掉,存入可能椭圆边缘点集只中;否则,遍历下一个边缘点 集d 中的点。重复以上过程,直到遍历完整个边缘点集d 。然后计算中点的个数( 即 c 的值) 是否大于一个阈值疋。如果大于则认为该可能椭圆为真实椭圆,否则将中的 像素点返回边缘点集d 中。我们注意到,当一个真实椭圆被检测到以后,真实椭圆上的 边缘点已从边缘点集d 中去除,从而减少了边缘点集d 中边缘点的个数。这样就使得 在检测下一个椭圆时,大大提高了检测的速度。 1 9 2 运动目标检测 硕l :论文 在实际检测过程中,阈值l 的选取存在不确定性的问题。因为不同的椭圆有不同的 长短轴,因而也就有不同的周长。对于不同大小的椭圆采用相同的阈值显然不可取。为 了解决这个问题,我们采用残缺率阈值z 。一个椭圆的周长可以用下式( 2 2 0 ) 给出: l _ - 4 口f 1 一p 2 s i i l 2 ,刃 ( 2 2 0 ) z 一 其中,a 为椭圆的长轴,p 为椭圆的离心率。如果中的像素点个数大于l x c ,则 判断可能椭圆为真实椭圆;否则将e 中的像素点返回边缘点集d 中,进行下次检测。 该算法的步骤如下: s t e p l 把所有图像边缘点( 薯,只) 存至边缘像素点集d 中。初始化失败次数计数器 f = 0 。设r f ,艺,乃和i 为5 个给定阈值。这里,r f 是最大失败次数。如果边 缘点集d 中的像素点小于瓦协时则结束该算法。可能椭圆上的任意两点之间的距离必须 大于阈值r a 。其中,乃与乃分别为距离阈值与残缺率阈值。此外,令l d | 代表d 中边 缘像素点的个数。 s t e p 2 如果f = 巧或者i d l 4 a c 以及 第6 个点到可能椭圆的距离小于阈值乃,否则转至s t e p 4 ;否则,将数组p 中的像素点 返回至d 中,并且置厂= 厂+ l ,然后跳转至s t e p 2 。 s t e p 4 假设e 。为可能椭圆。置计数器c = 0 。遍历边缘点集d 中所有的点,计算它 们到可能椭圆的距离以,如果满足d 6 乃,则c = c + l ,将该点从d 中去除,存入可 能椭圆边缘点集中。遍历完边缘点集d 后,计数器c 的数值等于中像素点的个数, 也就是说有c 个像素点满足d 6 l x z ,则跳转s t e p 6 ;否则,认为可能椭圆为假椭圆,将数组p 与 可能椭圆边缘点集只中的像素点返回到边缘点集d 中,并置f = f + l ,然后跳转至 s t e p 2 。 s t e p 6 检测到的可能椭圆e 。为真实椭圆。并且重置厂= 0 ,跳转至s t e p 2 。 算法流程图如图2 1 5 所示。 2 0 j 论t 件日w m 中动n 标的持1 ,¥h 蹿 r 丽、 初始化参数, 0 是 摩 臣否 爹 是 竖 附21 5 椭圆检测流科罔 直线和椭圆检测效果如图2 1 5 和2 1 6 。其中,图2 1 6 足聚用o p e n c v 中提供的h o u g h 变换,参数m e t h o d 选取的是c v h o u g hp r o b a b i l i s t i c ,代表检测概率最大的直线; 罔21 7 是采用本文的 | 线拟合的方法提取的椭圆,从图21 7 中我们可以看到,本文的 曲线拟合法可以很好地检测出椭厕。 刚21 6l i 线椅测的效果目 2 , 4 3 球场线的擦除 幽2 1 7 椭圆椅测的效果圈 通过卜阿节场地线提取后,得到r 球场场地线的坐标参数,就能在幽像中将球场场 地线擦除,即将球场场地线上的像素点值置为0 就完成了擦除。用上两仃得到的球场线 足一条啦度为一个像素的线段或者曲线,而图像。f 啪球场线有定的宽度,所以需要在 计算得到的球场线位置的定宽度范内撩除自色的像素点。而同时如粜自球员粘连球 2 i 2 运动t l 杯榆 场线卜还要避免擦隙球员区域的像素点。本文呆用如下的力法: ( 1 ) 对于一条球场场地线( 直线或曲线) ,左右端点分别为( 一,儿) ,( ,儿) ,考虑球 场线斜率绝对值小于1 的情况,大于1 的情况同小于1 的情况。 ( 2 ) x 4 到之间的每一个值蕾,通过球场场地线方程计算得到m 。在草地去除后 的黑白二值图像上,考虑像素点“,一+ - a y 2 ) 之间的每一个点( 一y ,) 。若同时满足下 面的两个条件,则将该点擦除( 像素值置为0 ) ; 1 ) 点( x ,y ,) 在扶度图像:的灰度值大于d ; 2 ) 在二值图像卜,点( j ,y 州1 之问的2 埘十1 个点中的白色像素点数小于n 。 这里衄代表线宽,实验中取4 ;d 值取2 0 0 ,保证了被擦除的点在扶度图上为白色; 第二个条件中m 值取为3 倍的a y ,”值取4 倍的如,条什二保证了在球员和球场线发 生粘连时,不会将球场线经过的球员区域也擦除掉。 我们对图21 6 和图21 7 提取的场地线采用本文的方法进行擦除,擦除的效果如图 2 1 8 。 幽2 18 撩除后的效果削 图21 8 表示图2 1 6 和图21 7 擦除场地线后的结果,从中我们可以看到,场地线有 效地被擦除掉了,而运动目标保持完整。该实验表明,本文提出的运动日标检测算法可 以很好地分割出球员和球。 2 5 本章小结 旨先,本章主要讨论了运动目标的分割。根掘实时性的要求。奉章选取了k 均值聚 类来分割赊球场区域,这样做可以消除观众席对后续分割的影响。针对k 均值聚类的需 要指定足数的缺陷,本章提出了一种基于h 分量的概率直方罔束模糊统计r 的方法, 并且也对k 均值聚类的初始点选择做了一些改进,实现了聚类数e 和聚类初始点的自 动选取。实验证明,本章提出的算法在提取球场区域方面有1 i 锚的效果。另外,针对 h o u g h 变换在检测椭圆时需要花费较多时间,本章采用了一种曲线拟合方法,该方法简 单,能够快速检测出椭圆,而且实验表明效果也很理想。黯后,本章还提出了针对足球 视频的场地线消除方法,在有效地擦除掉场地线的同时,保持了运动目标的完整。 硕士论文体育视频中运动目标的分割与跟踪 3 基于h u 不变矩的目标识别 矩在统计学中被用来表示随机量的分布,而在力学中用来表示物质的空间分布。若

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论