




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
静态背景下动态目标的识别跟踪技术研究概述目录TOC\o"1-3"\h\u21914静态背景下动态目标的识别跟踪技术研究概述 1208141.1常用目标识别算法分析 1247121.1.1帧差法 2263781.1.2背景差分法 2177611.1.3光流法 2269961.2帧差法的基本原理 3168691.3帧差法的实现步骤与理论说明 394161.3.1RGB图像转换为灰度值图像 3186711.3.2相邻帧差化 44441.3.3二值化处理 411491.3.4后处理:膨胀与腐蚀 5240481.4实现过程及细节 6125141.5三帧差法 8主要围绕传统方法进行的动态目标识别展开。首先主要学习了几种常见的基于帧间图像分析的目标识别方法:背景差分法、光流法、帧差法。掌握了这几种方法的思路,分析了这几种方法的相似点和不同点,以及这几种方法存在的局限性。接下来重点分析帧差法实现目标识别,结合公式论述帧差法的实现步骤,并对本章做出小结,分析帧差法存在的问题。1.1常用目标识别算法分析动态目标跟踪是指,通过某种方法找到图像中发生变化的区域,发生变化的模块则是要进行跟踪的目标。根据如何评判发生区域变化,形成了不同的算法,这也是传统方法实现目标识别的关键步骤。一般情况下,拍摄所得到的视频材料中是存在很多干扰因素的,例如天气因素、光线因素、亮度因素等,背景的变化是不可抗力的,这使得目标识别与跟踪的效果并不理想。根据拍摄工具是否在拍摄过程中发生位置以及角度变化,可以把目标识别算法分为静态背景和动态背景。比较经典的算法大都着手于静态背景的动态目标跟踪,并且日常生活中大多数情况下,只需要用到被固定好位置的拍摄工具进行视频记录和目标跟踪,因此本章着重研究静态背景的目标识别与跟踪。目标检测算法一般过程如图1.1:区域处理是否存在目标提取区域处理是否存在目标提取是否图1.1目标检测算法流程图1.1.1帧差法帧差法是一种比较经典的的动态目标识别的方法。其基本思想是获得相邻帧的图像,转换得到这两幅图像的灰度值,用灰度值来做后续处理。将灰度值做差,并且取其绝对值,保证得到的结果为非负值。根据目标的特性选取相对应的阈值,做阈值化处理。阈值要根据运动目标的特征选择,阈值的选择很大程度上决定了检测效果。如果差值不超过指定的阈值,那么可以确定该差值对于的区域是背景,因为没有发生明显的像素变化;如果差值大于指定的阈值,那么可以确定该区域是前景,因为发生了明显的像素变化。经过上述过程处理,就能得到动态目标的大致位置和移动路径,从而达到目标检测的效果。帧差法从一定程度上具备实时的特性,采取相邻两帧的前一帧作为比较的基准。帧差法简单并且易于理解,实现起来计算量小。阈值是随不同情况的而确定的,并且也难以快速确定,要根据目标的特性慢慢调试。阈值太大无法扑捉到有用的变化,太小不足以屏蔽噪声的干扰。运动体积较大的物体,会造成目标内部产生空洞,影响检测效果。1.1.2背景差分法背景差分法与帧差法有异曲同工之处。不同的是,背景差分法中的背景图像不像是帧差法那样将前一帧作为背景,而是利用背景的参数模型近似模拟,不如帧差法的处理方式直接和简单。后续的处理过程和帧差法相似,背景差分法也是采用差分比较这种经典的做法。观察处理后的结果,显而易见,发生明显变化的就是动态目标运动的区域,而没有发生明显变化的就是背景区域。背景差分法的着重点在于背景灰度值的形成,即背景的建模。除了背景灰度值的形成,做到背景的实时更新也是背景差分法的关键一步。理想情况下,背景差分法中的背景模型具有自适应性,避免动态场景中的变化对目标识别与跟踪的影响。1.1.3光流法光流法的主要研究重点在于对光流场的计算和运用。用光流法进行目标检测的前提是背景的亮度信息不会有太大的变化,和帧间法一样,也是对于背景的要求较高。用光流法进行动态目标识别与跟踪,并不需要像背景差分法那样知道背景图像的任何信息,只要求出帧间图像的光流场。进一步研究,也就是需要得到每一个像素点的运动矢量。根据前提我们知道,背景是不发生任何变化的,这一点体现在背景的运动矢量场比较均匀。然而对于动态目标来说,其运动矢量场和背景的运动矢量场特征不一样,结果是不规则的。基于以上原理,我们就可以找到动态目标。光流法根据计算的范围可以划分为,计算量大的全局光流场与计算量小的特征点光流场。前者基于全局,范围较大,后者只是对特征点处的流速进一步分析。光流法实现实时目标识别跟踪,进行大量的矩阵和迭代运算,同时,对背景的要求高,容易受到噪声、光线的干扰,这并不是一个恰当的选择。1.2帧差法的基本原理帧差法的基本原理:通过分析相邻帧间图像上的灰度值差,找到灰度值差变化明显的区域,则该区域就为运动目标所在的区域,那么就可以将动态的目标提取出来。大致流程如图1.2,第一步获取相邻帧间的图像信息,为了后续的处理步骤,转换为对应的灰度值,第二部将灰度值做差,取其绝对值,第三步针对目标图像合适的阈值,做阈值化处理,得到背景图像和前景图像,第四步做形态学处理,膨胀与腐蚀,最后一步,将目标所在的区域用框标识出来。前一帧前一帧当前帧差分阈值化后处理提取结果图1.2帧差法流程图1.3帧差法的实现步骤与理论说明1.3.1RGB图像转换为灰度值图像我们的研究对象虽然是视频数据,但实际上是提取视频中的每一帧图像进行分析。我们获得每一帧的原始图像,本质都是RGB彩色图像。三原色的组成成员包括红色,蓝色,绿色,三原色按照不同的比例可以产生各异的颜色。像素,是图像的基本单元,人眼是感觉不出来的,将图像不断放大,就能观察到一个个排列分布的小像素。例如,如果用8位的二进制数来表示,那么一共就有256种原色。灰度图像只是由不同饱和度的黑色像素点组成,灰度分布由黑到白,中间地带是不同程度的灰色。同理,如果用8位的二进制数来表示,那么一共就有256种“不同”的灰色像素点。遍历图像得到每一个像素点的RGB值,按照公式1.1进行转换,将新的到的灰度值将原始的RGB值覆盖,就能够得到相对应的灰度值图像。(1.1)1.3.2相邻帧差化帧差法就是利用灰度变化这一特征,进行动态目标检测。将相邻帧的灰度图像做差,再取其绝对值,保证结果位非负值。这一步实际上就得到相邻帧图像的变化大小。静止不变的区域差化结果为0,或者是一个非常小的值。发生变化的区域特别是运动目标轮廓所在之处,该绝对值应该是一个非常大的数字。(1.2)根据上述公式1.2,得到了差化后的结果,进行下一步的处理。1.3.3二值化处理二值化处理过程,就是获得前景图像(动态目标)和背景图像的过程。首先选择合适的阈值,根据阈值将像素值划分为两个结果,分别体现在白色和黑色上。经过这一步的处理,就彻底把目标与背景图像分离出来。(1.3)如公式1.3所示,当像素值大于设定阈值T时,认为它为发生变化区域中的像素,即认为该像素是为动态目标上的一部分,否则该像素应该是背景中的一点。二值化后效果如图:图1.3二值化效果图1.3.4后处理:膨胀与腐蚀这一步进行形态学处理,包括膨胀进行放大操作和腐蚀进行缩小这两个操作。形态学从利于理解的角度来说,就是改变物体的形状,针对于不同的形态学操作,腐蚀就是使物体“变小”,同理,膨胀就是使物体“变大”。其实二值化后的结果,就可以把目标和背景分割开来,但是进一步进行膨胀与腐蚀,检测的效果会更加理想,这是因为膨胀与腐蚀可以达到消除噪声的效果。形态学操作是对提取出来的白色部分进行处理的,对背景部分并没有影响。目标部分经过膨胀的操作,二值化后提取出来的区域被扩大,识别效果被进一步放大;目标部分经过腐蚀的操作,二值化后提取出来的区域被缩小。用数学的知识来解释,膨胀或腐蚀就是将图像(如图所示的A部分)与核(如图所示的B部分)做卷积。我们完全可以自定义核的模样,根据自己想要的效果来选择。核有一个锚点,锚点是单独定义的参考点。一般情况下,我们把核的形状确定为正方形,有时确定为圆形。为了更加直观地理解,我们可以把核视为模板或者掩码。图1.4膨胀原理图(1.4)膨胀原理如图1.4,核B与图形做卷积,如果想要达到膨胀的效果,就是取核B大小范围内图像中像素点的最大值max,并用max将参考点指定的像素值覆盖。这样处理后,目标区域就会被扩大。图1.5腐蚀原理图(1.5)我们通常将腐蚀和膨胀联系在一起,腐蚀就是膨胀的相反效果。腐蚀原理如图1.5,核B与图形做卷积,如果想要达到腐蚀的效果,就是做膨胀的相反操作,取核B大小范围内图像中像素点的最小值min进行覆盖。完成上述的操作流程后,最终得到的效果是目标区域被缩小化。1.4实现过程及细节打开视频获取帧数存入第一帧图像信息打开视频获取帧数存入第一帧图像信息转为灰度图是否为第一帧与前一帧图像差分阈值化腐蚀膨胀查找轮廓并绘制轮廓
查找正外接矩形
否是图1.6实现流程图帧差法实现流程图如1.6所示,处理对象为视频中抓取的每一帧图像。主要函数:MatMoveDetect(Mattemp,Matframe){Step1.转换成灰度图cvtColor()Step1.差化取绝对值absdiff()Step3.阈值化threshold()Step4.腐蚀与膨胀Erode();Dilate()Step5.绘制轮廓findContours();drawContour()}主函数中调用了上面实现的函数,完成对每一帧图像的操作,步骤如下:输入:frameFori=0ton-1Temp←frameIfi=0ThenMoveDetect(frame,fra
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB15T 4191-2025南美白对虾 疾病防控技术规程
- 《自然之道》阅读答案
- 2025年其他金属制品项目合作计划书
- 机关单位档案管理规程
- 快乐英语六年级下册教案及习题解析
- 半成品食品行业市场发展趋势
- 幼儿园家长安全承诺书模板
- 2025-2030光伏制氢系统效率提升途径与可再生能源消纳能力关联性研究
- 2025-2030元宇宙虚拟空间实木数字资产版权交易报告
- 2025-2030儿童运动协调障碍的神经基础与康复策略报告
- 某地区地质灾害-崩塌勘查报告
- 网络新闻编辑网络新闻图片的编辑课件
- 我的家乡德州夏津宣传介绍模板
- 茉莉花病虫害防治
- 基于人工智能的个性化学习路径设计
- Delft3D水动力软件讲解及实例操练课件
- 关于节后复工复产方案
- 110kv变电站安全距离110kv变电站设计规范
- LY/T 2242-2014自然保护区建设项目生物多样性影响评价技术规范
- GB/T 5267.4-2009紧固件表面处理耐腐蚀不锈钢钝化处理
- GB/T 5121.1-2008铜及铜合金化学分析方法第1部分:铜含量的测定
评论
0/150
提交评论