版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE8运动目标检测算法的理论基础综述目录TOC\o"1-3"\h\u31898运动目标检测算法的理论基础综述 1250311.1图像的色彩空间 170421.1.1RGB色彩模式 1149721.1.2YUV色彩模式 285071.2图像的灰度化 3269881.3图像的二值化处理 413401.4图像的数学形态学处理 5224171.4.1腐蚀 598461.4.2膨胀 66521.4.3开运算 611961.4.4闭运算 7105171.5运动目标检测的基本流程 7运动目标检测算法主要用于视频中的运动目标提取,并且尽量减小背景的干扰,能应对各种环境下的运动目标识别任务。彩色视频主要是一帧帧RGB彩色图像构成,要对整个彩色图像进行处理的计算量非常大,因此需要一定的方法来压缩数据量,同时也要有合适的算法来对获得的结果进行处理,本章将对运动目标检测算法中的理论基础进行阐述。1.1图像的色彩空间 颜色是物体的外在特征之一,也是我们区分物体的重要途径之一。对于计算机来说,图像的颜色需要有一种格式来进行表达,而图像的色彩空间这是这种表达的方式,“颜色空间”也称作“色域”,这是一种作用于颜色的编码方式。通过“颜色空间”,我们可以将任意。所以,图像的色彩空间是计算机图形处理的重要基础之一。1.1.1RGB色彩模式RGB色彩模式是我们生活中最常用的一种颜色标准[14]。RGB色彩模式是通过对红(R)、绿(G)、蓝(B)三个颜色的亮度变化来调整他们进行叠加后产生多样的色彩。RGB代表红、绿、蓝三个通道的颜色强度,取值范围在0到255之间,数值越大表示颜色亮度越高。这个标准能表达出近乎人类视力感知范围内的所有颜色,是应用最为广泛的颜色系统之一。采用这种编码方法,每种颜色都可用三个变量来表示,即红色绿色以及蓝色的强度。记录及显示彩色图像时,RGB是最常见的一种方案。图2-1RGB色彩立方RGB色彩模式最大的优点就是表达简单且有效。缺点是当一种色彩的某一个RGB分量发生了一定程度的变化,那么这种颜色可能会发生巨大的变化。同时,人眼所见的红绿蓝三色还受其他因素如光照等影响,同样的颜色可能在不同的环境下有不同的色彩表现,因此RGB色彩模式的均匀性非常差,两种颜色之间的色差并不是简单的在立方体中的距离相关,而是非线性关系的,通过线性或非线性变换,可以从RGB色彩模式推导出其他的颜色特征空间。1.1.2YUV色彩模式与我们常用的RGB格式相类似,YUV模式也是一种色彩的编码方法,但是其主要用于电视编码以及模拟视频等领域,通过将包含亮度信息的Y分量与包含色彩信息的UV分量进行分离,一样可以显示完整的图像,此时的效果与灰度图类似,图像只有亮度信息,没有色彩。由于人眼对亮点信息更敏感。也就是说,可以压缩UV数据,而人眼难以发现。因此,在图像数据的压缩处理过程中为了压缩数据量,往往先把RGB数据转换成YUV数据。对Y少压缩一点,对UV多压缩一点,以平衡图像效果和压缩率。1.2图像的灰度化在图像技术不断发展的今天,大多数的交通监控所获取的视频都是彩色视频。在处理这些视频数据的时候,大多数的算法都是建立在图像的灰度之上的,这是为了减少计算机的运算量,以获得更快的处理速度。目前主流的色彩模式为RGB模式,通过红绿蓝三种颜色的不同比例,显示不同的颜色。RGB色彩模式的格式为[R,G,B],其中三个分量的取值范围都为[0,255],每个像素都能表达十六万种以上(256*256*256)的颜色,一幅图像中有成千上万的像素,要计算的数据量非常大。基于RGB色彩模式下的灰度,R、G、B三个分量数值相等,例如RGB(0,0,0)表示灰度为0,同时也是黑色,RGB(50,50,50)则表示灰度为50。灰度表示了图像的颜色深度,数值越大表示颜色越淡。图像的灰度化处理[15]就是将彩色图像转换为灰度图像,通过将每个像素的数据量缩小到原来的1/256,但是仍然保留了图像整体和局部的特征,使得后续的计算更加简单。最常用的图像灰度化方式是加权平均法:GRAY=R+G+B3 另一种图像灰度化的方法通过YUV颜色空间就进行转化,其中的Y表示了像素点的亮度等级,通过RGB和YUV颜色空间的转换关系,可以获得如下转换公式:GRAY=0.3R+0.59G+0.11B(2-2)通过不同的计算方法获得灰度值之后,将原来的RGB模式中各分量的值替换为GRAY值即可获得灰度图像。图2-1RGB彩色图像图2-2经过灰度化处理的图像1.3图像的二值化处理经过灰度化处理的图像每个像素仍有255种可能,通过二值化处理,可以进一步缩小图像的数据量,方便后续处理。图像的二值化,是通过设定一个阈值,灰度值小于阈值的像素灰度变为0,灰度值大于阈值的像素灰度值变为255。最终获得的图像,每个像素只有黑或白两种状态。二值化后的图像仍能反应图像中物体的特征,让计算机的运算量减小,同时又能凸显出物体的轮廓,更方便了图像的后续处理。图2-3二值化的图像1.4图像的数学形态学处理数学形态学是数字图像处理的一个重要领域[16],它由描述生物形态与结构的生物形态学发展而来,用作数字图像的分析与描述。数学形态学作为一种计算机图像处理的一种实用工具,已经用于噪声抑制、边缘检测、图像分割等方面,它主要工作于二值化的图像上,同时也可以工作在灰度图像上,但是计算量会大幅增加。现在最常用的图像的形态学处理有四种运算方法:腐蚀、膨胀、开运算和闭运算。1.4.1腐蚀腐蚀运算主要的作用是消除二值化图像中的孤立点,起到一定的降噪效果。腐蚀运算的主要原理是定义一个卷积核,使用卷积核扫描图像,计算获得区域内的最小值后将锚点的值用该最小值替换,在二值化图像中获得的效果便是黑色区域扩大,孤立的白色区域消失,成片的白色区域会变小。如图2-4所示。图2-4原图(左)与经过腐蚀运算的结果(右)1.4.2膨胀与腐蚀相反,膨胀运算是通过将锚点的值用区域内计算出的最大值来替换进行实现的,在二值化图像中获得的效果便是白色区域扩大,孤立的黑色区域消失,成片的黑色区域会变小。如图2-5所示。图2-5原图(左)与经过膨胀运算的结果(右)1.4.3开运算开运算的本质是将待处理图片先进行腐蚀操作,再进行膨胀操作后得到结果。我们在移除小的对象时候很有用(假设物品是白色,背景色是黑色),常被用来去除噪声。图2-6原图(左)与经过开运算的结果(右)从图2-6可以看出,先将原图的白色部分进行腐蚀,这时候一些过细的部分会被完全腐蚀,将原来的前景目标分成多段,再对前景的白色进行膨胀操作,但已被完全腐蚀的部分并不受影响,获得最终如右图的效果。1.4.4闭运算闭运算与开运算相反,是通过将图片先进行膨胀再进行腐蚀得到结果。通常是被用来填充前景物体中的小洞,或者抹去前景物体上的小黑点。图2-7原图(左)与经过闭运算的结果(右)由图2-7可以发现,原图经过一次膨胀后,白色的前景部分很容易会连成一个整体,在这个过程中,前景部分的黑色像素会被抹去,不再受之后腐蚀效果的影响,去掉了背景像素的影响,让前景目标更容易成为一个整体。1.5运动目标检测的基本流程一般情况下我们需要对视频进行运动目标的检测。视频由连续的图像帧构成,首先要将视频分割成为一帧一帧的彩色图像,以方便后续对图像的处理。此时的图像中有背景的信息,也可能包含了需要被检测的前景图像,我们对此时的彩色图像进行灰度化处理,压缩每个像素的数据量,大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中铁工程师面试题集及答案解析
- 高级财务报表分析专家面试题及答案
- 2025年环境监测平台建设项目可行性研究报告
- 2025年智能节水灌溉系统研发项目可行性研究报告
- 2025年光伏发电普及推广项目可行性研究报告
- 2025年智能物流系统建设可行性研究报告
- 2025年智能仓储物流系统项目可行性研究报告
- 2025年家庭医疗设备市场研发可行性研究报告
- 2026年辽宁经济职业技术学院单招职业适应性测试题库附答案详解
- 2026年浙江邮电职业技术学院单招职业适应性测试题库带答案详解
- 医院布草洗涤服务方案(技术方案)
- 游戏:看表情符号猜成语PPT
- 手术室医疗废物的管理
- 普通机床主传动系统的设计课程设计说明书
- 班组工程进度款申请表
- 四年级阅读训练概括文章主要内容(完美)
- JJG 1033-2007电磁流量计
- GB/T 629-1997化学试剂氢氧化钠
- GB/T 37234-2018文件鉴定通用规范
- GB/T 2895-2008塑料聚酯树脂部分酸值和总酸值的测定
- 水利工程监理规划78648
评论
0/150
提交评论