




已阅读5页,还剩49页未读, 继续免费阅读
(计算机应用技术专业论文)公路车辆的信息统计技术.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
南京航空航天大学硕士学位论文 y3 , 7 185 8 摘要 公路车辆自动信息统计技术是近年来国际交通监控系统研究的一个重要方向,对 高速公路、城市交通、各类车辆收费站等交通场所实现现代化管理,具有重要的意义。 本文即是对此技术进行研究的一些总结。i 本文先将动态车辆视频压缩图像采集到计算机中,并实现了自动将其转化为静态 图像序列。经过噪声滤除后,本文采用了一种边缘加强和图像相减的算法,可以把车 辆从复杂背景中提取出来。为了满足实时性的要求,我们提出以目标车辆的长宽比、 面积和速度为特征对其进行识别,并从灰度入手将车辆阴影消除掉以便进行分类,识 别与分类结果令人满意。在目标跟踪过程中,我们对静态图像采取了最佳匹配跟踪, 以得到正确的流量、车型和速度三个统计数。 厂通过对实际高速公路车辆运行情况的检测试验,证明本系统性能稳定,目标提取 准确,统计精度较高。”、 i 关键词:流量统计边缘加强图像相减最佳匹配 公路车辆的信息统计技术 a b s t r a c t t h e t e c h n i q u eo f i n f o r m a t i o ns t a t i s t i co fv e h i c l eb ya u t o m a t i cm e a n si so l 砖o ft h e i m p o r t a n ts u b j e c ti nt h er e s e a r c ho fi n t e r n a t i o n a lt r a f f i cd e t e c t i o ns y s t e m i t si m p o r t a n t m e a n i n g f o rm o d e r n i z e d m a n a g e m e n to f h i g h w a y ,c i t y t r a f f i ca n dk i n d so f t o l ls t a t i o ne t c t h i st h e s i si st h e s u m m i n g - u p o f t h e s t u d y i nt h e t e c h n i q u e f i r s t l y ,w e c o l l e c t e dt h e d y n a m i c v i d e o - v e h i c l e c o m p r e s s e di m a g e i n t o c o m p u t e r ,a n dt r a n s f o r m e dd y n a m i c l yi n t os t a t i ci m a g es e q u e n c e a f t e rn o i s e f i l t r a t i o n , w eu s e dan e wt o o t h e do f e d g e - e n h a n c ea n di m a g e - m i n u st oe x t r a c tv e h i c l ef r o mt h e c o m p l e xb a c k g r o u n d ,c o n s i d e r i n g t h ep r a c t i c a ls i t u a t i o n ,w ep r o p o s e dt ou s et h er a t i oo f l e n g t ha n dw i d t h ,a r e aa n ds p e e do f t h eo b j e c tt or e c o g n i z ei ta n de l i m i n a t et h es h a d o w 、v i mg r a y i nt h ep r o c e s so fo b j e c tt r a c k i n g 。w eu s e dt h eb e s tm a t c ha l g o r i t h mt og e t a c c u r a t ef l o w ,t y p ea n d s p e e ds t a t i s t i c s t h e e x p e r i m e n t ss h o w t h a tt h i ss y s t e mi ss t a b l ea n dt h a tv e h i c l ee x t r a c t i o ni sp r e c i s e t h e s y s t e m a l s oc 姐g e tt h eh i g h p r e c i s i o ns t a t i s t i c k e y w o r d s :f l o ws t a t i s t i c e d g e - e n h a n c ei m a g e - m i n u so b j e c tt r a c k i n g b e s tm a t c h 2 南京航空航天大学硕士学位论文 第一章绪论 近年来,随着我国国民经济的不断发展,交通运输越来越繁忙,对交通管理提出 了新的要求。日前我国交通管理主要是人工管理,需要投入大量的人力、物力和财力, 而且越来越不适应现代化的要求。因此,如何对公路、城市交通、各类车辆收费站、 大型停车场等实现现代化管理。具有重要的意义。当人们建造越来越多的高速公路的 同时,如何对高速公路进行监控,以提高道路通行能力、改善其服务水平、保证高速 公路的快速、安全、舒适的行车环境也日益成为人们关注的焦点。预计全球所有的交 通部门五年内将在交通检测基础设施上花2 5 亿美元【l l ,这足以说明人们对于交通管 理的重视。 在现代化交通管理中,自动识别汽车类型、自动监控、报告汽车流量、自动记录 车速及积算费用等乃是大量减轻劳动强度、实现现化化管理的主要内容。本文主要研 究将数字视频技术与图像处理技术相结合,对视频车辆图像进行自动识别、跟踪,以 统计公路车辆有关流量、车型和速度的一种公路车辆信息统计系统。 长期以来,用感应线圈检测嚣进行交通检测统计是国外交通部门主要的检测统计 手段,但近年来全球交通工程的专业人士纷纷指出各类感应线圈已成为交通系统和控 制地下检测中最不耐用的部分。尽管自5 0 年代起,感应线圈已作为全球的检测标准 被试制和采用,然而线圈的重复维修,更换和路面的重铺费用,加之埋置在地下的线 圈频繁出现故障,已使交通工程师为更耐用和抗侵袭力的检测统计技术研究了4 0 年 1 2 1 。现在已经有了利用全球定位系统( g p s ) 技术、射电技术、激光技术,视频技术 等来进行检测统计,但前三种技术都需要在车辆本身安装接收、反射装置,这无疑将 增加不少成本,而近年来成本的降低和技术的进步使视频图像技术已在全球交通检测 系统市场上得到了应用m 御。视颓检测统计系统无须在车辆上增加任何装置,且它的 功能优于单纯的感应线圈检测器,通过车长进行车辆分类、流量统计和车速统计,它 提供了真正的大区域检测。 就我们所了解,国外对于视频检测技术研究较早,且在高速公路上已有相关产品 应用。主要有条线式视频检测系统和多层次“金字塔”式视频检测系统,但条线式视 频检测系统只分析当前图像检测区域内像素组或行的瞬时改变,在检测精度方面存在 不足。而基于多层次“金字塔”式视颓检测系统则是通过可进行多种清晰度转化的专 业“金字塔”式精片将高清晰度图像输入,并将其转化为级联性的低清晰度图像,分 别进行处理,再将几个图像窗口转换在一起,形成一个组合图像或嵌拼图,这孝申方法 可以快速的检测图像中整个检测区域内的每个像素点,在检测精度上比前者更高。但 这些方法在处理阴影方面仍未得到很好的解决【“2 “j 。在跟踪技术方面,国外有基于 公路车辆的信息统计技术 模板匹配的算法f2 0 1 、基于主动轮廓线的算法【2 2 r2 3 1 等,多数是对目标模型的直接匹配, 计算量大。另外还有一些针对点目标的跟踪算法【2 4 2 5 1 这种算法无法处理点的重叠。 且把目标作为点来处理则过于简单化。 目前国外最好的两种视频检测统计系统是以色列的v i p 2 和英国的 v i d e o t r a c k 9 0 0 。在一般情况下,v i p 2 对车流量的每小时计数精度能达到9 6 ,在5 一1 5 0 公里d , 时范围内速度检测精度为9 0 ,对车型的分辨率( 按车长分成三类) 精 度只有9 0 ,而v i d e o t r a c k 9 0 0 车流量每小时计数精度能达到9 7 ,在相同范围内 速度检测精度为9 3 ,对车型的分辨率精度也只有9 2 ,但当有光线投在车身上造 成车道上有较大阴影时。这两种视频检测系统都会在车型分类和流量统计两个技术指 标产生误差,使精确度下降口4 】。 而目前国内对于车辆分类f 1 4 1 ,运动目标跟踪2 1 2 6 2 7 堋,都有一定理论和技术 研究,但从发表的资料和结果来看。还未有一个接近实用的能较好解决车辆检测统计 的系统。我国在应用车辆检铡统计技术方面,仅是1 9 9 9 年在建设江阴长江公路大桥 时引进了国外的感应线圈检测器和v i d e o t r a c k - 9 0 0 视频检测系统对桥上的高速公路 进行交通检测统计。 为了提高江阴长江公路大桥的车辆的统计精度。也为了在高速公路上推广视频检 测统计技术,应西安公路研究所的要求,我们研究并设计了本系统。 设计公路车辆信息统计系统的困难在于: ( 1 ) 因为摄像机暴露在外场环境中,会因为风和其它外界因素而发生晃动,且 随着时间的变化,使得视频图像中的景物发生一定的变化,车道线在图像中的位 置也可能会发生偏移,如何消除这些影响将车辆单独提取出来是我们面临的第一 个难点; ( 2 ) 由于光线在不同时间所照射的角度和强度的不同,会使车辆的阴影灰度和 位置也不断变化,给车辆识别、分类造成误差,如何排除阴影干扰是我们要解决 的一个主要难点: ( 3 ) 如何得到检测区域内运动车辆的流量、车辆和速度统计值,也是我们在设 计系统对面临的一个难点; 为了解决上述问题,在系统中我们采用的下面几个主要的技术手段进行解决: 1 、通过动态更新背景图像的方法,保证了背景图像与有车辆的图像两者的灰度 差异和环境变化达到最小,再经过边缘加强、像素相减技术,排除掉各种外 界因素的影响,以滤掉背景和非车辆物体,将车辆物体提取出来。 2 、利用车辆的面积、比例、运行特性三个基本特征进行快速车辆识别,分析阴 影的灰度特征和本身性质来消除阴影,实现了车辆目标的正确识别并得到正 确的分类。 南京航空航天大学硕士学位论文 3 、我们通过考虑连续图像中检测目标的最佳匹配值,来判断运动目标的一致性, 并进行目标跟踪,以得到精确的车流量、速度和车型数。 针对系统要在高速公路上实时对运动车辆进行处理的特点,我们考虑设计本系统 应遵循两个原则: ( i ) 能用简单算法解决的问题,决不采用复杂的方法: ( 2 ) 解决实际问题的效果第一,在解决实际问题效果与计算方法复杂程度相同 的前提下,才考虑优先采用理论性强的、先进的技术。 我们所设计公路车辆信息统计系统的处理过程首先要将车辆在道路上的运行情 况通过摄像机采集到计算机内并以a v i 格式存储,再将其转换为b m p 图像格式。然 后在车辆检测阶段,根据最邻近的背景图像对当前图像进行调整,有效地清除背景和 各种噪声干扰,将目标从整个图像中单独提取出来,或动态更新背景。接着,利用车 辆的面积、比例和运动特性对提取的目标进行检测识别,并通过设定灰度阈值和阴影 本身的特点滤掉阴影部分,以对车辆正确进行分类。下一步对连续三帧图像进行最佳 匹配分析,以统计车辆速度,车流量和车型,这就是整个处理过程。 巫蚓a ,淼块p 岖圈叫禚美h 叫车辆识别模块h 车辆信息统计模块 b 出数据 图1 - 1系统的处理过程 本文共分5 章。第一章是绪论:第二章为动态视频车辆压缩图像的采集与转化, 介绍了自动将a v i 文件转化为静态的b m p 图像序列算法;第三章是视频车辆图像的 边缘检测,讨论了边缘加强与“图像”相减、检测框的确定算法:第四章是视频车辆 目标的识别与分类,介绍了用简单的三个基本特征进行车辆识别,及阴影消除和车辆 分类的问题:第五章为视频车辆的信息统计,讲述了对连续图像进行最佳匹配判断并 进行跟踪分析以统计车辆速度、流量和车型三种信息的统计。 通过对拍摄的高速公路车辆运行的试验条件下取得的数据分析,我们发现本系统 对车辆分类的数据精度可达到1 0 0 ,对速度的统计数据精度有9 5 ,但在统计车流 量方面,对检钡4 区域只有单目标运行的情况,统计数据精度有1 0 0 ,但若在检测区 域内会有多个目标在运行的情况,则统计数据精度只有9 0 。 公路车辆的信息统计技术 第二章动态视频车辆图像的采集与转化 2 1 前言 因为我们通过摄像机采集到的高速公路上的车辆图像为动态彩色视频图像,要存 入计算机内,就要通过视频采集卡将模拟信号转换为数字信号来完成这一工作,但是 动态彩色视频图像的存储量是巨大的,为了节省存储空间,我们要以压缩的方式存入 计算机内。而我们要对公路车辆信息进行统计就必须对每一帧图像进行处理,且图像 颜色对于我们的统计无任何作用,所以我们要对存入到计算机内的动态彩色视频图像 进行处理,将动态彩色视频图像转换为静态图像序列,并进行灰度化。在统计结束后, 再将静态图像序列删除掉。 本章处理过程如下图所示: 图2 - 1 采集与转换过程 2 2 动态视频车辆图像的采集 采集动态视频图像,视频输入源可为摄像机、录相机、c c d 摄像头等。我们先通 过东芝m 1 0 0 0 摄像机将高速公路上车辆运行情况摄下,再采用具有图像连续采集功能 的视频采集卡进行动态图像的数字化。视频采集卡可将模拟视频信号转变为数字视频 信号,以文件形式存储于计算机的硬盘中。因为动态视频图像的数据量非常大,一般 捕捉的图像都要经视频采集卡进行硬件压缩,现在的压缩格式有许多如v i d e of o r w i n d o w s 的a v i 格式、m p e gi i 格式、m p e g i i i 格式等,但a v i 压缩格式具有解压 缩快速,应用广泛,可以在任何p c 机上在无特定硬件支持的条件下播放等特点,所 以我们一般以a v i 文件格式进行存储。 本系统使用的采集卡是a n i m a t i o nt e c h n o l o g i e si n c 公司的视频实时采集、压缩 解压缩卡f l v d e 0 i i 。f l y v i d e o i i 能以p a l 制式、n t s c 制式和s e c a n 制式采集视 频图像,视频图像输入方式可以为电视信号、f l y c a m 、a v 和s - v i d e o 模式,采用多 南京航空航天大学硕士学位论文 种压缩方式如:m i c r o s o f tv i d e o l 3 2 、i n t e li n d e o ( r ) v i d e o r 3 2 等,可以选择r g b 3 2 位、2 4 位、1 6 位和y u v 4 2 2 、1 2 、9 六种格式,并且画面大小、质量、声音等都可以 进行设定,具有同步输入定格和实时视频覆盖功能,可采集高质量的数字视频图像。 为了保证系统的运行速度,存储和处理动态视频图像,宜采用s c s i 接口的高速 大容量视频硬盘。 2 3 动态视频转化 我们将动态视频图像以a v i 格式进行存储后,为了对其中每一帧进行处理以统计 车辆信息,又必须将其转换为静态图像序列。虽然市场上已有软件工具可以完成这一 工作,但若每次运行本系统都要调用外部软件工具进行工作,显然对于运行速度、使 用方便性和成本都会造成影响,为此我们自行设计了一个转换模块来完成这一工作。 目前静态图像格式有b m p 格式、g i f 格式、j p e g 格式、t i f f 格式等数十种,而 b m p 文件格式处理简单,且它已是w i n d o w s 环境设置的标准图像格式。所以我们选 择b m p 格式作为转换后的静态图像格式。下面我们先了解一下a v i 的文件格式和 b m p 文件格式【5 1 。 2 3 1a v i 文件格式 a v i 文件就是我们常说的多媒体文件a v i 图像就是视频图像。由于当前w i n d o w s 已成为p c 机窗口环境标准,现在我们所说的a v i 格式文件是指微软公司的a v i 格式 文件,它是一个r i f f ( r e s o u r c ei n t e r c h a n g ef i l ef o r m a t ) 说明文件,用于获取、编辑 以及演示音频、视频序列。a v i 文件中包含了许多有不同类型的数据流。一般的a v i 文件包含音频流和数据流,有的特殊的a v i 文件还包含了一个控制路径或m i d i 路径 作为附加数据流,控制路径能够控制外部设备,而m i d i 能够为结果提供背景音乐。 我们在下面详细介绍的a v i 文件只是包含有视频和音频数据的文件。 因为a v i 文件用的是a v i 哪形式,而a v i 砌f f 形式由a v i 来标识,所以 a v i 文件是由一些块组成的。所有的a v i 文件,都包括两个必须的l i s t 块,这些块 定义了流和数据流的格式。有时候,a v i 文件还包括一个索引块,这个块指示了文件 中数据块的地址。一个具有上述内容的a v i 文件具有例2 1 的形式: r i f f ( a v i ) l i s t ( h d r l ) 公路车辆的信息统计技术 l i s t ( m o v i 例2 1 a v i 块标识了此文件是一个a v ir i f f 文件。l i s t 块h d r l 定义了a v i 文件 的数据格式,它是必须出现的l i s t 块中的第一个块。l i s t 块m o v i 包含了a v i 文件数据的序列,是必须出现的l i s t 块中的第二块。而块i d x l 则是一个任选的 索引块。上面的三项内容必须按次序排列,而u s t 块的索引块都是r i f f a v i 块的子块。如例2 - 2 所示: r t f f ( a v l ) h s t ( h & l a v i h ( ) l i s t ( s t r l s t r h ( ) 妫f r ) s u d ( ) : ) : ) l i s t ( m o v i s u b e h u n k l l i s t ( f e c : ) ) : ) : 【i d x l 南京航空航天大学硕士学位论文 例2 2 在上面的两个例子中,我们可以看出l i s t 块h d r l 以及m o v i 运用的是子块 形式。而在第二个例子中,可以看出扩充后的a v ir i f f 形式包含有完整的l i s t 块。 接下来我们要了解a v i 文件的存储方式。a v i 文件标准格式是一种由软件辅助的 数字化视频压缩技术,使用它能够快速、方便地从一个数字存储设备中解压缩图像。 a v i 的存储格式如下图所示,它是一种交错的存储方式。它的这种交错的存储格式保 证了视频与音频的同步。 毛信息a u d i o v i d e oa u d i ov i d e oa u d i ov i d e o 图2 - 2a v i 文件存储格式 当我们知道了a v i 文件格式与存储格式后,要从中获得我们所需的数据,我们还 要了解a v i 文件的主头标文件和几个重要的数据块。 在a v i 文件中,头标是用字串a v i 来标识的。在头标文件中,定义和标识了 有关此文件的一般信息。比如说有a v i 文件序列的高度、宽度,以及文件中的流块 数。而在一个a v i 文件中,是以主头标( m a i nh e a d e r ) 开始的。在a v i 文件中,主 头标是用例2 - 3 所示的数据结构来进行定义的。 t y p e d e fs t z l l c t d 、) l k ,r dd w m i c r o s e c p e r f r a m e ; d w d r d d w m a x b y t e s p e r s e c ; d 7 0 r dd w r c s e v e d l : d w o r d d w f l a g s ; d w o r d d w t o t a l f r a m e s ; d w d r d d w i n i t i a l f r a m e s ; d w - 0 r d d w s l t e a m s ; d w o r d d w s u g g e s t e d b u f f e r s i z e ; d w o r dd 1 删d t h ; d w o r d d w h e i g h t ; d w o r d d w s c a l e ; d w o r d d w r a t e ; d w o r d d w s t a r t ; d w o r d d w l c n g t h ; 7 公路车辆的信息统计技术 ) m a i n a v i h e a d e r ; 例2 - 3 在a v i 文件中,有以下几个重要的数据块,即“s t r l ”流头块、“m o v i ”l i s t 块和 “i d x l ”块等。我们主要用到的就是上面3 个块。 ( 1 ) “s t r l ”流头块 在a v i 文件中,紧跟在m a i n a v i h e a d e r 后面的是一个或多个“s t r l ”块。文件中 的有关流的信息就包含在这些“s t r l ”中。每一个“s t r l ”块都需要一个流头块和流格 式块。 例2 - 4 就是“s i a l ”块的数据结构: t y p e d e f s t r u c t f o u r c c f e e t y p e ; f o u r c c f c e l - i a n d l e r ; d w o r d d w f l a g s ; d w o r dd w r e s e r v e d l ; d w o r d d w l n i t i a l f r a m e s ; d w o r d d w s e m e ; d w o r d d w r a t e ; d w d r d d w s t a r t ; d w o r d d w l c n g t h ; d w o r d d w s u g g e s t e d b u f f e r s i z e ; d w o i m d w q u a l i t y ; d w d r d d w s a m p l e s i z e ; a v i s t r e a m h c a d e r ; 例2 - 4 从例2 3 和例2 _ 4 ,我们可以看出在流头结构中有很多的域在主头文件中也出现 了。主头标中数据结构的域适用于整个文件,而流头中出现的只可以适用于它所说明 的流中。 流格式块是指流中的数据格式。它必须跟在流头块之后。对于前面我们提到的视 频流而言,在流格式块中,它是一个b i t m a p i n f o 结构,有时可能会包含调色板信 息。对于音频流而言,是一个p c m w a v e f o r m a t 或w 臌o i m 俏结构。 有时,“s t r l ”还会包含流数据块,这个数据块将在流格式块之后。它的格式或内 容由压缩和压缩驱动程序所决定的。在一般情况下,驱动程序用这个信息将系统进行 南京航空航天大学硕士学位论文 配置。在编写读和写r i f f 文件的应用程序时,不需要对信息进行翻译,它们直接将 应用程序的这些数据作为存储块,传递给驱动程序或从驱动程序中读取并进行传递。 ( 2 ) “m o v i ”l i s t 块 “m o v i ”l i s t 块是跟在头标信息之后的块,它是流中的实际数据块,也就是我 们所说的图像和声音数据本身。这些数据有两种存储格式,一种是直接驻留在l i s t 块“m o v i ”中,一种是在“嫩”块中。 周其它的r i f f 块一样数据块中亦含有f c c t y p e 字串来定义块的类型。标识每个 块的字串由流的个数和一个用来定义压缩信息的字串组成。 由于a v i 文件中所有的格式信息都在头标中所以,我们现在所讲的“m o v i ”l i s t 块中的音频和视频数据就不包含有关格式的信息。对于视频数据来讲,视频数据可以 是压缩或非压缩的d i b 形式。如果将与b i t m a p i n f o 结构相关的b i c o m p r e s s i o n 的 值设为b ir g b ,那么,就说明视频数据是非压缩的d i b 格式。 未被压缩的d i b 数据块中包含的r g b 视频数据用“d b ”表示。被压缩的d i b 数 据块用“d c ”表示。这些数据块中都不包含d i b 的头标信息。未压缩的d i b 数据块 和压缩的d m 数据块有如下的形式; d i bb i t s 撑群d b b y t e a b b i t s ; c o m p r e s s e d d i b 撑群d c b y l e a b b i t s 1 ; 例2 。5 前面,我们说过,在a v i 文件中,视频流有时还可能包含有调色板信息。所以, 我们有时可以使用视频数据块定义新的调色板入1 2 1 来更新调色板,用字串“p c ”来 标识。 ( 3 ) “i d x l ”块 “i d x l ”块是列在a v i 文件中“m o v i ”l i s t 块之后的一个索引块。它主要包含 a v i 文件中数据块的列表以及它们的地址。有了这个索引块,我们就可以对a v i 文件 中数据进行随机有效的访问。 2 3 2b m p 文件格式 当我们从a v i 文件中的“m o v i ”块中取出必要的视频数据后,为以后便于处理, 我们要将其转换为b m p 图像。而在“m o v i ”块中,视频数据虽然已经是设备无关位 图( d i b ) 形式,但它不包含d i b 的头标信息,所以我们要为其增加一个文件头。而 公路车辆的信息统计技术 且接下来还要将b m p 图像灰度化,这些都要求我们先熟悉b m p 文件格式,才能进 行后继处理。 b m p 图像文件格式是微软公司为其w i n d o w s 环境设置的标准图像格式,w i n d o w s 中定义了两种位图文件格式类型,即一般位图文件格式和设备无关位图文件格式。其 中,设备无关位图( d m ) 文件格式具有更强的灵活性与完整的图像数据、压缩方式 等定义,所以我们常常处理的b m p 图像都为d i b 文件格式。 b m p 图像文件的结构可以分成如下三个部分:文件头、调色板数据以及图像数据。 其中文件头的长度为固定值5 4 个字节;调色板数据对于所有不超过2 5 6 色的图像模 式都需要进行设置,即使是单色图像模式也不例钤,但是对于真彩色图像模式,其对 应的b m p 文件结构中却不存在相应调色板数据的设置信息 w i n d o w s 中将b m p 图像文件的文件头分成两个数据结构,其中一个数据结构中 包含b m p 文件的类型、大小和打印格式等信息,称为b i t m a p f i l e h e a d e r ;另外 一个数据结构中则包含b m p 文件的尺寸定义等信息,称为b r r m a p n 盯o 艟刖) e r ; 如果图像文件还器要调色板数据,则将其存放在文件头信息之后。 b n m a p 舶【胁糊e r 数据结构定义如下: t y p e d e f s t n l c t t a g b i t m a p f 皿e h e 剐) e r w o r d b f f y p e ; d w o r d b f s i z e ; w o r db f r e s e r v e d l ; w o r d b f r e s e r v e d 2 ; d w o r d b 虻哟b i t s ; ) b 1 1 m a p l e 旺a d 腿; 而b i t m a p i n f o h e a d e r 数据结构用于说明位图的大小,其定义为t t y p e d e f s t r u c tt a 班r r m a p 酣f o 髓a d i 职 d w 7 0 r d b i s i z e ; d w o r d b i w i d t h ; d r c i r d b i h e i g h t ; w o l t d b i p l a n e s ; w o r db i b i t c o t m t ; d w o r d b i c o m p r e s s i o n ; d w d r d b i s i z e l m a g e ; d w o r d b i x p e l s p e r m c t e r ; d w o r db i y p e l s p e r m e t e r ; d w o r d b i c l r u s e d ; 南京航空航天大学硕士学位论文 d w o r d b i c i r i m p o t t a n t ; b i t m a p i n f o h e a d e r ; 如果位图的描述还需要调色板数据,则应该在b m p 文件头之后定义一个颜色表, 它包含若干个表项。其中,每一个表项定义了一种颜色,w i n d o w s 将其定义为如下的 r g b q u a d 结构: t y p e d e f s t r u c ti a g r g b q u a d b y t e r g b b l u e ; b y t e r g b g r e e n ; b y t e r g b r e d ; b y t e r g b r e s e r v e d ; r g b q u a d ; 在r g b q u a d 数据结构中,增加了一个保留字段r g b r e s e r v e d ,它不代表任何意 义,必须取固定值0 。同时。r g b q u a d 结构定义的颜色值中,红色、绿色与蓝色的 排列顺序与般图像文件的颜色数据排列顺序恰好相反。若位图中某个像素点的颜色 描述为“0 0 ,o o ,f f ,o o ”,则表示该点的颜色为纯红色,而不是纯蓝色。 综上,在d i b 位图文件组成中,紧随b i t m a p f i l e h e a d e r 结构其后的数据结 构为b i t m a p i n f o ,两者共同构成完整的位图文件。w i n d o w s 将b i t m a p i n f o 结构 定义为: t y p e d e f s t r u c tt a g b n m a p n q f o f b r n 讧a p d i f o h e a d 啄 b m i h e a d e r ; r g b q u a db m i c o l o u r 1 ; ) b r 孤d a p n q f o ; 其中,b m i h e a d e r 字段指向包含位图颜色格式以及大小定义的 b i t m a p i n f o h e a d e r 结构。b m i c o l o u r 1 字段指向r g b q u a d 结构数组或者定义 位图颜色值的双字数据结构,它定义了b m p 图像文件的颜色表,它包含多少个表项 是由b i 办他p d 腰o 疆a d e r 数据结构中的b i b i t c o u n t 字段定义的:若该字段的取值 为1 ,则颜色表中共包含两个表项;若该字段的取值为4 ,则颜色表中共包含1 6 个表 项:若该字段的取值为g ,则颜色表中共包含2 5 6 个表项;若该字段的取值为1 6 ,而 且b i t m a p i n f o h e a d e r 结构定义中指定b i c o m p r c s s i o n 字段的取值为b ir g b ,则 颜色表中的表项为空,位图阵列中每个字代表一个像索,字中每5 位上的值代表该像 素点一种基色的亮度,其中最低5 位代表蓝色亮度,依次为绿色与红色,字的最高位 没有任何意义。若该字段的取值为2 4 ,则颜色表中的表项为空,丽位图阵列的每三 公路车辆的信息统计技术 个字节代表一个像素,这3 个字节直接定义了像素颜色中蓝、绿、红三种基色的相对 亮度。 因为非压缩存储格式是b m p 图像文件通用的一种数据处理方式,而我们在实际 处理中也使用非压缩存储格式,所以我们只需了解这种存储格式。 在这种存储格式中,位图每一点的像素值与位图阵列中的若干位一一对应,其中, 位图阵列的大小由位图的宽度、高度以及位图的颜色数共同确定。利用这种格式存储 位图数据,由于图像数据没有经过任何处理,应用程序在读写b m p 图像时,也就不 必进行数据的压缩与解压缩操作,从而使得b m p 图像文件的读写操作速度超过其它 经过压缩处理的图像文件,这对于要求实时进行操作的本系统而言,是最大的好处所 在。同时,由于这种格式的b m p 图像文件不存在数据的压缩处理操作,因此,只要 掌握图像数据的排列以及存储方式,即可正确处理这种b m p 图像文件。主要包括两 个方面内容: 首先,必须掌握位图扫描行与位图阵列的关系。假设记录一个扫描行的像素值需 要n 个字节,则位图阵列的o 到n 1 个字节记录了位图第一个扫描行的像素值;位图 阵列的第1 1 至第2 n - 1 个字节记录了位图第二个扫描行的像素值,依次类推,位图阵 列的第( m 1 ) n 至第m * n 1 个字节记录了位瞬第m 个扫描行的像素值,整个位图 阵列的大小为n * b i h e i g h t 。同时,由于w i n d o w s 对于b m p 图像文件特别规定:文件 内每行字节的个数必须是4 的倍数,否则。应该在每行的末端加上凡个字节,并利用 0 填充这些字节中的各个位值,从而凑齐差额部分的位值。因此,n 的取值可以利用 如下公式计算:当( b w i d t h + b i b i t c o u n t ) m o d3 2 ;0 时,n = ( b i w i d t h + b i b i t c o u n 0 8 ;否则,1 1 = ( b i w i d t h b i b i t c o t m t ) ,8 + 4 。 当我们将a v i 文件中的d i b 数据读出,加入头标信息存成b m p 图像文件时,应 该判断每行数据的位数是否满足4 的倍数,不符合的必须将该行数据补齐,以便导致 位图显示混乱。 其次,应该注意b m p 图像数据的存储方式,即位图像素值与位图阵列的关系。 由于b m p 图像中,单色图像利用一个字节记录8 个像素;1 6 色图像利用个字节记 录两个像素,其中。左边四个记录第一个像素,右边四位记录第二个像素;2 5 6 色图 像以一个字节记录一个像素;而真彩色图像则是以三个字节记录一个像素。因此,假 设记录第m 个扫描行像素值的n 个字节分别为a o 、a l 、a 2 、,则: 当b i b i t c o u n t 一1 时,n o 的第7 位记录位图第m 个扫描行中的第1 个像素值,a o 的第6 位记录位图第r a 个扫描行中的第2 个像素值,a 0 的第0 位记录位图 第m 个扫描行中的第8 个像素值,a 1 的第7 位记录位图第m 个扫描行中的第9 个像 素值,a l 的第6 位记录位圈第m 个扫描行中的第1 0 个像素值,依次类推。 当b i b i t c o u n t = 4 时,a o 的第7 位至第4 位记录位图第m 个扫描行中的第1 个像 南京航空航天大学硕士学位论文 素值,a o 的第3 位至第0 位记录位图第m 个扫描行中的第2 个像素值,a l 的第7 位 至第4 位记录位图第m 个扫描行中的第3 个像素值,依次类推。 当b i b i t c o u n t = 8 时,a o 记录位图第m 个扫描行中的第1 个像素值,a l 记录位图 第m 个扫描行中的第2 个像素值,依次类推。 当b i b i t c o u n t 一2 4 时,a o ,a l ,a 2 记录位图第m 个扫描行中的第1 个像素值,a 3 , a 4 ,a 5 记录位图第m 个扫描行中的第2 个像素值,依次类推。 2 3 3 动态视频转化为静态b m p 图像 有了上述的基本知识,我们就可以开始进行转化过程。我们先从a v i 文件的头信 息块中取得a v i 流的格式,再从a v i 文件中的“m o v i ”块中提取视频压缩图像数据。 在提取过程中,我们发现a v i 中的视频流并不是由单个d i b 数据依次组成,而是在 开头部分存储一帧基图,以后部分只存储局部动态变化信息,并且进行打包处理。经 过多次试验后,我们决定从时间方面入手,考虑到a v i 采用一种交错存储格式,除 第一个视频流可以用简单的帧数来取得解压后的数据外,其他的视频流则根据所需帧 数、整个a v i 文件的宽度和视频周期之间的关系公式 t = i n t 3 2 。3 2 t 0 6 4 ( f w s p ) l o o o ( 2 - 1 ) 其中,为所需帧数在整个a v i 文件中的时间 f 为所需的帧数 缈为a v i 文件的宽度 劬为视频周期 l m 3 2 * 3 2 t 0 6 4 ( a ,6 ) 含义见附录 来取得所需帧数在视频流中的时间,再通过m i c r o s o f tv i s u a lc + + 6 0 中的函数 a v i s t r e a m t i m e t o s a m p l e 将时间r 与a v i 中存储当前帧的位置对应起来,得到所需的 解压后的数据。 获得所要的数据后,我们接着将其转存为b m p 图像文件。首先我们根据从a v i 中获得的信息来构造b m p 的文件头,同时因为我们采集的a v i 是以r g b 2 4 的真彩 色形式存储的,所以我们填充b m p 图像数据时要跳过调色板数据,直接在设计好的 文件头之后加上图像数据,并在文件头结构中标明位置,这样将所有的数据都存为 b m p 图像后就得到了静态的b m p 图像序列。 公路车辆的信息统计技术 2 4 图像灰度化 当我们经过上述操作后得到的b m p 图像为2 4 位真彩色图像,若直接进行边缘检 测、滤波等操作将大大增加复杂度和处理时间,且我们以后的处理过程不需要颜色信 息,所以有必要先进行灰度化。 从上节我们知道2 4 位真彩色b m p 图像是以三个字节记录一个像索值,依次为8 位红、8 位绿、8 位蓝,并且文件结构中不含调色板数据,图像数据直接存在文件头 结构后。 当从2 4 位真彩色图像中取得红、绿、蓝三色的像素值后,我们利用下列公式得 到当前点的灰度值,并将灰度值存入当前点在灰度图像数据中的相应位置。 g r = 0 2 9 9 x r + 0 5 8 7 g + 0 1 1 4 b( 2 2 ) 其中g ,为灰度值,r ,g ,b 分别为图像的红色值。绿色值和蓝色值。 接下来我们要创建一个有2 5 6 个灰度等级的b m p 灰度图像。我们先在图像文件 信息头结构中将b i b i t c o u n t 设为3 。以表明这是个2 5 6 色的图像,但仅这一点并不表 示这个图像就是个灰度图像。因为一个灰度图像除了具有上面的一个特征外,它的颜 色表中的数据必须以: o 0 0 00 00 0 。o lo io lo o ,0 2 0 20 20 0 ,f f f f f f 0 0 这种格式排列。 完成上两个步骤后,我们就可以将2 4 位真彩色图像中的图像数据灰度化后的值 一一对应写入灰度图像数据阵列中,即生成了相应的b m p 灰度圈像。 这一章所得部分图像见后一页左边为直接从a v i 文件中转化出来的三帧连续 b m p 彩色图像,右边为这三帧图像灰度化后的图像。 南京航空航天大学硕士学位论文 ( a ) ( b ) ( c ) ( a ) ( b ) ( c ) 圈2 3a v i 图像转换成的三帧连续b m p 图像及灰度化后的图像 一】5 公路车辆的信息统计技术 第三章视频车辆图像的边缘检测 在上一章我们将动态视频车辆图像转换为静态的b t v n ,图像并且对其进行了灰 度化,而要进行车辆流量统计,我们还要对这些图像进行平滑、噪声消除、提取边缘, 为以后的车辆识别、分类作准备。 因为我们实际拍摄的图像背景十分复杂,不仅有车道分界线,还有周围的各种景 物,所以我们必须将背景除去,但不同的季节、不同的天气、不同的时间背景也在不 断的变化,无法用统一的模板来判断。所以开始处理前,我们先选定一幅无车辆的图 像作为背景图像,而对以后的图像进行分析处理时,若发现分析的图像中无车辆,则 将这幅图像设为背景图像。这样动态更新背景图像,保证了背景图像与有车辆的图像 两者的灰度差异和环境变化达到最小,效果也能达到要求。 3 1 图像的预处理 因为图像中往往包含着多种噪声,所以在从图像中提取各种特征前,一般都需要 对原始图像作某种方式的平滑以除去这样的噪声。常用的图像平滑有【7 1 : 【1 】邻区平均法 这是图像平滑处理的一种直接的空闯域方法。给定数字图像n x n 的产( 玛,他) 阵 列,可以产生一个平滑了的图像q ( 码,) 阵列。其中各个阵元的灰度由该阵元的邻 区各个阵元灰度值的平均值来表示。这个操作可以用下式表达 q ( ,吨,脚2 ) =
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建省莆田市某校2024-2025学年四年级上学期第一次月考数学试题
- 单元考点必刷卷 (一)(含答案)我上学啦 2025-2026学年北师大版一年级数学上册
- 高升专考试题及答案
- 校园体育文化特征主要包括
- 批判现实主义绘画课件
- 93阅兵精神主题班会学习阅兵精神争做时代少年
- 2025年多媒体电脑超声诊断仪项目发展计划
- 2025年保育师考试面试真题及答案
- 2025年入学拼音考试题目及答案
- 慢性乙肝肝炎课件
- 离职交接事项协议书范本
- 2025-2026学年陕旅版(三起)(2024)小学英语四年级上册(全册)教学设计(附目录)
- 心电监护血氧饱和度监测技术
- 【高考真题】海南省2025年高考真题物理(含答案)
- 体育教师自我介绍课件
- 局工作秘密管理暂行办法
- 银行员工职业操守课件
- 初中开学第一课心理健康课
- 艺康servsafe培训课件
- TDT1067-2021不动产登记数据整合建库技术规范
- 加气站投诉处理管理制度
评论
0/150
提交评论