版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于多尺度区域自适应分割的人流量统计方法分析案例概述目录TOC\o"1-3"\h\u15266基于多尺度区域自适应分割的人流量统计方法分析案例概述 1289341.1引言 1107511.2多尺度区域自适应分割算法 3303601.2.1多尺度方法的比较 3249451.2.2多尺度区域自适应分割思想 4187931.3多尺度区域自适应分割算法的设计与实现 522131.3.1多尺度区域自适应算法的处理 5213691.3.2多尺度区域自适应分割算法设计 6203741.4实验与分析 789321.4.1数据集 7311601.4.2模型训练 7194431.4.3评估指标 8139001.4.4实验一 8257481.4.5实验二 91.1引言人流量的统计是视频监测和控制系统的一个关键技术,在视频监控领域发挥着重要作用。目前该系统已经在我国广泛使用,适合在商场、学校、银行、火车站等各种公共设施中使用。由于灯光照射条件、摄像头的位置、背景和温度的变化、对行人的遮挡等不同原因,检测效果有限。在视频监测的人流量统计中,头部检测的干扰因子要小于全身检测的干扰因子。现有的人流量统计方法有三种:基于目标检测的方法、人群回归方法和深度学习神经网络方法。基于目标检测的方法能够同时获取人的数量和位置信息,但由于行人具有遮挡性、密度大、多尺度等特征,误检概率较高。Venkatesh[37]等人。提出一种通过计算减去图像的梯度和背景信息来得到目标感兴趣节点的检测方法,并通过利用AdaBoost分类器来对子窗口信息进行分类,实现了头部目标的检测。这种方法可以大大改善感兴趣节点的品质,但是错误检出概率比较高。Tuanhung[38]等人。提出了一种基于CNN和上下文的头部检测方法,不仅大大提高了检查的准确性,而且大大减少了TVHI数据集的时间损失。基于人口回归的方式是利用先前景像素和感兴趣点(例如纹理、梯度等)之间的关联性。可以实现人口统计,适合于高遮蔽、高密度场景。张等提出了MCNN模型,将一幅图像映射到一张密度图上,并进行人口统计。在基于深度学习神经网络的方法中,利用卷积神经网络提取输入图像的特征,利用深度学习目标检测器对头部进行定位和计数,大大提高了计数精度。然而,在多尺度目标被检测的情况下,精度会大幅降低。目标检查框架主要由四个组成部分:区域提取、特征提取、分类器和回归。在我国现有的文献中,针对框架的不同组成部分,提出了一些不同的优化和改进措施。为了解决多尺度目标检测的问题,Overfeat和SPP-Net将图像转换成不同大小的尺寸来进行多维检测,并且采用了区域提取算法(例如选择性搜索或edgebox)来提取高质量的图像。最后,利用卷积神经网络将所得到的检测数据进行了汇总,完成了检测工作。这种方法实质上就是将原始的图像进行精确地缩放,来适应各种尺度的检测对象。在接下来的研究中,将多尺度图像与多尺度锚定相结合形成神经网络模型。基于这种方法,Lu[39]等人提出了一种基于邻域信息的AZ网络模型和自适应比例锚定策略,以取代原FastRCNN的RPN模型。为了尽量减少目标检测的时间损失,Yolo和SSD通过从一个预定义的滑动窗口中直接估计目标的类别,就可以完成一个实时目标的检测。为解决目标尺寸变化很大,难以准确定位等等的问题。Xia[40]等人首先提出了一种能够自动适应物体本身及其组成部分尺度的HAZN模型。这种模型可以根据不同的缩放区域进行自适应的图像缩放,因此不再需要大量的计算资源来达到缩放图像的效果。郭等提出了一种自适应重叠分割方法,避免了分割过程中人头被切割的问题。该方法将分割后的图像放大到神经网络模型的输入大小,并能自动计算出分割的块数。这些方法可以解决小尺寸物体分辨率低、检测困难的问题,但不能解决物体尺度变化大、导致计数精度下降的问题。为了解决多尺度目标难以计数的问题,本文提出了一种多尺度区域自适应分割算法。如果物体太小,人们就会向前看。如果物体太大,人们会向后移动来观察它。这样,物体的大小就符合人类视觉的特点,可以更好地观察物体的细节。本文采用多尺度区域自适应分割算法将图像分为若干子块,然后将目标放大到不同的尺度以匹配检测点的大小。然后,利用K-means算法对FasterRCNN检测结果进行聚类。首先考虑同一类目标具有相似的尺度,然后对不同尺度的区域进行分割。在对不同尺度的区域进行放大后,采用FasterRCNN检测模型进行检测。图片上半部分的头部对象通常很小,这导致物体检测器中的锚定与头部尺寸不匹配,因此可以放大以进行检测。通过适当扩大密集人群的面积,使头部目标与锚点的大小相匹配,增加不同目标之间的距离,实现对目标的分割。为了进一步验证该方法的有效性,本文将多尺度区域自适应分割算法与FasterRCNN相结合来实现人员计数。实验结果表明,与直接利用目标检测模型统计人数的方法相比,组合方法的准确率有了很大的提高。1.2多尺度区域自适应分割算法1.2.1多尺度方法的比较Overfeat和SPP-Net将原始的图像缩放为不同比例的大小,以便于适应各种比例的图像。FasterR-CNN将RPN区域的提取模型全部集成并应用于FastR-CNN模型中,实现了目标检测端到端。针对图像中不同区域的目标尺度变化较大的问题,一种解决方案是根据目标检测模型对不同区域进行尺度调整。2*2的等分分割如图3-1(a)所示,将该图像分成4个等分区域,实验结果表明,分割后的图像可以大大提高计数的准确率,但随着分割次数的增加,误检率和时间也随之增加。此外,等分分割将导致对象被切碎。为了避免这个问题,采用了等分重叠分割,如图3-1(b)所示。在等分割的基础上,等分重叠分割避免了物体在边界处被切割的问题,提高了人员计数的准确性。在此基础上,提出了自适应重叠分割算法。如图3-2(a)和(b)所示,分割线和参数由实际图片中头部的分布信息决定。该算法首先用分割线将图像分割成四个块,然后遍历每个分割块中的对象个数,继续对人数大于阈值的子块进行分割。最后,将分割块缩放到相同的尺度,即深度学习模型的输入尺寸。该算法虽然实现了多尺度分割,提高了分割精度,但仍然保留了图像中不必要的背景信息,干扰了检测。此外,图像缩放的标准是固定的,即模型的输入大小。因此,对于对象尺度变化较大的问题,上述方法有以下局限性。首先,固定了传统的目标检测算法的输入和图像尺寸,采用了多尺度的滑动窗口,可以支持各种尺度下的目标检测。因此,该研究方法主要依靠训练数据和优化后的高质量的区域提取算法。其次,基于CNN的目标检测算法可以通过改变滑动窗口和输入图像大小等方式来实现多尺度检测。但该方法是通过多次下采样完成的,没有明确的标度标准。另外,大多数目标检测模型可以输入任意大小的图像。然而,由于训练集大小的限制,过大或过小的图像会降低目标检测器的性能,增加额外的消耗。第三,虽然最新的算法缩放不同的区域,但缩放是一个固定的值,由模型的输入大小决定。多尺度锚点与目标的最佳匹配没有实现。因此,针对上述问题,本文提出了一种多尺度区域自适应分割算法。(a)等分分割(b)等分重叠分割图3-1等分分割和等分重叠分割示意图图3-2自适应等分重叠分割1.2.2多尺度区域自适应分割思想不同的物体在图像中具有不同的位置关系,因此可以根据它们之间的距离进行分类,相互接近的物体具有相似的尺度。本文采用K-means算法对FasterRCNN检测结果进行聚类。首先考虑同一类物体具有相似的尺度,然后对不同尺度的区域 进行分割。在扩大不同尺度的区域后,采用FasterRCNN检测模型进行检测。多尺度区域自适应分割算法能有效地分离出远近目标区域,滤除无目标的背景信息。1.3多尺度区域自适应分割算法的设计与实现1.3.1多尺度区域自适应算法的处理本章节主要研究了基于多尺度区域自适应分割和深度神经网络的检测算法的总体过程,主要包括K-means算法、深神经网络检测模型和结果汇总算法。其中,采用K-means算法对检测到的目标进行聚类,分离远、近目标,过滤冗余背景信息。利用深神经网络模型检测图像块中的头部数。如果头部数大于阈值,则图像块将放大。如果子块中的目标数量太小,则子区域的面积较小,容易产生虚假检测。结果采用汇总算法对检测结果进行了汇总。详细流程图如图3-3所示。开始开始结束结束图3-3算法流程图1.3.2多尺度区域自适应分割算法设计本文采用K-means算法对图像中的远近目标进行聚类,并根据聚类结果对图像进行分割,如图3-4(a)、(b)、(c)所示。通过k-means算法,将区域划分为三个块(块数由k值决定),其中包含图片中的头部对象。然后,根据每个聚类块中目标的中心坐标值对其进行分割,并将子块放大到适当的比例进行检测。通过适当增大子块的大小,使对象之间的距离变大,对象的大小与锚点的尺度相匹配。检测结果(b)聚类结果(c)分割图3-4。图(a)显示了FasterRCNN检测结果,图(b)显示了检测结果的聚类。图(c)显示了分割结果。1.4实验与分析1.4.1数据集本章利用Malldataset数据集训练模型,这是一个用于头部检测的数据集。训练集包含1800幅图像,测试集包含100幅图像,验证集包含100幅图像。每个图像的大小为640*480,并且每个图像包含多个标记的头部位置信息。1.4.2模型训练本实验利用rtx2080ti在Malldataset数据集上训练FasterRCNN模型。FasterRCNN模型的训练内容包括锚点尺寸选择、样本参数、损失函数、模型参数初始化、训练参数和模型训练。为了匹配头部的实际大小,我们分别使用了32×32和64×64锚点,训练图像大小为640×480。对于训练集中的每幅图像,利用真值候选区域与两个尺度锚之间的重叠率提取正、负训练样本。如果重叠率大于0.7,则为正样本;如果重叠率小于0.3,则为负样本,丢弃重叠率在0.3到0.7之间的样本。本文采用多任务损失函数,如公式(3-1)所示。是第i个锚点包含对象的概率,是真正的标签。1表示包含头部对象,0表示不包含头部对象。ti是预测坐标的缩放和偏移,是真实坐标。是分类损失(softmax),是回归损失(平滑L1)。最后,使用和进行归一化和参数初始化。通过Imagenet训练,用vgg16模型对共享特征层参数进行初始化。其他网络层参数从零均值高斯分布中随机抽取,标准差为0.01。(3-1)1.4.3评估指标常用的人员计数评价指标主要有:平均绝对误差(MAE)、平均相对误差(MRE)、均方误差(MSE)和平均准确率(MPR)。同时,与基于回归和目标跟踪的方法不同,基于目标检测的统计方法可以同时得到人的数量和位置信息。因此,基于目标检测的统计方法也可以用平均误检率(MFPR)来评价。本文采用平均准确率和平均误检率来评价人流量统计方法的性能。这两个指标的定义如下:(3-2)(3-3)1.4.4实验一本实验对K值进行了研究。对于Malldataset数据集,当K值为3时,检测效果最好。K值的设置取决于对象在数据集中的分布。如图3-5所示,图(a)为FasterRCNN模型的检测结果,图(b)为K均值聚类结果,图(c)为本文算法的检测结果。检测出更多人头对象。检测结果(b)聚类结果(c)分割后检测图3-5。图(a)显示了FasterRCNN的检测结果。图(b)显示了检测结果的聚类。图(c)显示了我们的检测结果。1.4.5实验二该实验中讨论了聚类块的大小。如图3-5(a)所示,可以看出检测框的大小与第1.4.2节中候选框的设置不一致。在第1.4.2节中,当训练深度神经网络模型时,使用32*32和64*64尺度的锚。产生这种现象的原因是候选框的大小是固定的,用于训练深层神经网络模型。为了使候选框更接近真实标签,在训练过程中对候选框进行缩放和平移。下一个需要解决的问题是,聚类后的分割块大小不一致。如何合理缩放,使分段块中的头部尺寸与探测器锚的尺寸匹配。如图3-5(a)所示,可以看到图片中的大多数检测框是32×32锚。64*64锚没有得到充分利用,64与32有明显的比例关系。图像的大小是640*480,因此分割块的放大比例应
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 服务资源评估制度
- 施工电梯料台专项施工方案
- 实施节能降耗目标考核规定
- 钢筋工安全教育试卷及答案 版本三
- 振德防护服授权委托书
- 营口形体培训师测试卷
- 去年高考理科考试题及答案
- 桃红四物汤加减促进痛风术后切口愈合的早期临床观察
- 2026全球气候变化对中国葡萄干主产区种植影响评估报告
- 2026元宇宙金融应用场景与虚拟资产监管
- 医养中心突发事件应急预案
- 2025房屋买卖合同范本(下载)
- 2025年哈尔滨工业大学管理服务岗位招聘考试笔试试题(含答案)
- (2025年标准)山地开路协议书
- 2025年陕西高中学业水平合格性考试化学试卷真题(含答案)
- DB23∕T 3082-2022 黑龙江省城镇道路设计规程
- 江苏棋牌室管理暂行办法
- 聚合工艺作业培训课件
- 酒店安全设施维护规定
- 2024年中国烟草总公司江西省公司考试真题试卷及答案
- 单位见习人员管理制度
评论
0/150
提交评论