基于角度及轮廓特征的步态识别方法深度探究_第1页
基于角度及轮廓特征的步态识别方法深度探究_第2页
基于角度及轮廓特征的步态识别方法深度探究_第3页
基于角度及轮廓特征的步态识别方法深度探究_第4页
基于角度及轮廓特征的步态识别方法深度探究_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于角度及轮廓特征的步态识别方法深度探究一、引言1.1研究背景与意义在现代社会中,安全问题愈发凸显,人们对安全保障的需求也日益增长。无论是公共场所的安全监控,还是个人隐私的保护,都需要高效、准确的身份识别技术作为支撑。生物特征识别技术应运而生,它利用人体固有的生理特征或行为特征来进行身份鉴别,具有唯一性、稳定性和不可复制性等优点,在安防、金融、医疗等多个领域得到了广泛的应用。常见的生物特征识别技术包括指纹识别、人脸识别、虹膜识别等,这些技术在一定程度上满足了人们对身份识别的需求,但也存在着各自的局限性。例如,指纹识别需要物理接触,容易受到污渍、磨损等因素的影响;人脸识别对光线、姿态变化较为敏感,在远距离或低分辨率的情况下识别精度会大幅下降;虹膜识别则要求被识别者保持静止且配合度高,设备成本也相对较高。步态识别作为一种新兴的生物特征识别技术,近年来逐渐崭露头角。它通过分析个体行走时的动态特征,如步长、步频、身体摆动幅度、关节运动轨迹等,来实现身份识别。与其他生物识别技术相比,步态识别具有独特的优势。首先,步态识别具有非接触性和远距离识别的能力。在远距离的情况下,当其他生物特征难以获取时,步态是唯一可感知的生物特征。例如,在监控场景中,即使目标人物距离摄像头较远,或者面部被遮挡,也仍然可以通过分析其步态信息来进行身份识别。这一特性使得步态识别在智能监控、公共安全等领域具有巨大的应用潜力,可以实现对人员的自动识别和追踪,为防范犯罪、维护社会稳定提供有力支持。其次,步态难以伪装。个体的走路方式是长期形成的习惯,受到骨骼结构、肌肉力量、神经系统等多种因素的综合影响,即使刻意改变,也难以完全掩盖其独特的步态特征,这为身份识别的准确性和可靠性提供了保障。再者,步态识别的数据采集相对容易,只需通过普通摄像头即可获取行人的行走视频,无需昂贵的专业设备,降低了应用成本。步态识别技术在多个领域展现出了巨大的应用价值。在安防领域,它可用于公共场所的监控与预警。在机场、火车站、大型商场等人流量密集的场所,部署步态识别系统能够实时监测人员的出入情况,快速识别出潜在的危险人员,如通缉犯、可疑人员等,为安保人员提供及时的预警信息,有效提升公共场所的安全性。同时,步态识别还可与其他安防技术,如人脸识别、视频监控等相结合,形成多模态的安防体系,进一步提高身份识别的准确性和可靠性。在智能家居领域,步态识别技术能够实现更加智能化的家居控制。通过在家中安装摄像头或传感器,采集家庭成员的步态信息,智能家居系统可以自动识别用户身份,根据用户的习惯和偏好来调整家居设备的设置,提供个性化的服务。在医疗领域,步态识别技术为疾病诊断和康复治疗提供了新的手段。许多疾病,如帕金森病、中风、关节炎等,会导致患者步态发生明显变化。通过对患者步态特征的分析,医生可以获取有关疾病的信息,辅助疾病的早期诊断和病情评估。在康复治疗过程中,步态识别技术可用于监测患者的康复进展,评估治疗效果,为康复方案的调整提供数据支持。尽管步态识别技术具有诸多优势和广阔的应用前景,但目前仍面临着一些挑战和问题。例如,步态特征的提取和表达还不够准确和稳定,容易受到个体外观变化(如着装、携带物品等)、拍摄视角、光照条件等因素的影响;步态识别算法的计算复杂度较高,实时性较差,难以满足一些对实时性要求较高的应用场景;不同数据集之间的差异较大,缺乏统一的标准数据集和评估指标,导致不同算法之间的性能比较存在困难。因此,深入研究基于角度及轮廓特征的步态识别方法,对于提高步态识别的准确率和鲁棒性,推动步态识别技术的发展和应用具有重要的意义。通过对角度及轮廓特征的深入分析和挖掘,可以更准确地描述个体的步态特征,提高步态识别系统对各种干扰因素的抵抗能力。同时,研究高效的特征提取和匹配算法,能够降低算法的计算复杂度,提高识别效率,使其更好地满足实际应用的需求。1.2国内外研究现状步态识别技术的研究最早可追溯到20世纪70年代,当时的研究主要聚焦于步态特征的理论探索,尝试从人体运动学和生物力学的角度分析步态特征与个体身份之间的潜在联系。然而,受限于当时的计算机技术和图像处理能力,相关研究进展缓慢,仅停留在初步的理论分析阶段,未能实现实际应用。随着计算机技术的飞速发展和数字图像处理技术的不断进步,步态识别技术在20世纪90年代迎来了重要的发展契机。美国国防部高级研究计划局(DARPA)率先开展了关于步态识别技术的研究项目,旨在开发一种能够在远距离和复杂环境下进行人员身份识别的技术,以满足军事安防领域的需求。此后,英国、日本、以色列等国家也纷纷加入到步态识别技术的研究行列,推动了该技术在理论和算法方面的快速发展。在这一时期,基于轮廓的步态识别方法成为研究的热点,研究者们通过提取行人的轮廓信息来分析步态特征,如步态能量图(GEI)等经典算法被相继提出,为步态识别技术的发展奠定了重要基础。进入21世纪,随着深度学习技术的兴起,步态识别技术迎来了新的突破。深度学习强大的特征学习能力和对复杂数据的处理能力,为步态识别算法的性能提升提供了新的思路和方法。研究人员开始将深度卷积神经网络(CNN)、循环神经网络(RNN)等深度学习模型应用于步态识别领域,通过大量的数据训练,让模型自动学习步态特征,有效提高了识别准确率和鲁棒性。同时,多模态数据融合技术也被引入到步态识别研究中,将步态信息与其他生物特征(如人脸识别、声音识别等)或环境信息进行融合,进一步提升了识别系统的性能。在国内,步态识别技术的研究起步相对较晚,但发展迅速。中国科学院自动化研究所是国内最早开展步态识别技术研究的机构之一,在该领域取得了一系列具有国际影响力的研究成果。其研发的远距离步态识别系统,在复杂背景、多样姿态、不同尺度变化以及不同衣着等情况下,都能够快速准确地分割出人像并进行身份识别,相关技术已在多个实际场景中得到应用,为安防领域提供了强有力的支持。此外,清华大学、北京大学、上海交通大学等高校也在步态识别技术方面开展了深入研究,在特征提取、模型优化、多模态融合等方面取得了显著进展。在基于角度及轮廓特征的研究方面,国内外学者都进行了大量的探索。在角度特征提取方面,研究人员通过对人体关节角度变化的分析,来挖掘个体独特的步态信息。一些研究利用计算机视觉技术和运动捕捉设备,精确测量人体在行走过程中髋关节、膝关节、踝关节等关键关节的角度变化,并将这些角度序列作为步态特征进行识别。实验结果表明,基于角度特征的步态识别方法在一定程度上能够有效区分不同个体,但该方法对设备要求较高,且易受人体遮挡和运动噪声的影响。在轮廓特征提取方面,基于轮廓的步态识别算法取得了丰富的成果。早期的研究主要采用传统的图像处理方法,如背景减除法、阈值分割法等,从行人的背景图像中提取行人的轮廓。随着深度学习技术的发展,基于深度学习的轮廓提取方法逐渐成为主流,如MaskR-CNN、Yolo等算法,能够更加准确地提取行人轮廓,并且对复杂背景和遮挡情况具有更好的鲁棒性。在特征提取阶段,常用的轮廓特征有时域特征、频域特征、时频域特征以及基于深度学习的高级语义特征等。例如,通过对轮廓图像进行傅里叶变换,提取频域特征,或者利用卷积神经网络从轮廓图像中学习具有区分性的语义特征,这些方法都在不同程度上提高了步态识别的准确率。为了进一步提高步态识别的性能,许多研究尝试将角度特征和轮廓特征进行融合。通过将两种特征在特征层、匹配层或决策层进行融合,可以充分发挥它们的互补性,提高识别系统对各种干扰因素的抵抗能力。一些研究在匹配层上融合下肢角度及人体轮廓特征,通过合理赋予权重,使两种步态特征按较优的比例进行组合,实验结果表明,这种融合方法能够显著提高步态识别的准确率。然而,特征融合也面临着一些挑战,如如何选择合适的融合策略、如何确定不同特征的权重等,这些问题仍有待进一步研究解决。1.3研究目标与创新点本研究旨在深入探究基于角度及轮廓特征的步态识别方法,以提升步态识别系统的准确率和稳定性,使其能够更好地适应复杂多变的实际应用场景。具体而言,主要目标包括:精确提取和有效表达角度及轮廓特征,提高特征的稳定性和区分性;研究高效的特征融合算法,充分发挥角度特征和轮廓特征的互补优势,增强识别系统对个体外观变化、拍摄视角、光照条件等干扰因素的抵抗能力;设计并实现一种高性能的步态识别模型,在保证识别准确率的前提下,降低算法的计算复杂度,提高识别效率,满足实时性要求;通过在公开数据集和实际场景中的实验验证,评估所提出方法的性能,并与现有方法进行对比分析,证明其优越性和有效性。在研究过程中,本研究将力求在以下几个方面实现创新:提出新的特征提取方法:针对现有角度特征提取方法对设备要求高、易受遮挡和噪声影响的问题,提出一种基于深度学习的多模态融合角度特征提取方法。该方法将结合视频图像信息和惯性传感器数据,利用深度学习模型自动学习人体关节角度在不同模态下的特征表示,从而更准确地提取角度特征,提高特征的鲁棒性。在轮廓特征提取方面,引入注意力机制和多尺度特征融合技术,提出一种基于注意力多尺度卷积神经网络的轮廓特征提取方法。该方法能够使模型更加关注轮廓图像中的关键区域和细节信息,同时融合不同尺度的特征,增强特征的表达能力,有效提升对复杂背景和遮挡情况下轮廓特征的提取精度。创新特征融合策略:不同于传统的简单加权融合方式,提出一种基于自适应加权和深度学习网络的特征融合策略。该策略将根据不同特征在不同样本和场景下的重要性,动态地调整角度特征和轮廓特征的融合权重。通过构建一个深度学习网络来学习融合权重,使其能够自动适应各种复杂情况,充分发挥两种特征的互补性,提高步态识别的准确率。设计新型步态识别模型:综合考虑角度特征和轮廓特征的特点,设计一种基于双流卷积神经网络和循环神经网络的新型步态识别模型。其中,双流卷积神经网络分别对角度特征和轮廓特征进行处理,提取空间特征;循环神经网络则用于捕捉步态的时间序列特征,充分利用步态的动态信息。通过将两种网络结构有机结合,能够实现对步态特征的全面、深入学习,提高模型的识别性能。此外,在模型训练过程中,采用迁移学习和半监督学习技术,利用少量的标注数据和大量的未标注数据进行训练,有效解决标注数据不足的问题,同时加快模型的收敛速度,提高模型的泛化能力。二、步态识别基础理论2.1步态识别系统架构步态识别系统旨在通过分析个体行走时的动态特征来实现身份识别,其架构主要涵盖数据采集、预处理、特征提取以及分类识别这几个关键环节。每个环节都紧密相连,前一个环节的输出是后一个环节的输入,任何一个环节出现问题都可能影响整个系统的性能。2.1.1数据采集数据采集是步态识别系统的首要环节,其质量直接影响后续处理和分析的准确性。常见的数据采集设备包括摄像头和传感器,它们各自具有独特的特点和适用场景。摄像头是最常用的步态数据采集设备之一,其优势在于能够直观地记录行人的行走过程,获取包含丰富视觉信息的视频数据。根据不同的功能和应用场景,摄像头可分为普通摄像头、高清摄像头、红外摄像头等。普通摄像头成本较低,安装简便,适用于对图像质量要求不高的一般性监控场景,如小区、学校等场所的安防监控,可初步采集行人的步态信息。高清摄像头则能够提供更高分辨率的图像,捕捉到更细微的细节,对于准确提取步态特征至关重要,常用于对识别精度要求较高的场合,如机场、银行等重要区域的安全监控。红外摄像头则具有独特的优势,它可以在低光照或夜间环境下正常工作,通过感应物体发出的红外线来捕捉图像,不受光线条件的限制,适用于24小时不间断监控的场景,如边境监控、停车场监控等。在实际应用中,多摄像头系统还可通过不同角度的拍摄,获取行人更全面的步态信息,提高识别的准确性。例如,在智能安防监控系统中,可在不同位置安装多个摄像头,从多个角度对行人进行拍摄,然后将这些视频数据进行融合处理,从而更准确地分析行人的步态特征。传感器也是常用的步态数据采集设备,主要包括加速度传感器、陀螺仪、惯性测量单元(IMU)等。加速度传感器能够测量物体在各个方向上的加速度变化,在步态识别中,可通过佩戴在人体上的加速度传感器来采集行走时身体各部位的加速度信息,从而分析出步长、步频等步态特征。陀螺仪则用于测量物体的角速度,可获取人体在行走过程中的旋转信息,为步态分析提供更多维度的数据支持。惯性测量单元则集成了加速度传感器和陀螺仪等多种传感器,能够同时测量加速度、角速度和磁场等多个物理量,提供更全面的运动数据,常用于可穿戴设备中,如智能手环、智能鞋垫等。这些可穿戴设备可以方便地佩戴在人体的关键部位,如脚踝、腰部、手腕等,实时采集步态数据,且不受环境光线和遮挡的影响,适用于室内外各种场景,如运动监测、康复训练等领域。例如,在医疗康复领域,患者在进行康复训练时,可以佩戴装有传感器的智能设备,医生通过分析这些设备采集到的步态数据,了解患者的康复进展,调整康复方案。不同的数据采集设备在采集步态数据时也面临着各自的挑战。摄像头采集的视频数据容易受到光照条件、拍摄角度、遮挡等因素的影响。在光照不足的情况下,图像会变得模糊,细节丢失,导致步态特征难以准确提取;拍摄角度的变化会使行人的步态呈现出不同的形态,增加了特征提取和识别的难度;当行人被其他物体遮挡时,部分步态信息会缺失,影响识别效果。传感器虽然能够获取较为准确的运动数据,但传感器的佩戴位置和方式对数据质量有较大影响,如果佩戴不牢固或位置不准确,采集到的数据可能会出现偏差,从而影响步态分析的准确性。此外,传感器的精度和稳定性也需要进一步提高,以满足高精度步态识别的需求。2.1.2预处理预处理是对采集到的原始数据进行初步处理,以提高数据质量,为后续的特征提取和分析提供可靠的数据基础。常见的预处理操作包括降噪、归一化等,这些操作对于去除数据中的噪声干扰、使数据具有统一的尺度和分布具有重要意义,进而显著影响后续特征提取的效果。噪声是数据采集过程中不可避免的问题,它会干扰步态特征的提取,降低识别准确率。常见的噪声来源包括环境噪声、设备噪声等。降噪的目的就是去除这些噪声,使数据更加清晰、准确。常用的降噪方法有均值滤波、中值滤波、高斯滤波等。均值滤波是一种简单的线性滤波方法,它通过计算邻域内像素的平均值来替换当前像素的值,从而达到平滑图像、去除噪声的目的。例如,对于一个3x3的均值滤波器,它会将中心像素周围8个像素的灰度值与中心像素的灰度值相加,然后除以9,得到的结果作为中心像素的新灰度值。中值滤波则是一种非线性滤波方法,它将邻域内的像素值按照大小进行排序,然后取中间值作为当前像素的值,这种方法对于去除椒盐噪声等脉冲噪声效果较好。高斯滤波是一种基于高斯函数的线性平滑滤波方法,它根据像素点与中心像素点的距离,赋予不同的权重,距离越近权重越大,通过对邻域内像素进行加权平均来实现滤波,能够有效地保留图像的边缘信息,在图像降噪中应用广泛。在实际应用中,需要根据噪声的特点和数据的特性选择合适的降噪方法。例如,对于图像数据中存在的高斯噪声,高斯滤波通常能够取得较好的降噪效果;而对于椒盐噪声,中值滤波可能更为有效。归一化是将数据映射到一个特定的范围,使其具有统一的尺度和分布,便于后续的处理和分析。在步态识别中,常用的归一化方法有最小-最大归一化、Z-分数归一化等。最小-最大归一化是将数据映射到[0,1]区间,其计算公式为:x_{norm}=\frac{x-x_{min}}{x_{max}-x_{min}},其中x为原始数据,x_{min}和x_{max}分别为数据的最小值和最大值,x_{norm}为归一化后的数据。这种方法简单直观,能够保持数据的相对大小关系,但对异常值比较敏感。Z-分数归一化则是将数据映射到均值为0、标准差为1的标准正态分布,其计算公式为:z=\frac{x-\mu}{\sigma},其中\mu为数据的均值,\sigma为数据的标准差。这种方法能够消除数据的量纲影响,对异常值具有一定的鲁棒性。在特征提取阶段,归一化后的数据能够使不同特征具有相同的重要性,避免某些特征因为数值较大而对模型训练产生过大的影响,从而提高模型的性能和稳定性。例如,在使用支持向量机(SVM)进行步态识别时,如果特征数据没有进行归一化,那么数值较大的特征可能会主导分类结果,而数值较小的特征则可能被忽略,通过归一化可以使所有特征在分类过程中都能发挥应有的作用。如果预处理操作不当,可能会导致数据信息的丢失或失真,从而影响后续特征提取的准确性。过度降噪可能会平滑掉一些重要的步态细节特征,使提取到的特征无法准确反映个体的真实步态;归一化参数选择不合理,可能会使数据分布发生改变,导致特征之间的相关性被破坏,影响识别效果。因此,在进行预处理时,需要根据数据的特点和后续处理的要求,谨慎选择预处理方法和参数,确保数据的质量和信息的完整性。2.1.3特征提取特征提取是步态识别系统的核心环节之一,其目的是从预处理后的数据中提取出能够有效表征个体步态特征的信息。在基于角度及轮廓特征的步态识别方法中,角度特征和轮廓特征的提取各有其独特的原理和常用技术,不同技术在准确性、鲁棒性等方面存在差异。角度特征提取主要关注人体关节在行走过程中的角度变化,这些角度变化蕴含着丰富的个体身份信息。其基本原理是基于人体运动学和生物力学知识,通过分析人体关节的运动轨迹来计算关节角度。常用的技术包括基于计算机视觉的方法和基于传感器的方法。基于计算机视觉的方法利用摄像头拍摄的视频图像,通过目标检测、关节点定位等技术来获取人体关节的位置信息,进而计算关节角度。例如,采用基于深度学习的人体姿态估计算法,如OpenPose等,能够准确地识别出人体的各个关节点,并计算出关节之间的角度。这种方法的优点是能够直观地从视觉图像中获取角度信息,无需额外的传感器设备,但对图像质量和拍摄角度要求较高,容易受到遮挡和噪声的影响。基于传感器的方法则通过佩戴在人体关节部位的传感器,如惯性测量单元(IMU),直接测量关节的角度变化。这种方法的优点是测量精度高,不受光照和遮挡的影响,但传感器的佩戴可能会给用户带来不便,且数据传输和处理需要一定的硬件支持。不同的角度特征提取技术在准确性和鲁棒性方面存在差异。基于计算机视觉的方法在图像质量较好、拍摄角度合适的情况下,能够准确地提取角度特征,但当图像出现模糊、遮挡或视角变化较大时,其准确性会受到明显影响;基于传感器的方法虽然精度较高,但由于传感器的漂移和误差等问题,长期使用时可能会出现累积误差,影响鲁棒性。轮廓特征提取则侧重于从行人的轮廓图像中提取能够表征步态的特征信息。其基本原理是通过对行人轮廓的形状、大小、运动轨迹等进行分析,提取出具有区分性的特征。常用的技术包括基于传统图像处理的方法和基于深度学习的方法。基于传统图像处理的方法主要利用边缘检测、形态学处理等技术来提取轮廓,然后通过傅里叶描述子、Hu矩等方法对轮廓进行特征描述。例如,使用Canny边缘检测算法提取行人轮廓的边缘,再利用傅里叶描述子将轮廓的形状信息转化为频域特征,这些特征能够反映轮廓的形状和变化规律。基于深度学习的方法则通过构建卷积神经网络(CNN)等模型,让模型自动学习轮廓图像中的特征表示。例如,采用MaskR-CNN模型可以准确地分割出行人的轮廓,并通过后续的卷积层和全连接层提取出高级语义特征。基于传统图像处理的方法原理简单,计算效率较高,但对复杂背景和遮挡情况的适应性较差,提取的特征往往缺乏足够的区分性;基于深度学习的方法能够自动学习到更具代表性的特征,对复杂背景和遮挡具有较好的鲁棒性,但模型训练需要大量的数据和计算资源,且模型的可解释性相对较差。2.1.4分类识别分类识别是步态识别系统的最后一个环节,其任务是根据提取到的步态特征,将待识别的个体与已有的样本进行匹配,从而判断其身份。常用的分类识别算法包括最近邻分类器、支持向量机(SVM)等,它们在步态识别中有着不同的应用方式和效果。最近邻分类器是一种简单直观的分类算法,其基本思想是在特征空间中找到与待识别样本距离最近的已知样本,将待识别样本归类为该最近样本所属的类别。在步态识别中,通常使用欧氏距离、马氏距离等作为距离度量方式。例如,对于两个步态特征向量X=(x_1,x_2,\cdots,x_n)和Y=(y_1,y_2,\cdots,y_n),它们的欧氏距离计算公式为:d(X,Y)=\sqrt{\sum_{i=1}^{n}(x_i-y_i)^2}。在实际应用中,首先计算待识别样本与训练集中所有样本的距离,然后选择距离最小的样本的类别作为待识别样本的类别。最近邻分类器的优点是算法简单,易于实现,不需要进行复杂的模型训练;但其缺点也很明显,计算量较大,当训练样本数量较多时,计算距离的时间开销会很大,而且对样本的分布比较敏感,如果训练样本分布不均匀,容易出现分类错误。支持向量机(SVM)是一种基于统计学习理论的分类算法,它通过寻找一个最优分类超平面,将不同类别的样本尽可能地分开。在步态识别中,SVM通常用于二分类问题,如果要处理多分类问题,可以采用“一对多”或“一对一”等策略将其转化为多个二分类问题。SVM的核心思想是将低维的输入空间通过核函数映射到高维的特征空间,使得在低维空间中线性不可分的样本在高维特征空间中变得线性可分。常用的核函数有线性核、多项式核、径向基核(RBF)等。例如,对于一个二分类问题,假设训练样本集为\{(x_i,y_i)\}_{i=1}^{n},其中x_i为特征向量,y_i\in\{-1,1\}为类别标签,SVM的目标是找到一个超平面w^Tx+b=0,使得两类样本到超平面的间隔最大。通过求解优化问题,可以得到超平面的参数w和b,从而实现对新样本的分类。SVM在步态识别中具有较好的性能,能够处理非线性分类问题,对小样本数据也有较好的泛化能力;但它对核函数的选择和参数调整比较敏感,需要通过大量的实验来确定最优的参数组合。2.2角度及轮廓特征相关原理2.2.1角度特征原理在人体行走过程中,各个关节的角度变化呈现出特定的规律,这些规律蕴含着丰富的个体身份信息。从运动学角度来看,行走是一个复杂的周期性运动,涉及多个关节的协同运动。以髋关节为例,在一个完整的步态周期中,髋关节的角度变化经历了多个阶段。在摆动初期,髋关节屈曲,角度逐渐增大,使腿部向前摆动;在摆动中期,髋关节继续保持一定的屈曲角度,以维持腿部的运动速度和稳定性;在摆动末期,髋关节开始伸展,角度逐渐减小,为落地做准备。在支撑期,髋关节承受着身体的重量,角度会根据身体的平衡和运动需求进行相应的调整。同样,膝关节和踝关节在行走过程中也有着类似的周期性角度变化。膝关节在摆动期先屈曲再伸展,踝关节则在背屈和跖屈之间交替变化。这些关节角度的变化相互协调,共同完成行走动作,并且每个人的关节角度变化模式都具有独特性,受到骨骼结构、肌肉力量、神经系统控制等多种因素的影响。基于上述原理,我们可以通过提取这些关节角度变化特征来实现个体身份的区分。在实际操作中,首先需要确定用于分析的关键关节,如髋关节、膝关节、踝关节等,这些关节在行走过程中角度变化明显,对步态特征的贡献较大。然后,利用合适的技术手段获取这些关节在行走过程中的角度数据。基于计算机视觉的方法,通过摄像头拍摄行人的行走视频,利用人体姿态估计算法,如OpenPose算法,能够准确地识别出人体的关节点位置,进而根据关节点之间的相对位置关系计算出关节角度。基于传感器的方法,则是通过在人体关节部位佩戴惯性测量单元(IMU)等传感器,直接测量关节的角度变化。获取关节角度数据后,将其表示为时间序列,例如,以一定的时间间隔(如0.01秒)记录每个关节在每个时刻的角度值,形成一个时间-角度序列。这个序列能够直观地反映出关节角度随时间的变化情况,包含了丰富的步态信息。为了进一步提高特征的区分性,可以对时间序列进行一些处理,如计算角度变化率、角度加速度等衍生特征。角度变化率能够反映关节角度变化的快慢,而角度加速度则能体现角度变化的加速度情况,这些衍生特征可以从不同角度描述步态特征,增强特征的表达能力。2.2.2轮廓特征原理从图像中提取人体轮廓是基于轮廓特征的步态识别的基础。常见的人体轮廓提取方法主要包括基于传统图像处理的方法和基于深度学习的方法。基于传统图像处理的方法,通常首先利用背景减除法从视频图像中分离出前景的人体目标。背景减除法的原理是通过建立背景模型,将当前帧图像与背景模型进行差分运算,从而得到前景运动目标。常用的背景建模方法有高斯混合模型(GMM),它通过多个高斯分布的加权和来拟合背景像素的分布,能够较好地适应背景的动态变化。在得到前景人体目标后,利用边缘检测算法,如Canny边缘检测算法,提取人体的边缘信息。Canny边缘检测算法通过计算图像的梯度幅值和方向,采用非极大值抑制和双阈值检测等步骤,能够准确地检测出图像中的边缘。接着,通过形态学处理,如膨胀、腐蚀等操作,对边缘图像进行优化,填补边缘的空洞,去除噪声干扰,得到更完整、准确的人体轮廓。膨胀操作可以使边缘向外扩张,填补小的空洞;腐蚀操作则可以去除边缘的噪声点,使边缘更加平滑。随着深度学习技术的发展,基于深度学习的人体轮廓提取方法逐渐成为主流。其中,MaskR-CNN是一种非常有效的实例分割算法,它在FasterR-CNN的基础上增加了一个分支,用于预测目标的掩模(mask),从而能够准确地分割出人体轮廓。MaskR-CNN首先通过卷积神经网络(CNN)对输入图像进行特征提取,然后利用区域提议网络(RPN)生成可能包含人体目标的候选区域。接着,对这些候选区域进行分类和回归,同时预测出每个候选区域内人体的掩模。在特征提取阶段,CNN可以学习到图像中丰富的语义信息,使得提取的人体轮廓更加准确,对复杂背景和遮挡情况具有更好的鲁棒性。提取到人体轮廓后,可利用轮廓的形状、大小、变化等特征进行身份识别。从形状特征来看,人体轮廓的形状在行走过程中会发生周期性的变化,不同个体的这种变化模式具有一定的差异性。可以通过计算轮廓的周长、面积、长宽比等几何参数来描述轮廓的形状特征。在一个步态周期内,人体轮廓的周长和面积会随着腿部的摆动、身体的起伏而发生变化,通过分析这些参数的变化规律,可以提取出具有区分性的特征。轮廓的变化特征也是重要的识别依据。在行走过程中,人体轮廓的动态变化反映了个体的行走习惯和方式。可以通过分析轮廓的时间序列变化,如轮廓的位移、旋转、变形等,来提取动态特征。通过计算相邻帧之间轮廓的位移向量,能够反映出人体在行走过程中的移动方向和速度变化;分析轮廓的旋转角度变化,可以了解人体在行走时身体的扭转情况。三、基于角度特征的步态识别方法3.1角度特征提取方法3.1.1基于关节点定位的角度提取在人体行走过程中,关节角度的变化蕴含着丰富的个体身份信息,基于关节点定位的角度提取方法是实现步态识别的关键步骤之一。该方法以人体解剖学知识为依据,通过特定算法定位关节点,进而计算关节角度。人体解剖学知识为关节点定位提供了重要的理论基础。人体的骨骼结构和关节连接方式决定了关节点的位置和运动范围。在下肢,髋关节是连接躯干和下肢的重要关节,它由髋臼和股骨头组成,能够进行屈伸、内收外展、旋转等多种运动;膝关节则是人体最大、最复杂的关节之一,由股骨、胫骨和髌骨组成,主要进行屈伸运动,在行走过程中起着承上启下的作用;踝关节由胫骨、腓骨和距骨组成,负责足的背屈、跖屈以及内翻、外翻等运动。这些关节在行走过程中的协同运动,形成了独特的步态模式。利用图像特征匹配技术定位关节点是一种常用的方法。该方法首先需要建立关节点的模板库,模板库中的模板可以通过对大量人体样本的关节点进行标注和统计得到。在实际应用中,对于输入的行人图像,通过计算图像中的特征与模板库中关节点模板的相似度,来确定关节点的位置。例如,使用尺度不变特征变换(SIFT)算法提取图像中的特征点,SIFT特征具有尺度不变性、旋转不变性和光照不变性等优点,能够在不同尺度、旋转和光照条件下准确地描述图像特征。将提取到的特征点与关节点模板进行匹配,通过匹配的特征点来定位关节点的位置。这种方法在图像质量较好、背景相对简单的情况下,能够取得较好的定位效果,但对于复杂背景和遮挡情况,匹配的准确性会受到影响。随着深度学习技术的发展,基于深度学习的关节点定位方法逐渐成为主流。以OpenPose算法为例,它是一种基于卷积神经网络(CNN)的人体姿态估计模型。该模型首先通过一系列卷积层对输入图像进行特征提取,得到图像的特征表示。这些卷积层能够自动学习图像中的各种特征,包括人体的轮廓、纹理等信息。接着,利用部分亲和场(PAFs)来表示人体关节之间的连接关系。PAFs是一种二维向量场,通过对图像特征的分析,能够准确地描述人体各个关节之间的相对位置和方向关系。在训练过程中,OpenPose模型通过大量的标注数据进行学习,不断调整模型的参数,使得模型能够准确地预测人体关节点的位置。在测试阶段,将待检测的行人图像输入到训练好的OpenPose模型中,模型即可输出人体关节点的坐标。这种基于深度学习的方法对复杂背景和遮挡情况具有较好的鲁棒性,能够在各种场景下准确地定位关节点。在确定关节点位置后,即可计算关节角度。以髋关节、膝关节和踝关节为例,假设已经通过上述方法获取了这三个关节在某一时刻的坐标分别为H(x_{H},y_{H})、K(x_{K},y_{K})和A(x_{A},y_{A})。则可以利用向量运算来计算关节角度,首先计算向量\overrightarrow{HK}=(x_{K}-x_{H},y_{K}-y_{H})和\overrightarrow{KA}=(x_{A}-x_{K},y_{A}-y_{K}),然后根据向量的点积公式\overrightarrow{a}\cdot\overrightarrow{b}=|\overrightarrow{a}|\times|\overrightarrow{b}|\times\cos\theta,其中\theta为两向量的夹角,可得到膝关节角度\theta_{K}的计算公式为\cos\theta_{K}=\frac{\overrightarrow{HK}\cdot\overrightarrow{KA}}{|\overrightarrow{HK}|\times|\overrightarrow{KA}|},进而通过反余弦函数\theta_{K}=\arccos(\frac{\overrightarrow{HK}\cdot\overrightarrow{KA}}{|\overrightarrow{HK}|\times|\overrightarrow{KA}|})计算出膝关节角度。同理,可以计算出髋关节角度\theta_{H}和踝关节角度\theta_{A}。通过对这些关节角度在时间序列上的变化进行分析,可以提取出丰富的步态特征,为后续的步态识别提供数据支持。3.1.2基于运动轨迹分析的角度提取人体运动轨迹分析是步态识别领域中的重要研究方向,通过对人体在行走过程中各部位的运动轨迹进行深入剖析,可以获取到蕴含个体独特信息的角度特征。在行走过程中,腿部和手臂的运动轨迹呈现出特定的模式,这些模式与个体的身体结构、运动习惯等因素密切相关,因此可以作为身份识别的重要依据。在分析腿部运动轨迹时,通常会关注其在水平和垂直方向上的位移变化。以腿部的摆动为例,在一个完整的步态周期中,腿部从后向前摆动,再从前往后摆动回到初始位置。在水平方向上,腿部的位移随着时间的变化呈现出一定的周期性。可以通过对连续视频帧中腿部关键点(如膝关节、踝关节等)的位置进行跟踪,获取这些关键点在水平方向上的坐标序列。通过对这些坐标序列进行分析,计算相邻帧之间的位移差,从而得到腿部在水平方向上的运动速度。在垂直方向上,腿部的高度也会随着行走而发生变化,在摆动阶段,腿部会抬高,然后在落地阶段下降。通过分析垂直方向上的位移变化,可以得到腿部在垂直方向上的运动幅度和速度变化情况。这些水平和垂直方向上的位移变化信息,能够反映出个体行走时腿部的运动模式,不同个体之间的这些模式往往存在差异。在获取腿部运动轨迹信息后,即可从中提取相关角度特征。一种常用的方法是计算腿部在不同时刻与垂直方向或水平方向的夹角。假设在某一时刻,通过跟踪得到膝关节的位置坐标为(x_{k},y_{k}),踝关节的位置坐标为(x_{a},y_{a}),以垂直方向为基准,计算腿部与垂直方向的夹角\theta。首先计算向量\overrightarrow{ka}=(x_{a}-x_{k},y_{a}-y_{k}),然后根据向量与垂直方向的夹角公式\tan\theta=\frac{x_{a}-x_{k}}{y_{a}-y_{k}},得到\theta=\arctan(\frac{x_{a}-x_{k}}{y_{a}-y_{k}})。通过计算不同时刻的夹角\theta,可以得到一个角度随时间变化的序列,这个序列包含了腿部运动的角度信息,不同个体的这个序列具有独特性,可作为步态识别的角度特征。除了计算与垂直方向的夹角,还可以计算腿部在摆动过程中的弯曲角度,如膝关节的弯曲角度。通过计算膝关节在不同时刻的角度变化,能够反映出个体行走时腿部的弯曲程度和变化规律,进一步丰富了角度特征信息。手臂在行走过程中也会有规律地摆动,其运动轨迹同样蕴含着个体的步态信息。手臂的摆动与腿部的运动相互协调,共同维持身体的平衡和行走的稳定性。手臂的摆动幅度、频率以及摆动的轨迹形状等,都因人而异。在分析手臂运动轨迹时,可以选择手臂上的关键部位,如肩部、肘部和手腕作为跟踪点。通过对这些跟踪点在视频帧中的位置进行跟踪,获取它们在三维空间中的运动轨迹。在实际应用中,可以使用基于计算机视觉的目标跟踪算法,如卡尔曼滤波算法、粒子滤波算法等,对这些关键点进行实时跟踪。卡尔曼滤波算法是一种常用的线性滤波算法,它通过预测和更新两个步骤,能够根据前一时刻的状态和当前的观测数据,对目标的位置、速度等状态进行最优估计,在手臂关键点跟踪中能够有效地减少噪声的影响,提高跟踪的准确性。粒子滤波算法则是一种基于蒙特卡罗方法的非线性滤波算法,它通过大量的粒子来表示目标的状态分布,能够处理复杂的非线性和非高斯问题,在手臂运动轨迹分析中,对于手臂姿态变化较大的情况具有较好的适应性。通过对这些跟踪点的运动轨迹进行分析,可以提取出手臂的摆动角度等特征。以肩部和肘部为例,假设在某一时刻,肩部的坐标为(x_{s},y_{s},z_{s}),肘部的坐标为(x_{e},y_{e},z_{e}),计算手臂与身体中轴线的夹角\alpha。首先构建向量\overrightarrow{se}=(x_{e}-x_{s},y_{e}-y_{s},z_{e}-z_{s}),然后根据向量与身体中轴线的夹角计算公式,通过向量运算得到夹角\alpha的值。通过分析不同时刻手臂的摆动角度变化,可以得到手臂摆动的角度特征序列,这些特征序列反映了个体行走时手臂的运动习惯和特点,对于步态识别具有重要的参考价值。例如,有些人在行走时手臂摆动幅度较大,而有些人则摆动幅度较小,通过分析手臂摆动角度特征,可以有效地识别出这些个体差异。3.2基于角度特征的识别算法3.2.1动态时间规整(DTW)算法在角度特征中的应用动态时间规整(DTW)算法是一种用于计算两个时间序列相似度的经典算法,在步态识别中,尤其是基于角度特征的识别中,具有重要的应用价值。其核心思想是通过动态规划的方法,寻找两条长度可能不同的时间序列之间的最优匹配路径,从而计算它们的相似度。在基于角度特征的步态识别中,我们通常将人体关节的角度变化表示为时间序列。假设有两个不同个体的步态序列,分别记为序列A和序列B,序列A的角度特征序列为a_1,a_2,\cdots,a_m,序列B的角度特征序列为b_1,b_2,\cdots,b_n,其中m和n分别为两个序列的长度,且m不一定等于n。由于不同个体的行走速度、节奏等可能存在差异,直接对这两个序列进行逐点比较是不合理的。DTW算法的优势就在于它能够解决这种时间序列长度不一致的问题,通过动态规划的方式,在不同长度的时间序列之间找到最佳的匹配关系。DTW算法的实现过程主要包括以下几个步骤。首先,构建一个m\timesn的距离矩阵D,矩阵中的每个元素D(i,j)表示序列A中第i个角度值a_i与序列B中第j个角度值b_j之间的距离,通常可以使用欧氏距离来计算,即D(i,j)=\sqrt{(a_i-b_j)^2}。接着,利用动态规划的方法计算累积距离矩阵C。C(i,j)表示从序列A的起始点到第i个点,以及从序列B的起始点到第j个点之间的最优匹配路径的累积距离。其递推公式为:C(i,j)=D(i,j)+\min\{C(i-1,j),C(i,j-1),C(i-1,j-1)\},其中C(1,1)=D(1,1),C(i,0)=\infty,C(0,j)=\infty。通过这个递推公式,从矩阵的左上角开始,逐步计算每个元素的值,直到计算出右下角的C(m,n)。最后,从累积距离矩阵C的右下角开始,通过回溯的方式找到最优匹配路径。回溯的规则是根据C(i,j)的最小值来源来确定,例如,如果C(i,j)的最小值是由C(i-1,j)得到的,那么回溯到(i-1,j);如果是由C(i,j-1)得到的,回溯到(i,j-1);如果是由C(i-1,j-1)得到的,回溯到(i-1,j-1)。沿着回溯的路径,可以得到两个序列之间的最优匹配关系,而C(m,n)的值则表示这两个序列的相似度,值越小,说明两个序列越相似。在实际应用中,DTW算法在基于角度特征的步态识别中展现出了一定的优势。它能够有效地处理不同个体行走速度和节奏差异导致的时间序列长度不一致问题,通过动态规划找到最优匹配路径,使得即使两个步态序列的长度不同,也能准确地计算它们之间的相似度。在某些情况下,一个人可能走得快一些,另一个人走得慢一些,但他们的步态特征本质上是相似的,DTW算法能够忽略速度差异,准确地匹配他们的角度特征序列,从而实现准确的身份识别。DTW算法的计算过程相对简单,不需要复杂的数学模型和大量的训练数据,易于实现和应用。然而,DTW算法也存在一些局限性。该算法对噪声较为敏感,如果角度特征序列中存在噪声干扰,例如由于传感器误差或图像噪声导致的角度测量偏差,DTW算法可能会将噪声点误判为有效特征点,从而影响匹配结果的准确性。DTW算法的计算复杂度较高,其时间复杂度为O(m\timesn),当序列长度m和n较大时,计算量会显著增加,导致识别效率降低,难以满足实时性要求较高的应用场景。DTW算法在处理复杂步态模式时,可能无法准确捕捉到一些细微的特征差异,因为它主要关注的是整体的时间序列匹配,对于局部的特征变化不够敏感,这在一定程度上限制了其在复杂场景下的应用效果。3.2.2机器学习算法结合角度特征的识别机器学习算法在步态识别领域得到了广泛应用,通过将角度特征作为输入,结合不同的机器学习算法进行模型训练和分类识别,可以实现高效准确的身份识别。以下将以支持向量机(SVM)和神经网络为例,详细介绍其在基于角度特征的步态识别中的应用及性能表现。支持向量机(SVM)是一种基于统计学习理论的分类算法,在步态识别中具有独特的优势。其基本原理是通过寻找一个最优分类超平面,将不同类别的样本尽可能地分开。在基于角度特征的步态识别中,首先将提取到的角度特征作为SVM的输入特征向量。假设我们有N个训练样本,每个样本的角度特征向量可以表示为x_i=(x_{i1},x_{i2},\cdots,x_{id}),其中i=1,2,\cdots,N,d为特征向量的维度,即角度特征的数量。每个样本都对应一个类别标签y_i\in\{-1,1\},表示该样本所属的类别(例如,-1表示非目标个体,1表示目标个体)。SVM的目标是找到一个超平面w^Tx+b=0,使得两类样本到超平面的间隔最大。这里的w是超平面的法向量,b是偏置项。为了找到最优的w和b,SVM通过求解一个二次规划问题来实现,即最大化间隔\frac{2}{\|w\|},同时满足约束条件y_i(w^Tx_i+b)\geq1,i=1,2,\cdots,N。在实际应用中,由于步态特征往往是非线性可分的,因此通常会引入核函数,将低维的输入空间映射到高维的特征空间,使得在低维空间中线性不可分的样本在高维特征空间中变得线性可分。常用的核函数有线性核、多项式核、径向基核(RBF)等。线性核函数直接计算两个特征向量的内积,即K(x_i,x_j)=x_i^Tx_j,适用于特征向量本身线性可分的情况;多项式核函数K(x_i,x_j)=(x_i^Tx_j+1)^p,其中p为多项式的次数,能够处理一定程度的非线性问题;径向基核函数K(x_i,x_j)=\exp(-\gamma\|x_i-x_j\|^2),其中\gamma为核函数的参数,对非线性问题具有很强的处理能力,在步态识别中应用较为广泛。通过选择合适的核函数和调整参数,SVM能够有效地对基于角度特征的步态样本进行分类识别。神经网络是一类模拟生物神经网络结构和功能的计算模型,在步态识别中也展现出了强大的性能。以多层感知机(MLP)为例,它是一种最简单的前馈神经网络,由输入层、隐藏层和输出层组成。在基于角度特征的步态识别中,输入层接收提取到的角度特征向量,隐藏层通过一系列神经元对输入特征进行非线性变换,学习特征之间的复杂关系,输出层则根据隐藏层的输出进行分类决策,输出识别结果。在训练过程中,通过大量的训练样本对神经网络进行训练,利用反向传播算法不断调整神经元之间的连接权重,使得网络的输出与真实标签之间的误差最小化。随着深度学习技术的发展,卷积神经网络(CNN)和循环神经网络(RNN)等更复杂的神经网络结构也被广泛应用于步态识别。CNN能够自动提取图像或序列数据中的局部特征,通过卷积层、池化层和全连接层等组件,对角度特征进行深层次的学习和抽象,从而提高识别准确率。在处理角度特征序列时,可以将角度序列看作是一种时间序列数据,利用CNN的卷积操作对时间序列进行特征提取,捕捉角度变化的局部模式。RNN则特别适合处理具有时间序列特性的数据,如步态角度特征序列。它通过引入循环连接,使得神经元能够记住之前的状态信息,从而更好地捕捉时间序列中的长期依赖关系。长短期记忆网络(LSTM)是RNN的一种变体,它通过引入门控机制,有效地解决了RNN在处理长序列时的梯度消失和梯度爆炸问题,能够更好地学习和记忆步态角度特征序列中的长期依赖信息。不同机器学习算法在基于角度特征的步态识别中性能表现各有优劣。SVM在小样本情况下具有较好的泛化能力,对特征空间的划分较为准确,能够有效地处理非线性分类问题,但它对核函数的选择和参数调整比较敏感,需要通过大量的实验来确定最优的参数组合。神经网络具有强大的学习能力和对复杂模式的识别能力,能够自动学习到高度抽象的特征表示,在大规模数据集上表现出色,但它的训练过程需要大量的计算资源和时间,模型的可解释性相对较差。在实际应用中,需要根据具体的需求和数据特点,选择合适的机器学习算法,并对其进行优化和改进,以提高基于角度特征的步态识别性能。3.3案例分析3.3.1实验数据集介绍为了全面评估基于角度特征的步态识别方法的性能,本研究选用了公开的CASIA-B步态数据集。该数据集由中国科学院自动化研究所采集并公开,是目前步态识别领域应用最为广泛的数据集之一,具有较高的权威性和代表性。CASIA-B数据集包含了124个不同个体的步态数据,每个个体在11个不同的视角下进行了采集,视角范围从0度到180度,涵盖了正面、侧面和背面等多个角度,能够充分模拟实际应用中可能出现的不同拍摄视角情况。数据采集环境为室内,光线条件相对稳定,背景较为简单,减少了环境因素对步态数据的干扰。在数据采集过程中,每个个体进行了三种不同条件下的行走,分别为正常行走、背着包行走和穿着大衣行走,这三种条件模拟了个体外观变化的情况,如携带物品和穿着不同衣物等,有助于研究基于角度特征的步态识别方法在面对这些干扰因素时的性能表现。对于每个个体在每个视角和每种行走条件下,都采集了多段行走视频,每段视频包含了多个步态周期。视频分辨率为320×240像素,帧率为25帧/秒,能够清晰地记录行人的行走过程。数据集中的视频经过了初步的预处理,包括背景减除、人体轮廓提取等,得到了较为纯净的人体轮廓序列,为后续的角度特征提取和分析提供了良好的数据基础。CASIA-B数据集的规模较大,包含了丰富的个体信息和多样的行走条件,能够为基于角度特征的步态识别方法提供全面的测试和验证。通过在该数据集上进行实验,可以准确地评估所提出方法在不同视角、不同个体外观变化等复杂情况下的识别性能,为方法的改进和优化提供有力的依据。同时,由于该数据集的广泛应用,使用该数据集进行实验也便于与其他已有的步态识别方法进行对比分析,从而更好地展示本研究方法的优势和不足。3.3.2实验设置与结果分析在实验中,首先对CASIA-B数据集中的视频进行角度特征提取。对于基于关节点定位的角度提取方法,采用OpenPose算法定位人体关节点,设置其置信度阈值为0.5,以确保关节点定位的准确性。在计算关节角度时,根据人体解剖学知识和向量运算原理,准确计算髋关节、膝关节和踝关节等关键关节在每个视频帧中的角度。对于基于运动轨迹分析的角度提取方法,利用卡尔曼滤波算法对腿部和手臂的关键点进行跟踪,设置卡尔曼滤波的过程噪声协方差矩阵和观测噪声协方差矩阵,以优化跟踪效果。在提取角度特征时,计算腿部与垂直方向或水平方向的夹角,以及手臂与身体中轴线的夹角等,每个角度特征均以时间序列的形式表示。在识别算法方面,采用动态时间规整(DTW)算法结合支持向量机(SVM)进行步态识别。对于DTW算法,设置距离度量为欧氏距离,通过动态规划计算累积距离矩阵,找到最优匹配路径,从而计算出不同步态序列之间的相似度。对于SVM算法,选择径向基核函数(RBF)作为核函数,通过交叉验证的方式确定惩罚参数C和核函数参数γ,以优化SVM的分类性能。在训练过程中,将数据集按照70%作为训练集,30%作为测试集进行划分,使用训练集对SVM模型进行训练,然后用测试集评估模型的性能。实验结果表明,基于角度特征的步态识别方法在不同场景下展现出了一定的性能表现。在正常行走条件下,该方法的识别准确率达到了85%,召回率为83%。这表明在个体外观无明显变化的情况下,基于角度特征的方法能够较好地识别个体身份。然而,当个体背着包行走时,识别准确率下降到78%,召回率为75%;穿着大衣行走时,识别准确率进一步下降到72%,召回率为70%。这说明个体外观的变化,如携带物品和穿着不同衣物,会对基于角度特征的步态识别方法产生一定的干扰,导致识别性能下降。这是因为这些外观变化可能会改变人体的重心分布和运动模式,从而影响关节角度的变化规律,使得角度特征的区分性降低。在不同视角下,基于角度特征的步态识别方法的性能也有所不同。在正面和背面视角下,识别准确率相对较高,分别达到了82%和80%,召回率分别为80%和78%。这是因为在这些视角下,人体关节的运动相对较为明显,角度特征更容易提取和区分。而在侧面视角下,由于部分关节被遮挡或运动幅度较小,识别准确率下降到75%,召回率为73%。此外,随着视角的变化,人体的投影形状和关节角度的视觉表现也会发生变化,这增加了角度特征提取和匹配的难度,从而影响了识别性能。通过对实验结果的分析,可以看出基于角度特征的步态识别方法在一定程度上能够有效识别个体身份,但在面对个体外观变化和不同视角等复杂情况时,仍存在一定的局限性,需要进一步改进和优化。四、基于轮廓特征的步态识别方法4.1轮廓特征提取方法4.1.1传统图像处理方法提取轮廓在步态识别中,传统图像处理方法在提取人体轮廓时发挥了重要作用,其主要涵盖阈值分割、边缘检测、形态学处理等技术,这些技术在不同图像质量和背景条件下展现出各异的效果。阈值分割是一种简单且常用的图像分割方法,其核心原理是根据图像的灰度值,选取一个合适的阈值,将图像中的像素点划分为前景和背景两类。对于步态图像,若图像背景较为简单且与人体灰度差异明显,阈值分割能够快速有效地提取出人体轮廓。当背景为单一颜色,且人体与背景的灰度值分布相对独立时,通过设定合适的阈值,可将人体从背景中分离出来。常用的阈值选取方法有全局阈值法和自适应阈值法。全局阈值法适用于整幅图像中前景和背景的灰度分布较为稳定的情况,通过计算图像的灰度直方图,选择一个固定的阈值对整幅图像进行分割。自适应阈值法则根据图像局部区域的灰度特性来动态调整阈值,对于光照不均匀或背景复杂的图像具有更好的适应性。然而,阈值分割方法也存在一定的局限性。当图像中存在噪声干扰时,噪声点的灰度值可能会影响阈值的选择,导致分割结果出现错误,如将噪声点误判为前景或背景;若人体与背景的灰度差异较小,或者人体内部存在灰度变化较大的区域,阈值分割可能无法准确地提取出完整的人体轮廓,出现轮廓不连续或丢失部分轮廓的情况。边缘检测是另一种重要的传统图像处理方法,它通过检测图像中灰度值变化剧烈的位置来提取物体的边缘,从而得到人体轮廓。Canny边缘检测算法是一种经典的边缘检测算法,它通过计算图像的梯度幅值和方向,采用非极大值抑制和双阈值检测等步骤,能够准确地检测出图像中的边缘。在步态图像中,Canny算法能够有效地检测出人体轮廓的边缘,即使在图像存在一定噪声的情况下,也能保持较好的检测效果。在实际应用中,首先对步态图像进行高斯滤波,以平滑图像并减少噪声干扰;接着计算图像的梯度幅值和方向,通过非极大值抑制去除非边缘的像素点,保留真正的边缘;最后采用双阈值检测,将边缘分为强边缘和弱边缘,通过对弱边缘的连接,得到完整的边缘轮廓。但是,边缘检测算法对图像的噪声和光照变化较为敏感。在光照不均匀的情况下,图像的灰度值会发生变化,导致边缘检测结果出现误判,产生虚假边缘或丢失真实边缘;当图像噪声较大时,噪声点的灰度变化也会被检测为边缘,使得边缘检测结果中包含大量噪声,影响轮廓提取的准确性。形态学处理是对图像进行腐蚀、膨胀、开运算、闭运算等操作,以优化轮廓提取的结果。腐蚀操作可以去除图像中的噪声点和小的突出部分,使物体的轮廓向内收缩;膨胀操作则可以填补物体轮廓中的空洞和缝隙,使轮廓向外扩张。开运算先进行腐蚀操作再进行膨胀操作,能够去除噪声和小的干扰物,平滑物体的轮廓;闭运算先进行膨胀操作再进行腐蚀操作,能够填补物体内部的空洞和连接断开的轮廓。在步态识别中,形态学处理通常与阈值分割或边缘检测结合使用。在通过阈值分割得到初步的人体轮廓后,可能存在一些噪声点和小的空洞,通过形态学处理中的腐蚀和膨胀操作,可以去除噪声点,填补空洞,得到更清晰、完整的人体轮廓。但是,形态学处理的效果依赖于结构元素的选择,不同的结构元素会对处理结果产生不同的影响。如果结构元素选择不当,可能会过度腐蚀或膨胀轮廓,导致轮廓信息丢失或变形。4.1.2基于深度学习的轮廓提取以MaskR-CNN、Yolo等模型为代表的深度学习模型在人体轮廓提取中展现出强大的能力,它们通过对大量图像数据的学习,能够自动提取图像中的特征,实现准确的人体轮廓提取,然而,这些模型在实际应用中也对硬件资源有着较高的要求。MaskR-CNN是一种基于区域的卷积神经网络,它在FasterR-CNN的基础上增加了一个用于预测目标掩模的分支,从而能够实现对目标物体的实例分割,准确地提取出人体轮廓。该模型的工作流程主要包括以下几个步骤:首先,通过骨干网络(如ResNet、VGG等)对输入图像进行特征提取,得到图像的特征图。骨干网络中的卷积层能够自动学习图像中的各种特征,包括纹理、形状等信息。接着,利用区域提议网络(RPN)生成可能包含人体目标的候选区域。RPN通过滑动窗口的方式在特征图上生成一系列的锚框,并对这些锚框进行分类和回归,判断每个锚框是否包含人体目标以及调整锚框的位置和大小,从而得到一系列的候选区域。然后,对这些候选区域进行ROIAlign操作,将不同大小的候选区域映射到固定大小的特征图上,以便后续的处理。ROIAlign操作能够避免传统ROIPooling操作中由于量化误差导致的特征丢失问题,提高特征的准确性。最后,通过分类器对候选区域进行分类,判断其是否为人体目标,并通过掩模预测分支生成人体的掩模,从而得到准确的人体轮廓。在训练过程中,MaskR-CNN通过大量的标注数据进行学习,不断调整模型的参数,使得模型能够准确地识别和分割人体目标。MaskR-CNN对复杂背景和遮挡情况具有较好的鲁棒性,能够在各种场景下准确地提取人体轮廓。在人群密集的场景中,即使人体之间存在部分遮挡,MaskR-CNN也能够通过对上下文信息的学习,准确地分割出每个人的轮廓。然而,MaskR-CNN模型的训练和推理过程需要消耗大量的计算资源,对硬件设备的要求较高,需要配备高性能的GPU才能实现实时的轮廓提取。Yolo(YouOnlyLookOnce)系列模型是另一类基于深度学习的目标检测模型,它将目标检测任务转化为一个回归问题,通过一次前向传播即可预测出目标物体的类别和位置,具有速度快、实时性强的优点。以YoloV5为例,它采用了CSPNet(CrossStagePartialNetwork)结构作为骨干网络,通过对特征图的跨阶段融合,提高了模型的特征提取能力和计算效率。在颈部结构中,YoloV5采用了SPP(SpatialPyramidPooling)模块和PAN(PathAggregationNetwork)模块,SPP模块通过不同尺度的池化操作,能够提取到不同尺度的特征,增强模型对多尺度目标的检测能力;PAN模块则通过自上而下的路径聚合,将不同层次的特征进行融合,使得模型能够更好地利用上下文信息。在头部结构中,YoloV5采用了多尺度预测的方式,通过在不同尺度的特征图上进行预测,能够检测出不同大小的目标物体。在人体轮廓提取中,YoloV5能够快速地检测出图像中的人体目标,并通过后处理操作得到人体的轮廓。由于YoloV5模型结构相对简单,计算量较小,因此在一些对实时性要求较高的场景中具有优势,如实时监控系统中,能够快速地检测和提取人体轮廓。但是,Yolo系列模型在检测小目标和复杂场景下的准确性相对较低,对于一些细节丰富的人体轮廓,可能无法准确地提取。基于深度学习的轮廓提取模型在硬件资源要求方面,通常需要高性能的图形处理器(GPU)来加速模型的训练和推理过程。这些模型的训练过程涉及大量的矩阵运算和复杂的神经网络结构,对计算资源的需求巨大。在使用MaskR-CNN模型进行训练时,若硬件设备的GPU性能不足,训练时间可能会大幅延长,甚至无法完成训练;在推理过程中,若硬件设备无法满足模型的计算需求,可能会导致实时性下降,无法满足实际应用的要求。深度学习模型的存储需求也较高,需要存储大量的模型参数和训练数据。为了降低硬件资源的需求,一些研究提出了模型压缩和量化等技术,通过减少模型参数的数量和降低参数的精度,来减小模型的大小和计算量,从而提高模型在低配置硬件设备上的运行效率。4.2基于轮廓特征的识别算法4.2.1基于模板匹配的轮廓识别在基于轮廓特征的步态识别中,构建有效的步态轮廓模板是实现准确识别的关键一步,而步态能量图(GEI)是一种广泛应用且效果显著的模板构建方法。其构建过程基于对人体轮廓在多个步态周期内的像素级分析。首先,通过背景减除、边缘检测等图像处理技术,从视频序列中准确提取出每个步态周期内的人体轮廓图像。这些轮廓图像反映了人体在不同时刻的姿态和形状信息。然后,对提取到的轮廓图像进行时间对齐,确保每个轮廓图像在时间轴上的对应位置具有相同的物理意义,以便后续进行融合处理。在时间对齐的基础上,将所有轮廓图像进行叠加平均。具体来说,对于每个像素位置,计算在所有轮廓图像中该像素位置的灰度值总和,并除以轮廓图像的数量,得到该像素位置在GEI中的灰度值。通过这种方式,将多个步态周期内的轮廓信息融合到一张图像中,形成步态能量图。GEI能够有效地保留步态的主要特征,如人体的整体形状、腿部和手臂的摆动幅度和频率等,同时对一些噪声和微小的姿态变化具有一定的平滑作用,使得特征更加稳定。模板匹配是基于模板的轮廓识别中的关键环节,其核心在于通过计算相似度来判断待识别轮廓与模板之间的匹配程度。常用的相似度计算方法有欧氏距离、余弦相似度等。欧氏距离是一种直观的距离度量方法,它通过计算两个向量在空间中的直线距离来衡量它们的相似度。在基于轮廓特征的模板匹配中,将GEI等模板图像和待识别轮廓图像转化为向量形式,然后计算它们之间的欧氏距离。假设模板图像向量为T=(t_1,t_2,\cdots,t_n),待识别轮廓图像向量为S=(s_1,s_2,\cdots,s_n),则它们之间的欧氏距离d的计算公式为:d=\sqrt{\sum_{i=1}^{n}(t_i-s_i)^2}。欧氏距离越小,说明两个图像的相似度越高,即待识别轮廓与模板越匹配。余弦相似度则是从向量夹角的角度来衡量两个向量的相似度,它计算两个向量的夹角余弦值,取值范围在[-1,1]之间,值越接近1,表示两个向量的方向越相似,即图像的相似度越高。对于上述模板图像向量T和待识别轮廓图像向量S,它们的余弦相似度cosine的计算公式为:cosine=\frac{\sum_{i=1}^{n}t_i\timess_i}{\sqrt{\sum_{i=1}^{n}t_i^2}\times\sqrt{\sum_{i=1}^{n}s_i^2}}。然而,模板匹配方法在实际应用中存在一定的局限性。当个体外观发生变化时,如穿着不同的衣物、携带物品等,会导致人体轮廓的形状和大小发生改变,从而使得基于固定模板的匹配效果受到影响。穿着宽松的衣物可能会使人体轮廓看起来更加宽大,携带背包则会改变人体的重心和轮廓形状,这些变化会增加模板与待识别轮廓之间的差异,降低相似度计算的准确性,导致识别错误。拍摄视角的变化也是一个重要的影响因素。不同的拍摄视角会使人体轮廓在图像中的投影发生变化,导致轮廓的形状和比例与模板不一致。从侧面拍摄的人体轮廓与从正面拍摄的轮廓在形状和特征上有很大差异,如果使用正面拍摄的模板去匹配侧面拍摄的轮廓,很难得到准确的匹配结果。此外,模板匹配方法对于噪声和遮挡的鲁棒性较差。图像中的噪声会干扰轮廓的提取和特征的表达,使得模板与待识别轮廓之间的相似度计算出现偏差;当人体部分被遮挡时,缺失的轮廓信息会导致模板匹配失败,影响识别的准确性。4.2.2深度学习模型在轮廓识别中的应用深度学习模型在轮廓特征的学习和分类中展现出了强大的能力,以卷积神经网络(CNN)和循环神经网络(RNN)为代表的模型,通过独特的结构和学习机制,能够自动提取轮廓图像中的关键特征,实现准确的身份识别。卷积神经网络(CNN)在处理轮廓图像时,其独特的卷积层结构发挥了关键作用。卷积层通过卷积核在图像上滑动,对图像的局部区域进行卷积操作,从而提取出图像的局部特征。这些卷积核可以看作是一系列滤波器,它们能够捕捉图像中的边缘、纹理、形状等不同类型的特征。在处理人体轮廓图像时,卷积核可以学习到人体轮廓的边缘特征、关节部位的形状特征等。不同大小和参数的卷积核可以提取不同尺度和类型的特征,小的卷积核能够捕捉图像的细节特征,大的卷积核则可以提取图像的整体结构特征。池化层也是CNN中的重要组成部分,它通过对卷积层输出的特征图进行下采样,降低特征图的尺寸,减少计算量,同时保留图像的主要特征。最大池化是一种常用的池化方法,它在一个局部区域内选择最大值作为池化后的输出,能够有效地保留图像中的重要特征。通过多个卷积层和池化层的交替堆叠,CNN可以逐渐提取出图像的高层次语义特征,这些特征对于区分不同个体的轮廓具有重要意义。在一个包含多个卷积层和池化层的CNN模型中,浅层的卷积层主要提取图像的边缘、线条等低级特征,随着网络层数的加深,卷积层逐渐学习到人体轮廓的整体形状、姿态等高级语义特征。在分类阶段,全连接层将提取到的特征映射到类别空间,通过softmax函数计算每个类别的概率,从而实现对轮廓图像的分类识别。循环神经网络(RNN)则特别适合处理具有时间序列特性的轮廓数据,因为它能够捕捉时间序列中的长期依赖关系。在步态识别中,轮廓图像是按时间顺序采集的,形成了一个时间序列,RNN通过引入循环连接,使得神经元能够记住之前的状态信息,从而对整个时间序列进行建模。在处理轮廓图像序列时,RNN的每个时间步接收当前时刻的轮廓图像特征作为输入,并结合上一时刻的隐藏状态,通过非线性变换计算出当前时刻的隐藏状态。这个隐藏状态不仅包含了当前轮廓图像的信息,还融合了之前时刻的信息,能够反映出步态的动态变化过程。长短期记忆网络(LSTM)作为RNN的一种变体,通过引入门控机制,有效地解决了RNN在处理长序列时的梯度消失和梯度爆炸问题,能够更好地学习和记忆时间序列中的长期依赖信息。LSTM中的门控单元包括输入门、遗忘门和输出门,输入门控制当前输入信息的进入,遗忘门决定保留或丢弃上一时刻的记忆,输出门确定输出的信息。通过这些门控单元的协同作用,LSTM能够选择性地记忆和更新时间序列中的重要信息,在步态轮廓识别中表现出更好的性能。在一个基于LSTM的步态识别模型中,LSTM网络可以学习到人体轮廓在不同时间步的变化模式,从而准确地识别出不同个体的步态。不同深度学习模型在轮廓识别中的性能表现各有优劣。CNN在提取静态图像特征方面具有强大的能力,能够快速准确地提取出轮廓图像中的关键特征,对于单帧轮廓图像的分类具有较高的准确率。但它在处理时间序列信息时,由于缺乏对时间依赖关系的有效建模,可能无法充分利用步态的动态特征。RNN及其变体LSTM则在处理时间序列数据方面表现出色,能够捕捉步态轮廓随时间的变化规律,对于基于时间序列的步态识别具有较好的效果。然而,RNN和LSTM的计算复杂度较高,训练和推理速度相对较慢,在处理大规模数据时可能面临计算资源的限制。在实际应用中,需要根据具体的需求和数据特点,选择合适的深度学习模型,并对其进行优化和改进,以提高基于轮廓特征的步态识别性能。4.3案例分析4.3.1实验数据集及实验设置本次实验同样选用CASIA-B步态数据集,该数据集在前述基于角度特征的步态识别实验中已被采用,其丰富的个体样本、多样的行走条件以及多视角采集的特性,为全面评估基于轮廓特征的步态识别方法提供了有力的数据支持。与基于角度特征实验数据集的联系在于,二者使用的是同一数据集,这使得在对比分析基于角度特征和轮廓特征的步态识别性能时,具有更强的可比性,能够更直观地反映出两种特征在相同实验条件下的表现差异。在实验设置方面,对于轮廓特征提取,若采用传统图像处理方法,首先利用高斯混合模型(GMM)进行背景建模,设置混合高斯模型的个数为5,以适应背景的动态变化,准确地从视频图像中分离出前景人体目标。接着使用Canny边缘检测算法提取人体边缘,设置低阈值为50,高阈值为150,以平衡边缘检测的准确性和噪声抑制效果。最后通过形态学处理中的膨胀和腐蚀操作优化轮廓,选择结构元素为3×3的矩形结构元素,对边缘图像进行膨胀操作以填补空洞,再进行腐蚀操作去除噪声点,得到完整准确的人体轮廓。若采用基于深度学习的MaskR-CNN模型提取轮廓,使用预训练的ResNet50作为骨干网络,在训练过程中,设置初始学习率为0.001,采用随机梯度下降(SGD)优化器,动量参数为0.9,权重衰减系数为0.0001,训练100个epoch,以确保模型能够充分学习到人体轮廓的特征。在识别算法方面,采用基于模板匹配的方法时,构建步态能量图(GEI)作为步态模板。在构建GEI时,对每个个体的轮廓图像进行时间对齐,确保轮廓在时间轴上的一致性,然后将所有轮廓图像进行叠加平均,生成GEI。在模板匹配阶段,使用欧氏距离作为相似度度量,通过计算待识别轮廓与GEI模板之间的欧氏距离,判断待识别轮廓与模板的匹配程度,距离越小则匹配度越高。采用深度学习模型进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论