CN119323572B 基于rt-detr改进的绝缘子缺陷检测方法及系统 (国网江西省电力有限公司电力科学研究院)_第1页
CN119323572B 基于rt-detr改进的绝缘子缺陷检测方法及系统 (国网江西省电力有限公司电力科学研究院)_第2页
CN119323572B 基于rt-detr改进的绝缘子缺陷检测方法及系统 (国网江西省电力有限公司电力科学研究院)_第3页
CN119323572B 基于rt-detr改进的绝缘子缺陷检测方法及系统 (国网江西省电力有限公司电力科学研究院)_第4页
CN119323572B 基于rt-detr改进的绝缘子缺陷检测方法及系统 (国网江西省电力有限公司电力科学研究院)_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(19)国家知识产权局(12)发明专利(10)授权公告号CN119323572B(21)申请号202411874576.0(22)申请日2024.12.19(65)同一申请的已公布的文献号申请公布号CN119323572A(43)申请公布日2025.01.17(73)专利权人国网江西省电力有限公司电力科地址330096江西省南昌市青山湖区民营科技园内民强路88号检测试验中心科研楼(第1-11层)(74)专利代理机构南昌贤达专利代理事务所(普通合伙)36136GO6V20/17(2022.01)GO6V20/40(2022.01)GO6V10/25(2022.GO6V10/44(2022.GO6V10/77(2022.GO6V10/80(2022.GO6V10/82(2022.(56)对比文件(54)发明名称收集公开的绝缘子缺陷数据集以及通过视频截取帧获取图像作为数据集,将数据集基于目标检测模型RT-DETR进行改进,将骨干网络改为StarNet星网络进行特征提取,对StarNet收集公开的绝缘子缺陷数据集以及通过视频截取帧获取图像作为数据集,将数据集基于目标检测模型RT-DETR进行改进,将骨干网络改为StarNet星网络进行特征提取,对StarNet星网络进行进一步改进,将P5检测头移除,加入P2检测头,并且改部分自注意力机制PSA,对部分自注意力机制PSA进将RT-DETR中的RepC3卷积模块改进为RepMob卷积模块;CloU损失函数进行损失计算;验证集进行验证,得到在验证集最佳的权重;将得到最佳的权重载入改进后的RT-DETR中进行绝缘子缺陷检测。(57)摘要本发明公开了基于RT-DETR改进的绝缘子缺陷检测方法及系统,收集公开的绝缘子缺陷数据集以及通过视频截取帧获取图像作为数据集;基于目标检测模型RT-DETR进行改进,将骨干网络改为StarNet星网络进行特征提取,并且进一步改进,将P5检测头移除,加入P2检测头,并且改进其中的星卷积模块;将多头注意力机制更改为部分自注意力机制PSA,并进一步改进,得到S-PSACIoU相结合,得到Inner-CIoU损失函数进行损失计算;训练改进后的RT-DETR,并且进行验证,得到最佳的权重,将该权重载入改进后的RT-DETR中进行绝缘子缺陷检测。本发明使用基于RT-DETR21.基于RT-DETR改进的绝缘子缺陷检测方法,其特征在于:所述检测方法包括以下步收集公开的绝缘子缺陷数据集以及通过视频截取帧获取图像作为数据集,将数据集进基于目标检测模型RT-DETR进行改进,将骨干网络改为StarNet星网络进行特征提取,对StarNet星网络进行进一步改进,将P5检测络中的星卷积模块;将RT-DETR中的多头注意力机制更改为YOLOv10中的部分自注意力机制PSA,对部分自将损失函数用Inner-IoU与CIoU相结合,得到Inner-CIoU损失函数进行损失计算;将训练集输入改进后的RT-DETR中训练,并且在验证集进行验证,得到在验证集最佳的将得到最佳的权重载入改进后的RT-DETR中进行绝缘子缺陷检测;改进StarNet星网络中的星卷积模块,包括以下步骤:输入特征信息,通过split分割层进行通道的拆分将通道分成两个,积进行卷积的升维,另外一个通道经过深度卷积,然后分成两半分别通过全连接层,一半使用ReLU6激活函数使通道具有非线性,另一半不做处理,然后经过星形运算将两者的特征进行融合,对不同通道的特征进行两两相乘,再经过深度卷积将融合后的特征整合并加强,然后将该通道与点卷积的通道进行通道维度的concat拼接,然后进行通道混洗操作将通道与通道之间加强交流,最后经过普通卷积层进行整合。2.根据权利要求1所述的基于RT-DETR改进的绝缘子缺陷检测方法,其特征在于:收集公开的绝缘子缺陷数据集以及通过视频截取帧获取图像作为数据集,包括以下步骤:首先收集公开的绝缘子缺陷数据集,然后再收集电网提供的无人机巡检视频数据,针对视频数据采用截取帧获取图像的方式得到异物数据集,使用LabelImg工具对图像的异物进行数据标注,标明类别以及真实框。3.根据权利要求2所述的基于RT-DETR改进的绝缘子缺陷检测方法,其特征在于:S-PSA注意力机制模块的处理流程为:先将输入进来的信息经过深度可分离卷积进行特征提取,随后将得到的特征信息经过ReLU6激活函数,将非线性引入特征之中,然后经过split分割层对特征信息进行拆分,拆分为两部分,分为1/4和3/4,1/4特征信息不做操作,3/4特征信息中的1/3不做操作,3/4特征信息中的2/3做多头自注意力机制操作,然后将其与不做操作的3/4特征信息中的1/3采用星形运算进行融合,然后将特征信息拆分为两半,一半经过点卷积升高维度,融合部分通道信息,然后经过空洞卷积进一步获取全局信息,将其卷积后的结果再与另一半不做操作的特征信息进行星形运算结合,将学习到的全局信息渗入通道之中,然后与原始1/4特征信息进行concat拼接,再经过通道混洗将学习的全局信息与原始1/4特征信息产生信息交流,最后经过普通卷积整合。4.根据权利要求3所述的基于RT-DETR改进的绝缘子缺陷检测方法,其特征在于:将RT-训练阶段,将输入信息分成三份后通过三个分支,第一个分支不对信息做处理,第二个3星形运算将三个分支的特征信息进行融合,然后再用SE通道注意力机制加强通道的信息,过点卷积将通道信息进行升维后,经过ReLU6激活函数后与未作处理的部分通道信息进行inter=(min(b9ᵗ,b-)-max(b⁹,b₁))*(min(bᵗ,bb)—max(bᵗ,bt)),,LcIou=1-CIoU,LInner-CIou=LcIou+IoU-IoUinner,正因子之后得到的新的IoU,LcIou为CIoU的损失,LInner-CIoU为Inner-IoU结合CI46.基于RT-DETR改进的绝缘子缺陷检测系统,用于实现权利要求1-5任一项所述的检测方法,其特征在于:包括数据预处理模块、改进骨干网络模块、改进注意力机制模块、改进数据预处理模块:收集公开的绝缘子缺陷数据集以及通过视频截取帧获取图像作为数改进骨干网络模块:基于目标检测模型RT-DETR进行改进,将骨干网络改为StarNet星且改进StarNet星网络中的星卷积模块;改进注意力机制模块:将RT-DETR中的多头注意力机制更改为YOLOv10中的部分自注意力机制PSA,对部分自注意力机制PSA进一步改进,得到S-PSA注意力机制模块;改进损失函数模块:将损失函数用Inner-IoU与CIoU相结合,得到Inner-CIoU损失函数进行损失计算;模型训练模块:将训练集输入改进后的RT-DETR中训练,并且在验证集进行验证,得到在验证集最佳的权重;绝缘子缺陷检测模块:将得到最佳的权重载入改进后的RT-DETR中进行绝缘子缺陷检5基于RT-DETR改进的绝缘子缺陷检测方法及系统技术领域[0001]本发明涉及绝缘子缺陷检测技术领域,具体涉及基于RT-DETR改进的绝缘子缺陷检测方法及系统。背景技术[0002]绝缘子是输电线路的重要组成部分,长期暴露在户外条件下容易损坏。有效检测绝缘子缺陷具有重要的现实意义。在传统方法上,绝缘子缺陷检测依赖于人工检查。然而,随着深度学习在该领域的出现,目标检测算法逐渐取代了传统的人工检查。与成本高昂、耗时的人工检查相比,目标检测算法可以高效、安全地完成绝缘子缺陷检测任务。[0003]目前,目标检测算法大致分为单阶段检测算法和两阶段检测算法。两阶段检测算法虽然精度上限更高,但是随之而来的运算成本更高且复杂,并且后处理的非极大值抑制成本太大,不能实现端到端的目标检测,不利于实时目标检测,不适用于检测绝缘子的缺陷;而单阶段检测算法由于是需要一个过程,运算成本较低一些,并且检测流程也相对简洁,YOLO系列为单阶段检测算法十分常用的算法,但是其在推理阶段仍然依赖于非极大值抑制来得到唯一的预测框。[0004]专利申请号为CN202410495935.5的发明中提出了一种基于改进YOLOv8的轻量级绝缘子缺陷检测方法,主要按照以下步骤进行训练:(1)采集输电线路巡检绝缘子故障数据集,对采集到的绝缘子图像进行预处理和数据增强;(2)获取改进的YOLOv8网络模型并利用处理后的数据集对网络模型进行训练;(3)将待检测的绝缘子数据输入到最优检测模型中,输出绝缘子缺陷检测结果,即绝缘子的故障类别和出现缺陷的位置。但该方案存在以下缺陷:①该方案中对于骨干网络的改进之中,使用了大量的残差网络进行特征融合,这会使增加特征的冗余,并且ADD操作会增加计算复杂性,性能低下。②该方案中主干网络使用的EMA注意力机制以及SPPF模块不但功能相似,造成了多尺度信息的冗余和反复提取,并且还增加了骨干网络的复杂度,不利于后续输入RT-DETR的transformer模块。③该方案中使用的高效层聚合网络GELAN模块,由于聚合了许多分支的信息,再进行整体梯度更新,计算的信息极大,计算复杂度高。④该方案中推理阶段会产生许多冗余的预测框,依赖NMS处理后端数据,不利于端到端的检测任务,会使得推理时效率低下,不利于绝缘子的实时检测。[0005]专利申请号为CN202410326526.2的发明中提出了一种基于改进RT-DETR的交通标识检测方法,主要按照以下步骤进行训练:1)获取公开交通标识图像,划分训练与测试所需的目标检测数据集;2)设计改进的RT-DETR的交通标识检测模型,提出MCCA(Multichannelcoordinatedattention)注意力机制;为改善偏移量与掩码参数的生成能力,在DCNv2可变BasicBlock块替换为DCNv2att块;3)对基于改进RT-DETR的交通标识检测模型的训练结果进行评估。但该方案存在以下缺陷:①该方法中在骨干网络中后段使用过多残差连接分支,会极大增加网络的复杂度,并且使用ADD操作拼接特征效率低下,并且这种传统卷积网络在6特征表示的高维非线性变换上存在局限性。②如果数据集偏差较大,可变形卷积学习到的参数将会更加针对某种数据集,切换数据集时检测效果会变差,泛化能力较低。③该方法中的MCCA注意力机制模块中沿着x,y两个空间方向聚合特征是有冗余的,在RT-DETR的基础模块中,卷积网络和AIFI、CCFM都可以很好的将空间信息进行聚合,增加该注意力机制会使得网络结构冗余,并且由于增加了两个分支,会导致梯度信息计算更加复杂。[0006]专利申请号为CN202410005858.0的发明中提出了一种RT-DETR红外弱小飞机检测方法及系统,主要按照以下步骤进行训练:1)选择红外弱小飞机数据集,将其划分为训练出,完成初始检测模型的构建;5)利用训练集和验证集对构建出的初始检测模型进行训练,得到训练后的检测模型;6)利用训练后的检测模型对待检测的目标进行检测。但该方案存在以下缺陷:①该方法中使用的VanillaNet,由于非线性相对较低,在提取部分有用的区域合特征,都会导致网络增加许多冗余和计算量及参数量;③使用传统的P3,P4,P5检测头,没有针小型部件进行优化,不利于小目标的缺陷检测。④使用的损失函数没有考虑到所需真实框与预测框之间不匹配的方向,导致收敛速度较慢且效率较低,因为预测框可能在训练过程中偏移并最终导致模型效果更差。[0007]上述现有技术的缺点可以总结归纳为:对于其中的骨干网络,网络结构在提取图像的特征时会造成特征图信息的冗余,并且广泛使用ADD操作去融合特征图,会导致融合的效率低下,并且大量增加网络宽度,使得网络复杂不够精简,传统卷积网络在特征表示的高维非线性变换上存在局限性;改进的注意力机制有许多的额外分支,在计算梯度信息时十分复杂,会降低推理速度;原始网络的RepC3模块没有额外分支,相比使用分支来说会耗费一定的计算资源,卷积模块也不够高效,采用该种卷积进行推理不利于精度提升,不能替代含分支的卷积网络,并且上述改进此模块后,增加的过多的分支反而造成了梯度信息的更新复杂和网络的复杂度,并且其中的边界框损失函数无法根据不同检测器与检测任务进行自我调整,不具有很强的泛化性,而且忽视了真实框和预测框的匹配角度的影响。发明内容[0008]针对现有技术的不足,本发明的目的是提供基于RT-DETR改进的绝缘子缺陷检测方法及系统。[0009]为了实现上述目的,本发明提供如下技术方案:基于RT-DETR改进的绝缘子缺陷检测方法,所述检测方法包括以下步骤:[0010]收集公开的绝缘子缺陷数据集以及通过视频截取帧获取图像作为数据集,将数据集进行拆分,分为训练集与验证集;[0011]基于目标检测模型RT-DETR进行改进,将骨干网络改为StarNet星网络进行特征提星网络中的星卷积模块;7[0012]将RT-DETR中的多头注意力机制更改为YOLOv10中的部分自注意力机制PSA,对部分自注意力机制PSA进一步改进,得到S-PSA注意力机制模块;[0014]将损失函数用Inner-IoU与CIoU相结合,得到Inner-CIoU损失函数进行损失计算;[0015]将训练集输入改进后的RT-DETR中训练,并且在验证集进行验证,得到在验证集最佳的权重;[0016]将得到最佳的权重载入改进后的RT-DETR中进行绝缘子缺陷检测。[0017]在一个优选的实施方式中,收集公开的绝缘子缺陷数据集以及通过视频截取帧获[0018]首先收集公开的绝缘子缺陷数据集,然后再收集电网提供的无人机巡检视频数据,针对视频数据采用截取帧获取图像的方式得到异物数据集,使用LabelImg工具对图像的异物进行数据标注,标明类别以及真实框。[0019]在一个优选的实施方式中,改进StarNet星网络中的星卷积模块,包括以下步骤:[0020]输入特征信息,通过split分割层进行通道的拆分将通道分成两点卷积进行卷积的升维,另外一个通道经过深度卷积,然后分成两半分别通过全连接层,一半使用ReLU6激活函数使通道具有非线性,另一半不做处理,然后经过星形运算将两者的特征进行融合,对不同通道的特征进行两两相乘,再经过深度卷积将融合后的特征整合并加强,然后将该通道与点卷积的通道进行通道维度的concat拼接,然后进行通道混洗操作将通道与通道之间加强交流,最后经过普通卷积层进行整合。[0021]在一个优选的实施方式中,S-PSA注意力机制模块的处理流程为:先将输入进来的信息经过深度可分离卷积进行特征提取,随后将得到的特征信息经过ReLU6激活函数,将非线性引入特征之中,然后经过split分割层对特征信息进行拆分,拆分为两部分,分为1/4和3/4,1/4特征信息不做操作,3/4特征信息中的1/3不做操作,3/4特征信息中的2/3做多头自注意力机制操作,然后将其与不做操作的3/4特征信息中的1/3采用星形运算进行融合,然后将特征信息拆分为两半,一半经过点卷积升高维度,融合部分通道信息,然后经过空洞卷积进一步获取全局信息,将其卷积后的结果再与另一半不做操作的特征信息进行星形运算结合,将学习到的全局信息渗入通道之中,然后与原始1/4特征信息进行concat拼接,再经过通道混洗将学习的全局信息与原始1/4特征信息产生信息交流,最后经过普通卷积整合。[0022]在一个优选的实施方式中,将RT-DETR中的RepC3卷积模块改进为RepMob卷积模[0023]训练阶段,将输入信息分成三份后通过三个分支,第一个分支不对信息做处理,第二个分支使用3×3的深度卷积提取特征,第三个分支使用1×1的深度卷积提取特征,然后经过星形运算将三个分支的特征信息进行融合,然后再用SE通道注意力机制加强通道的信息,将通道信息的重要程度区分开,随后将通道信息拆分为两部分,一部分经点卷积改变维另一部分不做处理的通道信息做星形运算,得到最终的输出;推理阶段,将最初的三个分支合并为一个3×3的深度卷积,然后通过SE通道注意力机制模块将通道计算权重,得到重要的通道以及不重要的通道信息,将通道信息同样拆分为两部分,一部分不做处理,另一部分通过点卷积将通道信息进行升维后,经过ReLU6激活函数后与未作处理的部分通道信息进8行星形运算得到输出。[0024]在一个优选的实施方式中,将损失函数用Inner-IoU与CIoU相结合,得到Inner-CIoU损失函数进行损失计算,包括以下步骤:[0028]inter=(min(b?,b,)-max(b?”,b₁))*(min(测框顶部边界,x为真实框的中心点的横坐标,y.为真实框中心点的纵坐标,xe为预测框的中心点的横坐标,yc为预测框的中心点的纵坐标,w⁹ᵗ为真实框的宽,hᵗ为真实框的高,w为预测框的宽,h为预测框的高,ratio为尺度因子,inter为真实框的辅助框与预测框的辅助框的交集,union为真实框的辅助框与预测框的辅助框的并集,最后得到IoUinner为辅助框的IoU,然后将其与CIoU的损失结合,,Lcou=1-CIoU,LInner-Clo重函数,v为度量长宽比的相似性的参数,c为最小外接矩形的对角线距离,IoU为真实框与预测框的相交的面积与并起来的面积之比,CloU为考虑了目标框之间的完整交叉,并引损失。[0032]基于RT-DETR改进的绝缘子缺陷检测系统,包括数据预处理模块、改进骨干网络模缺陷检测模块;[0033]数据预处理模块:收集公开的绝缘子缺陷数据集以及通过视频截取帧获取图像作[0034]改进骨干网络模块:基于目标检测模型RT-DETR进行改进,将骨干网络改为StarNet星网络进行特征提取,对StarNet星网络进行进一步改进,将P5检测头移除,加入P2检测头,并且改进StarNet星网络中的星卷积模块;[0035]改进注意力机制模块:将RT-DETR中的多头注意力机制更改为YOLOv10中的部分自注意力机制PSA,对部分自注意力机制PSA进一步改进,得到S-PSA注意力机制模块;9[0037]改进损失函数模块:将损失函数用Inner-IoU与CIoU相结合,得到Inner-CIoU损失函数进行损失计算;[0038]模型训练模块:将训练集输入改进后的RT-DETR中训练,并且在验证集进行验证,得到在验证集最佳的权重;[0039]绝缘子缺陷检测模块:将得到最佳的权重载入改进后的RT-DETR中进行绝缘子缺陷检测。[0041]1、本发明使用StarNet星网络作为新的骨干网络进行改进,通过星形运算在保持计算复杂度较低的同时,实现了高维特征空间的映射,通过星形运算实现了更丰富的特征表示,并且本发明还对StarNet星网络进行了进一步的改进,增加了P2检测头,使得小目标检测更加精确,改进了星卷积模块,使得特征提取部分更加高效;[0042]2、本发明将多头注意力机制模块进行改进,将其进行部分自注意力操作再进行合并,不将所有信息都进行注意力操作,不会造成注意力机制的计算资源浪费,也能够很好的利用注意力机制对缺陷有更多的关注;本发明还改进了RepC3卷积模块,使用自研的RepMob卷积模块,增加了一定的分支,不会增加过多的计算量,并且将卷积模块也进行改进,使用星形运算将信息融合部分进行改进,使得对于自顶向下以及自底向上的特征融合更加高效,提高特征信息的利用率,本发明还利用Inner-IoU与CIoU进行结合,使用辅助边框改善边界框损失函数的计算,并且考虑到边界框的中心点距离和对角线距离,使用两者相结合的函数进行边界框损失计算,提高模型收敛速度以及训练精度。附图说明[0043]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。[0044]图1为本发明的方法流程图;[0045]图2为改进的StarNet星网络示意图;[0046]图3为改进的星卷积模块示意图;[0047]图4为S-PSA注意力机制模块示意图;[0048]图5为RepMob卷积模块训练阶段示意图;[0049]图6为RepMob卷积模块推理阶段示意图。具体实施方式[0050]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0051]实施例1:请参阅图1所示,本实施例所述基于RT-DETR改进的绝缘子缺陷检测方[0052](1)收集公开的绝缘子缺陷数据集以及通过视频截取帧获取图像作为数据集;[0053]首先收集公开的绝缘子缺陷数据集,然后再收集电网提供的无人机巡检视频数据,针对视频数据采用截取帧获取图像的方式得到异物数据集,使用LabelImg工具对图像的异物进行数据标注,标明类别以及真实框,将数据集进行拆分,分为训练集与验证集(8:[0054](2)基于目标检测模型RT-DETR进行改进,将骨干网络改为StarNet星网络进行特测效果,并且改进StarNet星网络中的星卷积模块,使得网络获得的特征更加丰富和高效;[0055]改进的StarNet星网络如图2所示,将图像输入StarNet星网络之中,用卷积下采样模块先得到2倍下采样的特征,然后继续进行卷积下采样操作,得到4倍下采样的特征,然后通过星卷积模块将特征进行融合和丰富,然后继续得到8倍和16倍下采样的图像特征,去除了32倍下采样的特征,因为绝缘子本身较小,使用P5的32倍下采样检测头一般用于检测大目标,本实施例将P5检测头丢弃,增加了P2的4倍下采样的检测头,更有利于绝缘子这种小目标的检测。[0056]改进的星卷积模块如图3所示,首先输入特征信息,通过split分割层进行通道的拆分将通道分成两个,一个通道使用点卷积进行卷积的升维,提高跨通道的信息融合,另外一个通道经过深度卷积,由于深度卷积对每个通道单独进行卷积,并且使用的卷积核也不相同,可以使得提取到的特征也具有多样性,加强网络的特征表示能力,经过深度卷积然后分成两半分别通过全连接层,一半使用ReLU6激活函数使通道具有非线性,另一半不做处理,然后经过星形运算将两者的特征进行融合,对不同通道的特征进行两两相乘,实现了高效的特征表示,无需过于额外的计算开销,能够在低维空间中执行计算,还能隐式地考虑极高维的特征,能够提供高效的计算和更好的特征表示,再经过深度卷积将融合后的特征整合并加强,然后将该通道与点卷积的通道进行通道维度的concat拼接,然后由于深度卷积缺少了自身通道之间的信息交流,并且也缺少了与点卷积通道之间的交流,因此加入一步通道混洗操作将通道与通道之间加强交流,最后经过普通卷积层进行整合,改进的星卷积模块计算简便,对于提取特征更加高效。[0057]本发明使用StarNet星网络将原始模型的骨干网络进行改进,并且对StarNet星网络进行进一步的改进,使得对于模型的特征提取部分更加高效且运算简单。[0058](3)将RT-DETR中的多头注意力机制更改为YOLOv10中的部分自注意力部分自注意力机制PSA进一步改进,得到S-PSA注意力机制模块,采用部分自注意力机制对部分信息进行自注意力操作,其他的信息进行卷积后与经过自注意力操作的信息融合,也能够达到自注意力的效果,还能够减少资源浪费;[0059]如图4所示,S-PSA注意力机制模块的处理流程为:先将输入进来的信息经过深度可分离卷积进行特征提取,可以使得产生多样化的特征信息,并且可以将重要特征放大并提取出来,目的是为了后续进行多头注意力机制计算时能够更好的将有利的信息进行全局信息的关联,随后将得到的特征信息经过ReLU6激活函数,利用这个计算简便的非线性激活函数将非线性引入特征之中,从而引入模型之中,使得模型具有非线性,然后经过split分割层对特征信息进行拆分,拆分为两部分,分为1/4和3/4,1/4特征信息不做操作,3/4特征信息中的1/3不做操作,3/4特征信息中的2/3做多头自注意力机制操作,这样就有原始信息的一半做多头自注意力操作,捕获全局的特征信息,然后将其与不做操作的3/4特征信息中特征信息进行concat拼接,再经过通道混洗将学习的全局信息与原始1/4特征信息产生信[0062]本实施例参考了RepVIT的重参数化结构,将RepC3卷积模块进行改进为卷的三个分支合并为一个3×3的深度卷积,然后通过SE通道注意力机制模块将通道计算权实框的顶部边界,b₁为预测框的左边界,b,为预测框的右边界,b₆为预测框底部边界,b为预测框顶部边界,x为真实框的中心点的横坐标,y.“为真实框中心点的纵坐标的中心点的横坐标,yc为预测框的中心点的纵坐标,w⁹ᵗ为真实框的宽,ht为真实框的高,w为预测框的宽,h为预测框的高,ratio为尺度因子,inter为真实框的辅助框与预测框的辅助框的交集,union为真实框的辅助框与预测框的辅助框的并集,最后得到IoUinner为辅助框的IoU,然后将其与CIoU的损失结合,,Lclou=1-CIoU,LInner-Clou重函数,v为度量长宽比的相似性的参数,c为最小外接矩形的对角线距离,IoU为真实框与预测框的相交的面积与并起来的面积之比(交并比),CloU为考虑了目标框之间的完整交[0072]本发明使用Inner-IoU结合CIoU进行损失的计算,利用辅助边框加速损失收敛,并且同时关注到了边界框的中心点距离和对角线距离,使得损失计算更加合理且有效,加速模型的收敛速度。[0073](6)将训练集输入改进后的RT-DETR中训练,并且在验证集进行验证,得到在验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论