WO2025138725A1 针对小型果实的识别方法、装置、终端设备及存储介质 (深圳职业技术大学)_第1页
WO2025138725A1 针对小型果实的识别方法、装置、终端设备及存储介质 (深圳职业技术大学)_第2页
WO2025138725A1 针对小型果实的识别方法、装置、终端设备及存储介质 (深圳职业技术大学)_第3页
WO2025138725A1 针对小型果实的识别方法、装置、终端设备及存储介质 (深圳职业技术大学)_第4页
WO2025138725A1 针对小型果实的识别方法、装置、终端设备及存储介质 (深圳职业技术大学)_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(19)世界知识产权组织(51)国际专利分类号:G06V20/68(2022.01)(21)国际申请号:PCT/CN2024/1(22)国际申请日:2024年7月16日(16.07.2024)(30)优先权:POLYTECHNICUNIVERSITY)[CN/CN];中国广东省深圳市南山区留仙大道7098号518055(CN)。南山区留仙大道7098号518055(CN)。李悦7098号518055(CN)。陈婉姗(CHEN,Wanshan);深圳市南山区留仙大道7098号518055(CN)。王林琳(WANG,Linlin);中国广东省深圳市南山区留仙大道7098号518055(CN)。PARTNERSHIP));中国广东省深圳市南山区桃业园二期8栋510518000(CN)。(81)指定国(除另有指明,要求每一种可提供的国家BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CCV,CZ,DE,DJ,DK,DM,DO,DZ,EC,E(54)Title:METHODANDAPPARATUSFORIDENTIFYINGSMALLFRUIT,TERMINALDEVI(54)发明名称:针对小型果实的识别方法、装置、终端设备及存储介质I图1]f(57)摘要:本发明公开了一种针对小型果实的识别方法、装置、终端设备及存储介质,所述方法包括:获取果实图像;将所述果实图像输入果实识别模型,以使所述果实识别模型识别所述果实图像中各果实所在位置,并确定各果实是否成熟;其中,所述果实识别模型基于YOLOv8模型构建而成;所述果实识别模型包括:一小目标检测头;所述小目标检测头与所述YOLOv8模型的StageLayer1模块以及第二级上采样模块连接,且在对所述果实图像进行识别时,接收所述StageLayer1模块以及所述第二级上采样模块的输出,并根据所述StageLayerl模块以及所述第二级上采样模块的输出,生成特征图。本发明提高了针对小果实检测效果。GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IR,IS,IT,JM,JO,JP,KE,KG,KH,KN,KP,KLA,LC,LK,LR,LS,LU,LY,MA,MD,MGMU,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SASE,SG,SK,SL,ST,SV,SY,TH,TJ,UA,UG,US,UZ,VC,VN,WS,ZA,ZM(84)指定国(除另有指明,要求每一种可提供的地区保护):ARIPO(BW,CV,GH,GM,NA,RW,SC,SD,SL,ST,SZ,TZ,UG,ZM,ZW),欧亚(AM,AZ,BY,KG,KZ,RU,TJ,TM),欧洲(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GBHU,IE,IS,IT,LT,LU,LV,MC,ME,MK,MT,PL,PT,RO,RS,SE,SI,SK,SM,TR),OAPI(BFCG,CI,CM,GA,GN,GQ,GW,KM,ML本国际公布:一包括国际检索报告(条约第21条(3))。1WO2025/138725说明书发明名称:针对小型果实的识别方法、装置、终端设备及存储介质技术领域[0001]本发明涉及图像识别技术领域,尤其涉及一种针对小型果实的识别方法、装置、终端设备及存储介质。背景技术[0002]2022年国内荔枝面积52.61万公顷,基本保持稳定;荔枝产量约222.27万吨。传细则26,统的荔枝采收需要手工操作,劳动强度大,并随着人口老龄化和劳动力高成本化,势必会降低采收效率。为了提高荔枝的采收效率、减少损伤和应对劳动力短缺等问题,基于深度学习的采摘机器人投入荔枝采摘的使用。[0003]基于深度学习的对象检测方法在公共数据集上表现出了良好的性能,但是现有的常规模型很少考虑到处理小型对象的情况。当面对荔枝这类小物体对象时,经常出现特征提取不足的问题,导致识别效果不佳。[0005]本发明提供了一种针对小型果实的识别方法、装置、终端设备及存储介质,以解决现有技术针对小型果实识别效果不佳的技术问题。[0006]为了解决上述技术问题,本发明实施例提供了一种针对小型果实的识别方法,[0007]获取果实图像;[0008]将所述果实图像输入果实识别模型,以使所述果实识别模型识别所述果实图像中各果实所在位置,并确定各果实是否成熟;[0009]其中,所述果实识别模型基于YOLOv8模型构建而成;所述果实识别模型包括:一小目标检测头;所述小目标检测头与所述YOLOv8模型的StageLayer1模块以及第二级上采样模块连接,且在对所述果实图像进行识别时,接收所述StageLayer1模块以及所述第二级上采样模块的输出,并根据所述StageLayer1模块以及所述第二级上采样模块的输出,生成特征图。2WO2025/138725[0011]所述选择性内核注意力模块与所述YOLOv8模型的SPPF模块、第一级采样模块[0012]所述选择性内核注意力模块,用于在对所述果实图形进行识别[0013]根据所述SPPF模块的输出,通过多个并行且内[0017]所述RepVGG模块,用于替换所述YOLOv8模型的c2f模块;且[0018]在所述果实识别模型的训练过程中,所述RepVGG模块包括一个3×3卷积分支、一个1×1卷积分支、一个恒等映射分中,所述3×3卷积分支、1×1卷积分支和恒等层;其中,所述3×3卷积层由所述3×3卷积分支、1×1[0021]将所述3×3卷积分支与所述BN层进行融合,生成第一3×3卷积BN分支;将所[0022]将所述1×1卷积BN分支的卷积大小转换为3×3,得到第二3×3卷积BN分支;[0023]将所述第一3×3卷积BN分支、第二3×3卷积BN分支以及恒等映射BN分支进3WO2025/138725PCT/[0026]根据所述样本果实图像,训练所述果实识别模型。[0027]在上述实施例的基础上,本发明另一实施例提供了一种针对小型果实的识别装置,其特征在于,包括:图像获取模块以及识别模块;[0028]所述图像获取模块,用于获取果实图像;[0029]所述识别模块,用于将所述果实图像输入果实识别模型,以使所述果实识别模型对所述果实图像进行识别;[0030]其中,所述果实识别模型基于YOLOv8模型构建而成;所述果实识别模型包括:一小目标检测头;所述小目标检测头与所述YOLOv8模型的StageLayer1模块以及第二级上采样模块连接,且在对所述果实图像进行识别时,接收所述StageLayer1模块以及所述第二级上采样模块的输出,并根据所述StageLayer1模块以及所述第二级上采样模块的输出,生成融合后的特征图。[0031]作为优选方案,所述果实识别模型,还包括:一选择性内核注意力模块;[0032]所述选择性内核注意力模块与所述YOLOv8模型的SPPF模块、第一级采样模块以及第一级检测头连接;[0033]所述选择性内核注意力模块,用于在对所述果实图形进行识别时,接收所述SPPF模块的输出;[0034]根据所述SPPF模块的输出,通过多个并行且内核大小互不相同的卷积分支,获取不同尺度的特征图;[0035]根据所有卷积分支的信息,确定选择权重;根据所述选择权重,将所述不同尺度的特征图进行融合,得到融合后的特征图;[0036]将所述融合后的特征图传输至所述第一级上采样模块以及第一级检测头。[0037]作为优选方案,所述果实识别模型,还包括:若干RepVGG模块;[0038]所述RepVGG模块,用于替换所述YOLOv8模型的c2f模块;且[0039]在所述果实识别模型的训练过程中,所述RepVGG模块包括一个3×3卷积分支、一个1×1卷积分支、一个恒等映射分支、一个BN层和一个ReLU激活;其中,所述3×3卷积分支、1×1卷积分支和恒等映射分支相互平行;且4WO2025/138725[0040]在所述果实识别模型的推理过程中,所述RepVGG模块包括:一个3×3卷积层;其中,所述3×3卷积层由所述3×3卷积分支、1×1[0042]将所述3×3卷积分支与所述BN层进行融合,生成第一3×3卷积BN分支;将所述1×1卷积分支与所述BN层进行融合,生成1×1卷积BN分支;将所述恒等映射[0043]将所述1×1卷积BN分支的卷积大小转换为3×3,得到第二3×3卷积BN分支;备包括处理器、存储器以及存储在所述存储器的计算机程序,所述处理器执行所述计算机程序时实现上述发明实施例所述的质包括存储的计算机程序,其中,在所述计算机程模型识别所述果实图像中各果实所在位置,并确定各果5WO2025/138725样模块的输出,生成特征图。本发明加入小目标检测层附图说明[0057]图6是本发明的RepVGG模块的结构重参数化过程示意图。以及RepVGG模块3。具体实施方式完整地描述,显然,所描述的实施例仅仅是本发的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳[0062]请参照图1,为本发明一实施例提供的一种针对小型果实的识别方法的流程示[0064]需要说明的是,所述果实图像是RGB图像和/或深度图像,通过RealSenseD4356WO2025/138725PCT/块以及第二级上采样模块连接,且在对所述果实图像进行识别时,接收所述StageLayer1模块以及所述第二级上采样模块的输出,并根据所述StageLayer1模块以及所述第二级上采样模块的输出,生成特征图。[0067]请参照图2和图3,图2为原始的YOLOv8网络构架图,图3为本发明的果实识别模型的网络框架图,为改进的YOLOv8网络结构,其中包含了小目标检测头,所述小目标检测头接收所述StageLayer1模块以及所述第二级上采样模块的输出,并根据所述StageLayer1模块以及所述第二级上采样模块的输出,生成大小为160×160×45的特征图。[0068]需要说明的是,原始的YOLOv8网络的下采样倍数比较大,在主干步长为2的降采样过程中,网络可以获得更多的语义信息,但丢失了大量的细节特征信息,缺乏浅层网络信息的问题。然而,细节信息中包含了小尺寸物体的质量特征,这在降采样过程中可能会被忽略。较深的特征图很难学习到小目标的特征信息,加入小目标检测头,对较浅特征图与深特征图拼接后进行检测。可以让网络更加关注小目标的检测,提高检测效果。[0069]在一优选的实施例中,所述果实识别模型,还包括:一选择性内核注意力模块[0070]所述选择性内核注意力模块与所述YOLOv8模型的SPPF模块、第一级采样模块以及第一级检测头连接;[0071]所述选择性内核注意力模块,用于在对所述果实图形进行识别时,接收所述SPPF模块的输出;[0072]根据所述SPPF模块的输出,通过多个并行且内核大小互不相同的卷积分支,获取不同尺度的特征图;[0073]根据所有卷积分支的信息,确定选择权重;根据所述选择权重,将所述不同尺度的特征图进行融合,得到融合后的特征图;[0074]将所述融合后的特征图传输至所述第一级上采样模块以及第一级检测头。[0075]请参照图2、图3和图4,其中,图4为本发明的选择性内核注意力模块的结构图。本发明的果实识别模型的网络框架图,包含了选择性内核注意力模块,所述选择性内核注意力模块与所述YOLOv8模型的SPPF模块、第一级采样模块以7WO2025/138725及第一级检测头连接;所述选择性内核注意力模块,用行识别时,接收所述SPPF模块的输出;根据所述SPPF模块的输出,通过多个并行且内核大小互不相同的卷积分支,获取不支的信息,确定选择权重;根据所述选择权重,将内核注意力机制是一种在卷积神经网络中引入不同内核大小以捕获多尺度上下文信息的注意力机制。在传统的卷积神经网络中制了它们有效捕获局部和全局上下文信息的能力。这些分支可以在不同的空间尺度上捕获信息,使模。选择行内核注意力的关键思想是跨不同内核大小利制学习每个通道对于每种内核大小的重要性,使网息量的内核大小。这种自适应性使得模型可以动态调整感受野,并从不同尺度上收集相关信息。通过将选择行内核注意力引入同时捕获细粒度的局部细节和更大范围的全局上下文,从而提高在各种计[0077]在一优选的实施例中,所述果实识别模型,还包括:若干RepVGG模块;[0078]所述RepVGG模块,用于替换所述YOLOv8模型的c2f模块;且[0079]在所述果实识别模型的训练过程中,所述RepVGG模块包括一个3×3卷积分支、一个1×1卷积分支、一个恒等映射分支、一个BN层和一个ReLU激活;其中,所述3×3卷积分支、1×1卷积分支和恒等[0080]在所述果实识别模型的推理过程中,所述RepVGG模块包括:一个3×3卷积层;其中,所述3×3卷积层由所述3×3卷积分支、1×18WO2025/138725[0082]将所述3×3卷积分支与所述BN层进行融合,生成第一3×3卷积BN分支;将所述1×1卷积分支与所述BN层进行融合,生成1×1卷积BN分支;将所述恒等映射[0083]将所述1×1卷积BN分支的卷积大小转换为3×3,得到第二3×3卷积BN分支;[0084]将所述第一3×3卷积BN分支、第二3×3卷积BN分支以及恒等映射BN分支进[0085]请参照图3和图5,其中图5为本发明的RepVGG模块的结构图。本发明的果实识别模型的网络框架图,包含了若干RepVGG模块,所述RepVGG模块,用于替分支,1×1卷积分支和3×3卷积层,模型训练时,输出y=x+g(x)+f(x),y参数块,对于n层网络,就需要3n个参数块。所以我们理时模型参数量小。结构重参数化就是训练和[0087]请参照图6,为本发明的RepVGG模块的结构重参数化过程示意图,结构重参所述1×1卷积分支与所述BN层进行融合,生成1×1卷积BN分支;将所述恒等映[0089](2)将所述1×1卷积BN分支的卷积大小转换为3×3,得到第二3×3卷积BN分9WO2025/138725PCT/[0094]需要说明的是,训练荔枝识别目标检测模型,使用反向传播迭代的方式,对模型进行训练,以获得适合荔枝识别目标检测的模型参数。[0096]请参照图7,为本发明一实施例提供的一种针对小型果实的识别装置的结构示意图,该装置包括:图像获取模块以及识别模块;[0097]所述图像获取模块,用于获取果实图像;[0098]所述识别模块,用于将所述果实图像输入果实识别模型,以使所述果实识别模型对所述果实图像进行识别;[0099]其中,所述果实识别模型基于YOLOv8模型构建而成;所述果实识别模型包括:一小目标检测头;所述小目标检测头与所述YOLOv8模型的StageLayer1模块以及第二级上采样模块连接,且在对所述果实图像进行识别时,接收所述StageLayer1模块以及所述第二级上采样模块的输出,并根据所述StageLayer1模块以及所述第二级上采样模块的输出,生成融合后的特征图。[0100]在一优选的实施例中,所述果实识别模型,还包括:一选择性内核注意力模块;[0101]所述选择性内核注意力模块与所述YOLOv8模型的SPPF模块、第一级采样模块以及第一级检测头连接;[0102]所述选择性内核注意力模块,用于在对所述果实图形进行识别时,接收所述SPPF模块的输出;[0103]根据所述SPPF模块的输出,通过多个并行且内核大小互不相同的卷积分支,获取不同尺度的特征图;[0104]根据所有卷积分支的信息,确定选择权重;根据所述选择权重,将所述不同尺度的特征图进行融合,得到融合后的特征图;[0105]将所述融合后的特征图传输至所述第一级上采样模块以及第一级检测头。[0106]在一优选的实施例中,所述果实识别模型,还包括:若干RepVGG模块;[0107]所述RepVGG模块,用于替换所述YOLOv8模型的c2f模块;且WO2025/138725[0108]在所述果实识别模型的训练过程中,所述RepVGG模块包括一个3×3卷积分支、一个1×1卷积分支、一个恒等映射分[0109]在所述果实识别模型的推理过程中,所述RepVGG模块包括:一个3×3卷积层;其中,所述3×3卷积层由所述3×3卷积分支、1×1[0111]将所述3×3卷积分支与所述BN层进行融合,生成第一3×3卷积BN分支;将所述1×1卷积分支与所述BN层进行融合,生成1×1卷积BN分支;将所述恒等映射分支与所述BN层进行融合,生成恒等映射BN分支;[0112]将所述1×1卷积BN分支的卷积大小转换为3×3,得到第二3×3卷积BN分支;[0113]将所述第一3×3卷积BN分支、第二3×3卷积BN分支以及恒等映射BN分支进器以及存储在所述存储器中且被配置为由所述处理器处理器执行所述计算机程序时实现上述发明实施例所述的针对小型果实的识别方法。程序,其中,在所述计算机程序运行时控制所述计算机件说明的单元可以是或者也可以不是物理上分开的,作WO2025/138725PCT/是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。[0122]所述领域的技术人员可以清楚地了解到,为的方便和简洁,上述描述的装置的具体工作过程,可参考前述方法实施例中对应的过程,在此不再赘述。[0123]设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述设备可包括,但不仅限于,处理器、存储器。[0124]所述处理器可以是中央处理单元(CentralProcessingUnit,CPU),还可以是ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述设备的控制中心,利用各种接口和线路连接整个设备的各个部分。[0125]所述存储器可用于存储所述计算机程序,所述处理器通过运行或执行存储在所述存储器内的计算机程序,以及调用存储在存储器内的数据,实现所述设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigit一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。[0126]所述存储介质为计算机可读存储介质,所述计算机程序存储在所述计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机WO2025/138725可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。[0127]以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。[0128]以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。WO2025/138725PCT/C[权利要求1][权利要求2]一种针对小型果实的识别方法,其特征在于,包括:获取果实图像;将所述果实图像输入果实识别模型,以使所述果实识别模型识别所述果实图像中各果实所在位置,并确定各果实是否成熟;其中,所述果实识别模型基于YOLOv8模型构建而成;所述果实识别模型包括:一小目标检测头;所述小目标检测头与所述YOLOv8模型的StageLayer1模块以及第二级上采样模块连接,且在对所述果实图像进行识别时,接收所述StageLayer1模块以及所述第二级上采样模块的输出,并根据所述StageLayer1模块以及所述第二级上采样模块的输出,生成特征图。如权利要求1所述的针对小型果实的识别方法,其特征在于,所述果实识别模型,还包括:一选择性内核注意力模块;所述选择性内核注意力模块与所述YOLOv8模型的SPPF模块、第一级采样模块以及第一级检测头连接;所述选择性内核注意力模块,用于在对所述果实图形进行识别时,接收所述SPPF模块的输出;根据所述SPPF模块的输出,通过多个并行且内核大小互不相同的卷积分支,获取不同尺度的特征图;根据所有卷积分支的信息,确定选择权重;根据所述选择权重,将所述不同尺度的特征图进行融合,得到融合后的特征图;将所述融合后的特征图传输至所述第一级上采样模块以及第一级检[权利要求3]测头。如权利要求1所述的针对小型果实的识别方法,其特征在于,所述果实识别模型,还包括:若干RepVGG模块;所述RepVGG模块,用于替换所述YOLOv8模型的c2f模块;且在所述果实识别模型的训练过程中,所述RepVGG模块包括一个WO2025/138725PCT/C层和一个ReLU激活;其中,所述3×3卷积分支、1×1卷积分支和恒等映射分支相互平行;且在所述果实识别模型的推理过程中,所述RepVGG模块包括:一个3×3卷积层;其中,所述3×3卷积层由所述3×3卷积分支、1×1卷积分支和恒等映射分支经过结构重参数化操作得到。其中,所述结构重参数化操作,包括:将所述3×3卷积分支与所述BN层进行融合,生成第一3×3卷积BN分支;将所述1×1卷积分支与所述BN层进行融合,生成1×1卷积BN分支;将所述恒等映射分支与所述BN层进行融合,生成恒等映射BN分支;将所述1×1卷积BN分支的卷积大小转换为3×3,得到第二3×3卷积BN分支;将所述第一3×3卷积BN分支、第二3×3卷积BN分支以及恒等映射BN分支进行融合,得到所述3×3卷积层。[权利要求4]如权利要求1所述的针对小型果实的识别方法,其特征在于,所述果实识别模型的训练过程,包括:[权利要求4]获取若干样本果实图像;其中,所述样本果实图像中所有目标对象均已被标注为对应的矩形框,并设置了对应的用于指示果实是否成熟的标签;根据所述样本果实图像,训练所述果实识别模型。[权利要求5]一种针对小型果实的识别装置,其特征在于,包括:图像获取模块以及识别模块;[权利要求5]所述图像获取模块,用于获取果实图像;所述识别模块,用于将所述果实图像输入果实识别模型,以使所述果实识别模型对所述果实图像进行识别;其中,所述果实识别模型基于YOLOv8模型构建而成;所述果实识别模型包括:一小目标检测头;所述小目标检测头与所述YOLOv8模型的StageLayer1模块以及第二级上采样模块连接,且在对所述果WO2025/138725PCT/C实图像进行识别时,接收所述StageLayer1模块以及所述第二级上采样模块的输出,并根据所述StageLayer1模块以及所述第二级上采样模块的输出,生成融合后的特征图。[权利要求6]如权利要求5所述的对小型果实的识别装置,其特征在于,所述果实识别模型,还包括:一选择性内核注意力模块;所述选择性内核注意力模块与所述YOLOv8模型的SPPF模块、第一级采样模块以及第一级检测头连接;所述选择性内核注意力模块,用于在对所述果实图形进行识别时,接收所述SPPF模块的输出;根据所述SPPF模块的输出,通过多个并行且内核大小互不相同的卷积分支,获取不同尺度的特征图;根据所有卷积分支的信息,确定选择权重;根据所述选择权重,将所述不同尺度的特征图进行融合,得到融合后的特征图;[权利要求7]将所述融合后的特征图传输至所述第一级上采样模块以及第一级检如权利要求5所述的对小型果实的识别装置,其特征在于,所述果实识别模型,还包括:若干RepVGG模块;所述RepVGG模块,用于替换所述YOLOv8模型的c2f模块;且在所述果实识别模型的训练过程中,所述RepVGG模块包括一个层和一个ReLU激活;其中,所述3×3卷积分支、1×1卷积分支和恒等映射分支相互平行;且在所述果实识别模型的推理过程中,所述RepVGG模块包括:一个3×3卷积层;其中,所述3×3卷积层由所述3×3卷积分支、1×1卷积分支和恒等映射分支经过结构重参数化操作得到。其中,所述结构重参数化操作,包括:将所述3×3卷积分支与所述BN层进行融合,生成第一3×3卷积BN分支;将所述1×1卷积分支与所述BN层进行融合,生成1×1卷积WO2025/138725PCT/CN2024/105BN分支;将所述恒等映射分支与所述BN层进行融合,生成恒等映将所述1×1卷积BN分支的卷积大小转换为3×3,得到第二3×3卷积BN分支;[权利要求8]将所述第一3×3卷积BN分支、第二3×3卷积BN分支以及恒等映射BN分支进行融合,得到所述3×3卷积层。如权利要求5所述的对小型果实的识别装置,其特征在于,所述果实识别模型的训练过程,包括:获取若干样本果实图像;其中,所述样本果实图像中所有目标对象均已被标注为对应的矩形框,并设置了对应的用于指示果实是否成熟的标签;[权利要求9]根据所述样本果实图像,训练所述果实识别模型。一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4中任意一项所述的针对小型果实的识别方法。[权利要求10]一种存储介质,其特征在于,所述存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至4中任意一项所述的针对小型果实的识别方法。WO2025/138725[图1]获取果实图像;将所述果实图像输入果实识别模型,以使所述果实识别模型识别所述果实图像中各果实所在位置,并确定各果实是否成熟;其中,所述果实识别模型基于YOLOv8模型构建而成;所述果实识别模型包括:一小目标检测头;所述小目标检测头与所述YOLOv8模型的StageLayer1模块以及第二级上采样模块连接,且在对所述果实图像进行识别时,接收所述StageLayer1模块以及所述第二级上采样模块的输出,并根据所述StageLayer1模块以及所述第二级上采样模块的输出,生成特征图。[图2]eeWO2025/138725[图3][图4][图5][图6][图7]Minimumdocumentationsearched(classificationsystemfollowedbyElectronicdatabaseconsultedduringtheinternationalseVEN,CNABS,CNTXT,WOTXT,EPTXT,USTXT,CNKI,IEEE:果实,水果,小对象,检测,图像,采样,模型,yolo,fruit,Citationofdocument,withindication,whereappropriate,oftherPXCN117789199A(SHENZHENPOLACN112508924A(GUILINUNIVERSITYOAUS2018114294A1(HTCCORP.)26April2018(2018-04-26tobeofparticularrelevance“D”documentcitedbytheapplicantintheinternationalapplication“X”d“E”earlierapplicationorpatentbutp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论