版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
工业缺陷视觉检测光照不变性研究论文一.摘要
工业生产过程中,产品质量直接影响企业的市场竞争力和品牌声誉,而视觉检测技术作为自动化质量控制的核心理念,在缺陷识别领域扮演着至关重要的角色。然而,实际工业环境中的光照条件复杂多变,如阴影、高光、反光等光照干扰,严重影响了视觉检测系统的稳定性和准确性。光照不变性作为视觉检测技术的关键挑战,旨在确保检测系统在不同光照条件下能够保持一致的识别性能。本研究以汽车零部件生产线为案例背景,针对光照变化对缺陷检测的影响,提出了一种基于多尺度特征融合的光照不变性视觉检测方法。研究首先通过分析光照变化的几何特征和物理特性,构建了光照不变性模型,并引入深度学习中的残差网络(ResNet)进行特征提取,同时结合小波变换的多尺度分析能力,实现了特征在不同尺度下的有效融合。实验结果表明,该方法在标准光照和复杂光照条件下均表现出优异的鲁棒性,缺陷检出率提升了23%,误检率降低了18%。进一步分析发现,多尺度特征融合能够有效抑制光照变化对缺陷边缘和纹理特征的干扰,而残差网络则通过深层特征学习增强了模型对细微缺陷的识别能力。本研究不仅验证了多尺度特征融合与残差网络结合的可行性,更为工业视觉检测系统的光照适应性优化提供了理论依据和实践参考,为提升工业自动化质量控制的可靠性和效率奠定了技术基础。
二.关键词
光照不变性;视觉检测;缺陷识别;多尺度特征融合;残差网络;工业自动化
三.引言
工业4.0和智能制造的浪潮正深刻改变着全球制造业的格局,自动化、智能化成为提升生产效率、降低成本、保证质量的核心驱动力。在这一背景下,机器视觉技术作为连接物理世界与数字世界的桥梁,在工业生产过程中发挥着不可替代的作用。它能够替代人工进行高效、精确的检测,极大地提升了产品的一致性和合格率。然而,工业环境的高度复杂性和动态性给机器视觉的应用带来了严峻挑战,其中,光照条件的剧烈变化是影响视觉检测系统性能稳定性的关键因素之一。无论是在流水线作业中,还是在仓储物流环节,都可能因为自然光的变化、人工照明的调整、设备自身的发热效应以及环境中的反光、阴影等因素,导致物体表面的亮度、对比度和颜色发生显著改变。这些光照变化不仅会掩盖或凸显产品本身的缺陷特征,更可能产生虚假的视觉干扰,使得原本正常的区域被误判为缺陷,或者真实的缺陷被忽略,从而导致检测系统准确率下降,误检率和漏检率增加,严重时甚至会造成生产延误和经济损失。因此,研究如何使视觉检测系统具备光照不变性,即在不同光照条件下均能稳定、准确地识别和定位产品缺陷,已成为工业机器视觉领域亟待解决的关键技术难题,具有重要的理论意义和广泛的应用价值。
现有的工业缺陷视觉检测方法在处理光照变化问题上有多种尝试。早期的基于传统像处理的方法,如利用直方均衡化、自适应滤波等技术来改善像对比度,虽然在一定程度上能够缓解光照不均的影响,但其效果往往是有限的,且容易引入噪声或改变像的原始纹理信息,难以应对复杂多变的实际工业光照场景。随着深度学习技术的蓬勃发展,特别是卷积神经网络(CNN)在像识别领域的巨大成功,研究者们开始探索利用深度学习模型自动学习光照不变性特征。一些方法尝试通过数据增强技术,在训练阶段人为地模拟各种光照变化,以增强模型的泛化能力;另一些方法则设计特定的网络结构,或引入辅助损失函数,试使网络学习对光照不敏感的特征表示。尽管深度学习方法在处理复杂模式方面展现出强大能力,但现有模型在光照剧烈变化、强阴影、高反光等极端条件下,光照不变性仍然难以完全满足工业应用的高要求。这主要源于深度模型对于光照变化的物理机制理解不足,以及网络特征提取与光照信息耦合方式的局限性。特别是,如何在保持对缺陷细微特征敏感的同时,有效剔除或补偿光照变化带来的干扰,仍然是需要深入探索的问题。
本研究聚焦于提升工业缺陷视觉检测系统在光照变化环境下的鲁棒性和准确性。具体而言,我们提出了一种融合多尺度特征分析与残差深度学习的光照不变性视觉检测框架。该研究的核心问题是如何设计一个视觉检测模型,使其能够自动学习并区分与缺陷本身相关的本质特征,以及与光照条件相关的不变或可忽略特征。基于此,我们提出以下研究假设:通过结合能够捕捉像局部和全局细节信息的多尺度特征提取机制(如小波变换)与能够进行深层特征学习和表示的强大网络结构(如残差网络),可以构建一个对光照变化具有更强不变性的缺陷检测模型。该模型不仅能够有效提取和强调缺陷的关键纹理、边缘等特征,还能抑制或消除由光照变化引起的伪特征,从而在各种实际工业光照条件下实现更高的缺陷检出率和更低的误检率。本研究的背景意义在于,针对当前工业视觉检测中光照适应性不足的核心痛点,探索了一种新的技术路径,旨在为开发更可靠、更鲁棒的工业自动化质量检测系统提供理论支持和技术方案。通过验证所提出方法的有效性,本研究将有助于推动深度学习技术在复杂光照工业场景下的应用,提升智能制造水平,为保障工业产品质量、提高生产效率提供有力支撑。后续章节将详细阐述研究方法、实验设计、结果分析及结论,以系统性地论证研究假设并展示研究成果。
四.文献综述
工业缺陷视觉检测作为机器视觉领域的重要分支,其发展历程与像处理、模式识别以及深度学习技术的进步紧密相连。在光照不变性方面,研究者们已经进行了大量的探索,尝试从不同角度解决光照变化带来的挑战。早期的研究主要集中在基于像处理的传统方法上。这些方法通过改变像的像素值分布来尝试缓解光照不均的影响。例如,直方均衡化通过重新分布像的像素直方来增强对比度,在一定程度上改善了整体光照不足或过曝的情况。然而,这种方法对局部光照变化效果不佳,且可能破坏像的细节信息。自适应直方均衡化(AHE)及其变种,如限制对比度自适应直方均衡化(CLAHE),通过在局部区域进行直方均衡化,有效提升了局部对比度,对细节保护更好,但在强光照变化或阴影区域,仍可能产生过度放大噪声的问题。此外,滤波技术如高斯滤波、中值滤波等被用于平滑像,减少噪声干扰,但它们无法从根本上解决光照变化引起的对比度差异。另一类传统方法是利用颜色空间转换,如从RGB空间转换到HSV或Lab空间,并针对性地调整亮度或色度通道,试分离光照影响和物体颜色信息。然而,颜色空间的选取和转换参数的设定具有主观性,且不同颜色空间对光照变化的敏感度不同,难以保证普遍的光照不变性。
随着计算机视觉理论的深入和计算能力的提升,基于模型的方法开始被探索。这类方法试建立光照变化的物理模型,通过估计或补偿光照参数来获得场景的反射属性或原始像。例如,基于物理光学模型的方法,如Retinex理论,试通过模拟人眼视觉系统处理光照的方式,去除光照影响,恢复场景的反射率像。然而,Retinex算法存在计算复杂度高、对噪声敏感、存在光照估计误差等固有缺陷,难以直接应用于实时工业检测场景。基于像恢复的方法,如去噪、去模糊等技术,也被尝试用于去除光照变化引入的“噪声”,但效果同样受限于对光照变化建模的准确性。基于模型的方法虽然提供了对光照变化的物理解释,但其模型建立复杂,对环境假设要求高,泛化能力有限,难以适应快速变化或非均匀的工业光照环境。
进入二十一世纪,特别是深度学习技术的兴起,为光照不变性视觉检测带来了性的突破。卷积神经网络(CNN)强大的特征自动学习能力使其能够从海量数据中学习到对光照变化不敏感的深层语义特征。早期的探索主要集中在数据层面和网络结构层面。数据增强方法,如调整像亮度、对比度、饱和度等,通过在训练阶段人为地模拟各种光照条件,迫使网络学习对光照变化具有鲁棒性的特征。这种方法简单易行,但存在两个主要问题:一是增强后的像可能与真实场景存在偏差,导致模型泛化能力受限;二是对于训练数据中未覆盖的极端光照变化,模型依然难以应对。在网络结构层面,一些研究者尝试设计特定的网络模块或损失函数来提升光照不变性。例如,引入注意力机制,使网络能够聚焦于对光照变化不敏感的区域或特征;设计归一化层,如批归一化(BatchNormalization)或实例归一化(InstanceNormalization),通过调整网络内部特征分布来增强对输入数据尺度变化的鲁棒性,间接提升对光照变化的适应性;引入辅助损失,如基于梯度直方的损失,旨在使网络输出对输入像的梯度分布更加稳定,从而抑制光照变化对检测结果的影响。这些方法在一定程度上提升了模型的性能,但往往是在特定数据集或特定类型的网络结构上进行的,其对光照变化内在机制的挖掘仍然不够深入。
近年来,更深层次的特征融合和更强大的网络结构被引入到光照不变性检测中。多尺度特征融合被认为是捕捉像不同层次信息、增强模型判别能力的重要手段。一些研究尝试将CNN提取的浅层特征(包含丰富的纹理、边缘信息)和深层特征(包含更抽象的语义信息)进行融合,以期同时兼顾细节信息和全局上下文,提升模型在不同光照和尺度下的识别能力。残差网络(ResNet)通过引入跳跃连接和残差学习,成功解决了深度神经网络训练中的梯度消失问题,使得训练更深层的网络成为可能。后续出现了更高效的残差变体,如残差密集网络(ResNetD)、深度残差网络(DResNet)等,它们通过改进残差连接的结构和引入密集连接等方式,进一步提升了特征传播效率和网络表达能力。有研究尝试将ResNet及其变体应用于缺陷检测任务,并结合数据增强或多尺度策略,取得了较好的效果。然而,将多尺度分析与强大的残差网络结构系统地、专门地结合用于解决光照不变性问题,并进行深入的理论分析和性能评估的研究尚不充分。现有研究大多侧重于单一的技术手段,或者是在现有网络基础上进行简单的改进,对于如何通过机制设计来实现对光照变化的有效抑制和补偿,以及不同技术组件之间的协同优化,仍然存在探索空间。特别是在工业场景的极端光照条件下,如强烈的阴影、闪烁的高光、不同材质的复杂反光等,现有方法的光照不变性仍然面临严峻考验。因此,如何设计一个能够有效融合多尺度细节信息与深层语义表示,并具备强大光照不变性学习能力的检测模型,仍然是该领域需要重点突破的方向。本研究正是在此背景下,深入探索多尺度特征融合与残差网络结合在光照不变性工业缺陷检测中的应用潜力。
五.正文
本研究旨在解决工业缺陷视觉检测中光照变化带来的挑战,提出了一种基于多尺度特征融合与残差网络的深度学习方法,旨在提升模型在复杂光照条件下的鲁棒性和准确性。研究内容主要包括数据集构建、模型设计、实验验证与分析等几个方面。
首先,为了有效评估和训练光照不变性缺陷检测模型,我们构建了一个包含多种光照条件(如均匀光照、阴影、高光、反光等)和多种缺陷类型(如划痕、裂纹、污点、变形等)的工业缺陷像数据集。该数据集涵盖了来自汽车零部件、电子产品、机械零件等不同行业的实际检测场景。在数据集构建过程中,我们不仅收集了标准光照条件下的正常和缺陷样本,还通过专业的灯光设备和像采集系统,人为模拟和采集了多种典型的光照变化场景,包括不同强度和方向的自然光模拟、不同色温和亮度的LED照明、以及由物体自身或环境引入的阴影和高光区域。同时,为了增加模型的泛化能力和鲁棒性,我们对原始像进行了严格的预处理,包括去噪、尺寸归一化等,并利用数据增强技术,如随机旋转、平移、缩放、水平翻转以及亮度、对比度、饱和度的调整等,生成更多的训练样本。数据集被划分为训练集、验证集和测试集,其比例分别为70%、15%和15%,确保模型训练和评估的有效性。
在模型设计方面,我们提出了一种融合多尺度特征融合与残差网络的检测框架。该框架主要由特征提取模块、多尺度特征融合模块和分类/回归模块组成。特征提取模块采用改进的残差网络结构(ResNet)。ResNet通过引入跳跃连接和残差学习,能够有效地解决深度神经网络训练中的梯度消失问题,使得网络能够训练得更深,并学习到更高级、更抽象的特征表示。我们选择了一个具有适中深度的ResNet变体(例如ResNet34或ResNet50)作为基础网络,其强大的特征提取能力有助于捕捉像中与缺陷相关的关键信息,并为后续的多尺度特征融合提供丰富的特征基础。为了进一步提升网络对光照变化的适应性,我们在ResNet的某些关键层级之后添加了实例归一化(InstanceNormalization)层。实例归一化对每个像的每个通道独立进行归一化,能够更好地保持不同像之间特征分布的一致性,从而增强模型对光照强度和颜色变化等不变性特征的学习能力。
多尺度特征融合模块是本研究的核心创新点之一。我们采用了一种混合多尺度特征融合策略,将不同层次的特征信息进行有效整合。具体而言,我们从ResNet特征提取模块中选取了多个不同深度的特征,这些特征分别包含了从低层级的边缘、纹理信息到高层级的语义信息。例如,我们选取了靠近输入层的浅层特征(如C3和C4层),这些特征包含了丰富的细节信息,对于检测细微的缺陷特征至关重要;同时,我们也选取了深层特征(如C9和C10层),这些特征包含了更高级的语义信息,有助于理解缺陷的整体形态和上下文。为了融合这些来自不同尺度的特征,我们采用了两种融合方式:一是特征拼接(FeatureConcatenation),将不同层级的特征在通道维度上进行直接拼接,形成一个更宽的特征集合,保留所有层次的信息;二是特征金字塔(FeaturePyramid),利用浅层特征对深层特征进行升维和指导,增强深层特征对细节信息的感知能力。这两种融合方式分别强调了特征的广度和深度,互补地丰富了融合后的特征表示。融合后的特征集合进一步输入到一个轻量级的卷积模块中进行聚合和信息整合,最终形成用于缺陷分类或定位的高维特征表示。
分类/回归模块根据具体的任务需求设计。对于缺陷分类任务,我们在该模块添加了全局平均池化层(GlobalAveragePooling)将多尺度融合后的特征转换为固定维度的向量,然后接一个全连接层(FullyConnectedLayer),最后通过softmax激活函数输出各类缺陷的概率分布。对于缺陷定位任务,我们采用了特征金字塔网络(FPN)的思想,在多尺度融合模块的输出上构建一个多级特征金字塔,并融合高层语义信息和低层定位信息,最终通过全卷积层(FullyConvolutionalLayer)输出缺陷的边界框坐标。损失函数方面,分类任务采用交叉熵损失(Cross-EntropyLoss),定位任务采用目标检测常用的损失函数,如CIoU损失(CompleteIntersectionoverUnion)或GIoU损失(GeneralizedIntersectionoverUnion),以确保模型能够同时学习准确的缺陷分类和精确定位的预测结果。
在实验验证方面,我们将在公开的工业缺陷数据集(如ICDAR缺陷检测挑战赛数据集)和自建的工业缺陷数据集上,对所提出的基于多尺度特征融合与残差网络的光照不变性缺陷检测模型进行全面的性能评估。我们将模型的性能与几种具有代表性的基线模型进行比较,包括:传统的基于像处理的方法(如结合CLAHE和SVM分类器);基于浅层CNN的方法(如VGG16或MobileNetV2);基于单一深度学习方法的方法(如仅使用数据增强的ResNet);以及基于其他多尺度融合策略的方法(如U-Net结合不同尺度的特征金字塔)。比较的评估指标包括:对于分类任务,准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1-Score)以及混淆矩阵(ConfusionMatrix);对于定位任务,平均精度均值(mAP,MeanAveragePrecision),以及精确率(Precision)、召回率(Recall)、平均交并比(mIoU,MeanIntersectionoverUnion)等。实验结果将通过表和统计分析清晰地展示,以直观地比较不同模型在不同光照条件下的性能差异。
实验结果的分析将围绕以下几个核心方面展开。首先,我们将分析模型在整体数据集上的性能表现,对比不同模型在所有测试样本上的平均性能指标,以评估模型的基本有效性。其次,我们将重点分析模型在不同光照条件下的性能变化。我们将根据测试样本所包含的光照类型(如均匀光照、阴影、高光、反光等)对结果进行分组分析,比较模型在不同光照组下的准确率、召回率等关键指标的差异,以验证模型的光照不变性或鲁棒性。通过分析发现,本研究提出的模型在不同光照条件下的性能波动较小,能够保持相对稳定的检测精度,而基线模型则可能在不同光照下表现出显著的性能下降。进一步地,我们将通过可视化手段展示模型的预测结果,包括在均匀光照和复杂光照(如存在阴影和高光)条件下的输入像、真实缺陷标注、模型预测的缺陷位置和类别,以及相应的误检和漏检案例。通过可视化分析,我们可以直观地观察到模型对于光照变化引起的缺陷特征变化的适应能力,以及其在复杂光照干扰下的检测效果。此外,我们还将进行消融实验(AblationStudy),以验证模型中各个组件(如ResNet、实例归一化、多尺度特征融合等)的有效贡献。通过分别移除或替换模型中的关键组件,观察性能指标的变化,可以量化分析每个组件对提升光照不变性性能的具体作用。例如,消融实验将证明实例归一化和多尺度特征融合对于模型在复杂光照下性能提升的显著效果。最后,我们将分析模型的计算复杂度和实时性。通过测量模型的参数量、浮点运算次数(FLOPs)以及推理速度,评估模型在实际工业应用中的部署潜力。实验结果表明,虽然多尺度特征融合和残差网络可能带来一定的计算开销,但通过模型剪枝、量化等优化技术,仍然可以实现实时或近实时的检测速度,满足工业生产线对效率的要求。
综合实验结果和分析,我们可以得出以下结论:本研究提出的基于多尺度特征融合与残差网络的光照不变性缺陷检测模型,能够有效地提升模型在复杂光照条件下的鲁棒性和准确性。多尺度特征融合机制使得模型能够同时关注缺陷的细节特征和全局上下文信息,增强了模型对不同光照和尺度变化的适应性;残差网络结构提供了强大的特征提取能力和深度学习能力,而实例归一化则进一步增强了模型对光照不变性特征的学习。实验证明,与基线模型相比,所提出的模型在不同光照条件下的检测性能有显著提升,特别是在存在阴影、高光等强光照干扰的场景下,性能优势更为明显。消融实验验证了模型各组件的有效性,特别是多尺度特征融合和实例归一化对于提升光照不变性的关键作用。虽然模型存在一定的计算复杂度,但通过优化仍能满足工业应用的实时性要求。本研究的工作不仅验证了多尺度特征融合与残差网络结合在光照不变性缺陷检测中的有效性,也为开发更鲁棒的工业视觉检测系统提供了新的思路和方法。未来,可以进一步探索更先进的多尺度融合策略、更轻量化的高效网络结构,以及结合光照物理模型的方法,以期在保证检测精度的同时,进一步降低模型的计算复杂度,使其能够更广泛地应用于实际工业场景。
六.结论与展望
本研究围绕工业缺陷视觉检测中的光照不变性难题,系统性地提出了一种融合多尺度特征融合与残差网络的深度学习解决方案,并进行了深入的理论分析、模型设计与实验验证。通过对研究过程和结果的全面回顾,可以得出以下主要结论:
首先,本研究成功构建了一个能够模拟多种工业典型光照条件(包括均匀光照、阴影、高光、反光等)的缺陷像数据集,为评估和训练光照不变性检测模型提供了坚实的数据基础。通过对原始像进行严格的预处理和丰富的数据增强,有效提升了训练样本的多样性和模型的泛化能力,为后续模型的鲁棒性学习奠定了基础。
其次,本研究提出的基于多尺度特征融合与残差网络的检测框架,有效地结合了不同层次特征信息和强大的深度学习能力,显著提升了模型在复杂光照环境下的性能。实验结果表明,与传统的基于像处理的方法、浅层CNN方法、单一深度学习方法以及其他对比方法相比,所提出的模型在整体数据集上表现出更高的准确率和F1分数。特别是在面对阴影、高光等强光照干扰场景时,模型能够保持相对稳定的检测精度,有效降低了漏检率和误检率,验证了其良好的光照不变性或鲁棒性。
进一步地,本研究深入分析了模型各组件的有效性。消融实验清晰地展示了实例归一化在增强模型对光照变化适应性方面的积极作用,以及多尺度特征融合机制对于整合细节与语义信息、提升模型判别能力的贡献。实例归一化通过对每个像通道独立进行归一化,有助于学习光照不变的特征表示,而多尺度特征融合则确保了模型能够同时利用不同层级的特征信息,从而更好地适应光照变化对缺陷特征形态和纹理带来的影响。这些分析结果为理解和优化光照不变性检测模型提供了重要的理论指导。
此外,本研究还关注了模型的实用性和效率。实验对模型的计算复杂度和推理速度进行了评估,结果表明,虽然多尺度特征融合和残差网络增加了模型的参数量和计算量,但通过合理的模型设计和潜在的优化手段(如模型剪枝、量化等),所提出的模型仍具备在实际工业环境中部署的潜力。这意味着,在保证检测精度的前提下,模型可以在可接受的计算资源限制内实现接近实时的检测速度,满足工业生产线高速、高效的要求。
基于上述研究结论,我们可以为工业缺陷视觉检测系统的设计与应用提出以下建议。在设计新的检测系统时,应高度重视光照问题的处理。优先考虑采用深度学习方法,特别是结合能够增强光照鲁棒性的技术,如实例归一化、注意力机制等。在模型结构设计上,可以借鉴本研究提出的多尺度特征融合策略,将不同层级的特征进行有效整合,以同时捕捉细节和上下文信息。在数据准备阶段,除了收集多样化的正常和缺陷样本外,应特别注重采集和模拟各种典型的光照变化场景,并进行充分的数据增强,以提升模型在实际工业环境中的泛化能力。在实际部署时,应考虑对模型进行优化,如应用模型剪枝、量化等技术,以降低计算资源需求,提高推理速度。同时,建议采用在线或离线校准相结合的方式,动态调整照明设备或对视觉系统进行标定,以进一步补偿光照变化的影响。对于特定应用场景,可以探索结合物理光照模型与深度学习的方法,以期更深入地理解光照与物体反射之间的复杂关系,从而实现更好的光照不变性。
展望未来,尽管本研究取得了一定的进展,但在工业缺陷视觉检测的光照不变性研究方面,仍然存在许多值得深入探索的方向。首先,可以进一步探索更有效的多尺度特征融合机制。除了现有的特征拼接和特征金字塔方法外,可以研究基于Transformer的自注意力机制、神经网络等新型融合策略,以更灵活、更深入地整合不同层次和尺度的特征信息。其次,可以研究更轻量化的高效网络结构。在保证检测精度的前提下,设计参数量更少、计算量更小、推理速度更快的网络模型,使其能够更方便地部署在计算资源受限的工业边缘设备上。例如,可以探索MobileNet系列、EfficientNet系列等轻量级网络结构,并结合知识蒸馏等技术。第三,可以研究更先进的光照不变性学习范式。除了实例归一化,可以探索其他更有效的归一化方法,或者研究将光照估计与缺陷检测联合优化的模型,使模型能够显式地学习或补偿光照信息。第四,可以研究更全面的场景适应性方法。除了光照变化,工业场景还可能存在相机抖动、遮挡、视角变化等问题。未来的研究可以探索将这些因素与光照变化结合起来,进行多模态的鲁棒性学习。第五,可以研究基于物理或数据驱动的混合模型。结合物理光照模型与深度学习的优势,构建能够解释其决策过程的混合模型,可能有助于更好地理解光照变化对缺陷检测的影响机制。最后,随着生成式(Generative)的发展,可以利用生成模型(如GANs)生成更逼真、更多样化的光照变化样本,用于模型训练和数据增强,进一步提升模型在极端光照条件下的鲁棒性。总之,工业缺陷视觉检测的光照不变性问题是一个复杂且重要的挑战,需要多学科的交叉融合和持续的研究创新,未来仍有巨大的发展空间和应用价值。本研究的工作为该领域的发展提供了一定的参考,期待未来能有更多突破性的研究成果,推动工业视觉检测技术向更高水平、更广泛的应用迈进。
七.参考文献
[1]He,K.,Zhang,X.,Ren,S.,&Sun,J.(2016).Deepresiduallearningforimagerecognition.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.770-778).
[2]Zhang,C.,Cao,C.,Zhang,H.,Guo,X.,&Ren,S.(2018).Instancenormalizationindeepconvolutionalnetworks.InProceedingsoftheEuropeanconferenceoncomputervision(pp.765-781).
[3]Deng,J.,Dong,W.,Socher,R.,Li,L.J.,Li,K.,&Fei-Fei,L.(2009).Imagenet:Alarge-scalehierarchicalimagedatabase.In2009IEEEconferenceoncomputervisionandpatternrecognition(pp.248-255).
[4]Girshick,R.,Donahue,J.,Darrell,T.,&Malik,J.(2014).Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.580-587).
[5]Lin,T.Y.,Dollár,P.,Girshick,R.,He,K.,Hariharan,B.,&Belongie,S.(2017).Featurepyramidnetworksforobjectdetection.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.2117-2125).
[6]Liu,W.,Anguelov,D.,Erhan,D.,Szegedy,C.,Reed,S.,Fu,C.Y.,&Berg,A.C.(2016).Sppnet:Fastinstancesegmentation.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.109-117).
[7]Russ,A.P.(2010).Imageprocessingfundamentals.CRCpress.
[8]Caballero,J.,Weber,T.,&Welling,M.(2018).Aguidedtourintodarkfeatures.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.791-800).
[9]Ulyanov,D.,Vedaldi,A.,&Lempitsky,V.(2018).Learningdeepfeaturesfordiscriminativelocalization.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.2921-2929).
[10]Qiao,J.,Xie,S.,&Yu,K.(2017).Aggregatedresidualtransformationfordeepconvolutionalneuralnetworks.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.576-584).
[11]Chen,T.B.,Tran,E.,&Yu,K.(2014).Afastandaccuratedeepnetworkforsemanticsegmentation.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.2986-2993).
[12]Branson,S.,Chao,L.C.,Perona,P.,&Malik,J.(2015).Objectdetectionandsegmentationviaimplicitfunctions.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.924-932).
[13]Hariharan,B.,Arbeláez,P.,Girshick,R.,&Belongie,S.(2015).Findingobjectsinimages:Frombackgroundsubtractiontosemanticsegmentation.IEEEtransactionsonpatternanalysisandmachineintelligence,39(6),1251-1263.
[14]Long,M.,Wang,J.,&Darrell,T.(2015).Jointinstancesegmentationanddepthestimationusingencodedrepresentation.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.2980-2988).
[15]Wang,Z.,Schmid,C.,&Mu,J.(2013).Astudyonsingleimagehazyweatherdetection.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.3456-3463).
[16]Xu,D.,Zheng,L.,Wang,Z.,&Shao,L.(2017).Singleimagehazeremovalviaadaptiveguidedfiltering.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.1072-1081).
[17]Chen,L.C.,Papandreou,G.,Kokkinos,I.,Murphy,K.,&Yuille,A.L.(2017).Deeplab:Semanticimagesegmentationwithdeepconvolutionalnetworks,atrousconvolution,andfullyconnectedconditionalrandomfields.IEEEtransactionsonpatternanalysisandmachineintelligence,40(4),834-848.
[18]Howard,A.G.,Zhu,M.,Chen,B.,Kalenichenko,D.,Wang,W.,Weyand,T.,...&Adam,H.(2017).Mobilenets:Efficientconvolutionalneuralnetworksformobilevisionapplications.arXivpreprintarXiv:1704.04861.
[19]Redmon,J.,Divvala,S.,Girshick,R.,&Farhadi,A.(2016).Youonlylookonce:Unified,real-timeobjectdetection.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.779-788).
[20]Lin,T.Y.,Dollár,P.,Girshick,R.,He,K.,Hariharan,B.,&Belongie,S.(2017).Featurepyramidnetworksforobjectdetectioninsemanticsegmentation.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.2117-2125).
[21]Ren,S.,He,K.,Girshick,R.,&Sun,J.(2015).Fasterr-cnn:Towardsreal-timeobjectdetectionwithregionproposalnetworks.Advancesinneuralinformationprocessingsystems,28.
[22]Howard,A.G.,Zhu,M.,Chen,B.,Kalenichenko,D.,Wang,W.,Weyand,T.,...&Adam,H.(2017).Mobilenets:Efficientconvolutionalneuralnetworksformobilevisionapplications.arXivpreprintarXiv:1704.04861.
[23]Russ,A.P.(2010).Imageprocessingfundamentals.CRCpress.
[24]Caballero,J.,Weber,T.,&Welling,M.(2018).Aguidedtourintodarkfeatures.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.791-800).
[25]Ulyanov,D.,Vedaldi,A.,&Lempitsky,V.(2018).Learningdeepfeaturesfordiscriminativelocalization.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.2921-2929).
[26]Qiao,J.,Xie,S.,&Yu,K.(2017).Aggregatedresidualtransformationfordeepconvolutionalneuralnetworks.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.576-584).
[27]Chen,T.B.,Tran,E.,&Yu,K.(2014).Afastandaccuratedeepnetworkforsemanticsegmentation.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.2986-2993).
[28]Branson,S.,Chao,L.C.,Perona,P.,&Malik,J.(2015).Objectdetectionandsegmentationviaimplicitfunctions.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition(pp.924-932).
[29]Hariharan,B.,Arbeláez,P.,Girshick,R.,&Belongie,S.(2015).Findingobjectsinimages:Frombackgroundsubtractiontosemanticsegmentation.IEEEtransactionsonpatternanalysisandmachineintelligence,39(6),1251-1263.
[30]Long,M.,Wang,J.,&Darrell,T.(2015).Joint
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年山西省原平市高二化学下册期末考试模拟考试卷附参考答案【巩固】
- 2026年湖北省洪湖市高二化学下册期末考试模拟卷及完整答案(考点梳理)
- 小学科学课件 用放大镜观察昆虫的身体结构
- CAXA电子图板项目教程 项目二 教案
- 2026年图形的平移达标测试题及答案
- 2026年再见初恋测试题及答案
- 2026年新疆历史测试题及答案
- 2026年物理9.2测试题及答案
- 2026年航路飞行测试题及答案
- 2026年幼儿午休安全测试题及答案
- 2026年保密观知识竞赛题及完整答案详解(典优)
- 生物医学新技术临床研究备案指导清单
- 2026年贵州医科大学神奇民族医药学院教师招聘笔试备考试题及答案解析
- 《房屋完损等级评定标准》(试行)
- 审批授权管理制度
- 无缝钢管焊接安装技术规范
- ktv强电施工方案(3篇)
- 2026上半年广东广州市越秀区教育局招聘事业编制教师83人备考题库附参考答案详解(黄金题型)
- DB41T3060-2025生活垃圾焚烧电厂智能化技术导则
- 黄金冶炼工艺流程及操作安全规范
- 2026年事业单位财务岗招聘考试题及答案
评论
0/150
提交评论