版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
绪论研究背景和意义研究背景人体正常细胞受到致癌物的影响时,会异常生长从而变成肿瘤细胞[1]。肿瘤可以分为恶性肿瘤和良性肿瘤。恶性肿瘤严重危害人们的健康甚至生命。根据世界卫生组织发布的数据表明,癌症现在是导致人类死亡的主要原因之一。此外,欠发达和发展中国家的癌症死亡率比世界上任何其他地区都高。死亡率如此之高的原因是,这些国家的大多数人口都不知道癌症的症状和原因。患癌前期并无明显病理特征,当患者察觉身体不适再去就医时,往往已经错过了最佳治疗时间,想要治愈癌症为时已晚。此外,导致高死亡率的另一个因素是缺乏获得高质量的医疗设施、医疗领域的专家以及缺乏有效的癌症筛查和诊断方法的机会[2]。目前,我国医疗行业还普遍存在优质医疗资源总量相对不足和医疗资源的分布不均衡等问题,医生对脑肿瘤的诊断水平也良莠不齐。大城市的公立三甲医院,医生专业素养高,但存在读片效率较低的情况,一名影像科医生诊断一位患者需要20分钟,无法满足众多患者的排队问诊现实需求。而基层医院医疗水平相对落后,医疗人员对复杂影像的处理能力、判断能力较为薄弱,因此误诊漏诊率较高。同时,基层医院还承担着大量的癌症筛查任务,需要降低误诊漏诊率的同时,提高诊疗效率,进而提高综合医疗水平。很长一段时间以来,传统的脑肿瘤图像识别需要大量的能量和耐心,并且存在潜在的错误和不确定性[3]。随着脑肿瘤患者的数量逐年增加,很明显,传统的诊断方法与现代医学的需求不符。深度学习技术在医学领域的杰出优势已成为医学领域图像分类的高级研究工具,越来越多的研究人员对该领域的科学研究感兴趣[4]。研究表明,较早的研究人员使用传统方法对脑肿瘤进行了分类,主要包括小波转换[5],灰度相连矩阵,支持向量机(SVM)[6,7,8,9]和其他方法。Cheng[10]等人提出了几种方法对脑肿瘤进行识别分类,即灰度直方图,灰度水平的共同矩阵和单词袋模型,以对不同类型的脑肿瘤进行识别分类,并公布出了实验中使用的数据集,将其命名为CE-MRI数据集。Das[11]等人使用了包含3064T1加权对比的卷积神经网络对MRI图像进行了数据增强,用于鉴定各种类型脑肿瘤,例如神经胶质瘤、脑膜瘤和垂体肿瘤。CNN模型经过训练,可以使用多个卷积和合并过程。通过基于可变大小的卷积内核来对卷积网络的大小进行调整,从而优化模型,最后该模型的精确率达到了94%。综上所述,基于神经网络的脑肿瘤种类识别方法可以帮助医生快速、准确地判断是否为脑肿瘤及识别肿瘤的类型,从而为患者提供个体化的治疗方案。这类方法在保证准确率的同时又大大提高了工作效率,为医生节省了时间和精力,从而去帮助更多的患者。意义基于神经网络的脑肿瘤种类识别与应用有着重要意义。首先,它可以自动化的进行脑肿瘤种类识别分类,有助于早期诊断和个性化治疗方案的制定,提高治疗成功率。在保证准确率的同时,提高医生的诊断效率,降低了时间成本和诊断成本。其次,神经网络在辅助医学研究方面也发挥着重要作用。通过分析影像数据,帮助医学研究人员发现不同种类肿瘤的特征,推动相关领域的科学研究进展。将神经网络应用于移动应用程序或医疗设备中,智能化地改善诊断过程,有助于普及医疗资源,提高医疗服务水平。综上所述,基于神经网络的脑肿瘤种类识别与应用,对于提高诊断准确性、改善医疗效率以及推动医学研究都具有重要的意义。国内外研究现状近年来,随着神经网络技术的持续发展,神经网络技术已经广泛用于各个领域,并在多方面上取得了不错的的成果。在医学领域上,基于神经网络的脑肿瘤类型识别方法在图像分割、分类识别、病灶检测等方面都取得了显著成果。其中,该方法可以通过分析和处理脑肿瘤图像数据,并自动对其检测和分类,从而帮助医生进行快速判定病情。使用深度学习对脑肿瘤图像进行分类的算法有很多,自2015年以来,学术界设计了许多深度学习网络模型,例如RestNet[12],VGG,DenseNet等。Pereira等人[13]设计了一个CNN,将大脑掩模和全脑图像分为二元类。实验结果显示,全脑图像和大脑掩模分类模型的最高准确率分别达到了89.5%和92.9%。Papageorgiou等人[14]使用模糊认知图(FCM)来区分低级别和高级别神经胶质瘤,该方法的高度脑肿瘤的准确率为93.22%,低度脑肿瘤的准确率为90.26%。Zacharaki等人[15]提出了一个特征选择方案。他们首先提取了实验中肿瘤形状,强度和不变的纹理等特征,然后使用SVM对这些特征进行特征选择和肿瘤分类,结果表明该方案在分类低和高级神经胶质瘤分类中达到了88%的最高准确率。Arunachalam和Savarimuthu[16]提出了使用位移不变剪波变换(SIST)来增强脑部MRI图像数据。然后使用Gabor滤波器,灰度共发生矩阵(GLCM)和离散小波变换(DWT)来提取特征。最后,将提取的特征输入到前馈反向传播神经网络中,实验获取到较高准确率。Preethi和Aishwarya[17]提出了一个多阶段的脑肿瘤分类模型。首先,他们使用基于小波的灰度共生矩阵(GLCM)方法从脑部MRI图像中提取到相关特征。然后,他们将从GLCM提取的特征与其他特征组合成特征矩阵。接下来,他们使用对立花粉算法(OFPA)对提取的特征进行重建。最后,他们使用深度神经网络(DNN)根据经过重建的特征矩阵对MRI图像进行分类,模型达到了92%的准确率。Ghassemi等人[18]提出了一种新方法来改进生成对抗网络(GAN)的体系结构,以生成更真实的MRI图像。他们将卷积神经网络用作GAN的鉴别器,使用两个数据集对CNN进行预训练提高了鉴别器的性能,为了增强GAN生成的图像的真实性,他们对数据进行了增强,最后将GAN中CNN的最后一层替换为SoftMax层。结果表明,该方法的在随机分割率方面达到95.6%的性能。将预训练的CNN作为GAN的鉴别器虽然是一种常用的方法,但由于GAN的网络对输入的数据大小通常需要一定要求。因此在实际应用中,这使得一些知名网络无法成为鉴别器。Begum和Lakshmi等人[19]提出了另一种有效的算法,用于脑肿瘤图像的分类和分割。首先,他们对脑肿瘤MRI图像进行预处理,去除噪声和其他干扰信息。其次,使用运行长度纹理特征和灰度共生矩阵(GLCM)高效提取图像的统计特征。然后,对提取到的所有统计特征使用对立重力搜索算法(OGSA)对冗余和不相关的特征进行排除。接着,将筛选出的特征输入到循环神经网络(RNN)中,将图像分为肿瘤和非肿瘤两种类别。最后,对于被分类为肿瘤的图像,将其发送到第二阶段进行感兴趣区域(ROI)的分割。该算法在实际的数据集中获得了96%的分类准确率。Z.Huang等人[20]介绍了一种名为CNNBCN(ConvolutionalNeuralNetworkbasedonComplexNetworks)的卷积神经网络,并改进了其激活函数。这个网络的结构是通过随机生成的图形算法构建的,而无需手动开发和优化。在实验中该方法的最高准确率达到了95.49%。主要研究内容针对医学影像图下是否存在脑肿瘤鉴定及脑肿瘤的分类识别问题,本课题计划基于神经网络对其展开研究,把采集到的脑部影像图进行处理分析。即拟用基于神经网络的卷积神经网络CNN下的ResNet-50、VGG-16、MobileNet-v2和EfficientNet-v2框架构建模型,对是否存在脑肿瘤鉴定及脑肿瘤的分类识别,并对模型检测精度进行评估,最后实验总结。主要研究内容如下:1、数据集分析和数据预处理本文计划以脑部影像图数据集作为研究对象,对图像进行标准化和数据增强等处理,查看数据集数据分布,使用torch.utils.data.random_split函数随机分割数据,将数据集划分成8:2的训练集与测试集。2、基于神经网络的脑肿瘤分类识别模型通过使用神经网络在图片处理方面的算法,卷积神经网络下的ResNet-50、VGG-16、MobileNet-v2和EfficientNet-V2模型进行是否存在脑肿瘤的鉴定及脑肿瘤的分类识别。3、脑肿瘤的鉴定及脑肿瘤的分类识别对比模型在训练与验证的准确率和损失值,绘制混淆矩阵,然后根据混淆矩阵计算出准确率、精确度、召回率、F1-Score各指标来对模型进行评估,然后对优化器、学习率等进行调整以对模型进行优化,最后使模型更为精准的识别出每张图像中是否存在脑肿瘤的鉴定和脑肿瘤分类识别。论文架构第一章,绪论部分主要介绍了课题的研究背景和意义,并通过梳理国内外相关的研究文献,确定了本文的研究内容和研究思路。第二章,介绍本课题相关的主要基础理论知识,及介绍了相关模型的基础框架,为后续的研究打下基础。第三章,是本课题的重要内容,首先介绍本课题相对较优的模型框架,然后介绍了数据集及数据预处理,然后介绍本实验的实验环境及相关参数设置,最后介绍了本实验的模型对比分析评估情况及结论。第四章,对以上的内容进行梳理,同时,总结本课题中所进行的主要工作内容以及目前存在的劣势和不足,并探讨未来可以完善的研究方向。相关理论及技术神经网络的概念神经网络是一种受生物神经系统运作方式启发的计算模型。它由大量神经元(节点)相互连接而成,组成一个复杂的网络结构,常用于机器学习和深度学习领域。神经网络一般由输入层、隐藏层和输出层构成。数据先被输入层接收,然后在隐藏层神经元通过激活函数对加权输入进行非线性变换,从而引入了网络的非线性特性,如调整激活函数、权重等相关操作,从而进行特征的提取,最后输出模型的预测结果。神经网络能够自动提取学习特征,是一种强大的模型,能够学习到复杂的数据模式和关系,其广泛应用于各个领域当中。图2.1卷积神经网络结构卷积神经网络卷积神经网络(CNN)是一种专门设计用于处理网格结构数据的人工神经网络。它的灵感主要来源于生物学中视觉皮层的工作原理,因此在图像处理方面表现出色。如图2.1所示,其核心思想是通过卷积层、池化层和全连接层构建网络,实现对输入数据的有效处理和分析。卷积层通过卷积操作和激活函数提取局部特征并保留空间信息,池化层通过降采样操作增强模型鲁棒性和计算效率,全连接层将之前层级提取到的特征向量展平成一维向量,然后通过一系列全连接的神经元进行权重计算和非线性变换,最终得到输出类别的概率分布或者其他任务的结果。训练过程采用反向传播算法,不断调整参数以学习数据模式和规律。CNN还具有参数共享和局部连接特性,在图像识别、目标检测、人脸识别等领域取得显著成就。输入层输入层是神经网络的第一层,负责接收原始数据并将其转化为神经网络能够理解和处理的形式传递给隐藏层。每个输入神经元对应输入数据的一个特征,不进行计算,只传递数据给下一层。神经元间通常全连接,数据经过权重和偏置调整后传递给隐藏层,最终进行预测或分类。卷积层图2.2卷积运算卷积层是卷积神经网络中的重要组成部分之一,它采用卷积运算来抽取输入数据的特征。如图2.2所示,每个卷积层都具有多个卷积核滤波器,对填充处理过的输入数据,通过设置其步长、偏置等参数进行卷积运算,从而提取不同特征。卷积操作在图像处理中能有效捕获局部特征,并保留空间结构信息。利用ReLU等激励对神经网络进行非线性建模,使其能够对复杂的非线性关系进行学习。利用卷积网络中的参数分享机制,可以有效地降低模型中的参数个数,从而改善模型的推广性能,提高学习率。池化层通常与卷积层配合使用,中间引入激活函数,有助于缩减数据维度、降低计算负担并增强模型鲁棒性。激活函数常用激活函数有Softmax、Sigmoid、Tanh、ReLU、RwLU6、ELU函数,如图2.3所示。Softmax,是一种常用且重要的归一化函数,其将输入值映射为(0,1)之间的概率实数,常用于多分类任务中。2、Sigmoid,使用范围最广的一种激活函数,将实数映射到(0,1)之间,具有指数形状但在深层网络中可能存在梯度消失问题。3、Tanh函数,将实数映射到(-1,1)之间,具有中心接近零的性质,在循环神经网络(RNN)中比较常见。4、ReLU函数,f(x)=max(0,x),解决了Sigmoid和Tanh函数的梯度消失问题,目前在大多数深度学习模型中广泛使用。5、ReLU6函数是ReLU的一种变体,将负输入值截断为0,并将大于6的正输入值截断为6。它在某些情况下可以减少梯度消失问题,并且对于输入值较大的情况有更好的鲁棒性6、ELU函数,f(x)=x(x>0),f(x)=a(exp(x)-1)(x<=0),相较于ReLU和ELU激活函数,在一些情况下ELU函数可以提供更好的性能。图2.3激活函数池化层在卷积神经网络中,池化是一种非常重要的方法,它可以有效地对特征图进行降维,从而达到降低模型参数数目、降低计算量的目的。最常用的池操作是最大化池和平均池,在图2.4中用极大或平均的方法缩小了特征图的大小,见图2.4。池化层能够保留主要特征并丢弃不相关信息,有助于提高模型对输入数据的不变性,对图像平移、缩放等变换具有一定的容忍性。同时,池化层还具有降低过学习效应、增强推广能力等优点。在卷积神经网络中,一般采用池化和卷积层交替使用,以构造高效的特征抽取与降维结构。总之,池化作为深度学习的一个重要环节,是构造高效卷积神经网络的关键支撑。图2.4最大与平均池化全连接层图2.5全连接层如图2.5所示,全连接层(FullyConnectedLayer)是深度神经网络中常见的层类型,其作用是将前一层的特征扁平化,在此基础上,利用权值的学习,构建了输入与输出的非线性映射。每一个神经元都和前面的神经元相连,构成了一个完整的神经网络,用来把抽取出来的高层特征映射到最后的结果。当前一层神经元数目增多时,整个连通层的参数数目也会随之增长,所以在处理过度学习问题时要特别注意。通常在全连接层之前使用池化层或卷积层进行特征提取和降维以减少计算复杂度。总的来说,全连接层在深度神经网络中扮演着关键角色,通过学习权重和偏置,能够将高级特征映射到最终的输出结果,为模型提供了强大的拟合能力和表达能力。批归一化批归一化(BatchNormalization,BN层)是深度神经网络中常用的一种技术,它的作用是通过在每个批次的数据上进行标准化处理,使得数据的均值为0,方差为1,解决深层神经网络中的数值不稳定的问题,使得同批次的各个特征分布相近,网络更加容易训练。批量规范化是这样进行的,先求出每批输入数据的平均值与标准偏差,再用这些数值来中心化和按比例调整输入数据,使其分布接近于标准的正态分布。最后还可以引入可学习的参数,通过缩放和平移等操作来调整数据的偏移和尺度,该方法不仅可以提高模型的稳定性,而且可以有效地防止梯度丢失和梯度爆破等问题。输出层输出层通常作为卷积神经网络的最后一层,其作用是将神经网络学到的特征映射到适当的输出空间,根据具体的任务来输出生成预测结果或分类标签。输出层的神经元数量通常对应着数据集中的类别数量,每个神经元对应一个类别,最后预测出每个类别的概率。在多分类问题中,常用Softmax激活函数将各类之间的对应关系表达为各类概率,最后以最大概率输出的类作为待预测类。ResNet-50框架图2.6ResNet-50架构ResNet-50的网络结构包含了多个残差块,这些残差块使得网络能够更深,同时避免了梯度消失的问题,使得网络更容易训练。具体来说,ResNet-50包含了5个阶段(stage),每个阶段包含了一系列的残差块。如图2.6所示,这是一个简化的ResNet-50架构。ResNet50首先会对输入数据会进行零填充,以便在卷积操作中确保特征图大小不变,从而保留输入图片的边界信息。然后在Stage1中进行一系列操作,包括卷积、批量归一化、ReLU激活和最大池化,用于初始的特征提取和下采样。在Stage2、Stage3、Stage4、Stage5这几个阶段中,每个阶段包含多个残差块(基本块和瓶颈块),包括卷积块(ConvolutionalBlock)和恒等映射块(IdentityBlock)。这些阶段进一步提取特征,并通过跳跃连接保持了特征图的大小。在此基础上,对最终的特征进行了平均池化,得到了具有一定尺寸的特征矢量。接着,展平,使平均池层的输出变成一维矢量,为完全连接层作好准备。最后的全连接层将展平的特征向量映射到最终的输出类别或其他任务的输出。EfficientNet-V2框架EfficientNet-V2是Google提出的高效神经网络架构,是EfficientNet系列的升级版。相比EfficientNet-V1,V2在保持高效性能的同时进一步提升了准确性和泛化能力,其网络结构如下表2.1所示。在0阶段,模型进行了简单的卷积,用于初始特征提取和下采样。在第1阶段,包含两个Fused-MBConv1模块,这些模块通常包括深度可分离卷积(DepthwiseSeparableConvolution)和扩张卷积(DilatedConvolution),该方法能够更好地提取出特征,增强网络的非线性,从而改善模型的性能。在第2、第3阶段进一步提取特征并减小特征图的尺寸。第4阶段通过多次堆叠扩张卷积和深度可分离卷积来提取特征,并且步长为2,以减小特征图的尺寸。第5、第6阶段,保持特征图的尺寸不变,增加模块的数量,具有更深的网络结构,从而进一步提取特征。第7阶段包括一层卷积和一层池化,以及一个完整的全连通层。表2.1EfficientNet-V2结构阶段操作步长通道数层数0Conv3x322411Fused-MBConv1,k3×312422Fused-MBConv4,k3×324843Fused-MBConv4,k3×326444MBConv4,k3×3212865MBConv6,k3×3116096MBConv6,k3×32256157Conv1×1&Pooling&FC—12281EfficientNet-V2引入了Fused-MBConv与MBConv层,如图2.7所示。EfficientNet-V2优化了Depthwise卷积,通过每个nn卷积核只处理一个通道,再通过11卷积核综合信息,减少参数量和计算量。用Fused-MBConv替代Depthwise卷积,充分利用现代加速器,虽增加了参数量但也提升训练速度。这种结合优化策略使V2在效率和性能上取得了平衡。图2.7模块结构VGG框架图2.8VGG网络结构如图2.8所示,这个神经网络结构输入尺寸为224x224的RGB三个颜色通道彩色图像,经过多个block进行特征后,利用完全连通层,将抽取出来的特征映射到最后的分类中。其网络结构包括5个block和3个全连接层。每个block包含若干个3x3大小卷积核的卷积层,随着通道数逐渐增加,其图像特征图尺寸逐渐减小。经过特征提取完后接入3个全连接层,前两个包含各4096个神经元将特征向量进行降维和组合,最后一个包含1000个神经元,经过SoftMax输出1000个类的后验概率。整个网络结构中,红色为采用最大池化进行下采样,白色为卷积层加ReLU激活函数,蓝色为全连接层加ReLU激活函数,参数传递从左向右进行,最终通过拉平操作将参数转化为1x1的长向量输入全连接层。评估指标在模型训练中,评估指标是用来衡量模型性能和效果的重要标准,最常用的模型评估指标有准确率与损失值。由于单一的精确率和损失值无法反映模型的总体表现,所以通常还会采用混淆矩阵来综合评估模型的总体表现。混淆矩阵是评价分类算法性能的一个重要手段,特别是对类不均衡和多类的情形。混沌矩阵包含真阳性(TruePositive)、真阴性(TrueNegative)、假阳性(FalsePositive)和假阴性(FalseNegative)多种类别信息,从而更全面地评估模型性能。混淆矩阵不仅可以为整个模型进行评估,还可对每个类别进行评估,可以更全面地了解模型在不同类别上的分类性能,并针对性地改进模型。真阳性(TP)表示真正例,即模型将正类别样本正确地预测为正类别。真阴性(TN)表示真负例,模型将负类别样本正确地预测为负类别。假阳性(FP)表示假正例,即模型将负类别样本错误地预测为正类别。假阴性(FN)表示假负例,即模型将正类别样本错误地预测为负类别。 在经过混淆矩阵绘制后,准确率、精确度、召回率和F1-Score都可以从混淆矩阵中计算得出。准确率(Accuracy)是评价分类器性能的一种常用指标,它表示分类器正确预测的样本数与总样本数之比。它衡量的是模型正确预测的能力,即所有预测正确的样本数与总样本数的比值。计算公式如下:Accuracy=精确度(Precision)是指分类器预测为正例的样本中,真正为正例的比例。它衡量的是模型预测为正例的准确性。计算公式如下:Precision=召回率(Recall)是指分类器正确预测为正例的样本数占真实正例总数的比例。它衡量的是模型能够检测到多少正例。计算公式如下:Recall=F1-Score是精确度和召回率的调和平均数,综合考虑了分类器的准确性和召回率。F1-Score越高,代表模型的性能越好。计算公式如下:F1−Score=章节小结在本章内容中,首先对神经网络的基本概念和有关卷积神经网络的一些基本知识进行阐述。然后,简要地介绍了卷积神经网络的一些构成要素,对卷积神经网络的组成进行了详细的介绍,包括输入层,卷积层,激活函数,池化层,完全连通层,批量标准化和输出层。然后,分别介绍了ResNet-50、EfficientNet-v2和VGG神经网络架构,对它们进行了简单阐述。最后,本文将介绍一般常用的模型评价标准,包括精确度,损失值,混淆矩阵,精确度,召回率,以及F1-Score。脑肿瘤MRI图像分类网络模型分析MobileNet-v2框架MobileNet-v2是一种面向移动终端与嵌入式终端的深度神经网络体系结构,通过轻量化、深度可分卷积的设计来降低系统的参数、降低计算复杂度,同时保证了模型的高效率,是基于MobileNet-v1的移动网络系列的第2代模型。MobileNet-v2的基本单元是倒残差块(InvertedResidualBlock),由扩展层(ExpansionLayer)、深度可分离卷积层(DepthwiseConvolutionLayer)和投影层(ProjectionLayer)组成。这个块被设计为可以堆叠多个以构建更深的网络。MobileNet-v2中采用了倒残差(InvertedResidual)结构,这是MobileNet-v1中深度可分离卷积的改进版本。与ResNet架构的先降维、卷积、再升维的方式不同,是先升维、卷积、再降维。只有当步幅为1时且输入特征矩阵与输出特征矩阵形状相同的时候才有残差连接。倒残差结构首先利用轻量级1x1卷积扩充信道数目,并利用深度可分离卷积实现特征抽取,最后利用1x1卷积降低信道数目。该方法能有效地降低参数个数,降低计算量,同时保证了系统的有效性。MobileNet-v2还引入了一种线性瓶颈(LinearBottleneck)结构,即利用输入与输出间的线性瓶颈来保持信息的流动。线性瓶颈结构是MobileNet-v2中的关键组成部分之一,用于在不引入额外非线性操作的情况下增加网络的表达能力。图3.1MobileNet-v2网络模型参考图3.1,在数据输入之后,首先用1x1的卷积核进行卷积运算,接入ReLU6激活函数中。其次,设定步长,完成3x3卷积运算,再次接入ReLU6激活函数中。最后,再用1x1的卷积核进行卷积运算,最后接入线性Linear激活函数。数据集与预处理3.2.1数据集介绍图3.2数据集展示本课题使用的脑肿瘤图像数据集来自公开数据集,该数据集有不同角度拍摄的脑部MRI图像组成,一共有3096张图像,其中脑膜瘤有913张,垂体瘤有844张,胶质瘤有901张,正常脑部图像有438张,其分布和图像如图3.2所示。3.2.2预处理图3.3数据处理前后对比针对MRI图像数据,首先从原始数据中提取特征并添加标签,构建带有脑膜瘤、正常、胶质瘤和垂体瘤等四种类别标签的样本集合。随后进行数据预处理,包括计算其均值与标准差进行标准化处理,随机旋转图像最多±30°,将图像调整为64x64像素大小并从中心裁剪出64x64部分,以50%的概率随机水平翻转图像,将图像转换为Tensor后进行标准化处理,其处理前后对比如图3.3所示。最后,将数据集按80%、20%的比例分割成训练集和验证集,实现对脑肿瘤的精确分类。参数设置与评估指标3.3.1实验环境本课题实验基于PyTorch深度学习框架,使用Python3.8语言实现,调用了PyTorch中torchvision模块中的ResNet-50、VGG-16、MobileNet-v2和EfficientNet-v2模型。在windows10环境下完成,硬件设备为Intel(R)Core(TM)i7-9750HCPU@2.60GHz2.59GHzCPU,NVIDIAGeForceGTX1650显卡,12GB内存4GB显存,如表3.1所示。表3.1实验环境软、硬件环境配置学习框架PyTorch2.2.1+cpu语言Python3.8计算机环境windows10系统CPU处理器Intel(R)Core(TM)i7-9750HCPU@2.60GHz2.59GHz显卡NVIDIAGeForceGTX1650内存12GB显存4GB3.3.2参数设置在训练过程中,对比不同参数的训练效果,本课题实验决定使用Adam优化器优化所调用的模型,模型训练中设置的相关参数如表3.2。表3.2训练过程的参数设置参数迭代次数批次大小子进程数优化器学习率数值10084Adam0.0001实验对比与分析3.4.1损失值为了分析模型在训练数据上的预测与真实标签之间的差异,探究其模型对数据集的适应力及模型泛化能力,进行了训练与验证的绘制损失曲线图,各模型结果如图3.4所示。(a)ResNet-50(b)VGG-16(c)MobileNet-v2(d)EfficientNet-v2图3.4各模型损失曲线图在a图中,其训练和验证损失值随着迭代次数的增加而趋于稳定,在其损失值在0.2上下波动。在图b中,其验证损失值总体波动大,且随着迭代次数的增加反而有向上反弹的趋势。在图c中,其图像与a是较为相似的。在图d中,虽然其验证损失值在训练初期升高且损失值也相比其他模型高出许多,但是随着迭代次数的增加,其验证损失值也能迅速下降然后趋于平稳。综上所述,除图b损失曲线图效果较差外,考虑其每个模型特性不一样,且其他模型损失曲线图差距小,说明图a、c、d损失曲线图效果较好,即在训练中ResNet-50、MobileNet-v2、EfficientNet-v2模型的数据拟合性和泛化性更优于VGG-16。3.4.2准确率为了分析各模型之间的训练效果和准确率,进行了绘制迭代次数与训练验证准确率的关系图,如图3.5所示。(a)ResNet-50(b)VGG-16(c)MobileNet-v2(d)EfficientNet-v2图3.5各模型准确率图总体来看,在训练模型过程中,各模型的准确率都是随着迭代次数的增加而提升,然后趋于稳定。对比模型的波动大小,VGG-16的波动会大一点且是趋于向下波动,表明实验中VGG-16的训练效果最差。实验获取了ResNet-50、VGG-16、MobileNet-v2、EfficientNet-v2模型的最高准确率,分别为96.13%、95.48%、96.26%、96.26%。由上可知,MobileNet-v2、EfficientNet-v2模型的训练效果会比ResNet-50、VGG-16模型更好。3.4.3混淆矩阵 (a)ResNet-50(b)VGG-16图3.6混淆矩阵(c)MobileNet-v2(d)EfficientNet-v2图3.6混淆矩阵分别使用模型ResNet-50、VGG-16、MobileNet-v2、EfficientNet-v2提供测试结果,然后画出混淆矩阵,如图3.6所示。由图可知,每个模型对不同类别的分类效果都不一样,且每个类别之间分类效果并无太大差距,从混淆矩阵图中难以比较整体模型的性能。3.4.4性能评估表对比分析为进一步比较模型整体的性能,根据混淆矩阵所得数据分别计算出每个网络模型对脑肿瘤分类验证的评价指标结果,考虑其波动性,采取了计算三次求取平均值方法,具体数值如表3.3-表3.6所示。表3.3ResNet-50验证评价指标 表3.4VGG-16验证评价指标类别精确率召回率F1分数脑胶质瘤0.960.900.93脑膜瘤0.880.950.91正常0.950.940.94垂体瘤0.980.970.97类别精确率召回率F1分数脑胶质瘤0.940.910.92脑膜瘤0.920.910.91正常0.940.980.96垂体瘤0.950.970.96表3.5MobileNet-v2验证评价指标 表3.6EfficientNet-v2验证评价指标类别精确率召回率F1分数脑胶质瘤0.980.890.93脑膜瘤0.940.940.94正常0.820.990.90垂体瘤0.970.980.97类别精确率召回率F1分数脑胶质瘤0.980.880.93脑膜瘤0.880.960.92正常0.950.970.96垂体瘤0.960.970.97由表可知,MobileNet-v2模型在脑胶质瘤、脑膜瘤、垂体瘤这三种类别下的评价指标是略高于其他三个模型的,但在识别正常脑部图像时MobileNet-v2模型的评价指标是最低的。虽然其他模型在个别类中也取得不错的评价指标,但综合来看,MobileNet-v2模型的训练效果是相对好的。为进一步比较模型整体的性能,还绘制出各模型对每个类的总体评估表,如表3.7所示。表3.7模型性能评估表模型准确率精确率召回率F1分数Res-500.94030.94210.94030.9406VGG-160.93810.93800.93810.9379MobileNet_v20.94160.94590.94130.9418EfficientNet_v20.94290.94580.94290.9430对比模型总体性能,可知EfficientNet_v2模型略优于其他模型,其次是MobileNet_v2模型。因EfficientNet_v2模型和MobileNet_v2模型差距微小,所以本课题还采取了模型的其他数据进行对比参考,如模型的总参数数量、模型所需的总内存大小、每个epoch所需的平均时间,如表3.8所示。表3.8参数评估表模型总参数量(MB)总内存(MB)平均时间(s)计算量(GFLOPs)Res-5097.7376.831503.8-4.1VGG-16527747.1548015-30MobileNet_v213.5166.81600.3-0.6EfficientNet_v2208808.794203.8对比上表数据发现MobileNet_v2在总参数数量、模型所需的总内存大小、每个epoch所需的平均时间都显著优于其他几个模型,且在整体性能上也并不输于其他模型。3.4.5实验总结在课题实验中,调用ResNet-50,VGG-16,MobileNet-v2,EfficientNet-v2多个预训练模型进行训练,获得了各模型的最优准确率,分别为96.13%、95.84%、96.29%和96.29%,绘制出了各模型的损失值,准确率,混淆矩阵,性能评估表以及模型相关参数。在进行了对比实验后,得出结论。虽然各个模型之间存在一些差异,但模型的整体性能差距微小,在资源受限条件下,MobileNet_v2是值得主推的模型之一。在参数量和内存消耗等方面,MobileNet_v2显著优于其他模型。它相对较小的参数量和内存消耗使得其在资源受限的环境中更具优势。在移动设备、嵌入式设备、微服务器等资源限制的场景下,MoblieNet_v2模型更具优势,而其他模型如ResNet-50和VGG-16需要更大的参数量和内存消耗,因此在这些场景下可能并不适用。章节小结本章介绍了MobileNet_v2框架、脑肿瘤图像数据集、预处理步骤、参数设置与评估指标和实验对比分析。数据集部分描述了数据集组成和预处理步骤,包括特征提取、标签添加和数据增强。参数设置与评估指标部分详细介绍了深度学习框架、硬件环境、参数设置。在实验对比与分析部分,四种不同模型(ResNet-50、VGG-16、MobileNet-v2和EfficientNet-v2)的性能进行了综合比较,发现模型之间的差距并不明显,但MobileNet_v2模型在特定条件下,如在资源受限的环境下,则更具优势。
总结与展望本课题以医学影像分类为研究对象展开了实验和分析,通过调用不同网络模型进行脑肿瘤图像识别分类,根据模型的表现进行全面比较与评估。课题总结课题首先介绍了使用的脑肿瘤图像数据集的基本信息。该数据集包含了不同角度拍摄的脑部MRI图像,共计3096张,涵盖了脑膜瘤、垂体瘤、胶质瘤和正常脑部图像等四种类别。随后,对数据进行了预处理,包括特征提取、标签添加和数据增强等,以便于深度学习模型的训练和评估。接着,详细介绍了实验所采用的深度学习框架、硬件环境以及模型训练中的参数设置。在实验对比与分析部分,通过损失值、准确率、混淆矩阵和性能评估表的对比分析,对四种不同模型(ResNet-50、VGG-16、MobileNet-v2和EfficientNet-v2)的性能进行了综合比较。基于实验结果的对比分析,综合来讲MobileNet_v2更具优势。MobileNet_v2有助于提高系统性能、降低资源消耗。它在总参数量、总内存消耗、训练时长和准确率等方面都表现出色,尤其适用于资源受限的环境和对实时性要求较高的应用场景,且其整体性能不属于其他几个模型。在医学领域中,在资源受限下使用MobileNet_v2进行脑肿瘤分类是一个很好的选择。MobileNet_v2的轻量级设计和高效率特点使得它非常适合在资源受限的环境中进行图像分类任务,同时还能保持较高的分类准确率。MobileNet_v2是一种在保持高准确率的同时显著减少参数数量和计算量的模型,因此非常适合在资源受限的环境中进行图像分类任务。其轻量级特性不仅节省了存储空间和计算资源,还确保了模型的高效率和实用性。医疗人员可以轻松地在移动设备、嵌入式系统和微服务器上部署MobileNetV2,以实现对脑肿瘤的快速诊断和分类。这种高效且精准的特点使医生能够实时对脑部影像进行分类,从而帮助他们及时做出诊断和治疗决策。此外,移动设备的便携性和灵活性使医疗团队能够随时随地在线进行影像分析和诊断,从而提高了工作效率并改善了患者的诊疗体验。工作展望本课题存在一些不足,具有一定的可进一步完善与扩展的空间,包括以下几个方面。1、优化深度学习模型的结构和参数,包括尝试不同的网络架构、损失函数和优化算法,以提高医学图像分类任务的性能和泛化能力。在此基础上,还可以采用更多更高效的数据增强与预处理等方法,并在此基础上加入更加复杂的脑瘤影像,以提高数据的多样性及模型泛化能力,以及提高模型的稳健性与推广性能。课题的实施,将有助于推动研究结果在临床中的应用,为临床提供更加精准、快捷的诊疗手段。2、多模态融合与联合学习。医学图像分类任务通常不仅涉及到单一的图像数据,还可能包括其他模态的数据,比如病人的临床资料、基因信息等,将这些因素有机的结合起来,可能会极大的改善模型的预测精度,大大提高预测的准确率。未来的研究可以探索多模态融合的方法,将来自不同模态的数据进行有效地结合和利用,以提高分类模型的性能和准确性。此外,联合学习方法可以同时训练多个相关任务的模型,共享特征表示和知识,从而提高模型的泛化能力和鲁棒性。这些技术的应用将可能进一步推动医学图像分类的发展和应用。在未来的研究中,可以针对以上方面展开工作,不断改进和完善医学图像分类的方法和模型,为医疗实践提供更加高效精确的辅助诊断工具。
参考文献DiL,HaoZ,ZhaoM,etal.BrainTumorSegmentionBasedonDilatedConvolutionRefine.Networks[C].2018IEEE16thInternationalConferenceonSoftwareEngineeringResearch,ManagementandApplications(SERA).IEEE,2018:113-120.OrganizationWH.Cancerindevelopingcountries:facingthechallenge[J].Director-General,2014,39(06):70-81.包星星,赵璨,饶家声.机器学习在MRI图像脑肿瘤分割中的研究进展[J].医疗卫生装备,2019,40(11):90-96.龚尚瑾,渠鸿竹,方向东.深度学习在医学影像学领域应用研究进展[J].医学信息学杂志,2020,41(07):40-43.SundararajGK,BalamuruganV.RobustclassificationofprimarybraintumorinComputerTomographyimagesusingK-NNandlinearSVM[C].InternationalConferenceonContemporaryComputing&Informatics.IEEE,2015:263-275.DeviTM,RamaniG,ArockiarajSX.MRBrainTumorClassificationandSegmentationViaWavelets[C].InternationalConferenceonWirelessCommunications,SignalProcessingandNetworking.Chennai,India,2018:8538643.MathewAR,AntoPB.TumordetectionandclassificationofMRIbrainimageusingwavelettransformandSVM[C].InternationalConferenceonSignalProcessingandCommunication.Coimbatore,India,2017:75-78.PollyFP,ShilSK,HossainMA,etal.DetectionandClassificationofHGGandLGGBrainTumorUsingMachineLearning[C].InternationalConferenceonInformationNetworking.ChiangMai,Thailand,2018:813-817.IslamA,HossainMF,SahaC.ANewHybridApproachforBrainTumorClassificationUsingBWT-KSVM[C].4thInternationalConferenceonAdvancesinElectricalEngineering.Dhaka,Bangladesh,2017:241-246ChengJ,HuangW,CaoS,etal.Correction:enhancedperformanceofbraintumorclassificationviatumorregionaugmentationandpartition[J].PloSone,2015,10(12):e0144479.DasS,AranyaO,LabibaNN.BrainTumorClassificationUsingConvolutionalNeuralNetwork[C].1stInternationalConferenceonAdvancesinScience,EngineeringandRoboticsTechnology(ICASERT).2019:1-5.HeK,ZhangX,RenS,etal.Deepresiduallearningforimagerecognition[C]//ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition.2016:770-778.PereiraS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年钳工技能实践考核题库综合试卷(考点精练)附答案详解
- 2026年医学微生物学复习练习题库包含答案详解(综合题)
- 2026年国开电大心理健康教育概论形考考试黑钻押题(达标题)附答案详解
- 2026年环境影响评价工程师之环评法律法规检测卷包及完整答案详解(历年真题)
- 2026年设备监理师之质量投资进度控制综合提升练习题附答案详解(轻巧夺冠)
- 2026年国开电大西方经济学形考通关考试题库【真题汇编】附答案详解
- 根河市金河镇招聘社区网格员真题附答案详解
- 2026年重庆市雅安地区单招职业适应性测试题库及参考答案详解
- 家庭结构变迁与人口发展趋势实证研究
- 2026年郑州财税金融职业学院单招职业适应性考试题库及答案详解一套
- CJJ-T 82-2012 园林绿化工程施工及验收规范培训课件
- 声屏障施工验收标准方案
- 2025-2030中国煤矿行业发展分析及投资前景与战略规划研究报告
- 2025全国青少年信息素养大赛初赛C试题及参考答案
- 2025辽宁能源集团所属铁法能源公司招聘96人笔试参考题库附带答案详解
- 金属凝固理论与技术
- 2025年中国工艺美术馆面向社会招聘工作人员2人笔试历年典型考题及考点剖析附带答案详解
- 编制说明-《绿色电生理导管消融临床技术规范》系列
- 民兵护路基本知识培训课件
- 2025年四川高考地理真题(含答案)
- 2025年初级(五级)仓储管理员(仓库保管)职业技能鉴定《理论知识》真题卷(后附答案和解析)
评论
0/150
提交评论