【《基于联邦学习的个人信用评估模型分析案例》9900字】_第1页
【《基于联邦学习的个人信用评估模型分析案例》9900字】_第2页
【《基于联邦学习的个人信用评估模型分析案例》9900字】_第3页
【《基于联邦学习的个人信用评估模型分析案例》9900字】_第4页
【《基于联邦学习的个人信用评估模型分析案例》9900字】_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于联邦学习的个人信用评估模型分析案例目录TOC\o"1-3"\h\u75基于联邦学习的个人信用评估模型分析案例 198681.1横向联邦学习架构 2238041.1.1 本地客户端 222431.1.2中央服务器 2307441.2模型的详细设计 4292591.2.1联邦个人信用评估模型设计思路 427031.2.2本地客户端设计 5201881.2.3中央服务器设计 6137181.2.4联邦个人信用评估模型详细设计 755551.3本章小结 827373第2章实验与分析 9131132.1数据集介绍 9185242.2实验环境 11115352.3系统评价指标 1120592.4数据预处理 12152452.4.1数据分析 12298522.4.2空缺值填补 13112282.4.3离散值编码 1318542.4.4数据归一化 13144362.4.5特征降维 13181792.4.6数据均衡化 14125762.5改进PSO-BP神经网络模型实验对比 15318132.2.1参数设置 15235722.2.2实验结果 1681612.6联邦个人信用评估模型测试结果 21随着互联网金融和大数据时代的来临,金融数据在近几年呈指数级爆发增长,本文改进的PSO-BP神经网络模型在收敛速度和模型精度上相较于标准PSO-BP模型有所提高。但是常规各家金融机构的数据不共享,会导致在训练模型时训练数据不足、数据质量差等进而导致模型预测效果不佳。联邦学习的特点是可以联合多家金融机构在数据不出本地的前提下进行共同建模,解决数据不足带来的建模不准确的问题。因此本文将改进的PSO-BP模型与联邦学习结合构建个人信用评估模型,本模型在不共享私有数据集的情况下联合多地金融机构数据集共同训练建模,打破数据孤岛问题同时保证数据的安全。1.1横向联邦学习架构联邦学习是一种分布式机器学习框架,使用联邦学习的进行建模就可以保证多家金融机构数据在安全不泄露隐私的前提下进行共同建模。联邦学习分为横向联邦学习、纵向联邦学习以及联邦迁移学习三种类型[35]。横向联邦学习所支持的数据是特征分布相同、ID不同的数据,适合于不同地区具有相同贷款业务的两所银行;纵向联邦学习所针对的数据是同一批ID,但特征不同的多个数据集,如不同银行的同一批用户,在不同业务中,他们有不同的特征,因此纵向联邦学习可以将同一用户的不同特征集合起来,训练出效果更好的模型;而联邦迁移学习,是一家金融机构由于自身数据标签不足等原因无法建模,但可以使用其他金融机构相似的业务数据进行迁移学习,最后达到模型通用的目的。目前,纵向联邦学习和联邦迁移学习由于业务场景和算法的限制导致应用的场景较少。相比较之下,横向联邦学习架构较为简单清晰,有更广的应用场景,通过提高模型的数据量,解决当前多数金融机构存在的数据量少、数据质量差而导致难以建模的问题。横向联邦学习架构分为两部分,本地客户端和中央服务器。1.1.1 本地客户端本地客户端是整个横向联邦学习架构的基础,在每家金融机构的本地客户端上都维护着一个本地模型,它在训练的过程中将本地模型参数发给中央服务器,利用中央服务器对各个本地的参数进行聚合计算,其结果作为全局参数返回到各个客户端用于继续更新模型。完成训练后每一个本地模型相当于通过训练所有数据所得到的模型。1.1.2中央服务器对于不同的应用场景,横向联邦学习架构分为两种方式对本地客户端进行协调,分别是有中央服务器和无中央服务器两种方式。如图1.1所示,这是一种使用中央服务器的横向联邦学习架构[36],称为客户-服务器架构。也是本文所采用的架构。在此架构下,中央服务器初始化模型参数发送给各个客户端,模型各自训练本地数据然后将模型参数发回中央服务器进行聚合计算,其结果作为全局参数返回到各个客户端进行本地模型的更新。例如在文献[25]中,中央服务器使用梯度平均算法对所有客户端上传的梯度求平均值然后作为全局参数下发。不断重复这一过程,直到模型收敛或达到最大迭代次数。这种训练方法使得中央服务器只起到参数聚合计算的作用,并不会直接参与建模,保护了数据隐私和安全。这种架构的优点是结构清晰,参与的客户端相互完全不可见,保证各个金融机构的隐私性。缺点是必须要保证参与建模的中央服务器是安全可靠的、其间的通信是可靠的。图1.SEQ图4.\*ARABIC1横向联邦学习客户-服务器架构图[36]Figure1.1Diagramoffederatedlearningframework横向联邦学习另一种应用场景是各个客户端被设计为对等网络的架构[42],如图1.2所示,即不需要中央服务器对多个参与方进行协调,将各自的训练的模型保存在本地,直接加密交换对方的参数然后在本地进行聚合计算求出全局参数用于更新本地模型。将中央服务器实现的功能通过加密的方式放到了每个客户端本地。这样的架构优点是提高了安全性,不存在第三方泄露参数等风险。但是缺点是需要更多的计算资源来对参数进行加密解密,每家客户端需要与其他客户端进行通讯,暴露了隐私。图1.SEQ图4.\*ARABIC2横向联邦学习对等网络架构[42]Figure1.2Diagramofhorizontalfederatedlearningpeer-to-peernetworkarchitecture由上述可知,两种架构各自存在优缺点,由于客户-服务器架构结构清晰,隐私的保护性好,同时本文使用的改进PSO-BP神经网络模型与联邦学习结合时需要独立的中央服务器,因此本文采用客户-服务器架构,模型设计将在下一节详细讲解。1.2模型的详细设计本节介绍了联邦个人信用评估模型的设计过程,具体给出了将联邦学习和改进的PSO-BP神经网络模型相结合的详细设计思路,联邦个人信用评估模型的架构,以及具体算法执行过程。1.2.1联邦个人信用评估模型设计思路在本文中,假设所有参数方都是诚实的,且通信过程是理想且安全保密的。在个人信用评估的场景中,使用本文提出的改进PSO-BP神经网络模型可以提高模型的预测精度,提高模型收敛速度。横向联邦学习可以通过联合多家金融机构共同建模以提高训练模型的数据量,解决数据少、数据质量差的问题,而且PSO-BP模型本身具有支持并行计算的特点,通过与横向联邦学习进行结合,提高了模型本身的计算效率,解决了个人信用评估上存在的预测精度低以及数据质量差的问题。改进的PSO-BP神经网络模型的训练可以分为两部分,第一部分是改进的PSO寻优算法,通过把BP神经网络的所有参数转换成一个粒子,通过在解空间中寻找最优粒子从而实现寻找BP神经网络的最优参数。另一个部分是适应度函数的计算,本文设计的适应度函数如式(3-4)所示,具体的计算方法是将粒子中包含的参数映射为BP神经网络的连接权重和阈值,再通过本地数据集计算出误差,因此每一个粒子计算得到的总误差值就是该粒子的适应度值。计算适应度值需要具体的粒子位置参数、BP神经网络结构以及本地数据。因此,本文将适应度的计算部署到本地客户端,而PSO寻优过程只需要每个粒子的适应度值即可,因此将PSO寻优算法部署到中央服务器。中央服务器和本地客户端之间通过传输每个粒子适应度值即可完成模型的整个训练过程。1.2.2本地客户端设计本地客户端部署在每个金融机构的本地服务器中,计算本地数据的适应度值并发给中央服务器用于计算全局适应度。保证了计算数据不出本地,同时分布在多地的客户端并行计算适应度值,在不考虑通讯情况的前提下,通过多个本地客户端的并行计算,提高了适应度计算的效率。各个客户端的本地个人信用评估模型所使用的算法是BP神经网络所建立的模型,具体结构如图1.3所示。本文所使用的BP神经网络模型由三层组成。个人信用模型的第一层也就是输入层由原始数据经过数据预处理后的数据特征维度组成,输入层的个数和处理数据的特征维度一样多,将隐藏层输出通过激活函数处理进入输出层,由于是分类问题,模型最后将输出的结果通过sigmoid处理,将输出结果o映射到0或者1。图1.SEQ图4.\*ARABIC3本地个人信用评估模型结构图Figure1.3Structurediagramoflocalpersonalcreditscoringmodel1.2.3中央服务器设计 中央服务器是联邦学习中的协调中心,连接所有客户端。在本文中,中央服务器的作用如下:(1)中央服务器首先需要初始化模型,包括改进的PSO优化算法的初始参数,也包括BP神经网络模型的初始连接权重和阈值。(2)中央服务器需要协调各个客户端完成数据的归一化工作,设每维特征为Xi,数据集共n维特征,i=1,2,3,……,n。Xi中最大值为Ximax,最小值为Ximin。第k家金融机构的特征为Xi(k),具体过程是客户端k,参与方共m个,k=1,2,……,m。将每家金融机构的本地数据的特征的最大值XX客户端通过全局数据的最大值Ximax、Xif(3)各个客户端在训练模型过程中将适应度值上传到中央服务器,中央服务器对其进行计算。其次,将PSO优化算法部署在中央服务器,将之前得到的适应度值计算结果用于联邦个人信用评估模型的更新。1.2.4联邦个人信用评估模型详细设计联邦个人信用评估模型的更新迭代过程中需要计算每个粒子的适应度,适应度值的计算分为两个步骤,首先各个客户端通过本地的数据和参数得到每个粒子的本地适应度值。将所有本地适应度值上传到中央服务器中,然后中央服务器将每个粒子的各个本地适应度值汇总求和计算得到每个粒子的全局适应度,计算得到每个粒子的总适应度,从而更新粒子的速度和位置。如图1.3所示,中央服务器向各个客户端发送粒子的位置参数,各个客户端通过粒子的位置参数和本地数据集去计算该粒子的适应度值,然后返回给中央服务器用于粒子寻优,更新模型。图1.SEQ图4.\*ARABIC4联邦个人信用评估模型架构图Figure1.4ArchitectureofFederalPersonalCreditScoringModel设粒子数量为m个,其中i=1,2,……,m。金融客户端共有K个,其中c=1,2,……,K。具体联邦个人信用评估模型的训练步骤如下:(1)中央服务器初始化PSO模型及其参数;(2)各个参与的客户端初始化BP神经网络;(3)通过中央服务器使全局数据归一化;(4)将中央服务器的粒子i的位置参数Wi下发到各个客户端。每个客户端计算对应粒子i的适应度FF其中,Dc表示金融机构c(5)将各个客户端对应粒子i的适应度相加得到粒子i的总适应度值FiF(6)中央服务器通过粒子i的适应度Fi(7)判断是否满足收敛条件,如果是,则结束训练,否则转到步骤(4)继续更新模型;(8)全局模型训练完成,中央服务器将最优粒子的参数下发到各个本地模型。上述步骤中,中央服务器通过各个客户端的适应度值求和得到模型每个粒子总适应度值来更新全局个人信用评估模型,通过使用联邦学习的思想训练个人信用评估模型。保证了各家数据不出本地就能共同训练模型,解决了数据少,数据质量不好的问题。1.3本章小结本章对于联邦个人信用评估模型的各个模块的架构和实现进行了介绍,通过将个人信用评估模型和联邦学习结合,实现了多家金融机构保证本地数据安全的同时又可以进行共同建模训练。

第2章实验与分析本章主要是对本文的实验进行了介绍,首先介绍了使用的数据集、实验平台、数据预处理工作等,然后对本文所提出的改进的PSO-BP神经网络模型和联邦个人信用评估模型进行了实验,并对实验结果进行了讨论。2.1数据集介绍本文所使用的数据集是Lendingclub的信贷数据集/wordsforthewise/lending-club/tasks。Lendingclub是美国的一家经营借贷业务的金融公司,总部设在旧金山,加利福尼亚。它是第一个在证券委员会(SEC)注册的。公司lendingclub为客户提供各种类型的贷款。公司收到贷款申请时,必须解决是否根据申请人提供的信息批准贷款。金融机构风险相关的决策有两种:/wordsforthewise/lending-club/tasks(1)如果申请人可能偿还贷款,那么不批准贷款将导致公司业务的损失。(2)如申请人不太可能偿还贷款,即他/她很可能会违约,则批准贷款可能会令公司蒙受经济损失。数据集的字段包括loan_amnt、term、int_rate、installment、grade、sub_grade、emp_title、emp_length、home_ownership、annual_inc、verification_status、issue_d、loan_status、purpose、title、zip_code、addr_state、dti、earliest_cr_line、open_acc、pub_rec、revol_bal、revol_util、total_acc、initial_list_status、application_type、mort_acc、pub_rec_bankruptcies,共28个字段具体含义如表2.1所示。表2.SEQ表5.\*ARABIC1数据集的各个字段具体含义对照表Table2.1Comparisontableofthespecificmeaningofeachfieldofthedataset字段名具体含义字段名具体含义loan_amnt贷款金融title借款人提纲的贷款名称term贷款期限(月)zip_code其他脱敏信息int_rate贷款利率addr_state地址installment分期贷款金额dti债务收入比grade贷款等级earliest_cr_line借款人最早报告信用额度的月份sub_grade贷款子等级open_acc信用档案中未结信用额度的数量emp_title就业职称pub_rec贬损公共记录的数量emp_length就业年限revol_bal信贷周转余额合计home_ownership房屋所有权revol_util循环额度利用annual_inc年收入total_acc当前信用额度总数verification_status认证状态initial_list_status贷款初始化列表申请状态issue_d贷款发放月份application_type个人贷款还是联合贷款loan_status是否违约(标签)mort_acc抵押账户的数量purpose贷款用途类别pub_rec_bankruptcies公共记录破产数量它包含过去贷款申请人的信息,以及他们是否“违约”。其目的是确定一个人是否有可能违约,针对不同预测结果可以采用不同的行动,如拒绝贷款、减少贷款数额或者以较高的利率贷款等。本文实验将使用lendingclub的数据集进行实验,此数据集包含395219条交易样本数据,其中违约贷款数据77523条,占整个数据集的19.62%。图2.SEQ图5.\*ARABIC1数据集违约样本比例图Figure2.1Theproportionofdefaultsamplesinthedataset如图2.1所示,本文所使用的数据集也存在数据不平衡问题,因此在训练模型的时候需要进行数据均衡化处理,在下面的数据预处理一节中有详细介绍。2.2实验环境本文实验环境如表2.2所示。表2.SEQ表5.\*ARABIC2实验所用的软硬件环境TableQUOTE“一九一一年一月STYLEREF1\s五日”\@”D”5.2Softwareandhardwareenvironmentoftheexperiment项目参数操作系统Windows10(64位)CPU为Intel(R)Core(TM)i7-8750HCPU@2.20GHz,16GRBM实验平台PyCharmMATLAB开发语言python2.3系统评价指标评价指标是衡量机器学习模型性能好坏的重要指标,可以通过多项机器学习指标去衡量模型的性能好坏。本文将精确率、召回率、F1值和AUC曲线等指标综合衡量联邦个人信用评估模型的性能。如表2.3所示,介绍了混淆矩阵的四个值,分别是TP(TruePositive)、FN(FalseNegative)、FP(FalsePositive)、TN(TrueNegative)。根据以下四个值计算出下面指标。表2.SEQ表5.\*ARABIC3混淆矩阵Table2.3ConfusionMatrix正类负类正类TP(样本标签为0,预测为0)FN(样本标签为0,预测为1)负类FP(样本标签为1,预测为0)TN(样本标签为1,预测为1)其中准确率的含义就是所有判断中有多少判断正确的,即把违约的判断成违约,把未违约的判断为未违约占所有样本的比例。因此,准确率Accuracy=(TP精确率是指在预测的结果中,预测结果为正的样本中有多少是对的。则预测为正的包括TP和FP,其中TP是预测正确的数量。因此精确率P=召回率是指在预测的样本中,将正样本正确的预测为正样本。正样本包括正确预测的正样本TP和预测错误的正样本FN,其中预测正确的是样本有TP个。因此召回率R=F1分数(F1-score),它是精确率和召回率的调和平均数。F1分数综合了精确率和召回率的分数。说明p指标和R指标同样重要。ROC(ReceiverOperatingCharacteristicCurve),又称为“受试者工作特征曲线”,横坐标为FPR,纵坐标为TPR,反映了模型在选取不同阈值的时候其敏感性(sensitivity,FPR)和其精确性(specificity,TPR)的趋势走向。AUC(AreaUnderCurve)为ROC曲线下的面AUC值相较ROC曲线更能清晰的显示分类器的优劣,AUC值越大分类器效果越好。以上介绍了本章实验结果所用到的评价指标,接下来介绍数据预处理工作。2.4数据预处理2.4.1数据分析通过对每维特征的分析,发现issue_d字段(贷款日期)属于已经贷款后的特征,因此如果将这维特征加入训练模型的话属于数据泄露,训练出的模型属于无效模型,因此删除这维特征,同时对于地址的特征进行截取的处理,只保留数字特征。然后对数据的特征进行分析,通过对特征的相关性分析,去掉存在强相关的特征,同时也减少了数据的维度,提高训练模型效率。2.4.2空缺值填补通过对每列特征的空缺值的统计,共有emp_title、 emp_length、title、revol_util、mort_acc、pub_rec_bankruptcies特征存在空缺值,本文使用这几维特征的中位数和平均数等对其进行空缺值填补。2.4.3离散值编码由于神经网络只识别数字特征,因此需要对属于离散值的特征进行one-hot编码,本文的数据在进行特征转化后的特征维度是79维,较高的维度会严重影响神经网络的计算速度。因此还需要降维,主成分分析是一种非监督的机器学习算法,可以对数据维度进行降维,以提高对样本有价值信息的处理速度以及降低计算开销。2.4.4数据归一化 在传统机器学习理论中规范化是数据预处理中的一步,在神经网络中如果不做规范化将使取值范围大的神经元获得绝对值更大的导数(梯度),使得每次迭代就在该神经元上做更多努力,反而忽略了其他同层网络。在PSO寻优过程中优化会更集中于较大的量级的位置,而忽略了其他位置。该处理步骤包含以下两个目的: 将不同定义域的数值特征统一映射到某个区间,通常是0~1之间。将样本数据在各维度特征上尽量形成“两边高,中间低”的正态分布。比如处理的特征是年龄和收入,年龄的取值范围是0~150,而收入的取值范围是0到非常大。对于这两列特征就需要将它们映射到0~1之间。具体计算过程在4.2.3节中有详细介绍。2.4.5特征降维 对于离散值编码后的数据,数据维度较大,且特征稀疏,具有这样特征的数据在进入模型后使神经网络的输入节点数增大,神经层之间的连接权重数量陡增,造成了计算资源的浪费。one-hot编码后的数据维度78维,如果输入到BP神经网络模型,会大大增加模型的训练时间,同时也降低了模型的泛化能力,因此,在尽量减少信息丢失的前提下减少数据的维度。主成分分析法(PrincipalComponentAnalysis,PCA),用于研究在众多特征维度中之间的相关性,通过主成分分析可以了解不同特征之间信息的重叠程度,因此就可以从大量的特征维度中变换出综合特征,综合特征是原来特征的线性组合,将多个原始特征组合为几个具有代表意义的少数指标。在使用PCA技术对原始数据进行降维,降维完成后的维数和BP模型所得到的准确率关系如图2.2所示。图2.SEQ图5.\*ARABIC2PCA降维后维度与BP神经网络模型准确率的关系图Figure2.2TherelationshipbetweenthedimensionalityofPCAandtheaccuracyofBPneuralnetworkmodelafterdimensionalityreduction由于在原始数据存在噪声、无关变量等因素,从图中可以得出当原始数据降维到40维时,综合特征可以最大程度保留原始数据特征信息。因此本文选择将数据维度降到40维。2.4.6数据均衡化金融信贷数据具有正负样本不平衡的特点,原因在信贷业务的交易过程中,违约样本是极少数的,本文使用的数据集同样存在数据不平衡的问题。数据正负样本的不平衡导致模型预测偏向于样本量多的标签,原因是训练过程中的目标函数就是对训练样本的误差值进行加权,如果一类的样本占比巨大,就会对目标函数的走向产生巨大影响,而忽略了小类样本的误差。因此,在进行建模之前必须要通过数据平衡方法达到正负样本的均衡的特点。本文采用SMOTE(SyntheticMinorityOversamplingTechnique)[43],是一种过采样技术,是在随机采样的基础上改进的一种过采样算法,SMOTE原理简单,是一种常用的处理数据不平衡的过采样方法。首先,从少数样本中选择一个样本xl1,然后通过计算样本不平衡比例得到采样倍率N,从xi的k近邻中随机选择N个xl2x本文使用SMOTE算法对实验数据进行数据均衡化,保证了训练完成的模型的对于少数样本的预测能力。2.5改进PSO-BP神经网络模型实验对比本节将使用数据预处理完成的数据集对本文改进的PSO-BP神经网络模型进行实验,并将其与几种常见改进算法和经典算法相比较。2.2.1参数设置一个三层的BP神经网络就可就能以任意精度拟合任意复杂度的函数,因为具有一个隐藏层就足够建立个人信用评估模型。BP神经网络的输入和输出层是由输出输出向量决定,输入的个数是数据的特征维度,本文模型的输入是经PCA处理后的40维特征的数据,因此输入维度为40。个人信用评估模型是输入多维特征数据后预测可能出现违约情况,因此模型的输出是1或0,输出维度为1。隐藏层的神经元个数通过经验公式nn隐=通过多次实验,PSO模型的初始化参数为:粒子群数量为300,惯性权重初始为0.8,C1和C2为2,最大限速为5,初步迭代次数为4000次,惯性的衰变参数γ为0.4,收敛判定次数tn为20次。在遗传算法中,控制交叉概率参数a1为4,控制变异概率参数a2为4,pcmin和pcmax在混沌搜索中,控制参数φ设置为0.4,T1为10,T2为30。下面进行本文的实验。2.2.2实验结果本节对改进的PSO-BP模型进行实验,将它与标准PSO-BP、GA-PSO-BP、CS-PSO-BP三种算法进行对比,这三种算法在PSO算法研究中是常用的改进方法,通过与本文方法相比较,可以验证本文改进方法的改进效果。从数据集中按照正负样本的比例抽取10000条样本,通过数据预处理之后,使用相同的训练集和测试集训练4组模型。通过十次实验取平均值得到了4组算法的误差收敛图。如图2.3所示,标准PSO-BP模型表现在收敛速度较慢,陷入局部最优解后也不能快速跳出局部最优解,最后收敛于局部最优解。图2.SEQ图5.\*ARABIC3四种算法收敛比较图Figure2.3ComparisonoftheconvergenceofthefouralgorithmsPSO-CS-BP神经网络在收敛速度上优于标准PSO-BP模型,但是在全局寻优的能力较差,从结果上看收敛于局部最优解。PSO-GA-BP神经网络在收敛过程中在收敛速度较慢,无法快速从局部最优解上快速逃逸,从结果上看,遗传算法扩大了解的范围,搜索到了更优的解。而使用遗传算法和混沌搜索两种算法对PSO-BP神经网络进行优化后,可以看出在收敛速度上明显加快了速度,在陷入局部最优解时可以快速逃逸,继续进行高效的寻优,从结果也可以看出,PSO-GA-CS-BP算法在寻优过程中较其它三组算法发现了更多的解空间,得到了更接近全局最优的结果。本文改进的PSO-BP模型,也就是PSO-GA-CS-BP神经网络模型,相比较标准PSO-BP神经网络模型,GA-PSO-BP神经网络模型,CS-PSO-BP神经网络模型具有更快的收敛速度和更高的模型预测精度。(a)准确率对比图(b)精确率对比图(c)召回率对比图(d)F1-score对比图图2.SEQ图5.\*ARABIC4四种算法实验结果图Figure2.4Experimentalresultsofthefouralgorithms如图2.4实验结果图所示,本文改进的PSO-BP神经网络模型可以达到更高的预测准确率,从模型预测的精确率、召回率、F1-score这三个指标值中可以看出,本文改进的PSO-BP模型在召回率的指标上有明显的优势,在金融机构信贷业务中,是否可以准确的发现所有违约事件是非常重要的指标,直接关系金融机构的信贷业务损失资金的多少。在精确率上相较PSO-CS-BP模型略有不足,但从总体指标F1-score上看,本文改进的PSO-BP模型相较其他传统改进方法具有一定的优越性。(a)PSO-BPROC(b)PSO-CS-BPROC(c)PSO-GA-BPROC(d)PSO-GA-CS-BPROC图2.SEQ图5.\*ARABIC5ROC曲线图Figure2.5ROCcurve如图2.5所示,改进后的PSO-BP模型AUC曲线下方面积更大,说明改进后的PSO-BP模型相对于其他改进模型预测能力更强。因此,本文的模型具有更好的分类效果。图2.SEQ图5.\*ARABIC6改进PSO-BP神经网络算法模型准确率与迭代次数关系图Figure2.6TherelationshipbetweentheaccuracyoftheimprovedPSO-BPneuralnetworkalgorithmmodelandthenumberofiterations如图2.6所示,改进PSO-BP神经网络模型的预测正确率随着迭代次数的增加而提高,大约迭代到4000次左右,算法进入收敛状态,准确率不再提高。当模型完成前三千次迭代后,准确率基本保持稳定,在后续迭代中准确率在极小的范围内波动。(a)准确率对比图(b)精确率对比图(c)召回率对比图(d)F1-score对比图图2.SEQ图5.\*ARABIC7本文算法与其

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论