【《基于神经网络的支付交易数据异常检测技术分析案例概述》8600字】_第1页
【《基于神经网络的支付交易数据异常检测技术分析案例概述》8600字】_第2页
【《基于神经网络的支付交易数据异常检测技术分析案例概述》8600字】_第3页
【《基于神经网络的支付交易数据异常检测技术分析案例概述》8600字】_第4页
【《基于神经网络的支付交易数据异常检测技术分析案例概述》8600字】_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于神经网络的支付交易数据异常检测技术分析案例概述目录TOC\o"1-3"\h\u14835基于神经网络的支付交易数据异常检测技术分析案例概述 1156551.1系统整体总体架构 157501.2支付交易数据抽取过程 331921.3交易数据的预处理 14257471.4基于BP算法的人工神经网络风险分析 15117891.1.1BP算法特点 1570911.1.2BP神经网络的应用 15302593.1.3数据可用性的检验及说明 16141561.1.4神经网络的模型构建及数据模拟 1644511.5模型结果验证 181.1系统整体总体架构图4SEQ图\*ARABIC\s11总体架构图1)整体分为4个模块:基础数据、数据库、任务定时调度系统、结果展示业务系统。数据的抽取,转换,加载都是通过QUARTZ定时调度系统进行处理任务来实现。2)基础数据主要是客户数据和交易数据,分别来自业务系统、交易系统和清算系统。3)在基础数据的基础上,QUARTZ通过定时执行配置的获取数据的任务将基础数据抽取到数据仓库的数据库中。有了基础数据后再根据不同的业务主题进行数据的转换,转换后再按照最终需要呈现的分析结果进行相应的数据汇总统计得出主题数据。4)最后将结果以报表的形式进行展现,此时需要实时查询数据库中的数据。5)上图业务系统还可以查看风险案例的信息。根据实际情况制定风险规则,再利用定时任务对己有的数据进行定期的风险检查,如果触犯了风险规则就生成相应的风险案例数据,最后在通过业务系统展示。下面卡种交易主题交易数据信息要素进行分析:图4SEQ图\*ARABIC\s12卡种交易主题交易数据信息要素图1)首先,市场提出对需要对数据进行分析2)开发结合市场的需求确定分析的主题,以及如何将主题数据以报表形式展现给市场3)结合主题进行主题执行任务的开发以及报表模板的开发4)将主题任务添加到定时任务系统,定时任务系统根据配置的任务进行数据的提取,转换形成主题分析数据5)最后通过发布报表模板对主题数据进行展示1.2支付交易数据抽取过程图4SEQ图\*ARABIC\s13数据库架构使用Oracle数据库实现,从以下几个点进行分析:1)OracleWarehouseBuilder(OWB)是与Oracle数据库集成在一起的ETL工具。OWB为用户提供了一个用于建立ETL过程模型的图形化环境「16]2)存储:数据量大,读取频繁,以及数据的可靠性,使用RA}_5磁盘阵列来为系统提供数据安全保障和磁盘的读取速度。3)容灾:通过对数据进行备份,以达到一定的容灾能力,选择DG同步保证数据安全。4)索引策略:索引策略的选择,D数索引,位图索引,保证查询精准,快速。5)并行处理:多节点,多cpu,多内存。6)设计规则:保证异构的数据源与数据仓库中信息实体的语义一致性。7)数据库命名规则:a)实体(表)的命名基础信息表,前缀"INFO”,表以名词或名词短语命名,根据此表的用途以单词缩写表示,每个单词间以“_”分隔。在命名过程当中,根据语义拼凑缩写即可。如果表或者是字段的名称仅有一个单词,那么建议不使用缩写,而是用完整的单词。历史表,后缀“_111S",是哪个表的历史,则直接在表名后加上后缀。主题数据表,前缀“FACT_"。属性(列)的命名列名需要能直观的看出其意义,表字段的命名需要指定比较详细的设计规则。每一个表都将有一个自动ID作为主键,都以状态,创建人,创建时间,修改人,修改时间等要素。如果是数据库自动生成的编码,命为:REC_ID;如果其他特殊情况下的字段编码则用缩写加“ID”的方法命名。如果此键是数字类型,可以用“_NO”作为后缀。所有的属性加上有关类型的后缀,注意,如果还需要其它的后缀,都放在类型后缀之前。注:数据类型是文本的字段,类型后缀“TX”可以不写。有些类型比较明显的字段,可以不写类型后缀。视图的命名:视图以“V”作为前缀,其他命名规则和表的命名类似;命名应尽量体现各视图的功能。触发器的命名:触发器以“TR”作为前缀,触发器名为相应的表名加上后缀,Insert触发器加“_I",Delete触发器加“_D",Update触发器加“_U",如:TRMer_I,TR_Mer_D,TR_Mer_U。存储过程名:存储过程应以“UP”开头,和系统的存储过程区分;后续部分主要以动宾格式构成,各个组成部分使用下划线分割,如增加客户的事实数据提取的存储过程为UP_Info_Mero。变量名:变量名小写,若属于词组形式,每个单词中间用下划线分隔,如my_err_nu。设计的原则是:既要使数据存储结构合理,访问效率高,节省存储空间;又要在这种可用结构下减少或消除任何信息丢失。命名中其他注意事项命名不超过30个字符,变量名的长度限制为数据对象、变量的命名统一使用英文字符,不允许使用中文,且不可在对象名的字符中间留空格。注意不要保留字,字段名不使用保留字、数据库系统或者常用访问方法冲突。保持字段名和类型的一致性,在命名字段并为其指定数据类型的时候一定要保证一致性。假如数据类型在一个表里是整数,那在另一个表里不能变成字符型。1.2.1.1客户信息.表名:info_mer.表更新周期:每天更新.表更新范围:每日备份到历史表(info_mer_his)并重新提取数据,历史表结果跟其一致.表的分区设计:客户量就几十万,无需分区.表的索引设计:mer_no,busi_code.表的唯一约束:rec_id表的用途:存储从业务系统获取的客户基础数据.表设计如下:表4SEQ表\*ARABIC\s11客户信息要素字段名字段类型是否可为空默认值描述MER-NOVARCHAR2(15)N客户编号BUSI-CODEVARCHAR2(8)N业务类型MER-NAMEVARCHAR2(200)N客户名称MER-ADDRVARCHAR2(200)Y客户地址REC-STATVARCHAR2(1)Y客户状态,0-正常,1-停用CRE-UIDVARCHAR2(50)Y创建人CRE-DTMDATEY创建时间MOD-UIDVARCHR2(50)Y修改人MOD-MTDDATEY修改时间MACCVARCHR2(6)YMCC-NAMEVARCHR2(100)YMCC名称PBCBANKVARCHR2(8)Y行别COUNTRY-CODINGVARCHR2(8)Y收款人常驻国家编码SFZIDVARCHR2(30)Y身份证编号SFZID-BEGIN-DATEDATEY法人身份证有效期SFZID-END-DATEDATEY法人身份证有效期LEGALREPVARCHR2(50)Y法人代表YYZZIDVARCHR2(40)Y营业执照编号LEGALREPVARCHR2(20)Y联系人YYZZIDVARCHR2(26)Y联系人电话LINK-MANDATEY入网时间LINK-MAN-TELVARCHR2(15)Y行业编号TRAND-NAMEVARCHR2(100)Y行业名称BANK-PROVINCEVARCHR2(20)Y开户行省BANKPCODEVARCHR2(6)Y开户行省编号BANK-CITYVARCHR2(30)Y开户行市BANK-CCODEVARCHR2(6)Y开户行市编号BANK-AREAVARCHR2(30)Y开户行区BANK-CCODEVARCHR2(6)Y开户行市编号BANKCODEVARCHR2(12)Y电子联行号BANKNAMEVARCHR2(200)Y开户银行ACCNAMEVARCHR2(50)Y账户名称BANK-ACCNOVARCHR2(30)Y银行账号ACCOUNT-ATTRIBUTECHAR(1)Y账户属性SALEMANNAMEVARCHR2(20)Y拓展人INPUT-DTMDATEY导入时间1.2.1.2终端信息.表名:info_term.表更新周期:每天更新.表更新范围:每日备份到历史表(info_term_his)并重新提取数据,历史表结果跟其一致.表的分区设计:终端量就几十万,无需分区.表的索引设计:mer_no,term_no,busi_code.表的主键:Key.表的用途:rec.存储从业务系统获取的终端基础数据.表设计如下:表4SEQ表\*ARABIC\s12终端信息要素字段名字段类型是否可为空默认值描述REC-IDVARCHAR2(50)N记录IDMER-NOVARCHAR2(20)N客户编号TERM-NOVARCHAR2(15)N终端编号BUSI-CODEVARCHAR2(8)N业务类型TERM-ADDRVARCHAR2(200)Y装机地址FIR-INS-DTMDATEY首次装机时间LAS-INS-DTMDATEY最后装机时间LAS-STP-DTMDATEY最后暂停用时间END-DTMDATEY撤机时间MAC-NOVARCHAR2(20)Y机身号MAC-MODELVARCHAR2(20)Y机具型号MAC-BRANDVARCHAR2(20)Y机具品牌ORG-IDVARCHAR2(8)Y维护机构REC-STATVARCHAR2(1)Y终端状态,0-启用,1-停用,3-暂停用CRE-UIDVARCHAR2(50)Y创建人CRE-DTMDATEY创建时间MOD-UIDVARCHAR2(1)Y修改人MOD-DTMDATEY修改时间DEVICE-TYPEVARCHAR2(2)Y设备类型:01-有线POS:02-无线POS(GPRS);03-无线POS(CDMA):04-无线POS(WIFI):05-网络POS11自助终端:12-自助终端(3G):13-自助终端(CDMA):14-自助终端(GRRS),15-自助终端(网络);21-农行PSAMEND-REASONVARCHAR2(200)Y撤机原因明细STREETVARCHAR2(50)Y街道LINK-MAN1VARCHAR2(20)Y联系人1LINK-MANI-TEL1VARCHAR2(30)Y联系人电话1LINK-MAN2VARCHAR2(20)Y联系人2LINK-MANI-TEL2VARCHAR2(30)Y联系人电话21.2.1.3银行信息.表名:info_bank.表更新周期:每天更新.表更新范围:删除后重新提取,不进行备份.表的分区设计:无需分区.表的索引设计:bank_name.表的唯一约束:banck_code.表的用途:存储从业务系统获取的基础数据.表设计如下:表4SEQ表\*ARABIC\s13银行信息要素字段名字段类型是否可为空默认值描述BANK-CODEVARCHAR2(8)N银行代码BANK-NAMEVARCHAR2(255)N银行名称DSCRVARCHAR2(255)Y备注1.2.1.4MCC信息.表名:info_mcc.表更新周期:每天更新.表更新范围:删除后重新提取,不进行备份.表的分区设计:无.表的索引设计:mcc_type.表的唯一约束:mcc.表的用途:记录着行业的分类信息.表设计如下:表4SEQ表\*ARABIC\s14MCC信息要素字段名字段类型是否可为空默认值描述MCCVARCHAR2(4)NMCC代码NAMEVARCHAR2(100)NMCC名称MCC-TYPEVARCHAR2(2)NMCC类别MCC-TYPE-NAMEVARCHAR2(100)YMCC类别名称STD-MCC-TYPEVARCHAR2(1)Y银联标准行业大类1.2.1.5业务信息.表名:info_busi_type表更新周期:每天更新表更新范围:删除后重新提取,不进行备份表的分区设计:表的索引设计:busi表的唯一:表的用途:busi_type_id记录着业务信息表设计如下:表4SEQ表\*ARABIC\s15业务信息要素字段名字段类型是否可为空默认值描述BUSI-TYPE-IDVARCHAR2(8)N业务类型IDBUSI-TYPE-NAMEVARCHAR2(100)N业务类型名称DSCRVARCHAR2(255)Y备注1.2.1.6交易明细表名:trx_avp_detail表更新范围:叠加表的分区设计:按月分区表的索引设计:MER_NO,PA_YesMER_NO;SETT_REC_ID;MER_NO,SETT_DATE;SETT_DATE,DATA_SOURCE_ID;SETT_DATE,REC_ID;表的唯一:sett_date,rec_id表的用途:存储从清算系统获取每日清算数据,用于进行统计表设计如下:表更新周期:每天表4SEQ表\*ARABIC\s16交易明细信息要素字段名字段类型是否可为空默认值描述SETT-DATEVARCHAR2(8)N清算日期REC-IDVARCHAR2(32)N记录IDSYS-TRA-NOVARCHAR2(6)N系统跟踪号RESP-CD4VARCHAR2(2)N应答码TRX-CODEVARCHAR2(4)N银联交易代码TRX-AMTVARCHAR2(12,2)N交易金额MESSAGE-TYPEVARCHAR2(4)N消息类型LOC-TRANDS-DT-TMVARCHAR2(20)N本地交易日期时间:格式:YYYYMMDDhhmmssMCCVARCHAR2(4)N客户类型(MCC码)RETRI-REF-NOVARCHAR2(12)N检索参考号PRI-ACCT-NOVARCHAR2(21)N主账号BINVARCHAR2(14)Y卡BINCARD-ATTRVARCHAR2(2)Y卡性质,01:贷记卡02:准贷记卡03:借记卡:(二期新增)99:其他CARD-MEDIAVARCHAR2(1)Y卡介质,1:磁条2:pbocic卡3:emvic卡:(二期新增)4:无卡5:FallbackTERM-NOVARCHAR2(8)Y受卡机终端标识码(终端编号)MER-NOVARCHAR2(20)N受卡方标识代码(客户编号)CARD-ACCPTR-NM-LOCVARCHAR2(40)N受卡方名称地址(客户简称)ACQ-INS-ID-CDVARCHAR2(13)N受理机构标识码FWD-INS-ID-CDVARCHAR2(13)Y转发机构标识码RCV-INS-ID-CDVARCHAR2(13)Y接受机构标识码ISS-INS-ID-CDVARCHAR2(13)Y发卡机构标识码ORIG-SYS-TRA-NOVARCHAR2(6)Y原始系统跟踪号ORIG-TRANSMSN-DT-TMVARCHAR2(20)Y原始系统日期时间:格式:YYYYMMDDDhhmmssRSN-CDVARCHAR2(4)Y原因码AUTH-DTVARCHAR2(4)Y授权日期AUTH-ID-RESP-CDVARCHAR2(7)Y授权标识应答码POS-ENTRY-MD-CDVARCHAR2(3)Y服务点输入方式POS-COND-CDVARCHAR2(2)Y服务点条件代码PROC-CDVARCHAR2(6)N交易处理码SUBINST-CODEVARCHAR2(12,2)N交易所属分支机构:默认为100400ORIG-TRANS-ATVARCHAR2(32)N原始交易金额LOCAL-REC-IDN本地增值流水ID,用来追溯本地增值流水记录BUSI-CODEVARCHAR2(8)N业务类型代码PROD-CODEVARCHAR2(4)N产品类型代码:默认为业务类型代码前四位UMS-UN-BUSI-CODEVARCHAR2(2)Y银商统一后业务类型,应为“产品编码”后两位PRE-PCHNLVARCHAR2(3)N前置渠道PAL-PCHNLVARCHAR2(3)N支付渠道ACQ-MER-NOVARCHAR2(15)N受理端客户编号ACQ-TRERM-NOVARCHAR2(8)N受理点终端编号SRTT-REC-IDVARCHAR2(128)Y清分流水IDSRTT-AMTVARCHAR2(15,2)Y清分交易金额MER-FEEVARCHAR2(15,2)Y清分手续费金额ISS-FEEVARCHAR2(15,2)Y发行卡交易金额RCV-FEEVARCHAR2(15,2)Y转接方受益金额ACQ-FEEVARCHAR2(15,2)Y收单受益金额BRAND-FEEVARCHAR2(15,2)Y品牌服务费ERROR-ENTER-AMTVARCHAR2(15,2)Y差错应收金额ERROR-OUT-AMTVARCHAR2(15,2)Y差错应付金额TERM-TYPEVARCHAR2(15,2)N终端类型,00:其他:01:自动柜员机:03:POS终端:05:多媒体终端:06:银行柜台和柜面:07:个人电脑:08:手机设备:09:Ⅰ型固定电话:10:基于PBOC电子钱包/存折标准的交易终端:11:移动POS:16:数字机顶盒:17:Ⅱ型固定电话RESV1VARCHAR2(255)Y保留域1RESV2VARCHAR2(255)Y保留域2:对多路由数据=D1文件RESV3VARCHAR2(255)Y保留域3:对多路由数据=D1文件RESV4VARCHAR2(255)Y保留域4:对多路由数据=D1文件RESV5VARCHAR2(255)Y保留域5:对多路由数据=D1文件CRE-DTMDATEY创建时间DATA-SOURCE-IDVARCHAR2(2)N数据源:定义参见表AVP-TRX-CODEVARCHAR2(4)Y增值交易代码UNS-BUSI-CODEVARCHAR2(6)Y银商业务类型代码UNS-PROD-CODEVARCHAR2(4)Y银商产品类型代码MER-INST-CODEVARCHAR2(8)Y客户所属机构SETT-MER-NOVARCHAR2(20)Y清算客户号PCHNL-MER-NOVARCHAR2(20)Y渠道客户号PCHNL-TERM-NOVARCHAR2(8)Y渠道终端号1.3交易数据的预处理本文采用银行的交易历史数据作为模型的检测数据,其中的风险交易己经人工或反欺诈处理系统标记出来并通过人工核对。由于是本次采集的交易数据,基本不存在特征值缺失的情况,本实验处理不进行缺失值补全等过程。针对银行交易数据存在时间上的相关性,主要使用两种常见的方式进行处理。一种是基于时间范围的变量衍生方法,例如时间范围内交易的次数或平均的交易金额、当前交易金额与过去一段时间交易金额均值或均方差的比。另一种为基于事件频率的变量衍生方法,例如账户的关键信息有没有发生变更、使用的交易设备是否发生变化、过去10次20次交易的平均交易金额等。本文采用的衍生的的变量有过去1天、7天、14天、30天、90天、180天是否发生交易。交易频率相关的衍生变量有过去1天的交易次数、过去7天的日均交易次数、过去14天的日均交易次数、过去30天的日均交易次数、过去90天的日均交易次数、过去180天的日均交易次数。交易金额相关的衍生变量有过去1天的交易额、过去7天的日均交易额、过去14天的日均交易额、过去30天的交易额、过去90天的日均交易额、过去180天的日均交易额。账户余额相关的衍生变量有过去1天的余额、过去7天的日均余额、过去14天的日均余额、过去30天的日均余额、过去90天的日均余额、过去180天的日均余额。2.变量离散化数据标准化处理布尔转换,对于客户性别、婚姻状态等属性进行布尔转换。连续变量的离散化处理,主要针对交易金额、账户余额、客户年龄、客户账龄等连续性变量。本实验采用等频的连续变量的离散化处理方法。首先确定一个初始分组数量和组距,通过调整分组后计算分组后的事件率相等找出最优分组。1.4基于BP算法的人工神经网络风险分析应用决策树模型,依据上文提取的网络节点结构和性质对支付交易中的节点识别为正常交易账号和异常交易账号,并对生成决策树模型的C1.5算法中连续型特征离散化的步骤进行了改进,使连续型特征离散化选取的阂值更加准确,在保证足够信息量的前提下减少离散化的区间数目,进而简化生成的决策树模型结构。最后利用生成的决策树模型完成识别大量交易数据中的异常交易账号工作。1.1.1BP算法特点自学习特点,BP神经网络在被输入一个样本的数据和对应的预期输出结果的时候,BP神经网络可以通过训练,自己学会这个样本中输入和输出之间是怎样的关系,然后皆可以对相差不多的其他数据信息进行评估。高速寻找优化解的能力。BP神经网络,能够有效地让计算机进行高速的计算,然后我们可以用非常少的时间,得到一个模型的最优解情况。不确定性信息处理能力。这也是人工神经网络的最大特点。神经网络中有很多很多的神经元,而且其网络化的结构,可以比同等的线性结构容纳更多的信息数据,而且其每个神经元之间形成的网络结构,让数据间的关系联系更加复杂和密切,即使有一个或者一些数据缺失或者模糊,甚至数据错误的情况下,BP神经网络都能够利用强大的网络关系,找出最佳的输出结果。抗压性,BP神经网络通过一定的学习和训练,即使在某些神经元失效的情况下,仍能够正常有效的预测。1.1.2BP神经网络的应用本文将采用B-P神经网络方法进行分析,从最上层的“总体感知风险”到底层的各类具体风险因素,共分为两个部分进行神经网络模拟。首先以各风险维度作为输入项,对应的风险因素为输出,216份有效问卷共有216对输入和输出数据作为样本,模拟得出底层权重及变量间关系,通过神经网络的学习,再根据具体风险因素作为输入项,可以输出一组预测的“感知风险维度”数据,再以此作为输入项,用户感知的总体风险程度作为输出,进行顶层模拟,可以确定各风险维度的相对重要性。经过上述流程,第一层的预测值又作为第二层的输入值进行模拟,数据从底层至顶层能够完全连通。1.3数据可用性的检验及说明针对上述样本集,首先在系统内建立“数据审核”节点,对数据进行可用性检验。以感知经济风险指标体系为例。Clementine的数据质量探索输出结果非常直观,以“感知经济风险”为例,可以看出样本数据的大致分布,以及伊特特征指标量,例如最大值、最小值、峰度偏度等。除此之外,Clementine还具有图文并茂的特点,用一张图几乎说明了数据源各种质量问题。如上图所示,可以明显的看出,感知经济风险下属的3项基础指标基本都呈散点均匀分布于坐标轴上。我们可以发现变量的完整性达到了100%,同时仅有“感知经济风险”指标的样本中不存在离群值和极值,通过上述诊断,数据质量问题一目了然。据此可以看出,样本数量十分完整,仅有少量极值出现,不影响后续的模型训练和预测,属于数据质量可控的范围内。由此我们可以得出结论,样本符合数据可用性的前提,下面将利用上述样本进行各部分的神经网络模拟。1.1.4神经网络的模型构建及数据模拟在拥有“感知经济风险”、“感知时间风险”、‘憾知技术风险”、“感知隐私风险”、“感知社会风险,以及“感知信誉风险”各项体系下属的基础指标数据和对应类别的“风险感知程度”后,就可以构建相应的B-P神经网络模型,本课题采用SpssClementine17.0对相关数据进行神经网络模拟,采用该软件需要设置一些基础参数。以“感知经济风险”为例,共有3个输入指标,1个输出指标,输入数据元有:1.不合理收费带来的风险一使用第三方移动支付产品的过程中遭到不合理收费的风险。2设备或密码丢失的风险一(2)移动终端设备丢失或被窃而导致的可能财产损失的风险。3账户或密码丢失或被窃导致的可能财产损失的风险。输入数据元:用户感知的经济风险程度。即输入神经元个数为6,输出神经元个数为l。由于本课题采用的是含有一层隐含层的B-P神经网络,因而还需要确定隐藏层神经元个数,本文将以神经网络的模拟估计精度为标准,确定在该指标体系中隐藏层神经元个数。随着模型不断拟合,该精度值最终会稳定在某一位置,称为“模拟估计精度”。此处,本文在对比调整藏层神经元个数的过程中,观察模拟估计精度的变化情况,最终确定感知经济风险体系指标的隐藏层神经元个数为15个。除此之外,关于B-P神经网络的具体训练方法,经过课题组多次实验,最终确定采用“快速训练法”的“专家模式”进行模拟,同时在模拟过程中还需要设置其他相关参数如下,其中Eta表示的是学习率,即神经网络每次模拟移动的距离,Alpha表示冲量项,在反向传播中,引入冲量项的目的是加快学习速度。表4SEQ表\*ARABIC\s17神经网络其他相关参数Alpha初始Eta高EtaEta衰减低Eta0.90.30.1300.01在确定上述参数后,可以构建B-P神经网络模拟数据流,以“感知经济风险”指标体系为例,如图4-7所示,从“分区”节点开始向右延伸共有5条分支,第一条“分区,,—“感知经济风险”表示采用100%的样本数据进行感知经济风险指标体系的神经网络模拟过程,第二条“分区’~‘选择,七一一一‘‘感知经济风险”表示采用70%的样本数据进行神经网络模拟,第三条“分区”一‘选择,一‘70%感知经济风险”模型一‘表”表示针对70%样本输入指标进行预测输出,第四条“分区”“选择,一‘100%感知经济风险”模型“表”表示针对全部样本输入指标进行预测输出,第五条“分区”一“表”仅用来查看输入系统的数据,以“表”的形式呈现。2)、模拟过程中发现的一些问题及处理方法在模拟过程中,本文尝试采用70%的样本数据进行模拟,30%的数据进行检验,但在模拟过程中发现,如果对数据进行“分区”处理,样本检验的结果普遍不好,预测结果与输出原值的误差浮动在30%左右。在此本文进行研究分析认为,由于该模型样本数量的限制,若采取不完全样本进行训练,会忽略掉大量属于模型的关键信息,因而造成样本检验大部分不达标的情况。因此本文最终采用100%样本数据进行模拟,随后针对系统模拟,将100%数据进行预测,在经过上述方法修正后,总体样本数据的误差范围能够控制在10%,预测的准确性明显提升,因而本文决定采用100%的数据进行训练。3)、数据模拟在成功构建相应数据流,并确定模拟样本数量后,可以对第三方移动支付感知风险指标体系进行B-P神经网络模拟,以“感知经济风险”的指标体系模拟过程为例。1.5模型结果验证本次模型采用newff,函数构建模型,对于新版本的newff函数,可采用提前结束,防止过训练的策略,通过少数迭代次数,达到收敛。模型的构建中,利用MATLAB中的默认值设置隐含层节点数、传递函数。模型中的训练函数trainlm函数,并设置最大迭代次数为1500次,调用train函数进行训练。具体代码如下:%创建BP网络net=newff(trainx,trainy);%设置最大训练次数net.trainParam.epochs=1500;%目标误差net.trainParam.goal=1e-13;%显示级别net.trainParam.snov}l;%训练net=train(net,trainx,trainy);为了消除因为有随机的因素对训练造成影响,在训练的过程中,选择了相同的训练和测试样本,一直重复运算40次,分别统计其正确的概率,最终得到平均正确率为87.27%,最低正确率为81.42%,迭代次数为6。在训练及拟合完成后,针对上述建立的支付交易风险度量模型,利用Sim函数引入新的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论