版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGEIIO2O平台用户黏度影响因素分析--以大众点评为例摘要我国O2O平台逐步转型,O2O平台消费需求已经从生存型转向了享受型。因此,对于O2O平台企业而言,能够从需求出发,以顾客为中心研究享受型消费的基本特征和需求本质极具影响力。论文在分析的基础上,根据大众点评客户的流失问题的各项原因的研究和分析,还能够对客户的风险预警体系作出调查。除此之外,在这些的基础上还做到了问卷调查的方式来实现基本的样本数据的收集。关键词:神经网络O2O平台大众点评粘性客户流失
目录摘要 I1绪论 12文献综述 22.1粘性的概念 22.2粘性的影响因素 23大众点评客户流失预警指标体系精简 33.1样本数据的搜集 33.1.1调查目的和问卷设计 33.1.2样本构成与基本信息统计 33.2大众点评客户流失风险预警指标体系属性约简 43.2.1KMO样本测度及巴特莱特球体检验 43.2.2变量提取 54基于神经网络的大众点评客户流失风险预警模型构建 114.1大众点评客户流失风险等级划分 114.2大众点评客户流失风险预警模型构建 164.2.1神经网络模型三层结构设计 164.2.2客户流失风险预警模型参数选择 174.3神经网络模型检验 18结语 20参考文献 20PAGE201绪论O2O平台的消费逐步转型,O2O平台消费需求已经从生存型转向了享受型。因此,对于O2O平台企业而言,能够从需求出发,以顾客为中心研究享受型消费的基本特征和需求本质极具影响力。理论意义上,目前关于客户粘性的研究内容大多集中在忠诚度与满意度,涉及各个行业的客户粘度分析,客户粘性实证分析,基于客户粘性的其他方面研究。有关O2O平台客户粘性的研究少之甚少,因此此次研究具有巨大的学术研究价值和理论意义。无论是从客户角度提升其良好体验,还是O2O平台行业自身的发展,客户粘性的研究已然成为焦点。随着电商的迅速发展,O2O平台市场竞争激烈,客户粘性的相关研究也缓慢地增加。客户粘性本质上是一种消费者忠诚与持续购买的意愿,它体现了消费者对于企业心理上和行为上的依赖感,这种依赖使得消费者能够长时间并且高频次地光顾产品。客户粘性能够使得企业保留住客户从而减少企业的用户成本。因此,研究客户粘性对于企业来说至关重要。分析有关O2O平台客户粘性的影响因素的研究能够弥补相关内容的研究空白,丰富客户粘性相关内容的理论基础。实际意义上,客户粘性是客户对于一个品牌、一件商品或一家店的依赖感和再消费期望值,它是由顾客的忠诚、信任与获得的良性体验等结合起来而形成的。依赖感越强,再消费期望值越高,客户粘性就越高。对O2O平台客户粘性影响因素的分析,能够全方位了解哪些因素在左右客户的粘性,通过对这些因素的分析来指导企业进行各个方面的改善。就传统意义上来说,客户粘性的影响因素主要包括:产品价格和质量、服务体系的好坏、客户体验度的高低、售后服务质量、客户满意度、用户成本的高低。随着移动互联网和社会化媒体的不断发展,对O2O平台客户粘性的影响因素不断增加,其中线上线下渠道的购买便利性、社会化媒体的营销效果等都对客户粘性产生巨大的影响。此次通过调查问卷的方式进行分析,能够充分分析O2O平台企业客户粘性的影响因素以及各个因素的权重。帮助O2O平台行业在以后的经营活动中,有针对性的进行改善,提升O2O平台品牌的服务质量和用户体验,获得更多的流量,并且提升品牌的核心竞争力,增强O2O平台行业在市场上的发展优势。2文献综述2.1粘性的概念粘性的概念最初来自一种叫做“牙膏”的食肉植物,它利用自身的香味来吸引昆虫。在随后的研究领域中有不同的应用,例如工业设计和知识管理领域中粘度的定义是知识寻求者将搜索到的知识转化为所需形式所必须付出的代价,即知识粘性越高,知识消费者的成本就越大。在网络粘性概念提出之前,管理领域对粘性的研究主要集中在工资、成本、价格、利率等方面,即成本粘性、价格粘性和利率粘性。Lietal.(2006)基于顾客忠诚的含义,认为粘性是消费者对深控网站再利用的承诺,并坚持今后重复访问和持续使用,不考虑导致转换行为或其他营销努力的外部潜力。首选网站被认为是消费者持续使用的行为。学者王海平(2009)认为,用户粘性是指消费者对网站的感知和情感。即使面对转换压力等影响因素,他们也不会选择放弃连续访问和使用自己喜欢的网站。消费者的特点。有学者认为粘性表现是消费者对网站的依赖,当这种习惯和依赖被剥夺时,就会产生不满。。2.2粘性的影响因素(1)网站因素。网站因素主要指与网站设计、产品质量、内容、服务特征等在内的和网站整体环境相关的影响因素,包括网站属性、网络外部性、网站声誉、转换成本、替代者吸引力等。当网站提供给网站用户准确、详细且有用价值的内容,网站吸引和保留用户的能力越高,即网站的内容质量越高,网站粘性越强。(2)用户因素。用户因素是指与用户个人特性密切相关的因素包括个人特征因素和用户心理因素。相比于网站因素,学者对用户层面影响因素的研究范围更为广泛,研究视角也更多。本文基于文献梳理,对影响用户粘性的用户因素进行了归纳汇总,在个人特征方面主要包括个性、性别、教育程度、网络使用经验、收入水平等人口特征因素。在用户心理层面包括感知价值、用户满意、用户态度、承诺与信任、用户体验和自我效能等。3大众点评客户流失预警指标体系精简3.1样本数据的搜集3.1.1调查目的和问卷设计本文问卷调查目的在于找出影响020电子商务企业客户流失的因素与客户流失状态的关系。问卷由两部分组成,第一部分是关于被调查者的年龄、性别、居住城市和月收入水平的基本信息;第二部分是正文部分,是关于影响电子商务客户流失因素的调查问题,要求被调查者根据自己使用大众点评的经历和感受,选择与自己情况相符的选项。本文采用数据来自对近一年来使用大众点评的300个客户的调查数据,以2016年1月作为研究的起始时间,中止时间为2016年12月,抽取该时间段内在大众点评注册并成功下单的用户,共计300个样本,该数据集包含300个客户的个人信息,对A平台在载入速度、网站页面设置及布局、联系沟通的便捷性、更新信息的及时性、支付方式全面性、退换货方便程度、交易时的安全性、物流速度满意度、快递员服务满意度、产品种类齐全性、商品信息的可信度、产品价格满意度、首发销售产品量、商品质量、价格接受程度的打分,以及样本客户的移动设备使用程度、下单一支付转化率、推荐产品点击率、优惠券吸引点击率、退换货次数、购买产品差评率、同类电商可选择机会、使用同类电商的个数、登录频率、平均浏览时长的信息。并统计这些样本客户使用京东平台后是否为流失客户。其中流失客户149个,非流失客户151个。3.1.2样本构成与基本信息统计本次收集数据问卷投放的被调查对象有在校大学生,也有已工作人群,收集方式采用微信和E-mail两种方式同时进行。调查问卷共设29个题项,问卷总发放数量为320份,回收共计310份,反馈率为96%。去除回收问卷中的10份无效问卷,有效问卷为300份,有效率达90%通过对回收的有效问卷分析可以看到,020电商己普及范围很广,遍及不同年龄不同职业的人群,己被相当大的消费者接受并作为日常生活的一部分,采样的男女比例基本一致;占总调查人数39.6%的样本用户年龄分布在25-35岁的区间;被调查者的居住城市多数分布在一线城市和二三线城市,占据总调查人数的84%;月收入水平集中人数最多的在3500-6500区间范围;受教育程度良好消费者接受这种方式的人数更多。调查问卷中的样本信息是零散且方便客户填写的,为了后文研究,在收集到样本数据后,需要将其进行必要的预处理,将数据转化成便于定量运算的形式。3.2大众点评客户流失风险预警指标体系属性约简考虑相关性研究的时候,一般是运用一开始的感受来确定29个指标的关系形式,所以不同的信息在叠加的状态下,必须要从关联性上做到分析。选择正确的方式能够实现各种指标之间的简约形式的认定,这种方式是较为合理必要的。想要从各种信息当中提取出来变量的定义形式,就要从原始的数据上做到分析,所以在研究的时候,选择公因子定义的形式能够做到数据的提取。在这之后的因子形式还可以把效率较高的变量展示出来,进而得到信息的最为原始的状态。在这篇文章当中,选择SPSS23.0的形式可以做到对流失问题的重点研究。任何的设计都需要从流失预警的模型上做到简单化。3.2.1KMO样本测度及巴特莱特球体检验只有相互之间关联较为紧密的变量才有必要做主成分分析。因此,要对影响客户流失的变量进行主成分分析,首先要检验变量之间的相关性。常被用来检验变量相关性的方法有KMO样本测度和巴特莱特球体检验。KMO取值范围是(0,1),它的作用是检验各变量间偏相关性,数值越大(越接近于1)表示各变量有高的相关性,也就越适合做主成分分析。常用的度量标准是:KMO>0.9时,表示非常适合;当0.8<KMO<0.9时,表示很适合;当0.7<KMO<0.8时,表示适合;当0.6<KMO<0.7时,则代表不太适合,当0.5<KMO<0.6时勉强适合,当KMO<0.5是,表示完全不适合进行主成分分析。巴特莱特球体检验的作用是检验各变量间的相互独立性,首先提出原假设:变量间的相互独立,各变量只与自身相关,而与其他变量无关,即各变量构成的相关系数矩阵是单位矩阵。计算结果中若显著性水平Sig.>0.05,原假设成立,变量间确实相互独立,也说明了不适合进行主成分分析;若显著性水平Sig.<0.05,证明原假设不成立,说明变量间有较强的相关性,可以用来做主成分分析。本研究同时用两个标准检验样本是否适合做主成分分析,样本数据的KMO样本测度和Bartlett球体检验的结果见表4-2。表4-2KMO和Bartlett球体检验KMO和巴特利特检验KMO取样适切性量数。.728巴特利特球形度检验近似卡方1267.875自由度406显著性.000KMO取样适切性量数为0.728,根据统计学家给出的因子分析适合性指标KMO度量标准,可知适合做因子分析;又知Bartlett球形检验的近似卡方值为1268.795,显著性概率为0,小于显著性水平0.05。所以拒绝Bartlett球度检验的零假设,变量之间存在共同的因素,确定样本数据适合用来做主成分分析。3.2.2变量提取进行变量的使用通常要在特定的规则模式下实现主成分的提取,同时要在超过一的主成分中实现考虑。特征值能够对主成分力产生很大的影响,假设超过这个特征值的时候,还能够从变量的力度上做到解释的效果。这种主成分能够显示出最为原始的信息形式,所以最后通常把特征值大于1作为提取主成分的标准。表4-3主成分解释的总方差表及累计的贡献率总方差解释成分初始特征值提取载荷平方和总计方差百分比累积%总计方差百分比累积%16.57622.64522.6456.57622.64522.64523.40411.70834.3413.40411.70834.34131.9746.77941.1081.9746.77941.10841.8026.18347.2791.8026.18347.27951.6555.67852.9441.6555.67852.94461.4494.96757.8991.4494.96757.89971.3394.58762.4741.3394.58762.47481.2934.42966.8911.2934.42966.89191.1453.91970.7981.1453.91970.798101.0133.46274.2481.0133.46274.248110.7952.71376.949120.7582.58379.52130.6852.33181.839140.6092.07283.899150.5161.75185.638160.4921.66887.294170.4581.54988.831180.4381.4890.299190.3911.31891.605200.3771.26992.862210.3561.19894.047220.3111.04495.079230.2830.94896.015240.2610.8796.873250.2550.85197.712260.2230.73998.439270.2070.68699.113280.1720.56499.665290.1130.359100.012从主成分累计的贡献率表中可以观察出,有十个主成分特征值大于1,其中,第一主成分特征值为6.576,方差贡献率为22.633%,即第一主成分能够反映原始样本数据信息的22.633%;第二主成分的特征值为3.404,方差贡献率为11.696%,前两个主成分累加占到总方差的34.329%,即前两个主成分能够反映原始样本数据信息的34.329%;第三个主成分的特征值为1.974,方差贡献率为6.767%,前三个主成分累加占到总方差的41.096%。同理,前十个主成分能够反映原始样本数据信息的74.236%,已经足够反映原始样本的大部分信息。对于特征值λ1=6.576,λ2=3.404,λ3=1.974,λ4==1.802,λ5=1.655,λ6=1.449,λ7=1.339,λ8=1.293,λ9=1.14,λ10=1.043,分别计算出变量X1,X2X29在各主成分上的载荷得到主成分载荷矩阵,结果如表4-4所示。表4-4成分矩阵变量成分1成分2成分3成分4成分5成分6成分7成分8成分9成分10X10.687-0.1750.07-0.2240.261-0.1050.1330.2060.030.288X20.812-0.162-0.019-0.1040.2110.0410.1570.046-0.0340.195X30.48-0.0040.4720.215-0.095-0.061-0.1340.346-0.346-0.078X40.383-0.040.537-0.225-0.0390.393-0.174-0.139-0.2440.166X50.798-0.0970.034-0.0530.1920.020.0610.005-0.0330.09X60.0990.6590.174-0.0550.083-0.2720.0190.1190.47-0.137X70.6020.1590.043-0.1-0.2040.2190.0460.508-0.029-0.038X8-0.690.1350.039-0.057-0.3680.143-0.0560.3130.1210.052X90.6150.0360.0890.183-0.23-0.1120.1220.2640.131-0.468X100.638-0.259-0.116-0.1880.088-0.186-0.106-0.1690.0660.052X110.3310.371-0.1420.031-0.5220.294-0.021-0.065-0.0510.284X12-0.0020.6170.167-0.3240.2220.1310.45-0.1190.03-0.046X130.554-0.2220.5770.015-0.1960.065-0.131-0.2490.225-0.102X140.6070.188-0.4640.217-0.221-0.027-0.0460.1860.0410.082X150.4670.014-0.3020.3360.1760.4130.1230.3380.152-0.013X160.7-0.027-0.2730.030.153-0.142-0.003-0.0480.2110.232X170.420.395-0.143-0.07-0.3310.3140.146-0.37-0.105-0.057X180.806-0.107-0.085-0.0670.173-0.072-0.096-0.022-0.014-0.05X190.534-0.1920.297-0.08-0.1830.198-0.205-0.160.408-0.176X200.1250.5030.4230.0970.364-0.170.1920.111-0.145-0.126X21-0.3290.2770.327-0.3840.2220.312-0.0010.3310.150.278X22-0.056-0.1940.4030.53600.0390.0950.0650.4350.391X23-0.0130.6210.0840.149-0.151-0.35-0.217-0.1040.1580.349X240.0260.0370.190.6330.205-0.07-0.146-0.165-0.220.008X250.4090.6290.0890.012-0.225-0.1890.338-0.1070.0210.024X260.0830.487-0.0470.2530.3160.302-0.5270.1030.041-0.033X270.0560.444-0.1930.1270.4580.451-0.081-0.2380.197-0.172X280.3160.6670.0380.2040.007-0.085-0.099-0.002-0.2720.147X290.005-0.2150.1610.554-0.0020.280.613-0.0920.020.091将各自主成分载荷向量除以各自主成分相对应特征值的算术平方根,便得到十个主成分中每个指标所对应的系数,得到特征向量矩阵,如表4-5所示。表4-5特征向量矩阵变量成分1成分2成分3成分4成分5成分6成分7成分8成分9成分10X10.275-0.0890.053-0.1650.206-0.0850.1170.1840.0290.288X20.324-0.083-0.01-0.0740.1680.0360.1380.042-0.0320.195X30.1950.0030.340.164-0.072-0.049-0.1150.307-0.325-0.078X40.157-0.0160.387-0.165-0.0280.33-0.15-0.122-0.2290.166X50.319-0.0470.028-0.0370.1520.0190.0540.006-0.030.09X60.0460.3630.128-0.0380.067-0.2250.0180.1070.442-0.137X70.2420.0920.034-0.072-0.1560.1850.0420.45-0.027-0.038X8-0.2620.0790.031-0.04-0.2850.122-0.0470.2780.1150.052X90.2470.0250.0670.14-0.177-0.0920.1080.2350.124-0.468X100.256-0.135-0.079-0.1380.071-0.153-0.09-0.1480.0630.052X110.1370.207-0.0980.026-0.4050.248-0.016-0.056-0.0470.284X120.0070.340.123-0.2390.1760.1120.392-0.1040.028-0.046X130.224-0.1150.4160.014-0.150.056-0.112-0.2180.212-0.102X140.2440.108-0.3280.165-0.17-0.021-0.0380.1660.040.082X150.190.013-0.2120.2550.140.3470.1080.30.143-0.013X160.281-0.009-0.1920.0250.122-0.117-0.001-0.0410.1990.232X170.1710.22-0.099-0.05-0.2550.2640.128-0.325-0.098-0.057X180.322-0.052-0.058-0.0470.137-0.058-0.081-0.018-0.013-0.05X190.216-0.0990.215-0.056-0.140.167-0.176-0.140.384-0.176X200.0560.2780.3050.0750.286-0.140.1680.1-0.135-0.126X21-0.1210.1560.237-0.2840.1760.26200.2940.1410.278X22-0.015-0.10.2910.4040.0030.0350.0840.0590.4090.391X230.0020.3420.0630.114-0.115-0.29-0.187-0.0910.1490.349X240.0170.0260.1390.4760.163-0.056-0.125-0.145-0.2060.008X250.1670.3470.0670.012-0.173-0.1560.295-0.0930.020.024X260.040.27-0.030.1930.2490.254-0.4560.0920.039-0.033X270.0290.247-0.1340.0980.360.378-0.069-0.2090.186-0.172X280.1310.3680.030.1550.008-0.069-0.0850-0.2550.147X290.009-0.1110.1180.4170.0010.2350.533-0.080.0190.091将得到的特征向量与标准化后的数据相乘,即得出主成分表达式,如,第一主成分表达式为:F1=0.263277X1﹢0.312X2﹢…﹣0.003X29。经过主成分分析,从每个主成分中选取前两个重要度最高的指标,将29个属性降到15维,利用用户的15个主要指标数值即可代表原有的样本数据,既能反映大部分信息,又简化了后文的神经网络模型构建。得到约简后的15维关键指标分别为:网站页面设置及布局(X2),更新信息的及时性(X4)、退换货方便程度(X6)、交易时的安全性(X7)、优惠券吸引点击率(X9),售后问题处理速度(X11)、快递员服务满意度(X13)、商品信息的可信度(X15)、产品上新速度(X17)、商品质量(X18)、年龄(X22)、居住城市(X24)、同类平台可选择机会(X26)、登录频率(X28)、平均浏览时长(X29)。4基于神经网络的大众点评客户流失风险预警模型构建4.1大众点评客户流失风险等级划分聚类分析能够实现多种形式的统计模式的研究,一般是在抽象对象的基础上实现的集合形式,所以在分析的时候,不同的指标状态需要的分类元素的形式也会有所不同。聚类研究的本质在于能够实现全部的信息的替代,也就是将未知信息实现已知的模式的认定。在这些的基础上,能够更好的做到本质的属性状态的研究,进而实现最佳效果的认定。在这里进行分析的时候,基本实现更方面的等级的划分和认定,所以最后确定的是聚类分析的模式。通过对上面的各种数据的研究,最后确定聚类的形式。把一百个样本用户的形式实现四种模式的分类,最后确定为:安全状态(聚类1)、较安全(聚类2)、危险(聚类3)和非常危险(聚类4)。所有的比重状态如下。表5-1每个聚类个案数目个案数目占总个案数比重聚类115.00015%聚类233.00033%聚类318.00018%聚类434.00034%有效个案数目100.000100%缺失个案数目.0000聚类1:安全状态。案例的形式如果是在安全的状态下,占据的比重基本是在百分之十五的形式。很多用户从相应的平台速度上看,能够保证基本的美观和快速,同时服务和支付都保持良好的状态,才能够满足要求。这种形式的用户的位置基本都是在一二线等较为发达的城市中,在登录的时候时间是比较长的。但是退换货的时间也会提升很多。优惠和促销会让他们登陆的时间较长,但是他们选择产品的时候,也会更为挑剔,这种状态会让他们专注于一种平台的使用。聚类2:较安全状态。占据较为安全的个案基本在百分之三十三的形式。这种形式的用户从搜索等问题上要保证舒适度等方面的满意程度。考虑推荐的产品等都是他们需求的产品,所以在进行付款的时候,很多都会因为支付方式等的不合适出现放弃支付的现象。如果支付安全能够有所保证,那么可能他们就会直接付款。但是如果个人的隐私容易出现问题,或者评价的状态并不是很高,所以在进行满意度认定的时候,就会有所下降。某些客户能够在物流等问题上保证基本的满意度,但是对产品的质量并不是非常放心,自然也会出现不满或者退货的问题,在这种整体登录时间不长的用户中,更是需要迅速的找到他们的适合点。聚类3:危险状态。从危险的个体状态看,样本的比重通常在百分之十八的形式。这种形式的用户对平台的反应速度要求较高,其他的服务问题满意度也是非常低的。所以在进行配送的时候,就容易出现不够满足的现象,这种形式的用户的年龄通常会大出很多。在进行产品购买的时候,基本不存在依赖性的问题。如果产品的价格在偏高的形势下,自然也不会购买这些产品。聚类4:非常危险状态。如果案例的形式是较为危险的,大部分能够占据到百分之三十四的形式。所以考虑美观的程度,或者是支付等方面的各种小问题,都有可能是他们不会喜欢的方式。这种形式的用户一般都是小城市中,工资的水平较低,在电商平台中能够购买到价格较为低廉的产品,所以会进行各种平台的比对。通过聚类的各种数据分析和研究,可以看到,第一种和第二种客户的流失程度是非常低的。但是在考虑后两种形式的时候,可以看到,样本的分析方式能都达到基本百分之九十七的可信度。这种聚类研究的形式也是非常可靠的。表5-2聚类结果与流失客户分类对比表个案号聚类距离客户类型个案号聚类距离客户类型144.024流失客户5144.767流失客户247.953流失客户5243.311流失客户346.171流失客户5344.937流失客户434.836流失客户5425.194非流失客户544.061流失客户5523.698非流失客户646.455流失客户5624.597非流失客户744.540流失客户5734.428流失客户813.338非流失客户5825.109非流失客户935.307流失客户5935.254流失客户1024.183非流失客户6044.961流失客户1145.532流失客户6125.782非流失客户1213.089非流失客户6215.533非流失客户1335.191流失客户6346.156流失客户1423.795非流失客户6424.215非流失客户1523.807非流失客户6526.292非流失客户1616.154非流失客户6645.822流失客户1726.479非流失客户6723.901非流失客户1823.417非流失客户6824.762非流失客户1943.239流失客户6943.713流失客户2024.453非流失客户7025.037非流失客户2125.808非流失客户7114.670非流失客户2246.359流失客户7227.991非流失客户2322.841非流失客户7347.586非流失客户2423.345非流失客户7424.554非流失客户2546.079非流失客户7547.093非流失客户2635.338流失客户7627.226非流失客户2744.705流失客户7718.222非流失客户2845.310流失客户7816.028非流失客户2924.878非流失客户7938.310流失客户3025.165非流失客户8047.473流失客户3143.284流失客户8118.030非流失客户3244.320流失客户8236.178流失客户3324.698非流失客户8347.001流失客户3423.843非流失客户8438.189流失客户3514.627非流失客户8537.516流失客户3625.324非流失客户8646.455流失客户3714.769非流失客户8746.797流失客户3826.814非流失客户8834.755流失客户3944.454流失客户8916.294非流失客户4045.141流失客户9017.331非流失客户4124.570非流失客户9115.317非流失客户4244.822流失客户9214.866非流失客户4345.072流失客户9314.797非流失客户4424.339非流失客户9434.672流失客户4525.269非流失客户9534.365流失客户4646.247非流失客户9633.993流失客户4724.669流失客户9733.822流失客户4824.087非流失客户9834.209流失客户4934.301流失客户9943.407流失客户5044.010流失客户10034.778流失客户4.2大众点评客户流失风险预警模型构建4.2.1神经网络模型三层结构设计在分析所有的因素后,最后认定了九十个训练的样本形式,同时还还存在是个预测的样本。通过对十五个大众点评的客户的指标的考虑,在这里重点实现了神经网络模型的三层次构建。整体的状态形式如下:第1层通常是作为输入层而存在,也就是最为底部的层次。在这个层次中能够达到外面的信息的形式。文章当中的神经网络模型基本实现了输入的状态。进行归类之后就能够作为样本而存在。处理的十五个指标可以实现进一步的预测,进而成为预测样本存在。第二层则是隐含层的形式,这种层次基本是在中间的位置上,主要的目的是实现整下层次的链接。这种层次一般不会和外界有深层次的联系,所以进行层次结构认定的时候,还需要考虑各种样本之间内在规律状态,最后就能够通过连接权值得状态。从隐含的节点中,这种状态是必须存在的。考虑到学习的速度和状态,如果速度降低会出现对整体的影响,都是极为不利的。当认定结构形式的时候,还需要考虑隐含的节点的状态,不能够出现节点过多的现象,这种过度的你和模式会对整体的时间和训练产生很大的影响。假设在隐含的节点中,无法实现内在的规律的认定,就要考虑信息的降低状态,通过对网络中的最小值的认定,会出现难以收敛的问题。所以在认定隐含层的时候,还需要考虑不一样的节点形式会使得准确率有所提升。较为合理的形式就是能够在选定节点的基础上,实现再次的测定,然后通过对比实现最后的完美节点的确定。一般较为常见的形式就是下面的几种模式:在这当中,m是输入层节点。而n是输出层节点。在这篇文章当中,重点实现了经验公式的计算,同时将最后的四个隐含的节点找到,在分层次的基础上做到了网络训练的结果。除此之外,还运用测定样本的形式实现拟合的状态,通过了解还可以进一步将输入的数据和输出的数据形式实现测定状态的认定。当全部的节点在完善之后,就可以实现隐含的节点的数量的确定,就是计算全部数据的基础形式。在第三个层次中多数是实现数据的输出,这个层次的位置是最高的,因此进行数据传递的时候,可以找到神经元的状态。在全部的神经元传递完成之后,就可能够把全部的数据输出到外围,随后得到全部的计算结果。在这里进行输出的时候,不同形式的风险控制方式和预警的效果一般存在四个等级的形式,在进行定义的时候,还需要考虑最后的输出结果。在对应的结果未知上,还可以确定输出层的状态,将全部的定义完成之后,才能够得到等级层次的输出状态。4.2.2客户流失风险预警模型参数选择(1)传递函数。进行传递函数确定的时候,一般会利用purelin,tansig,logsig三种函数中的一种形式。在确定选择什么形式函数的时候,还需要考虑训练的效果和形式,所以效率问题就是从这些问题中考虑。在这里选择的是sigmoid型。因为数据在输入的时候会出现复值的问题,因此在这里最后确定的范围的形式是(﹣∞,﹢∞)映射到(-1,1)的tansig函数为隐含层传递函数。最后是:除此之外,因为输出层的问题,数据是[1000],[0100],[0010],[0001]。在这里的隐含层的传递函数是logsig函数。通过神经元的状态实现范围得到认定,最后的函数形式是:(2)训练函数。通常在网络中的分析状态,会认定trainlm,traingdx或traingd实现训练函数的确定。在这里进行选择的时候,通常会运用trainlm的形式。而Levenberg-Marquardt本身的优越性在于数值的优化方式,也就是通过网络训练的模式,进而实现整体的梯度下降问题的结合手段的确定,在这之后的网络权值的形式是一种收敛的状态。为了更好的实现优势的认定,这种方式大多都是进行拟合函数的确定,所以收敛的效果是比较好的,整体的误差能够降低到一定程度。 (3)学习速率。考虑这个因素,通常要从权值的变化上认定,当取值增大的时候,权值的状态自然也会增大,那么训练的速度就会有所提升。但是学习速率的形式要更为慎重,当速度超过一定数值的时候,有可能会出现震荡的问题。所以为了能够保证长期有效的训练形式,必须要选择较不和稳定的学习速度。在想要实现不同的速度的认定,还需要从科学的方式上改善网络的认定模式,在最终确定的网络训练中,依照不同的误差函数的下降状态,还可以选择更为合适的学习的速度,也就是在[0.01,0.8]的范围内确定。在这里最后选择的是0.01。(4)期望误差。这个因素一般是进行训练的时候,输出和期望之间的不同。这种误差要控制在一定的范围内,才能够保证基本的数值是正确的。但是当出现节点增加问题的时候,就会很容易造成训练时间的不同。所以在这里的误差形式,还容易产生过度拟合的状态的风险问题。所以为了保证基本的通用效果,就必须要计算误差的形式,最后的函数形式如下所示:平均绝对误差(MAE):MAE=平方和误差(SSE):SSE=均方误差(MSE):MSE=在这当中,ej是预测误差(ej=yjk-ojk)。而yj则是预测输出值。Oj是实际值。当期望误差存在的时候,考虑整体的合理性通常是从不同的期望值时行考虑。所以将全部的数据进行误差研究之后,就能够得到最佳的误差形式。简单来讲,期望误差的取值通常是在0.0001到0.01的范围。最后确定为0.001的形式。将所有的误差数据进行比对分析,我们能够得到,误差曲线通过七次的训练,基本实现了误差问题的降低,在这些的基础上,可以看出这种模型是合理有效的。4.3神经网络模型检验在拟合度非常好的神经网络模型当中,基本上能够实现风险预警模型的准确度的测试。通过这种方式能够使得整体的准确性有所提高。在这里进行调查的基础上,可以将各种指标数据放入到神经网络当中,同时在网络层的处理基础上进一步做到输出层的数据的分析。在对比,隐含层的基础上还能够实现样本数据的分析和拟合度的改善。在对比之后,当误差的数值越来越小的时候,才可以更好地实现预警的模型的适用性的提升。除此之外,对整体的网络预警状态以及指标等方面的内在规律的研究上,我们也可以得到,如果不能够实现这方面的规律揭示,自然也就会使得预警的功能降低很多。所以在这里进行调查的时候可以看出,全部的十个样本在输入之后,还必须要运用一些自主深入学习的方式得到最后的输出层数据。模型测试结果如图5-3所示。图5-3测试样本检验结果图实现神经网络的输出结果的转化方式能够做到对客户的流失风险预警问题的等级方面的划分。考虑到转化的效果一般情况下可以实现一到十级的预警方式,所有最后的输出对比状态如下:表5-3测试集样本输出结果与期望输出对比表转化后的实际输出预警等级期望输出预测正确与否(0,0,0,1)一级预警(0,0,0,1)正确(0,0,0,1)一级预警(0,0,0,1)正确(0,0,0,1)一级预警(0,0,0,1)正确(0,0,1,0)四级预警(0,1,0,0)错误(0,1,0,0)三级预警(0,1,0,0)正确(0,1,0,0)三级预警(0,1,0,0)正确(0,1,0,0)三级预警(0,1,0,0)正确(0,1,0,0)三级预警(0,1,0,0)正确(0,0,1,0)四级预警(0,0,1,0)正确(0,0,1,0)四级预警(0,1,0,0)错误在进行测试的样本的期望值等输出的时候,通过现在的比较,我们能够得到风险预警的预测通常有一级预警和三级四级等预警方式。虽然这些叔叔的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 针对于小样本数据的换热器污垢预测方法进行研究
- 2024年碳排放监测设备安装调试合规考核试卷
- 购买热镀锌合同(标准版)
- 简易道路施工合同(标准版)
- 2024年贵州电网招聘真题
- 厦门市湖里区产业投资集团有限公司人员招聘考试真题2024
- 城南旧事感想200个字
- 2025年电大房地产开发与管理专业《房地产估价》真题汇编及答案解析
- 考点解析-人教版八年级物理上册第5章透镜及其应用-透镜专项攻克练习题(含答案详解)
- 考点攻克人教版八年级物理上册第5章透镜及其应用-透镜专项训练试卷(含答案详解版)
- 2025年杭州地铁考试题库
- 基因检测管理办法
- 战备码头管理办法
- 痫病患者的麻醉管理
- 移动通信原理与系统-课后习题答案
- 变化与更新-2025中国家居家装行业发展研究报告763mb
- 印刷品规定五项管理制度
- 2025年湖南省中考英语试卷真题(含答案)
- 医疗知识付费与内容服务平台企业制定与实施新质生产力项目商业计划书
- 缺血性心肌病血运重建专家共识(2025版)解读
- 3.1《〈中国科学技术史〉序言(节选)》课件高二语文(高教版2023拓展模块上册)
评论
0/150
提交评论