版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于主成分分析和熵值法的电信客户信用评级体系研究基于主成分分析和熵值法的电信客户信用评级体系研究覃国森(中国移动通信集团广东公司东莞分公司,广东东莞525000)摘要:本文结合主成分分析,逻辑函数和熵值法,构造出一个信用评分器.并在此基础上提出了一种新的电信客户信用评级体系.本文通过对抽样选取的全球通客户的通讯行为数据进行统计分析,遴选出六个重要维度及其代表性指标,然后利用主成分分析来缩减每个维度的指标,并用逻辑函数计算出每个维度的分数,最后用熵值法计算出每个维度分数的权重并求和得出最终的信用总分,从而实现了对电信客户的评级.通过案例实践,发现这一模型对通讯客户具有较好的识别信用风险和预测信用
2、风险的能力.关键词:主成分分析;熵;信用评级;逻辑函数;PACE模型一,应用背景和研究价值随着电信业的不断发展,信用管理和风险控制能力欠缺所带来的经营风险13益加大,但是目前电信行业还没有像银行业一样,做到对客户的信用价值进行分析管理并用于业务风险控制和管理,用户发生恶意欠费,钻漏洞恶意办理业务等情况屡屡发生,给运营商带来很大的损失.通信行业信用问题的根源来自于后付费的收费模式,该收费模式要求企业拥有健全的客户信用控制体系,而目前电信运营商普遍缺乏.赊账和客户信用控制体系不健全使移动电话欠费成为可能,而移动电话用户流动性大的特点进一步加重了问题的严重性.运营商各地公司均在客户信用评级和信用度管
3、理方面发力,如上海移动和上海联通的用户缴费信息都进入上海市个人信用联合征信体系,恶意欠费会被视为不良信用记录在案.但电信行业的信用管理总体情况依然不够理想,上下一体化的完整的体系建设到目前为止仍然没有建立起来.二,电信客户信用评级体系评估一个客户的信用目前缺少一种客观标准,对于信用的定义,各行业也是千差万别.为此,要构建一个科学的信用评估方法,首先要保证概念的完整性.根据各行业对信用的认识,并结合电信行业的业务特点,可以给出一个定义:客户可能不履行承诺,合约而带来收入风险的程度.本文在东莞公司信用体系研究案例中,基于PACE(表现一态度一能力一环境)的信用评估模型,建立了一个符合以上综合评估定
4、义的电信客户信用评级体系.如图l所示,体系从概念模型出发,寻找关系客户信用的代表性变量,进而对历史信用数据建立数据挖掘模型,量化收入风险的可能性,利用本文提出的评分器对这个定量的信用进行评分,从若干维度综合得出客户的信用评分,然后进一步定性分级,并从此得出客户红,黑名单.最终这些定量分值和定性分级将应用于业务流程的各关键环节.借助业务应用,在风险防范和满意度提升方面进行反馈优化,不断提升信用模型,形成闭环应用流程W删卜匦=遴选变量-=信用总分鹳螂一翩业务应用PAcE模型评分器图1电信客户信用评级体系三,PACE模型PACE模型根据业务经验,选出四个对客户信用影响比较显着的概念(图2)来综合评估
5、客户信用,并认为所有因素皆可归入其中某个特定概念当中:1.P:Performance.”表现”概念指的是客户曾经表现过的,并留有记录的,被标志为”坏”信用的行为表现.当一个客户曾经有过不好的信用记录,可以初步判断其未来存在同样坏行用行为的可能行较大.表现概念涵盖诸如欠费停机,曾入黑名单,可疑行为等因素.2.A:Attitude.”态度”概念反映了客户自我的心理态度,积极的态度将会有较低信用风险.本维度包括客户对运营商业务和服务的依赖性,以及客户的期望与需求被满足的差距而产生的不满心理,将分别用忠诚度和满意度来表示.3.C:Capacity.”能力”概念反映了客户消费能力和意愿,高能力的客户通常
6、信用风险较低.本维度将通过客户自身的身份背景,例如年龄,职业,关键人物等因素,以及客户实际的历史消费和消费变动趋势来衡量其消费能力和意愿.4.E:Environment.”环境”概念是指在客户个体之外的因素,而区别于前三个维度.外部环境对信用的影响是巨大的,可能导致总体或群体性的客户信用变化.本维度主要从宏观经济,电信策略,社会信用和重大事件出发,考虑这些因素对个体客户的影响e莩麟一?2”/?中国经贸-.图2PAcE模型四,评分器1.国内外研究状况以及各种算法的适用性和优劣性分析对比信用风险评估是分类决策应用中的一个经典问题.在进行分类时,需要对大量数据进行统计学习,发现分类模式,并最终决定分
7、析对象的风险等级.经过大量学者最近几年的研究,目前已经存存很多优秀的算法和模型可以借鉴,但是由于应用的问题领域不同,各种算法的优缺点对比也比较明显.按照是否具有训练集,这些算法可以分为被动学习算法和主动学习两大类.目前主流的被动学习算法有决策树,逻辑回归,支持向量机,神经网络,贝叶斯网络等虽然这些算法应用比较成熟,并且取得了很良好的效果,但它们最大的缺点是过分依赖于训练样本,而且只能在样本数达到一定数量和质量程度时才能表现出稳定的性能,准确率不能保证.我国电信行业开展信用评估工作的时间比较短,想要获得大量具有信用风险等级的数据是很困难的.在我们研究的案例中,基本不存任带有标注的历史数据,采用被
8、动学习显得十分困难.住这个应用背景下,主动学习算法就表现出了很大的优势.基f委员会投票选择算法虽然简单容易实现,但是其依然需要一定量的优质数据,否则分类器的精度会大打折扣;将”基因”对应与一种移动通信用户行为属性的权值,”染色体”对应于被选取的用户行为属性的权值的集合和”种群”对应与所有用r,行为属性的权值的遗传算法已经成功移动通讯用户信用度的预测评估,但是这种算法需要建立任良好设计的交义变异算子和上,拓展性不强.结合应用背景,借鉴各种方法的优点,以下提出结合一种基于主成分分析,逻辑函数和熵值法的评分器.2.评分器结构为了尽可能消减观选取相关变量带来的负面影响,本文首先对遴选出的变量进行维度划
9、分,对每个维度应用主成分分析方法提取反映重要信息的指标,任此基础上,不同于主成分得分的简单线性相加,引入逻辑函数来进行维度评分,最后取代专家设置,利用熵的方法来计算维度权值,以保证最后总分的客观性(如图3所示).图3评分器构造图?28?IC中hesSup幽3.主成分分析(1)基本原理主成分分析是数学上对数据降维的一种方法,其基本思想是设法将原来众多的具有一定相关性的指标(比如p个指标),用少数几个潜在的相互独立的主成分指标(因子)F.的线性组合来表示,构成的线性组合可以反映原多个实测指标的主要信息.(2)主成分分析模型的构建设有n个样品,每个样品观测P项指标(变量):,z,.,其中=(“.,)
10、,i=1,2.,P.用数据矩阵X的P个列向量(即P个指标向量)1,X2,作线性组合,得出指标向量方程:f=q+,l=q2XI+a22+-.+2I?Fpcl,pX+dpz2+.+dppXp并使其满足(1)+口;f=1,i=1,P(2)Cov(Ft,)=0(3)Var(F)=max(cX)C=J.计算得出的综合指标向量,就是主成分,这p个主成分从原始指标所提供的信息总量中所提来看,客户信用度与各相关变量之间并不是单纯的线性关系,因此为了消除主成分得简单相加带来的负面影响,算法采用了逻辑函数对选取的几个主成分再进行累计,得出第j维度的最终分数:一U)其中,当主成分F:与信用值负相关时取正号,正相关时
11、取负号.5.熵值法(1)基本原理建立在信息论熵理论基础的熵值法在求权值方面的应用比较广泛,其原理基于熵对不确定性信息的度量:信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大.根据熵的特性,我们可以通过计算熵值来判断一个事件的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响越大.(2)熵值法步骤在对各个维度进行逻辑评分后,进一步使用熵值法来计算各个维度的权重.这种计算权重的方法使得区分度较高的指标,权重较大,区分度较小的指标,权重较小.第j个维度的熵值计算公式:H7:一)ln毒Zxo.一SCORE=1.,score(i)
12、=1五,业务应用1.评分雷达图本文结合实际业务背景,通过衡量与PACE这四个概念维度相关的主要影响因素,总结出了历史信用,忠诚度,满意度,消费能力,消费意愿和关键人物这六个对客户信用起主要影响作用的业务维度.在经过对每个维度的得分进行标准化处理之后,除了得出信用总分和信用等级外,还可以用雷达图的形式将评分结果(图4)直观地展现在前台.忠诚度关键人物历史信用消费意愿图4雷达图满意度消费力2.评级方法信用评级将基于客户信用评分,包括综合评分和各项指标评分,结合业务需要,按照分数排名划分三等九级(A,B,C三等,AAA,AA,A,BBB,BB,B,CCC,CC,C九级).划分的界限以排名为原则,如图
13、5所示.排名等级排名等级排名等级0%,lAAA(2550%髓B(90g8%CCC(1%,i0叼AA(50礴%BB(98%,99.7%CC(10%,2蕊A(7890%B(99.7%,100%C图5评级标准六信用评级系统应用案例1.分析对象本文选取广东东莞市全球通用户为分析对象,结合实际业务背景,从每个维度中遴选出一些具有代表性的重要指标(图6),为下面的数据收集工作做好准备.本案例利用TeradataWarehouseMiner的因子分析模块中的主成份分析工具进行建模,并通过其集成的Teradata数据库功能,抽取了东莞客户2008年九月份的通讯数据来进行信用评级.业务堆度蝗业务维度变量业务皴变
14、量集团内主被叫次数占比是否有年龄资料客户投诉次数网内主被口1时长占比是否有【队资料客户套餐变换的次数嗣内主被号码数占比是否有学历下面以忠诚度为例,介绍单个维度内的主成分分析和逻辑评分的公式.在对主成分析结果进行Equamax旋转后,我们得到了因子(主成份)得分矩阵(如图7所示),图8显示了各个因子use草麟_?中国经贸_.的特征值和方差贡献率.第一个因子中,网内主被q占比和网内主被叫号码数占比的权重较大,因此可以把这个因子解读为网内交往占比.类似的,其他因子可以依次解读为集团网使用量,在网时长,使用量和呼叫联通客户的次数.袅逮内融内主被期内主被平均折呼叫联通集团内朗由主是否集因子主被叫叫时长占
15、号码数占算业务积分主破删被叫号在网时长变量次数占比比客服次鼗团成员比戛次数码数F1o.0891&533O.j1一nO射一0125一融003440.089l旺O964一O.1170.163F20.48ln0919nO蛳一n051l_o.089一-a0ol羽6Q416_o.8O.35ifo.o627F3一O.123一0351一nO567一n2弱O.309000132mO99laO葩603770.鹋5F40.162一a0735一n0979n640.372一a0139a】130.3田-0.119.175陌O一吐OO.oo3一aO116O.00l7l一0.O(E5nO艘50.Oo39.o
16、ol8图7忠诚度维度主成份分析的因子得分矩阵因子特征值方差贡献率累计方差贡献率Fl1.9O2819.O28519.O285F21.978319.783438.8119F31.3906l3.905752.7l76F41.56315.63o468.3481F51.000410.Oo478.3521图8特征值与方差贡献率将五个因子代入逻辑函数,就得到了忠诚度的单维度的评分公式:19o285783521(1+1l97834l39057丽丽l563o4l0004在得到六个维度的的评分之后,再利用熵值法来确定各个维度的权重,从而得到用户信用的综合评分.各个维度及其主成分的权重如图9所示.权重业务维度权重主
17、成份O.65全停状况O.29历史信用O.35欠费状况O.36增值业务使用量l0.21增值业务使用量20.14满意度O.22套锓变化频率O.21投诉次数0.53用户ARPU0.06消费力O.47l乇收情况综合评分0.1l消费意愿1户ARPU变化趋势0.45客户资料详实度O.17关键人物O.31Vip等级O.24是否为高学历高收入者0.24网内使用占比O.25集团网使用量0.23忠诚度0.18在网时长0.2使用量O.13呼叫联客服次数图9综合评分?30?-C中he3.模型验证由于电信客户信用评分不存在标准的比较标准,所以为了验证模型,对十月份的每个等级的欠费客户进行统计,计算出欠费率和提升率(等级
18、欠费率与总体欠费率的比值),从图l0中可以看出,随着等级增大,提升率出现了明显的下降趋势,表明信用等级低的欠费率较高,而信用等级高的欠费率较低,符合业务逻辑,体现了评分模型的准确性.1O0000O1O0o0010o00.J一/_,1o00-/一一,1O0r10-+等级人数*+欠费人数01C(BBBR确广A+欠费比例11.001_*_提升率图10模型验证结果七,总结与讨论本文结合主成分分析,逻辑函数和熵值法,成功构造出一个评分器,在此基础上提出了一个客户信用评估体系.这个体系能够综合衡量客户潜在存在欺诈可能,为降低收入风险,提升客户满意度提供了一套完整的分析模型.本文案例结合东莞移动公司的业务,将评估体系应用到若十关键业务流程当中,并设想未来跟社会其他行业进行信用数据交换,共同构建跨行业信用评估体系.参考文献:【1】中国移动通信集团公司.中国移动经营分析系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 亚运签名活动策划方案(3篇)
- 动物赛事活动方案策划(3篇)
- 垒球趣味活动方案策划(3篇)
- 寺庙咖啡活动策划方案(3篇)
- 抽奖活动策划方案汽车(3篇)
- 演出主题营销方案(3篇)
- 妊娠合并自身免疫病胎儿的干预
- 华为营销控制方案(3篇)
- 字词综合基础解题达标能力卷
- 材料作文多角度立意拓展快速测评试卷
- 2026山东菏泽生物医药职业学院招聘工作人员120人农业考试参考题库及答案解析
- 3.4 我们来造“环形山”课件(内嵌视频) 2025-2026学年教科版科学三年级下册
- 广东省茂名电白区七校联考2026届中考一模数学试题含解析
- 直播基地规划建设方案报告
- (新疆二模)新疆2026年普通高考三月适应性检测文科综合试卷(含答案)
- 喷漆房安全管理制度
- 《无人机导航定位技术》全套教学课件
- TCEC《 有机液体储氢载体 》编制说明
- 拆除房屋施工沟通协调
- 韦源口镇中心小学教学楼新建工程防水施工专项方案
- 近十年化工安全事故案例
评论
0/150
提交评论