基本分析基本概念.doc_第1页
基本分析基本概念.doc_第2页
基本分析基本概念.doc_第3页
基本分析基本概念.doc_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基本分析基本概念基本分析的目的是为了了解客户大致的交易、信用和收入情况,然后根据客户的交易、信用和收入特征对客户进行细分,并找出能够区分客户在这些方面特征的维度,为进一步分析和建模奠定基础。虽然不同的分析主题有不同的分析内容,从而分析方法可能也不尽相同。但从框架上而言,就象议论文有论点、论证、论据等几部分一样,基本分析还是有一个基本思路框架的。首先需要根据需求选定主题,然后确定分析角度和相应的方法。在确定分析方法的时候需要明确所选取的样本、分析的维度和计算指标。由于主题主要是从客户的需求中提取出来的,这里不多作赘述,下面对分析方法、分析维度、样本选取和KPI选择的有关概念作一些简单的说明。1.1 分析方法常见的分析方法有时序分析、频数分析和单变量分析、交叉分析、Vintage分析、迁移分析等几种方法,如果需要也可以做方差分析、聚类分析、主成分分析等多元统计分析。1.1.1 时序分析顾名思义,时序分析是研究对象随时间变化的一种分析方法。通过时序分析,可以了解研究对象的变化规律,以及两变量之间的相关性,从而为以后的交叉分析维度的选择、迁移分析分析时间段的选择提供依据。对于观测在时间上的计数类的分析指标,如客户数的增长情况,可以通过SAS的FREQ过程获得,更一般的情况是用TABULATE过程可以获得基本数据。如研究某银行男、女新开户客户占比随时间的变化情况,可以对每月开户的客户通过性别*开户年月来获得客户数,然后求出男、女客户每月占比来获得;研究男、女客户交易额时可以对交易金额以性别为行分类变量、交易时间为列分类变量对交易金额制表即可。数据组织常采取客户特征为行变量,统计年月为列变量的形式,相应的统计图可以选择线图,用纵轴表示研究对象的某个指标,横轴为时间,反映的是研究对象在实践上的变化规律和变化趋势。1.1.2交叉分析交叉分析是将分析对象与其他维度作频数和次数、金额上交叉,从而找出影响显著的维度,以及影响趋势。交叉分析常以分类变量为对象,如激活与否、逾期期数等;对于交易次数、交易金额和收入等单值较多的离散变量或连续变量,通常需要先对变量作分档处理,再以每档为目标变量与其他维度作交叉分析。分析的指标可以是客户数、金额、次数等绝对量上的指标,也可以是相应的百分比。交叉分析时通常将分析对象(目标变量)作为行变量,与之交叉的维度为列变量组织数据。相应的统计图表为柱状图和雷达图,其中又以簇状柱状图最为常用。1.1.3 Vintage分析Vintage分析源于葡萄酒酿造工业上对葡萄酒质量的分析方法,这种方法发现葡萄酒的口感不仅受储藏时间的影响,还受生产年份的影响,有些年份生产的葡萄酒尽管其年份不长,味道却非常好。这是由于葡萄酒的口感受原料葡萄质量的影响非常大,由于雨水等因素的原因,有些年份的葡萄品质特别好,所酿造出来的葡萄酒品质也很好。用在金融行业,由于不同时期的宏观经济背景和国家调控政策不同,客户的投资、消费心理也不同,结合标志客户开始使用一种投资或消费的产品的开户年月或激活年月来分析客户的行为,具有非常重要的意义,也会发现一些非常明显的特征。相应的KPI可以是客户数、交易金额、交易次数、收入,以及相应的行百分比。其中比较常用的是客户数及其行百分比。需要值得注意的一点是,Vintage分析计算的是累积客户数,因此在数量上应该是单调不减的。此外还应考虑清除客户存在重新进入时的计数问题,比如对销户作Vintage分析时,需要考虑销卡后重新激活的客户是否重新计数等问题。除用于侦测何年何月开户的客户在所考察的方面有突出的表现外,Vintage分析常用于确定客户某方面特征在其开户后多长时间内可以达到稳定,并为迁移分析和双变量分析等需要确定观察期和表现期的分析方法提供依据。数据组织常采取开户年月或激活年月为行变量,统计年月或统计年月距离行变量的月份数为列变量的形式。相应的统计图可以选择线图,用纵轴表示研究对象的某个指标,横轴为时间,反映的是研究对象在实践上的变化规律和变化趋势。1.1.4 迁移分析客户的行为会改变客户的状态,掌握各种特征客户的在交易、逾期等行为上的变化规律后,可以采取有针对性的措施刺激客户朝着对银行有利的方向发展。迁移分析就是用来达到该目的的一种分析方法。迁移分析以客户在某时点的状态为起始状态,分析其在某段时间(通常为半年或者一年)内各目标时间点上的状态,据此观察客户的迁移规律。起始点的选取应满足客户在该时刻已经处于较稳定状态的要求,通常根据Vintage分析的结果确定。迁移分析的KPI是从起始状态变化到各状态的客户数和百分比,常通过百分比的情况判断客户的迁移率,而通过客户数判断这种迁移规律的代表性。1.1.5 双变量分析双变量分析主要为建模作准备,目的在于分析各因素对目标变量的决定作用。双变量分析的目标变量常常是二元变量,即它的取值只有“是”或“否”、“0”或“1”等两种状态。通过统计出影响变量各单元在目标变量两种取值上的观测数,进而统计出累计百分比、各单元占比和平均占比,以发现影响变量各分类对目标变量的影响趋势,从而分析影响变量对目标变量作用的显著程度。以下是总交易次数对销户行为影响的双边量分析数据组织形式及其图表。1.2 样本选取不论做哪种分析,对客户都会有一个要求和限制,而不同的分析内容和目的对客户的基本要求也不尽相同,因此在做分析时指出分析样本是非常重要而且必要的。一般情况下,可以根据激活日、开户日和销卡日进行目标客户圈定。此外还要求所选择的客户必须在分析的主题上有良好的代表性,必须有试验组和对照组。如分析逾期客户的收入特征时,由于在开户后4个月的时间内,客户在逾期上的表现并不稳定,因此应选择至少已经开户4个月的客户;另一方面,收入通常以客户在某段时间内的平均收入来衡量,因此对收入的考察期会有一个规定(如考察1年),这就要求客户在逾期稳定后还应由1年的收入情况,因此这种情况下通常要求客户开户年月至销户年月的时间间隔达到16个月。通常需要通过分析正常客户和有逾期行为的客户的对比分析来了解逾期客户的行为特征,以及可以用于识别的维度。1.3 分析维度分析维度是能够明显的区分客户的若干变量,可以是有关客户人口学特征的变量,如性别、教育程度、年龄等,也可以是客户交易行为、收入特征和信用特征的变量,如交易金额档次、逾期期数等。对维度的基本要求是维度的各个水平对于目标变量有显著性的区别,这也是维度选择的重要依据之一。同交叉分析的变量类型一样,分析维度常以分类变量为对象,单值较多的离散变量或连续变量,需要先对变量作分档处理。此外做时序分析时分析维度可以采用时间维。在分析结果中分析维度通常作为列维。1.4 KPI选取KPI(Key Performance Indicators)即关键业绩指标,最初用在企业绩效考核中,目的是为企业的经营管理者通过具体数据评估已经过去的一段时间内工作完成的情况。在我们的分析中,KPI是指能够充分刻画客户行为、风险等的若干变量。制定KPI时,以下几个问题必

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论