




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1.银行客户数据分析,2007-09-01,2。背景、盈利性客户群服务商业银行拥有大量的个人客户交易数据、个人客户服务数据和个人客户基础数据。在这些海量数据中,隐藏着大量有价值的客户信息。数据挖掘中的聚类分析技术可以从这些数据集中提取客户分类知识。聚类分析技术可以将具有相似属性和特征的数据对象归属于同一个聚类。商业银行可以利用这种技术来识别能够有效服务于他们的最有价值的客户,并为他们提供更加个性化的服务,从而影响相关的客户行为,最终达到提高利润的目的。3,数据集,客户数据集包含10,000条客户数据,包括31个特征(属性),分别为3360bankno(银行代码,其值为:004,024,077等
2、。)账号简称首次联系日期账户开户日期账户余额账户低余额账户高余额账户高余额、余额类别、报表低余额、4、数据集(属性)、报表高余额报表合计借方余额报表合计借方日报表合计贷方余额报表合计贷方日返回检查计数状态审计合计,风险越高,风险越低。上月前薪资、上月薪资、本月薪资、本月贷方计数、5、数据集(属性)、本月借方计数、本月存款外径计数、本月取款金额、本月最后交易日期、国家/地区代码、生日、性别、6。数据预处理。我们使用Weka数据挖掘工具来分析客户的账户数据,因此所有原始数据必须转换成Weka可以处理的数据集格式。原始数据集有四种主要类型的特征,即数字、名义、日期和字符串。对于缺失的属性值,因为We
3、ka中的算法可以自动处理缺失的属性值,使用“?”根据Weka数据集的格式要求来表示。7,数据预处理(归一化),数字特征:通过以下公式归一化为0,1区间名义特征,日期特征和字符串特征保持不变,8,聚类分析,目的我们的目的是对客户进行聚类,使银行能够为不同群体的客户提供不同的服务。因此,聚类分析是自动聚类客户的有效方法。方法k-means算法选取的特征从31个原始属性值中选取23个属性作为聚类参数。在标准化数据集中,k-means算法用于对所选的23个属性进行聚类,聚类数设置为10。和9,并设置每个群集的大小。每个集群中包含的客户数量如下表1和表10所示。客户关系管理通常是寻找少数特殊客户(约20
4、%)进行特殊处理。在上表所示的10个集群中,剔除最大的4个集群后,其余9个集群的客户数量达到3818个,占客户总数的38.18%;除去最大的两个集群(集群4和集群5),其余八个集群的客户数量达到1833家,占客户总数的18.33%。大型集群可以继续细分(继续作为数据集进行集群,或者直接增加集群的数量)。11.对于每个聚类结果的处理,聚类后每个聚类结果的数据是归一化数据的结果。我们需要直观地分析每个集群的特征。例如,将最小值为-10,000、最大值为1,000,000的经常账户余额归一化为0,1后,很难理解账户之间的巨大差距。只有将其恢复到原始值-10,000,1000,000,人们才能直观地理
5、解差距。将每个聚类的数据集恢复到原始数据后,计算每个特征(数字特征)的均值和标准差;或者每个标称重量的数量(标称类型的特征)。12,聚类结果分析(账户当前余额),下表显示了账户当前余额的正负以及10个聚类中每个聚类的账户当前余额的均值和标准差、13,聚类结果分析(账户当前余额),最明显的特殊客户群有两个:客户,其中一个是聚类3,该聚类的平均当前余额约为150,000,比其他聚类的平均当前余额高一个数量级。因此,可以初步判断该集群中的客户是存款金额高或收入高的客户。此外,该集群当前余额的标准差也很大,这表明富裕客户群中每个客户的收入差距也很大,有的达到数百万、数千万甚至数亿。另一个明显的特殊客户
6、群是集群9中显示的客户群。该客户群中413个客户的活期账户余额均为负数,其平均值为负2万多元。因此,可以断定该客户群是一个高透支的客户群。对透支金额、透支次数、透支时间等属性的分析也可以证实我们的结论。14岁。聚类结果分析(活期账户余额),其他八个聚类分析4是最大的普通客户群,占61.81%,该客户群中几乎所有客户的活期余额为正,平均值超过5000,标准差超过20000,不算小,表明这个庞大的客户群可以继续细分。集群5是第二大客户群,占19.85%。与最大的客户群4相比,该客户群的平均余额要高得多,达到2万多元。因此,可以说集群5是大量普通客户中的中等存款额的账户(不包括低存款额的账户)。第7
7、组是当前账户余额为正但存款额较低的客户群。五个聚类1、2、6、8和10在经常账户余额属性中找不到它们的明显特征,我们将在后续的其他属性分析中找到它们的聚类特征。15,聚类结果分析(最低和最高交易账户),下表显示了每个聚类的最低和最高交易账户的均值和标准差,16,聚类结果分析(最低和最高交易账户),明显的聚类特征:聚类3的最低和最高交易账户具有最高的均值,这表明此类账户一般有大量的资金流入。第9类中最低交易账户和最高交易账户的平均值最小,属于透支最多的类别,表明这些账户为透支账户,透支金额保持在较高水平,最高交易金额平均也为负12,000以上,表明这类账户平均很少存入远期资金。17、聚类结果分析
8、(最低和最高交易账户),最大客户群聚类4的最低和最高交易账户的平均值保持在中等水平,最小值超过4000,最大值超过8000;最低和最高交易的平均值组群6和组群8的最低交易账户平均为负(属于透支),最高交易账户平均为正(属于储蓄),因此这类客户属于有储蓄和透支的信用消费客户。聚类1、2和10不能分析该属性中明显的聚类特征;18.聚类结果分析(透支账户/存款账户)。下表显示了透支账户和透支账户天数、存款账户和存款账户天数的均值和标准差。19、聚类结果分析(透支账户/存款账户),聚类3的总存款账户很高,平均价值超过300万,这类客户几乎没有透支,但这类客户的总存款账户标准差也极高,达到1500多万,
9、这也证实了上述高收入群体中的个人收入差距仍然很大。9类为高值透支账户,累计透支账户平均值接近60万,但累计存款账户平均值只有2000多,透支时间较长,平均超过25天。因此,这类账户应该长期透支。20,聚类结果分析(透支账户/存款账户),如前所述,聚类6和聚类8是具有透支和储蓄的基于信用的消费者客户,这也可以在这里解释问题。两个集群的总透支账户和总存款账户金额较大,但不同的是:集群6的总透支账户高于总存款账户,且透支时间较长,说明该账户以透支消费为目的,以存款维持信用消费。第八类存款账户总额远高于透支账户总额,表明客户群体主要是储蓄,其次是透支消费。第七类是存款不高的客户群,他们不透支消费。聚类
10、1、2、5和10不能分析该属性中明显的聚类特征。21,聚类结果分析(本月存款和取款账户),下表显示了本月存款次数、存款账户、取款次数和取款账户的平均值和标准差,22,聚类结果分析(本月存款和取款账户),聚类1、4和7都属于存款和取款账户相对较少的账户类型。组群1的取款账户是存款账户的两倍;群组4的存款和取款账户是等价的;第7组的提款账户略高于存款账户。此外,从本月的访问次数来看,群集1、4和7的访问次数都很低,因为它们的访问帐户也很低。可以认为,这些类型的账户主要是资本流动少的账户类型(或包含一部分的休眠账户)。23,聚类结果分析(本月存、取款账户),聚类2、3、5、6、8、9、10都属于存、取款账户较多的客户类型。其中,第3、第5、第6和第8组的平均存
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 法律文书智能审核员考试试卷及答案
- 2024成都大学辅导员招聘笔试真题
- 2025年核辐射剂量防护仪器设备项目合作计划书
- 2025年经典心理健康知识竞赛考试练习题库(230题)【答案】
- 2024年邓州市社区工作者招聘真题
- 2024年常德市市直中小学校招聘教师考试真题
- 项目管理制度规定
- 消防月消防知识题库100道2
- 消防试题题库4
- 2025年贸易经纪与代理服务项目发展计划
- 焊工证复审考试题及答案
- 喘息性支气管肺炎的护理查房
- 新型电极材料成本控制-洞察及研究
- 2025年高考英语试卷(全国Ⅰ卷)(空白卷)
- 工程测量考试试题及答案
- 粤菜餐厅运营方案
- 医学影像本科教材
- 江苏省南通市部分学校2025届数学七下期末联考试题含解析
- 2025年政治理论时政热点知识试题库(附含答案)
- 造粒机销售合同协议
- 运动免责声明协议书范本
评论
0/150
提交评论