基于数据挖掘的银行信用卡客户细分研究_第1页
基于数据挖掘的银行信用卡客户细分研究_第2页
基于数据挖掘的银行信用卡客户细分研究_第3页
基于数据挖掘的银行信用卡客户细分研究_第4页
基于数据挖掘的银行信用卡客户细分研究_第5页
已阅读5页,还剩48页未读 继续免费阅读

基于数据挖掘的银行信用卡客户细分研究.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

天津财经大学硕士学位论文基于数据挖掘的银行信用卡客户细分研究姓名:侯文喆申请学位级别:硕士专业:金融学指导教师:张维20080501内容摘要国内外信用卡市场竞争的加剧,要求国内银行信用卡业务的运营模式逐步向以客户为中心、以数据为中心、以信患为基础的国际先进模式转变,客户细分成为这种科学经营模式的前提和基础目前我国银行对信用卡客户的细分方法还是基于经验或者简单的统计方法,但是无法满足业务发展的复杂分析需求随着数据挖掘技术在信用卡管理中应用的深入,采用数据挖掘技术进行有针对性地客户细分变得十分重要和紧迫这篇文章研究对象是银行信用卡客户细分模型,主要针对银行在具备大量的信用卡数据中凭借数据挖掘技术,选择合理的客户细分方法,设计科学的客户细分模型,以指导银行进行有针对性地信用卡产品或服务设计,提高客户满意度,最大化客户价值,建立以客户为中心的营销战略。这篇文章研究内容如下:首先,提出研究背景及意义,确定研究目标与方法;其次,研究客户细分的相关理论和方法,并介绍了数据挖掘技术工具,为信用卡客户细分的研究作理论铺垫;第三,结合信用卡客户细分的应用现状,对常用的细分方法进行了总结并构造了基于通过数据加以实证研究;最后,提出了一些关于信用卡的个性化营销方式这篇文章探索了银行如何应用数据挖掘技术和方法,实现准确、有效的信用卡客户细分,为银行信用卡客户细分问题的数据挖掘提供系统的理论与方法。对我国信用卡业务在以客户为中心的管理理念背景下,利用信息技术提高竞争力具有一定的指导意义与应用价值关键词:信用卡、客户细分、数据挖掘、聚类分析、决策树to in on is t on or of m of of it is by of a a of in a of a to or to a n of as of of of on to it to it in s it a to ey 创性声明本人声明所星交的学位论文是本人在导师指导下进行的研究工作及取褥的研究成果。据我所知,除了文中特别加以标注糯致谢的地方外,论文中不包含其他入已经发表或撰写过的研究成果,也不包含为获得天津财经大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意,学位论支作者签名:彼蔓专乏 、签字日期:山口善年;胃j 用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权天津财经大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文,(保密的学位论文在解密后适用本授权书学位论文捧者签名:役冀叛 导师签名:芝垠吞代签字圜期:如嚣年;雳如字鑫期: 年月 嚣学位论文佟者毕业磊去向:工作单位: 电话:通讯地址: 邮编:第研究背景和意义本章主要揭示论文的研究背景、意义和目标,阐述论文的研究内容和方法,并说明论文的结构和章节安排。111研究背景目前,国内信用卡市场竞争日益激烈,各商业银行纷纷大规模推出信用卡业务,而此前的中国银行卡业务中借记卡业务占有90以上的比重,贷记卡和准贷记卡(即本文所称信用卡)所占比重不到10。信用卡的主要功能有三个,即交易媒介、分期贷款、预借现金功能。相应的信用卡业务的收入来源如下:持卡人(买方)获得交易便利,则信用卡业务提供方获得年费收入;商户(卖方)获得交易便利,则信用卡业务提供方获得销售折扣收入;持卡人使用消费信贷,则信用卡业务提供方获得利息收入。我国开展信用卡业务比较晚,1986年中国银行在国内率先成功地推出第一张信用卡,经过22年的发展,我国的信用卡业务也取得了长足的进步。目前国内可以找到的和信用卡最相关的是银行卡的统计数字。据统计,截至2002年6月末,全国银行卡发卡总量达到438亿张,比2001年年末增长14;1月至6月银行卡交易总额61万亿元,比2001年同期增长25;银行卡账户人民币存款余额5731亿元,比2001年年末增长121 1亿元,增长268。随着中国银联公司的成立和跨行交易成功率的提高,银行卡跨行交易量得到了较大幅度的增长。2002年1月至6月共完成跨行交易25亿笔,清算金额713亿元,分别比去年同期增长886和74,其中,通过银行卡总中心完成的异地跨行交易达到473万笔,清算金额67亿元,分别是2001年全年交易总和的16倍和19倍。上半年的各项联网通用任务基本完成。我国的信用卡业务正处突破性发展的阶段,学习和吸收信用卡业务发展成熟的国家(如美国)的经验,采用科学的、数量化的方法和手段,分析、识别和预测信用卡用户群体,保证信用卡市场的健康有效发展,是一个具有重要意义的研究课题。银行卡自诞生到现在经历了近一个世纪的时间,已成为人们日常生活中不可缺少的一个组成部分。随着中国加入国银行业面临着日益激烈的竞争。各大银行纷纷采叼匕京青年报,2002年08月02日用先进的信息技术手段提升自身的服务水平。银行提供给用户的产品有一个显著的特点就是:同质性。不同银行之间的产品几乎没有什么差别。而另一方面,银行又存有海量的用户信息数据。通过对这些海量数据的挖掘分析,发现用户不同的消费偏好,开展有针对性的营销活动,保留高价值客户,创造更多的利润,成为银行获取竞争优势的一个重要手段。数据挖掘技术的出现,为银行实现这个目标提供了强有力的武器。在银行信用卡业务中,如何取得竞争优势,留住老客户,开发新客户,是各家银行非常关心的问题。只有建立以客户为中心的管理信息系统,通过对大量信息的分析,找出客户消费的行为和规律,筛选出优秀的客户群体,预测客户的个性化需求,及时响应每一位客户现在和未来的需要,设计出更加符合客户需要的产品和服务,才能真正进行以客户为中心的营销和服务。目前,一般银行卡业务系统缺乏真正面向市场、面向客户的决策分析系统,对客户的评判仍停留在静止的、片面的、主观的水平,不能对客户作出动态的、全面的、客观的评价和准确、高效的选择。为了更好地细分市场、细分客户,提高业务管理水平和银行卡获利能力,推行基于数据挖掘的银行信用卡客户细分研究,是银行提高综合竞争力的必然选择。随着网络技术的发展和计算机使用的日益广泛,电子化数据越来越多,数据挖掘技术的研究与推广己取得了较大成果,但数据挖掘技术在银行信用卡客户方面还处于一个探索前进的阶段。数据挖掘技术为银行开展以信用卡客户细分为基础的针对性营销提供了有效工具,同时银行内部丰富的客户资料和历史消费数据是实施数据挖掘的有力保证。因此,国内银行正面对一个全新的、更加激烈的市场竞争环境,银行将主要靠对客户服务挖掘来提高竞争力,银行己经进入一个服务大比拼的时代。此阶段的主要特征是银行更加关注自身的核心竞争力,进一步提升其管理水平及运作效率,逐步降低运营成本,以更好地服务于客户。因此,客户关系管理作为先进的企业管理理念、策略和方法就自然地成为银行竞争的发展方向。客户关系管理进入中国已经很长一段时间,在多变的市场面前,系统更大的潜力并没有发挥出来,其积累的数据如同一座未开发的金矿,有待去发掘和共享。随着网络技术的发展和计算机使用的日益广泛,电子化数据越来越多,“数据丰富而知识贫乏”的问题日益突显,而数据挖掘技术正为此类问题开辟了一条道路,其研究与推广己取得较大成果,但在数据挖掘的具体商业运用方面还处在一个探索前进的阶段。银行业务的一个重要特点就是拥有海量用户,在经历了业务快速发展的初期阶段以后,银行的增量市场日益萎缩,存量市场日益饱和,原来粗放的经营模式已开始向精细营销模式过渡,从以产品和服务为2中心的运营方式转换到以客户为中心的运营方式,其核心是要能够对海量客户群体进行细分研究,了解客户消费行为特征和差异,从而提供差异化的营销。因此,本文就在这样的背景之下,研究并积极寻求有效的客户细分方法和科学的细分模型,以协助银行正确地实现客户细分并有针对性地进行商业决策,从而为银行信用卡销售额和利润的增加做出贡献。112研究意义银行卡已被各家商业银行视作可带来丰厚收益的重点业务。金融市场的对外开放,银行卡市场首当其冲,同时激烈的国际市场竞争也将推动国内银行卡市场的迅速发展和成熟,中国银行卡业务在面临种种挑战的同时也将带来巨大的历史机遇。信用卡是当今银行发展最快的一项金融业务之一,它是一种可在一定范围内替代传统现金流通的电子货币。目前我国政府也在大力促进银行卡的推广和普及。随着信息技术的不断发展,信用体系的不断完善,信用卡的应用将不断得到普及。国内各大银行纷纷将其作为重点业务加以发展,己经成为各银行的必争之地。然而当前国内银行的信用卡业务的服务水平还停留在较落后的水平。中国银行业与国外银行最大的差距在于服务。在客户关系管理方面,国外已有将近二十年的历史。西方银行业一直处于比较激烈的竞争状态,在客户服务方面积累了相当的经验。而中国银行业刚从计划经济时期转变过来,对“以客户为中心的理解一直处于表面状态,不能够深入的了解客户的需求,长期以来对客户实行无差别服务策略,不能够抓住真正的赢利客户进行区别对待,为客户提供一对一的服务。银行的数据库中积累了大量的客户信息,如何利用这些有效的数据去对不同客户进行细分,为他们提供一对一的有效服务应当成为当今各大银行研究的重点。而随着数据挖掘技术的不断成熟和完善,完全可以为国内银行开展个性化的信用卡营销提供强大的信息支持。本文旨在通过数据挖掘技术和统计分析方法的结合,实现准确、有效的客户细分,为银行分析和进一步的数据挖掘等工作提供支撑。这在理论上可以丰富银行信用卡客户细分与数据挖掘领域的研究,在实践上可为客户关系管理中客户细分问题的解决提供更多的方法选择,为我国银行在以客户为中心的管理理念的背景下,利用信息技术提高银行竞争力具有一定的指导意义与应用价值。相信本文的研究可以为国内银行开展信用卡业务、提升服务水平提供一点帮助。12研究目的和创新点本文研究的是银行信用卡客户的细分模型,其研究目的是分析银行在信用卡持续发展中需要解决的营销问题,研究数据挖掘技术在解决这些问题中的技术和优势,并和传统的经验方法作对比,为银行在信用卡营销中改变过去“一卡通式跑马圈地的营销模式,基于数据挖掘技术设计产品,选择客户,授予信用额度并实现一对一营销提供理论依据和建议。本文利用数据挖掘对银行信用卡客户细分研究的内容包括以下几个具有代表性的方面:(1)挖掘不同客户群体的信用卡消费偏好:挖掘持卡人的特征属性与交易行为之间的关联关系。按客户类型进行专项内容的分类或聚类挖掘。(2)银行卡用卡行为与银行贡献度的挖掘:以往银行划分优质信用卡客户的标准往往是按是否按时全额还款,按时全额还款的客户固然是优质客户,但不使用是不能给银行带来更大效益的,而部分还款却可以在规避风险的前提下,给银行带来效益的最大化。因此通过用卡还款行为的数据挖掘,可以更加细分客户群体,反映不同客户对银行的贡献度,找出更多的对银行贡献度较高的客户群体,并针对不同群体进行金融产品营销或差异化服务。13研究内容和方法131研究内容框架本文的研究内容可以概括地分为六个章节:第一章:绪论部分阐明论文的研究背景、意义、目标及研究的内容和方法;第二章:是对国内外相关研究理论和方法综述,包括客户细分理论以及数据挖掘技术的研究概况和现状的介绍;第三章:着重分析基于数据挖掘的银行信用卡客户细分的应用现状,介绍银行信用卡业务及客户特点,分析利用数据挖掘对银行信用卡客户细分的意义和应当注意的问题;第四章:基于之前的理论基础和应用现状的描述,进行基于数据挖掘的银行信用卡客户细分的模型设计,包括银行信用卡客户细分的数据挖掘方法分析和比较,以及基于五章:对上述模型进行定量的实证分析,对实证结果进行分析和解释;4第六章:根据以上的研究结果,提出基于客户消费行为分析的营销战略和个性化营销方式。本文以下将按照此研究框架进行有序的深入研究和分析,设计科学合理的信用卡客户细分模型并进行实证分析。132研究方法(1)本论文的研究采用理论分析与实证研究相结合的方法,除文字叙述和逻辑推理外,还运用了数据挖掘分析技术(如并且对数据的处理和检验的结果采用了大量统计分析方法,从而使论述更具说服力。(2)本论文运用比较分析的方法,综合而全面地分析了各种的市场细分和数据挖掘技术的方法的区别和利弊,并对采取的方法的检验结果进行比较分析和解释。5第2章 国内外相关研究理论和方法综述21客户细分理论和方法的研究概况和现状211客户细分的理论概述客户细分(又称为关系细分(是20世纪50年代中期由美国学者温德尔史密斯提出,是指按照一定的标准将企业的现有客户划分为不同的客户群的行为。它是现代营销理念的产物,是第二次世界大战后西方发达国家市场营销理论和战略的新发展。确的客户细分能够有效的降低成本,同时获得更强、更有利可图的市场渗透。客户细分是产品和服务进行开发及市场营销的基础,是使差异化成为可能、使提供的产品和服务更直接的针对某一客户群的重要环节。这包括理解客户对产品和服务的偏好,针对客户的需求提供产品和服务;理解客户对销售和服务的要求,有针对性地设计销售渠道;理解客户对市场活动的反应和接受程度。客户细分的目的是要通过细分,寻找客户群之间的需求差异并追溯差异原因,选择符合企业发展目标和资源条件的客户群和市场,针对不同客户群的不同需求来设计个性化产品和服务,使其真正成为企业业务获得成功、扩大产品和服务销量的助推器。任何一种方法的产生都要有相关的理论依据,而客户细分也不例外。其理论依据主要有以下几个方面。(1)客户需求的异质性并不是所有客户的需求都相同,只要存在两个以上的客户,需求就会不同。影响消费者消费决策因素的差异决定了消费者的需求、欲望及消费行为是多元的,必然存在差异。因此可以根据这种差异来区分不同的客户,客户需求的异质性是进行客户细分的内在依据。(2)消费档次假说随着经济的发展和消费者收入水平的提高,消费量会随之增加,但消费量的增加并非线性增长,而是呈现出区间性台阶式的变化形式,一旦消费者达到某种消费层次之后,消费变化的趋势将变得非常平缓。根据消费档次假说,消费者的消费档次或消费习惯在一段时期内是相对稳定的,这就为通过消费行为来划分消费群体提供了理论前提和基础。6(3)企业资源的有限性和有效市场竞争的目的性资源总是稀缺的,任何一个企业都不能单凭自己的人力、财力和物力来满足整个市场的所有需求,这不仅缘于企业自身条件的限制,而且从经济效应方面来看也是不足取的。由于缺乏足够的资源去应对整个客户群体,因此企业必须有选择地分配资源。为了充分发挥资源的最大效用,企业必须区分不同的客户群,分辨出能有效为之服务的最具吸引力的细分客户市场,对不同的客户制定不同的服务策略,集中资源服务重点客户,以增强竞争优势。(4)2080法则不同客户给企业带来的价值是不同的。由意大利经济学家帕雷托提出的著名的2080法则认为:在顶部的20的客户创造了企业80的利润。甚至在某些行业利润客户存在更极端的情况。一些商业银行发现他们当前客户中的10几乎创造了100的利润,即关键的少数创造重要的多数,但其中一部分利润却被一些没有盈利的客户丧失了。因此,对客户进行有效地细分,把客户群分为高价值客户、低价值客户和负价值客户三部分,对于不同的类别其管理意义也不同。对企业来说,最主要的就是要识别能带来绝大部分利润的20的客户和负价值的客户,对其采取不同策略。当然,此2080法则并不是全行业通用的客户细分理论依据,因为在某些行业如汽车、房地产行业中,绝对不是20的客户购买了80的汽车,也不是20的业主,购买了80的房子。在这类行业中,2080法则是不适用的。2080法则只适用于银行、电信、零售等行业。212客户细分的原则客户细分可以根据很多标准来进行,但无论采用何种细分标准,都应该遵循以下原则:(1)可接受性在企业实际应用过程中,细分客户群的细化程度应达到企业的要求,并且对于企业的实践应用有指导作用。(2)可衡量性细分出的客户群不仅范围要比较明确,而且规模也能大致判断,细分后的客户群特征是可以识别和衡量的。(3)稳定性有效的客户细分还必须具有相对的稳定性,要足以实现在此基础上进行的实际应用。如果变化太快,应用方案还没来得及实施,群体就已面目全非,这样的细分方法就会毫无7意义。成功的企业选择成功的客户,通过客户细分,企业可以留住最有价值客户,提高潜力客户在企业的支出额,并努力把其变成最有价值客户,以取得最大的利润回报。22数据挖掘技术的研究概况和现状221数据挖掘技术的介绍数据挖掘(指从数据库的大量数据中提取隐含的、先前未知的并有潜在价值的信息和知识的过程。从技术角度看,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息和知识的过程。从商业应用角度看,数据挖掘是一种崭新的商业信息处理技术。与传统统计回归方法相比,数据挖掘技术更注重与商业应用的结合。其主要特点是对商业数据库中大量业务数据进行抽取、转化、分析和模式化处理,从中提取辅助商业决策的关键知识,即从一个数据库中自动发现相关商业模式。随着人们对数据中蕴含知识和规律的关注不断加大,数据挖掘技术无论是在算法研究还是在应用研究上都得到了很大程度的发展。在商业应用领域中,依据现代数据库、数据仓库技术,大量的商业数据被记录和保留下来,这给数据挖掘技术在商业领域中的应用研究提供了基础。对这些商业数据分析的目的也不再仅仅是为了研究,更主要的是为商业决策提供有价值的信息。与传统统计回归方法相比,数据挖掘技术更注重与商业应用的结合,应用的领域主要集中在对商业趋势与客户行为的预测、行业关联性分析、客户聚类分析及偏差检测等。本文以下要设计的银行信用卡客户细分模型就是以数据挖掘作为技术工具的。数据挖掘是按照企业既定的业务目标,对大量的企业数据进行探索、揭示隐藏其中的规律性并进一步将之模型化的先进、有效的方法。数据挖掘技术从功能上包括分类、聚类分析、关联分析、以及概念描述、偏差检验和预测等,这些都在实际中得到了具体应用。分类:按照分析对象的属性、特征,建立不同的组类来描述事物。例如:银行可以根据以前的数据将新用户进行分类,对其以后使用信用卡的可能性进行预测。聚类分析:聚类分析是根据物以类聚的原理,分析数据对象,将本身没有类别的对象聚集成不同的类别,并且对每一个这样的类别进行描述的过程。分类是事先已经知道有哪些类别,而聚类则事先不知道数据对象到底有些什么样的类别。对象根据“最大化类内的8相似性、最小化类间的相似性一的原则进行聚类或分组,使得在一个簇(聚类)中的对象具有很高的相似性,而与其他簇的对象很不相同。它增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。关联分析:关联是某种事物发生时其他事物会发生的这样一种联系,可分为简单关联、时序关联、因果关联。例如:银行可以使用多维关联规则,分析信用卡使用情况和找到银行信用卡利润的主要贡献者。概念描述:对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。偏差检验:它也被称为孤立点分析或异常检测。在数据库中可能存在这样一些数据对象,它们与数据的一般行为或模型存在较大偏差,称之为孤立点。孤立点可能是度量或执行错误所致,因此在一般情况下,孤立点数据常常被当作杂质排除,但有些情况下找出孤立点却是非常有用的,比如高额频繁的信用卡透支行为,这种现象相对于正常的信用卡使用来说是很少出现的,属于孤立点,找出这些孤立点,就可能预防或发现一些信用卡欺诈行为。预测:把握分析对象发展的规律,对未来的趋势做出预见。例如:对未来信用卡客户消费情况进行判断。222数据挖掘技术方法的介绍和比较数据挖掘主要采用的技术和方法包括一些统计方法,如线性回归和逻辑回归;有些用非统计或混合方法,如决策树、神经网络技术、遗传算法、粗糙与模糊集方法。(1)线性回归简单线性回归分析是量化两个连续变量之间关系的一种统计技术。这两个变量分别是因变量和自变量。使用这一方法,可以发现一条穿过数据的线,线上的点使对应数据点的方差最小。为市场营销、风险和客户关系管理建立模型时,通常有多个自变量,用多个独立自变量来预测一个连续变量称为多元线性回归。公式表示为:Y=)2+X。+占 (21)其中是随机干扰项,可以利用样本数据资料对2)线性回归很相似。两者的主要区别在于逻辑回归的因变量不是连续的,而是离散的或者类型变量。该模型没有关于变量分布的假设,9也不要求假设指标存在多元正态分布。最早有977)建立983)建立确认0551为两者的分界线。比如在我国,张后启(2002),杨朝军固(2002),应用出有效结论等等。(3)决策树它较神经网络、多元统计中的判别分析等方法有速度快、精度高、生成模式简单易用等优点,在数据挖掘中被广泛采用。决策树的目标是逐步将数据分类到不同的组或分支中,在因变量的值上建立最强划分,主要是通过训练样本集,建立目标变量关于各输入变量的分类预测模型,全面实现输入变量和目标变量不同取值下的数据分组,进而用于对新数据对象的分类和预测。当利用所建决策树对一个新数据对象进行分析时,决策树能够依据该数据输入变量的取值,推断出相应目标变量的分类或取值。决策树方法存在两大核心问题:第一,决策树的生长问题,即利用训练样本集,完成决策树的建立过程。第二,决策树的剪枝问题,即利用检验样本集,对形成的决策树进行优化处理。由于分类规则比较直观,所以易于理解。决策树常用于分类和预测。(4)神经网络技术神经网络处理和回归处理大不相同,它不依照任何概率分布,而是模仿人脑功能,可以认为它是从每一次经验中提取并学习信息。神经网络系统由一系列类似于人脑神经元一样的节点组成,这些节点通过网络彼此互连,具有自组织性、自适应性以及较强的稳健性。如果有数据输入,它们便可以进行确定数据模式的工作。神经网络由相互连接的输入层、中间层(或隐藏层)、输出层组成,中间层由多个节点组成,完成大部分网络工作,输出层输出数据分析的执行结果。神经网络模型的类型较多,目前不下数十种,其中多层感知器(络在分类问题中使用最多。利用神经网络建立信用评分模型的最大优点是它能够描述建数据中复杂的线性关系,就预测精度而言,神经网络一般要高于其他方法。神经网络模型也存在一些缺陷:由于其计算过程基本上是一个“黑箱”,其结果往往难于理解;神经网络往往存在着过度拟合问题,对训练样本而言,神经网络的预测精度很高,。,a I,977年。 S,,983年张后奇,上市公司财务危机预警系统:理论研究与实证分析嗍,上证研究,2002年第1期白杨朝军,上市公司业绩预警机制研究叨,上证研究,2002年第用于实际预测时,其结果并不见得很理想。神经网络技术具有非线性数据的快速拟合能力,被广泛应用于数据挖掘中,是聚类分析的有力工具。(5)遗传算法与神经元网络类似,遗传算法也不遵循任何概率分布,是源自“适者生存”的进化过程。它首先将问题的可能解按某种形式进行编码,编码后的解称为染色体。随机选取根据问题预定的评价函数对每个染色体计算适应值,性能较好的染色体有较高的适应值。选择适应值较高的染色体进行复制,并通过遗传算子产生一群新的更适应环境的染色体,形成新的种群,直至最后收敛到一个最适应环境的个体,得到问题的最优化解。主要应用于关联规则和分类挖掘。(6)粗糙与模糊集方法。主要应用粗糙集和模糊集理论进行分类和预测。第3章基于数据挖掘的银行信用卡客户细分的现状分析31银行信用卡业务和客户特点分析311银行信用卡业务及特点(1)信用卡的定义随着信用卡业务的发展,信用卡的种类不断增多,概括起来,一般有广义信用卡和狭义信用卡之分。从广义上说,凡是能够为持卡人提供信用证明、持卡人可凭卡购物、消费或享受特定服务的特制卡片均可称为信用卡。广义上的信用卡包括贷记卡、准贷记卡、借记卡、储蓄卡、提款卡(支票卡及赊账卡等。从狭义上说,信用卡主要是指由银行或其它财务机构发行的贷记卡,即无需预先存款就可贷款消费的信用卡,是先消费后还款的信用卡。根据中国人民银行1999年3月1日颁布执行的银行卡业务管理办法的定义,该办法所称银行卡,是指由商业银行(含邮政金融机构)向社会发行的具有消费信用、转账结算、存取现金等全部或部分功能的信用支付工具。银行卡包括信用卡和借记卡。信用卡按是否向发卡银行交存备用金分为贷记卡、准贷记卡两类。贷记卡是指发卡银行给予持卡人一定的信用额度,持卡人可在信用额度内先消费、后还款的信用卡。准贷记卡是指持卡人须先按发卡银行要求交存一定金额的备用金,当备用金账户余额不足支付时,可在发卡银行规定的信用额度内透支的信用卡。借记卡按功能不同分为转账卡(含储蓄卡)、专用卡、储值卡。借记卡不具备透支功能。本论文所研究讨论的信用卡是指贷记卡和准贷记卡。312使用信用卡的优点信用卡作为特殊的金融商品、现代化的金融工具,是国际流行的先进结算手段、支付工具和新颖的消费信贷方式,日益受到人们的青睐。由于使用信用卡,使得现金交易变为转账结算,取代了一定数量的市场流通货币,减少了货币的发行量,减少了国家每年用于货币印刷、调拨、运输、仓储和投放所耗费的资金,也加快了社会流动资金周转速度,促进经济发展。信用卡还能促进商品销售,刺激社会需求。12对于持卡人而言,信用卡的发行和使用,使持卡人通过使用信用卡获得商品和劳务服务,免除了携带大量现金的不便和风险,同时还可通过透支简便地获得银行贷款。同时贷记卡持卡人非现金交易还可以享受如下优惠条件: (1)免息还款期待遇。银行记账日至发卡银行规定的到期还款日之间为免息还款期。免息还款期最长为60天。持卡人在到期还款日前偿还所使用全部银行款项即可享受免息还款期待遇,无须支付非现金交易的利息。(2)最低还款额待遇。持卡人在到期还款日前偿还所使用全部银行款项有困难的,可按照发卡银行规定的最低还款额还款。对于特约商户来说,由于有信用卡发卡银行的信用保证,特约商户可以放心地为持卡人提供商品和服务,从而扩大商品的销售量,并减轻收款、点款工作量,简化了支付、记账和结账的过程。信用卡的发行,使银行有了一种新的争取特约商户和信用卡客户存款的手段,有利于扩大银行转账结算业务,同时增加银行信贷资金的来源,从而获得更多的利差收入,已经成为银行的重要盈利手段。据统计,国外信用卡业务给银行带来的利润一般占到银行利润的3096左右,花旗银行甚至还要高,占5096以上。美国运通公司更是凭借运通卡成为全球服务、旅游、娱乐业界的巨无霸。对于银行而言,信用卡业务的收入主要包括存款利差收入、年费、结算手续费、透支利息等。在这几项收入中,年费收入是固定不变的,普通信用卡大约50要发卡就会有年费收入(其他几项收入随业务量的大小而变化,结算手续费收入随卡均消费额的变化而变化,利息收入随透支额的变化而变化。313银行信用卡客户及特点在竞争激烈的信用卡市场中,对于发卡银行来说,客户不再仅是销售和服务的对象,而是竞争中拥有的资本,是在竞争中取胜的关键因素之一。所以,在研究信用卡客户细分的状况之前,先要研究一下信用卡客户的特点。(1)信用卡客户及其分类对于企业来说,客户是企业所提供的新产品或服务的直接购买者或使用者。由此可以推出,信用卡客户就是银行所提供的信用卡业务的购买者和使用者。购买者可能是信用卡业务使用者,也可能不是,原因在于客户购买的目的不同,有的是为了使用,有的则不是。当今全球范围内的竞争,与其说是企业之间的竞争,不如说是一系列以核心企业为中心的。中国人民银行1999年3月1日颁布执行的活期存款帐户2、持卡时间(整数3、信用历史(04 O:no at in in at 卡消费的种类 O10 0:汽车(l:备、必需品3:假期8:培训9:用额度(整数6、储蓄账户金额(15 l: =100000 储蓄帐户7、目前工作年限(l:=7 期付款占收入的比重(、个人状况和性别 15 1:离婚男性2婚女性3、其他担保(13 1:一前在本地定居的时间 整数( 2、个人财产(14 l:if l:寿保险3:2:or in 汽车或其他4:no 财产1 3、年龄(整数14、其他的分期付款计划 13 1:2:房情况(1:本行已经存在的账户 整数数量(l 7、工作情况(1-4 l:务员4:资格雇员高级职员、警察、军官18、担保人的数量 整数(9、是否有电话(12 1:否为本市户口 12 1:2:者编制512数据的整理和预处理银行业务系统的数据量十分庞大,难免其中存在着有噪声、不完整、不一致的数据。为保证数据挖掘的质量,必须对这些数据进行预处理。数据预处理主要包括数据抽取、清洗、集成和转换等。(1)数据抽取又称数据采集,就从不同的数据源中抽取数据。进行数据抽取应当注意:所抽取的数据必须满足经营分析系统主题模型的需要,而不是数据库所有数据的全部抽取;必须保证不能影响业务系统的性能,充分考虑业务系统的性能要求以及业务量大小和数据量大小,尽量减少对业务系统的影响。(2)数据清洗用于组成数据仓库的数据常常是有噪声、不完全和不一致的。数据清洗就是通过填补遗漏数据、消除异常数据、平滑噪声数据,以及纠正不一致数据来提高数据的质量。遗漏数据处理假如在分析客户的交易数据时,发现有一些记录的某些字段值为空,如交易金额。对于为空的属性值,一般的处理方法有:忽略该条记录、手工填补遗漏值、利用缺省值填补遗漏值、利用均值填补遗漏值、利用最可能的值填补遗漏值。最后一种方法是最常用的方29法,与其它方法相比,它最大程度的利用了当前数据所包含的信息来帮助预测所遗漏的数据。噪声数据处理噪声是指被测变量的一个随机错误和变化。针对银行的业务特点和实际应用,对银行卡业务进行挖掘可采用聚类方法。该方法的原理可以简单叙述为:相似或相近的数据聚合在一起形成了各个聚类集合,而那些位于这些聚类集合之外的数据对象就可以认为是异常数据。不一致数据处理在数据库中,常常会出现数据记录内容的不一致,主要是由于同一属性值在不同的数据库中的取名不规范,使得在数据集成的时候导致不一致的情况发生。解决的方法就是针对各个有关的业务数据库的实际情况,针对各对象的属性设计一个程序,将属性值统一进行规范。(3)数据转换数据挖掘的数据模型不同于业务系统,必然导致大量的数据转换工作。根据数据挖掘主题需要,从外部数据文件中选取目标集合需要的数据,并对数据进行规范化处理,格式转换等操作,生成目标数据所要求的数据形式。产生的目标数据集为外部数据文件形式,需要装载到数据挖掘系统中。52聚类分析521分析提取的样本数据本文研究数据为德国某银行信用卡数据,数据来源为rB 20003。样本容量为1000个,样本属性个数为20个(其中包括7个数值型变量和13个分类型变量)。样本根据信用卡客户的交易情况区分“好客户”与“坏客户。522对样本数据进行聚类分析聚类分析包括聚类结果的生成、调整、优化和输出的步骤。本节将根据上章设计的基于聚类算法的挖掘模型进行客户细分。采用分析软件进行聚类模型分析。(1)聚类分析过程3将数据导入,然后用K类数目难一次确定,需要根据聚类结果进行调整。调整策略如下:根据业务经验,分群的个数不宜太多,一般经验是7加减2个群。本文初步将聚类数(细分客户簇数)别取值为4、5、6、7、8、9、10,对样本进行尝试性运算,分别求出与细分变量簇数对应的聚类分析解。如果的簇用户数太多,占总用户数的80以上,不能发现有效模式,使划分失去意义;如果计数据变得琐碎,会产生无意义簇,对指导市场经营活动没有操作性;如果产生的簇之间没有明显区别特征,2)聚类结果优化如果有一个簇用户数太多占总用户数的50以上,而有的簇用户数太少,只有几个用户,仅仅靠调整时候就要重新选择细分变量,对模型进行优化。客户细分模型优化的主要内容是通过分析找到变量之间的关系,并优化变量组合。在对模型结果的分析中,根据标准群间差距最大,群内差距最小的原则进行分析,同时调整变量组合,以尽量接近标准。以此方式循环,逐步使模型得到优化。本文采用运用先选取关键变量确定回归系数。以申请者的关键变量为自变量,以申请者是好客户还是坏客户为因变量。建立=专韩z,吼+芸色弓托 (51)乙 lp乃为信用卡信用风险评定的影响变量,卢(j=0,l,2m)为需要判定的系数。为递增函数,p(O,1),因为万1=:l+p。 熟p=Z。o专=o; l口。 (52)对于各申请者i(i=l,2,n),若pO,表明信用状况较差,不宜向该申请人发放信用卡;若p1,表明信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论