数据挖掘在商业银行信用卡中的应用研究.doc_第1页
数据挖掘在商业银行信用卡中的应用研究.doc_第2页
数据挖掘在商业银行信用卡中的应用研究.doc_第3页
数据挖掘在商业银行信用卡中的应用研究.doc_第4页
数据挖掘在商业银行信用卡中的应用研究.doc_第5页
免费预览已结束,剩余38页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本科生毕业论文 数据挖掘在商业银行信用卡中的应用研究 目 录摘 要iAbstractii前 言iii第1章 信用卡业务及数据挖掘概述11.1信用卡业务概述11.1.1 信用卡的定义和类型11.1.2 信用卡的功能与优势11.1.3 我国信用卡业务的现状及存在的问题与对策21.2数据挖掘技术概述41.2.1 数据挖掘的定义及含义41.2.2 数据挖掘基本功能51.2.3 数据挖掘基本过程和主要步骤61.2.4 据挖掘技术的应用现状与前景7第2章 银行信用卡应用数据挖掘技术的需求分析82.1 数据挖掘应用于信用卡业务的优势82.1.1 数据挖掘解决的典型问题82.1.2 数据挖掘的优势82.1.3 信用卡业务引入数据挖掘的现实意义92.2 数据挖掘应用于信用卡业务的领域102.2.1 对银行客户关系进行管理102.2.2 风险预测与控制112.2.3 信用评估与信用决策12第3章 银行信用卡应用数据挖掘的关键技术研究133.1 数据挖掘技术在银行信用卡应用中的主要模型分析133.1.1 市场开拓和客户维护方面133.1.2 风险控制方面153.1.3 获利分析方面173.2 基于数据挖掘的银行信用卡管理系统的功能结构分析18第4章 基于数据挖掘的中国银行湖南省分行信用卡管理系统解决方案设计204.1 系统需求分析204.1.1 背景分析204.1.2 信用卡管理系统的必要性204.2 系统总体设计214.2.1 系统架构214.2.2 系统总体设计214.3 系统编码设计224.3.1 编码原则224.3.2 编码设计234.3.3 编码表244.4 系统数据库设计254.5 具体研究过程274.6 基于数据挖掘的中国银行湖南省分行信用卡管理系统典型模型设计274.6.1 客户信用风险分析模型logisitic回归分析274.6.2 决策树挖掘模型挖掘优秀持卡人和优秀商户314.6.3 CHA ID 顾客消费特性分析324.7 系统评价及建议34结 束 语36参考文献37II本科生毕业论文 数据挖掘在商业银行信用卡中的应用研究 摘 要随着信息技术的不断发展,各行业的数据规模也不断扩大,与此同时,数据挖掘技术不断成熟并逐渐向领域应用方向发展。随着信用卡业务的快速拓展,数据挖掘技术应用于信用卡数据分析将成为一种必然的趋势。本文通过深入了解信用卡的领域知识以及对数据挖掘技术的学习研究,详细分析了银行信用卡应用数据挖掘技术的需求。探讨了银行信用卡管理在市场开拓和客户维护、风险控制、以及获利分析三个方面所需应用的数据挖掘模型(已经帮你改过)。最后,根据中国银行湖南省分行在信用卡业务发面存在的问题,做了基于数据挖掘的中国银行湖南省分行信用卡管理系统解决方案设计,其中详细分析了客户信用风险分析模型logistic回归分析,决策树挖掘模型挖掘优秀客户,CHA ID 顾客消费特性分析的具体实现,并对该系统进行了客观的评价。关键词:数据挖掘;信用卡;logistic回归分析;决策树AbstractAlong with the development of information technology, more and more data from various fields are produced extraordinary. At the same time, Data Mining technology is being developed continually and transferred to application gradually. Along with the rapid expand of credit card, it should be a trend that data mining was applied to credit card data management.In this paper, we go deep into the field of credit card and study data mining technology. We illuminate the demand in the application of data mining in data analysis of credit card. Then analyze ten kinds of models, applied expand to support with analysis model about the develop of market, customer maintenance, risk control, and profit analysis aspect.At last , according to the existent problem in the credit card business, pass the design of Bank of China Hunan Branch Credit Card management system solution based on Data Mining. Among them detailed analyzed the customer credit risk analysis the model-logistic analysis, decision tree model- pick out excellent customers of cards, the CHA ID model-customer consumes the analytical and concrete realization of characteristic. And carry on the objective evaluation to that system.Keywords:Data Mining, Credit Card,logistic regression,decision tree前 言随着数据挖掘(Data Mining)技术的不断成熟,数据挖掘被应用到很多领域,无论是市场营销、财务、银行、制造业还是通讯等方面,只要具有分析价值,并有分析需求的数据仓库(DataWarehouse)或数据库,就可以利用数据挖掘工具进行有目的的挖掘分析,从少量数据库中获得先前不知但具有价值的信息,并利用这些信息增加获利机会或减少成本损失。对信用卡公司而言,通过数据挖掘进行信用卡管理是颇具意义的工作,为了提高信用卡业务收益水平,可以建立以贡献大小为目标变量的客户细分模型,根据模型的结果看高贡献客户的基本特征,在开拓市场时具有这些特征的客户就是目标客户。信用卡业务的利润和风险是共存的,必须对账户进行科学的分析和归类,并进行信用评估。利用数据挖掘技术可以帮助信用卡产品开发部门描述客户以往的需求趋势,并预测未来。我们可以通过一系列的预测性或描述性模型,更有效的完成信用卡风险管理的相关工作。比如,信用评分模型(客户初始信用等级评定)、信用额度动态调整模型(客户当前信用等级评估)、欺诈监测模型(客户消费异常性分析)等。在信用卡业务的获利分析方面,可以建立客户透支分析模型、利润分析模型等。最后通过对基于数据挖掘的中国银行湖南省分行信用卡管理系统解决方案设计,进一步验证了数据挖掘用于银行信用卡业务的可行性和必要性,并对客户信用风险分析模型logistic回归分析,决策树挖掘模型挖掘优秀客户以及CHA ID 顾客消费特性分析做了深入的讨论。38第1章 信用卡业务及数据挖掘概述1.1 信用卡业务概述1.1.1 信用卡的定义和类型一般定义:信用卡是银行或其它财务机构签发给那些资信状况良好的人士,用于在指定的商家购物和消费、或在指定银行机构存取现金的特制卡片,是一种特殊的信用凭证。随着信用卡业务的发展,信用卡的种类不断增多,概括起来,一般有广义信用卡和狭义信用卡之分。从广义上说:凡是能够为持卡人提供信用证明、消费信贷或持卡人可凭卡购物、消费或享受特定服务的特制卡片均可称为信用卡。广义上的信用卡包括贷记卡、准贷记卡、借记卡、储蓄卡、提款卡(ATM卡)、支票卡及赊账卡等;从狭义上说:信用卡主要是指由金融机构或商业机构发行的贷记卡,即无需预先存款就可贷款消费的信用卡(国内的信用卡主要是指贷记卡,即准贷记卡,先存款后消费,允许小额、善意透支的信用卡)。1.1.2 信用卡的功能与优势1.1.2.1 信用卡的功能信用卡是一种重要而常用的支付、结算工具,具有“通用、安全方便、快捷”的特点,并具有以下功能:1.直接消费功能2.储蓄存款功能3.通存通兑功能4.转账结算功能5.透支信贷功能1.1.2.2 信用卡的优势1. 信用卡的发行,使银行有了一种新的争取特约商户和信用卡客户存款的手段,有利于扩大银行转账结算业务,同时增加银行信贷资金的来源,从而获得更多的利息,也加快了社会流动资金周转速度,促进经济发展。2. 由于使用信用卡,改现金交易为转账结算,取代了一定数量的市场流通货币,减少了货币的发行量,减少了国家每年用于货币印刷、调拨、运输、仓储和投放所耗费的资金。3. 信用卡的发行和使用,使持卡人通过使用信用卡获得商品和劳务服务,免除了携带大量现金的不便和风险,同时还可通过透支简便地获得银行贷款。4. 作为特约商户来说,由于有信用卡发卡银行的信用保证,特约商户可以放心地为持卡人提供商品和服务,从而扩大商品的销售量,并减轻收款、点款工作量,简化了支付、记账和结账的过程。1.1.3 我国信用卡业务的现状及存在的问题与对策1.1.3.1 我国信用卡业务的现状1. 信用卡业务发展迅猛1993 年金卡工程启动以来,我国信用卡市场开始步入逐年递增的发展阶段。特别是在2003年,各家银行的信用卡发卡量都出现了强劲增长态势。人民银行的统计数据显示,截至2003 年底,国内商业银行信用卡(包括准贷记卡和贷记卡)发卡量达到2694.4万张,比2002 年增加400 万张。其中四大国有商业银行发行2238.7万张,股份制商业银行发行437.8万张,城市商业银行等共发行了17.9万张。12. 信用卡消费依旧疲软与强劲增长的发卡量形成鲜明对比的是依旧疲软的用卡消费量。同样是人民银行的统计数据,截至2003年底信用卡消费金额为1079.9亿元,佣金收入约为21.6亿元。按照我国信用卡保有总量6.4亿张来计算,卡均累计消费额仅168元左右,卡均佣金收入不足3.4元。2003年信用卡透支余额约59.2亿元,如果按照18.25%的透支年利率来计算,银行透支收入仅10.8亿元。数字对比的结果引人深思。表1.1 我国信用卡市场与其他国家的比较中国其他国家用卡率( % )小于2.724.5(美国)个人持卡消费金额小于1300亿元约1.67万亿美元ATM(台)约50 000309 000(美国)发卡机构(家)5514 000(美国)商户数量(家)约10 万430 万(美国)信用卡持卡人3000万4.53亿(美国)用卡消费次数0.67次/月40.2 次/月(加拿大)(资料来源 IBM论坛2002对国内信用卡业务发展的探讨)1.1.3.2 信用卡业务存在的问题表1.1 从主要用卡环境和消费者行为两方面,揭示了我国信用卡市场与发达国家之间的差距。造成这种差距的原因是多方面的,但究其原因主要有以下几个方面:1.宣传不够,持卡者用卡意识不强。2.办卡手续复杂。3.费用繁多。4.特约网点问题:数量少且分布不均,服务态度和质量较存在问题。?5.信用卡安全性问题:存在信用卡消费等欺诈。6.科技含量低:信用卡除部分地区外不能实现跨行通用,加之信用卡网络稳定性不够。7.相关法律法规不完善。1.1.3.3 信用卡市场的发展前景及对策根据VISA国际组织近期公布的一份调查报告显示,中国目前信用卡潜在目标人群按保守估计达到了3000万到6000万,2010年中国中等收入的人群可能超过2亿人。这意味着,中国已经成为全球信用卡发展潜力最大的市场。我国的信用卡市场经过各家商业银行几年的艰苦努力,有了较大的发展,已初步形成一定的规模,在促进市场经济发展和银行业务发展方面起到了一定的积极作用。但目前我国信用卡的管理与国外同业相比还存在一定差距,主要表现在:国外信用卡业务的操作流程标准化、业务管理规范化、风险防范预防化、个人服务个性化等方面。1.提倡“优化风险”而非“零风险”在国外,商业银行以谋求利润最大化为其根本目标。其普遍把善意透支罚息作为信用卡业务的主要利润增长点。因此,比较提倡“优化风险”,即如何将客户的信用卡透支风险降到最低,而按时在免息还款期内还款的客户则由于不能为银行带来利润,则不一定是优质客户。2.增加个性化服务,改“推销”为“营销”在市场拓展方面,国外银行非常重视市场营销战略,除了重视传统的4P(PLACE、PRODUCT、PRICE、PROMOTION)外,还非常重视5thP(PEOPLE)。他们对目标市场重新定位,进行市场细分,量体裁衣,提供个性化服务,以满足客户需求为目标,变以产品为主导为以市场为主导,改变过去我们有什么产品就向客户提供什么产品的推销模式为客户需要什么我们就提供什么的营销战略,这是十分值得我们借鉴的一个理念。3.建立“零容忍”制度2针对信用卡业务的高风险点,如:空白卡管理、授权、授信等方面,进行重点布控,建立不定期稽核制度及“零容忍”制度。事先明确相关人员的责与权,给予一定的风险补偿金,一旦发生重大责任事故,则对相关责任人采取“零容忍”制度,可有效的防范风险,保证银行资金的安全。4.注重培养客户“忠诚度”据花旗银行的测算:每新开发一名优质客户需花165美元,而保持一名客户只需66美元。因此,国外银行比较注重培养客户的忠诚度。他们采取分散管理办法对一些大客户进行重点关注,采用寄贺卡、生日礼物等方式增加亲和力,通过消费积分等方式吸引客户,从而达到保持客户忠诚度的目的。5.建立与客户的多层次沟通渠道在我国,客户办理信用卡往往需要到银行去填写申请表;但在国外可有多种方式可供客户选择:柜台填写申请表、邮寄、E - MAIL、上网申请等多种方式申请信用卡。银行除了按月寄送对账单外,客户还可通过INTERNET、手机短信息等渠道获得及时的账户信息。以上是国外银行在发展信用卡业务中的一些普遍做法,只有借鉴其好的经营理念和工作方法,加强中国信用卡业的整体实力,才能推动我国的信用卡业务向健康、有序的方向发展,在激烈的市场竞争中立于不败之地。1.2 数据挖掘技术概述1.2.1 数据挖掘的定义及含义1.2.1.1 技术上的定义及含义数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点。1.2.1.2 商业角度的定义数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。简而言之,数据挖掘其实是一类深层次的数据分析方法。数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。1.2.1.3 数据挖掘与传统分析方法的区别数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。1.2.2 数据挖掘基本功能数据挖掘任务一般可分成描述和预测两类。描述性挖掘任务,是刻画数据库中数据的一般特性;预测性任务则在当前数据上进行推断,进行预测。一般通过如下一些功能来实现:1. 概念描述概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。32.关联分析关联分析主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件,其主要依据是应该符合一定的统计意义的相关事件发生的概率和条件概率。关联分析的目的是找出数据库中隐藏的关联网。如研究客户在拥有一种产品后,哪一种产品经常被购买。3.分类和预测分类分析就是通过分析样本数据库中的数据,为每个类别做出准确的描述,或建立分析型或挖掘出分类规则,然后用这个分类规则对其它数据进行分类。预测是使用历史资料去推测估计未来的数值以及趋势,根据样本的已知特征估算某个连续类型的变量的取值的过程。一个典型的例子是市场预测问题,数据挖掘使用过去有关促销的数据来寻找未来投资中回报最大的用户,其它可预测的问题包括预报破产以及认定对指定事件最可能做出反应的群体。4.聚类分析聚类分析是根据物以类聚的原理,分析数据对象,将本身没有类别的对象聚集成不同的类别,并且对每一个这样的类别进行描述的过程。分类是事先已经知道有哪些类别,而聚类则事先不知道数据对象到底有些什么样的类别,对象根据“最大化类内的相似性、最小化类间的相似性”的原则进行聚类或分组,使得在一个簇(聚类)中的对象具有很高的相似性,而与其他簇的对象很不相同。5.偏差检验也常被称之为孤立点分析或异常检测。在数据库中可能存在这样一些数据对象,它们与数据的一般行为或模型存在较大偏差,称之为孤立点。孤立点可能是度量或执行错误所致,因此一般情况下孤立点数据作为杂质排除,但有些情况找出孤立点却是非常有用的。比如高额频繁的信用卡透支行为。这种现象相对于正常的信用卡使用来说是很少出现的,属于孤立点,找出这些孤立点,就可能预防或发现一些信用卡欺诈行为。6.演变分析用于描述随时间变化的对象的变化规律或趋势,并对其建模。比如时间序列数据分析、序列或周期模式匹配和基于相似性的数据分析。如给定过去几年证券市场的历史数,通过演变分析识别某类证券的演变规律,从而预测证券的未来价格走势。1.2.3 数据挖掘基本过程和主要步骤1.定义商业目标在开始数据挖掘之前,首先最重要的就是了解数据和业务问题,明确要去度量或预测什么,缺少对业务的了解,就不可能明确要解决的问题,也就不能为数据挖掘准备数据,导致最终很难正确的解释所得的结果。4例如,如果是建立申请记分卡模型,首先就必须明确定义什么样的客户是想要的客户(好客户),什么样的客户是不想要的(坏客户)。2.数据准备(1) 数据的选择:搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。(2) 数据的预处理:研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型。(3) 数据的转换:将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。3.数据挖掘对所得到的经过转换的数据进行挖掘,除了完善从选择合适的挖掘算法外,其余一切工作都能自动地完成。4.结果分析解释并评估结果。使用的分析方法一般应作数据挖掘操作而定,会用到可视化技术。5.知识的同化将分析所得到的知识集成到业务信息系统的组织结构中去。选择预处理转换挖掘分析和同化逻辑数据库被选择的数据预处理后的数据被转换的数据被抽取的信息被同化的知识定义商业目标阶段数据准备阶段数据挖掘阶段结果分析知识同化图1.1 数据挖掘的基本过程和主要步骤1.2.4 数据挖掘技术的应用现状与前景1.2.4.1 数据挖掘技术的应用现状目前,数据挖掘应用主要集中在以下几个领域及其算法,如图1.2银行电信零售保险各行业的电子商务网站制药生物信息科学研究CRM产品推荐客户细分客户流失客户利润。WEB挖掘网站结构优化网页推荐商品推荐。基因挖掘基因表达路径分析基因表达相似性分析基因表达共发生分析。关联规则、序列模式、分类、聚类、神经元网络、偏差分析行业应用层商业逻辑层算法层相关行业商业应用商业模型挖掘算法图1.2数据挖掘应用领域及其算法1.2.4.2 数据挖掘技术的前景展望目前大量算法的完善,挖掘过程的系统化、规范化,以及工具的不断推陈出新,为数据挖掘应用的发展提供了理论和物质的基础。一方面越来越多的研究人员致力于具体应用的研究,另一方面广大的用户也逐渐看到了它的价值。数据挖掘系统的应用门槛日益降低,中小企业已有能力购买或应用现有技术自行开发数据挖掘系统。早期的数据挖掘系统都相当昂贵,随着技术的不断进步,其价格也已经下降到了中小型企业可以接受的程度。可以展望未来,随着在高容量PC平台上数据挖掘能力的普及,它将会大幅度降价,而且在各种大小规模的公司和部门里数据挖掘的使用也将迅速普及。国外的许多行业如通信、信用卡公司、银行和股票交易所、保险公司、广告公司、商店等已经大量利用数据挖掘工具来协助其业务活动。国内在这方面的应用还处于起步阶段,对数据挖掘技术和工具的研究人员以及开发商来说,我国是一个有巨大潜力的市场。而对于国内的用户来说,谁优先使用了这一技术,谁就有可能取得制胜的机会。第2章 银行信用卡应用数据挖掘技术的需求分析2.1 数据挖掘应用于信用卡业务的优势信用卡业务与销售产品不一样,一般的产品卖出后交易基本完成,而信用卡发出后交易才刚刚开始,必须要让顾客用起来银行才有可能获利。怎么寻找信用卡的潜在客户?怎么让信用卡持卡人用卡消费?是否做到了上面两点银行就赢利?答案显然是否定的。现在困扰中国信用卡产业发展的主要问题是:怎样寻找真正的信用卡客户?怎样让客户在交易时用卡?怎样控制风险?对于以上疑难问题,数据挖掘技术(DM,Data Mining)是一个行之有效的工具。2.1.1 数据挖掘解决的典型问题金融机构需要搜集和处理大量的数据,对这些数据进行分析,发现其数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和商业兴趣。并且,根据新观点,用户的行为会随时间而变化。分析客户整个生命周期的费用和收入就可以看出谁是最具创利潜能的,并可观察金融市场的变化趋势。数据挖掘可以分两大类:预测性数据挖掘和描述性数据挖掘。预测性数据挖掘是进行数据分析,建立一个或一组数据模型,并且根据模型产生关于数据的预测。所谓预测,是指该信息是未曾料到的,即数据挖掘是要发现那些不能靠直觉发现的信息知识,甚至是违背直觉的信息或知识。挖掘的信息越是出乎意料,就可能越有价值。在商业应用中最典型的例子就是一家连锁店通过数据挖掘发现了小孩尿布和啤酒之间有着惊人的联系。描述性数据挖掘是以概要的方式对数据信息进行描述,提供数据的有意义的一般性质。包括:异常检测、聚集等多种数据挖掘方法。预测类数据挖掘及描述类数据挖掘所能解决的典型商业问题包括:数据库营销、客户群体划分、背景分析、交叉销售,以及客户流失性分析、客户信用计分、欺诈发现等。2.1.2 数据挖掘的优势数据挖掘与传统的数据分析(查询、报表、联机应用分析)的本质区别是,数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识,数据挖掘具有预测性、有效性和实用性三个特征。1. 预测性通常信用卡发行机构的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘隐藏知识的手段,它不仅能对过去的数据进行查询和遍历,而且能够找出历史数据之间的潜在联系,并预测其未来的发展模式,从而促进信息的传递。2. 有效性数据挖掘不是为了替代传统的统计分析技术,相反,它是统计分析方法学的延伸和扩展。大多数统计分析技术都基于完善的数学理论和高超的技巧,预测的准确度还是令人满意的,但对使用者要求很高。随着计算机能力的不断增强,我们有可能利用计算机只通过相对简单和固定的方法完成同样的功能。比如,利用神经元网络和决策树,在足够多的数据和足够强的计算能力下,几乎不用人的关照,计算机就能实现许多有价值的功能。数据挖据就是利用了人工智能和统计分析的进步所带来的好处,这两门学科都致力于模式发现和预测。数据挖掘把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能实现同样的功能,并且更专注于自己所要解决的问题。3. 实用性现在数据挖掘在商业应用中已经可以马上投入使用,因为对这种技术进行支持的三种基础技术已经发展成熟。这三大基础技术是,海量数据搜集,强大的多处理器计算机和数据挖据算法。数据挖据的核心模块技术经历数十年的发展,其中包括数理统计、人工智能、技机器学习。今天,这些成熟的技术,加上高性能的关系数据库引擎以及广泛的数据集成,让数据挖掘技术在当前的数据仓库环境中进入了实用阶段。 总之,相对于传统数据分析方法而言,数据挖掘可以按信用卡发行机构既定的业务目标,对大量的运营数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律,并进一步将其模型化,是更先进、有效的业务数据分析法。2.1.3 信用卡业务引入数据挖掘的现实意义数据挖掘技术在一些国际化银行,如花旗银行、美国第一银行等的实际业务运营中发挥了巨大的作用。根据美国集团的调查,数据挖掘技术在美国金融业、制造业、商贸业以及社会服务等方面都得到广泛的应用,已经采用数据仓库数据挖掘技术的企业的投资回报率均在40以上,部分企业高达每年600。国外经验表明,数据挖掘对银行信用卡业务的发展发展有重大意义。51.应用数据挖掘能显著提升客户关系管理(CRM)应用效果信用卡业务的主要客户来自较高收入群体,该群体消费行为复杂多变、流动性高、服务意识强烈。但在以往各家银行的信用卡业务实践中,银行方由于缺乏对海量交易数据的深度挖掘,不能对客户进行有效地区分,只能宽泛地提供基础应用及客户服务,导致严重的同质竞争,客户普遍满意度及忠诚度低。数据挖掘与相结合,分析评估信用卡客户信用等级,细分客户群,定位最大贡献度的信用卡客户,分析客户的喜好和消费习惯,对消费大户进行跟踪分析,根据分析的结果,向用户提供温馨的个性化服务,大幅度地提高了客户满意度和忠诚度,也激励银行积极开发信用卡的应用,刺激持卡人用卡消费。2.应用数据挖掘能策略性地发展和管理商户 一般情况下,银行只能凭借粗略的评估发展和管理商户,在信用卡业务中引入数据挖掘后,可以根据对信用卡客户的消费数据的分析,可以挖掘出客户的刷卡消费习惯,有重点的发展符合客户的刷卡消费习惯的商户。银行可以分析商户特征及其交易水平,衡量商户的贡献度,加强与重点商户的合作,关注重点商户的重点客户的变化情况,优先将商户的促销信息、新产品信息通知相关持卡人,而商户亦可以将其大客户介绍给银行,可以提供专门针对重点商户、重点持卡人的优惠服务,从而优化用卡环境,加快银行和商户之间的联合,促进信用卡业务高速发展。3.有效地降低业务风险信用卡包涵借贷服务,因此对发卡机构存在相当的风险。数据挖掘帮助银行跟踪客户透支交易行为,通过数据挖掘判断风险出现的原因及方式,以便决策者及时处理,实现事前预 测、事中控制、事后化解,确保信用卡业务能够高效、安全的发展。数据挖掘工具能帮您预示出可能是欺诈性的交易。预测模型建立购买特征,表示可能的信用卡欺诈。数据挖掘模型跟踪交易数据,对历史数据进行分析,找出导致信用卡欺诈的因素、特征和行为,建立精确地对欺诈可能性进行测度的规则。数据挖掘模型还能实时进行购买行为监测,实时监测可疑活动,加快合理交易的接受时间,使银行可以马上发现可疑的交易并采取措施,减少欺诈风险。4. 有利于准确有效地营销目前国内银行大多实施大众营销,拥有一批借记卡客户群体。要进一步提高银行效益,就必须提高发卡质量,在借记卡客户群体中积极挖掘和发展贷记卡客户群体;积极参与国际竞争,拓展国际卡客户群体。利用数据挖掘工具分析直销数据以及风险和增益数据,自动发现用户群及其信用卡使用模式,找出有意义的用户群。这些信息可以帮助市场部经理或企业主管提高促销活动的效果策划新的市场营销。数据挖掘技术也可通过对以往交易业务量和交易金额的分析,随时把握业务发展近况,发现历史规律和趋势,分析客户消费特征,针对不同客户群采取灵活、更有效的促销手段,引导和刺激持卡人用卡消费,及时从卡类结构中考察各卡种营销的成败,从商户结构中挖掘营销重点、发现工作盲点。采用数据挖掘的方法对信用卡的交易分析,形成对每个客户的描述分析,了解并预测该客户对购买其他银行产品的可能性,对信用卡客户进行交叉销售诸如个人贷款,信托基金等产品,提高市场营销的效率、增加营业收入以及加强银行和客户之间的联系。2.2 数据挖掘应用于信用卡业务的领域2.2.1 对银行客户关系进行管理目前,各商业银行已经认识到客户是至关重要的商业资源,应当高度重视对客户关系的建立、维持和培育,实施客户战略,以建立长期稳定的客户关系。因此,建立高效的CRM管理系统,可以使银行更好地了解客户要求,评价客户价值,从而为客户提供个性化金融服务,提高客户价值,巩固客户忠诚度。CRM 作为一种管理技术,是以数据仓库、内部网络及客户信息、业务信息系统的建设为基础的。建立CRM 系统的目的是以实时的客户信息开展全部金融服务,便于有效细分客户市场,提供差别服务,达到保留现有客户和发掘潜在客户并提高银行盈利能力的目的。要使CRM 系统有效运作,引入数据挖掘技术是一大趋势。该技术在信用卡管理中有两个重要应用及其实现过程。1. 识别新的价值客户。利用数据挖掘可以有效获取新的客户并建立预测模型或评分模型。商业银行首先需要建立所期望的客户行为并收集客户响应行为形成数据,接着对数据进行处理,用数据挖掘的一些算法(如统计回归、逻辑斯蒂回归、决策树、神经网络等)对数据挖掘,对客户将来行为进行预测分析,再生成预测模型和建立评分模型。例如,美国有的银行使用Marksman数据挖掘工具,根据客户的消费模式预测何时为客户提供何种产品。银行数据库中存储着关于每位客户的大量信息,关键是要透彻分析客户购买新产品的原因,在数据库中找到一种模式,从而能够为每种新产品找到最合适的消费者。数据挖掘的软件能读取800到1000个变量并且给它们赋值,根据消费者是否有家庭财产贷款、赊账卡、存款证或其它储蓄、投资产品,将它们分成若干组,然后预测何时向每位消费者提供哪种产品。因此,数据挖掘可以利用高度详细的客户数据来识别新的价值客户,大大提高识别的有效性,将帮助商业银行完成日益繁重的划分潜在客户群的工作。2. 提升现有客户价值。数据挖掘技术可以帮助商业银行保持住有价值的客户,帮助银行确定客户的特点,使银行能够为客户提供有针对性的金融服务。数据挖掘可以把大量的现有客户分成不同的类,在每个类里的客户拥有相似的属性,而不同类里的客户的属性不同。给不同类客户提供完全不同的服务能大大提高客户的满意度。数据挖掘帮助银行进行细致而切实可行的客户分类,使营销人员更好地理解客户需求、态度和愿望,从而更好地提供差别化的金融服务,保留优质客户,继而对这些客户进行交叉销售。2.2.2 风险预测与控制信用卡业务是一个高投入、高风险和高回报的行业,关键是要能够有效的控制住高风险,降低企业的运营成本,那么在这个方向,数据挖掘应用的效果将是突出的,是银行信用卡业务应用的一大趋势。商业银行为了保证最大的利润和最小的风险,必须对账户进行科学的分析和归类,以及时发现问题,化解风险。使用银行客户信息系统中数据库的数据,利用数据挖掘中的变化和偏差分析技术进行客户信用风险分析和欺诈行为预测,可以分析这些风险为什么会发生?哪些因素会导致这些风险? 这些风险主要来自于何处?如何预测到可能发生的风险?采取何种措施减少风险的发生? 通过评价这些风险的严重性、发生的可能性及控制这些风险的成本,汇总对各种风险的评价结果,进而建立一套信用风险管理的战略和监督体系,设计并完善信用风险管理能力,准确、及时地对各种信用风险进行监视、评价、预警和管理,进而采取有效的规避和监督措施,在信用风险发生之前对其进行预警和控制。信用卡业务上经常发生诈骗行为,如信用卡诈骗、恶性透支等,这些给银行和商业单位带来了巨大的损失。对这类诈骗行为进行预测,哪怕正确率很低的预测,都会减少发生诈骗的机会,从而减少损失。进行诈骗辨别主要是通过总结正常行为和诈骗行为之间的关系,得到诈骗行为的一些特性,这样当某项业务符合这些特征时,可以向决策人员提出警告。而数据挖掘技术就可以自动预测趋势和行为。数据挖掘自动在大型数据库中寻找预测性信息,构造出预测模型,以帮助银行事先发现具有潜在欺诈性的事务。对欺诈的侦测可以通过对数据进行聚类分析来进行。由于欺诈性付款通常都具有某些独有的特征如在短期内发生多次付款,而且较多出现在新办理的信用卡上因此通过对数据的聚类分析可以将数据划分为较可能出现欺诈的组和不大可能出现欺诈的组。一旦聚类分析的结论得到验证,就可以此为基础构造出一个针对信用卡欺诈的分类挖掘模型。以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。这方面应用非常成功的系统有: FALCON系统和FAIS系统。FALCON是HNC公司开发的信用卡欺诈估测系统,它已被相当数量的零售银行用于探测可疑的信用卡交易;FALCON的数据格式主要针对一些流行的信用卡公司,如VISA ,MASTER等,因此它的应用面很大。FAIS则是一个用于识别与洗钱有关的金融交易的系统。数据挖掘的开展能帮助商业银行随时调用与自己有业务往来的客户的历史和现实业务数据,为商业银行减少内部经营风险创造了条件;与此同时,在结合社会外部环境相关经济数据的基础上,数据挖掘还可以帮助商业银行掌握同业经营状况和国际经济发展趋势,减少外部经营风险。2.2.3 信用评估与信用决策信用卡业务基于数据挖掘应用的第三大趋势,就是建立信用评价模型和进行信用决策。银行对企业和个人客户的信用评级目前的趋势不仅为防范风险,而且也是为了银行市场开拓的需要。科学全面的信用评估是建立在各行业大量基础数据的大融合基础之上的,随着金融领域、企业、政府纷纷建立统一数据平台,基础数据的融合将逐步实现。随着数据大集中的逐步深入,我们的结构化的数据和非结构化的数据,搭建起来的这一个统一的数据平台,为数据挖掘在银行业信用评价中的应用打下了一个坚实的基础。6利用数据挖掘相关工具如神经网络算法和决策树方法建立评价模型和决策模型,并可以根据不断变化的外部数据对模型进行动态的修正。因此,数据挖掘技术可以支持信用评级朝着多元细化的方向发展。其下一步的发展是将市场和信用数据结合起来对客户进行信用基础上的市场开发。第3章 银行信用卡应用数据挖掘的关键技术研究3.1 数据挖掘技术在银行信用卡应用中的主要模型分析数据挖掘技术在信用卡行业中主要应用在市场开拓和客户维护、风险控制以及获利分析方面等。在这些领域中可以应用的数据挖掘模型主要包括以下10种:表3.1 数据挖掘在银行信用卡用中的主要模型模型名称模型类型主要采用方法应用的方面客户细分模型描述性聚类分析市场开拓和客户维护方面定向营销模型预测性分类、回归分析定向服务模型描述性关联分析客户激活模型预测性时间序列分析、神经元网络、决策树客户流失模型预测性时间序列分析、神经元网络、决策树信用评分模型描述性、预测性关联分析、神经元网络、决策树风险控制方面信用额度动态调整模型描述性、预测性时间序列分析、神经元网络、决策树欺诈监测模型描述性基于概率分布的检测方法、例外分析法客户透支分析模型预测性神经元网络、决策树获利分析方面利润分析模型预测性神经元网络、决策树3.1.1 市场开拓和客户维护方面3.1.1.1 客户细分模型1. 概述细分是指将一个大的消费群体划分为一个个细分群体的动作,同属一个细分群的消费者相似,而隶属于不同细分群的消费者被视为不同的。将产生细分的客户群,银行根据客户提出的要求和实际所做的不断地改善产品和服务,从而使银行不断提高该客户群满意的能力。7对所有客户按照研究目的不同设定不同的目标变量,例如:l 研究客户的活跃状态就可以把客户分为:活跃户、一般户和静止户;l 研究客户的透支行为可以把客户分为:经常利用循环信贷户、偶尔利用循环信贷户和从不利用循环信贷户;l 研究客户对银行的贡献大小可以把客户分为:大贡献、中贡献、小贡献等等。这样就可以根据不同的目的建立不同的客户细分模型。为了提高信用卡业务收益水平,可以建立以贡献大小为目标变量的客户细分模型,根据模型的结果看高贡献客户的基本特征,在开拓市场时具有这些特征的客户就是目标客户。2. 方法数据挖掘技术中的聚类(Clustering)分析技术能够被运用来从客户基本库中发现不同的客户群,并且用购买模式来刻画不同客户群的特征,达到细分客户群的目的。根据客户数据特点,一般可采用聚类技术中的K-平均算法来进行划分。其原理为将含原始客户信息的数据库划分成K个聚簇,然后采用一定的算法使得同一簇中的对象是“相似的”,而不同簇中的是“相异的”。其算法如下:算法: K-平均。划分的K-平均算法基于簇中的对象的平均值。输入: 簇的数目K 和包含N 个对象的数据库。输出: K 个簇,使平方误差准则最小。方法: a. 任意选择K 个对象做为初始的簇中心。b.repeat 。c.根据簇中对象的平均值,将每个对象(重新)赋给最类似的簇。d.更新簇的平均值。e.until 不再发生变化。3.1.1.2 定向营销模型1. 概述商业企业可以在信用卡结算过程中收集商业消费信息,记录客户消费的时间、地点、感兴趣的商品或服务、愿意接受的价格水平和支付能力等,消费者的个人信息就存入了相应的业务数据库。企业除了自行收集相关业务信息之外,还可以从其他公司或机构来购买此类信息。这些来自各种渠道的数据信息被组合,运用客户类别分析模型、客户消费行为分析模型等数据挖掘技术与其他有意义的营销信息一起进行处理,从中得到用于向特定消费群体或个体进行定向营销的有用信息。这种源自数据挖掘的信息是如何有效应用到实际的市场营销工作中的呢?以Mellon银行为例,销售部在先期数据挖掘项目上使用Intelligent Agent寻找信息,利用分类、回归分析等数据挖掘的算法,预测现有Mellon用户对特定附加产品和新产品的购买倾向,可对那些有较强倾向购买其他产品和服务的客户进行有针对性的推销和服务。2. 举例当银行对业务数据挖掘后,发现一个账户持有者突然要求申请双人联合账户,并且确定该消费者是第一次申请联合账户,银行会推断该用户可能要结婚了。银行就会向该用户定向推销用于购买房屋、支付子女学费等长期投资业务。3.1.1.3 定向服务模型1. 概述每一个客户都有一定的消费习惯,具有相似消费习惯的客户可以组成一个群体。通过消费行为分析,可以了解不同群体的消费模式,从而可以提供更贴切的服务。2. 举例美国运通公司有一个用于信用卡业务的数据库,数据量达到54亿字符,并且仍在随着业务的拓展不断更新。运通公司通过对这些数据进行挖掘,制定了“关联结算(Relationship Billing)优惠”的促销策略。l 如果一个顾客在一个商店用运通卡购买一套时装,那么在同一个商店再买一双鞋,就可以得到比较大的折扣。这样既可以增加商店的销售量,也可以提高运通卡在该商店的使用率。l 再如,居住在伦敦的持卡人如果最近刚刚乘英航空公司的航班去过巴黎,那么他可 能会得到一个周末前往纽约的机票打折优惠卡。其实,很多的贴心服务同时也是一种产品或联合促销。通过定向服务,既满足了客户不同的服务需求,增加了客户的满意度,也会给公司带来利润和价值。3.1.1.4 客户激活模型随着发卡量的增加,睡眠卡的客户数量也在不断增加,这样不但不能给银行带来收益, 反而会增加系统负担和运营成本,通过激活模型可以很好地解决这个问题。激活模型用于预测某个账户成为活跃客户的概率。通过建立模型,可以给睡眠客户计算激活的概率,对激活概率高的客户采取一定的措施让其成为活跃户。采取这种措施激活客户比对所有静止客户都采取激活的措施成本低、效果好,这也就是所谓的数据库营销。3.1.1.5 客户流失模型营销学所提到的开发一个新客户是挽留一个老客户的成本的8倍的规律,在信用卡行业中同样适用。通过一定方法,对一段时间持卡人历史交易明细数据、账户状态的观察和分析,当一个客户以前是活跃户,最近几个月基本上处于静止状

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论