




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘技术和风险管理一、数据挖掘的定义数据挖掘就是利用人工智能、统计分析以及其它建模方法,从大量不完全的、随机的数据中寻找数据之间的关系和有用的信息。数据挖掘在营销、金融等行业的重要性已经被认识,所以企业一般都建立自己的数据库即客户关系系统(CRM),这为数据挖掘的发展提供了基础。需要指出的是:数据挖掘并不仅仅是技术和算法的组合,它其实更像过程,这个过程的目的在于解决具体的问题或做具体的决策。数据挖掘的过程一般如下:(1)问题的定义以及数据准备;(2)数据分析以及模型的建立。(3)模型的应用与检验。第一步与第三步因问题的不同而不同,第二步具有一般性因而可以实现自动化。由于实现第二步的方法以及模型可能有多个,最优化的模型可能会因定义的问题以及应用的领域不同而不同。模型建立包括核心以及外部技术,自动化主要在核心之中应用。数据挖掘一般是重复的过程,当数据与模型不再相合时,或数据已经过时了,数据挖掘就得重做。尤其在金融部门,由于金融数据的高变动性,数据挖掘过程更加频繁。这里数据挖掘的定义指按照某种商业目的,确定针对不同商业目的算法和技术,对大量的信息知识和数据进行有效的知识管理的工具。二、数据挖掘和信用风险管理数据挖掘目前在信用风险管理上应用得相当广泛,如:信用评分、数据库市场化、客户关系管理等等。从目前的发展情形来看,数据挖掘技术不是信用风险管理的主流方法。但是,从该技术的特点以及信用风险管理的目的和方法来看,应该是信用风险管理中重要的手段。主要表现在如下几个方面。首先,对贷款者进行信用计分。信用计分是个贷业务中的重要方法,它是决定是否给予贷款的基准,信用计分是贷款者的信用级别高低的标志。信用计分卡实际上是一种用于个人信用风险控制的数学模型。它是利用数据挖掘技术对银行积累的大量客户历史数据进行分析,寻找出有关客户信用风险的特征值和规律,建立相应的数学模型,为新的贷款申请者或已有的客户评估风险。例如申请计分模型专门用于对新申请客户的信用评估,它通过申请人填写的有关身份资料,即可以有效、快速地辨别和划分好/坏客户。其次,数据挖掘还可以对贷款者的行为计分,例如对信用卡持卡人的消费行为和还款行为进行分析。信用卡的主要利润来源即应收利息已经成为一些银行的利润点,但是利润点的增长需要从大量的个人特征和消费特征中找到特征,需要对信用卡的收入分析、持卡人消费分析、以及循环费用进行分析,对于滞留还款可能是潜在的损失,也可能带来潜在的利润,因此基于统计资料的估值方法不同于以往信用风险管理方法,后者重视的是对一些数理模型的应用,如果模型本身的假设与实际不符,则模型的结果不能取得令人满意的结果。同时行为记分模型是通过对客户的消费行为进行监控和预测,从而达到评估客户信用风险的目的。行为计分模型可用于信用额度的自动监控和调整、授权以及对坏账的预测。例如,信用卡客户想增加信用卡的限额,那么这位客户的以前的消费及信用模式,就要通过使用行为记分模型进行分析以便获得认可。最后,在对客户信用计分和行为计分的基础上,客户对银行的贡献度和利润才是信用风险管理的最终目标,这点和数据挖掘的目标一致,因此利润模型将是信用风险管理的重要内容,也是数据挖掘模型的最终目的,即挖掘出有价值的客户。信用卡消费目前的主要利润来源是信用循环和预先借款利息,但是如何准确的找到合理的客户群就是传统的信用风险管理不能适用,需要从大量的数据对客户群总体分析,客户群风险/收益分析,客户群好坏分析等环节,对于单体客户应该对其效益、风险进行分析,从大量的统计结果找到规律,从而提高利润。目前,大多数数据挖掘技术集中讨论在信用管理的第一阶段,即对申请者的接受与否进行分类和判断,对顾客的行为计分以及利润模型等相关研究比较少。因此,需要开发高级模型以适应现代风险管理的需要。三、数据挖掘方法和信用风险管理技术1.信用计分模型设变量x=(x1,x2,xp)描述申请者的特征,集合G表示好的客户全体集合,集合B表示坏的客户全体集合。假设对每一个客户期望利润记为L,而若将坏客户分成好客户造成的损失假设为D。pG表示申请者好客户的比例,pB表示申请者中坏客户的比例,p(x|G)表示好客户G中具有属性x的概率,q(G|x)表示具有属性x的客户是好客户的概率,p(x)表示申请者具有属性x的概率,因此如下关系成立q(G|x)p(x)=P(x|G)pG, 同样,q(B|x)p(x)=P(x|B)pB因此得到.按照成本最小法则,希望预期收益不小于预期损失,因此判别准则为Dp(x|B)pBLp(x|G)pG。定义集合假设概率p(x|G)的密度函数为f(x|G),概率p(x|B)的密度函数为f(x|B),因此集合AG表示如下AG=假定f(x|G),f(x|B)服从正态分布,亦即可以得到记等式左边为,表示具有特征为x的申请者的信用计分,等式右边记为表示临界值,利用此模型可以对申请者进行判断和分类。Error! Reference source not found. 2.消费者行为评估模型为了准确了解消费者的可能带来的潜在损失,必须对消费者的行为进行评估,特别是还款行为进行分析。假设一年之内有6个时期为免息期(每期50天)同时假设免息期之后90天内仍然不还款认为是违约,将90天分为6个期间,对应于不同的状态如正常,关注,次级,可疑和损失5个状态,记为s0,s1,s2,s3,s4。以记号Bij表示在第i期到第j期间内仍然没有还款的金额,Bii表示在第i期内未还金额总数。例如B12表示在第一期到第二期内未还金额,Bn-1,n表示在第n-1期内截止到第n期未偿还金额。因此得到一个矩阵因此定义转移概率为,得到转移概率矩阵为客户在时刻t的状态用Xt表示,t(i)=P(Xt=si)表示在时刻t处于状态si的概率,pij(t,t+1)=P(Xt+1=sj|Xt=si)表示在时刻t从状态si出发在时刻t+1到达状态sj的概率,表示状态之间的转移概率。如果状态是平稳的,即pij(t,t+1)=pij不依赖时间t,那么在初始状态s0在t+1转移到状态sj的概率P(Xt+1=sj|X0=si)=Pt+1(i,j)。状态s5在马尔科夫链中成为吸收状态。按照马尔科夫链的理论和方法可以计算从不同的状态sj到状态s5的概率,并且可以计算处于某状态的平均时间和计算从某种状态最终进入违约状态的时间,为公司提供适当的策略以避免损失。3.利润模型对于信用风险管理而言,降低风险提高利润才是最终目的。因此利润模型可以从两个方面考虑即风险最小化或者利润最大化。这里考虑在风险最小化基础上建立利润计分模型。假设某申请者的信用计分为s(x),pG和pB分别表示总样本中好客户和坏客户的比例,q(G|s)和q(B|s)表示信用计分为s的好客户和坏客户的概率,满足q(G|s)+q(B|s)=1,p(s)表示信用计分为的客户的比例。假设客户的预期盈利为随机变量R,满足(1)如果被拒绝,那么R=0O(2)如果被接受且是一个好客户,那么R=L(s);(3)如果被接受但是成为坏客户,那么R=-D(s)。因此信用计分为s的客户的预期收益为. ER|s=Lq(G|s)-D(1-q(G|s)=(L+D)q(G|s)-D因此分类原则是假设c表示临界值,即如果sc表示申请者被接受。因此信用计分高于c的申请者的收益为这里F(c|G)和F(c|B)表示在好客户和坏客户中计分低于c的概率。在期望损失下界为p*的限制下,求解如下问题从而可以确定最优信用计分s*。根据最优信用计分s*,可以确定哪些客户能够在风险最小,从而达到利润最大的目的。四、结论和现实意义本文讨论了数据挖掘技术和信用风险管理的联系,提出了信用计分模型、消费者行为模型以及利润模型。数据挖掘作为知识管理的手段和引擎,其技术不断被挖掘和探索。对于信用风险管理而言,信用计分、消费者行为计分以及利润模型涉及到信用风险管理不同阶段决策,例如信用计分用于讨论是否接受申请者、信用额度上限等,消费者行为计分主要涉及消费者还款行为特征、违约状态的变化以及最终违约损失;利润模型将涉及影响到诸如营销、服务程度甚至与定价策略。因此在大多数商业银行已经建立CRM的基础上,按照信用风险管理的框架下,结合数据挖掘手段和技术开展对CRM系统的利用,将有助于提高银行收益率。近年来商业银行由于竞争激烈,已经逐步建立客户关系系统(CRM),因此已经累积大量的数据,而为了提高信用风险管理,可以配合客户关系管理,商业银行不但能找出黄金客户,并且能准确把握其需求,增加其贡献度,提高他们的忠诚度,从而延长客户与银行的交易生命期O而且商业银行更能够精准地将营销资源灌到那些有待采用适当手段提升到风险最小而效益较高价值的潜在黄金客户群中。透过一系列客户关系管理和数据挖掘手段,商业银行可以以最低成本保有最有价值的客户,获取最大可能的利润。数据挖掘是指从大量数据中寻找隐藏的信息,如趋势、特征及相关性的过程,也就是从数据中挖掘信息或知识。具体到CRM中,商业银行可以通过数据挖掘,分别针对经营策略、目标定位、操作效能与测量评估等几个方面的相关问题,从市场与顾客所搜集积累的大量数据中高效率地挖掘出信用风险管理不同阶段最关心、最重要的答案,并且以此建立真正由客户需求出发的客户关系管理。同时,完整的数据挖掘还可从数据仓库提供的大量顾客数据中,挖掘到充分的信息来指导银行的行动。针对信用风险管理中不同的目的,两者可以有效地结合,提高数据挖掘的效率,达到风险管理的目的。在信用风险管理第一阶段,即信用计分阶段,由于信用计分是针对所有申请者,因此根据CRM系统可以对每个申请者进行信用计分。第二阶段,即在已经通过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年人工智能(AI)基础设施状况报告
- 电玩城技术知识培训课件
- 高科技显示课件
- 北京七年级考试新题目及答案
- SBT-100-生命科学试剂-MCE
- Clothiapine-Standard-生命科学试剂-MCE
- 北京安管人员考试题型及答案
- 报关员考试练习题及参考答案
- 广东高考试题及答案
- 历年自考试题及答案
- 跨境电子支付的风险管理与防范策略
- 《整式的乘除》上海新教材七年级数学单元教学设计(沪教版)
- 健康管理中心运营与服务流程规范
- 甲状腺手术甲状旁腺保护
- GB/T 2820.7-2024往复式内燃机驱动的交流发电机组第7部分:用于技术条件和设计的技术说明
- 2023年法律职业资格《主观题》真题及答案
- 施工项目部会议管理制度
- 欢迎一年级新生入学课件
- 译林版七年级上册英语阅读理解专项练习题100篇含答案
- 职业技术学院《汽车维修接待》课程思政标准
- 夫妻婚内财产协议书(2024版)
评论
0/150
提交评论