




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独创性声明 本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所取得的成 果。据我所知,除了特,i i j j n 以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过 的研究成果。对本人的研究做出重要贡献的个人和集体,均已在文中作了明确的说明。本声 明的法律结果由本人承担。 学位论文作者签名: 学位论文使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即: 东北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部 分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇 编本学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:啦 日 期:边丛7 学位论文作者毕业后去向: 工作单位: 通讯地址: 指导教师签名:塑主 日期:塑! ! :兰:2 电话: 邮编: 摘要 本文主要研究了数据挖掘中关联规则挖掘技术在电子银行业务中的应用。 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提 取隐含在其中的、事先未知但又有潜在价值的信息和知识的过程。关联规则挖掘是数据 挖掘的一个重要研究领域,关联规则挖掘的目标是通过对数据处理找出一些积极的、有 意义的规则。关联规则挖掘技术广泛应用于商业、银行、电信、保险、医疗等行业。 电子银行作为各家商业银行争先发展的重点,市场竞争日趋激烈。作为一种主要靠 人机交互的经营方式,如何提高其业务推荐效率,是各家商业银行一直在深入研究的问 题。 本文应用关联规则挖掘技术,对银行产品与产品、客户与产品的关联关系进行了研 究,并基于挖掘得到的关联规则建立了电子银行产品的推荐模型。具体工作如下:( 1 ) 通过对银行产品特性的分析,确定分类依据,合理分类电子银行产品。( 2 ) 对交易数据 及相关数据进行预处理。( 3 ) 采用m i c r o s o f t 关联规则挖掘算法进行关联规则挖掘:通 过对产品消费记录的分析,找出不同产品的购买关联;通过对主要的客户信息指标与购 买行为的分析,找出客户自身特点与电子银行产品购买行为之间的关联。( 4 ) 建立推荐 模型,针对未来用户实施产品推荐。 关键词:数据挖掘:电子银行;关联规则;推荐 a b s t r a c t i n t h i sp a p e r w ed i s c u s st h ee l e c t r o n i cb a n k i n ga p p l i c a t i o nb a s e do na s s o c i a t i o nr u l e s m i n i n gt e c h n o l o g y o fd a t am i n i n g d a t am i n i n gi sap r o c e s st h a te x t r a c t sc o n n o t a t i v e , u n k n o w n ,p o t e n t i a l l yv a l u a b l ei n f o r m a t i o na n dk n o w l e d g ef r o mt h ep r a c t i c a la p p l i c a t i o no f p l e n t i f u l i n c o m p l e t e ,s t o c h a s t i cd a t a a s s o c i a t i o nr u l e sd a t am i n i n gi sa ni m p o r t a n ta r e ao f d a t am i n i n g ,t h a ti st of i n dp o s i t i v ea n dm e a n i n g f u lr u l e sf r o mt h ed a t ap r o c e s s i n g ,t h e r e f o r e p r o m o t et h ed e v e l o p m e n tf o r w a r d l y a s s o c i a t i o nr u l e st e c h n o l o g y i s w i d e l yu s e d i n c o m m e r c i a l ,b a n k i n g ,t e l e c o m m u n i c a t i o n s ,i n s u r a n c e ,m e d i c a la n do t h e ri n d u s t r i e s e b a n k i n gi st h ef o c u st h a tc o m m e r c i a lb a n k sw a n tt od e v e l o pa n dm a r k e tc o m p e t i t i o n b e c o m e si n c r e a s i n g l yj e i e r c e a sam o d eo fo p e r a t i o nt h a tm a i n l yr e l i e so nh u m a n - c o m p u t e r i n t e r a c t i o n h o wt oi m p r o v ei t so p e r a t i o n a le 伍c i e n c yi sap r o b l e mt h a tc o m m e r c i a lb a n k sa r e r e s e a r c h i n gd e e p l y t h i sp a p e rd i s c u s s e st h ea s s o c i a t e da n a l y s i sa n da p p l i e dm o d e lt h a tu s ea s s o c i a t i o nr u l e t e c h n i q u e s i nt h ep a p e r w es t u d yd e e p l yt h eh i s t o r i c a lt r a n s a c t i o nd a t af o re l e c t r o n i cb a n k i n g a n dc l a s s i f i c a t i o no ft h ee l e c t r o n i cb a n k i n gp r o d u c t s 。胎c o m p l e t ei n - d e p t ha n a l y s i sf o r p r o d u c tr e c o m m e n d a t i o no fe l e c t r o n i cb a n k i n gp r o d u c t sf r o md i f f e r e n ta n g l e sa n dd i f f e r e n t d i m e n s i o n su s i n gm i c r o s o f ta l g o r i t h m m a i n l yw o r ki sa sf o l l o w i n g s :( 1 ) w r ef i n do u t s y s t e m a t i ct h e o r ya n dc a t e g o r yr e a s o n a b l ya c c o r d i n ga st h ea n a l y s i so fe - b a n k i n gp r o d u c t s f r o mt h ed i f f e r e n tc h a r a c t e r i s t i c s ( 2 ) d a t ap r o c e s s i n ga n dp u r i f i c a t i o nf o rm u l t i p l ed a t a s o u r c e s ( 3 lw 色f i n do u tp u r c h a s i n gr e l a t i o nb a s e do nt h ea n a l y s i so fl o g w ed i s c o v e rt h e c o n n e c t i o nb e t w e e nc u s t o m e r so w nc h a r a c t e r i s t i c sa n de l e c t r o n i cb a n k i n gp r o d u c t sb a s e do n t h ea n a l y s i so fn a t u r a lf a c t o r sa n ds o c i a la t t r i b u t e so fc u s t o m e ra n dp u r c h a s i n gb e h a v i o r 腑 c o n s t r u c tr e c o m m e n d i n gm o d e lf o rd i f f e r e n tc u s t o m e r sb a s e do nt h ea s s o c i a t e dd a t a k e yw o r d s :d a t am i n i n g ;e l e c t r o n i cb a n k i n g ;a s s o c i a t i o nr u l e ;r e c o m m e n d a t i o n n 第三章数据挖掘5 3 1 数据挖掘5 3 2 关联规则5 3 3 关联规则挖掘的目的和实现过程:6 3 4 关联规则挖掘的应用领域6 3 5 关联规则挖掘相关算法6 3 6 关联规则挖掘的优势7 第四章关联规则挖掘在电子银行产品推荐中的应用8 4 1 电子银行业务分类8 4 2 关联规则挖掘在电子银行领域的应用意义与优势8 4 3 关联规则挖掘在产品研发中的应用9 4 4 关联规则挖掘在产品销售中的应用9 4 5 关联规则挖掘在客户开发中的应用9 4 6m i c r o s o f ts o ls e r v e r 2 0 0 5 关联规则挖掘算法和应用1 0 4 6 1 商业智能1 0 4 6 2m i c r o s o f ts q ls e r v e r 2 0 0 5 商业智能中关联规则挖掘算法1 0 第五章基于关联规则挖掘的电子银行产品推荐解决方案1 1 5 1 电子银行应用需求分析1 1 5 2 数据库设计1 1 5 3 总体设计1 3 5 4 电子银行产品交易数据预处理1 3 l 5 4 1 电子银行产品分类1 3 5 4 2 历史数据净化和整合1 3 5 5m i c r o s o f t 关联算法用于对客户、产品相互关系的关联规则挖掘1 4 5 5 1 数据结构1 4 5 5 2 电子银行产品关联规则挖掘1 5 第六章总结1 7 参考文献1 8 致谢2 0 i v 东北师范大学硕士学位论文 1 1 研究背景及意义 第一章引言 关联规则挖掘经过长期发展,在多个不同领域都有良好的表现,但在有些领域仍需 要进一步研究,根据实际应用情况拓展关联规则挖掘的应用领域,提高挖掘效率,推动 关联规则挖掘技术不断发展。目前,关联规则挖掘技术的研究和发展多集中在以下几个 方面h 1 :提高关联规则挖掘的效率,主要是通过提高关联规则挖掘算法的并行处理能力 和研究新的高效率算法。社会不断进步,科技急速发展,随之而来的是各行各业数据库 中数据容量井喷式增长,以往的关联规则也需要不断更新,更新频率也不断提高。挖掘 的效率必须提高,才能保证关联规则的时效性、科学性。关系数据库和事物数据库一直 是关联规则挖掘算法的主要应用对象。降低关联规则挖掘算法的操作难度,在挖掘算法 确立后,用户操作的简便性和数据的直观性也是关联规则挖掘技术必须考虑的因素。 现代商业银行的发展中,电子银行的建设已作为一个重要的发展方向。电子银行的 优势显而易见:成本低、地域广、效率高、使用方便、业务办理速度快。如何科学发展 电子银行产品,客户的需求、市场的预期是根本。商业银行都有完备的数据库,保存了 大量的历史数据。将关联规则挖掘技术应用于电子银行业务,通过对数据进行有效分析, 得出科学结论用以指导银行的生产经营,必然促进电子银行业务的开展。 1 2 国内外研究历史及现状 国外银行业对关联规则挖掘技术在银行业务上的研究早于国内,有了一定的发展和 应用。国内商业银行由于电子银行业务本身业务发展就比国外滞后,对于这方面的技术 研究还不多见。大多只是海量数据的拥有者,对其中的关联分析能力亟待提高。 1 3 本文的主要工作 本文深入研究了关联规则挖掘技术在电子银行产品推荐上的应用。依据银行专业分 类依据,对电子银行的多数据源的不同格式的数据进行共性分析,完成分类工作对大量 数据进行净化,统一数据格式,建立了合理的数据结构,提高了计算的效率。应用关联 规则挖掘技术,主要是m i c r o s o f t 关联算法建立多个分析模型,通过多角度对不同维度 的数据进行分析,找出了客户产品自然因素和社会属性与产品、产品和产品等有益的规 东北师范大学硕士学位论文 则。再结合银行自身的需要,按照其不同时期的经营侧重完成对电子银行客户的推荐工 作。 1 4 论文结构 本文各章节具体安排如下: 第一章引言,介绍了目前关联规则技术的研究情况,关联规则技术应用于电子银行 产品推荐的意义。 第二章介绍了电子银行的概念,并对目前电子银行的发展作了全面分析。 第三章介绍了关联规则挖掘技术的原理,在各方面的应用和典型算法。 第四章对电子银行产品进行科学分类。论述了关联规则技术应用于电子银行产品推 荐的多个应用领域。 第五章详细介绍了关联规则技术应用于电子银行产品推荐的解决方案,对实验数据 进行了分析。 第六章总结本文所做的工作。 2 东北师范大学硕士学位论文 2 1 电子银行的概念 第二章电子银行 电子银行分为狭义的电子银行和广义的电子银行豫1 。 狭义的电子银行即网上银行。1 9 9 8 年3 月巴塞尔银行监管委员会发布电子银行与 电子货币风险管理,其中定义电子银行为:通过电子渠道提供零售性的小额银行服务 和产品引。 随着科技的不断进步和银行经营渠道的不断拓展,电子银行的经营范围不断随之扩 大。广义的电子银行指:通过固定电话、移动电话、自助设备、因特网终端等电子渠道 来办理银行业务。即是指商业银行利用计算机和多种网络通讯技术,通过语音或其他自 动化设备,以人工辅助或自助形式,向客户提供方便快捷的金融服务。通过自助银行、 电话银行、网上银行、p o s 、转账电话、a t m 等多种渠道为客户提供多种传统金融产品和 新兴中间业务金融产品。嘲 2 2 电子银行的优点 电子银行的功能能够办理绝大多数传统的柜台业务,例如:查询、支付、转账、汇 款、缴费等;新兴中间业务,包括投资理财、股票、黄金、外汇、代收水费、电费、税 费等多种代收代付业务。 与银行业原始的面对面的经营方式相比,电子银行的优势在于:对于客户来说,不 再受营业地点、营业时间的限制。电子银行能提高银行对客户综合服务能力,客户通过 电子银行渠道办理业务更方便快捷。对银行来说,电子银行比传统窗口经营模式经营成 本更低,降低了场地、人员的投入;服务时间更长,银行工作人员每天都要定时休息, 电子自助设备不需要;服务效率更高,电子服务渠道并行处理能力强、处理速度快、同 一时间处理的业务数量更多;服务地域更广,网络通讯技术的使用极大地扩展了交易的 使用范围。总之,银行通过电子银行渠道可以更快、更方便地宣传自己的产品,更高效 地销售自己的产品,更好地服务于大众,以更高的服务质量吸引客户。 2 3 电子银行的发展现状 随着银行卡业务的迅速发展,电子银行功能日益强大,电子银行产品日益增多。电 3 东北9 币范大学硕士学位论文 子银行越来越成为未来银行核心竞争力的基础b 引。 市场经济的发展刺激银行不断调整经营手段、拓展经营渠道,促进了银行业的多元 化发展。2 0 0 6 年开始,随着对外资银行政策的逐步放宽,已经有大量的外资银行进入我 国市场,随着外资银行人民币业务的开展对国内银行造成了巨大的冲击。国内各家商业 银行与外资银行相比,具有以下优势:柜台式人工经营网点数量庞大,在国内覆盖地域 广,经营时间较长,对国内市场需求比较了解,占有了一定的市场份额,有一定的客户 群体。外资银行进入中国市场如果也把网点实体化经营作为自己的主要经营手段,就需 要高额投入和大量的人力。面对这种情况,他们都把电子银行作为现阶段发展重点之一, 把通过高新技术开发适合中国国情的电子银行产品来占领高端客户群体作为其抢占国 内市场份额的重要手段。外资银行因其发展时间早,电子银行技术相对成熟,电子银行 产品的管理、销售、研发相对完善。我国各大银行在电子银行发展方面普遍存在不足: 技术创新不足;产品销售没有足够的高效的媒体宣传;产品研发缺乏针对性;只片面追 求电子银行注册用户数量,对现有客户缺乏有针对性的产品服务,客观上造成了睡眠户 的大量存在;对潜在客户的客户挖掘不足,产品推荐手段必须不断改进。阱, 2 4 电子银行存在的问题和发展的有利条件 电子银行有待提高之处在于:作为银行未来发展的重要方面,如何利用电子银行服 务点多面广、无地域限制的优势,利用科学手段,把发展优势变成自己的效益增长点, 是各家商业银行不断投入、深入探索、多方面研究求证的的重要课题。其中,如何设计 新产品,获得最佳的投入产出比,如何针对不同客户推荐不同的金融产品,如何扩大自 己的影响力,壮大自己的客户群,赢得市场,都是急需解决和不断改进解决方法的重大 问题。矧 电子银行应用的有利条件是:银行卡用户数量稳步增长;固定电话、移动电话、网 络用户数量激增。固定电话、移动电话的普及率是有目共睹的。2 0 0 8 年7 月2 4 日,中国 互联网络信息中心( c n n i c ) 发布了第2 2 次中国互联网络发展状况统计报告,报告显 示截至2 0 0 8 年6 月底,我国网民数量达到了2 5 3 亿,首次大幅度超过美国,跃居世界第 一位,网络购物的人数达到网民总量的2 5 。在网民的上网活动中,网络购物已成为其 对网络的一个重要应用。面对不断增长的客户群,电子银行作为银行业新的业务增长点, 面临一个前所未有的发展商机。 电子银行的发展,自身的特点也是主要的优势:无分支机构,业务种类全,费用低; 经营成本低,高回报;无时空限制,使用方便。u 朝 4 东北9 币范大学硕士学位论文 3 1 数据挖掘 第三章数据挖掘 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提 取隐含在其中的、事先未知的但又有潜在价值的信息和知识的过程。n 明对大数据量数据 集的分析是得出可靠结果的保证。数据挖掘技术是根据目标探索和分析数据,找出其 中隐含的规律,并将其模型化的先进有效技术。口2 3 良好的数据组织便于数据挖掘的顺利 进行。 3 2 关联规则 关联规则定义n 1 如下:设i = i 1 ,i 2 ,i m ) 是项的集合。设任务相关的数 据d 是数据库事务的集合,其中每个事务t 是项的集合,使得t i 。每一个事务有 一个标识符,称作t i d 。设a 是一个项集,事务t 包含a 当且仅当a t 。关联规则 是形如ajb 的蕴涵式,其中aci ,bci ,并且anb = o 。规则a 专b 在事 务集d 中成立,具有支持度s ,其中s 是d 中事务包含aub ( 即,a 和b 二者) 的 百分比。它是概率p ( aub ) 。规则a 号b 在事务集d 中具有置信度c ,如果d 中包 含a 的事务同时也包含b 的百分比是c 。这是条件概率p ( b l a ) 。同时满足最小支持度阈 值( m i n s u p ) 和最小置信度阈值( m i n _ c o n f ) 的规则称作强规则。项的集合称为项集,如 果项集满足最小支持度,则称它为频繁项集。 关联规则从不同角度出发,有多个方法分类:按挖掘的模式的完全性分类,根据关 联规则中所处理的值的类型来划分,分为布尔关联规则和量化的关联规则。如果关联规 则只考虑的项的在或不在,即类似布尔值o 或1 的关系,即布尔关联规则。量化的关联 规则考虑的项在一定的数据范围内的关联:按规则中考虑的数据的抽象层次来划分,分 为单层关联规则和多层关联规则。规则考虑的单一层次上数据的关联,即单层关联规则, 考虑的是多个层次上数据的关联,即多层关联规则:按规则中数据所涉及到的数据的维 数来划分,分为单维关联规则和多维关联规则,如果规则考虑的是一个维度上的数据、 即单维关联规则。涉及两个以上维度的关联规则即多维关联规则。 5 东北师范大学硕士学位论文 3 3 关联规则挖掘的目的和实现过程 关联规则挖掘的目标是对给定数据找出一些内在的规则,这些规则的支持度要大 于给定的最小支持度,置信度要大于给定的最小置信度。n 3 1 关联规则挖掘的过程是:哺1 ( 1 ) 找出项集中所有频繁项集。 ( 2 ) 找出由频繁项集产生的满足最小支持度和最小置信度的关联规则。 在实际应用中,每个事务、每个事务中的数据项的重要性可能不相同,因此关联 规则挖掘算法中对事物和其中的数据项引入加权的概念。有垂直加权和水平加权两方面 的问题。h 1 关联规则涉及的数据库的内容不是一成不变的,由于主客观因素的影响,最小支持 度和最小置信度可能都要根据新的需要调整,就产生了关联规则的更新问题。主要有三 种情况:最小支持度和最小置信度值不变,数据库中数据增加时如何生成新的关联规则; 最小支持度和最小置信度的值不变,数据库中数据减少时如何生成新的关联规则;数据 库中数据不变,调整最小支持度和最小置信度的值如何生成新的关联规则。“4 ,矧 3 4 关联规则挖掘的应用领域 关联规则数据挖掘是数据挖掘的一个重要研究领域,是a g r a w a l 等提出的为了研究 从交易数据库中挖掘出有潜在价值的关联规则的一个重要的k d d 课题。瞳妇1 9 9 3 年由 a g r a w a l 等人在对市场购物篮问题进行分析时首次提出该问题用以发现商品销售中的顾 客购买模式。h 3 现在,关联规则的技术广泛应用于商业、保险业、医疗、银行业、电信 业。国外的很多行业都已成熟应用关联规则的技术在销售、预测、数据分析上。如:企 业生产合格产品与生产条件的关联,产品的生产、销售和宣传,有关联商品的集中销售 等诸多方面。已经成为一种应用广、见效快的技术。目前,我国多个行业存有大量数据, 但对数据中信息利用不足,只是简单建立了数据库,缺乏科学有效的应用技术,只能进 行一些简单的信息处理工作,对关联规则挖掘技术的研究和应用急待提高。 3 5 关联规则挖掘相关算法 a p r i o r i 算法是一种宽度优先的算法。开创性的使用基于支持度的剪枝技术,控 制了候选项集的指数增长。口1 基于先验原理:如果一个项集是频繁的,则它的所有子集一定也是频繁的。口, 缺点是:a p r i o r i 算法对数据库进行挖掘时,需要多次扫描数据库,会产生大量的中 间候选项集数。在项目个数较多时,算法的复杂度将呈指数级增长,影响运行效率。 f p - g r o w t h 算法使用f p t r e e 。f p t r e e ( f r e q u e n tp a t t e r nt r e e ) :它是将每个事 6 东北师范大学硕士学位论文 物的频繁项按其频度从大n d , 排n 后,添加到一棵树上的存储结构。为遍历树。建立一 个频繁卜项集的项头表,每个项用一个节点链指向其在树中的位置。树中每个节点由3 个域组成:到达该点的事务的名称;支持数计数,即包含从根节点到该点事务数,链指 针,即指向和该节点在同一事务中的下一节点,无下一节点,则n o d e - l i n k 为n u l l 。n l 2 7 制 f p - g r o w t h 算法的思想为从长度为1 的频繁项目集开始,构造它的条件模式基,然 后用条件模式基来生成它的条件f p t r e e ,并递归地在该树上进行挖掘。n j f p - g r o w t h 算法的优点是:把一个大数据库压缩到一个高度压缩的,很小的数据结 构上,避免了重复访问数据库的造成的巨大资源浪费;f p - g r o w t h 算法不使用候选,避 免了大量候选项集的产生;f p g r o w t h 算法将挖掘任务分解成一些对受约束的条件数据 库进行挖掘的较小任务,这显著地缩小了搜索空间。啪1 m i c r o s o f t 关联算法m 1 是指m i c r o s o f ts o ls e r v e r2 0 0 5a n a l y s i ss e r v i c e s ( s s a s ) 中的关联分析算法。在消费者进行消费行为时,它可以依据其以往的消费记录 或者消费者感兴趣的物品向他们进行推荐,对客户的推荐非常有效。m i c r o s o f t 关联算 法用支持度和置信度说明项集以及通过算法找出的数据中的规则。 m i c r o s o f t 关联算法的原理。该算法通过遍历整个数据集找到同时出现在事务中 的项。关联分析通常对于关系数据库,数据集进行。建立的关联模型必有一个键列、多 个输入列、一个可预测列。用于分析的的数据通常包含在两个表中。例如:用于记录历 史消费明细数据的表,另一个记录进行消费行为的消费者信息的表。 3 6 关联规则挖掘的优势 每个人都是自然界客观存在的独立个体,都具有年龄、性别等自然属性。同时,作 为社会中的一员,人都不能脱离社会独立存在,必然受到客观条件的制约。每个人由于 自身经历、能力的不同,受教育程度、职业、收入、学历、社会地位等社会属性都不尽 相同。自然属性和社会属性的不尽相同导致了人们行为、习惯的差异。同时,不同人的 自然属性和社会属性也有一些相似或相近的方面,这也决定了具有相似或相近属性的人 群可能具有相同的习惯、行为。如何找到人们的各种属性和行为、习惯的关系,一直是 值得不断研究、在多领域有广阔发展前景的问题。关联规则挖掘技术就是针对给定数据 应用科学算法、分析得出事物间的有趣关联。工欲善其事,必先利其器。采用何种技 术解决问题是问题能否解决、解决好坏的关键。将关联规则挖掘技术应用于挖掘电子 银行的产品和客户的自然属性、社会属性的关联,会起到事半功倍的效果。 对同一领域内的大量历史数据进行科学分析,会发现很多有趣的关联。依据电子银 行客户在电子银行产品上的消费记录和当前购买产品就可以预测未来客户可能选择的 产品。依据电子银行具相同自然属性和社会属性的客户的购买记录和当前客户的自然属 性和社会属性,也可以为当前客户推荐产品提供科学的依据。依据电子银行不同产品的 销售记录和当前客户购买的产品,可以为当前客户推荐其感兴趣的产品。 7 东北师范大学硕士学位论文 第四章关联规则挖掘在电子银行产品推荐中的应用 4 1 电子银行业务分类 电子银行业务经过近几年的飞速发展,每家商业银行几乎都有带有自己特色的电子 银行产品。从招商银行1 9 9 9 年9 月推出“一网通 网上银行业务开始,到最近的中国 移动入股浦发银行,发展手机支付业务。电子银行的产品已经形成种类繁多、服务渠道 灵活、产品多样化的局面。主要有以下几种分类方式。 按时间分类:传统业务产品,如:转账、汇款。新兴中间业务产品,如:银证通, 银保通,代收水费、代发工资等各种代收付产品。 按金融风险分类:无风险、低风险、高风险。 按销售地点分类:固定交易地点、移动销售渠道。 只有做好电子银行业务的分类,抽取每个业务的标志性特征,才能保证关联规则挖 掘能找到有意义的关联。 4 2 关联规则挖掘在电子银行领域的应用意义与优势 当今社会已处于信息时代,随着电子技术的不断发展,单纯的传统柜面银行服务模 式已不适应社会的需要,电子银行服务已得到迅速的普及。关联规则应用于电子银行产 品推荐,从银行大量的数据中,抽取出对电子银行产品推荐潜在有效的、有价值的信息 应用于电子银行产品推荐,是关联规则挖掘技术在银行业的应用实践,对电子银行产品 的销售、开发、客户的挖掘有着一定的积极作用。 电子银行的发展,改变了传统银行业务主要靠银行人员与客户当面沟通的工作方 式,变传统的面对面方式为人机对话模式。银行销售人员的销售技巧和成功的推荐经验 也随之丧失了作用。如何在电子银行产品销售中合理推荐产品成为各家银行不断调查研 究、改进的课题。如何让程序化的机器灵活应对多变的客户需求,提高处理程序的智能 化水平,让客户对推荐的电子银行产品更感兴趣,就应该更准确地了解客户的消费需求 和兴趣所在。这样就不能满足于已建立了完善的数据库,存储了大量数据,通过简单数 据库操作可以得出一定的信息,必须深入从多层次、多角度研究数据间的关联。但是, 目前我国多家商业银行的电子银行管理现状都是数据存储完善、数据量大,但缺乏对有 用信息的深入挖掘。是对可利用数据资源的巨大浪费。 8 东:t t :l j 亓i 范大学硕士学位论文 通过对关联规则挖掘科学应用于电子银行产品推荐的研究,合理调配资源,能够节 约资金、人力的投入,提高销售效率,科学预测市场,占领市场,有针对性的开发产品 和销售,吸引客户,从而获得更大的收益。 4 3 关联规则挖掘在产品研发中的应用 在研发方面,可以预测市场需求、节约经营成本、指导新产品研发。满足客户需求、 适应市场需要的产品是一个企业生存、发展的保障。关联规则挖掘的应用,通过对电子 银行历史数据库的挖掘,对近一段时间内产品购买记录的分析,找出客户感兴趣的产品 特性,依此开发新的产品。例如:2 0 0 5 年下半年中国股市开始复苏,股票、基金类产品 交易量稳步增加,但并不是所有银行都能敏感地察觉这一变化。市场的商机转瞬即逝, 此时通过关联规则挖掘对近期数据做简单分析,就会发现市场对此类产品需求增加,此 时尽早开发此类代理业务,抢占市场就成了紧迫任务。国内很多商业银行的电子银行业 务都有自己的v i p 客户群体。为了维护、发展自己的v i p 客户群,每家银行都制定了一 系列办法。适应客户的需求是吸引客户的最佳途径。通过对v i p 客户群的历史消费记录 的挖掘,找出其最感兴趣的产品,成为指导研发的一个重要因素。从客户自然情况、社 会情况预测客户消费取向、从而合理调配资金的使用,加大对银行主流客户感兴趣的产 品研究的投入,才能不断开发出具有市场竞争力的客户真正感兴趣的产品。 4 4 关联规则挖掘在产品销售中的应用 以往的产品销售更多关心的是产品的特性,销售人员的形象、口才、技巧。电子银 行的应用能更有效地挖掘客户的潜在购买能力,创造更大的经济效益。关联规则挖掘科 学应用于电子银行产品销售能尽量减少银行销售人员主观经验的不足,用科学的数据指 导银行对客户的产品宣传,力争在产品营销时做到有的放矢,针对不同的客户群推荐不 同的产品,可以直接提高电子银行的产品收益。 4 5 关联规则挖掘在客户开发中的应用 客户的需求是商业银行存在和发展的根本。了解客户需要是商业银行占领市场的必 要条件,客户的消费取向是商业银行经营发展的重要依据。在新客户开发方面,根据客 户可能的需要推荐能让产品更容易被客户接受;在已有客户群的维护方面,通过推荐客 户感兴趣的产品来与客户沟通必然对维护客户群的稳定起到积极的作用。关联规则挖掘 得出的科学的推荐策略能够不断扩大电子银行的用户规模,规模出效益,必将极大地增 强现代商业银行的竞争力。 9 东北师范大学硕士学位论文 4 6mic r o s o f ts qi s e r v e r 2 0 0 5 关联规则挖掘算法和应用 4 6 1 商业智能 商业智能就是在必要的时间段内,把经过分析的科学结论,也就是正确的有意义的 信息提供给决策者。它可以用于解决对于数据的明显问题,也可以用来发现数据中隐含 的关联。嘲 4 6 2mi c r o s o f ts qis e r v e r 2 0 0 5 商业智能中关联规则挖掘算法 在s o ls e r v e r2 0 0 5 联机丛书中定绍了m i c r o s o f t 关联算法: m i c r o s o f t 关联算法。m i c r o s o f t 关联算法通过遍历整个数据集以查找同时出现在 某个事务中的所有数据项。 m ic r o s o f ts q ls e r v e r 2 0 0 5 商业智能中关联规则挖掘的基本步骤: 图4 1 挖掘步骤图 1 0 东北师范大学硕士学位论文 第五章基于关联规则挖掘的电子银行产品推荐解决方案 5 1 电子银行应用需求分析 关联规则挖掘应用于电子银行产品推荐,主要应用于以下几个问题的解决: 1 、不考虑客户的自然和社会属性,总体预测未来市场需要何种产品。通过对一段 时间内市场消费情况分析,得出消费走向,预测产品购买趋势。 2 、分析电子银行主流客户消费走向,对应开发产品,提高电子产品自动推荐的成 功率。 3 、无客户消费记录如何成功对客户推荐产品。从客户的单一或多个自然或社会属 性找出客户可能对何种产品感兴趣。 4 、从客户当前购买产品的特性,推断出客户会继续购买何种商品。 5 2 数据库设计 数据库中主要包含下列几个表: 交易明细表:用于关联规则挖掘源数据存储表,是关联规则挖掘的主表。 客户信息表:用于存储客户的自然情况和社会情况。 业务种类表:用来记录业务详细属性。 交易关联表:用于记录同一天同一客户在相近时间内的交易记录。 以上各表的结构如表5 1 至表5 4 所示。 表5 1 交易明细表 交易明细表 序号字段名数据类型备注 1 日期非空 2 时间非空 3 客户号非空 4交易额 5 业务号非空 东北师范大学硕士学位论文 表5 2 客户信息表 客户信息表 序号字段名数据类型备注 1客户号 非空 2信用等级 3 性别 4年龄 5收入 表5 3 业务种类表 业务种类表 序号字段名数据类型备注 1业务号 非空 2 类别 非空 3子类 非空 4性质 非空 5优先级 非空 表5 4 交易关联表 交易关联表 序号字段名数据类型备注 1 日期 非空 2客户号 非空 3交易额 4业务号1 非空 5业务号2 8业务号1 5 1 2 东北师范大学硕士学位论文 5 3 总体设计 如图5 1 所示,客户通过电子银行渠道购买产品,交易记录进入事物数据库。对事 物数据库采用关联规则算法,找出业务关联,进入业务关联库。业务关联库中包括客户 自然属性与银行产品购买之间的关联,不同业务之间的购买关联等。企业需求指在不同 时期,不同条件下银行对不同产品销售的重视程度,对采用业务关联库中的关联规则有 一定影响。 图5 1 总体设计框图 5 4 电子银行产品交易数据预处理 5 4 1 电子银行产品分类 电子银行产品名称众多,更新换代速度快,业务性质复杂,将其分类归并,才能更 高效完成关联规则挖掘和业务推荐。首先要对电子银行产品科学分类,提取出各产品的 构成要素。结合银行业务经营性质将所有产品分类。根据对银行风险、收益区分主要分 为以下几大类: 储蓄类产品; 代收水电费等中间业务产品,特点是风险低,以收取手续费为主要目的; 贷款类业务产品,特点是风险高,收益高。 5 4 2 历史数据净化和整合 电子银行数据涉及多个业务平台,在多种数据库中以不同的数据格式存在。以产品 分类为依据,统一处理数据到同一数据库中的相同数据结构中。数据净化保留银行主流 东北师范大学硕士学位论文 客户数据、清除无效数据。将多渠道不同结构的有效数据分别处理后,依照统一标准导 入待挖掘的表中。 交易关联表数据整合和净化原则:通过对历史数据分析,找出同一天相近时段同一 客户的交易记录,合为交易关联表中一条记录,便于挖掘,目前处理数据的时段采用两 个小时,即对两个小时内同一客户的消费记录超过两条,将其交易信息合并成一条记录。 对于给定时间段内用户无两条消费记录数据,不写入交易关联表。 具体净化步骤如下: ( 1 ) 由于电子银行数据存储不集中,数据格式不一致,抽取共性,统一格式,建立 临时数据表,将不同类型数据库的多数据源数据转换为纯文本格式。 ( 2 ) 对于临时存储表中与关联规则挖掘无关的的数据删除,例如:非产品购买交易; 内部管理交易。 ( 3 ) 对交易明细表、交易关联表进行数据填充。 5 5mic r o s o f t 关联算法用于对客户、产品相互关系的关联规则挖掘 5 5 1 数据结构 1 、交易关联表,通过对表中数据的挖掘,找出不同产品购买关系的单维关联规则。 2 、建立数据结构关联如下图,用于挖掘电子银行客户的自然和社会属性与购买产品的 多维关联规则。 图5 2 数据结构图 j y m x 表通过p r o d u c t i d 外键与y w z l 表建立约束关系,通过c u s t l d 外键与c u s t i f o 表建立 约束关系。 1 4 东北师范大学硕士学位论文 5 5 2 电子银行产品关联规则挖掘 1 、挖掘结构 ( 1 ) 单维关联规则挖掘。例如:输入列:购买产品1 ;预测列:购买产品2 。 ( 2 ) 多维关联规则挖掘。例如:如图5 3 :输入列:a g e 、s e x :预测列:p r o d u c ti d 。 结构参 c a s ti f o 霉麓m ic r o s o f ta 暑s o c i 毫t io nb m l e s 缗 g e固i n p l l t 圈c a s ti d 目| 鋈胁x 圈 m 鋈p r o d u c t i d 髁s e x 0 圈k e y 镯i a p a t 图5 3 多维关联规则 2 、挖掘得到的关联规则 关联规则中,产品名称使用分类后的产品代码。产品代码按业务风险分为g ( 高风险类) , z ( 一般风险类) ,d ( 低风险类) 三大类。 ( 1 ) 通过对交易关联表挖掘,得出了不同产品间的购买关联。即通过客户目前已购买的产 品,预测客户还将购买何种产品。 一, 得出规则实例: 购买产品g 1= 购买产品g 4 购买产品g 2= 购买产品g 4 购买产品z 1= 购买产品z 3 购买产品d 2= 购买产品d 3 ( 2 ) 通过客户的自然属性、社会属性,预测客户购买何种产品。 得出规则实例: 年龄2 0 - 3 0 = 购买产品g 1 4 0 0 0 - 5 0 0 0 元月,年龄3 0 一4 0 = 购买产品g 2 3 0 0 0 - 4 0 0 0 元月,男性= 购买产品z 1 年龄5 0 - 6 0 = 购买产品d 1 3 、产品推荐的实现 以挖掘出的关联规则为依据,结合银行自身对不同产品的兴趣度及客户的信用度记 录,得出产品推荐序列,再综合考虑对电子银行产品的推荐。 产品推荐按以下原则:优先考虑银行方兴趣度高的产品,依据已经挖掘的关联规则 推荐产品。 吐0lci t a q y e 口嘶胁螂 圈羽镭 东北师范大学硕士学位论文 推荐算法步骤如下: ( 1 ) 对事务数据库中的交易记录进行预处理,去除无用数据,生成用于关联规则挖掘 的数据库。 ( 2 ) 应用关联规则挖掘算法对经过预处理的数据库进行挖掘,得出关联规则集,存 入业务关联数据库。 ( 3 ) 对新客户根据其自身属性,对原有客户根据其消费记录,再结合银行本身对不 同产品的重视程度应用关联规则实施银行产品的推荐。 图5 4 为关联规则库生成后,电子银行产品实际推荐流程。 图5 4 推荐流程 通过实际测试和相关人员认定,推荐方案是科学有效的。 1 6 东北师范大学硕士学位论文 第六章总结 本人从对微观具体应用的角度探讨了关联规则挖掘在电子银行产品推荐上的应用。 在对电子银行产品做了深入分析的基础上,利用m i c r o s o f ts q ls e r v e r 2 0 0 5 商业智能 中关联规则挖掘算法对产品销售历史记录、客户信息进行有益的处理,为电子银行产品 销售过程中的产品和客户、产品和产品问得出了一些有趣的规则。我国目前的产品需求 早已向个性化发展,这些规则的应用,为电子银行产品推荐提供合理依据,提高了产品 销售效率,节省了银行的资源。 要想深入研究关联规则挖掘技术,就必须了解多个学科和领域的知识,但这门技术 在电子银行的产品推荐反面的作用是明显的,应该本着求真、务实的态度深入研究。 1 7 东北师范大学硕士学位论文 参考文献 1 j i a w e ih a nm i c h e l i n ek a m b e r 著数据挖掘概念与技术 m 范明,孟小峰译北京:机械工业出 版社,2 0 0 7 1 4 7 - 1 5 0 2 孟祥瑞主编,张波、余忠林、邵康副主编网上支付与电子银行 m 上海:华东理工大学出版 社,2 0 0 5 1 5 3 1 5 4 3 美 p a n g n i n gt a nm i c h a e ls t e i n b a c hv i p i nk u m a r 著数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年中考英语第一轮复习:过去进行时(含答案解析)
- 2025年地标建筑建设合同提前终止
- 2025标准版试用买卖合同范本
- 2025湖南省职业病防治院高层次人才公开招聘9人考前自测高频考点模拟试题参考答案详解
- 2025广东广州市横沥人力资源管理服务有限公司招聘服务外包人员1人考前自测高频考点模拟试题及答案详解(考点梳理)
- 2025年上半年浙江宁波市北仑区(开发区)招聘国有企业人员(港城英才)及进入人员模拟试卷及答案详解(典优)
- 中考消防考试题库及答案
- 铁路列车乘务员考试题库及答案
- 街道特勤考试题库及答案
- 客户服务支持标准化工具与培训资料
- GB/T 6441-1986企业职工伤亡事故分类
- 第一章 电渣冶金
- GB/T 12719-2021矿区水文地质工程地质勘查规范
- 剖宫产术后护理常规
- 老年康复理论知识考核试题及答案
- 分子杂交技术hu
- 第3章-信息可视化设计的流程课件
- 实验数据的误差分析课件
- 供水管网爆管事故应急抢修全新预案修订
- 沉降计算表格计算表格
- 华为企业应收账款管理【案例分析】
评论
0/150
提交评论