基于数据挖掘的银行信用卡客户细分研究_第1页
基于数据挖掘的银行信用卡客户细分研究_第2页
基于数据挖掘的银行信用卡客户细分研究_第3页
基于数据挖掘的银行信用卡客户细分研究_第4页
基于数据挖掘的银行信用卡客户细分研究_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

天津财经大学硕士学位论文基于数据挖掘的银行信用卡客户细分研究姓名:内容摘要国内外 信用卡 市场竞 争的加 剧,要 求国内 银行 信用卡 业务的 运营模 式逐步 向以客 户为中心、 以数据 为中 心、以 信患 为基础 的国际 先进 模式转 变, 客户细 分成为 这种 科学经 营模式的前 提和基 础 目前我 国银 行对信 用卡客 户的 细分方 法还 是基于 经验或 者简 单的统 计方法,但 是无法 满足 业务发 展的 复杂分 析需求 随 着数据 挖掘 技术在 信用卡 管理 中应用 的深入,采用数据挖 掘技术进行有 针对性地客户 细分变得十分 重要和紧迫这篇文 章研 究对象 是银 行信用 卡客 户细分 模型 ,主要 针对 银行在 具备 大量的 信用 卡数据中凭 借数 据挖掘 技术 ,选择 合理 的客户 细分 方法 ,设计 科学 的客户 细分 模型, 以指 导银行进行 有针 对性地 信用 卡产品 或服 务设计 ,提 高客 户满意 度, 最大化 客户 价值, 建立 以客户为中心的营销战略。这篇文章研 究内容如下 :首先, 提出研究背 景及意义, 确定研究 目标与方法 ;其次,研究客 户细 分的相 关理 论和方 法, 并介绍 了数 据挖 掘技术 工具 ,为信 用卡 客户细 分的 研究作理论 铺垫 ;第三 ,结 合信用 卡客 户细分 的应 用现 状,对 常用 的细分 方法 进行了 总结 并构造了 基于 聚类 算法 和决 策树 方法 的 数据 挖掘 模型 ,并 通过 数 据加 以实 证研 究; 最后,提出了一些关于信用卡的个性化营销方式这篇文 章探 索了银 行如 何应用 数据 挖掘技 术和 方法, 实现 准确、 有效 的信用 卡客 户细分,为 银行 信用卡 客户 细分问 题的 数据挖 掘提 供系 统的理 论与 方法。 对我 国信用 卡业 务在以客户 为中 心的管 理理 念背景 下, 利用信 息技 术提 高竞争 力具 有一定 的指 导意义 与应 用价值关键词 :信 用卡、 客户 细分 、数据 挖掘 、聚 类分析 、决 策树 , , , , , , , 、 析 , , , , , , : , , ;, , ; , , , , , , : ; ; ; ; 独 创 性 声 明本人声明所 星交的学 位论文是本 人在导师 指导下进行 的研究工作及 取 褥 的研 究 成 果。 据 我 所知 , 除 了 文中 特 别 加以 标 注 糯致 谢 的 地方外,论文中不包含其他入已经发表或撰写过的研究成果,也不包含为获 得天 津 财经 大 学或 其 他教 育 机构 的 学位 或 证书 而 使用 过 的材 料 。与 我 一 同 工 作 的 同 志 对 本 研 究 所 做 的 任 何 贡 献 均 己 在 论 文 中 作 了 明确的说明并表示谢意,学位论支作者签名:彼蔓专乏 、签字日期:山口善年;胃 网学位 论文 版权 使用 授权 书本学位论文作者完全了解天津财经大学有关保留、使用学位论文的规定,有权 保留并向国家 有关部门或机 构送交论文的 复印件和磁盘, 允 许 论文 被 查 阅 和借 阅 。 本 人授 权 天 津 财经 大 学 可 以将 学 位 论 文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文,(保密的学位论文在解密后适用本授权书导师签名:芝垠吞代签字圜期:如嚣年;雳如。签字鑫期:学位论文佟者毕业磊去向:工作单位: 电话:通讯地址: 邮编:学位论文捧者签名:役冀叛 嚣第 章 绪论 研究 背 景和 意 义本章主 要揭 示论 文的 研究 背景 、意 义和 目标 ,阐 述论 文的 研究 内容 和方 法, 并说 明论文的 结构 和 章节 安排 。研究背景目前, 国内信 用卡 市场竞 争日益 激烈 ,各商 业银行 纷纷 大规模 推出信 用卡 业务, 而此前的 中国 银行 卡 业务 中借 记卡 业 务占 有 以 上 的比 重, 贷记 卡 和准 贷记 卡( 即本 文所 称信用卡) 所占比重 不到 。信 用卡的 主要功能 有三个 ,即交 易媒介、 分期 贷款、 预借现金功 能 。相 应 的信 用 卡 业务 的 收入 来 源 如下 : 持卡 人 (买 方 )获 得交 易 便 利, 则 信用 卡 业务提 供 方获 得 年费 收 入; 商 户( 卖方 )获 得 交易 便 利 ,则 信 用卡 业 务提 供 方获 得 销售 折 扣收入;持卡 人使用消费 信贷,则信 用卡业务提 供方获得利 息收入。我国开展 信用卡 业务比 较晚, 年 中国银 行在国 内率先 成功地 推出第 一张信 用卡,经过 年的 发 展, 我 国的 信 用卡 业 务也 取 得了 长 足 的进 步 。目 前 国内 可 以找 到 的和 信 用卡最 相 关 的 是 银行 卡 的 统 计 数 字。 据 统 计 , 截 至 年 月 末 , 全 国 银 行卡 发 卡 总 量 达到 亿 张 , 比 年 年 末 增 长 ; 月 至 月 银 行 卡 交 易总 额 万 亿元 , 比 年同 期 增长 ; 银 行卡 账 户 人民 币 存款 余 额 亿元 , 比 年 年末 增 长 亿元,增长 。随 着中国 银联公 司的成 立和跨行 交易成 功率的 提高,银 行卡跨 行交易 量得到了较 大 幅 度 的 增长 。 年 月 至 月 共 完 成 跨 行交 易 亿 笔 ,清 算 金 额 亿 元 , 分别比去 年同 期增 长 和 ,其 中, 通过银 行卡 总中 心完成 的异 地跨 行交 易达到 万笔, 清算 金额 亿 元, 分别 是 年全 年交 易总 和的 倍 和 倍。 上半 年的 各项联网通用任务基本完成。我国 的 信 用卡 业 务 正处 突 破 性发 展 的 阶段 , 学 习和 吸 收 信用 卡 业 务发 展 成 熟的 国 家(如美 国 )的经 验 ,采 用科 学的 、 数量 化的 方 法和 手段 ,分 析 、识 别和 预测 信 用卡 用户 群体,保证 信用卡市 场的健康 有效发展 ,是一个具 有重要 意义的研 究课题。银行卡 自诞 生到 现在 经历 了近一 个世 纪的 时间 ,已 成为 人们日 常生 活中 不可 缺少 的一个组 成 部 分 。 随 着 中国 加 入 , 中 国 银 行 业 面 临着 日 益 激 烈 的 竞 争。 各 大 银 行 纷 纷 采叼 匕 京 青 年 报 , 年 月 日用先进 的信 息技术 手段 提升自 身的 服务水 平。 银行 提供给 用户 的产品 有一 个显著 的特 点就是:同 质性。 不同 银行之 间的 产品几 乎没有 什么 差别。 而另 一方面 ,银行 又存 有海量 的用户信息 数据 。通过 对这 些海量 数据 的挖掘 分析 ,发 现用户 不同 的消费 偏好 ,开展 有针 对性的营销活动,保留 高价值客户,创造 更多的利润,成为 银行获取竞争优势 的一个重要手段。数据挖掘技 术的出现, 为银行实现 这个目标提 供了强有力 的武器。在银行 信用 卡业 务中, 如何 取得 竞争优 势, 留住 老客户 ,开 发新 客户, 是各 家银 行非常关心 的问 题。只 有建 立以客 户为 中心的 管理 信息 系统, 通过 对大量 信息 的分析 ,找 出客户消费 的行 为和规 律, 筛选出 优秀 的客户 群体 ,预 测客户 的个 性化需 求, 及时响 应每 一位客户现 在和 未来的 需要 ,设计 出更 加符合 客户 需要 的产品 和服 务,才 能真 正进行 以客 户为中心的 营销和 服务 。目前 ,一 般银行 卡业务 系统 缺乏真 正面 向市场 、面向 客户 的决策 分析系统, 对客 户的评 判仍 停留在 静止 的、片 面的 、主 观的水 平, 不能对 客户 作出动 态的 、全面的、 客观 的评价 和准 确、高 效的 选择。 为了 更好 地细分 市场 、细分 客户 ,提高 业务 管理水平和 银行 卡获利 能力 ,推行 基于 数据挖 掘的 银行 信用卡 客户 细分研 究, 是银行 提高 综合竞争力的必然选择。随着网 络技 术的 发展和 计算 机使 用的日 益广 泛, 电子化 数据 越来 越多, 数据 挖掘 技术的研究 与推 广己取 得了 较大成 果, 但数据 挖掘 技术 在银行 信用 卡客户 方面 还处于 一个 探索前进的 阶段 。数 据挖掘 技术 为银 行开展 以信 用卡 客户 细分为 基础 的针 对性营 销提 供了 有效工具,同 时银行内 部丰富的 客户资料 和历史消费 数据是 实施数据 挖掘的有 力保证。因此, 国内 银行正 面对 一个全 新的 、更加 激烈 的市场 竞争 环境, 银行 将主要 靠对 客户服务挖 掘来 提高 竞争力 ,银 行己 经进入 一个 服务 大比 拼的时 代。 此阶 段的主 要特 征是 银行更加关 注自 身的核 心竞 争力, 进一 步提升 其管 理水 平及运 作效 率,逐 步降 低运营 成本 ,以更好地 服务 于客 户。因 此, 客户 关系管 理作 为先 进的 企业管 理理 念、 策略和 方法 就自 然地成为银行竞争的发展方向。客户关 系管 理进 入中 国已 经很长 一段 时间 ,在 多变 的市 场面前 ,系 统更 大的 潜力 并没有发挥 出来 ,其 积累的 数据 如同 一座未 开发 的金 矿, 有待去 发掘 和共 享。随 着网 络技 术的发展和 计算 机使用 的日 益广泛 ,电 子化数 据越 来越 多, “ 数据 丰富而 知识 贫乏” 的问 题日益突显, 而数据挖 掘技术 正为此类 问题开 辟了一条 道路, 其研究与 推广己 取得较大 成果,但在数 据挖 掘的 具体商 业运 用方 面还处 在一 个探 索前 进的阶 段。 银行 业务的 一个 重要 特点就是拥有 海量用户 ,在经 历了业务 快速发 展的初期 阶段以 后,银行 的增量 市场日益 萎缩,存量市 场日 益饱 和,原 来粗 放的 经营模 式已 开始 向精 细营销 模式 过渡 ,从以 产品 和服 务为中心的 运营 方式转 换到 以客户 为中 心的运 营方 式, 其核心 是要 能够对 海量 客户群 体进 行细分研究 ,了 解客户 消费 行为特 征和 差异, 从而 提供 差异化 的营 销。因 此, 本文就 在这 样的背景之 下, 研究 并积极 寻求 有效 的客户 细分 方法 和科 学的细 分模 型, 以协助 银行 正确 地实现客 户 细分 并 有针 对 性 地进 行 商业 决 策 ,从 而 为银 行 信 用卡 销 售额 和 利 润的 增 加做 出 贡献。研究意义银行卡 已被 各家 商业银 行视 作可 带来丰 厚收 益的 重点业 务。 金融 市场的 对外 开放 ,银行卡 市 场首 当 其冲 , 同 时激 烈 的国 际 市 场竞 争 也将 推 动 国内 银 行卡 市 场 的迅 速 发展 和 成熟,中国银行 卡业务在面 临种种挑战 的同时也将 带来巨大的 历史机遇。信用卡 是当 今银 行发 展最 快的一 项金 融业 务之 一, 它是 一种可 在一 定范 围内 替代 传统现金流通的电 子货币。 目 前我国政府也 在大力促进 银行卡的推广 和普及。随着 信息技术的不断发 展, 信用 体系的 不断 完善 ,信用 卡的 应用 将不 断得到 普及 。国 内各大 银行 纷纷 将其作为重 点业 务加 以发展 ,己 经成 为各银 行的 必争 之地 。然而 当前 国内 银行的 信用 卡业 务的服务水 平还 停留 在较落 后的 水平 。中国 银行 业与 国外 银行最 大的 差距 在于服 务。 在客 户关系管理 方面 ,国 外已有 将近 二十 年的历 史。 西方 银行 业一直 处于 比较 激烈的 竞争 状态 ,在客户服 务方 面积 累了相 当的 经验 。而中 国银 行业 刚从 计划经 济时 期转 变过来 ,对 “以 客户为中 心 的理 解一 直处 于 表面 状态 ,不 能 够深 入的 了解 客 户的 需求 ,长 期 以来 对客 户实 行无差别服 务策略 ,不能 够抓住真 正的赢 利客户 进行区 别对待, 为客户 提供一 对一的 服务。银行 的 数据 库 中积 累 了 大量 的 客户 信 息 ,如 何 利用 这 些 有效 的 数据 去 对 不同 客 户进 行 细分,为 他们 提供 一对 一的 有效 服务应 当成 为当 今各 大银 行研 究的重 点。 而随 着数 据挖 掘技术的 不 断成 熟 和 完善 , 完 全可 以 为 国内 银 行开 展 个 性化 的 信 用卡 营 销 提供 强 大 的信 息 支持。本文旨 在通 过数 据挖掘 技术 和统 计分析 方法 的结 合,实 现准 确、 有效的 客户 细分 ,为银行分 析和 进一 步的 数据 挖掘 等工作 提供 支撑 。这 在理 论上 可以丰 富银 行信 用卡 客户 细分与数据 挖掘 领域 的研 究, 在实 践上可 为客 户关 系管 理中 客户 细分问 题的 解决 提供 更多 的方法选择 ,为 我国 银行 在以 客户 为中心 的管 理理 念的 背景 下, 利用信 息技 术提 高银 行竞 争力具有一 定的 指导 意义 与应 用价 值。相 信本 文的 研究 可以 为国 内银行 开展 信用 卡业 务、 提升服务水平提供一点帮助。 研 究目 的 和创 新 点本文研 究的 是银行 信用 卡客户 的细 分模型 ,其 研究目 的是 分析银 行在 信用卡 持续 发展中需要 解决的 营销 问题, 研究 数据挖 掘技术 在解 决这些 问题 中的技 术和优 势, 并和传 统的经验 方法 作对 比, 为银 行在 信 用卡 营销 中改 变过 去“ 一 卡通 式跑 马 圈地 的营 销模 式, 基于数据 挖掘 技术设 计产 品,选 择客 户,授 予信 用额 度并实 现一 对一营 销提 供理论 依据 和建议。本文 利 用数 据 挖 掘对 银 行信 用 卡 客户 细 分研 究 的 内容 包 括 以下 几 个具 有 代 表性 的 方面:()挖掘 不同客户 群体的 信用卡消 费偏好 :挖 掘持卡人 的特征 属性与交 易行为 之间的关联关系。按 客户类型进行 专项内容的分类 或聚类挖掘。()银行 卡用卡行 为与银 行贡献度 的挖掘 :以往 银行划分 优质信 用卡客户 的标准 往往是按是否 按时 全额 还款, 按时 全额 还款的 客户 固然 是优 质客户 ,但 不使 用是不 能给 银行 带来更大效 益的 ,而 部分还 款却 可以 在规避 风险 的前 提下 ,给银 行带 来效 益的最 大化 。因 此通过用卡 还款 行为 的数据 挖掘 ,可 以更加 细分 客户 群体 ,反映 不同 客户 对银行 的贡 献度 ,找出更 多 的对 银 行贡 献 度较 高 的客 户 群体 , 并针 对 不 同群 体 进行 金 融产 品 营销 或 差异 化 服务。 研究 内 容和 方 法研究内容框架本文的研究内容可以概括地分为六个章节:第一章:绪 论部分阐明 论文的研究 背景、意 义、目标及 研究的内容 和方法;第二章 :是 对国 内外 相关 研究理 论和 方法 综述 ,包 括客 户细分 理论 以及 数据 挖掘 技术的研究概况和现状的介绍;第三章 :着 重分 析基于 数据 挖掘 的银行 信用 卡客 户细分 的应 用现 状,介 绍银 行信 用卡业务及客 户特点, 分析利用 数据挖掘 对银行 信用卡客 户细分的 意义和应 当注意的 问题;第四章 :基 于之 前的 理论 基础和 应用 现状 的描 述, 进行 基于数 据挖 掘的 银行 信用 卡客户 细 分 的 模 型 设 计 , 包 括 银 行 信 用 卡 客 户 细 分 的 数 据 挖 掘 方 法 分 析 和 比 较 , 以 及 基 于 聚类算 法和决 策树方法 的客户 细分数 据挖掘 模型的 设计;第五章:对 上述模型进 行定量的 实证分析, 对实证结 果进行分析 和解释;第六章 :根 据以上 的研 究结果 ,提 出基于 客户 消费行 为分 析的营 销战 略和个 性化 营销方式。本文以 下将 按照此 研究 框架进 行有 序的深 入研 究和分 析, 设计科 学合 理的信 用卡 客户细分模型并进行实证分析。研究方法()本论文的研究采用 理论分析与实证研究相 结合的方法,除文字 叙述和逻辑推理外,还运用了 数据挖掘 分析技 术(如 回 归、 聚类 方法和 决策树分 类方法 等) ,并且对数据的 处理和检验 的结果采 用了大量统 计分析方 法,从而使 论述更具 说服力。()本论 文运用比 较分析 的方法, 综合而 全面地 分析了各 种的市 场细分和 数据挖 掘技术的方法的区别 和利弊,并 对采取的方 法的检验结果 进行比较分 析和解释。第 章国内 外 相 关研 究 理 论 和方 法 综 述 客 户 细 分 理 论 和 方 法 的 研 究 概 况 和 现 状客户细分的理论概述客户 细 分( ) ,又称为关系细分( ) ,是世 纪 年 代 中期 由 美 国学 者 温德 尔 史密 斯 提出 , 是 指按 照 一定 的 标 准将 企 业的 现 有客户划 分为 不同 的客户 群的 行为 。它是 现代 营销 理念 的产物 ,是 第二 次世界 大战 后西 方发达国家 市场 营销 理论和 战略 的新 发展 。 认 为: 正确 的客 户细 分能 够有 效的降低成本,同时获 得更强、更有利可 图的市场渗透。客户细 分是 产品 和服务 进行 开发 及市场 营销 的基 础,是 使差 异化 成为可 能、 使提 供的产品和服 务更直接 的针对 某一客户 群的重 要环节。 这包括 理解客户 对产品 和服务的 偏好,针对客 户的 需求 提供产 品和 服务 ;理解 客户 对销 售和 服务的 要求 ,有 针对性 地设 计销 售渠道;理 解客 户对 市场活 动的 反应 和接受 程度 。客 户细 分的目 的是 要通 过细分 ,寻 找客 户群之间的 需求 差异 并追 溯差 异原 因,选 择符 合企 业发 展目 标和 资源条 件的 客户 群和 市场 ,针对不同 客户 群的 不同需 求来 设计 个性化 产品 和服 务, 使其真 正成 为企 业业务 获得 成功 、扩大产品和服务销量的助推器。任何一 种方 法的 产生都 要有 相关 的理论 依据 ,而 客户细 分也 不例 外。其 理论 依据 主要有以下几个方面。()客户需求的异质性并不是 所有 客户 的需求 都相 同, 只要存 在两 个以 上的客 户, 需求 就会不 同。 影响 消费者消费决 策因素 的差异 决定了消 费者的 需求、 欲望及 消费行为 是多元 的,必 然存在 差异。因此 可 以根 据 这种 差 异 来区 分 不同 的 客 户, 客 户需 求 的 异质 性 是进 行 客 户细 分 的内 在 依据。()消 费 档 次假 说随着经 济的 发展 和消费 者收 入水 平的提 高, 消费 量会随 之增 加, 但消费 量的 增加 并非线性增 长, 而是 呈现出 区间 性台 阶式的 变化 形式 ,一 旦消费 者达 到某 种消费 层次 之后 ,消费变化 的趋 势将 变得 非常 平缓 。根据 消费 档次 假说 ,消 费者 的消费 档次 或消 费习 惯在 一段时期内是 相对稳 定的,这 就为通 过消费 行为来划 分消费 群体提 供了理论 前提和 基础。()企业资源的有 限性和有效市场 竞争的目的性资源总 是稀 缺的, 任何 一个企 业都 不能单 凭自 己的人 力、 财力和 物力 来满足 整个 市场的所有需 求,这不 仅缘于企 业自身条 件的限制 ,而且从 经济效应 方面来看 也是不足 取的。由于缺 乏足 够的资 源去 应对整 个客 户群体 ,因 此企 业必须 有选 择地分 配资 源。为 了充 分发挥资源 的最 大效 用,企 业必 须区 分不同 的客 户群 ,分 辨出能 有效 为之 服务的 最具 吸引 力的细分客 户市 场, 对不同 的客 户制 定不同 的服 务策 略, 集中资 源服 务重 点客户 ,以 增强 竞争优势。()法则不同客 户给 企业 带来的 价值 是不 同的。 由意 大利 经济学 家帕 雷托 提出的 著名 的 法则认 为: 在顶 部的 的 客户 创造了 企业 的利 润。甚 至在 某些 行业利 润客 户存 在更极端的情 况。一 些商业 银行发现 他们当 前客户 中的 几乎创 造了 的利 润,即 关键的少数创 造重 要的多 数, 但其中 一部 分利润 却被 一些 没有盈 利的 客户丧 失了 。因此 ,对 客户进行有 效地 细分 ,把客 户群 分为 高价值 客户 、低 价值 客户和 负价 值客 户三部 分, 对于 不同的类别 其管 理意 义也不 同。 对企 业来说 ,最 主要 的就 是要识 别能 带来 绝大部 分利 润的 的客户和负价值的客户,对其采取不同策略。当然,此法 则并不是全行业通 用的客户细分理 论依据,因为在某 些行业如汽车、房地产行业中 ,绝对不是 的客户购买 了的汽 车,也不是 的业主,购 买了的房子。在这 类行业中, 法则 是不适用的 。法 则只适用于 银行、电信 、零售等行业。客户细分的原则客户细分可以根 据很多标准来 进行,但无论采 用何种细分标 准,都应该遵 循以下原则:()可接受 性在企业 实际 应用 过程中 ,细 分客 户群的 细化 程度 应达到 企业 的要 求,并 且对 于企 业的实践应用有指导作用。()可衡量性细分出 的客 户群 不仅 范围 要比较 明确 ,而 且规 模也 能大 致判断 ,细 分后 的客 户群 特征是可以识别和衡量的。()稳 定性有效的客 户细分 还必须具 有相对 的稳定 性,要足 以实现 在此基 础上进行 的实际 应用。如果变 化太 快, 应用 方案 还没 来得及 实施 ,群 体就 已面 目全 非,这 样的 细分 方法 就会 毫无意义。成功的 企业 选择 成功的 客户 ,通 过客户 细分 ,企 业可以 留住 最有 价值客 户, 提高 潜力客户在企 业的支出 额,并努 力把其变 成最有价 值客户, 以取得最 大的利润 回报。 数 据 挖 掘 技 术 的 研 究 概 况 和 现 状数据挖掘技术的介绍数 据 挖 掘 ( , ) 是指 从 数据 库 的大 量 数据 中提 取 隐含 的 、先 前 未知 的并有潜 在价 值的 信息和 知识 的过 程。从 技术 角度 看, 数据挖 掘是 从大 量的、 不完 全的 、有噪声的 、模 糊的 、随 机的 实际 数据中 ,提 取隐 含在 其中 的、 人们不 知道 的、 但又 是潜 在有用的信息 和知识 的过程 。从商业 应用角 度看, 数据挖 掘是一种 崭新的 商业信 息处理 技术。与传统 统计 回归 方法 相比 ,数 据挖掘 技术 更注 重与 商业 应用 的结合 。其 主要 特点 是对 商业数据库 中大 量业 务数 据进 行抽 取、转 化、 分析 和模 式化 处理 ,从中 提取 辅助 商业 决策 的关键知识,即从 一个数据库中 自动发现相关 商业模式。随着人 们对 数据 中蕴 含知 识和规 律的 关注 不断 加大 ,数 据挖掘 技术 无论 是在 算法 研究还是在 应用 研究 上都 得到 了很 大程度 的发 展。 在商 业应 用领 域中, 依据 现代 数据 库、 数据仓库技 术, 大量 的商 业数 据被 记录和 保留 下来 ,这 给数 据挖 掘技术 在商 业领 域中 的应 用研究提供 了基 础。 对这 些商 业数 据分析 的目 的也 不再 仅仅 是为 了研究 ,更 主要 的是 为商 业决策提供有价值的 信息。与传统统 计回归方法相比 ,数据挖掘技 术更注重与商业 应用的结合,应用的 领域 主要 集中 在对 商业 趋势与 客户 行为 的预 测、 行业 关联性 分析 、客 户聚 类分 析及偏差 检 测等 。 本 文以 下 要 设计 的 银 行信 用 卡客 户 细 分模 型 就 是以 数 据 挖掘 作 为 技术 工 具的。数 据挖 掘是 按照企 业既 定的 业务目 标, 对大 量的 企业数 据进 行探 索、揭 示隐 藏其 中的规律性并进一 步将之模型 化的先进、有 效的方法。数据挖 掘技 术从 功能 上包 括分类 、聚 类分 析、 关联 分析 、以及 概念 描述 、偏 差检 验和预测等,这些都在实际 中得到了具体应用。分类: 按照 分析 对象 的属 性、 特征 ,建 立不 同的 组类 来描 述事 物。 例如 :银 行可 以根据以前的 数据将新 用户进 行分类, 对其以后 使用信 用卡的可 能性进行 预测。聚类分 析: 聚类 分析 是根 据物 以类 聚的 原理 ,分 析数 据对 象, 将本 身没 有类 别的 对象聚集成 不同 的类 别, 并且 对每 一个 这样 的类 别进 行描 述的 过程 。分 类是 事先 已经 知道 有哪些类别 ,而 聚类 则事 先不 知道 数据对 象到 底有 些什 么样 的类 别。对 象根 据“ 最大 化类 内的相似性 、最小 化类 间的相 似性 一的原 则进行 聚类 或分组 ,使 得在一 个簇( 聚类) 中的对 象具有很高 的相似 性, 而与其 他簇 的对象 很不相 同。 它增强 了人 们对客 观现实 的认 识,是 概念描述和偏差分析的先决条件。关联分析:关联是某种 事物发生时其他事物会 发生的这样一种联系 ,可分为简单关联、时序关 联、因 果关 联。例 如: 银行可 以使用 多维 关联规 则, 分析信 用卡使 用情 况和找 到银行信用卡利润的主要贡献者。概念描 述:对 某类 对象的 内涵进 行描 述,并 概括这 类对 象的有 关特征 。概 念描述 分为特征性 描述和 区别 性描述 ,前 者描述 某类对 象的 共同特 征, 后者描 述不同 类对 象之间 的区别 。 生 成 一 个 类 的 特 征 性 描 述 只 涉 及 该 类 对 象 中 所 有 对 象 的 共 性 。偏差检 验: 它也被 称为 孤立点 分析 或异常 检测 。在数 据库 中可能 存在 这样一 些数 据对象,它 们与 数据的 一般 行为或 模型 存在较 大偏 差, 称之为 孤立 点。孤 立点 可能是 度量 或执行错误 所致 ,因此 在一 般情况 下, 孤立点 数据 常常 被当作 杂质 排除, 但有 些情况 下找 出孤立点却 是非 常有用 的, 比如高 额频 繁的信 用卡 透支 行为, 这种 现象相 对于 正常的 信用 卡使用来说 是很 少出现 的, 属于孤 立点 ,找出 这些 孤立 点,就 可能 预防或 发现 一些信 用卡 欺诈行为。预测: 把握分 析对 象发展 的规律 ,对 未来的 趋势做 出预 见。例 如:对 未来 信用卡 客户消费情况进行判断。数据挖掘技术方法的介绍和比较数据挖 掘主要 采用 的技术 和方法 包括 一些统 计方法 ,如 线性回 归和逻 辑回 归;有 些用非统计或混 合方法, 如决策树、 神经网络 技术、遗 传算法、粗 糙与模糊 集方法。()线性回 归简单线 性回 归分析 是量 化两个 连续 变量之 间关 系的一 种统 计技术 。这 两个变 量分 别是因变量 和自变 量。 使用这 一方 法,可 以发现 一条 穿过数 据的 线,线 上的点 使对 应数据 点的方差最 小。 为市场 营销 、风险 和客 户关系 管理 建立 模型时 ,通 常有多 个自 变量, 用多 个独立自变量来预测一个连 续变量称为多元线性 回归。公式表示为: 五 ) 。 占 ()其中 是随 机干 扰项 ,可 以利用 样本 数据 资料 对以 及参 数进 行估 计。()回归 回 归是 使用最 广泛 的建 模技术 ,与 线性 回归很 相似 。两 者的主 要区 别在 于逻辑回归的因变量不 是连续的,而是离 散的或者类型变量 。该模型没有关于 变量分布的假设,也不要 求假 设指标 存在 多元正 态分 布。最 早有 ( )建 立 回归模 型预 测公司的破产以及违约的概率。()建立回归模型来区分违约和非违约贷款申请人,并确认为两者的分界线。比如在我国,张后启() ,杨朝军固() ,应用模型研究 上市公司财务危机, 得出有效结论等等。()决策树它较神 经网 络、多 元统 计中的 判别 分析等 方法 有速度 快、 精度高 、生 成模式 简单 易用等优点,在数据挖 掘中被广泛采用。 决策树的目标是逐 步将数据分类到不 同的组或分支中,在因变 量的 值上建 立最 强划分 ,主 要是通 过训 练样 本集, 建立 目标变 量关 于各输 入变 量的分类预 测模 型,全 面实 现输入 变量 和目标 变量 不同 取值下 的数 据分组 ,进 而用于 对新 数据对象的 分类 和预 测。当 利用 所建 决策树 对一 个新 数据 对象进 行分 析时 ,决策 树能 够依 据该数据输入变量 的取值,推断 出相应目标变 量的分类或 取值。决策树 方法存在两大 核心问题:第一, 决策 树的生 长问 题,即 利用 训练样 本集 ,完 成决策 树的 建立过 程。 第二, 决策 树的剪枝问题 ,即利用 检验样本 集,对形 成的决策 树进行优 化处理。 由于分类 规则比较 直观,所以易于理解。决策树常用于分类和预测。()神 经网 络 技术神经网络处理和 回归处理大不 相同,它不依照 任何概率分布 ,而是模仿人 脑功能,可以认为它 是从 每一 次经验 中提 取并 学习信 息。 神经 网络 系统由 一系 列类 似于人 脑神 经元 一样的节点组 成,这些 节点通过 网络彼此 互连,具 有自组织 性、自适 应性以及 较强的稳 健性。如果有数 据输入, 它们便 可以进行 确定数 据模式的 工作。 神经网络 由相互 连接的输 入层、中间 层 (或 隐藏 层 ) 、 输出 层 组成 , 中间 层 由多 个 节 点组 成 ,完 成 大部 分 网络 工 作, 输 出层输出 数据 分析 的执行 结果 。神 经网络 模型 的类 型较 多,目 前不 下数 十种, 其中 多层 感知器( ,)网络在分类问题中使用最多。利用神经 网络建立 信用评分 模型的 最大优点 是它能够 描述建 数据中复 杂的线性 关系,就预测精度而言,神经网 络一般要高于其他方法。神经网络模型也存在一些缺陷:由于其计算过程基本上是一个“黑箱” ,其结果往往难于理解;神经网 络往往 存在着过 度拟合 问题, 对训练样 本而言 ,神经 网络的预 测精度 很高,。, : , ,年。 , ,: , 年张 后 奇 , 上 市 公 司财 务 危 机 预 警 系 统: 理 论 研 究 与 实证 分 析 嗍 , 上 证 研究 , 年 第 期白杨 朝 军 , 上 市 公 司 业 绩 预 警机 制 研 究 叨 , 上 证 研 究 , 年 第 期但是,当用于实际 预测时,其结果并 不见得很理想。神经网 络技 术具 有非 线性 数据的 快速 拟合 能力 ,被 广泛 应用于 数据 挖掘 中, 是聚 类分析的有力工具。()遗传算法与神经 元网 络类 似, 遗传 算法也 不遵 循任 何概 率分 布, 是源自 “适 者生 存” 的进 化过程。 它首 先将 问 题的 可能 解按 某 种形 式进 行编 码 ,编 码后 的解 称 为染 色体 。随 机 选取 个染色体 作为 初始 种群, 再根 据问 题预定 的评 价函 数对 每个染 色体 计算 适应值 ,性 能较 好的染色体 有较 高的 适应值 。选 择适 应值较 高的 染色 体进 行复制 ,并 通过 遗传算 子产 生一 群新的更适 应环 境的染 色体 ,形成 新的 种群, 直至 最后 收敛到 一个 最适应 环境 的个体 ,得 到问题的最优化解。主 要应用于关联规 则和分类挖掘。()粗糙与模糊集方法。主要应用粗糙集 和模糊集理论进 行分类和预测。第 章 基 于 数 据 挖 掘 的 银 行 信 用 卡 客 户 细 分 的 现 状 分 析 银 行 信 用 卡 业 务 和 客 户 特 点 分 析银行信用卡业务及特点()信用卡的定义随着信 用卡 业务 的发展 ,信 用卡 的种类 不断 增多 ,概括 起来 ,一 般有广 义信 用卡 和狭义信用卡之分。从广义 上说 ,凡 是能够 为持 卡人 提供信 用证 明、 持卡人 可凭 卡购 物、消 费或 享受 特定服务的 特制 卡片 均可 称为 信用 卡。广 义上 的信 用卡 包括 贷记 卡、准 贷记 卡、 借记 卡、 储蓄卡、 提款 卡( 卡) 、支 票卡 及 赊账 卡等 。从狭义 上说 ,信 用卡 主要 是指由 银行 或其 它财 务机 构发 行的贷 记卡 ,即 无需 预先 存款就可贷款消费 的信用卡,是 先消费后还款 的信用卡。根 据 中 国 人 民 银 行 年 月 日 颁 布 执 行 的 银 行 卡 业 务 管 理 办 法 的 定 义 , 该办法所 称银 行卡 ,是 指由 商业 银行( 含邮 政金 融机构 )向 社会 发行的 具有 消费 信用 、转 账结算、存 取现 金等 全部 或部 分功 能的 信用 支付 工具 。银 行卡 包括 信用 卡和 借记 卡。 信用 卡按是否向 发卡 银行 交存 备用 金分 为贷 记卡 、准 贷记 卡两 类。 贷记 卡是 指发 卡银 行给 予持 卡人一定的 信用 额度 ,持 卡人 可在 信用 额度 内先 消费 、后 还款 的信 用卡 。准 贷记 卡是 指持 卡人须先按 发卡 银行 要求 交存 一定 金额 的备 用金 ,当 备用 金账 户余 额不 足支 付时 ,可 在发 卡银行规定的 信用额 度内透 支的信 用卡。 借记卡 按功能 不同分 为转账 卡(含 储蓄卡 ) 、专用 卡、储值卡。借记卡不具备透支功能。本论文所研 究讨论的信 用卡是指 贷记卡和准 贷记卡。使用信用卡的优点信用卡 作为 特殊 的金 融商 品、 现代 化的 金融 工具 ,是 国际 流行 的先 进结 算手 段、 支付工具和新颖 的消费信贷 方式,日 益受到人们 的青睐。由于使 用信 用卡 ,使 得现 金交易 变为 转账 结算 ,取 代了 一定数 量的 市场 流通 货币 ,减少了货 币的 发行 量, 减少 了国 家每年 用于 货币 印刷 、调 拨、 运输、 仓储 和投 放所 耗费 的资金,也 加快 了社 会流 动资 金周 转速 度, 促进 经济 发展 。信 用卡 还能 促进 商品 销售 ,刺 激社会需求。对于持 卡人 而言 ,信用 卡的 发行 和使用 ,使 持卡 人通过 使用 信用 卡获得 商品 和劳 务服务,免 除了 携带大 量现 金的不 便和 风险, 同时 还可 通过透 支简 便地获 得银 行贷款 。同 时贷记卡持卡人非现金 交易还可以享受 如下优惠条件: ()免息还 款期待遇 。银行记 账日至发卡银 行 规定 的 到期 还 款 日之 间 为免 息 还 款期 。 免息 还 款 期最 长 为 天 。 持卡 人 在到 期 还款日前偿 还所使用 全部银行 款项即可 享受免息 还款期待 遇,无须 支付非现 金交易的 利息。()最低 还款额待 遇。持 卡人在 到期还 款日前偿 还所使 用全部 银行款项 有困难 的,可 按照发卡银行规定的最低还款额还款。对于特 约商 户来 说,由 于有 信用 卡发卡 银行 的信 用保证 ,特 约商 户可以 放心 地为 持卡人提供 商品 和服 务,从 而扩 大商 品的销 售量 ,并 减轻 收款、 点款 工作 量,简 化了 支付 、记账和结账的过程。信用卡 的发 行, 使银行 有了 一种 新的争 取特 约商 户和信 用卡 客户 存款的 手段 ,有 利于扩大银 行转 账结 算业务 ,同 时增 加银行 信贷 资金 的来 源,从 而获 得更 多的利 差收 入, 已经成为银 行的 重要盈 利手 段。据 统计 ,国外 信用 卡业 务给银 行带 来的利 润一 般占到 银行 利润的 左右 ,花 旗银行 甚至 还要 高,占 以上 。美 国运通 公司 更是 凭借运 通卡 成为 全球服务、旅游、娱乐业界的巨无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论