(应用数学专业论文)城市商业银行授信分类鉴审分析评价系统研究.pdf_第1页
(应用数学专业论文)城市商业银行授信分类鉴审分析评价系统研究.pdf_第2页
(应用数学专业论文)城市商业银行授信分类鉴审分析评价系统研究.pdf_第3页
(应用数学专业论文)城市商业银行授信分类鉴审分析评价系统研究.pdf_第4页
(应用数学专业论文)城市商业银行授信分类鉴审分析评价系统研究.pdf_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 内容摘要:商业银行的风险控制一直是银行经营管理的核心,而且建 立合理、有效的信用评价系统一直是业内关注的核心问题。本文基 于c s v m 理论对银行数据进行分析,建立城市商业银行授信分类鉴 审分析系统。该系统主要包括三个模型:一、基于财务报表信息的 模式识别模型,用于辅助决策者进行信用鉴别;二、属性重要程度 判别模型,用于为辅助决策者提炼有价值的信用属性( 财务指标) : 三、简约模型,用于判断重要属性提炼的可靠性及非重要属性间是 否存在关联性。技术上,主要体现在数据预处理、训练集构造、核 函数选取、参数选取几个方面。由于c s v m 的建模基础有完备的数 学依据,为建模的可靠性及有效性提供了坚实基础。总之,数学模 型的应用与授信风险控制和管理的有机结合是是本研究课题的灵魂 之所在。 关键词:银行授信;风险控制;数据挖掘;模型构建 a b s t r a c t c o n t e n t :t h er i s k sc o n t r o lo ft h ec o m m e r c i a lb a n k si sa l w a y st h e c e n t r a lq u e s t i o ni nb a n k s m a n a g e m e n t ,a n de s t a b l i s h i n gar e a s o n a b l e a n de f f e c t i v ec r e d i ta s s e s 8s y s t e mh a sb e e nac r u c i a lp r o b l e m t h i s p a p e ra n a l y s e st h eb a n kd a t aw i t ht h eh e l po ft h ec - s v mt h e o r e m a n de s t a b l i s ht h ea n a l y s i sa n de v a l u a t i o ns y s t e mf o rc r e d i tc l a s s i f i c a - t i o na n dt r i mo fu r b a nc o m m e r c i a lb a n k s t h i ss y s t e mi n c l u d e st h r e e m o d e l s :f i r s t ,t h ep a t t e rr e c o g n i t i o nm o d e lw h i c hb a s e do nf i n a n c i a l r e p o r t i n gi n f o r m a t i o n ,i no r d e rt oa s s i s tt h ep o l i c y - m a k e rt oc a r r yo n t h ep a t t e r nd i s t i n c t i o n ;s e c o n d ,t h ep r o p e r t yi m p o r t a n td e g r e ed i s - t i n c t i o nm o d e l ,i no r d e rt oa s s i s tt h ep o l i c y - m a k e rt oa b s t r a c tt h e v a l u a b l ec r e d i tp r o p e r t y ;t h i r d ,t h eb r i e fm o d e l ,i no r d e rt oj u d g e t h er e l i a b i l i t yo ft h ei m p o r t a n tp r o p e r t ya n dw h e t h e rt h e r ei sc o n n e c - t i o na m o n gt h eu n i m p o r t a n tp r o p e r t i e s i nt h et e c h n o l o g y , m a i n l y m a n i f e s ti nt h ed a t ap r e t r e a t m e n t ,t h et r a i n i n gs e t sc o n s t i t u t i o n ,t h e k e r n e lf u n c t i o ns e l e c t i o n ,t h ep a r a m e t e r ss e l e c t i o n b e c a u s et h ec - s v i n m o d e lf o u n d a t i o nh a st h ec o m p l e t em a t h e m a t i c sb a s i s ,t h i sp r o v i d e s t h es o l i df o u n d a t i o nf o rt h em o d e l s 7 r e l i a b i l i t ya n dv a l i d i t y i naw o r d , t h ec o m b i n a t i o no ft h em a t h e m a t i c a lm o d e lw i t ht h er i s k sc o n t r o la n d m a n a g e m e n ti st h es o u lo ft h ep a p e r k e yw o r d s :b a n kc r e d i t ;r i s kc o n t r o l ;d a t am i n i n g ;m o d e lc o n s t r u c - t i o n 学位论文独创性声明 本人承诺:所呈交的学位论文是本人在导师指导下所取得的研究成果论文中除特别 加以标注和致谢的地方外,不包含其他人和其他机构已经撰写或发表过的研究成果,其他同 志的研究成果对本人的启示和所提供的帮助,均已在论文中做出了明确的声明并表示谢意 一弛匀像 日期:训罗矿f i 学位论文版权使用授权书 本学位论文作者完全了解辽宁师范大学有关保留、使用学位论文的规定,及学校有权 保留并向国家有关部门或机构送交复印件和磁盘,允许论文被查阅和借阅本人授权辽宁师 范大学,可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印 或其他复制手段保存、汇编学位论文保密的论文在解密后使用本授权书 渊一始q 侈 指导教师躲i 硬 e l 期:o 即罗;咿矿yy 口y , 城市商业银行授信分类鉴审分析评价系统研究 城市商业银行授信分类鉴审分析评价系统 研究 1 引言 1 1历史概述及研究背景 近些年随着改革开放的不断深入和市场经济体制的不断完善以及我国加 入w t o 以后,将在今后对银行业全面开放,届时大量的外资银行会涌入国内, 对我国国有商业银行、股份制银行和城市商业银行等会产成很大的冲击,面对 着金融竞争国际化的大趋势,研究如何提高我国目前商业银行的竞争力,从而 在竞争中立于不败之地将成为最重要的任务。 我国商业银行大多自组建之日起就面临着资本充足率低、不良资本比例 高、财务效益低下等问题,以信用风险为代表的银行风险时刻威胁着商业银行 的健康发展。而所谓信用风险【6 】是指由于借款人违约或其信用评级的变动和履 约能力的变化导致其债务的市场价值变动而引起的商业银行损失的可能性。贷 款发放后存在借款人不能按期还本付息的可能性,即贷款能否如约偿还存在不 确定性,这种不确定性就是信用风险。1 9 9 7 年亚洲金融危机中,泰国、韩国、 马来两亚、日本等国的许多银行倒闭或被强制合并,从表面上看是由于流动性 危机所引起,但归根到底是由于银行的资产质量差,大量贷款成为呆账,终端 客户将损失累积到银行,而且形成了商业银行信用风险失去控制的结果。 以史为鉴,我国商业银行应尽可能降低自己的信用风险。因此有必要建立 完善有效的辅助鉴审分析系统。该系统至少具有依据预贷款企业的现状及历史 经营情况及未来发展趋势等基本信息为决策者提供辅助决策的功能。 本文将基于城市商业银行掌握的具有某属性的信息初步建立一个城市商业 银行授信分类鉴审分析评价系统。为了建立该系统有必要对城市商业银行现有 的贷款流程进行分析。贷款流程主要分三步:贷款的前期调查、贷款审查与审 批、贷款发放。其中贷款的前期调查对该系统的建立起着支撑的作用。前期调 查主要包括 ( 一) 调查借款人的基本情况 ( 二) 调查借款人的财务情况 ( 三) 调查借款人申请贷款的用途 城市商业银行授信分类鉴审分析评价系统研究 ( 四) 调查借款人还款来源、渠道,测定贷款金额和期限 ( 五) 分析本次贷款的风险 ( 六) 对借款人提供的贷款担保方式予以调查确认 ( 七) 综合分析,出具贷前调查报告,明确提出贷前调查意见贷前调查报告包 括上述贷前调查的各个方面的结论和意见,并明确提出贷与不贷及其理由、贷 款金额、贷款方式、利率、期限等调查意见。 本文主要依据( 二) 即调查借款人的财务情况,建立辅助决策者分析贷款风 险的授信分类鉴审分析评价系统。 商业银行对企业客户信用风险的测度,可以转化为对企业财务状况的衡量 问题。因为信用风险的形成即企业是否能如期还本付息主要取决于企业财务状 况。影响企业财务状况的因素很多,不能仅根据某一项指标,而应根据影响企 业财务状况的多维指标来评估企业的财务状况。而现有的模糊数学方法、神经 网络模型等都可实现上述问题。其中神经网络是主流建模方法,但是神经网络 的本质缺陷在于无法避免过拟合现象及网络结构难以确定。而基于统计学习理 论建立的支持向量机技术在保留神经网络的优点的基础上避免了上述缺点,有 效地提高了模型的泛化能力。支持向量机技术是基于统计学习理论及优化技术 建立起来的一种智能学习方法。该方法既属于数据挖掘领域也属于“机器学 习的研究领域。本文主要依据支持向量机技术中的c s v m 方法对城市商业银 行授信分类鉴审分析评价系统进行建模。 1 2本文的研究工作 本文的主要研究工作包括以下几个方面: 给出城市商业银行授信分类鉴审分析评价系统建模方案 完成上述方案中的基于财务报表信息得到模式识别模型的建立 依据c s v m 方法对数据属性进行分析,挖掘重要属性的信息 建立基于简约属性的模式识别模型 比较上述两种模式识别模型进而给出简约属性的合理性分析 通过仿真实验说明上述建模方案的可行性和有效性 2 城市商业银行授信分类鉴审分析评价系统研究 2理论基础 2 1银行经营管理与授信风险管理相关理论 商业银行作为经营货币的金融中介组织,自有资本占比低这一特点决定了 其本身具有较强的内在风险特性。而银行贷款质量的优劣,信贷资产所面临风 险的大小、对银行的经营成果乃至生存发展,有着至关重要的影响。目前我国 商业银行信贷风险管理中存在着一定的问题和缺陷,这使得我国的商业银行在 参与国际金融市场的竞争中处于不利的地位。商业银行在信贷业务中面临的风 险可分为信用风险、市场风险和操作风险,现实中主要是信用风险。传统的信 用风险定义为包括借款人、债券发行人或金融交易对方在内的交易对手由于各 种原因不能完全履约致使金融机构、投资人或交易对方遭受损失的可能性。从 狭义上讲,信用风险就指信贷风险。 财务因素分析主要是根据借款人提供的财务报表,揭示其财务状况、现金 流特征、偿债能力和未来发展趋势,为做出正确的信贷决策提供依据,侧重于 定量分析。对于商业银行的信贷管理,企业财务危机可描述为企业无力偿还全 部本息的状态,或企业的现金净流量低,资产配置的流动性也差,无法变现用 于抵偿到期债务的本息。因而从财务角度来看,商业银行信贷管理者对信贷企 业财务状况所看重的,首先是盈利性,因为企业的经营收入构成企业的第一还 款来源:其次是企业的清偿保证能力( 企业的现金流及其资产变现后偿还债务 的能力) 。 一般说来,商业银行贷款按照期限划分,其贷款种类分为:短期贷款、中 长期贷款和长期贷款。而从历史上看,银行倾向于向企业发放短期贷款,用于 流动资金的非固定性补充。这是因为短期贷款收回本息面临的不确定性要小于 长期贷款。这说明,出于风险回避的考虑,商业银行更加关注企业的短期偿债 能力。即使对于长期贷款项目,商业银行通常也要在信贷计划中对本金和利息 偿还做出详细的安排,而每期本息的偿还情况又与当期信贷企业的现金流量情 况密切相关,即与其一定期间内的偿债能力密切相关。对于商业银行来说,分 析企业的还款来源:企业的经营收入和现金流量构成企业的第一还款来源:而 企业资产负债表所反映的财务实力,即可以用做抵押的资产,或者可以出售弥 补现金流量缺口的流动性资产构成第二还款来源。总之,银行面对贷款企业的 信用风险主要反映的就是贷款企业的财务状况。 3 城市商业银行授信分类鉴审分析评价系统研究 2 2 数据预处理的基本方法 + 数据挖掘把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘 参数,提供决策支持服务。数据挖掘过程可分为:问题定义、数据预处理、数 据挖掘以及结果的解释和评估等阶段。目前对数据挖掘的研究主要集中于挖掘 技术、挖掘算法、挖掘语言等。而事实上数据挖掘对所处理的数据有严格的质 量要求。在数据挖掘过程中数据预处理至关重要,数据预处理主要包括数据清 理、集成和归约。 数据清理是处理数据中的遗漏和清洗脏数据。数据集成将多数据源中的数 据进行合并处理,解决语义模糊性并整合成一致的数据存储。数据归约将辨别 出需要挖掘的数据集合,缩小处理范围。 1 、数据清理 数据清理主要处理空缺值,平滑噪声数据( 脏数据) ,识别、删除孤立点。 数据清理的基本方法是: ( 1 ) 空缺值处理 目前最常用的方法是使用最可能的值填充空缺值,比如可以用回归、贝叶 斯形式化方法工具或判定树归纳等确定空缺值。这类方法依靠现有的数据信息 来推测空缺值,使空缺值有更大的机会保持与其他属性之间的联系。还有其他 一些方法来处理空缺值,如用一个全局常量替换空缺值、使用属性的平均值填 充空缺值或将所有元组按某些属性分类,然后用同一类中属性的平均值填充空 缺值。如果空缺值很多,这些方法可能误导挖掘结果。 ( 2 ) 噪声数据处理 噪声是一个测量变量中的随机错误或偏差,包括错误的值或偏离期望的孤 立点值。可以用以下的数据平滑技术来平滑噪声数据,识别、删除孤立点。 分箱:将存储的值分布到一些箱中,用箱中的数据值来局部平滑存储数 据的值。具体可以采用按箱平均值平滑、按箱中值平滑和按箱边界平滑。 回归:可以找到恰当的回归函数来平滑数据。线性回归要找出适合两个 变量的“最佳”直线,使得一个变量能预测另一个。多线性回归涉及多个变 量,数据要适合一个多维面。 计算机检查和人工检查结合:可以通过计算机将被判定数据与已知的正 常值比较,将差异程度大于某个阈值的模式输出到一个表中,然后人工审核表 中的模式,识别出孤立点。 4 城市商业银行授信分类鉴审分析评价系统研究 聚类:将类似的值组织成群或“聚类”,落在聚类集合之外的值被视为 孤立点。孤立点模式可能是垃圾数据,也可能是提供信息的重要数据。垃圾模 式将从数据库中予以清除。 2 、数据集成 数据挖掘需要对数据进行集成,也就是将多个数据源中的数据合并存放在 一个同一的数据存储( 如数据仓库、数据库等) 中,数据源可以是多个数据库、 数据立方体或一般的数据文。 数据集成涉及三个问题: ( 1 ) 模式集成涉及实体识别,即如何将不同信息源中的实体匹配来进行模式 集成。通常借助于数据库或数据仓库的元数据进行模式识别; ( 2 ) 冗余数据集成往往导致数据冗余,如同一属性多次出现、同一属性命名 不一致等。对于属性间冗余可以用相关分析检测到,然后删除: ( 3 ) 数据值冲突的检测与处理,由于表示、比例、编码等的不同,现实世界 中的同一实体,在不同数据源的属性值可能不同。这种数据语义上的歧义性是 数据集成的最大难点,目前没有很好的办法解决。 93 、数据归约 数据归约技术可以用来得到数据集的归约表示,它接近于保持原数据的完 整性,但数据量比原数据小得多。与非归约数据相比,在归约的数据上进行挖 掘,所需的时间和内存资源更少,挖掘将更有效,并产生相同或几乎相同的分 析结果。几种数据归约的方法: ( 1 ) 维归约通过删除不相关的属性( 或维) 减少数据量。不仅压缩了数据集, 还减少了出现在发现模式上的属性数目。通常采用属性子集选择方法找出最小 属性集,使得数据类的概率分布尽可能地接近使用所有属性的原分布。属性子 集选择的启发式方法技术有: 逐步向前选择:由空属性集开始,将原属性集中“最好的”属性逐步填 加到该集合中; 逐步向后删除:由整个属性集开始,每一步删除当前属性集中的“最 坏”属性;, 向前选择和向后删除的结合:每一步选择“最好的”属性,删除“最坏 的 属性; 判定树归纳:使用信息增益度量建立分类判定树,树中的属性形成归约 5 城市商业银行授信分类鉴审分析评价系统研究 后的属性子集。 ( 2 ) 数据压缩应用数据编码或变换,得到原数据的归约或压缩表示。数据压 缩分为无损压缩和有损压缩。比较流行和有效的有损数据压缩方法是小波变换 和主要成分分析。小波变换对于稀疏或倾斜数据以及具有有序属性的数据有很 好的压缩结果。主要成分分析计算花费低,可以用于有序或无序的属性,并且 可以处理稀疏或倾斜数据。 ( 3 ) 数值归约通过选择替代的、较小的数据表示形式来减少数据量。数值归 约技术可以是有参的,也可以是无参的。有参方法是使用一个模型来评估数 据,只需存放参数,而不需要存放实际数据。 ( 4 ) 概念分层通过收集并用较高层的概念替换较低层的概念来定义数值属性 的一个离散化。概念分层可以用来归约数据,通过这种概化尽管细节丢失了, 但概化后的数据更有意义、更容易理解,并且所需的空间比原数据少。 2 3 最大最小对偶 定义:称极小一极大问题m i ,n ,m a x y ( x ,可) 为原始问题。称e h 户( z ) = m a x r ( z ,y ) 定 z ,【y e :j ,c - r 义的该问题的目标函数,。扛) 为原始函数;称极大一极小问题m a x m i n 厂( z ,y ) 为 耋,z ,t 对偶问题,称由只( ! ,) = m i n 2 ( x ,可) 定义的该问题的目标函数只( ! ,) 为对偶函 数。 弱对偶定理:考虑由上面所定义的原始函数尸( z ) 和对偶函数只( 可) 。则对任意 的z 刀和y y 有 只( 可) 尸( z ) 进而若原始问题和对偶问题都有最优解,则 搿卿地可) - m 删a x 只( 可) 唑尸( z ) 2 卿搿厂( z ,可) 即原始问题的最优值以对偶问题的最优值为下界。 定义:设给定定义在( 石,y ) 上的实值函数尸( z ,可) 和一个点( z ,可+ ) ,z + 疋,y y 。称( 矿,+ ) 满足鞍点条件,若对任意的z 彤,y y ,有 厂( 矿,y ) 厂( z + ,y 。) 尸( z ,y + ) 强对偶定理:原始问题和对偶问题有相同的最优值 卿学厂( z ,) _ m 删a xm 。i z n 厂( z ,y ) 6 城市商业银行授信分类鉴审分析评价系统研究 的充分必要条件是存在着满足鞍点条件的( 矿,剪) 。 2 4数据挖掘及支持向量机技术介绍 2 4 1统计学习 “统计学习”理论是2 0 世纪7 0 年代由统计学家v a p i l i c f 3 】经过2 0 余年的科学 探索撰写出的一步统计学巨作。其研究对象是趋于传统统计学的小样本问题, 故称为小样本统计学1 7 】。它是传统统计学的有益补充。 2 4 2 数据挖掘 随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的 数据越来越多,那么如何从大量的数据库中挖掘或抽取出有用的知识是数据挖 掘的主要任务。由于数据库涉及面的广泛性使得数据挖掘成为一门涉及面很大 的交叉学科,包括机器学习、数理统计、神经网络【4 】【5 】、数据库、模式识别、粗 糙集、模糊数学等相关技术。 2 4 3机器学习 2 0 0 1 年,美国航空航天局j p l 实验室的科学家在( ( s c i e n c e ) ) 杂志上发表的 一篇文章,引起了许多科研工作者的兴趣,也使机器学习作为一类数据挖掘技 术得到了广泛重视。其主要涉及模式识别、回归分析等领域的智能算法设计及 理论分析。其中支持向量机是继神经网络之后机器学习研究领域的又一个热门 技术。 2 4 4 支持向量机 支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 1 1 】是由v a p n i k 领导的a t t 实 验小组在上世纪九十年代中期,基于统计学习理论,提出的以凸二次规划为基 本模型的一种处理小样本的机器学习方法,它是一种通用的有监督的学习方 法,是数据挖掘技术中的一个新的研究热点。在支持向量机【2 】建模理论中,结 构风险最小化原则起到了核心作用。正因为该原则的优点,使其能有效地摆脱 传统建模方法中的过拟合现象的困扰,增强了模型的泛化能力。经过科研人 员2 0 多年的不懈努力,先后提出了c s v m 、v - s v m 、l s s v m 等一批有代表性 7 城市商业银行授信分类鉴审分析评价系统研究 的支持向量机模型。本文主要依据c - s v m 技术对城市商业银行授信分类鉴审分 析评价系统进行建模。 2 5c s v m 理论 其本质就是在于寻找一个把r d 空间的点分成两部分的规则。基本思想由 图( 2 1 ) 中简单的线性可分的问题来说明。图( 2 1 ) 中,实心点和空心点代表两类 样本,日为分类超平面,皿,岛分别代表各类中离 2 1 线性可分情况下的分类线 r g m h 协i 最近的样本且平行于日的面,它们之间的距离称为分类间隔( m a r g i n ) 。所谓最 优化分类面就是要求不但能将两类正确分开,而且使分类问隔最大。假定大小 为l 的训练样本集 ( z t ,玑) ,z t 月:d ,y i - t - 1 ,一1 ) ,i 1 z ) 有两个类别组成,如果翰r d 属于第一类,则标记为正( 犰= 1 ) ;否则,标记 为负( 玑= 一1 ) 。支持向量机的目的在于寻找分类超平面日: 叫t z + r = 0 使得样本集满足 y i ( w 丁x t r ) 一1 0 ,i t f ( 2 1 ) 则此超平面可以将两类点分开。点z 到超平面何的距离为 撕= 智 城市商业银行授信分类鉴审分析评价系统研究 根据最优分类超平面的定义,使间隔最大等价于使忪i 最小。则求最优分 类超平面问题就转化为求在满足条件( 2 1 ) 且使忪l | 最小的数学规划问题。 支持向量机模型主要分为两种:线性支持向量机和非线性支持向量机。 ( a ) 线性支持向量机 上面已经提到了线性可分问题,并用来解释了支持向量机的基本原理。在线形 可分的情况下,设( 甄,玑) :1 副木 + 1 ,- 1 ) 是二分类问题的训练样本,我们采 用最大间隔的思想得到的数学优化模型 粤j n5 u u _ s t 阢( u t 黾一r ) 一1 o ,i 1 f ) ( 2 2 ) 其中u 舒为分类超平面的法向量,r r 为阀值。对于上述优化问题, 其最优解可以通过求解它的拉格朗日对偶问题的解得到。,为此,可以定义下面 的拉格朗日函数 m , ) :三w t 0 2 - - 圭啦( 幽t 铲r ) - 1 ) ( 2 3 ) 其中,q i 0 为拉格朗日系数。把式( 2 3 ) 分别对u 和r 求偏微分并令它们等 于0 ,可以得到 掣:u 一壹跳舻0 ( 2 4 ) a u 下c o l ( w , r , a ) :壹y i c 。i :o ( 2 5 ) 五一一 7一uu , d r_ 由( 2 4 ) 和( 2 5 ) 可得到 u = 耽啦x i ( 2 6 ) 将上面两个式子代入( 2 3 ) 可得到相应的对偶形式 使得 ( 2 7 ) 警以n 2 争1 一壶善1 卿嘶q ) ( 2 8 ) i = i ,j = 9 ( 2 9 ) 0 = 口 玑 :渊 、, l ,l 0 i i q 可 。澍 0 一 q 城市商业银行授信分类鉴审分析评价系统研究 这样,求解最优分类面问题就转化为对啦求解下面的优化问题 m 。i n j 1 厶l i j :1y i y j a i ( 瓤) 一:1q i s t 啦 0 ,i 1 f ) := 1 y i a 严0 ( 2 1 0 ) 其中啦是与每一个样本对应的拉格朗日乘子。这是一个不等式约束的二次寻优 问题,存在唯一的解a + = ( q :q ;,q ) ,则得到 f一 = q ;执戤 ( 2 1 1 ) i = 1 且由k k t 定理可知,最优解满足 q ;( 妙t ( u r z i r ) 一1 ) = 0( 2 1 2 ) 因此,对于多数样本q 将为零,最优解只依赖那些对应的q 0 的输入,他们 通常只占全体样本的很少的一部分。我们引入下面的定义: 定义2 1 ( 支持向量) 称训练样本集丁中输入x t 为支持向量,如果它对应 的q + 0 。求解上述问题后得到的最优分类函数是: 厂( z ) = s g n ( “,“z + 广)( 2 1 3 ) 由于非支持向量对应的o l + 均为零,因此式中的求和实际上只对支持向量进行, 而广是分类的域值。 ( b ) 非线性支持向量机 对于非线性分类问题,s v m 将输入瓤,i = 1 z 通过非线性变换圣( ) 映射到 某个高维空间中的向量西( 祝) ,i = 1 2 ,将非线性问题转化成该高维空间中的线 性问题,然后再在这个高维空间中寻求最优分类面。在这个过程中,支持向量 机巧妙地应用了“核函数 的技巧,即用核函数k ( 既,巧) 替换在上述问题中出 现的内积运算。其对应的模型为: m 。i n j 1 := ,;:ly t 协q t q j k ( 鼢,) 一名1 s t :ly i a i = 0 0 c ,i = 1 ,1 而相应的分类函数也就变为 f ,( z ) = s g n ( zq 孙k ( x i ,z ) + 矿) 1 0 城市商业银行授信分类鉴审分析评价系统研究 其中扩= 殇一:= l 西虢k ( 兢,巧) ,其中下标歹满足c 哆 0 常用的核函数主要有: 1 ) 多项式核函数 g ( x ,z 7 ) = ( z z 7 ) d ,d = 1 ,2 , g ( x ,z 7 ) = ( ( z z 7 ) + 1 ) d ,d = 1 ,2 , 2 ) 高斯径向基核函数 k ( x ,x a ) = e x p ( 一訾) ( 2 1 4 ) 3 ) 多层感知器,又称s i g m o i d 核函数 k ( x ,z 7 ) = t a n h ( k ( x z 7 ) + 刀) 其中七 0 ,u 0 4 ) 傅里叶核函数 常用的傅里叶核有两种,它们也都是有一维傅里叶核产生的。 第一种傅里叶和所对应的一维傅里叶核为 剐叩,) - 酊面去南 妇,以r ( 2 1 5 ) 其中q 是满足0 q o ,i 1 f ( 2 1 7 ) := 1y i a i = 0 城市商业银行授信分类鉴审分析评价系统研究 求得最优解q + = ( q :q ;,q ;) 3 ) 计算 选择a + 的一个正分量噶,并计算 4 ) 由此求得模式识别模型决策函数 f ( x ) = s g n ( w t z - i - r + ) 1 2 z 玑 口 。试 = u 巧 欢坎 q :l 一 骆 = r 城市商业银行授信分类鉴审分析评价系统研究 3 城市商业银行授信分类鉴审分析评价系统的建模 综述 对城市商业银行授信分类鉴审分析评价系统进行建模的目标为:i 、给出鉴 别分析模型。2 、属性重要性分析。基于以上两个目标,本文主要分五步进行建 模。 第一步:基于财务报表的信息给出模式识别模型。其主要步骤包含数据预 处理、核函数选取、模型参数选取( 结构参数c 和核参数仃) 、代入c - s v m 模型获 取模式识别函数。 第二步:依据g s v m 方法对数据属性进行分析,挖掘重要属性的信息。其 主要步骤包含从授信风险角度对属性( 财务指标) 进行预处理、单个属性( 财务指 标) 重要程度判别模型的建立、比较分析,验证单个属性( 财务指标) 重要程度判 别模型的有效性及可靠性。 第三步:建立基于简约属性的模式识别模型。给出属性( 财务指标) 重要性 的判别阈值,得到重要属性( 财务指标) 并改造训练集,重复第一步的过程用改 造后的训练集重新建模得到简约属性模型。 第四步:比较基于财务报表信息的模式识别模型和简约模型,进而给出简 约属性( 财务指标) 的合理性分析。给出基于财务报表信息的模式识别模型和简 约模型的准确率,从经济学角度进行分析解释。 第五步:通过仿真实验说明上述建模方案的可行性和有效性。给出基于财 务报表信息的模式识别模型、单个属性重要程度模型、简约模型的仿真试验。 1 3 城市商业银行授信分类鉴审分析评价系统研究 4建立基于财务报表信息的模式识别模型 4 1 模型的功能 某城市商业银行对1 0 0 个预贷款企业的财务报表( 共3 7 项财务指标) 进行分 析,确定给予其中6 0 家企业贷款,其余4 0 家企业不给予贷款。 基于财务报表信息的模式识别模型希望根据上述资料,对新来的一个预贷 款企业通过3 7 项指标,就可以判断是否将给予贷款,进而可以给决策者( 信贷 员) 提供辅助决策的功能。 为了叙述方便,我们对上述问题加以简化 编号 销售利润率h 营业利润率m 2利润增长率 x 3 7 是否给予贷款 l 纠1 - - 0 3 2【z 】2 = o 2 2【x 3 7 = o 9 7y - - 1 2 纠1 - - 0 1 22 = 0 0 2 z 1 3 7 = o 2 5 y = l l o o 1 - - 0 5 1纠2 = 0 4 6【x 3 7 = 0y = - i 表中= 1 表示该企业属于正类,即给予贷款的企业;表中可= - 1 表示该 企业属于负类,即不给予贷款的企业。 在这里第1 个预贷款企业的数据是z 1 = ( k 1 】1 ,【x 1 2 ,【z 1 】3 7 ) t = ( 0 3 2 ,0 2 2 ,0 9 7 ) t , y l = 1 ;第2 个预贷款企业的数据是x 2 = ( i x 2 , ,p 2 】2 ,k 2 】3 7 ) t = ( o 1 2 ,0 0 2 ,0 2 5 ) t , y 2 = 1 ;第1 0 0 个预贷款企业的数据是5 1 0 0 = ( 【z 1 0 0 】1 ,【x l o o 2 x 1 0 0 1 3 7 ) t = ( o 5 1 ,0 4 6 ,o ) r ,y 1 0 0 = 一1 ;这些数据可以综合为t = ( z 1 ,妙1 ) ,( x 2 ,沈) ,( x 1 0 0 ,秒1 0 0 ) ) 。 现在的问题是,对新来的一个企业,已经知道它的销售利润率1 ,营业 利润率m 2 ,利润增长率 x 3 7 试推断是否应该给予贷款,即求对应的y 是1 还 是一1 。 为了求解上述问题,本文采取支持向量机方法进行建模分析。 1 4 城市商业银行授信分类鉴审分析评价系统研究 4 2模式识别模型建立流程图 从模式识别模型建立流程图中可知为了建立c - s v m 模型,首先要对银行调 查得到预贷款企业的财务报表中的属性进行数据预处理从而得到训练集t :其次 确定核函数类型;再次确定参数( 结构参数c 和核参数盯) ;最后将训练集t 、核函 数和参数带入c - s v m 模型得到模型识别函数白= s 夕托( ,扛) ) ) 。 模式识别模型建立流程图 1 5 城市商业银行授信分类鉴审分析评价系统研究 4 3 数据预处理及训练集的构造 由于财务报表中的数据可能不完整、含噪声或不致,冈此有必要对财务 报表中的数据进行预处理。 ( 1 ) 处理数据的缺失:用回归得到的在缺失数据点处的回归值来代替,其中回 归技术可以采用现有的成形的方法,例如最d - - 乘法、最小模法、支持向 量回归机法。 ( 2 ) 处理噪声数据:对于噪声数据,针对具体情况我们可以采用现有成形的技 术,例如聚类方法、数据平滑技术、滤波技术、统计分析等。就金融系统 而言通常采用聚类的方法,即每个簇中的数据用其中心值代替并且忽略孤 立点。 将经过数据预处理得到的数据按一定比例构造成训练集和测试集两类。其 中训练集是构造模型所需的集合,测试集是用于判断模型有效性所需的集合。 为了叙述方便我们令经过数据预处理后得到的训练集记为t ,且 t - - - _ 【( 戤,y j ) l i = l ,2 ,f ) c 舻宰 - 1 ,1 ) 4 4核选取 由于目前所用的核函数主要包括多项式核函数、高斯径向基核函 数、s i g m o i d 核函数、傅里叶核函数,其中高斯径向基核函数具有参数少而 且可以逼近任意一个连续可微的函数的特点,所以通常均取此函数作为模型核 函数。不违背该惯例本文均采用高斯径向基核函数。 4 5参数确定 在c - s v m 模型中结构参数c 的选取对模型优劣的影响很大。通常c 被默认 为1 ,但c 具有如下特性:当c 较大时,说明在结构风险中更重视经验风险尽量 小;否则较偏重v c 置信尽量小。而对于城市商业银行授信分类鉴审分析评价系 统来说,我们可以通过预先知道采集数据的可靠性程度给出c 的适当的取值范 围。例如若数据准确可将c 尽量取大,不妨在【1 ,+ o 。) 中选取:否则在( o ,1 ) 中选 取。 1 6 城市商业银行授信分类鉴审分析评价系统研究 核参数盯选取的好坏直接影响模型泛化程度的优劣。具体的说,口具有如 下性质:当仃越大时,模型的泛化能力越强:反之泛化能力减弱。通常以1 为分 界点,即希望泛化能力强时取盯1 1 ,+ o 。) 。 4 6代入c - s v m 得出结论 将( 现,协) t ,k ( x i ,) = e x p ( 一业竺j ! 业) ,c 【1 2 ,+ ) ,口【1 ,+ o o ) 带入 1 1 1 一f 式( 2 1 5 ) 中。 具体算法如下: 第一步:给出训练集t 、参数c 【1 ,+ ) 和盯 1 ,+ ) 、k ( z ,) :e x p ( 一监二竖) 第二彬:求解最优化问题求得最优解: 哩n 岛y t y ;a t a j k ( 甄巧) 一:- a t s t o t i 0 ,i 1 f ) 名1y i a i = 0 求得最优解a = ( q :q ;,q ;) 第三步:计算 选择口的一个正分量噶,并计算 第四步:由此求得模式识别模型决策函数 4 7 模型修正 i ( x ) = s g n ( w 汀z + r + ) 通过现有的模型修正方法,例如网格法来选取参数使模型的准确率提高。 即重复取c 【1 ,+ 。o ) ,盯【1 ,+ ) 来调节模型从而提高准确率。 1 7 z 玑 口 。僦 i u 巧 甄 统 ;谢 一 骄 = r 城市商业银行授信分类鉴审分析评价系统研究 4 8 给出最佳模型 对4 6 中选取的最佳的c 和盯带入4 5 中得到的模式识别模型中得到最佳模型。 值得注意的是通过模型求解可以得到最优解q ,q 的分量中满足大于零的对应 的数据点被称为是支持向量。这说明对模型真j 下起作用的并不是所有数据点, 而是这些支持向量点构成的集合。因此可以通过此信息寻找财务报表中的重要 数据。 1 8 城市商业银行授信分类鉴审分析评价系统研究 5 属性( 财务指标) 分析 5 1 基于信用风险角度对属性( 财务指标) 进行预处理 商业银行对企业客户信用风险的测度,可以转化为对企业财务状况1 8 的衡 量问题。因为信用风险的形成即企业是否能如期还本付息主要取决于企业财务 状况。影响企业财务状况的因素很多,不能仪根据某一项指标,而应根据影响 企业财务状况的多维指标来评估企业的财务状况。信用分析,就是金融机构通 过对企业有关财务和非财务因素分析并按客户偿债能力定级,作为贷款决策的 依据,在保障金融机构贷款安全的前提下,在赚取最大利润的同时,尽可能避 免信用风险的发生,从而达到金融机构与企业”双赢”的目的。 企业在市场竞争中成功与否的主要标志是企业的现金净流量,企业现金净 流量综合企业风险决定了企业的价值。因此,财务分析就是企业价值判断的核 心。 本文从信用风险角度选取以下重要属性( 财务指标) 。 ( 一) 、企业盈利能力分析 企业盈利能力是决定企业价值的一个重要的因素。在很多情况下,盈利能 力还体现着风险。盈利能力可用绝对数和相对数表示。盈利能力的绝对数是某 种盈利能力指标的绝对金额,如利润总额等。盈利能力的相对数是某种盈利额 与相关基数之比,如毛利率、资产盈利率、净资产盈利率等。在计算企业价值 绝对值大小时,多用绝对盈利指标:在比较企业盈利水平高低时,多用相对盈 利能力指标,因为可以消除企业规模大小、占用资源多少的影响。由于企业绝 对盈利量的多少已在企业财务报表中得到充分的揭示,不需要作进一步的分 析。因此,所谓企业盈利能力分析,主要就是对企业盈利能力相对数的分析。 企业盈利能力指标依据分子分母的不同,可分为收入盈利率、资产盈利率和净 资产盈利率。 ( 1 ) 企业收入盈利能力分析 销售利润率1 反映收入与盈利之间的关系,我国财政部等部委颁布的国有资本金效绩评 价指标体系就将该指标作为基本财务效益状况指标的修订指标,其计算公式: 销售利润率= 营业利润销售( 营业) 收入xi 0 0 销售净利润率m 4 1 9 城市商业银行授信分类鉴审分析评价系统研究 其计算公式:销售净利率= 净利润总额销售( 营业) 收入x1 0 0 毛币u 率【z 】1 1 在上述销售收入盈利率指标中的盈利均是扣除期间费用后的盈利。期间费 用的高低与销售收入的多少并不成正比,它只是为企业经营和营销提供一个基 础,当然这一基础会间接影响到销售收入。一般而言,期间费用越高,经营风 险就越大。主营收入利润是企业最基本的盈利,只有在该利润足够大时,才可 能形成最终的企业利润。揭示主营收入毛利率,既可以反映企业经营活动的最 基本的盈利能力,又可以从一个侧面反映企业经营风险的大小。该指标是一个 十分有用的指标。其计算公式如下: 毛利率= 产品销售利润销售( 营业) 收入 将该指标与销售利润率指标相比,可以从一个侧面反映企业经营风险的大 小。一般而言,两指标之差越大,经营风险也越大。 ( 2 ) 企业资产盈利能力分析 资产盈利率是企业一定时期内的盈利额与资产平均余额之比,反映的是企 业投资于盈利产出的状况。它可以分为总资产盈利率和各种具体资产盈利率两 大类指标。 总资产报酬率旧8 = 盈利总资产平均余额 指标变形:总资产报酬率= ( 利润总额+ 利息费用) 总资产平均余额 该指标本身看不出其盈利率的高低,判断它的高低必须有一定的参照物主要包 括:社会平均资产息税前收益利率,以及社会同风险和不同企业的资产息税前 收益盈利率。当企业的该指标大于社会平均、行业平均、同风险的该指标时, 一般认为其获利能力强。该指标值越大,获利能力越强。它是不受筹资活动影 响的企业真实盈利能力的反映。我国财政部等部i - j $ i j 定的国有资本金效绩评价 指标体系中的总资产报酬率就是使用该指标,且将它作为评价财务效益状况的 重要指标,仅次于净资产盈利率。总之,总资产盈利率是扣除筹资活动影响的 盈利指标,反映的是企业的真实盈利能力,是企业资产经营效率的表现。因 此,它是财务报表分析中最重要的分析指标之一。它不仪可作为企业判断负债 筹资的最高资金成本标准,而且对投资者和债权人而言,了解该比率也十分有 用,该比率越高,股东所持股票的每股收益就越大,债权人的债权就能够获得 越有利的保障。 净资产盈利率m 7 2 0 城市商业银行授信分类鉴审分析评价系统研究 全部净资产盈利率,简称净资产盈利率。它是企业税后利润与全部净资产 平均余额之比。该比率体现了由企业投资者拥有的权益获取净收益的能力,反 映的是投入资本及其积累与报酬的关系,是评价企业资本经营效率的核心指 标。其计算公式如下: 净资产盈利率= 净利润净资产平均余额 净资产盈利率是最具有综合性和代表性的指标。由于在市场经济条件下, 利润具有平均化的趋势,因此,该指标不受行业不同的限制,通用性强,适用 范围广。一般认为,净资产盈利率越高,资本运营效益越高,投资者和债权人 的利益受保障的程度也就越高。在我国国有资本金效绩评价指标体系中,净资 产盈利率的权重也大大高于其他指标处于核心地位。 ( 二) 、企业负债风险水平分析 9 1 企业负债风险水平是除企业盈利能力之外决定企业价值的另一个因素。企 业总是在不同的风险环境条件下生存和发展的,经营企业就离不开风险。风险 对企业价值的影响是通过风险对企业盈利能力的影响和对折现率的影响两方面 起作用的。风险对企业盈利能力的影响,是指由于风险的存在使企业盈利能力 具有的可变性,风险越大,这种可变性就越大。同一盈利能力,风险越大,价 值越低;反之,风险越小,价值越高。风险对折现率的影响,是指由于风险的 存在,使企业资金供给者( 包括投资者和债权人) 要求的资金回报率具有的可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论