pso-svm模型在财务危机预警中的应用_第1页
pso-svm模型在财务危机预警中的应用_第2页
pso-svm模型在财务危机预警中的应用_第3页
pso-svm模型在财务危机预警中的应用_第4页
pso-svm模型在财务危机预警中的应用_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

pso-svm模型在财务危机预警中的应用

预算危机风险报警是一个重要而广泛的研究主题。它通过实时监控财务形势、分析和挖掘数据来获得有效知识,评估公司是否陷入预算危机,并对公司管理层、投资者、债权人和其他利益相关者做出决策,这对政府和证券监督管理部的管理具有重要的实践意义。为了获得更高的预测精度,人们将统计方法、人工智能专家系统和理论方法应用于预动危机模型的风险预测器。考虑到公司的最终结果是正常或陷入危机这两个状态,公司财务危机的预警类似一个二元决策.例如,Fitzpartrick和Beaver运用单个财务比率将样本划分为破产和非破产两组.在此基础上,后来有很多学者采用统计方法进行了改进,其中线性判别分析、多重回归、逻辑回归等是应用最多的方法.然而,在传统统计方法中,若要求预警变量之间是线性、正态和独立的,则限制了这些方法在实践中的应用.随着新技术的发展,人工智能专家系统技术被应用到预警研究中.在这些方法中,Vapnik提出的采用结构风险最小化原则的支持向量机(SVM)方法已成为人们关注的焦点.然而,在应用SVM进行财务危机预警时,特征集的选择和核函数参数的选择对预测结果有着很大的影响.本文尝试结合粒子算法(PSO)和SVM建立混合模型,对预警指标特征集和SVM参数同时进行优化,从而提高SVM模型的预测准确度.1pso和svm的性能1.1局极值pgdPSO是一种基于迭代的优化工具.系统初始化为一组随机粒子(随机解),通过迭代搜寻最优值.在每一次迭代中,粒子通过跟踪两个“极值”来更新自己.一个是粒子本身所找到的最优解,此解叫做个体极值pid.另一个极值是整个种群目前找到的最优解,此极值是全局极值pgd.在找到这两个最优值时,粒子速度和位置分别为:vid=wvid+c1rand()(pid-xid)+c2rand()(pgd-xid)(1)xid=xid+vid(2)vid=wvid+c1rand()(pid−xid)+c2rand()(pgd−xid)(1)xid=xid+vid(2)式中:rand()为介于(0,1)之间的随机数;c1、c2均为学习因子,通常c1=c2=2;w为惯性权重,用于控制前一次迭代产生的速度对本次迭代速度的影响,一般w∈.在每一维粒子的速度都会被限制在一个最大速度vmax,如果某一维更新后的速度超过用户设定的vmax,那么这一维的速度就被限定为vmax.PSO根据适应值来进行一定的随机搜索,整个搜索更新过程是跟随当前最优解的过程.故在大多数情况下,所有的粒子可能较快地收敛于最优解.1.2最优分类面的构造SVM是基于统计学习理论和结构风险最小化原则的机器学习方法.其基本思想是:把输入空间的样本通过非线性变换映射到高维特征空间,在特征空间中,求样本线性分开的最优分类面.算法使用分类间隔控制线性学习机器的容量,从而使结构风险最小,在有限样本下具有较强的泛化能力.SVM是从线性可分情况下的最优分类面发展而来.设分类面的方程为x·w+b=0,使得对线性可分的样本集(xi,yi)(i=1,2,…,n),x∈Rd,y∈{+1,-1},寻找最优超平面的问题等同于解决约束条件下的二次规划问题,优化条件是两类之间的距离,最后得到最优决策函数:f(x)=sgn(n∑i=1α*iyi(xi⋅x)+b*)(3)f(x)=sgn(∑i=1nα∗iyi(xi⋅x)+b∗)(3)对于非线性问题,只需要将输入向量非线性映射到一个更高维的特征空间,然后再构造最优分类超平面.这个分类超平面可定义为f(x)=sgn(n∑i=1α*iyiΚ(xi,x)+b*)(4)f(x)=sgn(∑i=1nα∗iyiK(xi,x)+b∗)(4)式中:K(xi,x)为核函数;f(x)的符号决定x的类属.构造最优超平面等同于寻找所有非零的αi,对应于一个非零αi的任何数据点xi就是这个最优超平面的支持向量.2pso特征集及核函数参数的优化由于特征集的选择、核函数参数对SVM模型预测性能有重要影响,本文采用PSO对特征集的选择和核函数参数同时进行优化,得到接近最优的特征集和核函数参数,提高SVM模型的预测能力.2.1特征集的编码优化特征集的选择有filter和wrapper方式.它们的区别在于特征集的选择是否独立于学习算法,如果独立,则为filter方式;反之,则为wrapper方式.在filter方式中,先进行特征集的选择,然后进行分类.同wrapper方式相比,filter方式计算效率更高.wrapper方式通过输入一个给定的特征集训练分类系统,采用一个检验集估计分类的准确性.尽管它是一个更加缓慢的过程,但选择的特征集对于分类而言通常是最优的.在财务危机预警研究中,特征集的选择对于提高预测的准确度是非常重要的.而且,当特征数量很大时,特征集的选择显得尤为重要.本文将采用wrapper方式、利用PSO优化算法选择SVM模型的最优特征集.以二进制字符串方式对特征集进行编码,代表原始特征集的一些子集.字符串中的每个bit代表对应的特征是否被选择,1代表对应的特征被选择,0则代表未被选择.图1所示为特征集的编码方式.由于采用PSO不能直接对以上编码进行优化,故在使用PSO进行优化前,将以上二进制编码转化为对应的整数,再利用PSO对该整数进行寻优.2.2svm模型的参数优化SVM最大的一个问题就是如何选择恰当的核函数参数值,使得模型具有最佳的分类性能.然而,事先并不知道针对某一问题参数取何值为最佳.因此,对核函数参数的优化是提高基于SVM的财务危机预警模型预测准确度的关键因素.本文采用RBF函数作为SVM预警模型的核函数.由于涉及到的参数对SVM模型的性能起着至关重要的影响,故采用PSO对这2个参数进行优化.2.3pso-svm模型粒子的位置为{V1,V2,V3},V1为核函数的参数C,V2为核函数的参数δ2,V3为特征集,适应度函数如式(5)所示.特征集和核函数参数通过SVM进行评价,该过程不断重复直到满足终止条件(本文采用达到最大迭代次数为算法终止条件).PSO-SVM模型的数据集分为两部分:一部分训练SVM模型;另一部分则用于检验模型,得到粒子的适应值:Fitness=Vsize∑i=1Μi/Vsize(5)式中:Vsize为检验集的大小;Mi为预测结果和实际结果的匹配情况.当预测结果和实际结果一样时,Mi为1;反之,则为0.可以说,Fitness就是SVM模型的平均分类准确度.3确认研究3.1样本选取和数据来源中国证监会于1998年3月16日颁布了《关于上市公司状况异常期间的股票特别处理方式的通知》,要求证券交易所应对“状况异常”的上市公司实行股票的特别处理(ST).证券市场上被ST的股票大多是由于“连续2年亏损或每股净资产低于股票面值(1元)”,即财务指标恶化是上市公司被特别处理的主要原因.故国内研究一般把被ST的股票作为上市公司陷入财务危机的标准,本文也将ST公司视为财务危机公司,非ST公司视为正常公司.由于获取资料的局限性,本文的样本数据来自上市公司.将2000~2005年表现正常、2006年首次被ST的公司作为失败组,公司状况用“1”表示.这样的选择方式可以避免将包装上市的公司选入失败组,从而影响模型判定的准确率.由于行业、企业规模等因素对企业的财务指标影响较大,为了控制这些干扰因素,本文按相同行业、相同规模配对抽样挑选出2000~2006年内都表现正常的公司作为正常组,公司状况用“0”表示.通过对这些样本公司t-1年、t-2年、t-3年、t-4年(t为开始陷入财务危机的年度,本文指2006年)基本财务数据所计算得到的59个指标进行长时间的分布观察,发现t-2年开始,有多个指标出现差异扩大趋势.因此,本文决定采用t-2年、t-2年中期、t-1年、t-1年中期的数据作为立体样本集合,以期真实反映财务数据的持续性变化和累积效果.删除数据不全的公司,最后,入选样本共268家(其中财务危机企业134家,配比公司134家).所有基础数据均来自万德资讯(WIND).3.2基本特征选取结果结合国内外的研究成果,本文初步选择了财务结构、偿债能力、成长能力、经营能力、盈利能力、现金流量、其他等7个方面共59个指标,以便对公司的情况进行全面、综合和系统地描述.通过多种方法对这59个指标进行了挑选,结果如表1所示.表中:“*”表示被选中;59FS代表所有指标组成的特征集;7FS代表通过MDA逐步法从特征集挑选出7个指标组成的特征子集;8FS代表通过LR逐步法从特征集挑选出8个指标组成的特征子集;38FS代表通过独立样本t检验方法从特征集挑选出38个指标组成的特征子集;“PSO-SVM”表示通过本文提出的模型,从特征集挑选25个指标组成的特征子集.3.3特征集对svm模型预测性能的影响将数据集按1∶1比例分为训练集和检验集,对SVM模型采用不同参数、不同特征集进行分类预测.图3(a)所示为对于不同的特征集,核函数参数C=5时,δ2对SVM模型预测性能的影响.图3(b)所示为对于不同的特征集,核函数参数δ2=30时,C对SVM模型预测性能的影响.由图3可见,SVM模型的预测性能不仅与特征集的选择有关,还与核函数的2个参数有关.因此,对特征集和核函数的参数同时进行优化,将提高模型的预测准确度.3.4pso-svm模型预测结果本文采用种群规模为80,最大迭代次数为1000,通过PSO-SVM模型对特征集和核函数参数进行同时优化,模型预测准确度和迭代次数的关系如图4所示.实证结果表明,PSO-SVM模型对核函数参数的优化结果为:C=90.52、δ2=12.93,特征集的优化结果见表1,模型的最优预测准确度为90.30%.从SVM模型采用不同参数、不同特征集得到的预测准确度中挑选最佳的预测结果,结合PSO-SVM模型的预测结果,预测准确度如表2所示.由表可见,本文提出的PSO-SVM模型由于通过PSO算法自动优化选择特征子集和核函数,在得到接近最优特征子集和核函数的同时,PSO-SVM模型也得到最

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论