Logistic回归模型在上市公司财务预警中的应用.doc_第1页
Logistic回归模型在上市公司财务预警中的应用.doc_第2页
Logistic回归模型在上市公司财务预警中的应用.doc_第3页
Logistic回归模型在上市公司财务预警中的应用.doc_第4页
Logistic回归模型在上市公司财务预警中的应用.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Logistic回归模型在上市公司财务预警中的应用 龙 松 向丽苹(华中科技大学武昌分校,湖北,武汉,430064)摘要:该文以我国A股市场上因“财务状况异常”而被特别处理的制造类上市公司为研究对象,首先利用非参数检验方法对财务危机公司和非财务危机公司的27个财务指标的显著性差异进行了检验,其次利用单变量逻辑回归分析进一步筛选出对模型预测有显著贡献的9个财务指标,然后又利用因子分析方法再次精简变量并避免多重共线性的影响,最终选择3个因子变量作为Logistic模型的自变量,构建了我国制造类上市公司财务危机发生前三年的预警模型,并对所建模型的有效性进行了检验。关键词:Logistic回归 ;财务预警 中图分类号:O212.4 文献标识码:A 文章编号:一、国内外有关研究及其评价自20世纪60年代以来,就有许多学者对财务危机预警问题进行深入的探索,提出了许多财务危机预警模型。这些模型按构建方法的不同可以分为统计类预警模型和非统计类预警模型两大类。统计类财务危机预警模型主要包括一元判别模型、多元线性判别模型、多元逻辑回归模型、多元概率比回归模型、生存分析法等。财务危机预警的非统计方法包括递归划分算法、人工智能、神经网络等,其中较有代表性的是神经网络分析方法。企业财务风险的实证研究在我国才刚刚起步,尽管资本市场的结构特征与成熟程度不同,国内学者也做出了可贵的探索。1986年,吴世农、卢贤义作者简介: 龙 松(1978-),男,汉,湖北武汉人,讲师,概率统计硕士,主要从事概率统计研究向丽苹(1979-),女,汉,湖北武汉人,中级会计师,会计硕士,主要从事会计实务研究1吴世农、卢贤义.我国上市公司财务困境的预测模型研究J,.经济研究,2001年第6期.曾介绍企业的破产分析指标和预测模型,引领了我国在这领域的研究。总的说来,国内外学者对财务危机预警模型大致可以分为:单变量判定模型、多变量判定模型、多元逻辑回归模型。以上三种模型也代表了财务预警研究方法不断发展和完善的阶段性过程;他们的共同点是都运用了会计数据和财务比率,而从各自的前提假设、适用范围上看,三种模型又各有特点。通过比较分析可以看出,采用多元逻辑回归模型的效果相对于其它两种模型更具科学性。第一,Logistic回归对于变量的分布没有具体要求,适用的范围更加广泛第二,具体公司数据带入模型之后得到的是一个概率值,在实际使用中简单方便。因此,本文将采用Logistic回归模型进行财务危机预警的实证分析。二、研究设计和财务指标的舍取通过对我国上市公司财务危机状况的分析,并结合我国的实际情况,本文将研究对象界定为A股市场上因“财务状况异常”而被特别处理(ST)的制造类上市公司和非ST类制造业上市公司,并由此界定如下标准来选取样本公司:1. 行业选择:因为不同行业由于其生产特点及生产周期的不同,财务指标一般具有较大差异,如果不进行行业的划分,会降低预警模型的实用性,另外,考虑到样本的容量,本文选择制造类行业的上市公司作为研究样本。2. 财务危机公司(ST公司):该上市公司在t年由于“财务状况异常”而被特别处理,且可以获得t-3年的财务报表数据。3. 正常公司(非ST公司):在为每一家ST公司选择相应的非ST公司时,要求其行业严格相等或近似相等(从其行业代码加以严格判断),并确保财务数据来源于同一会计年度;公司在t-3年12月31日前上市,至今未被特别处理,并且可以获得t-3的财务报表数据。4. 组内分布控制:由于研究的样本来源于3个会计年度,可能会产生资料的时间性差异。为了控制和减少外部经济因素可能带来的模型偏差,本文尽量使进入样本的个体在各年的分布大致平均。5. 组间数量分布:从沪、深两市选取ST公司32家和非ST公司32家,样本总量达到64家, 为了进行预警分析,将上述家公司分成建模样本和检验样本两个子样本。其中建模样本包括32家ST公司和与之相应的32家正常公司,其作用是确定预警模型,而检验样本包括24家ST公司和24家正常公司,主要用来评估预警模型的预警能力。本文广泛考察了在以往的国外和国内相关研究杨瑞敏.用因子分析法改进的一种健康保险模型J,统计与信息论坛,2005年第9期.中对最终预测模型有显著贡献的预测变量,参考了在实证研究中目前广泛采用的财务变量,并结合上述指标选取原则和我国上市公司的实际情况,初步确定了27个财务指标。这些指标不仅包括传统的财务指标,还包括现金流量指标。三、模型的建立和检验1.财务指标的差异显著性检验目前,对样本数据的均值差异性检验一般采用参数检验法中的检验法。但是该检验法运用的前提是样本数据服从正态分布,然而本文所采用数据是否服从正态分布还不太明确,所以笔者不采用参数检验法而采用非参数检验法进行财务指标的差异显著性检验。非参数检验是指在总体不知是否服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体的一类检验方法。这类方法一般不涉及总体参数,其假定前提比参数检验方法少得多,相对来讲更容易满足。非参数检验方法较多,本文采用两独立样本的Mann-Whitney U检验 余建英 何旭宏编著.数据统计分析与SPSS应用M,北京,人民邮电出版社,2003年:325-327.。两独立样本的Mann-Whitney U检验的零假设为样本来自的两独立总体的均值没用显著差异。其检验主要通过对平均秩的研究来实现推断,秩简单来说就是名次,首先将两组样本数据和混合并按升序排列,求出每个数据各自的秩;然后对和的秩求平均,得到两个平均秩。如果这两个平均秩相差很大,则零假设不一定成立。Mann-Whitney U检验还计算每个秩优于每个秩的个数,以及每个秩优于每个秩的个数,并对和进行比较。如果两者相差很大,则零假设不一定成立。SPSS将自动计算Wilcoxon W统计量和Mann-Whiteny U统计量,其中:当mn时,;当m=n时,Wilcoxon W等于第一个观察值所属样本组的W值。Mann-Whitney U统计量的计算公式如下:,其中W为Wilcoxon W统计量,n为W对应组的样本容量。SPSS将计算出U值,然后依据Mann-Whitney分布表给出相应的相伴概率值。同时还计算近似服从正态分布的Z统计量:。当样本个数小于30时,应以U统计量的相伴概率值作为判断标准,大于等于30时,应以Z统计量的相伴概率值作为判断标准。如果相伴概率小于或等于用户的显著性水平,则应拒绝,认为两个样本来自的总体均值有显著差异,否则,认为无显著差异。对建模样本的32家ST公司和32家正常公司的t-3年的财务指标进行Mann-Whitney U检验,其操作是首先选取SPSS界面中的“Analyze”菜单,然后选择下级菜单“Nonparametric Tests”中的“Independent Samples”命令,接着按照对话框和提示操作,最后其检验结果如下:表1:Mann-Whitney U检验Mann-Whitney UWilcoxon WZAsymp. Sig.每股收益x151579-6.18998880.00000000每股收益增长率x2263791-3.34339960.00082759每股负债比x3446974-0.88619220.37551399流动比率x4253781-3.47767270.00050579速动比率x5247775-3.55819580.00037341现金流动负债比x6389917-1.65153990.09862837股东权益比x7300828-2.84655660.00441949流动负债率x8380908-1.77482390.07592696负债权益比x9427955-1.14130810.25374174存货周转率x10253781-3.47763290.00050586应收账款周转率x11345873-2.24233470.02493975主营成本比率x12358886-2.06778170.03866056总资产周转率x13150678-4.86062970.00000117经营净利率x14126654-5.18288140.00000022经营毛利率x15352880-2.14834460.03168639资产净利率x1675603-5.86766620.00000000净资产收益率x17108636-5.42519120.00000006净资产收益率增长率x18194722-4.26988380.00001956税前利润增长率x19284812-3.06142610.00220285主营收入增长率x20259787-3.39710880.00068102净利润增长率x21248776-3.54480920.00039290总资产增长率x22251779-3.50452730.00045742股东权益增长率x23197725-4.22960190.00002341主营利润增长率x24289817-2.99428960.00275085资产负债比x25308836-2.58465540.00974764长期负债资产比x26459894-0.07226240.94239306主营收入现金含量x27332860-2.25469940.02415220从表1可以看出,若以=0.01为显著性水平来看的话,变量x3、x6、x8、x9、x11、x12、x15、x26、x27 的相伴概率Asymp. Sig.均大于,也就是说它们的数据在ST公司和非ST公司之间没有显著的区别,不能用来判断其区别,也就是要被排除在模型之外。这样模型剩下x1、x2、x4、x5、x7、x10、x13、x14、x16、x17、x18、x19、x20、x21、x22、x23、x24一共18个变量。以下将进一步进行筛选。2.单变量Logistic回归分析 Logistic回归分析不仅可以用来建立预测模型,也可以利用它检查每个自变量(上文初次筛选出的财务指标)和因变量的二元关系,通过拟合单变量回归模型来识别哪些财务指标可以很好的预测因变量,从而提高模型的拟合优度。这里应用Wald统计量,进行单变量Logistic回归检验。Wald统计量用于判断一个变量是否包含在模型中。当假设为真时,Wald统计量服从自由度等于参数个数的渐进分布。于是,这个统计量的值就可以用来判断相应的模型自变量是否显著。即在给定的显著性水平下(如),若统计量Wald的实际值超过了的临界值,即落入拒绝域,便拒绝原假设,认为该自变量的作用显著。在用Logistic单变量回归进行初选变量时,把显著性水平设为,如果一个自变量在单变量回归的检验中相伴概率p0.01(或者统计量的实际值大于),就考虑将该变量保留并加入到多元Logistic回归模型中。我们分别对t-3年初次筛选出的显著性财务指标进行模型拟合优度检验。其操作大致如下:首先选择“Analyze”菜单下“Regression”菜单中的“Binary Logistic”命令;然后按照出现的对话框选择拟和优度Wald检验,最后得检验结果如下表:表2:财务指标的拟和优度Wald检验财务指标Wald自由度P值每股收益x123.4127610.000001每股收益增长率x28.52497810.003503流动比率x43.337110.067734速动比率x52.50949310.113162股东权益比x76.59543510.010224存货周转率x100.43659710.508770总资产周转率x1324.1594510.000001经营净利率x1411.1641210.000834资产净利率x1620.3399510.000006净资产收益率x174.67540510.030597净资产收益率增长率x187.6009310.005834税前利润增长率x198.2726610.004025主营收入增长率x201.96700110.160767净利润增长率x218.7683210.003065总资产增长率x222.5702510.108890股东权益增长率x235.47475610.019293主营利润增长率x242.20216610.137817资产负债比x256.28335510.012188从以上可以看出,只有以下变量的相伴概率P值小于检验标准0.01,根据判别准则,我们选择如下指标:x1、x2、x7、x13、x14、x16、x18、x19、x21。下面将基于这些变量进行进一步的因子分析。3.因子分析宇传华:SPSS与统计分析,电子工业出版社,2007年。通过以上的非参数检验和单变量回归分析,己经筛选出了既有显著性差异又有利于提高模型预测精度的9个财务指标。虽然进行了精简,但是这些财务指标用来建立模型还是显得复杂和繁琐,而且它们之间可能存在较强的相关关系。因此,有必要对这些财务指标进行进一步的简化,用少数几个因子来描述许多指标或因素之间的联系,这就是因子分析法。因子分析法的特点为:(1)因子变量的数量远少于原有的指标变量的数量,对因子变量进行分析能够减少分析中的计算工作量。(2)因子变量不是对原有的变量的取舍,而是根据原始变量的信息进行重新的组建,它能够反映原有变量的大部分信息。(3)因子变量之间不存在线性相关关系,对变量的分析比较方便。(4)因子变量具有命名解释性,即该变量是对原始数据的综合和反映。本文基于t-3年的数据采用因子分析方法对二次筛选出的财务指标进行再次精简。因子分析大致有如下步骤:(1)确定待分析的原有若干变量是否适合因子分析;(2)利用构造的因子变量进行旋转,使得因子变量更具可解释性;(3)计算因子变量的得分。操作过程大致如下:首先在“Analyze”菜单“Data Reduction”中选择Factor命令,然后在弹出的对话框中选择相应的选项,确定后得到如下结果:表3:KMO and Bartletts 检验Kaiser-Meyer-Olkin Measure of Sampling Adequacy.(KMO)0.781Bartletts Test of SphericityApprox. Chi-Square892.507Sig.0.000该表给出了KMO检验和Bartlett球度检验结果。其中KMO值为0.781,根据统计学家Kaiser给出的标准,KMO取值大于0.6,适合因子分析。另外,Bartlett球度检验给出的相伴概率为0.000,小于显著性水平0.05,因此拒绝Bartlett球度检验的零假设,认为适合于因子分析。表4:因子方差贡献率Initial EigenvaluesComponent(成分)Total(特征值)% of Variance(方差)Cumulative %(累积)15.01603254655.7336949655.7336949621.91405294221.2672549177.0009498730.8513722229.45969136186.4606412340.64417830876181779950.3611863164.01318129297.6313592860.1277792351.41976928299.0511285670.0499393030.55488114399.6060097180.0347934520.38659390699.9926036190.0006656750.007396389100Extraction Method: Principal Component Analysis.(主成分分析)表4给出了因子分析初始解对原有变量总体描述的情况,第二列是因子变量的方差贡献(特征值),它是衡量因子重要程度的指标,其中第一个因子的特征值为5.02,表示第一个因子描述了原有变量总方差9中的5.02,后面的因子描述的方差逐渐减少。第三列是各个因子的方差贡献率,第四列是因子变量的累计方差贡献率,表示前m个因子描述的总方差占原有变量的总方差的比例。由表可以看出,前三个因子的累积贡献率可以达到86.46%,这样我们就可以用前3个因子来进行主成分的因子分析。根据SPSS输出的由回归算法计算出的得分因子回归矩阵,可以得到下面的因子得分函数:根据这个得分函数,就可以将9个变量的信息转化为3个因子的信息,也就是简化成了3个主成分的变量了。下面就以此3个因子进行相应的Logistic回归分析。4.Logistic回归分析在一般回归模型中,因变量为区间(定量)变量,并且理论上要求其服从正态分布等LINE(线性、独立、正态、等方差)假定条件。而logistic回归与之的主要区别在于因变量的类型不同。采用logistic回归,可以预测一个分类变量的每一分类所发生的概率,因变量为分类变量,自变量可以为区间变量,也可以为分类变量,还可以是区间与分类变量的混合。令因变量Y服从二项分布,其二项分类的取值为0或1,Y=1的总体概率为,则m个自变量分别为所对应的logistic回归模型为: 或 以上公式被称为logistic回归预测模型。利用以上的三个因子的得分函数,将原9个变量的值输入得分函数中,就可以得到新的因子变量F1、F2、F3,利用SPSS软件运行,大致操作如下:选择“Analyze”菜单下“Regression”中的“Binary Logistic”命令,根据对话框选择相应的选项,得到如下的结果:表5:回归方程参数表BS.E.WalddfSig.Exp(B)Step 1(a)F1-5.547035.184091.14492110.0046150.003899F2-8.833412.9211179.14447410.0024950.000146F3-6.375482.701345.5701610.0102690.001703Constant1.5461610.9525182.63489510.0105394.69342a. Variable(s) entered on step 1: F1, F2, F3.注:B ,S.E.,Wald,df,Sig.,Exp(B)分别表示变量系数,标准差,Wald得分,自由度,伴随概率,系数对数由表5可以看出,三个变量和常数量的相伴概率都非常小,若以默认的显著水平来判断,都将小于显著性水平,即能够满足要求,因此可以看出,由3个因子变量得到的回归模型拟和效果不错。另外,由表5更能得到logistic预测概率模型,即由该概率模型,若算出概率p0.5,则预测该企业有风险,或者说有即将被特别处理的危险,这样,就可以用此概率模型进行预测和检验了。5.模型的检验和预测利用以上的模型公式,将64个建模样本带入计算,经统计,得如下结果:表6 模型预测值与实际值对照表实际预测01百分比031196.9%142887.5%合计92.2%其中,灵敏度,也称真阳性率,是实际分类为1的个体中,预测结果也为1的概率;特异度,也称真阴性率,是实际分类为0的个体中,预测结果也为0的概率;漏诊率,也称假阴性率,是实际分类为1的个体中,预测结果却为0的概率;误诊率,也称为假阳性率,是实际分类为0的个体中,预测结果却为1的概率;总体预测准确率为预测结果正确的比率。由表6可知:灵敏度=87.5%,特异度=96.9%,漏诊率=12.5%,误诊率=3.1%,总体预测准确率为92.2%,说明整体预测效果很好。为了更好地说明该模型的代表性和准确性,我们另挑选了48家企业进行检验,结果如下:灵敏度=87.5%,特异度=91.67%,漏诊率=12.5%,误诊率=8.33%,总体预测准确率为89.58%,从而再次说明该方法具有一定适用性和推广性。四、全文总结和展望本文对比前人的研究结果,其主要特点如下:第一,研究对象只针对我国A股市场中的制造类上市公司。第二,研究样本新,样本容量比较合理,时间跨度也较长。第三,大多数的财务危机预警研究在筛选模型变量时,都采用参数检验中的独立样本检验,但是它的前提条件是样本必须服从正态分布,而作者通过前人检验的结果发现财务指标总体上不服从正态分布(而且从直观上也不应该服从正态分布),因此采用非参数检验来考察指标差异的显著性。第四、为了进一步精简变量,本文又相继采用了单变量回归分析和因子分析方法,前者用来检验变量是否对模型预测有显著贡献,后者用来提取信息含量较高的因子变量并有效避免多重共线性的影响。研究结果表明,采用以上方法提取的模型变量,可以较好的拟合模型,并达到良好的预测效果。另外,鉴于文章篇幅的局限,本文也没有更多地给出在实际中操作的具体算法以及其它的统计预测方法。参考文献:1吴世农,卢贤义.我国上市公司财务困境的预测模型研究J,.经济研究,2001年第6期。2 Altman, E.L, Haldman, R.C, and Narayanan, P, Zeta Analysis: A New Model to Identify Bankruptcy Risk of CorporationJ, Journal of Banking and Finance, 1997 3 杨瑞敏.用因子分析法改进的一种健康保险模型J,统计与信息论坛2005年第9期4 宇传华.SPSS与统计分析M,电子工业出版社,2007年。5张玲.财务危机预警分析判别模型J,数量经济技术经济研究,2003年。6高培业,张道奎.企业失败判别模型实证研究J,统计研究,2000年第10期7 陈晓,陈治鸿.中国上市公司的财务困境预测J,中国会计与财务研究,2000年第9期。The Practice of Logistic Regression in theEarly-warning of the Listed CompanysFinancial RiskXiang Liping Long Song(Wuhan Penta Chutian laser Equipment Co.Ltd , Wuhan ,430074 ,China)Abstract:On the basis of the reference to a considerable amount of research, this article regards the listed ma

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论