




已阅读5页,还剩18页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于因子分析的LOGISTIC违约概率模型的实证研究作者葛钊本文针对一般商业银行等单位采用LOGISTIC回归估计PD的模型中多重共线性、没有考虑时间因素等问题,构建和验证了基于因子分析的LOGISTIC违约概率测算模型的效果和可行性,并对财务指标进行了时间加权化处理的模型改进工作,在最后对模型的进一步优化提出了新的思考和方向。本文样本数据获取渠道为中国证券市场公开信息,选取6家在20052006年和2010年发生过银行贷款违约的制造业上市公司(违约笔数8笔),和31家同行业同期贷款未发生违约且非ST类的上市公司,并且总资产与销售规模与违约公司相似(考虑到建模样本数量过少,加入此约定为提高模型精度),组成39个建模数据,进行模型构造。其中,财务数据均取自违约/非违约公司对应违约年份前一年末或前二年末的数据,此是模型具有预测功能的必要条件。6家违约上市公司8条违约记录(其中3条违约记录来自同一公司)如下序号股票代码最新公司全称证监会行业门类名称证监会行业次类名称报表日期报表类型信息来源贷款类型1000413石家庄宝石电子玻璃股份有限公司制造业电子20051231Q4定期报告短期流贷2000498丹东化学纤维股份有限公司制造业石油、化学、塑胶、塑料20061231Q4定期报告短期流贷3000506中润资源投资股份有限公司制造业造纸、印刷20050630Q2定期报告短期流贷4000557广夏银川实业股份有限公司制造业医药、生物制品20061231Q4定期报告短期流贷5600196上海复星医药集团股份有限公司制造业医药、生物制品20061231Q4定期报告短期流贷6600608上海宽频科技股份有限公司制造业电子20051231Q4定期报告短期流贷7600608上海宽频科技股份有限公司制造业电子20061231Q4定期报告短期流贷8600608上海宽频科技股份有限公司制造业电子20100630Q2定期报告短期流贷6家上市公司发生逾期的贷款类型均为短期流贷,全部归属于公司风险暴露中一般公司风险暴露。另外,之所以将上海宽频科技股份有限公司的三次逾期数据全部纳入建模,是由于一方面可供建模的违约数据过少,将其加入不影响模型的建立和使用,另一方面数据量的增加增强了模型的预测能力。31家非违约上市公司信息如下(合并报表数据)股票代码最新公司全称证监会行业门类名称证监会行业次类名称截止日期基本每股收益元/股营业收入元资产总计元000590紫光古汉集团股份有限公司制造业医药、生物制品20061231003287312308562057554000593四川大通燃气开发股份有限公司批发和零售贸易批发和零售贸易20061231004262961854643441371000606青海明胶股份有限公司制造业医药、生物制品20061231012180495301641844773000619芜湖海螺型材科技股份有限公司制造业石油、化学、塑胶、塑料20061231039397E092589E09000755山西三维集团股份有限公司制造业石油、化学、塑胶、塑料20061231045211E093454E09000788北大国际医院集团西南合成制药股份有限公司制造业医药、生物制品20061231006501365634737943749000790成都华神集团股份有限公司制造业医药、生物制品20061231004225243387703082775000792青海盐湖工业股份有限公司制造业石油、化学、塑胶、塑料200612311062596E095727E09000812陕西金叶科教集团股份有限公司制造业造纸、印刷20061231037313953982957758784000830鲁西化工集团股份有限公司制造业石油、化学、塑胶、塑料200612310164009E094572E09000909数源科技股份有限公司制造业电子200612310019631126391778E09000912四川泸天化股份有限公司制造业石油、化学、塑胶、塑料200612310774799E095101E09000936江苏华西村股份有限公司制造业石油、化学、塑胶、塑料200612310152896E092677E09002004重庆华邦制药股份有限公司制造业医药、生物制品20061231049287872529781297226002007华兰生物工程股份有限公司制造业医药、生物制品20061231036354994023816570602002019浙江杭州鑫富药业股份有限公司制造业医药、生物制品20061231005347989819592378458002022上海科华生物工程股份有限公司制造业医药、生物制品20061231053340326970485513935002025贵州航天电器股份有限公司制造业电子2006123108322784915640281027002045国光电器股份有限公司制造业电子200612310268563370691134E09002079苏州固锝电子股份有限公司制造业电子20061231031435408883530697505002117东港股份有限公司制造业造纸、印刷20061231064415751481499356585600206有研半导体材料股份有限公司制造业电子200612310114990345191071E09600237安徽铜峰电子股份有限公司制造业电子20061231004509950109149E09600356牡丹江恒丰纸业股份有限公司制造业造纸、印刷200612310297580133271571E09600360吉林华微电子股份有限公司制造业电子200612310519067950551909E09600433广东冠豪高新技术股份有限公司制造业造纸、印刷20061231008592813086862208294600589广东榕泰实业股份有限公司制造业石油、化学、塑胶、塑料20061231037973090351599E09600666西南药业股份有限公司制造业医药、生物制品20061231008456151830846948311600793宜宾纸业股份有限公司制造业造纸、印刷20061231062535064636951950250600796浙江钱江生物化学股份有限公司制造业石油、化学、塑胶、塑料20061231011430045963926870562600836上海界龙实业集团股份有限公司制造业造纸、印刷20061231015048220341332E09其中四川大通燃气开发股份有限公司在2006年由医药、生物制品类转为批发和零售贸易类;浙江钱江生物化学股份有限公司在2006年由医药、生物制品转为石油、化学、塑胶、塑料类。特此说明。以下对从网络公开信息获取的数据,进行数据手机、业务定义、数据清洗、模型分组、模型分析、变量构造、变量分析和变量选择等步骤。选取如下14个财务指标,作为建模数据估计模型参数。选取数据的原则主要是从数据的易获得性、完整性考虑的,同时为了免去单因素初步筛选等较为简单的过程,直接按现有资料综合选取了显著性较高的财务指标。所选指标全部是以百分比度量的财务比率,这样的好处是将企业规模等因素在模型系统中的影响最小化,提高模型的预测精度。提取指标列表指标类型标号指标含义与计算公式备注VAR9净利润/总资产总资产报酬率/总资产净利率VAR17净利润/报告期末股本每股收益摊薄盈利能力VAR10主营收入主营成本/主营收入主营业务利润率VAR16销售收入总额/平均资产总额总资产周转率营运能力VAR15销售收入总额/平均流动资产流动资产周转率流动性与偿债能力VAR8负债总额/总资产资产负债率VAR12总资产现金回收率经营现金净额/平均总资产总资产现金回收率VAR11经营活动现金流量净额/销售收入销售现金比率VAR5流动资产存货/流动负债速动比VAR4流动资产/流动负债流动比VAR7利息保障倍数EBIT/利息利息保障倍数VAR6营运资金/总资产VAR14本年总资产增长额/年初资产总额总资产增长率经营发展能力/成长能力VAR13本年主营业务收入增长额/年初主营业务收入主营业务收入增长率对于违约上市公司,做因子分析和LOGISTIC回归时采用违约当年和前一年经时间加权计算的财务数据,对于非违约上市公司,由于违约公司违约发生年份大多集中于2005年和2006年,故对非违约公司财务数据以2005年和2006年为基础做时间加权平均处理。采取此方法的目的主要是由于企业各种指标会随着时间变化而变化,如果仅仅考虑最近一年的指标,可能会由于经济周期或偶然因素造成财务指标失真,最终影响违约概率测算的准确性。为解决这一问题,我采取了基于2年时间加权的方法计算模型的输入变量。公式为11221/211/2其中,T取2,代表2年;XI代表按时间加权平均后的结果;XIT表示指标I第T年的数值。据此可知时间越晚的年份所占权重越大。将违约和非违约公司数据经过时间加权方法进行调整,得到8个违约和31个非违约共计39个样本,用SPSS软件进行因素分析(抽取共同因素时选用主成分分析法)。这里特别指出的是,诸多文献指出在进行此类问题的因素分析时,需先将数据按如下ZSCORE公式进行标准化处理其中,XIJ为第I个样本的第J个指标值,XJ为样本第J个指标的平均值,SJ为样本第J个指标标准差,ZIJ为第I个样本第J个指标值标准后化的得分。进行该标准化的目的主要为了消除各项财务指标由于量纲单位不同或正、逆性指标不同带来的不可比拟性,但经现有数据进行标准化前后的因子分析结果来看,分析所得数据和结论在标准化前后无丝毫不同,故本文未采取先将数据标准化,再进行分析,而是直接将数据进行了因子分析,过程和结论如下KMOANDBARTLETTSTESTKAISERMEYEROLKINMEASUREOFSAMPLINGADEQUACY685APPROXCHISQUARE584771DF91BARTLETTSTESTOFSPHERICITYSIG000从上表看到,KMO值为0685,当其数值越大时,表示变量间的共同因素越多,越适合进行因素分析。一般大于05时,均适合进行因素分析。此外,从BARTLETTS球形检验达显著,代表母群体间有共同因素存在,同样表明适合进行因素分析。选取特征值大于06的抽取共同因素,共抽取6了个共同因素,可以解释的总变异量为91701。另外,可以看到采用最大方差法转轴后每个因素的特征值和方差贡献率都发生了变化,但累计方差贡献率未发生变化,均为91701,而且转轴缩小了各因素方差贡献率之间的差距,使各因素解释原变量的能力更加平衡。详见下表TOTALVARIANCEEXPLAINEDINITIALEIGENVALUESEXTRACTIONSUMSOFSQUAREDLOADINGSROTATIONSUMSOFSQUAREDLOADINGSCOMPONENTTOTALOFVARIANCECUMULATIVETOTALOFVARIANCECUMULATIVETOTALOFVARIANCECUMULATIVE167504821648216675048216482162803200182001822073148076302320731480763023240217155371733175412529755521754125297555222761625853431492165818213292165818213222001571669147571651138724571651138724519551396383110662444569170162444569170112038592917017356254294243829320929633591961401977361018413119904711071505995521203424699798130201439994014008060100000EXTRACTIONMETHODPRINCIPALCOMPONENTANALYSIS以下是陡坡图,可以看到从第6个点后坡度线比较平滑,故可以侧面告诉我们选取6个因素是较为适宜的。以下是未转轴的因素矩阵(因素负荷量小于01的未予显示)。COMPONENTMATRIXACOMPONENT123456VAR00009931167157113VAR00017894215207VAR00004773475396VAR00014765141147450VAR00010755375230237134VAR00012754293280131104373VAR00005726532397VAR00011697328450252VAR00006660378529269138VAR00008645321508264333121VAR00013606385315398274VAR00015329728492165VAR00016433437666172295VAR00007490149738311228A6COMPONENTSEXTRACTED以下是经过转轴后的因素矩阵(因素负荷量小于01的未予显示),转轴方法为最大方差法,属正交转轴方法之一,也叫直交转轴法,其特点是因素间没有相关。我们正是想利用这一特性避免在后面的LOGISTIC回归中出现多重共线性。另外,由下表可看出,转轴前共同因素1包含VAR12、VAR11、VAR10,共同因素2包含VAR5、VAR4,共同因素3包含VAR8、VAR6,共同因素4包含VAR13、VAR14、VAR17、VAR9,共同因素5包含VAR16、VAR15,共同因素6包含VAR7。ROTATEDCOMPONENTMATRIXACOMPONENT123456VAR00012877158117182193143VAR00011854144322VAR00010524398468187269280VAR00005217910267119136VAR00004205894298188132VAR00008103175939136139107VAR00006346886135181VAR00013413807150VAR00014132196325728252299VAR00017589325173608175127VAR00009549409175594214199VAR00016164160126928VAR00015252221136881VAR00007167181119936AROTATIONCONVERGEDIN7ITERATIONS另外,从下面的因素得分协方差矩阵也可以看出6个公共因素是不相关的,从而达到了既简化财务指标数目,又防止出现多重共线性的目的。COMPONENTSCORECOVARIANCEMATRIXCOMPONENT123456110000000000000000002000100000000000000030000001000000000000400000000010000000005000000000000100000060000000000000001000下图是最终的得到的因素得分系数矩阵。COMPONENTSCORECOEFFICIENTMATRIXCOMPONENT123456VAR00004100569144055075116VAR00005056587154119049111VAR00006050046502062011145VAR00007069131093030026971VAR00008033251614073064047VAR00009019104111230035038VAR00010255073235131248120VAR00011480067055153022096VAR00012564093032352056030VAR00013089122039609132206VAR00014358094019606022253VAR00015146131023145471054VAR00016126210111084565020VAR00017072033064237003025由因素得分系数矩阵即可得到公共因素(F1F6)被表示成14个财务指标线性组合的形式,如F1的线性组合如下F101VAR40056VAR5005VAR60069VAR70033VAR80019VAR90255VAR10048VAR110564VAR120089VAR130358VAR140146VAR150126VAR160072VAR17所得到的用于下一步LOGISTIC回归的原始数据从SPSS软件中已给出,即序号上市公司名是否违约FAC1_1FAC2_1FAC3_1FAC4_1FAC5_1FAC6_11石家庄宝石电子玻璃股份有限公司是0664520709050564151559591608570482892丹东化学纤维股份有限公司是0944430099460622721654520529380205563中润资源投资股份有限公司是204581003955022161145559081240485534广夏银川实业股份有限公司是0050870422215566810759941051380295075上海复星医药集团股份有限公司是0128270394760347320369740085770024686上海宽频科技股份有限公司是2693690805250220110984910567170218397上海宽频科技股份有限公司是137450418470112451526870401090524068上海宽频科技股份有限公司是0030570182951228991442980199670156169紫光古汉集团股份有限公司否01025800252805057206940407339803491510四川大通燃气开发股份有限公司否022591022550047940319870468230051511青海明胶股份有限公司否04659205426901113207521109739500573712芜湖海螺型材科技股份有限公司否01568103501800506507831234654805007713山西三维集团股份有限公司否0822651068920137606340107606503322514北大国际医院集团西南合成制药股份有限公司否011810400770246940140950370401817115成都华神集团股份有限公司否00281401565106352601624110223404537116青海盐湖工业股份有限公司否2171991023310356340692380915904828317陕西金叶科教集团股份有限公司否00461801485107070811024206359605892118鲁西化工集团股份有限公司否07529708332200559301743923066303511419数源科技股份有限公司否19943300411702553214759203260300288620四川泸天化股份有限公司否05813203049901467808478509294202350421江苏华西村股份有限公司否03912500463703045701033149320343322重庆华邦制药股份有限公司否04304304428706476601719408479735055223华兰生物工程股份有限公司否13138604554606468404901204958302435724浙江杭州鑫富药业股份有限公司否00339606907104241306469700170500380625上海科华生物工程股份有限公司否11064814639703130308583901359433847726贵州航天电器股份有限公司否07244847452704329806507304051923803827国光电器股份有限公司否133112025843021422592340079901105328苏州固锝电子股份有限公司否13456916454301345609542115970820377929东港股份有限公司否09471905559901374802059714134307473730有研半导体材料股份有限公司否00787805627404430505312306078806944131安徽铜峰电子股份有限公司否0324720588370407608013905416200298232牡丹江恒丰纸业股份有限公司否01432300810702765303115501406202057933吉林华微电子股份有限公司否0160650402930174421556470702810259334广东冠豪高新技术股份有限公司否11205803781501496206551802427405317135广东榕泰实业股份有限公司否02741505984102656314163400089301032136西南药业股份有限公司否12409306217700260607402801008901509537宜宾纸业股份有限公司否0833430790208150909374503351605296138浙江钱江生物化学股份有限公司否01057705793702583809630205756902386739上海界龙实业集团股份有限公司否08306302603101871075328045184008369这里特别需要说明的是,此表中的FAC1_1与上面F1的计算公式略有不同,是由于SPSS将数据自动进行了标准化操作,即FAC1_1等于因素得分系数矩阵(AIJ)和原始变量的标准化值的乘积之和,公式为FAC1_1A11(VAR1U)/A21(VAR2U)/,其中U所有样本的均值,为所有样本的标准差。FAC1_1FAC6_1可直接用于LOGISTIC回归,作为其自变量估计参数使用。下面是所有数据准备完毕后,使用SAS软件的LOGISTIC回归函数进行回归分析。程序代码如下ODSGRAPHICSON/为绘制ROC曲线做准备/PROCLOGISTICDATADR_LOGISDEFAULTRISK_LOGISTICDESCENDINGPLOTSROCIDPROB/调用LOGISTIC;指定绘制ROC曲线;DESCENDING用来指定按照选项ORDER指定顺序的倒序排列,目的是为得到针对违约概率P的模型参数/MODELYFAC1_1FAC2_1FAC3_1FAC4_1FAC5_1FAC6_1/SELECTIONSTEPWISESLSTAY015SLENTRY015DETAILSLACKFITSTB/指定Y为因变量,FAC1_1到FAC6_1为自变量;采用逐步筛选法,变量被选进和剔除模型的显著水平均为15;DETAILS为输出选择方法的详细信息;LACKFIT为进行对模型进行拟合失真检验HOSMERANDLEMESHOWTEST;STB指定输出标准化数据模型选项/RUNODSGRAPHICSOFF以下为SAS软件执行以上程序输出的结果和相应的解释THELOGISTICPROCEDUREMODELINFORMATIONDATASETDR_LOGISDEFAULTRISK_LOGISTICRESPONSEVARIABLEY0,非违约;1,违约MODELINFORMATIONNUMBEROFRESPONSELEVELS2MODELBINARYLOGITOPTIMIZATIONTECHNIQUEFISHERSSCORINGNUMBEROFOBSERVATIONSREAD39NUMBEROFOBSERVATIONSUSED39RESPONSEPROFILEORDEREDVALUEYTOTALFREQUENCY11008200031PROBABILITYMODELEDISY100以上主要显示的是要建模的数据集信息,数据集为DR_LOGISDEFAULTRISK_LOGISTIC;响应变量为Y,0代表未违约,1代表违约;响应水平数为2;连接函数为BINARYLOGIT;最优化方法为费雪得分算法;读入和使用的观测数均为39,其中违约观测数为8,未违约观测数为31;最后一行代表计算用的分析响应变量的概率模型值为1事件的发生概率以下是采用逐步筛选法对变量进行筛选的过程STEPWISESELECTIONPROCEDURESTEP0INTERCEPTENTEREDMODELCONVERGENCESTATUSCONVERGENCECRITERIONGCONV1E8SATISFIED从上表可以看出此模型时是收敛的,和变量无关,说明模型拟合达到收敛标准。2LOGL39580ANALYSISOFMAXIMUMLIKELIHOODESTIMATESPARAMETERDFESTIMATESTANDARDERRORWALDCHISQUAREPRCHISQSTANDARDIZEDESTIMATEINTERCEPT1135450396611667400006RESIDUALCHISQUARETESTCHISQUAREDFPRCHISQ266656600002下表说明的是下一步可能进入模型筛选的变量信息。其中第2、5、6号变量不符合我们制定的显著性水平达15的标准。ANALYSISOFEFFECTSELIGIBLEFORENTRYEFFECTDFSCORECHISQUAREPRCHISQFAC1_119897400017FAC2_110055408139FAC3_116159700131FAC4_119065900026FAC5_111375702408FAC6_110111507384第一个变量进入模型。STEP1EFFECTFAC1_1ENTEREDMODELCONVERGENCESTATUSCONVERGENCECRITERIONGCONV1E8SATISFIEDMODELFITSTATISTICSCRITERIONINTERCEPTONLYINTERCEPTANDCOVARIATESAIC4158033581MODELFITSTATISTICSCRITERIONINTERCEPTONLYINTERCEPTANDCOVARIATESSC43243369082LOGL3958029581以上三个指标值均为越小越好。以下三个指标值的P值均小于001,说明有显著统计意义,建模效果比较显著。TESTINGGLOBALNULLHYPOTHESISBETA0TESTCHISQUAREDFPRCHISQLIKELIHOODRATIO99983100016SCORE98974100017WALD70043100081ANALYSISOFMAXIMUMLIKELIHOODESTIMATESPARAMETERDFESTIMATESTANDARDERRORWALDCHISQUAREPRCHISQSTANDARDIZEDESTIMATEINTERCEPT1177810530411239800008FAC1_111411705334700430008107783从上表可以看出,FAC1_1前的系数显著。STANDARDIZEDESTIMATE是在模型代码中加入STB语句才出现的。ODDSRATIOESTIMATESEFFECTPOINTESTIMATE95WALDCONFIDENCELIMITSFAC1_1024400860693ASSOCIATIONOFPREDICTEDPROBABILITIESANDOBSERVEDRESPONSESASSOCIATIONOFPREDICTEDPROBABILITIESANDOBSERVEDRESPONSESPERCENTCONCORDANT847SOMERSD0694PERCENTDISCORDANT153GAMMA0694PERCENTTIED00TAUA0232PAIRS248C0847以上表格主要注意C统计量,它反映了实际观测值和模型预测的事件概率的关联强度,越高越好。另外PERCENTCONCORDANT代表ROC曲线所围面积。RESIDUALCHISQUARETESTCHISQUAREDFPRCHISQ185470500023ANALYSISOFEFFECTSELIGIBLEFORREMOVALEFFECTDFWALDCHISQUAREPRCHISQFAC1_117004300081第一步筛选没有变量被移除。NOTENOEFFECTSFORTHEMODELINSTEP1AREREMOVEDANALYSISOFEFFECTSELIGIBLEFORENTRYEFFECTDFSCORECHISQUAREPRCHISQFAC2_110008409268FAC3_119663900019FAC4_118226500041FAC5_111974701599FAC6_110418705176第三个变量加入到模型中。STEP2EFFECTFAC3_1ENTEREDMODELCONVERGENCESTATUSCONVERGENCECRITERIONGCONV1E8SATISFIEDMODELFITSTATISTICSCRITERIONINTERCEPTONLYINTERCEPTANDCOVARIATESAIC4158027745SC43243327362LOGL3958021745TESTINGGLOBALNULLHYPOTHESISBETA0TESTCHISQUAREDFPRCHISQLIKELIHOODRATIO178345200001SCORE160570200003WALD87383200127ANALYSISOFMAXIMUMLIKELIHOODESTIMATESPARAMETERDFESTIMATESTANDARDERRORWALDCHISQUAREPRCHISQSTANDARDIZEDESTIMATEINTERCEPT121093070588930900028FAC1_111718706193770270005509476FAC3_112219712435318650074212238ODDSRATIOESTIMATESEFFECTPOINTESTIMATE95WALDCONFIDENCELIMITSFAC1_1017900530604ODDSRATIOESTIMATESEFFECTPOINTESTIMATE95WALDCONFIDENCELIMITSFAC3_1010900091243ASSOCIATIONOFPREDICTEDPROBABILITIESANDOBSERVEDRESPONSESPERCENTCONCORDANT919SOMERSD0839PERCENTDISCORDANT81GAMMA0839PERCENTTIED00TAUA0281PAIRS248C0919RESIDUALCHISQUARETESTCHISQUAREDFPRCHISQ97410400450ANALYSISOFEFFECTSELIGIBLEFORREMOVALEFFECTDFWALDCHISQUAREPRCHISQFAC1_117702700055FAC3_113186500742NOTENOEFFECTSFORTHEMODELINSTEP2AREREMOVEDANALYSISOFEFFECTSELIGIBLEFORENTRYEFFECTDFSCORECHISQUAREPRCHISQFAC2_110544504606ANALYSISOFEFFECTSELIGIBLEFORENTRYEFFECTDFSCORECHISQUAREPRCHISQFAC4_118394100038FAC5_113046100809FAC6_110948203302STEP3EFFECTFAC4_1ENTEREDMODELCONVERGENCESTATUSCONVERGENCECRITERIONGCONV1E8SATISFIEDMODELFITSTATISTICSCRITERIONINTERCEPTONLYINTERCEPTANDCOVARIATESAIC4158019625SC43243262792LOGL3958011625TESTINGGLOBALNULLHYPOTHESISBETA0TESTCHISQUAREDFPRCHISQLIKELIHOODRATIO2795483CHISQSTANDARDIZEDESTIMATEANALYSISOFMAXIMUMLIKELIHOODESTIMATESPARAMETERDFESTIMATESTANDARDERRORWALDCHISQUAREPRCHISQSTANDARDIZEDESTIMATEINTERCEPT128978102837941600048FAC1_112469112063418960040713613FAC3_111413608246293870086507794FAC4_112198610069476720029012121ODDSRATIOESTIMATESEFFECTPOINTESTIMATE95WALDCONFIDENCELIMITSFAC1_1008500080900FAC3_1024300481225FAC4_1011100150799ASSOCIATIONOFPREDICTEDPROBABILITIESANDOBSERVEDRESPONSESPERCENTCONCORDANT960SOMERSD0919PERCENTDISCORDANT40GAMMA0919PERCENTTIED00TAUA0308PAIRS248C0960RESIDUALCHISQUARETESTCHISQUAREDFPRCHISQ08848308291以上为残差的卡方检验,P值显著说明残差满足正态分布。ANALYSISOFEFFECTSELIGIBLEFORREMOVALEFFECTDFWALDCHISQUAREPRCHISQFAC1_114189600407FAC3_112938700865FAC4_114767200290NOTENOEFFECTSFORTHEMODELINSTEP3AREREMOVEDANALYSISOFEFFECTSELIGIBLEFORENTRYEFFECTDFSCORECHISQUAREPRCHISQFAC2_110510204750FAC5_110589604426FAC6_110008909248第2、5、6号变量由于P值过大,没有入选模型。以下表格是变量被入选时的P值等信息。NOTENOADDITIONALEFFECTSMETTHE015SIGNIFICANCELEVELFORENTRYINTOTHEMODELSUMMARYOFSTEPWISESELECTIONEFFECTSTEPENTEREDREMOVEDDFNUMBERINSCORECHISQUAREWALDCHISQUAREPRCHISQVARIABLELABEL1FAC1_1119897400017REGRFACTORSCORE1FORANALYSIS12FAC3_1129663900019REGRFACTORSCORE3FORANALYSIS13FAC4_1138394100038REGRFACTORSCORE4FORANALYSIS1ROC曲线对应面积为09597,说明模型拟合效果令人满意。PARTITIONFORTHEHOSMERANDLEMESHOWTESTY100Y000GROUPTOTALOBSERVEDEXPECTEDOBSERVEDEXPECTED14000044002400014399340002439844000443965400054395641011338974005043508400654335PARTITIONFORTHEHOSMERANDLEMESHOWTESTGROUPTOTALY100Y000OBSERVEDEXPECTEDOBSERVEDEXPECTED944363003710332970003HOSMERANDLEMESHOWGOODNESSOFFITTESTCHISQUAREDFPRCHISQ89660803452以上HOSMERANDLEMESHOWTEST的P值为03452,说明统计不显著,所以接受原假设“模型不存在拟合失真”,即表示模型的拟合优度已经满足要求。最后留在模型中的变量为第1、3、4号变量,所得到的LOGISTIC回归模型为LOGITP2897824691X114136X321986X4,其中1或2897824691X114136X321986X412897824691X114136X321986X4对于LOGISTIC回归的小结和说明1采用逐步筛选法进行回归,可看到每加入一个新的变量到模型中后,AIC、SC、2LOGL三项指标均有所改善,但经反复试验,当第1、3、4变量进入模型后,其他变量再进入后,对此三项指标的改善作用已极其有限,也会使其他指标,如WALD指标明显恶化,并且第2、5、6变量本身P值过大,不显著,同时考虑到采用1、3、4变量后AIC、SC、2LOGL、LIKELIHOODRATIO、SCORE、ROC曲线、优比指标较优,WALD也在01以下,权衡后筛选出这3个变量构建模型。2虽然最终的LOGISTIC模型中没有用到第2、5、6个变量,但并不能省略之前对VAR417所包含数据的提取和因子分析的工作,因为最终模型用到的第1、3、4个变量可能利用到了VAR417里面包含的数据。唯一能进行简化的工作只是可以在进行LOGISTC回归时可以不利用第2、5、6个变量进行建模,不用采用逐步筛选法对变量进行筛选而已。3因为在做因子分析时,转轴采用的是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年山东体育学院辅导员考试真题
- 2024年西安市渭北中学招聘笔试真题
- 2024年台州市椒江区办公室招聘笔试真题
- 2024年河北省乡村振兴局下属事业单位真题
- 仓库货物分类管理计划
- 2024年贵州省社会科学院下属事业单位真题
- 2024年贵州省交通运输厅下属事业单位真题
- 2025届山东省邹平唐村中学七下数学期末达标检测模拟试题含解析
- 2024年甘肃省统计局下属事业单位真题
- 法学理论与实践的结合试题及答案
- 全国国道大全(包括里程及路过城市)
- 化学品作业场所安全警示标志大全
- 2024药店质量负责人聘用合同范本
- CJ/T 156-2001 沟槽式管接头
- 黑龙江省齐齐哈尔市五县联考2023-2024学年七年级下学期期末数学试题
- CJJT81-2013 城镇供热直埋热水管道技术规程
- 留置导尿法操作评分标准
- 图集04S206自动喷水与水喷雾灭火设施安装
- 咖啡文化与饮品调制智慧树知到期末考试答案2024年
- JTS153-3-2007 海港工程钢结构防腐蚀技术规范
- (高清版)DZT 0319-2018 冶金行业绿色矿山建设规范
评论
0/150
提交评论