贝叶斯判别、费希尔判别法的计算机操作及结果分析

上传人：文*** IP属地：贵州上传时间：2020-05-31 格式：DOC 页数：8 大小：146.50KB 积分：20 举报 版权申诉

已阅读5页，还剩3页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

贝叶斯判别、费希尔判别法的计算机操作及结果分析一、实验内容、目标及要求（一）实验内容选取140家上市公司作为样本，其中70家为由于“财务状况异常”而被交易所对其股票实行特别处理（Special Treatment，简称ST）的公司，另外70家为财务正常的公司。为了研究上市公司发生财务困境的可能性，以“是否被ST”为分组变量，选择资产负债率、总资产周转率和总资产利润率几个财务指标作为判别分析变量，这三个指标分别从上市公司的偿债能力、资产管理能力和获利能力三个不同的角度反映了企业的财务状况。（二）实验目标贝叶斯判别、费希尔判别法的计算机操作及结果分析。（三）实验要求要求学生能熟练应用计算机软件进行判别分析并对结果进行分析，培养实际应用能力。二、实验准备（一）运行环境说明电脑操作系统为Windows XP及以上版本，所需软件为SPSS 16.0。（二）基础数据设置说明将数据正确导入SPSS，设置相应的变量值。三、实验基本操作流程及说明（一）系统界面及说明同实验一。（二）操作步骤1. 选择菜单项AnalyzeClassifyDiscriminate，打开Discriminate Analysis对话框，如Error! Reference source not found.。将分组变量st移入Grouping Variable列表框中，将自变量x1x3选入Independents列表框中。选择Enter independents together单选按钮，即使用所有自变量进行判别分析。若选择了Use stepwise method单选按钮，则可以根据不同自变量对判别贡献的大小进行变量筛选，此时，对话框下方的Method按钮被激活，可以通过点击该按钮设置变量筛选的方法及变量筛选的标准。图 41 Discriminate Analysis对话框2. 单击Define Range按钮，在打开的Define Range子对话框中定义分组变量的取值范围。本例中分类变量的取值范围为0到1，所以在Minimum和Maximum输入框中分别输入0和1。单击Continue按钮，返回主对话框。3. 如果不想使用全部的样本进行分析，单击Select按钮，则Discriminate Analysis对话框下方会跳出一个Selection Variable列表框，将一个选择变量移入Selection Variable列表框，并单击Rule按钮，设置选择条件。这样，只有满足选择条件的观测才能参与判别分析。4. 单击Statistics按钮，在跳出的Statistics子对话框中指定输出的描述统计量和判别函数系数。该对话框中各选项的含义如下：Descriptives选项栏：输出原始数据的描述性统计量u Means：输出各类中所有自变量的均值、组内标准差以及总样本的均值和标准差；u Univariate ANOVA：进行单因素方差分析，检验的原假设为不同类别中自变量的均值不存在显著差异；u Boxs M：对各类的协方差矩阵是否相等进行检验。Matrices选项栏：输出各种不同的协差阵和相关系数矩阵u Within-groups correlation matrix：平均组内相关系数矩阵，它是由平均组内协差阵计算得到的；u Within-groups covariance matrix：平均组内协差阵，它是由各组的协差阵平均后得到的；u Separate-groups covariance matrix：分别输出各个类的协差阵；u Total covariance matrix：总体协差阵。Function Coefficients选项栏：输出不同的判别函数系数u Fishers：给出Bayes线性判别函数的系数。（注意：这个选项不是要给出Fisher判别函数的系数。这个复选框的名字之所以为Fishers，是因为按判别函数值最大进行归类这种思想是由Fisher提出来的。这里极易混淆，请读者注意辨别。）u Unstandardized：给出未标准化的Fisher判别函数（即典型判别函数）的系数。（SPSS默认给出标准化的Fisher判别函数系数）这里我们仅选择Function Coefficients选项栏中的两个选项Fishers和Unstandardized，以便得到所需要的Bayes判别函数和Fisher判别函数，其余选项均不作选择。图42 Statistics子对话框5. 单击Classify按钮，打开Classification子对话框，如Error! Reference source not found.。对话框中各选项的含义如下：Prior Probabilities选项栏：用于设定在Bayes判别法中各类的先验概率，其中All groups equal表示各类先验概率相等，Compute from group sizes表示用样本频率代替先验概率；Use Covariance Matrix选项栏：用于指定计算判别函数所使用的协差阵，其中Within-groups表示使用平均协差阵计算判别函数，而Separate-groups表示计算判别函数时使用各组自身的协差阵；Display选项栏：Casewise result选项表示输出一个判别结果表，该表中给出了每个样品的判别分数、后验概率、实际类和预测类编号等；Summary table选项表示输出错判矩阵；Leave-one-out calssification选项表示输出每个样品的分类结果，这里的分类所依据的判别函数是由除该样品之外的其它样品导出的，因此也称为“交互校验”；Plots选项栏：可以指定输出几种直观地展现分类结果的统计图。这里，我们仅选择Display选项栏中的Summary table选项，即要求输出错判矩阵，以便从总体上把握模型的判别功效，其余均保持默认选项。图 43 Classification子对话框6. 单击Save按钮如果运行出错，则此项不要选。，打开Save子对话框，如图4-4，指定在数据文件中生成代表判别分类结果和判别函数值的新变量。生成的新变量的含义如下：u Predicted group membership：存放判别样品所属类别的值；u Discriminant scores：存放Fisher判别函数值的值，有几个典型判别函数就有几个判别函数值变量；u Probabilities of group membership：存放样品属于各类的Bayes后验概率值，总体分为几类就生成几个后验概率变量。将对话框中的三个复选框均选中，单击Continue按钮返回。图 44 Save子对话框7. 返回判别分析主界面，单击OK按钮，运行判别分析过程。（三）结果分析1. Fisher判别法的相关输出结果Error! Reference source not found.是Fisher判别函数的特征值表。Eigenvalues为相应Fisher判别函数的特征值，等于判别函数值组间平方和与组内平方和之比，该值越大表明判别函数效果越好。特征值的个数与Fisher判别函数的个数相等，由于本例中总体只有两类，所以至多有一个Fisher判别函数。Canonical Correlation为典型相关系数，等于组间平方和与组内平方和之比的平方根。Error! Reference source not found.给出了Fisher判别函数有效性检验结果。该检验的原假设是不同组的平均Fisher判别函数值不存在显著差异。从表中给出的值来看，说明在0.05的显著性水平下有理由拒绝原假设，即应认为不同组的平均Fisher判别函数值存在显著差异，这意味着判别函数是有效的。表 41 Fisher判别函数特征值表42 Fisher判别函数有效性检验Error! Reference source not found.和Error! Reference source not found.分别给出了标准化的Fisher判别函数和未标准化的Fisher判别函数。标准化的Fisher判别函数是由标准化的自变量通过Fisher判别法得到的，所以要得到标准化的Fisher判别函数值，代入该函数的自变量必须是经过标准化的。而未标准化的Fisher判别函数系数由于可以将实测的样品观测值直接代入求出判别函数值，所以该系数使用起来比标准化的系数要方便一些。由Error! Reference source not found.可知，Fisher判别函数为：Error! Reference source not found.给出了类中心处的Fisher判别函数值，该函数值是根据未标准化的Fisher判别函数计算的。这样，只要根据Fisher判别函数计算出各样品的函数值后，再比较它们分别离各类中心的距离，就可以得知它们的分类了。表 43 标准化的Fisher判别函数系数表 44 未标准化的Fisher判别函数系数表 45 类中心处的Fisher判别函数值2. Bayes判别法的相关输出结果Error! Reference source not found.给出了各类总体的先验概率。由于我们在Classification子对话框的Prior Probabilities选项栏中选择了默认的All groups equal选项，所以系统自动给每类分配了0.5的先验概率。表46 各类的先验概率Error! Reference source not found.给出了Bayes线性判别函数的系数。表中的每一列表示样品判入相应类的Bayes判别函数系数。在本例中，各类的Bayes判别函数如下：第一组：第二组：将各样品的自变量值代入上述两个Bayes判别函数，得到两个函数值。比较这两个函数值，哪个函数得出值比较大就可以判断该样品判入哪一类这与书本上理论内容不一致，原因是两种方法出发点不同。例如，本例中第一个待判样品公司“国投电力”的自变量值分别为：将其代入判别函数，得到：比较两个值，可以看出最大，据此得出第一个待判样品应该属于第一组，即非ST类。表 47 Bayes判别函数3. 模型的判别功效Error! Reference source not found.给出了模型的错判矩阵。从表中可以看到，在70家实际被ST的公司中，有59家被正确地判别，11家被错判为财务正常的，正确率为84.3%；在70家财务正常的公司中，有61家被正确预测，9家被错判，正确率为87.1%；模型总的预测正确率为85.7%，说明模型的判别效果比较理想，但比二项Logistic回归模型的判别功效（87.9%）稍差。从表中还可以看到，5个待判样品中有4个被判定为财务正常公司，1个被判定为财务异常公司。表 48 错判矩阵4. 生成的新变量由于我们在Save子对话框中选择了生成表示判别结果的新

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

贝叶斯判别、费希尔判别法的计算机操作及结果分析

文档简介

温馨提示

最新文档

评论

贝叶斯判别、费希尔判别法的计算机操作及结果分析

文档简介

温馨提示

最新文档

评论

相关文档