第章定性数据的建模分析含SPSSppt课件.ppt

上传人：儿*** IP属地：广东上传时间：2020-03-19 格式：PPT 页数：46 大小：3.39MB 积分：20 举报 版权申诉

已阅读5页，还剩41页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第九章定性数据的建模分析本章内容第一节解释变量中含有定性变量的回归模型第二节二项Logistic回归模型第三节判别分析第一节解释变量中含有定性变量的回归模型在回归分析中我们对一些解释变量是定性变量的情形先给予数理化处理方法是引进只取0和1两个值的虚拟变量当某一属性出现时虚拟变量取值为1 否则为0 一简单情况简单情况是指定性变量只取两类可能性的情况例如研究企业资本结构问题为企业资本结构为企业规模另外再考虑审计意见两种情况企业资本结构的回归模型为 9 1 二复杂情况复杂情况是指定定性变量可能取多类值的情况假设以采掘业建筑业房地产业和社会服务业4个行业的上市公司为例研究企业资本结构问题其中为企业资本结构为企业规模为审计意见另外再考虑行业差异为了用虚拟变量反映这4个行业我们初步设想引入如下4个0 1型解释变量可是这样作却产生了一个新的问题即4个自变量之和恒等于1 构成完全多重共线性解决这个问题的方法很简单我们只需去掉一个0 1型变量只保留3个0 1型解释变量即可所以对于具有个分类的变量当确定了参照系后只需设置个0 1型解释变量企业资本结构的回归模型为 9 2 第二节二项Logistic回归模型一二项Logistic回归模型概述一二项Logistic回归模型的应用背景在许多会计研究问题中所研究的被解释变量往往只有是或否两个可能结果就需要设置虚拟变量当被解释变量为虚拟变量时建立一般的多元线性回归模型就会出现以下问题 1 残差不再满足且的假设条件 2 残差不再服从正态分布 3 被解释变量的取值区间受限制由此可见当被解释变量是0 1型变量时无法直接采用一般的多元线性回归模型建模通常应采用Logistic回归模型本章只介绍二项Logistic回归模型利用Logistic回归可以直接预测观测量相对于某一事件的发生概率在一般的多元回归中若以概率为被解释变量则方程为 9 3 但用该方程计算时常会出现或的不合理情形为此需要对作对数单位转换即于是可得到Logistic回归方程为 9 4 其中为常数和解释变量的系数为自然数其曲线为型某一事件不发生地概率为 Prob noevent 1 Prob event 9 5 二元Logistic模型对数据要求为 1 被解释变量应具二分特点 2 解释变量数据最好为多元正态分布三二项Logistic回归模型中回归系数的含义在应用中人们通常更关心的是解释变量给发生比带来的变化当Logistic回归模型的回归系数确定后将其代入的函数即 9 6 当其他解释变量保持不变而研究变化一个单位对的影响时可将新的发生比设为则有 9 7 于是有 9 8 由此可知当增加一个单位时将引起发生比扩大倍一般化则为 9 9 式 9 9 表明当第个解释变量发生一个单元的变化时几率的变化值为解释变量的系数为正值意味着事件发生的几率会增加的值大于1 解释变量的系数为负值意味着事件发生的几率会减少的值小于1 当为0时此值等于1 四二项Logistic回归模型的检验1 回归模型的显著性检验Logistic回归模型显著性检验的目的是检验解释变量全体与Logit的线性关系是否显著是否可以用线性模型拟合其原假设是各回归系数同时为0 解释变量全体与Logit的线性关系不显著 9 10 好的模型的似然比值较高其值相对较小似然比值的变化说明当变量进入与被剔除出模型对数据拟合度方面的变化常用的3种卡方统计量分别为Model Block Step 1 Model统计量检验除常数项以外模型中所有变量系数为零的假设 2 Block卡方值为当前值与后一组变量进入模型后的值之差 3 Step卡方值是在建立模型的过程中当前与下一步之间的差值 SPSS将自动计算似然比卡方的观测值和相伴概率值如果相伴概率值小于给定的显著水平则应拒绝零假设反之如果相伴概率值大于给定的显著水平则不应拒绝零假设 2 回归系数的显著性检验Logit回归系数显著性检验的目的是逐个检验模型中各解释变量是否与Logit有显著的线性关系对解释Logit是否有重要贡献其原假设是即某回归系数与零无显著差异相应的解释变量与Logit之间的线性关系不显著回归系数显著性检验采用的检验统计量是统计量数学定义为 9 11 式 9 11 中是回归系数是回归系数的标准误差检验统计量服从自由度为1的卡方分布 SPSS将自动计算各解释变量的的观测值和相伴概率值如果概率值小于给定的显著性水平则应拒绝零假设认为某解释变量的回归系数与零有显著差异该解释变量与Logit之间的线性关系显著应保留在模型中反之如果概率值大于给定的显著性水平则不应拒绝零假设可以认为某解释变量的回归系数与零无显著差异该解释变量与Logit之间的线性关系不显著不应保留在模型中 3 回归模型的拟合优度检验在Logistic回归分析中拟合优度可以从两大方面考察第一回归模型能够解释被解释变量变差的程度第二回归模型计算出的预测值与实际值之间吻合的程度即模型的总体错判率是低还是高常用的指标有Cox Snell统计量 Nagelkerke统计量错判矩阵 Hosmer Lemeshow统计量 4 残差分析Logistic回归中可以利用一下残差指标进行残差分析主要包括非标准化残差标准化残差 Logit残差等二二项Logistic回归分析在SPSS中的实现1 建立或打开数据文件后进入Analyze Regression BinaryLogistic对话框如图9 1所示图9 1Logistic逻辑回归分析主对话框 2 选择被解释变量放入Dependent框选择一个或多个解释变量放入Covariates框也可以将不同解释变量组放在不同的块 Block 中进而分析不同解释变量组对解释变量的贡献 3 在Method框后选择解释变量的筛选策略包括Enter选项 Forward Conditional选项 Forward LR选项 Forward Wald选项 Backward Conditional选项 Backward LR选项 Backward Wald选项 4 SelectionVariable框根据指定变量的取值范围选择参与分析的观察量 5 单击Categorical按钮展开如图9 2对话框设置处理分类变量的方式适用于解释变量协变量为非定距的品质变量图9 2定义分类协变量对话框 1 在Covariates框中包含了在主对话框中已经选择好的全部协变量及交互项 2 CategoricalCovariates框中列出了所选择的分类变量 3 ChangeContrast栏设置分类协变量中各类水平的对比方式有Indicator选项 Simple选项 Difference选项 Helmert选项 Repeated选项 Polynomial选项 Deviation选项 4 ReferenceCategory选项如果选择了Deviation Simple Indicator对比方式可选择First或Last 指定分类变量的第一类或最后一类作为参考类 5 如果改变了ChangeCovariates的设置单击Change按钮以示对选项的确定 6 单击Save按钮激活储存新变量对话框如图9 3所示选择在数据文件中保存的新变量图9 3保存新变量对话框 1 PredictedValue栏预测值选项其中 Probability复选项表示每个观测量发生特定事件的预测概率 Groupmembership复选项表示依据预测概率得到的每个观测量的预测分组 2 Residual栏保存残差包括Unstandardized非标准化残差 Logit残差 Studentized学生化残差 Standardized标准化残差和Deviance偏差 3 Influence栏保存每一个观测量的影响力指标包括Cook距离 Leveragevalues杠杆值和Dfbeta s 统计量 7 单击Options按钮展开如图9 4所示对话框图9 4Options选择项对话框 1 StatisticsandPlot栏输出统计量和图形包括Classificationplots复选项 Correlationsofesti复选项 Hosmer Lemeshowgoodness of f复选项 Iterationhistory复选项 Casewiselistingofresiduals复选项 CIforexp B 复选项 2 Display栏中 Ateachstep选项表示对每一步计算过程输出表统计量和图形 Atlaststep选项表示只输出最终方程的表统计量和图形 3 ProbabilityforStepwise栏设置变量进入模型及从模型中删除的判据 4 Classification栏被解释变量分类界限 5 Maximum栏设定最大迭代次数 6 Includeconstantinm 模型包含常数项 8 图形诊断模型包括 1 使用Graphs图形功能对保存在数据文件中的Deviance统计量做P P图 2 将保存的StandardizedResiduals DfBeta s 和Leverage统计量用SPSS图形功能做散点图横坐标为变量ID 纵坐标为各种保存的新变量第三节判别分析一判别分析的概念和基本步骤一判别分析的概念判别分析是根据观察到的若干变量值判断研究对象如何分类的方法判别分析能够解决两组或者更多组的情况当包含两组时称做两组判别分析当包含三组或者三组以上时称做多组判别分析聚类分析和判别分析都是分类学的基本方法但它们也有很大的不同二判别分析的基本步骤1 判别分析的研究设计 1 解释变量和被解释变量的选择判别分析中被解释变量为定性变量解释变量可以为定量变量也可以为定性变量 2 样本容量在判别分析中最小的组的大小必须超过解释变量的个数 3 样本的分割在实际研究中很多时候样本需要分割为两个子样本一个子样本用于估计判别函数另一个子样本用于验证判别函数每个子样本都要有适当的样本容量来支持结论分割样本有很多种方法最常用的是将整个样本随机的分为两组这种验证方法称为分割样本法或者交叉验证法 2 判别分析的假定 1 每一个判别变量解释变量不能是其他判别变量的线性组合即不能出现多重共线性问题 2 各组变量的协方差矩阵相等判别分析最简单和最常用的形式是采用线性判别函数它们是判别变量的简单线性组合在各组协方差矩阵相等的假设条件下可以使用很简单的公式来计算判别函数和进行显著性检验 3 各判别变量之间具有多元正态分布即每个变量对于所有其他变量的固定值有正态分布在这种条件下可以精确计算显著性检验值和分组归属的概率当违背该假设时计算的概念将非常不准确 3 估计判别模型和评估整体拟合 1 计算方法推导判别函数时可以使用两种计算方法联立直线法和逐步法联立估计在计算时同时考虑所有的解释变量而当研究者考虑了相对较多的解释变量时逐步法是适用的 2 统计显著性在计算了判别函数以后必须评估它的显著性有一系列不同的统计准则可用 Wilk slambda Mahalanobisdistance和Rao sV等都可以用来评估判别函数 3 评估整体拟合这个评估包括三个任务计算每个观测的判别得分检验各组在判别得分上的差异评估组关系预测的精度 4 结果的解释这个过程主要是解释在判别分析中每个解释变量的相对重要性主要有三种方法标准化判别权重判别载荷偏值 5 结果的验证判别分析的最后一个阶段就是验证判别分析的结果通常采用分割样本和交叉验证法 1 建立或打开数据文件后按Analyze Classify Discriminant的顺序打开DiscriminantAnalysis对话框见图9 7所示图9 7判别分析主对话框 2 选择分类变量及其范围在主对话框中左面的矩形框中选择表明已知的观测量所属类别的变量按向右按钮使该变量名移到右面的GroupingVariable框中此时矩形框下面的 DefineRange 按钮加亮按该按钮显示如图9 8所示的对话框在该框中分类变量的最小值和最大值图9 8DefineRange对话框 3 指定判别分析的解释变量在主对话框左面的变量表中选择表明观测量特征的变量按下面一个箭头按钮把选中的变量移到Independents矩形框中作为参与判别分析的变量完成前面3步骤的操作即可使用各种系统默认值对数据集的数据进行判别分析了但结果有时不能令人满意因此有必要根据以下步骤做进一步的分析 4 选择观测量如果希望使用一部分观测量进行判别函数的推导而且有一个变量的某个值可以作为这些观测量的标识则用Select功能进行选择展开SetValue子对话框如图9 9所示键入标识参与分析的观测量所具有的该变量值图9 9SetValue子对话框在分析中一般均使用数据文件中的所有合法观测量因此此步骤也可以省略 5 选择分析方法在主对话框中解释变量矩形框下面有两个选择项用于选择判别分析方法 1 Enterindependenttogether选项当认为所有解释变量都能对观测量的特性提供丰富的信息且彼此独立时使用该选择项建立全模型不需要进一步进行选择 2 Usestepwisemethod选项当不认为所有解释变量都能对观测量的特性提供丰富的信息时因此需要使用该选择项根据判别贡献的大小再进行选择单击该项 Method 按钮加亮可以进一步选择判别分析方法 6 单击 Method 按钮展开StepwiseMethod对话框如图9 10所示其中图9 10StepwiseMethod对话框 1 Method栏选择进行逐步判别分析的方法可供选择的判别分析方法有 Wilk slambda选项 Unexplainedvariance选项 Mahalanobisdistance选项 SmallestFratio选项 Rao sV选项 2 Criteria栏选择逐步判别停止的判据可供选择的判据有 UseFvalue选项使用值 UseProbabilityofF选项用检验的概率决定变量是否加入函数或被剔除 3 Display栏显示选择的内容有Summaryofsteps复选项和FforPairwisedistances复选项进行选择 7 单击Statistics按钮展开Statistics对话框指定输出的统计量如图9 11所示图9 11Statistics对话框 l Descriptives栏选择对原始数据的描述统计量的输出包括Means复选项 UnivariateANOV复选项 Box sM复选项 2 Functioncoefficients栏选择判别函数系数的输出形式有Fisherh s复选项 Unstandardized复选项 3 Matrices栏选择要求给出的解释变量的系数矩阵包括Within groupscorrelation复选项 Within groupscovariance复选项 Separate groupscovariance复选项 Totalcovariance复选项 8 在主对话框中单击Classify按钮展开Classification对话框指定分类参数和判别结果如图9 12所示图9 12Classification对话框 1 在PriorProbabilitie

人人文库> 全部分类> 毕业设计 > 开题报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第章定性数据的建模分析含SPSSppt课件.ppt

文档简介

温馨提示

最新文档

评论

第章定性数据的建模分析含SPSSppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档