spss统计分析及应用教程 6

上传人：门*** IP属地：江西上传时间：2020-04-17 格式：PPT 页数：142 大小：2.87MB 积分：12 举报 版权申诉

已阅读5页，还剩137页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第6章相关和回归分析第6章相关和回归分析本章学习目标理解相关和回归分析的基本思想原理与两者之间关系明确相关和回归分析的实验目的实验步骤和实验内容掌握实验结果的统计分析熟练使用散点图相关和回归分析应用在经济管理数据分析中的应用第6章相关和回归分析相关和回归分析是分析客观事物之间相关性的数量分析方法客观事物之间的关系可分为函数关系和统计关系函数关系指客观事物之间的一一对应关系即当一组变量取一定值时另一变量y可以依确定的函数取唯一确定的值统计关系指客观事物之间的一种非一一对应关系即当一组变量取一定值时另一变量y无法依确定的函数取唯一确定的值事物之间的函数关系比较容易分析而事物之间的统计关系不像函数关系那样直接相关和回归分析正是以不同的方式处理事物间的统计关系实验一相关分析实验目的了解相关分析的方法原理熟练掌握相关分析的SPSS操作命令熟练应用三个常用相关系数的计算方法及其数据测度要求运用相关分析解决管理学实际问题的能力实验一单一样本t检验准备知识简单相关分析的概念统计学中相关分析是以分析变量间的线性关系为主是研究它们之间线性相关密切程度一种统计方法它是通过几个描述相关关系的统计量来确定相关的密切程度和线性相关的方向这些统计量包括皮尔逊 Pearson 相关系数斯皮尔曼 Spearman 和肯德尔 Kendall 秩相关系数一般用符号r来表示准备知识简单相关分析的概念相关系数具有一些特性 1 它的取值极限在 1和 1之间即 1 r 1 2 它具有对称性即X与Y之间的相关系数和Y与X之间的相关系数相同 3 它与原点和测度都无关即如果定义和其中且c和d都是常数则和之间的r无异于原始变量X与Y之间的r 4 如果X和Y统计上独立的则它们之间的相关系数r 0 但反过来 r 0不等于说X和Y是独立的 5 它仅是线性关联的一个度量不能用于描述非线性关系相关系数的计算方法皮尔逊 Pearson 相关系数通常仅对刻度级 Scale 变量计算皮尔逊 Pearson 相关系数公式为其中分别为 i 1 2 n 的算术平均值相关系数的计算方法斯皮尔曼和肯德尔秩相关关系用于反映两个序次或等级变量的相关程度计算Spearman相关数据时要求先对原始变量的数据排序根据秩使用Spearman相关系数公式进行计算公式可为式中分别是的秩分别是变量的平均值至于肯德尔秩相关系数的计算公式此处不再列出关于相关系数统计意义的检验我们通常利用样本来研究总体的特性由于抽样误差的存在样本中两个变量之间的相关系数不为0 不能直接就断定总体中两个变量间的相关系数不是0 而必须进行检验给出显著性水平做出判断对给定的显著性水平与检验统计量相对应的p值进行比较当p值 SPSS中常用Sig值来表示小于显著性水平则拒绝原假设认为相关系数不为零如 0 05 P 0 01 则P 拒绝零假设即两个变量相关系数r 0 计算得到的相关系数是有意义可以对它进行说明两个变量之间的相关程度反之当p值大于显著性水平则不能拒绝原假设认为相关系数为零不能根据计算得到的相关系数来说明两者之间相关程度实验一相关分析实验内容某大学一年级12名女生的胸围 cm 肺活量 L 身高 m 数据见表6 1 1 试分析胸围与肺活量两个变量之间相关关系表6 1 1胸围肺活量与身高相关数据表实验步骤 1 绘制散点图以判断两个变量之间有无线性相关趋势见图 2 从菜单上依次选择分析相关双变量二元相关命令打开对话框如图6 1 2所示选择胸围肺活量到变量框选择相关系数 pearson 显著性检验双侧检验标记显著性相关单击确定按钮实验结果胸围与肺活量相关性实验分析胸围与肺活量相关性由结果表可以看出变量间相关系数是用2 2方阵形式出现的每一行和每一列的两个变量对应的单元格就是这两个变量相关分析结果有三个数字分别为Pearson相关性显著性双侧 N 样本量如表格中黑色单元格所示胸围与肺活量的Pearson相关系数为0 549 显著性检验为0 064 样本量为12 如果单从相关系数可以看出两者是正相关的而且具有中等相关性但是显著性检验0 064 0 05 接受原假设所以Pearson相关系数为0 549的值没有通过显著检验根据这12个小样本来推断该大学一年级女生胸围与肺活量之间的没有线性相关性实验二偏相关分析实验目的准确理解偏相关分析的方法原理和使用前提熟练掌握偏相关分析的SPSS操作了解偏相关分析在中介变量运用方法实验二偏相关分析准备知识偏相关分析的概念在多元相关分析中由于其他变量的影响 Pearson相关系数只是从表面上反映两个变量相关性相关系数不能真正反映两个变量间的线性相关程度甚至会给出相关的假想因此在有些场合中简单的Pearson相关系数并不是测量相关关系的本质性统计量当其他变量控制后给定的任意两个变量之间的相关系数叫做偏相关系数偏相关系数才是真正反映两个变量相关关系的统计量偏相关系数的计算公式设有n个变量每两个变量间的简单相关关系即皮尔逊 Pearson 相关系数所构成的相关系数对称矩阵为其中 i j 1 2 n 偏相关系数的计算公式如设为此矩阵的行列式既则变量与之间的偏相关关系为其中分别为中元素的代数余子式实验二偏相关分析实验内容研究人员收集了26个旅游景点某年的商店投资数据游客增长率和风景区的经济增长率问景区商业投资是否确实导致了风景区的经济增长率实验二偏相关分析实验步骤 1 在SPSSl7 0中打开数据文件6 2 sav 通过选择文件打开命令将数据调入SPSSl7 0的工作文件窗口旅游投资数据文件 2 从菜单上依次选择分析相关偏相关命令打开其对话框如图所示选择商业投资与经济增长作为相关分析变量送入变量框中选择游客增长率作为控制变量用箭头送入右边的控制框中 3 点击选项按钮见图选择零阶相关系数也就是两两简单相关系数可以用与偏相关系数比较点击继续按钮回到主分析框点击确定按钮实验结果描述性统计分析偏相关分析实验三简单线性回归分析实验目的准确理解简单线性回归分析的方法原理熟练掌握简单线性回归分析的SPSS操作与分析了解相关性与回归分析之间关系培养运用简单线性回归分析解决实际问题的能力知识准备线性回归分析问题线性回归分析一般解决以下问题第一确定因变量与若干自变量之间的定量表达式通常称为回归方程式并确定它们联系的密切程度第二通过控制可控变量的数值利用求出的回归方程式来预测或控制因变量的取值和精度第三进行自变量分析找出影响因素最为显著的以区别重要因素和次要因素回归分析主要研究变量之间的线性相关关系时称为线性回归分析否则称为非线性回归分析又按照自变量多少分为一元线性回归和多元线性回归知识准备简单线性回归分析的理论模型其理论假设为简单线性回归的主要任务是根据样本数据求出未知参数和的估计值和从而得到估计的回归方程知识准备SPSS线性回归分析的数据要求线性回归过程中包括一元多元线性回归多元逐步回归可以给出所求回归方程的回归系数估计值即回归系数参数估计和区间估计协方差矩阵复相关系数R 方差分析表因变量的最佳预测值等还可以输出变量值的散点图等图形线性回归过程对数据的要求是自变量和因变量必须是具有刻度级测度的数值型变量标志或分类变量必须记录为二元的哑变量虚拟变量或者其他类型的对立变量对于因变量的所有观察值样本应该认为是来自于相互独立的等方差的正态总体 i i d 并且因变量与各个自变量之间应具有一定的线性关系简单线性回归分析中的统计检验和残差分析拟合优度检验定线性回归直线拟合优度的检验统计为式中 SST 称为总平方和 SSR 称为回归平方和 SSE SST SSR 称为残差平方和称为判定系数或拟合效度等简单线性回归分析中的统计检验和残差分析F检验回归方程显著性检验的统计量为F统计量式中 p为自变量个数 n为样本观测个数对于一元线性回归方程 p 1 同时注意到即拟合优度越好 F值越大越有可能是显著的方程成立可能性越大说明R方是直观地体现出拟合效果而F是统计量定量说明这个效果是否显著一般两者配套使用简单线性回归分析中的统计检验和残差分析DW检验在回归模型的诊断中有一个非常重要的回归模型假设需要诊断那就是回归模型中的误差项的独立性如果误差项不独立那么对回归模型的任何估计与假设所作出的结论都是不可靠的其参数称为DW 取值范围是0 DW 4 统计学意义如下当残差与自变量互为独立时 DW 2 当相邻两点的残差为正相关时 DW 2 当相邻两点的残差为负相关时 DW 2 简单线性回归分析中的统计检验和残差分析残差分析所谓残差就是指回归方程计算得到的预测值与实际值之间的误差它是回归模型中的估计值有多个形成的序列称为残差序列可通过残差序列分析来证实模型假设常以预测值为横轴以误差为纵轴或学生化残差绘制残差的散点图如果散点图呈现明显的规律性则认为存在自相关性或者存在非线性非常数方差的问题利用残差图还可以判断模型的拟合效果在残差图中如果各点呈随机状并绝大部分落在范围 68 的点落在内 96 的点落在之中说明模型对于数据的拟合效果较好知识准备简单线性回归分析的基本步骤回归分析之前需要对样本资料是否满足要求进行判断可以先使用相关分析法确定自变量与因变量之间的相关系数或者运用散点图 Scatter 功能产生直观的散点图观察自变量与因变量之间关系以及奇异值等情况如果图中发现有明显远离主体的观测值则称之为异常点 Outlier 这些点很可能对正确评价两变量之间关系有较大影响知识准备简单线性回归分析的基本步骤分析因变量的正态性方差齐性确定是否可以进行线性回归分析模型拟合完毕通过残差分析结果来考察模型是否可靠如果变量进行了变换则应重新绘制散点图并观察数据分布知识准备简单线性回归分析的基本步骤利用检验统计量对回归预测模型进行显著性检验得到拟合回归直线知识准备简单线性回归分析的基本步骤考察数据是否符合模型假设条件主要包括以下两个方面首先残差是否独立实际上就是考察因变量取值是否相互独立采用Durbin Watson DW残差序列相关性进行分析其取值范围为 0 DW 4 统计意义为若DW 2 表明相邻两点的残差项相互独立若0 DW 2 表明相邻两点的残差项正相关若2 DW 4 表明相邻两点的残差项负相关其次考察残差分布是否为正态实际上就是考察因变量趋势是否服从正太分布可以采用残差列表及相关指标法进行分析直方图是图示法观察用的知识准备简单线性回归分析的基本步骤线性回归用于预测时其适用范围一般不应超出样本中自变量的取值范围此时求得的预测值成为内插 Interpolation 而超出自变量取值范围所得到的预测值成为外延 Extrapolation 若无充分理由说明现有自变量范围以外的两变量间仍然是线性关系则应尽量避免不合理的外延同时线性模型的预测效果不及非线性模型所以一般不用线性模型来开展预测功能相关分析与回归分析关系概念关系相关分析与回归分析有密切的关系它们都是研究变量之间线性关系的统计分析方法但是两者又有区别相关分析中的变量视为随机变量仅研究变量之间是否存在线性关系而回归分析中研究的变量分为因变量和自变量因变量是随机变量又成为被解释变量自变量又称为解释变量是可以加以控制的变量相关分析与回归分析关系虽然因果分析研究一个变量对另一个些变量的依赖关系但它并不一定意味着因果关系用Kendall和Stuart的话说一个统计关系式不管多强也不管多么有启发性却永远不能确定因果方面的联系对因果关系的理念必须来自统计学以外最终来自这种或那种理论实验三简单线性回归分析实验内容下表给出1960 1972年之间的美国制造业的每百名雇员的辞退率与失业率试分析辞退率Y和失业率X的线性关系实验三协方差分析实验步骤 1 进入线性回归分析的对话框选择分析回归线性命令弹出回归分析对话框回归分析对话框 2 选择分析变量将辞退率送入因变量分析框将失业率送入自变量分析框 3 在方法 M 框中回归分析方法进入法 Enter 所选择的自变量全部进入回归模型该选项是默认方式逐步回归法 Stepwise 它是向前选择法与向后剔除法的结合根据在选项 O 对话框中设定首先根据方差结果选择符合要求的自变量且对因变量贡献最大的进入方程然后根据向后剔除法将模型中F值最小的且符合剔除要求的变量剔除出模型重复进行直到回归方程中的自变量均符合进入模型模型外的自变量都不符合进入模型要求为止消去法 Remove 建立回归方程时根据设定的要求剔除部分自变量后向剔除法 Backward 先建立全模型根据在选项 O 对话框中设定每次剔除一个最不符合要求的变量直到回归模型中不再含有不符合要求的自变量为止向前选择法 Forward 从模型中无自变量开始根据在选项 O 对话框中设定每次将一个最符合的变量进入模型直止所有符合要求的变量都进入模型为止第一个进入模型的变量应该与因变量间的相关系数绝对值最大如果指定的依据是F值每次将方差分析的F值最大的进入模型 4 选择分析统计量单击统计量 S 按钮弹出对话框如图所示回归系数估计 E 选项输出回归系数的标准误标准化回归系数beta 对回归系数进行检验的t值 t值的双侧检验的显著性水平sig 置信区间 Confidenceintervals 选项显示每个回归系数或协方差矩阵指定置信度的置信区间协方差矩阵 Convariancematrix 选项输出非标准化回归系数的协方差矩阵各变量的相关系数矩阵与模型拟合及其拟合效果有关的选择项模型拟合度 Modelfit 选项输出复相关系数R 复相关系数R2及其修正值估计值的标准误 ANOVA方差分析表引入模型和从模型中剔除的变量这是系统默认选择项 R方变化 Rsquaredchang 选项由于添加或删除自变量而产生的R2统计量的变化如果较大说明进入和从方程中剔除的变量有可能是一个较好的回归变量与模型拟合及其拟合效果有关的选择项部分相关和偏相关性 Partandpartialcorrelation 选项输出部分相关系数表明当一个自变量进入回归方程后 R2增加了多少偏相关系数表示排除了其他自变量对因变量的影响后与因变量的相关程度零阶相关系数变量之间的简单相关系数共线性诊断 Collinearitydiagnostics 选项共线性或多重共线性指一个自变量是其他自变量的线性函数输出用来诊断各变量共线性问题的各种统计量和容限值有关残差 Residuals 分析的选择项Durbin Watson选项输出Durbin Watson统计量以及可能是奇异值的观察量诊断表个案诊断 Casediagnostics 选项输出观测量诊断表离群值 Outliersandstandarddeviation 选项设置奇异值的判据默认值为 3 所有观测量选项输出所有观察量的残差值离群值 Outliersandstandarddeviation 选项设置奇异值的判据默认值为 3 所有观测量选项输出所有观察量的残差值 5 选择分析 O 选项如图所示步进方法标准设置变量进入模型或从模型中剔除的判据使用F的概率选项以F检验的概率作为变量进入模型或从模型中剔除的判据系统默认值为0 05 当一个变量的sig值 0 05时该变量进入回归方程当一个变量的sig值 0 10时该变量从回归方程中删除可以在其后的编辑框中输入自定义值但是进入值要小于删除值使用F值选项以F值作为变量进入模型或从模型中剔除的判据系统默认进入F值 3 84 F值 2 71时从模型中删除该变量步进方法标准设置变量进入模型或从模型中剔除的判据使用F的概率选项以F检验的概率作为变量进入模型或从模型中剔除的判据系统默认值为0 05 当一个变量的sig值 0 05时该变量进入回归方程当一个变量的sig值 0 10时该变量从回归方程中删除可以在其后的编辑框中输入自定义值但是进入值要小于删除值使用F值选项以F值作为变量进入模型或从模型中剔除的判据系统默认进入F值 3 84 F值 2 71时从模型中删除该变量在等式中包含常量 Includeconstantinequation 选项在回归方程中包含常数项这是默认选择项本例选择SPSS系统默认单击继续按钮 6 选择绘制 T 选项弹出绘制对话框图可以帮助检验数据的正态性线性和方差相等的假设还可以帮助识别离群值异常观察值和有影响的观测量等非常正数据散点图可以绘制以下各项中的任意两种 DEPENDNT 因变量 ZPRED 标准化预测值 ZRESID 标准化残差 DRESID 剔除残差 ADJPRED 调整的预测值 SRESID 学生化的残差 SDRESID 学生化的已删除残差针对标准化预测值绘制标准化残差以检查线性关系和等方差性产生所有部分图 P 选项输出每一个自变量的残差相对于因变量残差的散点图要生成部分图方程中必须至少有两个自变量标准化残差图选项可以获取直方图输出带有正态曲线的标准化残差的直方图标准化残差的正态概率图 R 即P P图检查残差的正态性 7 单击保存 S 选项弹出保存变量对话框见图所示预测值 PredictedValues 选项回归模型对每个个案预测值未标准化 U 非标准化模型为因变量预测的值标准化 R 每个预测值转换为其标准化形式调节 J 当某观测量从回归系数的计算中排除时观测量的预测值均值预测值的S E 预测值的标准误对于自变量具有相同值的观测量所对应的因变量的均值的标准差的估计残差未标准化 N 未标准化残差因变量的实际值与模型预测值之间的差标准化 A 标准化残差残差除以其标注差的估计标准化残差也称为Pearson残差它的均值为0 标准差为1 学生化 S 学生化残差残差除以其随观测量变化的标准差的估计这取决于每个观测量的自变量值与自变量均值之间的距离删除 L 剔除残差当某个观测量从回归系数的计算中排除时该观测量的残差是因变量的值和经调整的预测值之差学生化已删除 E 学生化剔除差一个观测量的剔除残差除以其标准误距离Mahalanobis距离 H 马哈拉诺比斯距离简称为马氏距离是一个测量自变量观测值中有多少观测值与所有观测值均值不同的测度把马氏距离数值大的观测值视为极端值 Cook距离 K 库克距离如果一个特殊的观察值被排除在回归系数的计算之外时库克距离用于测量所有观测量的残差将会有多大的变化当将库克距离数值大的观测量排除在回归分析的计算时会导致回归系数发生根本变化杠杆值 G 用于度量某个点对回归拟合的影响集中的杠杆值范围为从0 对拟合无影响到 N 1 N 预测区间 PredictionIntervals 均值 M 均值预测区间的上下限单值 I 因变量的单个观测量的预测区间置信区间 C 预测区间的置信概率在小框中输入1 99 99之间的值预测区间 PredictionIntervals 标准化DiFit T 标准化的DiFit值如果此值大于其临界值的绝对值则可以认定此观测量为影响点协方差比率 V 剔除一个影响点的协方差矩阵与全部观测量的协方差矩阵的比率如果比率接近于1 则说明被排除的观测量不能显著改变协方差矩阵系数统计将回归系数保存到数据集或数据文件可以在同一会话中继续使用数据集但不会将其另存为文件除非在会话结束前将其保存为文件数据集名称必须符合变量名命名规则将模型信息输出到XML文件将参数估计值及其协方差导出到指定的XML格式的文件这里不保存任何值然后单击继续命令返回实验结果模型汇总方差分析表模型系数表实验四多元线性回归分析实验目的准确理解简单线性回归分析的方法原理熟练掌握简单线性回归分析的SPSS操作与分析了解相关性与回归分析之间关系培养运用简单线性回归分析解决实际问题的能力知识准备多元线性回归分析基本原理 1 多元线性回归模型是指含有多个自变量的线性回归模型用于解释因变量与其它多个自变量之间的线性关系线性回归的一般数学模式是式中因变量Y的变化由两个部分来解释一是由P个自变量x的变化引起的Y变化部分二是由其他随机因素引起的Y的变化部分知识准备多元线性回归分析基本原理 2 SPSS线性回归分析过程作了n次观测得到观测值为其中分别为第i次观测时自变量的取值为因变量Y的观测值知识准备多元线性回归分析基本原理 3 回归分析需要对模型中的未知参数作出估计分别称为回归常数和偏回归系数偏回归系数表示假设在其他所有自变量不变的情况下某一个自变量变化引起的因变量变化的比率对建立的回归方程进行回归系数显著性检验即检验假设即第i个偏回归系数与0无显著差异检验的显著性统计量为t统计量知识准备多元线性回归分析基本原理 4 多元线性回归方程显著性检验的零假设为检验的统计量为F统计量如果检验拒绝H 则认为回归方程有效与一元回归方程相同在多元回归中也使用判定系数来解释回归模型中自变量的变异在因变量变异中所占的比率此时反映的是Y的变异由自变量联合解释的比例因此称为复判定系数 Multiplecoefficientofdetermination 知识准备多元线性回归分析基本原理 4 多元线性回归方程显著性检验的零假设为同时复判定系数的值随着进入回归方程的自变量个数P 或样本容量的大小的增加而增大因此为了消除自变量个数以及样本量的大小对判定系数的影响引入了经调整的判定系数 AdjustedRSquare 调整的判定系数的公式是 Adjusted其中p为自变量的个数 n为观测量的数目可以看出自变量个数大于1时其值小于判定系数自变量个数越多与判定系数的差值越大多元线性回归分析基本步骤实验三简单线性回归分析实验内容本例使用6 4数据文件建立一个以初始工资工作经验受教育年限等为自变量当前工资为因变量的回归模型员工工资与工作经验实验步骤 1 散点图直观地观察自变量与因变量之间关系是否有线性特点 1 按图形散点简单分布顺序展开如图所示的对话框单击定义出现图6 4 2简单散点图对话框 1 散点图单击定义出现图简单散点图对话框 2 将变量初始工资当前工资依次放入Y轴与X轴单击确定按钮结果如下图生成图形见图6 4 3 根据同样操作方法以当前工资为Y轴分别以其他几个自变量为X的散点图回归模型操作 1 按分析回归线性顺序展开选择当前工资作为因变量进入因变量 D 框中选择初始工资工作经验工作时间受教育年限变量作为自变量进入自变量 I 框中在方法 M 框中选择逐步回归法作为分析方式见图线性回归主对话框回归模型操作 2 单击统计量 S 按钮打开如图6 4 5对话框在回归系数一栏中选择估计 E 模型拟合度 M 共线性诊断 L 在残差一栏中选择Durbin Watson U 个案诊断中的离群值 O 参数框中键入3 表示设置观察量标准差大于等于3 为奇异值单击继续按钮返回主对话框回归模型操作 3 单击保存按钮打开图对话框选择距离一栏中的Mahalanobis距离 H Cook距离 K 杠杆值 G 选择影响统计量一栏中的标准化DfBeta Z 标准化DfFit T 协方差比率 V 用来确定影响点单击继续按钮返回主对话框回归模型操作 4 为了从图形上检查模型的线性和方差齐性等做散点图单击绘制 T 按钮打开绘图对话框将变量ZPRED与ZRESID分别放入X Y框中标准化残差图中选择直方图 H 正态概率图 R 单击继续按钮返回主对话框回归模型操作 5 在主对话框中单击选项 O 按钮选择在等式中包含常量 I 单击继续按钮返回主对话框 6 提交系统执行结果实验结果回归方程拟合过程模型汇总方差分析回归系数分析已排除的变量共线性诊断案例奇异值诊断残差统计量残差分布直方图观测量累计概率图当前工资的预测值与其学生化残差散点图实验五曲线估计实验目的准确理解曲线回归的方法原理熟练掌握曲线估计的SPSS操作与分析掌握根据11种曲线模型选择建立简单又适合的模型掌握利用曲线回归方程进行预测知识准备非线性模型的基本内容曲线估计问题即曲线拟合问题现实中变量之间的关系往往不是简单的线性关系而是呈现某种曲线或非线性关系此时选择适当的曲线拟合可以更加准确地反映实际情况变量之间的非线性关系可以划分为本质线性关系和本质非线性关系所谓本质线性关系是指变量形式上虽表现为非线性关系但可以通过变量转化方式变换为线性关系并可最终进行线性回归分析建立线性模型本质非线性关系是指变量之间不仅形式上为非线性关系而且也无法通过转化为线性关系 PSS的曲线估计 CurveEstimation 就是用来解决这类问题的它提供了包括线性回归在内的11种不同的曲线估计回归模型拟合模型曲线估计的基本步骤实验五曲线估计实验内容某公司有一种新产品上市选择8个地区做试销活动收集了试销广告投入与销量的数据数据文件6 5 结果见表问广告投入与销量之间的关系实验步骤 1 绘制散点图选择图形散点简单分布定义命令销售变量放入Y轴广告投入放入X轴按确定按钮得到散点图见图所示从图中看出二者的斜率有逐渐减缓的曲线趋势因此选用二次曲线模型三次曲线模型和对数曲线模型 2 选择分析回归曲线估计命令显示曲线估计对话框如图所示将销售放入因变量框 D 将广告投入放入变量框如果自变量是时间变量或观测量序号ID 可以选择时间这时曲线估计产生一个时间变量观测量之间的时间长度视为均匀的 3 选择分析变量在等式中包含常量 D 估计回归方程式中的常数项根据模型绘图 O 对照自变量绘制因变量的值每个模型产生一个单独的曲线模型 11种常用曲线此处选中二次项对数立方等选项线性选项是默认的显示ANOVA表格 Y 为每个选定的模式输出方差分析表 4 保存 A 如图所示保存变量对于每个选定的模型可以保存预测值残差和预测区间此处三个都选中预测个案在数据集中如果选择时间而不是变量作为自变量则可以指定超出时间序列结尾的预测期可以选择以下选项之一从估计期到最后一个个案的预测 L 在估计期内的观测量的基础上预测文件中所有观测量的值预测范围 T 根据估计期的观测量预测指定日期时间或观测号范围内的值此功能用于预测超出时间序列中最后一个观测量的值实验结果线性模型对数模型二次曲线模型三次曲线不同图形的拟合结果数据文件中的新变量保存情况实验六二项logistic回归分析实验目的准确理解二项logistic回归分析的方法原理熟练掌握二项logistic回归分析的SPSS操作明确了解二项logistic回归方程参数的意义及其解释能运用二项logistic回归分析解决实际问题知识准备logistic回归介绍一般的回归模型中应变量为刻度变量并且理论上要求其服从正态分布等LINE 线性独立正态等方差假定条件 logistic回归与它们的主要区别在于因变量的类型不同通过一组解释变量或自变量采用logistic回归可以预测一个分类变量每一分类发生的概率解释变量可以使刻度变量或分类变量或两者的混合如果解释变量均为刻度数据则可以采用判别分析等方法进行分析通常情况下 logistic回归对预测变量的假定条件较少所以logistic回归更为常用知识准备logistic回归介绍分类变量可以分为有序变量序次级和无序变量名义级后者分为二项分类变量和无序多项分类变量两种情况如候选人是否会当选二项分类消费者对某个产品使用满意程度分为很满意一般不满意结果变量满意程度为有序分类变量不同人群将会选择不同品牌联想苹果戴尔等的电脑这里的结果变量电脑品牌为无序多项分类变量知识准备二项logistic回归模型令因变量Y服从二项分布其二项分类的取值分别为0 1 Y 1的总体概率为 Y 1 则K个自变量分别为X1 X2 XK所对应的logistic回归模型为 6 6 1 或 6 6 2 知识准备二项logistic回归模型公式 6 6 1 与公式 6 6 2 可以互相推导公式 6 6 1 通常被称为logistic回归预测模型将某一个个体的自变量Xj值 x1 x2 xk 代入公式 6 6 1 在求得回归系数估计值的情况下可以得到该个体概率 Y 1 的预测值或称估计值即 6 6 3 logistic回归模型实际上是对概率 Y 1 进行了logit变换后的线性回归模型所以通常也称logistic回归模型为logit模型通过logit变换使0 1范围取值的 Y 1 变成了范围取值的logit值知识准备二项logistic回归方程参数的意义及其解释在一般线性回归模型中通过普通最小二乘法求解回归系数在二项分类logistic回归模型中通过最大似然估计法求解回归参数为了理解二项分类logistic回归模型参数的意义需要先理解优势 Odds 与优势比 OddsRations 的概念一个事件的优势被定义为它发生的可能性与不发生的可能性之比例如抛一枚硬币后其正面向上的优势为0 5 0 5 1 从52张桥牌中抽出一张A的优势为 4 52 48 52 1 12 这里不要把优势的含义与概率混淆其概率值为4 52 1 13 两者的关系可以用简单的公式来表示如果事件概率为二项分类变量的非事件概率为1 表示优势用表示则有优势 6 6 4 知识准备二项logistic回归方程参数的意义及其解释由公式 5 6 2 和公式 5 6 4 可得 6 6 5 根据公式 6 6 5 回归系数bj j 1 2 K 表示在其他自变量固定不变的情况下某一个自变量Xj改变一个单位或对数优势的平均改变量在实际应用中 logistic回归不是直接用回归系数来解释而是解释优势比优势比被用来作为衡量效应大小的指标度量某自变量对因变量优势影响程度的大小某一个自变量Xj对应的优势比为 6 6 6 知识准备二项logistic回归方程参数的意义及其解释将公式 5 6 5 等号两边同时取以自然对数e为底的指数有 6 6 7 优势比的含义是在其他自变量固定不变的情况下某一自变量Xj改变一个单位因变量对应的优势比平均改变exp bj 个单位如X1从一个任意实数变为 1 则 6 6 8 所以当一个自变量的系数为正值它意味着优势比将会增加此值会大于1 当系数为0时此值等于1 如果系数为负值它意味着优势比将会减少此值将会小于1 单因素方差分析基本步骤对于较大样本的系数的检验使用基于卡方分布的Wald统计量 Wald统计量也有弱点当回归系数的绝对值开始变大时其标准误的值将发生更大的改变这样Wald统计量的值开始变得很小将导致拒绝回归系数的零假设即认为变量的回归系数为零因此当变量的系数很大时就不要依据Wald统计量应建立两个包含与不包含药检测的变量的模型利用对数似然比的变化值进行建设检验可以选择BackwardLR方式作为变量的选择方法单一样本t检验基本原理和步骤判别模型与样本之间的想象度是判别模型好坏的方法之一在SPSS的 Modelsummary 输出结果中给出了Coxan

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

spss统计分析及应用教程 6

文档简介

温馨提示

最新文档

评论

spss统计分析及应用教程 6

文档简介

温馨提示

最新文档

评论

相关文档