




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、简单教程 04 1. 相关配套数据 已经 上传百度文库:2. 配套软件 SPSS 17.0 已经上传百度文库;百度文库搜索“SPSS简单教程配套数据及软件_chenxy”百度云盘链接;5. 回归分析25.1 一元线性回归分析25.2 回归分析曲线估计55.3 多元线性回归分析105.3.1 多元线性回归分析强制全部回归分析105.3.2 多元线性回归分析_逐步回归分析115.4 多元线性回归三大问题135.4.1 问题1:判定多重共线性135.4.2 对多重共线性处理175.4.3 问题2:判定异方差215.4.4 对异方差处理265.4.5 问题3:判定序列相关365. 回归分析一元线性回归
2、分析多元线性回归分析回归:揭示出不确定数量关系的内在数量变化规律,并通过一定的表达式 (回归方程) 描述数量之间的这种内在关系的方法。被解释变量:必须是刻度级数据解释变量:可以是刻度级、顺序级、名义级的变量 但是都必须用Numeric 型来定义5.1 一元线性回归分析效果检验系数检验操作步骤 1 (数据见文件 20151105_回归分析)回归系数的显著性检验T检验H0:回归方程不显著 H1:回归方程显著 t(n-k)针对回归系数的统计量的显著性检验决定了相应的变量能否作为解释变量进入回归方程。 Analyze-> Regression-> LinearEnter 强行全部回归Con
3、tinue->OK 结果如下SSR = 27272426.508 SSE= 254044.393F= 27.576P = 0.000 < 0.05;故拒绝原假设H0;有95%的把握认为回归方程显著操作步骤2 回归方程的效果检验判定相关系数法判定相关系数越接近1 表明回归平方和占离chat平方和的比例越大,用x的变动解释y变动的部分就越多,回归的效果就越好。判定相关系数R0.9 以上 非常好 0.8 以上 很好 0.7以上 比较好 0.6以上 一般 0.6 以下 不好分析结果如下1. 0.956 自变量(人均月收入,广告投入)和因变量(销售额)之间存在着极度相关关系2. 由表可知:判
4、定相关系数为0.915;说明回归平方和占总离差平方和的比例91.5%,用(人均月收入,广告投入)的变动 解释 (销售额)变动的比例为91.5%,且该回归的效果非常好;调整的判定系数(校正的判定系数)公式(待补充)R2 校正后 不考虑自由度校正与否不会差异太大操作步骤 3 系数检验: 含常数项的检验 一元 2 个 二元 3 个 以此类推H0:=0; H1:0;( 决定了这个变量是否进入回归方程 )1. Constant P值 = 0.01 < 0.05 即选择B一列 反之 P值>0.05; 则该方程不含常数项,选择Standardized (标准化系数)检验其他系数:2. X1能不能
5、进入回归方程 P=0.001<0.05 即这个变量能进入回归方程3. X2能不能进入回归方程 P=0.007<0.05 即这个变量能进入回归方程 y = 8.577 + 599.454+2116.516附注:从而判断实际最后得到的方程的最高次项判定该模型实际含义5.2 回归分析曲线估计操作步骤1 (数据文件见 20151112_回归分析_曲线估计 ) ( 以下英文步骤了解即可,暂不实际操作,后面通过转化成中文界面再实际操作 )Analyze ->Regression-> Curve Estimation 进入 下面窗口 勾选相应多选框Model : 所有曲线名字点击右上
6、角Save 按钮 查看 该窗口暂不 Continue->OK第一次操作由于输出表格过多且相应曲线模型较多,转换成汉语界面,该次分析转换成汉语界面,便于了解输出结果的具体模型名称,查看输出结果:General 将 language 选择 Simplified Chinese OK中文操作步骤 :分析 -> 回归 -> 曲线估计 勾选各选择项了解各模型具体含义点击右上角 保存 按钮 继续 -> 确定确定输出界面分析 首先会根据 所勾选的 曲线估计模型 生成每一种曲线估计对应的三个表格Model Summary 模型总汇表格ANOVA 表格Coefficients 系数表格首
7、先根据 模型总汇表 中 R和R方值(R Square) 简单比较各曲线的模型优劣,选择R和R方值越接近1的模型越合适,然后具体筛选,分析然后以一两种表格举例具体分析 分析案例 1 : 注释:必须满足三个条件1. R Square >= 0.6 回归效果好2. P < 0.05 回归方程显著3. 系数检验任意通过一项模型才可以采用条件一: 模型总汇表 检验相关系数 判定回归效果好坏R为自变量和因变量之间的相关系数,R=1.0说明两者之间完全相关R方(R Square)为判定相关系数判定相关系数越接近1 表明回归平方和占离差平方和的比例越大,用自变量的变动解释因变量变动的部分就越多,回
8、归的效果就越好。条件二: ANOVA表格 判定回归方程 显著性 效果由P值检验法:该P=0.00<0.05 故拒绝原假设H0;有95%的把握认为回归方程显著条件三:系数检验 ( 二次项一般表达式 )由各项均含有自己的假设检验P值,故自下而上从 常数项的P值往上判断1. 由常数项(Constant)对应P=0.813>0.05 故采用标准化系数;即该二次项不含常数项;(若P值<0.05 则采用未标准化系数对应B列)2. 由 苗龄 和 苗龄2 对应系数各位 0.005 和 0.000 均小于 0.05 故都可进入回归方程最后得到模型:(这个P=0.05 比较特殊 个人观点 暂且化
9、为 P<=0.05 )分析案例 2 :同样的分析结果如下R=1.0 因变量和自变量 完全相关R=1.0 R Square=1.0 回归效果好P=0.00 < 0.05 回归方程显著系数检验由常数项 P值=0.337 >0.05 故采用标准化系数由三项P值均大于 0.05 故该模型不可采用引申:三次项一般形式 :若方程最高次项系数 a 的 p值 > 0.05 其他项满足则最后模型方程为 : 其实质是 二次曲线估计5.3 多元线性回归分析5.3.1 多元线性回归分析强制全部回归分析操作步骤 1 ( 数据文件见 20151112_多元线性回归分析_强制全部回归分析 ) Ana
10、lyze -> Regression -> Linear OK 得出结果如下结果分析如下:R=0.949 自变量和因变量之间 高度相关R Square=0.883 回归效果很好P值<0.05 回归方程显著系数检验:P值=0.168 >0.05 故不含常数项 且采用规范化系数有 X1 粮食平均单价 P值=0.007 < 0.05有 X2 人均收入 P值=0.000 < 0.05最后模型如下:5.3.2 多元线性回归分析_逐步回归分析操作步骤 1 ( 数据文件见 20151112_多元线性回归分析_逐步回归分析 )Analyze -> Regression
11、 -> Linear 年龄证券市场以外年收入受教育程度入市年份输出结果如下:由于是逐步检验,依次加入因变量Model 表示4个因变量依次加入形成的的模型组合方式 如上 a b c d 四种模型由P值 均 < 0.05 故4种模型 回归方程显著具体分析4个模型,各模型系数检验在依次加入前三个因变量 P值均 <= 0.05 即不同 系数项均通过假设检验,可以加入到回归方程中最后模型4得出最终结果 不同 系数项均通过假设检验,可以加入到回归方程中; 各个模型被删除的变量即不包含的变量的假设检验,用于辅助判定上表中可以看出,各模型中,各项系数检验均 > > 0.05故也可
12、以判定 各模型缺失项可以进入回归方程5.4 多元线性回归三大问题多重共线性异方差问题序列相关问题5.4.1 问题1:判定多重共线性多重共线性后果:多重共线性判别指标1. 容忍度对应于解释变量xj的容忍度定义为 是解释变量xj与方程中其他所有解释变量之间的复相关系数平方,可以衡量xj与其他解释变量的线性相关程度。如果 <0.1 则可能存在多重共线性2. 方差膨胀因子一般认为,方差膨胀因子大于10时,就认为存在多重共线性。3. 相关系数矩阵自变量间的相关系数矩阵:如果相关系数超过0.9的变量在分析时将会存在共线性问题。在0.8以上可能会有问题。但这种方法只能对共线性作初步的判断,并不全面。4
13、. 特征根 Eigenvalue该方法实际上就是对自变量进行主成分分析,如果相当多维度的特征根等于0,则可能有比较严重的共线性。5. 条件指数由Stewart等提出,当某些维度的该指标数值大于30时,则能存在共线性。选择 奇数 个判别因子 要么5个 要么3个 避免偶数个判别因子出现 相互矛盾的现象多共线性问题的处理 (理论)1. 逐步删除不重要的(t 相对小的)解释变量,采用多种自变量筛选方法相结合的方式,建立一个最优的逐步回归方程。可直接用逐步回归法完成。2. 增大样本量,可部分的解决共线性问题3. 从专业的角度加以判断,人为的去除在专业上比较次要的,或者缺失值比较多,测量误差比较大的共线性
14、因子。4. 进行因子分析,用提取的因子代替原变量进行回归分析。其他方法: (1)用变量的比例代替原来的变量,即用相对数变量替代绝对数变量:(2)差分法(3)逐步回归分析 (4)偏最小二乘回归(5)岭回归(6)恰当处理滞后变量。操作步骤 1 (数据文件见 20151112_多重共线性 )Analyze->Regression->Linear可支配收入金融资产服装价格指数一般价格指数点击 statistics共线的诊断Continue ->->OK 输出结果如下(1)特征根(Eigenvalue):(3,4,5)多个维度特征根约为0证明存在多重共线性;(2)条件指数(Con
15、dition Index):(3,4,5)大于30时提示我们可能存在多重共线性(3)看相关系数矩阵,找到数值接近1的相关,这也提示出可能存在多重共线性。用SPSS处理,主要采用: 1、使用Transform中的Create time series命令,对数据进行一阶差分处理后,重新使用Linear Regression命令,采用自变量全部入选法,做线性回归分析。 2、针对自变量存在的严重多重共线性,普通最小二乘法明显变坏的问题,可以在SPSS软件中运用岭回归分析。岭参数K值从0到1,步长可以取0.05。3、采用逐步回归方法5.4.2 对多重共线性处理操作步骤 1 (数据文件见 20151112
16、_多重共线性 )Transform -> Create Time Series ->->OK 输出结果如下数据窗口生成新的五列数据添加新创建的五列数据因变量: DFF(服装消费)自变量(其他四个 DFF列数据)操作步骤 2 : Analyze->Regression->Linear> OK 输出结果如下表格分析:由表格( Model Summary ) 判定相关系数 R2 = 0.511 0.6所以该模型回归效果不好由表格( ANOVA) )P=0.4840.05,接受原假设,有95%把握认为该方程没有显著性故不要下一步系数检验,且该种处理方式不适用操作步骤
17、 3 :Analyze > Regression -> Linear -> 点击 Reset添加原始数据因变量 服装消费其他自标量:可支配收入;.;一般价格指数> OK 输出结果如下 表格分析:由以上操作步骤共产生两个模型:且由表格可以看出第一个模型:R2 =0.998 回归效果好 且P=0.00 <0.05 回归方程显著 但是在系数检验中存在很多系数无法进入回归方程 故判断存在多重共线性 不适用第一个模型:R2 =0.998 回归效果好 且P=0.00 <0.05 回归方程显著 并且通过系数检验,较多系数可以进入回归方程 故该模型适用得出结果如下:常数项系
18、数 P=0.098 > 0.05 故采用标准化 引申回归分析 选择方法的区别:Enter:所有X一次性全部进入Forward:X一个一个进,每次进入P-value最小的X,直到未进入的X都不significantBackward:所有的X先一次性进入,然后一个一个剔除,每次剔除P-value最大的X,直到保留的X全都significantStepwise:X一个一个进,但是进入新的X以后,会重新审查所有已进入X的P-value,如果进入新的X导致原来的X的P-value从significant变成不significant,则把原来的X剔除5.4.3 问题2:判定异方差问题内涵(了解):是
19、指随着解释变量的变化,被解释变量的方差存在明显的变化趋势(不具有常数方差的特征)这也是经济与管理领域中经常出现的问题之一。异方差造成的后果: 回归方程的估计值不具有实用价值判定是否存在异方差问题的方式1. 散点图判断(不完全准确)2. 求e变量的绝对值与残差的等级相关系数 绝对值大 存在非齐性方差操作步骤 1 ( 数据文件见 20151119_异方差 ) Analyze -> Regression -> Linear 点击 plots “DEPENDNT” 因变量。“ZPRED” 标准化预测值。“ZRESID” 标准化残差。“DRESID” 删除残差。“ADJPRED” 调节预测值
20、。“SRESID” 学生氏化残差。“SDRESID” 学生氏化删除残差。从图形看可能存在异方差,进一步通过 等级相关系数 判断操作步骤 2 :Analyze -> Regression -> Linear 记得 Reset点击 save 按钮 :残差非标准化 Continue -> OK 出现一列新的数据对该列数据绝对值化 Transform -> Computer Variable ->依次 1.录入新变量名称; 2.选择方法all; 3.选择函数abs 双击; 4. 双击处理对象OK-> 数据增加新的一列操作步骤 3 : 计算 绝对值(abs1) 和 非
21、标准残差绝对值 的相关系数Analyze -> correlate -> Bivariate 选择 Spearman系数Person系数表示两个变量的 积矩相关系数 Kendalls tau-b 和 Spearman 表示两个变量的等级相关系数 -> OK 输出结果如下:表格分析由表格可知 : P=0.000 < 0.05 拒绝原假设H0,故有99%的把握认为存在异方差显著等级 *5.4.4 对异方差处理方法一 直接回归 : 以1/收入为权重,作如下回归直接回归(1)定义变量“储蓄/收入”和“1/收入”(2)进入一元线性回归过程用加权最小二乘法估计回归系数-继续上面数据
22、进行操作增加两个新变量:1. 储蓄除以收入2. 收入的倒数操作步骤 1 (数据文件见: 20151119_异方差 ):变量一: Transform -> Computer variable 点击 Reset点击 OK变量二 : Transform -> Computer variable 点击 Reset点击 OK操作步骤 2 : (检验异方差)Analyze -> Regression -> Linear 绘制散点图Analyze -> Regression ->Linear点击 saveContinue -> OK表格分析由表格可知: 判定相关系数
23、 R2 = 0.774 回归效果比较好 P= 0.000 回归方程显著由系数检验结果: y = -722.47x + 0.088 现实含义 : 两边同乘以收入得到: 储蓄 = -0.722.47 + 0.088 收入操作步骤 3 :检验异方差 是否得到改善Analyze -> Regression -> Linear 点击 save continue -> OK非标准残差 绝对值化 Transform -> Computer Variable -> OK 结果如下判定 abs2 和 收入的倒数 的相关系数Analyze -> Correlate ->
24、Bivariate 由表格 可知 P=0.289 > 0.05所以 接收原假设,即有95%的把握认为内无异方差方法二: 加权-最小二乘法估计回归系数操作步骤 1 ( 2数据文件见:0151119_异方差_最小二乘法 ): 注意: 收入的倒数 小数位数值设为 7 显示如下 Analyze -> Regression-> Linear点击 OK 输出结果如下:表格分析:由上表的出结果如下:1. R2 =0.933 回归效果好 P=0.000<0.05 回归方程显著2. 系数检验后,方程如下: ( 与第一种方法得出结果作比较 )判定该回归方程是否可以直接使用,必须通过等级相关
25、系数检验三步:1. 添加 未标准化异方差Analyze -> Regression -> Linear 点击 save 勾选 OK2. 绝对值化 未标准化异方差Transform -> Computer Variable3. 计算 自变量(收入) 和 绝对值的 相关系数Analyze -> correlate -> Brivariate操作步骤 2 : Analyze -> Regression -> Weight Estimation -> OK 输出结果如下 表格分析:由上表的出结果如下:1. R2 =0.936 回归效果好 P=0.000&
26、lt;0.05 回归方程显著2. 系数检验后,方程如下: ( 与第一种方法得出结果作比较 )判定该回归方程是否可以直接使用,必须通过等级相关系数检验三步:1. 添加 未标准化异方差 Analyze -> Regression -> Linear 点击 save 勾选 OK2. 绝对值化 未标准化异方差 Transform -> Computer Variable3. 计算 自变量 和 绝对值的 相关系数 Analyze -> correlate -> Brivariate5.4.5 问题3:判定序列相关自相关问题,是指随着不同期的样本值(不同编号的样本值)之间存在
27、相关关系,这也是经济与管理领域中经常出现的问题之一。经济管理问题中产生序列相关的主要原因:1. 遗漏重要变量2. 经济变量的滞后性3. 采用错误的回归形式4. 因数据加工整理而导致误差项之间出现自相关性。检验工具:DW 统计量(公式了解即可)公式:其中 ;由于 : ;DW 判定区间如下观察、检验序列相关图示和DW值检查自相关的原因,若不是遗漏重要变量或回归形式选择错误,则用恰当方法处理;常用方法是:(1)迭代法广义差分法(2)一阶差分法序列相关的诊断yt操作步骤 1 :( 数据文件见 20151126_序列相关 )Analyze -> Regression -> Linearxt点
28、击 statistic 勾选Continue-> 点击 plots 画散点图Continue -> 点击 save 勾选 残差非标准化点击 continue -> OK 输出结果如下:由表格DW = 0.934 故存在正一阶序列相关并由DW值并结合图形 诊断出存在序列相关序列相关 处理方法一:广义差分法操作步骤 2 :由上述操作的出 DW = 0.934 由此得出 = 0.533第一步:transform Compute中的LAG(1) 函数产生两个新变量 和 Transform -> Computer Variable -> ->OK结果如下同理生成新变量
29、 Transform -> Computer Variable -> LAG(gnp)-> OK 结果如下根据公式继续产生两个新变量 Transform -> Computer Variable -> 进口额-0.533 * -> OK 结果如下:Transform -> Computer Variable -> Gnp - 0.533 * -> OK 输出结果如下对新生成的两个因变量 自变量 进行诊断 :Analyze -> Regression -> Linear 依次点击 Statistic Plots Save 勾选相应属性(省略) - 诊断序列相关输出结果如下:DW = 1.428 < 2图像( 省略 )由DW值并结合图形 诊断出依然
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 模具合同延期补充协议
- 2025年出口商品购销合同范本
- 《2025协商解除劳动合同协议书》
- 2025机械设备购货合同模板
- 2025家居用品最简单购销合同
- 2025年货运从业资格证考试模拟考试题及答案详解
- 食品质量安全追溯系统采购协议
- 2025年泉州货运运输驾驶员从业资格证考试试题
- 青原区电梯安全管理人员会考模拟卷与答案
- 采购协议和产品质量保障承诺函
- 2022版义务教育(道德与法治)课程标准(附课标解读)
- 部编版八年级语文下册第11课《核舟记》教学课件
- 角膜溃疡护理常规
- GB/T 43706-2024资产管理战略资产管理计划(SAMP)实施指南
- 俄罗斯阿尔泰山脉的生态保护与旅游业
- (2024年)夹具设计培训
- 腹痛的护理措施
- 《我家漂亮的尺子》课件-定稿
- 区块链投资计划书
- 人口社会学(第二版) 课件 第八章 婚姻家庭
- 2024年国家公务员考试行政职业能力测试真题及详细解析(一)
评论
0/150
提交评论