版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、简单回归分析,回归分析(regression variable): 研究一个变量如何随另一个变量变化的常用方法。 线性回归(linear regression):又称简单回归(simple regression) 两个连续型变量之间线性依存关系的统计方法。即描述一个因变量(dependent variable)Y与一个或多个自变量( independent variable )X之间的线性依存关系。,回归分析的要求,1、应变量Y服从正态分布 2、自变量X可以是随机变动的,也可以是精确测量或人为取值的变量 线性回归模型的适用条件(line) L-线性 I-独立性 N-正态性 E-方差齐性,残差图
2、,方差不齐,模型还有别的变量需要引入,曲线关系,方差齐、直线关系,Analyze regression linear(线性回归分析)可进行以下几个过程 1、建立回归方程; 2、回归方程的配合适度检验:包括回归方程和回归系数或偏回归系数的假设检验、残差分析; 3、直线回归的区间估计:包括总体回归系数的区间估计;当x为某定值时,估计值总体均数的可信区间和个体Y值的容许区间 4、直线相关和偏相关分析。,Linear regression对话框,Method:自变量筛选下拉菜单,Enter:强迫引入法;全部自变量均引入方程 Stepwise:逐步引入 Remove:强迫剔除法 backward:向后剔
3、除法 Forward:向前引入法,Statistics对话框,独立性检验,Plots对话框,Options对话框,例题11-1操作步骤:1、定义变量,输入数据,先检验适用条件,一、线性(散点图): 1、x与y 2、x与非标准化残差的散点图(在多重回归分析中,效率高于散点图矩阵) 步骤: graphsscatter/Dotsimple scatter,非标准化残差与自变量的散点图(从上图可见各点基本平均分布在0这条水平线的两边,没有明显偏正或偏负的趋势),二、正态性、方差齐性检验 1、正态性即残差服从正态分布N(0,2) 2、方差齐性即残差的大小不随所有变量取值水平的改变而改变(标准化预测值和标
4、准化残差的散点图) 3、步骤: analyzeregressionlinear plot,正态性检验,方差齐性检验,正态性检验结果:QQ图上各点基本在直线上。,从上图可见,不论Y的标化预测值如何变化,标化残差的波动基本保持稳定。,四、独立性:各观测间相互独立,即任两个观测残差的协方差为0。 步骤: 通过linear regression过程statistics按钮中的durbin-watson检验进行判断。 该统计量取值在04之间。一般若自变量数少于4个,统计量接近2,基本上可以肯定残差间相互独立。,2、分析 Analyze -regression - linear Linear regres
5、sion对话框,Statistics对话框,散点图1:因变量为Y轴标准化预测值为X轴,散点图1:因变量为标准化残差标准化预测值为X轴,保存以下新变量,描述性统计:均数、标准差、例数,相关分析:Pearson相关系数0.964、单侧检验p值为0.001,先是自变量纳入模型情况的汇总,模型的简单汇总,包括R、R2,调整R2 ,,方差分析:p0.001,说明模型有意义(回归系数有统计学意义)。,:,t检验结果等(重要)常数项=1106.788,回归系数=61.423,直线回归方程为 第一行:对截距a的检验,有意义。 第二行:对回归系数b的检验,有意义。回归系数的标准误=4.881,总体回归系数95%
6、可信区间为(50.788,72.058)。标准化回归系数=0.964,回归系数t检验的t值为12.584,p0.001,可认为两变量之间有直线关系,,残差统计结果:显示预测值、标准预测值等统计量的最小值、最大值、均数和标准差,P-P图,散点图: Y轴:因变量,x轴:标准化预测值,散点图: Y轴:标准化残差, X轴:标准化预测值,显示增加新变量,二、非线性回归 例11-6,直线方程,对数方程,二次方程,三次方程,指数方程,多重线性回归分析,研究一个因变量与多个影响因素之间的关系 反应变量:连续计量资料,正态随机变量 多重线性回归,例13-1(第六版) 为了研究有关糖尿病患者体内脂联素水平的影响因
7、素,某医师测定30名患者的体重指数BMI(kg/m2)、病程LEP(ng/ml)、空腹血糖FPG(mmol/l)及脂联素水平。,例13-1:1、定义变量,输入数据,考察线性 1、散点图矩阵graphsscatter/Dotmatrix scatter 2、自变量与残差的散点图 graphsscatter/Dotsimple scatter,选择enter,(选入全部变量),描述,两两相关(简单相关),模型的基本情况,四个自变量全部选入的复相关系数、决定系数、调整决定系数、标准误,方差分析结果,模型有意义,系数(回归系数b、b的标准误、标准回归系数、t值、p值),多重共线性诊断一般,容忍度(To
8、lerance)小于0.1时,严重共线性方差膨胀因子VIF(Variance inflation factor)一般不应大于5,或大于10,2、分析Analyze -regression - linear 因变量:脂联素 自变量:其他四个变量全部选入 method:选择逐步stepwise,模型基本情况(每一步引入模型的变量,纳入、剔除自变量的水准0.05、0.10),模型概况第一行,引入一个变量第二行,引入两个变量,方差分析1,引入一个变量2,引入两个变量,例12-1(第七版),1、定义变量,输入数据,考察线性 1、散点图矩阵graphsscatter/Dotmatrix scatter 2
9、、自变量与残差的散点图 graphsscatter/Dotsimple scatter,graphsscatter/Dotsimple scatter,Analyze -regression - linear linear regression对话框选择enter,(选入全部变量),描述,两两相关(简单相关),模型的基本情况,四个自变量全部选入的复相关系数、决定系数、调整决定系数、标准误,方差分析结果,模型有意义,系数(回归系数b、b的标准误、标准回归系数、t值、p值),多重共线性诊断一般容忍度(Tolerance)等于1-R2,越小共线性越严重,方差膨胀因子VIF(Variance inflation factor)等于容忍度的倒数大于10时提示共线性严重,特征根(Eigenvalue)为0,提示共线性严重条件指数(condtion index)大于30,提示共线性严重,2、分析A
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026湖南岳阳临湘市第一中学高中代课教师招聘笔试备考题库及答案解析
- 2026山西警察学院招聘博士研究生20人考试备考题库及答案解析
- 2026国网重庆市电力公司高校毕业生招聘218人(第二批)笔试参考题库及答案解析
- 2026年青岛农商银行校园招聘考试参考试题及答案解析
- 2026广西北海市银海区财政局招聘1人考试参考试题及答案解析
- 2026广西防城港市公安局防城分局第一次公开招聘警务辅助人员50人笔试参考题库及答案解析
- 2026广东东莞市厚街镇白濠小学招聘心理老师1人笔试备考题库及答案解析
- 2026山东海化骊潍新材料有限公司招聘12人笔试参考题库及答案解析
- 2026四川省西南医科大学附属医院招聘话务员及前台导诊岗2人笔试模拟试题及答案解析
- 柴油发电机组保养手册
- GB/T 46470-2025皮革色牢度试验颜色迁移到聚合物上的色牢度
- 2026药用辅料附录检查指导原则
- 全球核安全形势课件
- 2026福建泉州市选优生选拔引进笔试考试备考试题及答案解析
- 工地花岗岩施工技术交底
- 2025年国企招聘考试(纪检)综合能力测试题及答案
- 汽车电气构造与维修(第二版)课件:电源系
- 电力行业面试问题
- 《智慧供水厂建设工程技术标准》
- 2025年辽宁医药职业学院单招职业适应性测试题库及参考答案
- 幼儿园科学探究活动设计及案例分析
评论
0/150
提交评论