心理学研究方法多元回归分析ppt课件_第1页
心理学研究方法多元回归分析ppt课件_第2页
心理学研究方法多元回归分析ppt课件_第3页
心理学研究方法多元回归分析ppt课件_第4页
心理学研究方法多元回归分析ppt课件_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元线性回归,1,内容,基础概念一元线性回归一元回归方程、线性回归条件步骤强影响点判断多元线性回归1、回归方程、线性回归条件2、线性回归步骤3、评价方程的优度4、强影响点判断5、多重共线性的判断,2,基础概念,3,回归,什么是回归?变量间存在相关关系时,也就具备了建立预测关系的基础。在相关变量见建立预测方程式的统计学方法叫做回归分析。在问卷调查中用得多包括线性和非线性、一元和多元回归分析,4,一元和多元线性回归,一元线性回归:在两个变量具有线性关系的基础上,建立预测方程式。用一个变量预测另一个变量。如儿童的身高和体重存在线性相关,当得知身高时,预测被试的体重范围。多元线性回归:多个变量都与一个变量存在相关关系,建立用预测方程式。用多个变量预测某一个变量。例如:儿童的体重和年龄,都与身高存在线性关系,当已知体重和年龄时,对身高进行预测。,一元和多元线性回归的差别在于自变量的个数,5,一元线性回归,6,一元线性回归方程(使用原始数据计算的回归方程),Y是因变量,X是自变量,alpha和beta是待求的参数。=(y/x)*r,称为非标准化回归系数=y-x,标准化回归方程(使用标准化的数据计算的回归方程),ZY=BZxB=(Zy/Zx)*r=1*r=r,称为标准化回归系数,两种方程表现形式,7,回归分析的一般过程,1、提出假设的回归模型,确定自变量和因变量。自变量是现实中容易测量的,而因变量是难测量的,如幸福感、自我效能感等2、估计回归是线性还是非线性,用散点图判断。如果是线性则用线性回归。(必须做)3、建立回归方程4、回归方程的有效性检验,测定系数和回归系数,8,一元线性回归的条件,1、线性趋势(用散点图检测)2、独立性:因变量y的取值相互独立,残差独立。用durbin-watson计算,值在0-4。如果残差间相互独立,则取值在2附近。D小于2说明相邻误差存在负相关。大于2,说明存在正相关3、正态性:自变量的任何一个线性组合,因变量y都服从正态分布,残差正态(直方图和PP图)。4、方差齐性:自变量的任何一个线性组合,因变量y的方差均相同(把ZPRED放入Y轴,把ZRESID放入X轴做图),9,注意的问题,强影响点判断(极端值的判断)Cooksdistance:当值1,表明是特别大的极端值。leverage值(杠杆值):当值3倍均数,均数为(自变量个数+1)/N画散点图:最后把cook距离值和leverage杠杆值分别作为X和Y轴画散点图,方便判断。强影响点处理判断原因,考虑是否删除,10,一元线性回归例子,建立体重和肺活量的回归方程(用练习1的数据),11,一元线性回归步骤,先探索数据,判断是否整态、极端值画散点图(画出散点图后,双击图,右键选addfitlineattotaltool)Analyze-regression-把肺活量放入因变量dependent-体重放入自变量independentStatistics-默认的-residuals-durinwastonsavedistance勾上Cooks和leverage值Plots-histogram和normalprobabilityplot勾上-把ZPRED放入Y,把ZRESID放入X轴OK,12,=(y/x)*r=(0.41989/7.426)*0.881=0.04981=y-x=3.1027-0.04981*53.43=0.441,原始回归方程Y=0.0498X+0.441标准化回归方程Zy=0.881Zx,13,测定系数,判断因变量Y是独立的,回归方程的显著性检验,回归方程的系数、标准化回归系数、回归系数的显著性检验,14,决定系数,决定系数R2值域在0,1,越接近于1,表明方程的自变量对y的解释能力越强。当变量的关系是线性关系时,R2越大,说明回归方程拟合数据越好,共变越多。,校正的决定系数:随着自变量的增加,R2自然就会随之增加。所以R2是一个受自变量个数与样本规模影响的系数,一般的常规是1:10为好。当这个比例小于1:5时,R2倾向于高估实际的拟合优度。为了避免这种情形,常用校正的R2代替。,15,回归方程显著:说明X与Y有显著的线性关系。用该方程表示X与Y之间的关系是可靠的。如果不显著,则不能用回归方程表示X与Y之间的关系。,16,残差的正态性,对比直方图和正态曲线的相似性,是否是中间高,两头低。P-P图的点是不是接近对角线。,17,残差齐性,18,多元回归,19,偏回归系数:当其他变量不变时,xi每改变一个单位,所预测的y的平均变化量。受到自变量的单位影响。因此可以用标准化回归系数。标准化偏回归系数:可以用来比较哪个自变量是影响y的主要因素,哪个是次要因素(即哪个自变量对y的影响更多)。,多元回归方程,20,回归系数计算,标准化偏回归系数(假如有两个自变量)B1=(r1y-r2y*r12)/(1-r212)B2=(r2y-r1y*r12)/(1-r212)非标准化偏回归系数b1=B1*(sy/sx1),21,多元回归的样本量要求,多元回归模型的样本量要求根据经验,希望样本量在自变量数的20倍以上。,比如:有5个自变量,则样本量应该在100以上,少于此数可能会出现检验效能不足的问题,22,多元线性回归的条件,同一元线性回归的条件,23,回归分析的5个步骤,24,回归分析的步骤,1、做出散点图,观察变量间的趋势(是否线性)。这些图是用来观察是否是线性趋势。如果不是线性,可能考虑其他对变量进行预处理,或用曲线回归,注意:是否是曲线关系,或者强影响点造成的线性,或者极端值),25,2、考察数据的分布,进行必要的预处理。3、进行直线回归,选入变量进入计算。回归方程是否显著偏回归系数显著根据决定系数,校正决定系数判断拟合得好不好。决定最优方程,回归分析的步骤,26,4、残差分析,分析两方面:残差是否独立:用durbin-watson进行分析(取值02。残差是否正态:采用残差图显示(勾选Histogram和Normalprobabilityplot就行)。残差的方差齐性:以标准化预测值(ZPRED)为横轴,标准化残差(ZRESID)为纵轴做散点图。若散点随机分布,且绝大部分在2倍标准差以内,则最好,表明没有相关。如最左图最好。中间图随着x值,残差越来越大。最右图,残差非正态。,回归分析的步骤,27,残差是否正态:画图来评价1、残差直方图:标准化残差为x轴,标准化残差频数为Y轴。与正态曲线比较,是否拟合。2、残差p-p图:累积残差观测分布为x轴,期望分布为Y轴。如果符合的话数据会和理论的直线(对角线)重合。,回归分析的步骤,28,5、根据散点图,对强影响点进行判断和对多重共线性进行判断(自变量之间不能有强相关。)最后两幅图是有强影响点。需要判断是否数据出错,出错则删掉。,回归分析的步骤,29,步骤同一元回归,补充步骤在statistic勾上Rsquarechange,partandpartialcorrelation(半偏相关和偏相关),conlineraritydiagnostics(共线性判断),30,分层回归方法,Enter:强制进入Forward:前向选择法Backward:反向删除法Stepwise:逐步回归,最常用把需要控制的变量用这种方法强制enter法放入方程自由进入变量用forward、backward和stepwise方法放入方程,31,Enter法,32,逐步回归法(可以得出更优的方程),33,决定系数的变化量,34,回归方程的显著性检验,保留的变量,因为回归系数和偏回归系数显著,删除的变量,因为标准化回归系数不显著,35,多重共线性判断,36,回归方程的显著性检验偏回归系数的显著性检验决定系数R2,校正决定系数R2复相关系数R,回归方程的解释能力,37,回归方程的解释能力,回归方程的显著性检验当显著时,便可以认为回归方程中至少有一个回归系数是显著的,但是并不一定多有的回归系数都是显著的。偏回归系数的显著性检验判断指定的某个自变量的回归系数是否显著。显著的话,代表与残差相比,该x变量对y的贡献是显著的。根据回归系数显著、偏回归系数显著、校正的决定系数判断最优方程。,38,复相关系数R值域在0,1,是因变量y与所有自变量之间的多元线性相关程度的度量。R值越接近于1,表明y与所有x之间的线性关系越密切。,39,对强影响点的诊断

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论