多元统计分析原理与操作技术.ppt_第1页
多元统计分析原理与操作技术.ppt_第2页
多元统计分析原理与操作技术.ppt_第3页
多元统计分析原理与操作技术.ppt_第4页
多元统计分析原理与操作技术.ppt_第5页
已阅读5页,还剩111页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七讲 多元统计分析原理与操作技术,宁波大学 张 林,心理学硕士研究生基础平台课程,数据分析,描述统计,推断统计,平均数 标准差,相关 系数,差异检验,相关分析,方差分析(ANOVA),方差分析是一种通过分析样本数据各项差异的来源,以检验二个或二个以上样本空间的平均数是否相等或是否具有显著差异的方法。 方差分析的原理 变异分解 总变异 = 随机变异 + 实验处理所导致的变异 总变异 = 组内变异 + 组间变异 F值 = 组间变异(MSb)/ 组内变异(MSw) 方差分析的主要功能是分析因变量的总变异中不同来源的变异,然后用系统变异误差变异来看各种变异对总变异影响。,实验中各种变异的控制 使系统变异的效应增大; )选取适当的自变量的水平; )选择对自变量敏感的因变量; 控制无关变异; )随机化; )消除(恒定的方法); )匹配; )附加自变量; )统计控制; 使误差变异最小;(被试和测量工具) 注:实验设计的精髓就是增大系统变异,控制无关变异和减少误差变异,方差分析的基本假设条件 正态分布(normolity); 变异的同质性(homogeneity of variance); 独立性(independence);,一、单因变量,1.单自变量 1.1 自变量2个水平 独立样本:独立样本t检验 相关样本:相关样本t检验,1.2 多个水平,独立样本:one-way 差异显著后,需事后比较,post hoc。 相关样本:repeated measure 差异显著后,需事后比较,做两两相关样本t检验。,2.两个自变量,2.1 两因素都是被试间设计 交互效应不显著,主效应显著,对主效应做事后比较; 交互作用显著,对交互效应做简单效应检验。,处理(treatment)与处理水平的结合(treatment combinations) 处理和处理水平的结合都是指实验中一个特定的独特的实验条件 主效应(main effects)与交互作用(interaction) 实验中由一个因素的不同水平引起的变异叫因素的主效应在一个多因素实验中,一个因素的不同水平对另一个因素的不同水平的影响叫做因素之间的交互作用,简单效应(simple effects) 在因素实验设计中,一个因素的水平在另一个因素的某个水平上的变异叫做简单效应。 图 A因素在B、B水平的简单效应,B2,图 B因素在A、A水平的简单效应,因素,实验得出的数据如下:,A 教学方法,B 学习能力,a1 正常讲授教学,a2 独立学习和讨论,b1 能力较高的,b2 能力较低的,例如,一个研究要探讨两种教学方法对不同能力学生学习成绩的影响。研究中有两个因素,如下所示:,下面我们用图解的方式观察一下各因素的影响及交互作用的情况:,图3 两种教学方法对不同能力学生学习成绩的影响,100,90,80,70,60,A1,A2,(79),(78),100,100,90,90,80,80,70,70,60,60,(86),(66),(92),(64),(78),(80),教学方法与学习能力对学生学习成绩的影响,B1,B1,B2,B2,(a),(b),(c),由图(a)可以看出,学生的学习能力对学习成绩有重要影响。,由图(b)可以看到,若只考察教学方法的影响,我们会发现两种教学方法对学生学习成绩的影响没有明显的差别。,只有当同时考察两个因素的作用时,才能观察到它们之间的真实关系:在a1的条件下能力高与能力低的学生的成绩没有差异,而当使用教学方法a2时,能力高与能力低学生的学习成绩出现了显著的差异。(见图(c))。,a1,a2,两个被试间变量的简单效应检验程序,A因素有三个水平,B因素有两个水平,因变量是Y 1.检验B因素在A的三个水平上的简单效应 MANOVA Y BY A(1,3) B(1,2) /DESIGN= B WITHIN A(1) /DESIGN= B WITHIN A(2) /DESING= B WITHIN A(3). 2.检验A因素在B的两个水平上的简单效应 MANOVA Y BY A(1,3) B(1,2) /DESIGN= A WITHIN B(1) /DESIGN= A WITHIN B(2).,2.2 两因素都是被试内设计,交互效应不显著,主效应显著,对主效应做事后比较; 交互作用显著,对交互效应做简单效应检验。,两个被试内变量的简单效应检验程序,A因素有三个水平,B因素有两个水平 1.检验B因素在A的三个水平上的简单效应 MANOVA A1B1 A1B2 A2B1 A2B2 A3B1 A3B2 /WSFACTORS=A(3) B(2) /WSDESIGN= B WITHIN A(1) /WSDESIGN= B WITHIN A(2) /WSDESING= B WITHIN A(3). 2.检验A因素在B的两个水平上的简单效应 MANOVA A1B1 A1B2 A2B1 A2B2 A3B1 A3B2 /WSFACTORS=A(3) B(2) /WSDESIGN= A WITHIN B(1) /WSDESIGN= A WITHIN B(2).,2.3 两因素混合设计,交互效应不显著,主效应显著,对主效应做事后比较; 交互作用显著,对交互效应做简单效应检验。,两因素混合设计的简单效应检验程序,A是被试内变量,有三个水平;B是被试间变量,有两个水平。 1.以被试内变量为标准分类的程序: MANOVA A1 A2 A3 BY B(1,2) /WSFACTORS =A(3) /WSDESIGN /DESIGN /WSDESIGN =MWITHIN A(1) MWITHIN A(2) MWITHIN A(3) /DESIGN =B. 2.以被试间变量为标准分类的程序: MANOVA A1 A2 A3 BY B(1,2) /WSFACTORS =A(3) /WSDESIGN /DESIGN /WSDESIGN =A /DESIGN =MWITHIN B(1) MWITHIN B(2).,3.三个自变量,3.1 三个自变量都是被试间设计 交互效应不显著,主效应显著,对主效应做事后比较; 交互作用显著,对交互效应做简单效应检验。,三个被试间变量的简单效应检验程序,A因素有两个个水平,B因素有两个水平,C因素有两个水平,因变量是Y 1.检验在c1水平上,B因素在A1和A2水平的简单效应;检验在c2水平上,B因素在A1和A2水平的简单效应; MANOVA Y BY A(1,2) B(1,2) C(1,2) /DESIGN= B WITHIN A(1) /DESIGN= B WITHIN A(2) /DESING= B WITHIN C(1) /DESING= B WITHIN C(2) /DESING= B WITHIN A(1) WITHIN C(1) /DESING= B WITHIN A(1) WITHIN C(2) /DESING= B WITHIN A(2) WITHIN C(1) /DESING= B WITHIN A(2) WITHIN C(2).,自变量个数和自变量水平的个数,自变量个数最好不超过3个 自变量水平个数最好不超过6个,二、多因变量,Multivariate(多元方差分析) 多元方差分析,就是说存在着不止一个因变量,而是两个以上的因变量共同反映了自变量的影响程度。比如要研究某些因素对儿童生长的影响程度,则身高、体重等都可以作为生长程度的测量因子,即都应作为因变量。,Multivariate(多元方差分析),相关分析,1.两个变量之间的相关,散点图做法。 2.偏相关分析是在相关的基础上考虑了两个因素以外的各种作用,或者说在扣除了其他因素的作用大小以后,重新来考虑这两个因素间的关联程度。这种方法的目的是消除其他变量关联性的传递效应。,偏相关分析在理解检验变量和控制变量之间的关系时,通常有两种解释或模型,一种是共同作用假设,另一种是中介变量假设。 被作用变量A 共同作用变量 被作用变量B 作用变量 中介变量 被作用变量 (变量A) (变量B),(1) 在共同作用假设模型中,两个变量相关显著的原因在于他们都受同一变量的影响。如果这个起共同作用的变量不存在,即排除共同作用变量的效应,则两个分析变量的相关系数应为0。 (2) 在中介变量假设模型中,两个变量相关显著的原因在于变量A通过中介变量影响了变量B 。在排除中介变量的效应后,两个变量的相关系数显著逐渐降低或为0。,学习策略、学习效能感、学习坚持性与学业成就的相关分析,回归分析,1.一元回归分析 2.多元回归分析,回归系数的意义 回归方程的检验 回归系数的检验 Methods的区别 多重共线性 虚拟变量转换,方程系数的意义,=a+bx,a,,B,F,t,R2,回归方程的检验,回归系数的检验,H0:Bj=0 H1:Bj0 t检验,Methods的区别,自变量的显著,且R2尽可能大。 同时分析法,将所有的预测变量同时纳入回归方程中估计因变量。分为Enter和Remove。 逐步分析法,依据解释力的大小,逐步地检查每个自变量的影响,分为Forward和Backward。 Stepwise,按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。 层次分析法,有明确的理论依据,按顺序进入。,多重共线性(定义),当自变量高度相关时,就会互相削弱各自对y的边际影响,使本身的回归系数下降而其标准误扩大,于是就会出现回归方程整体显著,但各个自变量都不显著的现象,即多重共线性。,多重共线性(表现),1.方程检验F值显著,但是不显著; 2.自变量的r12很高; 3.多个自变量时,某一自变量可以被其他自变量线性表达。 方程的确定系数很高,但每一自变量的偏确定系数很小。,多重共线性(对策),1.去掉与因变量相关低,而与其他自变量高度相关的变量; 2.去掉可以被其余变量线性表出的变量; 3.增加样本; 4.组合自变量; 5.数据转换,当自变量为分类变量时,必须先将分类变量转化为虚拟变量,然后再将它 们引入回归方程,所得到的回归结果才有明确的意义解释。 虚拟变量:虚拟变量是将分类变量加以量化描述的一种假设的变量,当某种品质或属性出现时为1,不出现时为0。只有两个取值:0,1。虚拟变量数等于分类变量的水平数减一。将不设虚拟变量明确表示的类别为参照类。 例:,汉族(1),藏族(2),回族(3),汉族1,说明:1表示是,0表示否,1,0,0,1,0,0,是汉族,而非藏族,也非回族,是藏族,而非汉族,也非回族,是回族,而非汉族,也非藏族,虚拟变量,原变量,藏族1,回族1,0,0,1,其他民族(4),0,0,0,非汉族,非藏族,也非回族,因而是其他民族,虚拟变量的回归分析,方差分析主要用于探讨不同来源的变异对总变异的影响大小,从而确定自变量对因变量的重要性。使用方差分析应满足的基本假设为:总体正态分布;变异是可加的;各处理内及实验组内部的方差一致。扩大组间差异,减小组内差异。 回归分析是通过观测值寻求自变量与因变量之间的函数关系的一种统计方法,它所要解决的主要问题是:在相关变量间建立数学关系式,即回归方程;检验回归方程存在的统计合理性,并对各自变量对因变量影响的显著性进行检验;利用回归方程进行预测和控制,并了解这种结果的精确程度。,回归分析与方差分析,单个分类变量的不同类别时,等价于单因素方差分析,回归系数检验等价于不同类别与参照类平均值之差的t检验。,多个分类变量形成的虚拟变量,等价于多因素方差分析,只考虑主效应。,既有分类变量,又有连续变量,等价于协方差分析,假定交互作用为0。,(五)交互作用,当某一自变量对因变量的作用大小与另一个自变量的取值有关时,则表示两个变量有交互作用(interaction)。 检验两变量间有无交互作用,普遍的做法是在方程中加入它们的乘积项再做检验。如考察X1、X2间的交互作用,可在模型中加入X1X2项。,Interaction coefficient: C X1 and X2 must be in model for interaction to be properly specified.,Interaction Model With 2 Independent Variables,1. Hypothesizes Interaction Between Pairs of X Variables Response to One X Variable Varies at Different Levels of Another X Variable,Interaction Model With 2 Independent Variables,1. Hypothesizes Interaction Between Pairs of X Variables Response to One X Variable Varies at Different Levels of Another X Variable 2. Contains Two-Way Cross Product Terms,1. Hypothesizes Interaction Between Pairs of X Variables Response to One X Variable Varies at Different Levels of Another X Variable 2. Contains Two-Way Cross Product Terms 3. Can Be Combined With Other Models Example: Dummy-Variable Model,Interaction Model With 2 Independent Variables,Effect of Interaction,Effect of Interaction,1. Given:,Effect of Interaction,1. Given: 2. Without Interaction Term, Effect of X1 on Y Is Measured by 1,Effect of Interaction,1. Given: 2. Without Interaction Term, Effect of X1 on Y Is Measured by 1 3. With Interaction Term, Effect of X1 on Y Is Measured by 1 + 3X2 Effect Increases As X2i Increases,Interaction Model Relationships,Interaction Model Relationships,E(Y),X1,4,8,12,0,0,1,0.5,1.5,E(Y) = 1 + 2X1 + 3X2 + 4X1X2,Interaction Model Relationships,E(Y),X1,4,8,12,0,0,1,0.5,1.5,E(Y) = 1 + 2X1 + 3X2 + 4X1X2,E(Y) = 1 + 2X1 + 3(0) + 4X1(0) = 1 + 2X1,Interaction Model Relationships,E(Y) = 1 + 2X1 + 3X2 + 4X1X2,E(Y) = 1 + 2X1 + 3(1) + 4X1(1) = 4 + 6X1,E(Y) = 1 + 2X1 + 3(0) + 4X1(0) = 1 + 2X1,Interaction Model Relationships,Effect (slope) of X1 on E(Y) does depend on X2 value,E(Y) = 1 + 2X1 + 3X2 + 4X1X2,E(Y) = 1 + 2X1 + 3(1) + 4X1(1) = 4 + 6X1,E(Y) = 1 + 2X1 + 3(0) + 4X1(0) = 1 + 2X1,Interaction Model Worksheet,Multiply X1 by X2 to get X1X2. Run regression with Y, X1, X2 , X1X2,路径分析原理,递归(recursive)模型,Z1,Z1,Z1,Z1,e1,e2,43,31,41,32,42,图1 递归模型路径图 只有单向的直线箭头,且误差之间没有弧线箭头联系,路径分析基本步骤,1.根据相关理论与文献数据,建构一个可以检验的初始模式,并绘出一个没有路径系数的路径图 2.选用适当的回归模式,以估计路径系数并检验其是否显著,进而估计残差系数. 所谓残差系数是因变量变异量中自变量无法解释的部分,其求法是e=1-R2(R2是决定系数),3.评估理论模式,可再删除不显著的路径系数,重新计算新模式的路径系数. 在删除部分的影响路径后,会成为一种”限制模式”,由于预测变量数的改变,路径系数也跟着改变,因而要重新进行复回归分析。,路径系数的求法,將路径模式分解为数個回归方程式 求各回归方程式中各預測变数之值 各預測变数之值即为所对应之路径系数,冲突,情绪,分离,亲密,外生变量,中介变量,内生变量(最终结果变量),中介变量,路径图(结构模式),路径结构中的变量,外生变量(exogenous variables) 只能是因的变量,有箭头指向別的变量但沒有箭头指向它 两外生变量间可能有相关(以双向箭头表示),也可能独立无关 内生变量(endogenous variables) 作为果的变量,有箭头指向它,包括: 中介变量:既是果又为因 最终结果变量(ultimate response variable):只有箭头指向它,而不会指向别的变量。,方程式 1:,亲密= 14 冲突 + 34分离 + 24情绪,-.173,-.527,-.106,方程式 2:,分离 = 13 冲突 + 23情绪,.642,.079,方程式 3:,情绪 = 12 冲突,.263,路径系数的显著性检验,以回归分析中的 显著性检验作为其路径系数的显著性检验,分離 3,变量间的影响效果,直接效果 (direct effect) 直接是从自变量到因变量间的效果 其路径系数即为直接效果的值,冲突至亲密的直接效果 其值为-.106,间接效果 (indirect effect) 自变量到因变量之間,所有通过中介变量的效果 其效果的值为路径系数乘积和,冲突至亲密的间接效果有三: 1.冲突分离亲密:.642*-.527= -.338 2.冲突情绪分离亲密:.263*.079*-.527= -.01 3.冲突情绪亲密:.263*-.173= -.045 间接效果= -.338+ -.01+ -.045 = -.393,可能效果 (spurious effect) 自变量到因变量间的效果,只是兩者均受另一共同变量的影响 其效果的值为路径系数乘积,分离 3,冲突 1,情绪 2,亲密 4,-.173*,-.527*,-.106*,.642*,.079*,.263*,分离至亲密的可能效果 其值为 .079*-.173= -.01,Total effect,Error term,Total causal effect,Spurious effect,Direct effect,Indirect effect,X对Y的影响是通过兩者的共同变量,等于r,亦即r可以分解为:,等于1-R2,变量间的相关系数的分解,自变量到因变量间的总效果(total effect)即为兩变量间的相关 总效果(total effect)=总因果效果(total causal effect) +所有可能效果 (spurious effect) 总因果效果(total causal effect)=直接效果 (direct effect)+所有间接效果 (indirect effect),中介效应与调节效应分析,中介变量(mediator) 考虑自变量X 对因变量Y 的影响,如果X 通过影响变量M 来影响Y ,则称M 为中介变量。,中介效应的分析方法,传统的做法是依次检验回归系数。 如果下面两个条件成立,则中介效应显著: (i) 自变量显著影响因变量; (ii) 在因果链中任一个变量,当控制了它前面的变量(包括自变量) 后,显著影响它的后继变量,这是Baron 和Kenny 定义的(部分) 中介过程。 (iii) 在控制了中介变量后,自变量对因变量的影响不显著, 变成了Judd 和Kenny 定义的完全中介过程。,在只有一个中介变量的情形,上述条件相当于: (i) 系数c 显著(即H0 : c =0 的假设被拒绝) ; (ii) 系数a 显著(即H0: a =0 被拒绝) ,且系数b 显著(即H0: b =0 被拒绝) ,中介效应显著。 完全中介过程还要加上: (iii) 系数c不显著。,中介效应的三种检验假设,c=c+ab 1. H0: c=0 + a=0 + b=0 (+ c=0) 2. H0: ab=0 3. H0: c-c=0,实例分析1,教师喜欢程度的中介效应分析 假设学生行为(即被试的违纪捣乱行为)会影响老师对他的喜欢程度,而同伴关系会受到老师喜欢程度的影响,则喜欢程度是中介变量。,学生行为,同伴关系,老师的喜欢程度,X,Y,M,Y,喜欢程度(w)的中介效应分析结果见表,结果是标准化的解 由于依次检验(指前面3个t检验)都是显著的,所以喜欢程度的中介效应显著; 由于第四个t检验也是显著,所以是部分中介效应; 中介效应占总效应的比例为0.338 0.3490.232= 0.508,教师管教方式的中介效应分析 假设学生的行为会影响老师的管教方式,而管教方式会影响同伴关系,则管教方式是中介变量。,教师管教方式,学生行为,同伴关系,Sobel检验程序,/preacher/sobel/sobel.htm,0.11*(0.12*),-0.10*(-0.12*),调节变量(moderator),变量Y与变量X的关系是变量M 的函数,称M 为调节变量,影响因变量和自变量之间关系的方向(正或负)和强弱。,调节效应的假设,Y=aX+bM+cXM+e Y=bM+(a+cM)X+e H0: c=0,调节效应的分析方法,1,2,3,4,1.类别+类别,自变量类别变量,调节变量类别变量 采用方差分析检验交互效应是否显著简单效应分析(在调节变量的不同水平上,自变量的差异),2.连续+连续,自变量连续变量,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论