北师大心理统计学10 因果模型Causal Model课件_第1页
北师大心理统计学10 因果模型Causal Model课件_第2页
北师大心理统计学10 因果模型Causal Model课件_第3页
北师大心理统计学10 因果模型Causal Model课件_第4页
北师大心理统计学10 因果模型Causal Model课件_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因果模型(CausalModel),主要内容,因果模型概述递归模型递归模型的应用,主要内容,因果模型概述递归模型递归模型的应用,因果模型概述,回归模型的局限因果模型与传统的回归模型因果模型的表示方法因果模型的种类因果模型的识别模型的参数估计模型的效应分解,因果模型概述,回归模型的局限因果模型与传统的回归模型因果模型的表示方法因果模型的种类因果模型的识别模型的参数估计模型的效应分解,回归模型,因变量确定为学生学业成绩(变量X5),自变量包括同伴关系(变量X1)、教师期望(变量X2)、学习能力(变量X3)以及自尊(变量X4),因果模型,因变量确定为学生学业成绩(变量X5),自变量包括同伴关系(变量X1)、教师期望(变量X2),中介变量包括学习能力(变量X3)、自尊(变量X4),因果模型,标准化总因果效应(X2)(X4)教师期望自尊(X5)-学业成绩0.720.39标准化直接因果效应(X2)(X4)教师期望自尊(X5)-学业成绩0.160.39,因果模型与传统回归模型,回归模型多个自变量一个因变量没有中介变量自变量没有测量误差只有单向路径,因果模型多个自变量多个因变量有中介变量自变量有测量误差*(本节先考虑没有情形)可以有往返路径,因果模型简介,因果模型是一种“证实性技术”因果模型并不是用来推论变量之间是否存在因果关系,而只是用来验证某一假设的理论因果模型与数据的拟合程度,方法本身只具有事后验证的作用。在使用这种方法时,研究者首先应当假设所依赖的理论体系是完整的,即它包含了所有的重要变量,而且具有相当可靠的测量信度和效度。,因果模型的表示方法,因径图表示矩形框:观测变量线条:单箭头与双箭头路径系数:第一个下标标志着结果变量第二个下标标志着原因变量外源变量内源变量及其误差,因果模型表示方法,模型表示:例:上面表示的因果模型可以写作,因果模型表示方法,模型表示Y=Y+X+Y为内源观测变量的矩阵X为外源观测变量的矩阵为内源观测变量y的路径系数矩阵,为外源观测变量x的路径系数矩阵,为内源观测变量y的误差矩阵。,因果模型的种类,递归模型:指的是那些因果关系结构中全部为单向链条关系、无反馈作用的模型。非递归模型:模型中任何两个变量间存在双向因果关系(也就是有直接反馈作用)的情况变量间虽然没有直接反馈作用,但存在间接反馈作用的情况某个变量存在自身反馈作用(也就是变量存在自相关)此外,还有一种判断是否为非递归模型的途径是看每一个内衍变量的误差项是否与其他有关项目相关。主要表现在:a.一个结果变量的误差项与其原因变量相关b.不同变量之间的误差项之间存在相关,非递归模型的不同形式,因果模型的识别,(1)恰好识别(justidentified):指方程式的个数等于要估计的参数的个数的模型,因此每个参数都能求得唯一解。饱和的递归模型都是恰好识别的模型。(2)超识别(overidentified):指方程式的个数多于参数估计所需要方程数的模型,这实际上是对参数(路径系数)强加某些限制而产生的模型。超识别模型一般是针对不饱和模型而言的。(3)不足识别(underidentified):指的是模型上方程式的个数少于待估参数的个数,无法确定模型参数。,模型的参数估计,递归模型可以直接通过最小二乘法回归(OLS)或者运用线性代数求解方程的方法来取得路径系数的估计值非递归模型的参数估计过程比递归模型要复杂的多,有时可能无解,模型效应分解,对变量间的相关系数进行分解,去探讨变量间的关系。,模型效应分解,直接因果效应原因变量对结果变量的直接作用。间接因果效应一个变量首先作用于中介变量,然后再通过中介变量对另一变量产生的效应。虚假相关两变量间存在着相关关系,不是因为这两个变量间确实存在着相关,而是因为两个变量和第三变量共同发生联系,第三变量的变化致使这两个变量表现出共同变化的趋势。未分解效应两变量间存在着相关关系,但在模型内又找不到共同的前置变量时,称这两个变量间存在着未分解效应。,递归模型的原理,基本性质假设条件递归模型的识别参数估计效应分解及方法递归模型的检验与调试共线性问题,基本性质,递归模型是相对于非递归模型而言的,它指的是那些因果关系结构中全部为单向链条关系、无反馈作用的模型。这种模型具有以下一些基本性质:1.所有的递归模型都是可识别的。2.递归模型的假设条件允许采用最小二乘法回归来取得联立方程组中各个系数的无偏估计。,递归模型的假设条件,1.因果模型中各变量之间的关系为线性、可加的因果关系。变量之间呈线性关系意味着原因变量的每一单位变化引起结果变量的变化量不变。在因果模型中,变量间的线性关系使得多个原因变量作用于一个结果变量时,各原因变量的作用可以迭加。2.每一内衍变量的误差项与前置变量不相关,也不得与其它内衍变量的误差项相关。3.模型中因果关系必须为单向,不得包括各种形式的反馈作用。4.模型中各变量均为间距测度等级5.各变量的测量不存在误差,递归模型的识别,递归模型都是可以识别的,因此在递归模型的识别中无须考虑能否识别的问题,而是需要着重探讨可识别的模型究竟是“恰好识别”还是“过度识别”的。,递归模型的参数估计,最小二乘法(OLS)解线性方程组,模型效应分解方法,路径回溯方法(therulesfortracingpaths)(1)根据研究需要选择要进行效应分解的一对变量(2)起始点:当这对变量间存在着因果关系时,路径回溯需要从果开始。如果这对变量间不存在因果关系(如X1与X2之间),那么路径回溯的起始点可以由自己决定,但是一旦选定,有关这对变量的路径回溯都要从这个变量开始。(3)规则:a.从起始点,逆着路径箭头回溯,一直到达另一个变量为止。b.每个中介变量只能通过一次c.两个变量间的每条特定路径只能经过一个非因果变量d.从起始点开始,路径回溯一直逆向行进,而一旦经过了顺向箭头的路径,就不能再通过逆向箭头的路径了。,效应分解举例,路径回溯过程路径路径1:从X5开始,逆箭头而行,直接回溯到X2X2X5路径2:从X5开始,逆箭头而行,通过X3,回溯到X2X2X3X5路径3:从X5开始,逆箭头而行,通过X3,再经X4,回溯到X2X2X4X3X5路径4:从X5开始,逆箭头而行,经X3,再经X1、X4,回溯到X2X2X1X4X3X5路径5:从X5开始,逆箭头而行,通过X3,再经X1,回溯到X2X2X1X3X5路径6:从X5开始,逆箭头而行,通过X4,回溯到X2X2X4X5路径7:从X5开始,逆箭头而行,通过X4,再经X1,回溯到X2X2X1X4X5路径8:从X5开始,逆箭头而行,通过X1,最后回溯到X2X2X1X5,模型效应分解方法,Duncan法则Duncan公式为:rij=qpiqrjq公式中i代表一个变量,j代表另外一个变量(ij),q为箭头指向i与j两变量的全部变量。R代表两变量间的相关系数,P为两变量间的因径系数,通过相关系数的分解,就可以将两个变量间的效应分解出来了。,下面用Duncan公式的方法再对X2与X5两变量进行一下效应分解:r52=p51r21+p52r22+p53r23+p54r24r22=1r42=p41r21+p42r22=p42+p41r21r32=p31r21+p32r22+p34r24=p32+p31r21+p34p42+(p41r21)=p32+p31r21+p34p42+p34p41r21r52=p52+p51r21+p53(p32+p31r21+p34p42+p34p41r21)+p54(p42+p41r21)=p52+p51r21+p53p32+p53p31r21+p53p34p42+p53p34p41r21+p54p42+p54p41r21,按照从因果效应到非因果效应的顺序将上式重新整理一下,则得到下式:r52=p52+p53p32+p54p42+p53p34p42+p51r21+p53p31r21+p54p41r21+p53p34p41r21,递归模型的检验与调试,运用模型检验的基本思想就是将这些反推出的相关系数值与实际的相关系数值进行比较,如果二者差异显著,说明被检验的模型在统计上不能很好地拟和数据,需要进一步修正。饱和模型总是恰好识别的模型,因此它能够完全再现实际相关系数值。对这种模型是无法进行检验的,在因果模型中,真正能够检验的是不饱和模型。对不饱和模型进行检验主要是为了分析删除路径后的模型与未删除路径的模型所估计出的相关系数是否存在显著差异。,递归模型的检验与调试,对模型的检验主要包括以饱和模型作为基准的检验和两个嵌套的非饱和模型之间的差异检验(1)以饱和模型作为基准模型的检验这种检验是将不饱和模型与饱和模型相比较而进行的,饱和模型在这里为基准模型,而不饱和模型为检验模型。检验的无差异假设为:不饱和模型中删除的路径系数为0。(2)两个嵌套的非饱和模型间的差异检验,递归模型的检验与调试,由于饱和模型能够完全再现实际相关系数值,因此它总能完全地拟合数据,但这并能不说明所设定的模型就完美无缺,因为即便将模型中的因果路径完全颠倒,在统计上也难以去检验它的有效性。最佳模型的获得总要经过一个复杂的调试过程,在统计检验、理论假设与实际观察三者的综合考虑下不断对模型进行修正。,因果模型的共线性问题,共线性现象不良的影响回归系数的置信区间变宽,系数变得不稳定,由样本推到总体不可靠回归系数不能很好地反映单个自变量对因变量的独立影响使变量的偏确定系数变小当方程用于预测时,回归结果变得不可靠。,因果模型的共线性问题,补救方法:去掉与Y相关程度较低,但与其它自变量高度相关的变量去掉可以由其它自变量线性表示的自变量增加样本量采用新的样本数据,递归模型的应用,多元回归多因素多元回归递归分析,非递归模型简介,因果模型中参数估计的一般原理,对递归模型与非递归模型,结构方程的参数估计问题就是用观测变量(包括外源变量x和内源变量y)的协方差估计模型中未知参数的过程。结构方程模型的一般形式是:=()公式中为外源变量x,内源变量y,及x和y之间的协方差,()是以待估参数表示的观测变量的方差协方差矩阵,这一方程表明协方差矩阵中的元素是模型中一个或多个待估参数的函数。,因果模型中参数估计的一般原理,根据关系式=(),用中的元素与对应的()中的元素建立方程式,即可求解以上结构方程中的参数。,非递归模型的识别p为内源变量数目,q为外源变量数目,非递归模型的识别,注意事项:在运用阶条件和秩条件要注意的是,所谓的阶条件和秩条件适用于对、矩阵未加约束的情况,而如果对它们中的参数已经施加约束,则即使不满足阶条件和秩条件,模型也有可能是可识别的。,举例,举例,把上面的公式进行转换:,举例,将以上方程的系数写成矩阵的形式(Y的系数的符号可以忽略),得如下矩阵:,非递归模型的识别,修正未识别模型增加外源变量零限制设置工具变量:要使非递归模型能识别,有时可预先假设有些外源变量对内源变量没有影响,即路径系数为0。,非递归模型的参数估计,未加权最小二乘法(ULS)广义最小二乘估计(GLS)极大似然估计(ML)工具变量法(IV)两阶段最小平方法(TSLS)广义加权最小平方法(WLS)对角加权最小平方(DWLS),模型的评价,饱和模型:相关数目=V(V-1)/2不饱和模型零模型,模型的评价,饱和递归模型不存在评价问题不饱和递归模型和非递归模型整体拟合指数绝对拟合指数:2、2/df、GFI、AGFI、RMSEA相对拟合指数:(与零模型的比较)CFI、NFI、TLI或NNFI、IFI,等同模式,等同模式的含义:从数学意义上讲,若M1、M2、M3、M3等模型内各参数所衍生的均相等(对任何样本协方差矩阵S而言),即1234,那么M1、M2、M3、M3便是等同模型。等同模式在其它一般统计方法也有出现,如简单回归和探索性因素分析。替代法则:若指向X3和X4的变量相同,则X3和X4的关系可用“X3X4”,”X3X4”,或Z3和Z4允许相关。如果模型中有饱和部分,即变量之间均有相关关系,对这部分可随意改变变量之间的关系,而不影响整个模型的拟合度。,等同模式,处理等同模式的建议研究者应逐一检查其它等同模式,看看他们是否能合理地解释各变量之间的关系,逐一删除不合理的模型。方法如下:(1)用实验法操纵主要变量若模型中一些变量能以实验法加以控制,则其它变量不应指向这些被控变量,故可删除那些包含这类指向的模式。,等同模式,(2)纵向研究(longitudinalresearch)研究者亦可以进行长期纵向研究,对其中一些变量作多次量度,等同模式中含有与时序相反关系者,均不合理。(3)变量的特征在逐一检视各等同模式时,研究者需用常理,去判断模式的合理性。,模型的修正,简约原则(principleofparsimony)当两个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论