结构方程模型入门_第1页
结构方程模型入门_第2页
结构方程模型入门_第3页
结构方程模型入门_第4页
结构方程模型入门_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1引言n 袁振国在译完威廉 维尔斯曼的教育研究方法导论后在其前言中评论道“ 总觉得教育研究方法过于传统,研究的手段也比较落后。而在世纪年代中期由瑞典统计学家心理测量学家提出的结构方程模型(简称SEM)则提供了一种新的统计方法和研究思路。它能有力地解决教育研究中的问题,应当引起教育界的重视,理应成为教育研究的有力工具。n注:袁振国,教育部社会科学司副司长,北京师范大学教育学院教授、博士生导师。 23结构方程模型(SEM)入门云南大学 高等教育研究院解亚宁SEM4导言-1n 心理学或教育学研究的一个主要目的是通过分析变量与变量之间的关系来揭示心理或教育现象的发展以及变化规律与特点,如相关分析。X2

2、X1r5导言-2 在相关分析基础上,进一步把变量分为自变量与因变量两部分,并以自变量来解释因变量。 该模型假设自变量是原因,因变量是由这些原因引起的结果,如回归分析模型。yx11eexy+=1b6导言-3yx1ex2exxy+=2211bb127x1y1y2e1e2x2 在回归分析基础上,还发展了路径分析,进一步把变量之间复杂关系,例如因果交错关系。8问题提出n 但是,现实中变量之间的关系要复杂得多,各自变量之间可能存在因果关系,因变量也可能是某个或某几个自变量的原因,有时需要处理多个原因和多个结果的关系。n 特别是会遇到不可直接观测的变量,这种变量称为潜在变量(Latent Variable

3、s) ,诸如社会经济地位、智力等都不能准确、直接地加以测量。社会经济地位智力潜在变量9问题提出n对于潜变量,可用一些外显指标(Observable indicators)来间接测量它们。如用收入高低、教育水高低、教育水平平作为社会经济地位社会经济地位()的测量指标。nSEM主要特点在于能反映潜在变量(Latent variables)与外显变量(Manifest variable )之关系。收入高低教育水平社会经济地位外显指标潜在变量10n 方法的进步与革命常常导致相应学科的进步与革命。就统计方法而盲,回归分析是相关分析的深人, 而结构方程模型(SEM)则是对回归分析的深入。11一、结构方程模

4、型的概念n结构方程模型(structural equation modeling,简称SEM) ,早期称为线性结构关系(Linear Structural Relationships ,简称LISREL) ,是评价理论模型与经验数据一致性的统计方法。n潜在变量也称为隐变量。n外显变量也称观测变量 ( Observable variable )或测量变量 ( Measurement variable )。n SEM主要特点在于能反映潜在变量(Latent variables)与外显变量(Manifest variable )之关系。12导例1314x1x3x21 2 3123误差 观测变量 负荷

5、量 潜在变量 结构方程模型是用来检验观测变量与潜在变量之间假设关系及测量误差的一种统计技术,或者说是模型构建与检验的方法。 结构方程模型是通过观测变量集合的间的协方差结构和相关结构出发,从定量的角度建立模型来研究变量间的因果关系的一种方法。 15例2误差误差 观测变量观测变量 负荷量负荷量 潜在变量潜在变量16专栏:结构方程模型的构图与模式17SEM的模式n测量模式测量模式 (measurement model) 测量模式旨在建立测量模式旨在建立测量变量与潜在变量间测量变量与潜在变量间之关系,主要透过验证之关系,主要透过验证性因素分析(性因素分析( CFA)以)以考验测量模式的效度考验测量模式

6、的效度结结构模式。构模式。y1y3y2e1e2e3f1y4y6y5e4e5e6f218y1y3y2e1e2e3f1y4y6y5e4e5e6f2fr1r219SEM的模式 结构模式结构模式 (structural model) 结构模式旨在考验潜在变项间之因果路径关系,结构模式旨在考验潜在变项间之因果路径关系,主要针对潜在变量进行径路分析,以考验结构模式的主要针对潜在变量进行径路分析,以考验结构模式的适配性适配性 。2021例3:研究生研究论文222324252627模型假设28293031二、结构方程模型分析步骤示意图 首先针对研究问题,根据已有的研究资料提出多个假设模型,然后收集数据、进行分

7、析,通过模型与实际数据的拟合情况和模型比较的结果,确定最终的结果模型。根据LISREL的分析程序,SEM大体分为建立模型、识别模型、估计模型,评估模型和修正模型五个步骤。32模型界定n模型的界定必须来自健全理论的建构。n模型界定的步骤有三。首先由研究者整理文献与相关理论,提出建立模型的双向结构表,然后由专家对结果进行论证,最后根据确定的结构设计可能的项目。33三种模型策略 nSEM的基本假设是观测变量的共变数矩阵是一组参数的函数,而检验一个共变数矩阵有三种模型策略。34验证模型策略n即根据搜集的经验资料严格检验研究者界定的理论模型,以确定所检验理论模型是接受还是拒绝,所谓严格检验是指当模型被拒

8、绝时,不再寻找接受模型的可能线索。35竞争模型策略n即研究者事先界定多个可替代的理论模型,再搜集一组经验资料以检验哪一个理论模型与经验资料最匹配。譬如对智力既可用Spearman的二因素理论解释,也可用Thurstone的群因素理论解释,还可以用卡特尔的简明层次论解释等,对于哪一种解释方式最好,以往的统计技术难以处理, SEM却可以有效地处理这类问题,采用竞争模型更符合实际情况。36模型的发展策略n即研究者先利用理论界定出一个起始模型,再搜集一组资料检验其匹配程度。如果不是相当匹配,可运用SEM统计中的某种指数了解需要修正的地方,如果需修正处有着健全的理论可解释则将其修正,这是一般研究者常用的

9、策略。37模型识别n模型的识别分为低识别、恰好识别和过度识别三种。n对SEM理论不十分清楚的研究者,往往会忽略模型识别的问题,只是将其交给统计软件处理,即不知其中存在诸多复杂的问题,对此应当阅读有关书藉,详细了解模型识别的问题。 38模型的估计 n用观测资料估计模型的参数方法有很多,最常用的有三种,即最大概似法、广义最小平方法和渐近分布自由法。 39拟合概念n当我们测试某一模型时,其实是在研究自己所提的模型(即哪些变量之间有关,哪些则没有) 是否与数据拟合。 40三、分析过程与结果示例 例題:學生智力測驗成績之前分析建立在兩因子模型下,且能提供良好適合度,本例題測試在單因子模型下是否能提供更加

10、適合度? 樣本數 :145個學生 指標變數:文章閱讀, 造句能力, 字彙能力, 加法能力, 計數能力潛伏變數:語言, 數學41路徑圖:學生智力測驗成績 (P.192)語言語言文章文章閱讀閱讀2、 GFI、AGFI、數學數學造句造句能力能力字彙字彙能力能力加法加法能力能力計數計數能力能力=1採用採用Single Single dimensiondimension1234542Title Confirmatory Factor Analysis for student test performanceObserved Variables 文章閱讀文章閱讀 造句能力造句能力 字彙能力字彙能力 加法能

11、力加法能力 計數能力計數能力Correlation Matrix= 1 0.722 1 0.714 0.685 1 0.203 0.246 0.170 1 0.095 0.181 0.113 0.585 1Sample Size=145Latent Variables 語言語言 數學數學Relationships: 文章閱讀文章閱讀= =語言語言 造句能力造句能力= =語言語言 字彙能力字彙能力= =語言語言 加法能力加法能力= =數學數學 計數能力計數能力= =數學數學SET the Covariance of 語言語言 and 數學數學 to 1 Path DiagramLISREL OU

12、TPUT SE TV RS MI相關矩陣相關矩陣指標變數指標變數潛伏變數潛伏變數定義指標變數與定義指標變數與潛伏變數之關係潛伏變數之關係軟體操作:學生智力測驗成績 (P.192)定義潛伏變數之間的關係定義潛伏變數之間的關係相關係數為相關係數為1 1,不具區別效度,不具區別效度輸出指令輸出指令 SE: SE: 標準誤標準誤TV: tTV: t檢定檢定RS: RS: 常態化殘差與常態化殘差與Q Q圖圖MI: MI: 修飾指標修飾指標43軟體操作:學生智力測驗成績 (P.192)44軟體操作:學生智力測驗成績 (P.192)參數最大概似估計參數最大概似估計、標準誤標準誤、t t值值: :語言語言:

13、:相關性較大相關性較大、標準誤標準誤0.070.07、t t值顯著值顯著22數學數學: :相關性小相關性小、標準誤標準誤0.090.09、t t值值22不顯著不顯著兩潛伏變數之間兩潛伏變數之間的相關係數為的相關係數為1殘差變異數估計、殘差變異數估計、標準誤、標準誤、t t值值45軟體操作:學生智力測驗成績 (P.192)卡方值卡方值2 = 59.47GFI = 0.88 0.90 AGFI= 0.63 0.05 ( (皆低於可接受水準皆低於可接受水準) ) 模型配適度不佳模型配適度不佳46 學生智力測驗成績綜合比較二因子模型單因子模型卡方值2.9359.47GFI0.990.88AGFI0.9

14、70.63單因子模型下:GFI AGFI 皆低於可接受水準,故潛伏變數兼具區別性,應採二因子模型較合適。47四、模型拟合度指标n(一)基本拟合标准:n不能有负的误差变异;n误差变异需有统计意义;n估计参数之间相关的绝对值不能太接近1;n因素负荷量不能太低或太高,最好介于0.500.95之间;n标准误不能太大。48(二)整体模型拟合度指标数值范围及临界值49(二)整体模型拟合度指标数值范围及临界值 5051五、结构方程模型的用途(一)李茂能(2007)1、考验理论模式(test of theory)2、考验测量工具的建构信度(construct reliability)或因素结构效度(valid

15、ity of factorial structure)n信度:观测变量与潜在变量之间相关程度(0.7)n 效度:可分为下列两种n收敛效度(convergent validity):对相同特性(construct, concept, or research variables)使用不同衡量方法(Likert scale, Stapel scale, or semantic differential),所得结果高度相关。n区别效度(discriminant validity):不同建构(construct, 即研究变数或称concept) 彼此之间确实不相同。52五、结构方程模型的用途(二)侯杰泰

16、(1999)na、验证性因素分析 nb、高阶因子分析 nc、路径及因果分析nd、多时段(multiwave)设计 ne、单形模型(Simplezs Model) nf、多组比较 53五、结构方程模型的用途n(三)范晓玲(2007)nSEM在心理学研究的应用,主要有两方面。n1、 测验编制理论结构建立。因素分析虽然也应用于测验编制之中,但却只能用初步探讨结构而无法检验其理论建构。SEM却不同,其功用颇丰。n1-1 项目分析,即估计每个项目,把项目分析的概念融合于因素结构的检验中;检验每个项目的测量误差,把测量误差从项目变异中抽取出来,使因素负荷量具有较高的精确度,并根据理论,预先确定项目所属的因

17、素。n1-2 根据理论,检验某些因素之间相关或不相关,确定各因素之间的关系;n1-3 对整体因素模型进行评估,确定以理论建构的因素模型与搜集资料之间的符合程度。因此,结构方程模型属于检验理论模型的统计方法,为研究者用于量化与理论检验提供一种综合模型。n2、是研究各种复杂心理现象之间的关系。譬如,心理学中,研究认知加工速度、工作记忆与智力发展的关系,家庭文化环境与儿童言语的关系等;在管理学中,研究组织绩效各层次指标与组织核心能力的关系,变革型领导与员工工作态度以及心理授权的关系;在教育学中,研究性别、文化程度、教育经验与教师职业承诺的关系等;在医学中,研究吸烟、喝酒等不良行为与身心健康的关系等;

18、 54六、结构方程的数学模式与方法n(一)测量模型(一)测量模型n对于外显变项与潜伏变项间的关系,即测量模式部分,通常写为以下测量方程: X=x+ Y=y+ nX,Y是外源及内生指标。n,是X,Y测量上的误差。 nx是X指标与潜伏变项的关系。ny是Y指标与潜伏变项的关系。 55(二)结构模型(二)结构模型n(a)对于潜伏变项(如:社经地位与收入)的关系,通常写成如下结构方程:n=+ 内生(依变)(endogenous,dependent)潜伏变项 外源(自变)(exogenous,independent)潜伏变项 内生潜伏变项间的关系 外源变项对内生变项的影响 模式内未能解释部份(即模式内所包

19、含的变项及变项间关系所未能解释部分) 潜变量间的关系,即结构模型,是研究的兴趣重点,所以整个分析也称潜变量间的关系,即结构模型,是研究的兴趣重点,所以整个分析也称结构方程模型。结构方程模型。 56七、讨论57 1、探索型因素分析与驗證型因素分析比較比较内容EFACFA理論架構在分析過程中所扮演的角色理論架構是因素分析後的產物須先有特定的理論觀點作為基礎,再決定該架構是否適當。理論架構在分析過程中所扮演的檢驗時機事後概念事前概念582、结构方程模型假设条件、结构方程模型假设条件合理的样本量合理的样本量nJames Stevens的Applied Multivariate Statistics f

20、or the Social Sciences一书中说平均一个自变量大约需要15个case;nBentler and Chou (1987)说平均一个估计参数需要5个case就差不多了,但前提是数据质量非常好;这两种说法基本上是等价的;n而Loehlin (1992)在进行蒙特卡罗模拟之后发现对于包含24个因子的模型,至少需要100个case,当然200更好;n小样本量容易导致模型计算时收敛的失败进而影响到参数估计;特别要注意的是当数据质量不好比如不服从正态分布或者受到污染时,更需要大的样本量。 59n樣本大小至少超過150個。 Rigdon, E. (2005). SEM FAQ. from

21、/mkteer/htmln至少要為x觀察變項數目的10倍量或15倍量。 Thompson, B. (2000). Ten commandments of structural equation modeling. In L. G. Grimm & P. R. Yarnold (eds.), Reading and understanding more multivariate statistics (pp. 261-283). Washington, DC: APA.樣本大小亦取決於潛在變項的數目60n樣本大小不能少於50個,應該要超過100個。n至少要為x觀

22、察變項數目的5倍量或10倍量。 Hair, J. F., Anderson, R. F., Tatham, R. L. & Black, W. C. (1998). Multivariate data analysis 5th ed. New Jersey: Prentice Hall Inc. 613、模型的、模型的解释n模型的说明和因果关系的理论基础模型的说明和因果关系的理论基础 实际上就是假设检验的逻辑你只能说你的模型不能拒绝,而不能下定论说你的模型可以被接受。 623、模型的解释n统计结果只有得到正确解释时才是有用的,一个不正确的解释比无用还要糟糕。SEM的解释主要有结构系数的因果性(

23、或影响性)、方向性和效果系数三方面。n1因果性。 之所以称因果性是源于SEM早期被视为因果模型,然而SEM并不限于研究因果关系,它与一般使用的相关、多元回归及变异数分析一样可以研究事物多种关系,为了避免因果性而将其结构系数看成是一种影响性。633、模型的解释n2方向性。 方向性是建立在坚实的理论基础之上的。SEM是统计技术,无法处理方向性问题。n3效果系数。 效果系数是指SEM的结构系数,有直接效果、间接效果和总效果之分。直接效果是指一个变量对另一个变量的影响未通过其他其他变量;间接效果是指一个变量对另一个变量的影响至少需要通过一个其他变量,总效果则是直接效果与间接效果的总和。在结果解释时直接效果是必然的,间接效果和总效果能回答直接效果无法回答的问题。譬如,在二级因素分析中,若想知道哪一个指标受到二级潜在变量的影响最大,就要找出二级潜在变量总效果最大的一个。643、模型的解释nSEM效果的解释可以用非标准

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论