




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
结构⽅程模型_结构⽅程模型(StructuralEquationModel,SEM)三下续三上,⼤纲:上篇:⼀、探索性&验证性因⼦分析(EFA&CFA)因⼦分析的基本概念和EFACFA延伸内容下篇:⼆、结构⽅程模型(StructuralEquationModelswithLatentVariables)1.简介2.操作3.补充内容⾮正态分布的因变量(non-normallydistributeddependentvariables)等同模型(equivalentmodels)统计效⼒(statisticalpower)效应量(effectsize)如何根据不同ES确定统计效⼒(power)?/反向确定样本量?——a.Satorra&Saris法(Satorra-Sarismethodofexactfit)、b.MacCallum法(MacCallumetal.methodofclosefit)、c.蒙特卡罗模拟法(MonteCarlosimulation)。三、R代码1.CFA2.SEM⼆、结构⽅程模型(StructuralEquationModelswithLatentVariables)1.简介SEM相当于含有潜在变量的路径分析(CFA+path含有潜在变量的路径分析(CFA+pathAnAnalysis)alysis),所以SEM既检测了(直接间接的)因果关系,还检测了潜在的预测变量、中介变量和结果变量。样本量⾜够的情况下,推荐使⽤包含潜在变量的SEM,因为它可以更好地估计结构效应,减⼩测量误差导致地偏差和标准误。2.操作依然是六个步骤:1.步骤1:模型确定(Specification)2.步骤2:模型识别(Identification)3.步骤3:模型估值(Estimation)4.步骤4:模型评估(Evaluation)5.步骤5:(可能需要)模型再明确(Potentialre-specification)6.步骤6:模型解释(Interpretation)步骤2:模型识别(Identification)可通过以下三种⽅法测定模型识别度:2.1矩阵代数(Matrixalgebra,难)2.2t法则(t-rule;必要不充分)2.3两步法则(Two-steprule;充分不必要)1.第⼀步:将模型重新指定为CFA,并指定所有因素⼦之间可能的关联;像测量CFA模型识别⼀样测它。2.第⼆步:将结构模型中的所有潜在变量视为观察变量;像测量路径模型识别⼀样测它。步骤3:模型估值(Estimation)⽅法有:最最⼤⼤似似然然估计(Maximum估计(Maximumliklikelihood;推荐elihood;推荐使⽤!⽤)!、)、普通最⼩⼆乘法(Ordinaryleastsquares)、⼩⼆乘法(Generalizedleastsquares)、加权最⼩⼆乘法(Weightedleastsquares)……使⽤最⼤似然估计时,CFA和path的不同在于模型隐含的均值和协⽅差计算。解释测量模型的部分(measurementmodel)等于CFA;解释结构模型的部分(structuralmodel)等于pathanalysis。步骤4:模型评估(Evaluation)辩证地使⽤修正指数MIs在定位模型不⾜的时候,有个技巧是讲测量模型和结构模型分开考虑,⽐较原模型和仅测量/结构模型的卡⽅的差别。如果是嵌套模型,使⽤前⾯讲过的LRT(LRT显著意味着结构模型部分有问题)。3.补充部分3.1⾮正态分布的因变量(non-normallydistributeddependentvariables)3.1.1影响⾮正态分布对估值(estimates)的影响:样本量⾜够⼤、峰值不过⾼地情况下,估值是不受太⼤影响的⾮正态分布对推断的影响:标准误⽐实际⼩、卡⽅⽐实际⼤、存在⼀类错误可能性⾼、置信区间较⼩、3.1.2应对⽅案:⽅法11:数据转:数据转化(化(transformation)transformation),如对数转换(logtransformation),但也可能⽆效(⽐如数据中有太多0)有关数据转化的⽂章:Box,G.E.,&Cox,D.R.(1964).Ananalysisoftransformations.JournaloftheRoyalStatisticalSociety.SeriesB,211-252.⽅法2:稳健的标准误差和适合的统计(RobustStandardErrors&FitStatistics)参数的标准误(SEs)可以根据⾮正态分布的数据的特征修正。稳健标准误(robustSEs)也叫Satorra-Bentler标准误或三明治估计标误(“sandwichestimator”SEs)。似然⽐检验统计值(Likelihoodratioteststatistic)也可以根据⾮正态分布的数据的特征修正。不同R包计算robustSEs和correctedLRTs会有细微出⼊。相关⽂章:West,S.G.,Finch,J.F.,&Curran,P.J.(1995).Structuralequationmodelswithnon-normalvariables:Problemsandremedies.InR.Hoyle(Ed.),StructuralEquationModeling:Concepts,IssuesandApplications,(pp.56-75).NewburyPark,CA:Sage.3.2等同模型(equivalentmodels)等同模型(equivalentmodels)指导致完全相同的模型拟合度(samemodelfit)的不同的模型。(参数估值parameterestimates、标准误standarderrors可能不同;所以得出的理论结论也可能不同)⼤部分SEM模型使⽤LeeHershberger替代规则(LeeHershbergerreplacingrules)来做决定。找理论依据最有⽤,等同模型也具有其理论意义。请⾃⾏阅读:Hershberger,S.L.(1994).Thespecificationofequivalentmodelsbeforethecollectionofdata.InA.vonEyeandC.C.Clogg(Eds.),LatentVariablesAnalysis(pp.68–108).ThousandOaks,CA:Sage.Lee,S.,&Hershberger,S.(1990).Asimpleruleforgeneratingequivalentmodelsincovariancestructuremodeling.MultivariateBehavioralResearch,25,313–334.Raykov,T.,&Marcoulides,G.A.(2001).Cantherebeinfinitelymanymodelsequivalenttoagivencovariancestructuremodel?StructuralEquationModeling,8,142-149.3.3统计效⼒(statisticalpower)右上⾓,统计效⼒(power)是正确地否定原假设的概率。左上⾓,⼀型错误(TypeⅠerror)是原假设为真时,错误拒绝原假设的情况(⼀型错误出现的概率=α)右下⾓,⼆型错误(TypeⅡerror)是原价这为假时,错误地接受原假设的情况(⼆型错误出现的概率为1-power)与统计效⼒有关的系数:已知以下四个系数中的三个可以计算另外⼀个系数值(废话==、)α⼀型错误概率(TypeIerrorrate)1-β统计效⼒(power)ES效应量(effectsize)N样本量(samplesize)3.4SEM中,效应量(effectsize)有不同的形式:单个参数的ES,如变量年龄的影响⼀组参数的ES,如协⽅差的共同影响整个模型的ES:假设模型的总体拟合值3.5如何根据不同ES确定统计效⼒(power)?/反向确定样本量?可以使⽤a.a.Satorra&Saris法(Satorra-Sarismethodofexactfit)、b.b.MacCallum法(MacCallumetal.methodofclosefit)、或者cc..蒙特卡罗模拟法(MonteCarlosimulation)。a.基于NCP的Satorra&Saris法Satorra&Saris(1985)提出基于⾮中⼼(non-centrality)统计概念,在SEM中计算效⼒的⽅法。⾮中⼼化参数(non-centralityparameter,NCP)反应了两种分布的不同,逻辑上可以当作SEM的ES。使⽤NCP计算统计效⼒。步骤:1.定义假设模型的模型的结结构构,包括所有参数的精确值2.计算模型隐隐含含均值向量和隐隐含协⽅差矩阵3.定义在假设模型内嵌套嵌套的的备备选选模模型的型的结结构4.在给定样本量N的情况下,将替代模型与假设模型所隐含的均值向量和协⽅差矩阵进⾏拟拟合合5.从步骤4得到得到的卡⽅的卡⽅检验检验统计量是NCP统计量是NCP6.参照中⼼卡⽅分布,基于特定的NCP值、N、df、α,计算统计效⼒计算统计效⼒优点:在样本量⼤且多元正态性⾼的前提下,可以从给定的假设效应获得精精确确的统计效⼒估计值假设效应可以以涉涉及及⼀⼀个或个或多多个参数,计算⽅⽅便便,通过SEM程序包即可得到,对于估计特定的假设效应的统计效⼒⾮常有⽤缺点:对模型结构和参数精确度要求⾼:要求精确的模型结构和数值的所有参数,有时很难定义和证明难以成⽴的假设:假设精确的模型拟合符合零假设,这是不可能成⽴的不能⽤于估计模型中某个地⽅的⼀⼀般般错误的统计功效相关阅读:Browne,M.W.,&Cudeck,R.(1992).Alternativewaysofassessingmodelfit.SociologicalMethods&Research,230-258.Chen,F.,Curran,P.J.,Bollen,K.A.,Kirby,J.,andPaxton,P.(2008).AnempiricalevaluationoftheuseoffixedcutoffpointsinRMSEAteststatisticinstructuralequationmodels.SociologicalMethodsandResearch,36,462-494.b.基于RMSEA的⽅法(MacCallum法)步骤:1.在原假设下定义RMSEA值(testofclosefit,可以设为.05)2.在备择假设下定义RMSEA值(useratherarbitraryguideline可以较武断,如设为.08)3.步骤1和步骤2定义两个重叠的⾮中⼼卡⽅分布4.参照中⼼卡⽅分布,基于特定的NCP值、N、df、α,计算统计效⼒优点:不需要精精确的模型说明确的模型说明或为所有参数选择精确的数值从紧密密拟合(close拟合(closeffit)it)的⾓度预估统计效⼒计算⽅⽅便,便,通过表格或任何基础软件即可计算⾃定义值与Satorra-Saris⽅法适⽤于精确精确拟合测试缺点:不能⽤于估计模型中某个特定特定假设的的统计功效没有强强理论说明理论说明什么样的RMSEA代表了紧密的拟合度像Satorra-Saris法⼀样,假设有⼤样本量和多元的正态数据假设有⼤样本量和多元的正态数据相关阅读Kim,K.H.(2005).Therelationamongfitindexes,power,andsamplesizeinstructuralequationmodeling.StructuralEquationModeling,12,368-390.Lee.T.,Cai,L.,&MacCallum,R.C.(2012).PowerAnalysisfortestsofstructuralequationmodels.InR.Hoyle,D.Kaplan,g.Marcoulides,&S.West(Eds.),HandbookofStructuralEquationModeling(pp.181-194),NewYork:Guilford.MacCallum,R.C.,Browne,M.W.,&Sugawara,H.M.(1996).Poweranalysisanddeterminationofsamplesizeforcovariancestructuremodeling.PsychologicalMethods,1,130-149.MacCallum,R.C.,Lee,T.,&Browne,M.W.(2010).Theissueofisopowerinpoweranalysisfortestsofstructuralequationmodels.StructuralEquationModeling,17,23-41.c.蒙特卡罗模拟法(MonteCarloSimulation)特点:不要求⼤样本量或多元正态分布⽆缺失的数据;分析上不够精确,但通常是极好的近似值像Satorra-Saris法⼀样,对模型结构和参数精确度要求⾼:要求精确的模型结构和数值的所有参数,有时很难定义和证明相关阅读:Curran,P.J.,Bollen,K.A.,Paxton,P.,Kirby,J.,&Chen,F.(2002).Thenon-centralchi-squaredistributioninmisspecifiedstructuralequationmodels:FinitesampleresultsfromaMonteCarlosimulation.MultivariateBehavioralResearch,37,1-36.Dolan,C.,vanderSluis,S.,&Grasman,R.(2005).AnoteonnormaltheorypowercalculationinSEMwithdatamissingcompletelyatrandom.StructuralEquationModeling,12,245-262.Muthén,L.K.,&Muthén,B.O.(2002).HowtouseaMonteCarlostudytodecideonsamplesizeanddeterminepower.StructuralEquationModeling,9,599-620.三、R代码1.CFA#导⼊数据hs<-read.table("hs.dat",header=FALSE)names(hs)<-c("school","female","age","month","visperc","cubes","lozenges","parcomp","sencomp","wordmean","addition","countdot","sccaps")#对指标变量进⾏缩放(rescaling)hs$addition<-hs$addition/4hs$countdot<-hs$countdot/4hs$sccaps<-hs$sccaps/4#加载lavaan包library(lavaan)#CFAwithstandardizedfactors模型1cfa.1a<-'#因⼦负荷visual=~visperc+cubes+lozengesverbal=~parcomp+sencomp+wordmeanspeed=~addition+countdot+sccaps'#std.lv:使⽤标准化的潜在变量fit.1a<-cfa(cfa.1a,data=hs,meanstructure=TRUE,std.lv=TRUE)summary(fit.1a,fit.measures=TRUE,standardized=TRUE,rsquare=TRUE)modindices(fit.1a,sort.=TRUE,minimum.value=10)模型2cfa.1b<-'#因⼦负荷visual=~visperc+cubes+lozengesverbal=~parcomp+sencomp+wordmeanspeed=~addition+countdot+sccaps##均值/截距均值/截距visual~1vverbal~1speed~1vvispisperc~0*1#截距为0parcomp~0*1aaddddition~0*1'fit.1b<-cfa(cfa.1b,data=hs,meanstructure=TRUE)summary(fit.1b,fit.measures=TRUE,standardized=TRUE,rsquare=TRUE)模型3cfa.2<-'#因⼦负荷visual=~visperc+cubes+lozenges++ssccapsccapsverbal=~parcomp+sencomp+wordmeanspeed=~addition+countdot+sccaps'fit.2<-cfa(cfa.2,data=hs,meanstructure=TRUE,std.lv=TRUE)summary(fit.2,fit.measures=TRUE,standardized=TRUE,rsquare=TRUE)lavTestLRT(fit.2,fit.1a)modindices(fit.2,sort.=TRUE,minimum.value=10)模型4cfa.3<-'#因⼦负荷visual=~visperc+cubes+lozengesverbal=~parcomp+sencomp+wordmeanspeed=~addition+countdot+sccaps##协⽅协⽅差addition~~coountdotuntdot''fit.3<-cfa(cfa.3,data=hs,meanstructure=TRUE,std.lv=TRUE)summary(fit.3,fit.measures=TRUE,standardized=TRUE,rsquare=TRUE)lavTestLRT(fit.3,fit.1a)modindices(fit.3,sort.=TRUE,minimum.value=10)2.SEM#加载包Library(lavaan)#定义变量名names<-c("ptgi","ptgi1","ptgi2","ptgi3","ptgi4","ptgi5","marital","fa","fr","si","child","child18","age","gender","depres","comt","con","cha","es","lo","pro","th","diord","time","problem","em","ind","ru","av","hy","relipart","rb")#输⼊数据、求协变量矩阵mip.mns<-c(59.18,19.84,10.53,12.65,9.80,6.35,9.53,24.96,19.89,18.24,2.68,.45,52.04,.11,9.37,10.36,10.35,9.93,30.33,80.47,2.67,1.78,.47,3.91,70.58,38.87,24.34,12.26,11.80,9.17,.81,2.74)mip.sds<-c(24.24,9.00,6.89,5.22,3.73,3.05,2.59,3.87,6.07,7.48,1.07,.81,11.04,.318,6.57,2.65,3.27,2.45,5.92,18.12,.74,1.14,.50,8.05,11.94,11.41,6.83,7.51,5.51,5.94,1.24,.92)mip.cor<-read.table("mip.dat",header=FALSE,s=names,s=names)mip.cor<-data.matrix(mip.cor)mip.cov<-cor2cov(mip.cor,sds=mip.sds)#模型1mod.1<-'##明确测量模型部分ER=~fa+fr+siIR=~comt+con+cha+es+loERF=~pro+th+timeCPP=~em+ind+ru+av+hy+rbPTG=~ptgi1+ptgi2+ptgi3+ptgi4+ptgi5#明确结构模型部分ERF~ER+IRCPP~ERFPTG~ER+IR+CPP'#拟合模型;std.lv=TRUE意味着均值为0,1,fit.1<-sem(mod.1,sample.cov=mip.cov,sample.mean=mip.mns,sample.nobs=132,meanstructure=TRUE,std.lv=TRUE)summary(fit.1,fit.measures=TRUE,estimates=FALSE)modindices(fit.1,sort.=TRUE,minimum.value=10)模型2mod.2<-'#明确测量模型ER=~fa+fr+siIR=~comt+con+cha+es+loERF=~pro+th+timeCPP=~em+ind+ru+av+hy+rbPTG=~ptgi1+ptgi2+ptgi3+ptgi4+ptgi5'fit.2<-sem(mod.2,sample.cov=mip.cov,sample.mean=mip.mns,sample.nobs=132,meanstructure=TRUE,std.lv=TRUE)summary(fit.2,fit.measures=TRUE,estimates=FALSE)lavTestLRT(fit.2,fit.1)模型3mod.3<-'#指定测量模型部分ER=~fa+fr+siIR=~comt+con+cha+es+loERF=~pro+th+timeCPP=~em+ind+ru+av+hy+rbPTG=~ptgi1+ptgi2+ptgi3+ptgi4+
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论