课件-第二讲多水平模型_第1页
课件-第二讲多水平模型_第2页
课件-第二讲多水平模型_第3页
课件-第二讲多水平模型_第4页
课件-第二讲多水平模型_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多水平模型*应用情境*方法*步骤*STATA作1.应用情境宏观单位的影响不可忽视重复测量数据分析单位与方法学谬误多水平数据应用情境严洁多2水平模型诸多称谓教育学:分层线性模型(hierarchical

linear

models)社会学:多层线性模型(multi-level

linear

models),多水平分析(Multilevel

ysis)生物统计学:混合效应模型(mixed-effects

model)和随机效应模型(random-effects

models)计量经济学:随机系数回归模型(random-coefficientregression

models)统计学:协方差成分模型(covariance

componentsmodels),混合模型(MixedModels)应用情境1严洁多3水平模型多水平数据观测数据在单位上具有嵌套(Nested)关系同一单位内的观测,具有更大的相似性应用情境1严洁多4水平模型分析单位与方法论谬误分析单位的多层次性:个人、班级、学校、地区、国家将

层面数据计算均值,然后到组层面进行回归分析»

产生生态学谬误(ecological

fallacy)»宏观趋势可能和微观趋势相反应用情境1严洁多5水平模型分析单位与方法论谬误把组层面数据放到 层面进行回归分析»产生简化论谬误(reductionism)»

了 间独立的假定»

错误地把组效应归因于

了在每个组中单独运行微观模型»损失信息»样本量小的组将有偏估计应用情境1严洁多6水平模型什么时候用多水平模型解释因变量的因素中包括宏观变量(组变量)并且,不同组的回归系数不同,或者不同组的平均差异也显著,从而显示出组变量对因变量有影响应用情境严洁多7水平模型12.方法组内同质组间异质随机效应和固定效应原理与方法模型表达式严洁多8水平模型应用条件不同层是嵌套关系(如,学生是在学校中的,居民是在区县中的)如果使用线性回归的话,那么要求因变量总体上服从正间随机态分布,但不要求各组内的方差齐性,以及误差的相互独立。水平1的残差和水平2的残差无关联组间(例如,不同学校之间)是有显著差异的步骤3严洁多9水平模型组数与样本量的要求组数和组内样本容量:»一般要求组数要达到30以上,每组有一定的样本即好。»

Icc越大要求组越多,而要求的 则越少。如果icc=0.3,需要50个组,如果每组有25个

。(Bryk and

Raudenbush,2007)160个学校且每个学校约60个学生时,数据仅可以支持3个随机系数加1个随机截距的估计层2自变量的确定:一个自变量需要10个案例对应的经验法则步骤3严洁多1水平模型0模型表达式水平1(如:学生)Yij

0

j

1

j

X

ij水平2(如:学校)

W

u0

j

00

01

j

0

j1

j

10

1

1W

j

u1

j

eijij---第j个学校的第i个学生例:学生成绩不仅受到学生层面智力水平、勤奋因素的影响,还受到学校层面学校质量、管理方式、教学方式的影响。严洁多1水平模型1方法2严洁多1水平模型2模型表达式水平1:Yij表示第j个学校的第i学生因变量的观测值(如:学生期末成绩)Xij表示第j个学校第i个学生自变量的观测值(如:入学成绩)Wj表示第j个学校的特征变量(如:学校的管理风格)Β0j和Β1j分别表示第j个学校学生入学成绩对期末成绩回归直线的截距和斜率,eij表示第j个学校第i个学生的测量误差。方法2严洁多1水平模型3模型表达式水平2:γ00和γ01分别表示学校特征变量Wj对截距Β0j的回归直线的截距和斜率U0j表示由第j个学校的特征变量解释截距Β0j后的误差γ10和γ11分别表示学校特征变量Wj对斜率Β1j的回归直线的截距和斜率U1j表示由第j个学校的特征变量解释斜率Β1j后的误差方法2模型表达式合并模型:Yij

00

10Xij

01Wj

11XijWj

u0j

u1j

Xij

eij其中:yij表示因变量(如期末成绩),xij表示第一水平(学生)的

变量,Wj表示第二水平(学校)的变量。方法2严洁多1水平模型4分析思路先以第一层级的变量建立回归方程然后把该方

的截距、斜率作为因变量,使用第二层数据中的解释变量作为自变量,再建立若干新的方程组层面的变量对因变量的作用是通过影响第一层回归方的截距和斜率来实现的。通过这种处理,可以探索不同层面变量对因变量的影响步骤3严洁多1水平模型5随机回归系数与固定回归系数固定回归系数是一个常数,不随组的变化而变化随机回归系数则跨组变化混合模型就是指既有固定的也有随机的回归系数不同组内的自变量的回归系数都相同;这是固定系数严洁多1水平模型6不同组内的自变量的回归系数不相同;这是随机系数方法2组内相关系数(ICC)如何判断组间差异显著?用组内相关系数(ICC)的值,以及组间差异的假设检验结果来判断。»组内相关系数(Intra-class

correlationcoefficient)等于组间方差与总方差的比»ICC接近于1说明组间差异大于组内方差;当组内间趋向独立时,ICC接近于0,多层模型就可以简化为固定效应模型»“组内同质表明组间异质”方法2严洁多1水平模型73.步骤解读变量之间关系建模注意事项解读模型整体分析思路步骤应用条件严洁多1水平模型8分析的步骤1、建立模型:先运行空模型(截距模型)目标是确定是否存在显著的组内相关将水平2的标识变量(例如:学校

)纳入空模型依据ICC判断是否组间异质将水平1的解释变量纳入空模型,水平2的解释变量纳入截距方程先将水平1的所有回归系数设置为固定系数,再将水平2的解释变量放在截距方程,目标是检验随机截距步骤3严洁多1水平模型9严洁多2水平模型0分析的步骤检验跨水平的交互作用将随机的回归系数作为组水平模型的因变量,在组水平上解释组间差异。建立最终模型经过前面的探索之后建立最终模型方法3严洁多2水平模型1分析的步骤2、解释模型运行的结果»模型拟合度»因变量总变异被解释的比例»各类假设检验的结果»各个解释变量对因变量的作用步骤3严洁多2水平模型2解读输出结果:模型拟合对模型拟合的评价方法与logistic回归、结构方程模型等方法类似»

-2LL,数据越小说明拟合度越好»

AIC,BIC,越小越好步骤3严洁多2水平模型3解读输出结果:因变量变异的解释量方差缩减比例分别表示水平1的解释变量和水平2的解释变量可解释因变量的方差比例,类似R2。»

比较模型A,和模型B,那么方差缩减比例等于模型B与模型A的方差之差除以模型A的方差»

不仅有组间方差的缩减比例,也有组内方差的缩减比例步骤3Raudenbush

&

Bryk法A:空模型B:分析模型方差消减比例1.组间方差2.9482.3750.194=(1-B1/A1)2.组内方差19.55718.8130.038=(1-B2/A2)Snijders

&

Bosker法A:空模型B:分析模型方差消减比例(nij为组内平均样本数)1.组间方差2.9482.3750.176=[1-(B1+B2/nij)/(A1+A2B2/nij)]2.组内方差19.55718.8130.058=[1-(B1+B2)/(A1+A2)]解读输出结果:跨层交互项的解读跨层交互作用说明水平1解释变量x对因变量y的作用会随着组水平变量w的值而变化跨层交互作用的系数表示:宏观解释变量对量的作用的调节效应的大小。例如:“解释变层面的解释变量x1对因变量的作用随着宏观单位的w1的值而变化,w1的值高的话,那么…”步骤3严洁多2水平模型4建模注意事项:因变量的正态分布如果做分层线性模型:因变量要符合正态分布非正态分布可能歪曲变量之间的关系,并影响显著性检验的结果事先先做正态分布的检验将因变量标准化,然后做直方图,或

图对数转换可以近似正态分布步骤3严洁多2水平模型51234为什么对中对中的方法对中后的解读研究的变量应有准确的实际意义Xij为0是否有实际意义Wij为0是否有实际意义grand-mean:观测值减全部样本均值group-mean:观测值减组均值对层2变量的对中不像层1变量那么关键,层2使用总平均数对中可用菜单选择对HLM中方法STATA需事先gen对中后的变量统计 中如何对中对中步骤3建模注意事项:对中(centering)grand-mean:自变量与总均值的距离每增加一个单位,因变量…group-mean:自变量与组均值的距离每增加一个单位,因变量…严洁多2水平模型6建模注意事项:估计方法的选择步骤3um

likelihood

estimation)um

likelihood两种估计方法:ML(还是REML(restrictedestimation)二者在估计固定效应时完全一样,区别在于随机效应。

REML可以得出偏误更小的随机效应。如果二层单位>30,则基本没有区别。REML通常用于组数较少的模型,组数少时,REML所产生的层2残差方差/协反差的偏倚比ML较小;模型比较时,随机效应不同,固定效应相同时,用REML严洁多2水平模型7建模注意事项:残差分析残差分析用于检验模型假定:»组内误差互相独立并且服从残差均值为0的正态分布;»随机效应服从残差均值为0的正态分布,并且在组间独立;残差分布是否以0为均值的正态分布;用图或直方图步骤3严洁多2水平模型84.

STATA作使用方法数据库样式原理各种多水平模型

令严洁多2水平模型9STATA中的多水平模型mixed»

Multilevel

mixed-effects

linear

regressionmeglm»

Multilevel

mixed-effects

generalized

linear

modelmelogit»

Multilevel

mixed-effects

logistic

regressionmeprobit»

Multilevel

mixed-effects

probit

regressionAlthough

there

is

no

memlogit

command,

multilevel

mixed-effectsmultinomial

logistic

models

can

be

fit

using

gsem;STATA作4严洁多3水平模型0STATA中的多水平模型meoprobit»

Multilevel

mixed-effects

ordered

probit

regressionmeologit»

Multilevel

mixed-effects

ordered

logistic

regressionmepoisson»

Multilevel

mixed-effects

Poisson

regressionmenbreg»

Multilevel

mixed-effects

negativebinomial

regressionmestreg»

Multilevel

mixed-effects

parametric

survival

modelsSTATA作4严洁多3水平模型1原始数据的格式:»SPSS、ASCII、SAS、STATA数据库格式区县水平的自变量区县水平标识变量个人水平的因变量个人水平的自变量STATA

作4严洁多3水平模型2LR

test

vs.

linear

model:

chibar2(01)

=

362.13Prob

>=

chibar2

=

0.0000psuid:

IdentityRandom-effectsParametersEstimateStd.

Err.[95%

Conf.

Interval]_cons29.02173.212348136.670.000politruCoef.Std.

Err.zP>|z|[95%

Conf.

Interval]28.6055429.43792空模型/*只有因变量的空模型*/use

"N:\hlm.dta",

clearmixed

politru,

remlmixed

politru

||

psuid:,reml

/*只有因变量和组变量的空模型*/estat

icc

/*icc>0.1,适用于多水平模型,反之单水平即可*/Log

likelihood

=

-11207.077 Prob

>

chi2

=

.组间方差,水平2的方差组内方差,水平1的方差var(_cons)2.901212.54668542.0053244.197342var(Residual)19.55678.451251918.6920420.46152STATA作4严洁多3水平模型3ICC(组内相关系数)此例:二水平模型的icc:三水平模型的icc:.

estat

iccIntraclass

correlationLevelICCStd.

Err.[95%

Conf.

Interval]psuid.1291839.021401.0927043

.1772148组间方差组间方差

组内方差icc

0.1292.9

19.62.9icc

STATA作4严洁多3水平模型4随机的截距项mixed

politru

gdppergini

age

gender

edu

sotrust

||

psuid:

,

nologreml/*截距项的随机效应,用层2的gdpper

gini变量进行解释*/该命令等同于hlm

中的Level1:

politru=b0+b1*age

+b2*gender

+b3*edu

+b4*sotrust+eLevel2:

b0=r00+r01*gdpper

+r02*gini+u0STATA作4严洁多3水平模型5随机的截距项输出结果STATA作4var(Residual)

18.83443

.4348259LR

test

vs.

linear

model:

chibar2(01)

=

302.4518.00118

19.70625Prob

>=

chibar2

=

0.0000var(_cons)2.536608.49499961.7304053.718423psuid:

IdentityRandom-effectsParametersEstimateStd.

Err.[95%

Conf.

Interval]30.557471.43395421.31

0.00027.746sotrust_cons1.016451.14711456.910.000.7281124 1

30479gdpper-.0000365.000012-3.040.002-.0000601-.000013gini-.0561618.0285994-1.960.050-.1122155-.0001081age.0426284.00596767.140.000.0309322.0543247gender-.2587274.1459598-1.770.076-.5448033.0273486edu-.0738521.0214111-3.450.001-.1158171-.0318871politruCoef.Std.

Err.zP>|z|[95%Conf.Interval]Log

restricted-likelihood

=

-11151.492Wald

chi2(6)Prob

>

chi2==160.590.00001552.587Obs

per

group:min

=avg

=max

=Mixed-effects

REML

regressionNumber

of

obs=3,830Group

variable:

psuidNumber

of

groups=73.

mixed

politru

gdpper

gini

age

gender

edu

sotrust

||

psuid:,nologreml用水平2的属性解释水平1的截距项为什么在各组之间有差异组内方差,水平1的方差严洁多3水平模型6随机的回归系数mixed

politru

gdpper

gini

age

gender

edu

sotrustc.sotrust#c.gdpperc.sotrust#c.welper

||

psuid:

sotrust,

nolog

reml/*sotrust的回归系数用层2的gdpper

welper进行解释,截距项的随机效应用层2的gdpper

gini变量进行解释,c.表示计算交互项的意思*/该命令等同于Level1:Politru=

b0+b1*age

+b2*gender

+b3*edu

+b4*sotrust+eijLevel2:b0=r00+r01*gdpper

+r02*gini+u0b4=r40+r41*gdpper

+r42*welper+u4STATA作4严洁多3水平模型7Random-effects

Parameterspsuid:

IndependentEstimateStd.

Err.[95%

Conf.

Interval]var(sotrust).7196668.3531587.27505871.882945var(_cons)2.690748.54050761.8150423.988956var(Residual)18.62147.434617217.7888319.49309LR

test

vs.

linear

model:

chi2(2)

=

310.52Prob

>

chi2

=

0.0000_cons30.642211.49035620.560.00027.7211733.5gdpper-.0000427.0000131-3.260.001-.0000684-.0000171gini-.0566276.0297831-1.900.057-.1150015.0017463age.0434511.00595617.300.000.0317774.0551248gender-.2597157.1457323-1.780.075-.5453457.0259144edu-.0726673.0214343-3.390.001-.1146778-.0306568sotrust.9108768.28127053.240.001.35959691.462157c.sotrust#c.gdpper.0000251.00001491.680.093-4.16e-06.0000543c.sotrust#c.welper-.0004141.0003308-1.250.211-.0010624.0002341politruCoef.Std.

Err.zP>|z|[95%Conf.Interval]Log restricted-likelihood= -11163.66Wald

chi2(8)Prob

>

chi2==153.430.0000min

=avg

=max

=1552.587Obs

per

group:.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论