




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多水平模型*应用情境*方法*步骤*STATA作1.应用情境宏观单位的影响不可忽视重复测量数据分析单位与方法学谬误多水平数据应用情境严洁多2水平模型诸多称谓教育学:分层线性模型(hierarchical
linear
models)社会学:多层线性模型(multi-level
linear
models),多水平分析(Multilevel
ysis)生物统计学:混合效应模型(mixed-effects
model)和随机效应模型(random-effects
models)计量经济学:随机系数回归模型(random-coefficientregression
models)统计学:协方差成分模型(covariance
componentsmodels),混合模型(MixedModels)应用情境1严洁多3水平模型多水平数据观测数据在单位上具有嵌套(Nested)关系同一单位内的观测,具有更大的相似性应用情境1严洁多4水平模型分析单位与方法论谬误分析单位的多层次性:个人、班级、学校、地区、国家将
层面数据计算均值,然后到组层面进行回归分析»
产生生态学谬误(ecological
fallacy)»宏观趋势可能和微观趋势相反应用情境1严洁多5水平模型分析单位与方法论谬误把组层面数据放到 层面进行回归分析»产生简化论谬误(reductionism)»
了 间独立的假定»
错误地把组效应归因于
了在每个组中单独运行微观模型»损失信息»样本量小的组将有偏估计应用情境1严洁多6水平模型什么时候用多水平模型解释因变量的因素中包括宏观变量(组变量)并且,不同组的回归系数不同,或者不同组的平均差异也显著,从而显示出组变量对因变量有影响应用情境严洁多7水平模型12.方法组内同质组间异质随机效应和固定效应原理与方法模型表达式严洁多8水平模型应用条件不同层是嵌套关系(如,学生是在学校中的,居民是在区县中的)如果使用线性回归的话,那么要求因变量总体上服从正间随机态分布,但不要求各组内的方差齐性,以及误差的相互独立。水平1的残差和水平2的残差无关联组间(例如,不同学校之间)是有显著差异的步骤3严洁多9水平模型组数与样本量的要求组数和组内样本容量:»一般要求组数要达到30以上,每组有一定的样本即好。»
Icc越大要求组越多,而要求的 则越少。如果icc=0.3,需要50个组,如果每组有25个
。(Bryk and
Raudenbush,2007)160个学校且每个学校约60个学生时,数据仅可以支持3个随机系数加1个随机截距的估计层2自变量的确定:一个自变量需要10个案例对应的经验法则步骤3严洁多1水平模型0模型表达式水平1(如:学生)Yij
0
j
1
j
X
ij水平2(如:学校)
W
u0
j
00
01
j
0
j1
j
10
1
1W
j
u1
j
eijij---第j个学校的第i个学生例:学生成绩不仅受到学生层面智力水平、勤奋因素的影响,还受到学校层面学校质量、管理方式、教学方式的影响。严洁多1水平模型1方法2严洁多1水平模型2模型表达式水平1:Yij表示第j个学校的第i学生因变量的观测值(如:学生期末成绩)Xij表示第j个学校第i个学生自变量的观测值(如:入学成绩)Wj表示第j个学校的特征变量(如:学校的管理风格)Β0j和Β1j分别表示第j个学校学生入学成绩对期末成绩回归直线的截距和斜率,eij表示第j个学校第i个学生的测量误差。方法2严洁多1水平模型3模型表达式水平2:γ00和γ01分别表示学校特征变量Wj对截距Β0j的回归直线的截距和斜率U0j表示由第j个学校的特征变量解释截距Β0j后的误差γ10和γ11分别表示学校特征变量Wj对斜率Β1j的回归直线的截距和斜率U1j表示由第j个学校的特征变量解释斜率Β1j后的误差方法2模型表达式合并模型:Yij
00
10Xij
01Wj
11XijWj
u0j
u1j
Xij
eij其中:yij表示因变量(如期末成绩),xij表示第一水平(学生)的
变量,Wj表示第二水平(学校)的变量。方法2严洁多1水平模型4分析思路先以第一层级的变量建立回归方程然后把该方
的截距、斜率作为因变量,使用第二层数据中的解释变量作为自变量,再建立若干新的方程组层面的变量对因变量的作用是通过影响第一层回归方的截距和斜率来实现的。通过这种处理,可以探索不同层面变量对因变量的影响步骤3严洁多1水平模型5随机回归系数与固定回归系数固定回归系数是一个常数,不随组的变化而变化随机回归系数则跨组变化混合模型就是指既有固定的也有随机的回归系数不同组内的自变量的回归系数都相同;这是固定系数严洁多1水平模型6不同组内的自变量的回归系数不相同;这是随机系数方法2组内相关系数(ICC)如何判断组间差异显著?用组内相关系数(ICC)的值,以及组间差异的假设检验结果来判断。»组内相关系数(Intra-class
correlationcoefficient)等于组间方差与总方差的比»ICC接近于1说明组间差异大于组内方差;当组内间趋向独立时,ICC接近于0,多层模型就可以简化为固定效应模型»“组内同质表明组间异质”方法2严洁多1水平模型73.步骤解读变量之间关系建模注意事项解读模型整体分析思路步骤应用条件严洁多1水平模型8分析的步骤1、建立模型:先运行空模型(截距模型)目标是确定是否存在显著的组内相关将水平2的标识变量(例如:学校
)纳入空模型依据ICC判断是否组间异质将水平1的解释变量纳入空模型,水平2的解释变量纳入截距方程先将水平1的所有回归系数设置为固定系数,再将水平2的解释变量放在截距方程,目标是检验随机截距步骤3严洁多1水平模型9严洁多2水平模型0分析的步骤检验跨水平的交互作用将随机的回归系数作为组水平模型的因变量,在组水平上解释组间差异。建立最终模型经过前面的探索之后建立最终模型方法3严洁多2水平模型1分析的步骤2、解释模型运行的结果»模型拟合度»因变量总变异被解释的比例»各类假设检验的结果»各个解释变量对因变量的作用步骤3严洁多2水平模型2解读输出结果:模型拟合对模型拟合的评价方法与logistic回归、结构方程模型等方法类似»
-2LL,数据越小说明拟合度越好»
AIC,BIC,越小越好步骤3严洁多2水平模型3解读输出结果:因变量变异的解释量方差缩减比例分别表示水平1的解释变量和水平2的解释变量可解释因变量的方差比例,类似R2。»
比较模型A,和模型B,那么方差缩减比例等于模型B与模型A的方差之差除以模型A的方差»
不仅有组间方差的缩减比例,也有组内方差的缩减比例步骤3Raudenbush
&
Bryk法A:空模型B:分析模型方差消减比例1.组间方差2.9482.3750.194=(1-B1/A1)2.组内方差19.55718.8130.038=(1-B2/A2)Snijders
&
Bosker法A:空模型B:分析模型方差消减比例(nij为组内平均样本数)1.组间方差2.9482.3750.176=[1-(B1+B2/nij)/(A1+A2B2/nij)]2.组内方差19.55718.8130.058=[1-(B1+B2)/(A1+A2)]解读输出结果:跨层交互项的解读跨层交互作用说明水平1解释变量x对因变量y的作用会随着组水平变量w的值而变化跨层交互作用的系数表示:宏观解释变量对量的作用的调节效应的大小。例如:“解释变层面的解释变量x1对因变量的作用随着宏观单位的w1的值而变化,w1的值高的话,那么…”步骤3严洁多2水平模型4建模注意事项:因变量的正态分布如果做分层线性模型:因变量要符合正态分布非正态分布可能歪曲变量之间的关系,并影响显著性检验的结果事先先做正态分布的检验将因变量标准化,然后做直方图,或
图对数转换可以近似正态分布步骤3严洁多2水平模型51234为什么对中对中的方法对中后的解读研究的变量应有准确的实际意义Xij为0是否有实际意义Wij为0是否有实际意义grand-mean:观测值减全部样本均值group-mean:观测值减组均值对层2变量的对中不像层1变量那么关键,层2使用总平均数对中可用菜单选择对HLM中方法STATA需事先gen对中后的变量统计 中如何对中对中步骤3建模注意事项:对中(centering)grand-mean:自变量与总均值的距离每增加一个单位,因变量…group-mean:自变量与组均值的距离每增加一个单位,因变量…严洁多2水平模型6建模注意事项:估计方法的选择步骤3um
likelihood
estimation)um
likelihood两种估计方法:ML(还是REML(restrictedestimation)二者在估计固定效应时完全一样,区别在于随机效应。
REML可以得出偏误更小的随机效应。如果二层单位>30,则基本没有区别。REML通常用于组数较少的模型,组数少时,REML所产生的层2残差方差/协反差的偏倚比ML较小;模型比较时,随机效应不同,固定效应相同时,用REML严洁多2水平模型7建模注意事项:残差分析残差分析用于检验模型假定:»组内误差互相独立并且服从残差均值为0的正态分布;»随机效应服从残差均值为0的正态分布,并且在组间独立;残差分布是否以0为均值的正态分布;用图或直方图步骤3严洁多2水平模型84.
STATA作使用方法数据库样式原理各种多水平模型
令严洁多2水平模型9STATA中的多水平模型mixed»
Multilevel
mixed-effects
linear
regressionmeglm»
Multilevel
mixed-effects
generalized
linear
modelmelogit»
Multilevel
mixed-effects
logistic
regressionmeprobit»
Multilevel
mixed-effects
probit
regressionAlthough
there
is
no
memlogit
command,
multilevel
mixed-effectsmultinomial
logistic
models
can
be
fit
using
gsem;STATA作4严洁多3水平模型0STATA中的多水平模型meoprobit»
Multilevel
mixed-effects
ordered
probit
regressionmeologit»
Multilevel
mixed-effects
ordered
logistic
regressionmepoisson»
Multilevel
mixed-effects
Poisson
regressionmenbreg»
Multilevel
mixed-effects
negativebinomial
regressionmestreg»
Multilevel
mixed-effects
parametric
survival
modelsSTATA作4严洁多3水平模型1原始数据的格式:»SPSS、ASCII、SAS、STATA数据库格式区县水平的自变量区县水平标识变量个人水平的因变量个人水平的自变量STATA
作4严洁多3水平模型2LR
test
vs.
linear
model:
chibar2(01)
=
362.13Prob
>=
chibar2
=
0.0000psuid:
IdentityRandom-effectsParametersEstimateStd.
Err.[95%
Conf.
Interval]_cons29.02173.212348136.670.000politruCoef.Std.
Err.zP>|z|[95%
Conf.
Interval]28.6055429.43792空模型/*只有因变量的空模型*/use
"N:\hlm.dta",
clearmixed
politru,
remlmixed
politru
||
psuid:,reml
/*只有因变量和组变量的空模型*/estat
icc
/*icc>0.1,适用于多水平模型,反之单水平即可*/Log
likelihood
=
-11207.077 Prob
>
chi2
=
.组间方差,水平2的方差组内方差,水平1的方差var(_cons)2.901212.54668542.0053244.197342var(Residual)19.55678.451251918.6920420.46152STATA作4严洁多3水平模型3ICC(组内相关系数)此例:二水平模型的icc:三水平模型的icc:.
estat
iccIntraclass
correlationLevelICCStd.
Err.[95%
Conf.
Interval]psuid.1291839.021401.0927043
.1772148组间方差组间方差
组内方差icc
0.1292.9
19.62.9icc
STATA作4严洁多3水平模型4随机的截距项mixed
politru
gdppergini
age
gender
edu
sotrust
||
psuid:
,
nologreml/*截距项的随机效应,用层2的gdpper
gini变量进行解释*/该命令等同于hlm
中的Level1:
politru=b0+b1*age
+b2*gender
+b3*edu
+b4*sotrust+eLevel2:
b0=r00+r01*gdpper
+r02*gini+u0STATA作4严洁多3水平模型5随机的截距项输出结果STATA作4var(Residual)
18.83443
.4348259LR
test
vs.
linear
model:
chibar2(01)
=
302.4518.00118
19.70625Prob
>=
chibar2
=
0.0000var(_cons)2.536608.49499961.7304053.718423psuid:
IdentityRandom-effectsParametersEstimateStd.
Err.[95%
Conf.
Interval]30.557471.43395421.31
0.00027.746sotrust_cons1.016451.14711456.910.000.7281124 1
30479gdpper-.0000365.000012-3.040.002-.0000601-.000013gini-.0561618.0285994-1.960.050-.1122155-.0001081age.0426284.00596767.140.000.0309322.0543247gender-.2587274.1459598-1.770.076-.5448033.0273486edu-.0738521.0214111-3.450.001-.1158171-.0318871politruCoef.Std.
Err.zP>|z|[95%Conf.Interval]Log
restricted-likelihood
=
-11151.492Wald
chi2(6)Prob
>
chi2==160.590.00001552.587Obs
per
group:min
=avg
=max
=Mixed-effects
REML
regressionNumber
of
obs=3,830Group
variable:
psuidNumber
of
groups=73.
mixed
politru
gdpper
gini
age
gender
edu
sotrust
||
psuid:,nologreml用水平2的属性解释水平1的截距项为什么在各组之间有差异组内方差,水平1的方差严洁多3水平模型6随机的回归系数mixed
politru
gdpper
gini
age
gender
edu
sotrustc.sotrust#c.gdpperc.sotrust#c.welper
||
psuid:
sotrust,
nolog
reml/*sotrust的回归系数用层2的gdpper
welper进行解释,截距项的随机效应用层2的gdpper
gini变量进行解释,c.表示计算交互项的意思*/该命令等同于Level1:Politru=
b0+b1*age
+b2*gender
+b3*edu
+b4*sotrust+eijLevel2:b0=r00+r01*gdpper
+r02*gini+u0b4=r40+r41*gdpper
+r42*welper+u4STATA作4严洁多3水平模型7Random-effects
Parameterspsuid:
IndependentEstimateStd.
Err.[95%
Conf.
Interval]var(sotrust).7196668.3531587.27505871.882945var(_cons)2.690748.54050761.8150423.988956var(Residual)18.62147.434617217.7888319.49309LR
test
vs.
linear
model:
chi2(2)
=
310.52Prob
>
chi2
=
0.0000_cons30.642211.49035620.560.00027.7211733.5gdpper-.0000427.0000131-3.260.001-.0000684-.0000171gini-.0566276.0297831-1.900.057-.1150015.0017463age.0434511.00595617.300.000.0317774.0551248gender-.2597157.1457323-1.780.075-.5453457.0259144edu-.0726673.0214343-3.390.001-.1146778-.0306568sotrust.9108768.28127053.240.001.35959691.462157c.sotrust#c.gdpper.0000251.00001491.680.093-4.16e-06.0000543c.sotrust#c.welper-.0004141.0003308-1.250.211-.0010624.0002341politruCoef.Std.
Err.zP>|z|[95%Conf.Interval]Log restricted-likelihood= -11163.66Wald
chi2(8)Prob
>
chi2==153.430.0000min
=avg
=max
=1552.587Obs
per
group:.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025湖北荆州市石首市第二批校园招聘教师6人模拟试卷完整参考答案详解
- 2025辽宁铁岭市调兵山市第二批公岗招聘15人模拟试卷及完整答案详解1套
- 2025杭州青少年活动中心招聘工勤岗位工作人员20人考前自测高频考点模拟试题有答案详解
- 2025广东龙川县财政投资评审中心招聘编外人员1人考前自测高频考点模拟试题及答案详解(历年真题)
- 2025贵州惠水县公益性岗位招聘4人考前自测高频考点模拟试题及答案详解(网校专用)
- 2025年台州市路桥区各医疗服务共同体招聘医疗卫生专业技术人员27人考前自测高频考点模拟试题及答案详解一套
- 沧州市中医院肾内科住院医师晋升主治医师病种题库
- 秦皇岛市人民医院术前准备规范考核
- 张家口市人民医院临床科研转化能力考核
- 张家口市人民医院白细胞与血小板抗原系统知识评估
- 幼儿园合胞病毒知识培训
- 《凯勒战略品牌》课件
- 手术室的器械护士
- 2023年广东省中学生天文知识竞赛初赛(高年组)
- 【教科2017课标版】小学科学六年级上册全册教学设计
- 面瘫(面神经炎)课件
- 畜禽粪污资源化利用培训
- 女生穿搭技巧学习通超星期末考试答案章节答案2024年
- 2024年大学试题(政治学)-比较政治制度考试近5年真题集锦(频考类试题)带答案
- 厉害了我的国
- 动物生理学智慧树知到期末考试答案章节答案2024年浙江大学
评论
0/150
提交评论