




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPS嗽据分析一混合线性模型(2)之前介绍过的基于线性模型的方差分析,虽然扩展了方差分析的领域,但 是并没有突破方差分析三个原有的假设条件,即正态性、方差齐性和独立性,这其中独立性要求较严格,我们知道方差分析的基本思想其实就是细分, 将所有对 因变量产生影响的因素逐一摘出,但是如果各观测值之间相互影响,这样在细分 影响因素的时候,是很难分出到底是自变量的影响还是观测值之间自己的影响。 虽然随机抽样会最大程度的使数据满足独立性,但是有时候这种方法并不奏效, 比如随机抽取受访者分析其消费特征,这里就假定所有受访者的之间是相互独立 的,然而仔细想想,这其中存在问题,如果某些受访者来自同一个城市或地区
2、, 从个体角度讲,他们确实是独立的人,之间没有任何联系,但是如果从分析目的 角度讲,由于区域因素他们之间的消费特征是趋于相似的,而产生这种相似性, 正是由于相互作用导致,这些人是存在相互影响关系的,也就类以于相关样本, 与此同时,这种相互作用也使得不同城市间的消费特征产生差异,我们称这种数 据为具有层次聚集性的数据。数据的聚集性除了表现在聚集因素间指标的均值水 平不同外,还表现在不同城市间的指标离散度上。从层次聚集性数据也可以看出,随机抽样只能保证数据被抽到的概率相同, 但是 对于抽到的是什么样的数据,却无法控制了。对于这种具有层次结构的数据,如 果分析目的仅限于这几种层次,比如就分析这几个城
3、市,那么可以把它当做一种 固定因子,只分析固定效应而不用考虑这种聚集性, 但是如果想把结果推广到所 有城市,那就不能忽略这种特征,否则会降低结果的准确性,因此还要加入随机 效应。混合线性模型就是同时包含固定效应和随机效应的线性模型, 是解决此类层次聚 集性数据的方法之一,对于具有层次结构的数据,我们需要将使观测值之间产生 相互影响的层次因素也摘出来,比如上述中的城市因素,传统的方差分析模型中, 将所有无法解释的因素都归在随机误差中,而随着我们对传统方差模型的不断拓 展,对随机误差的分解也越来越精细,结果也越来越准确。【例】我们想分析哪些因素会对16岁时毕业成绩的影响,显然毕业成绩和学校 有关,
4、好学校的学生成绩会好一些,而差学校的学生成绩会差一些,那么学校这 个因素就是上述的层次因素,它使得因变量产生相关性,而且我们是想把结果推 广到所有学校,因此学校这个变量应该被定为随机变量, 我们首先按照一般线性 模型来分析,不考虑层次因素分析一一股线性模型一单变量SPS嗽据分析一混合线性模型(2)因变量为16岁成舞. 协变量为11岁成绩T 随机因子为学校,不 做其他设定,不考虑 二者交互作用T直接 分析其主效应II*F一口1工而6K理於器-43730 M&tSrtdld.1127 12011127J3O199 工 55。川口俣整225S ?05诩35球号Eg口 1I'j
5、9;?J73 704645回1D.3M.0CQ225ft 70435»35贰上体可就成响槌检l-r.-.r 16< I; *2 干曲.HMsH恒口 15* 414.)b呷邛,.:>只看方差分析若果, 11岁成绩和学校对因 变量均有显著影响, 我们将该结果与后续 用混合线性模型分析 的结果作对比在按照一般线性模型分析之后,我们再来看看按照混合线性模型分析的结果会有 什么不同SPS嗽据分析一混合线性模型(2)分析一混合模型一线性首先建出的对话框 用耒设置作为层次 因素的变量,将其 援贯在主翻对话框 中,本例为学桢, 如果不设黑的话, 后面的分析则认为没有层次因素立SPS嗽据分
6、析一混合线性模型(2)很骂好层次因素之 后,进入的混合线性 模型的壬对话福,和 一般线性模型类似, 在此可以对模型做更 详细的谩置。本例 中,我们首先来分析 学校这个因素是否是 层次因素,也就是检 验不同学校的平均成 绩是否有差异,因此 不纳入任何其他因 子,只选人因变量 在随机对话框中*我 们选定包含截距,苒 将学桢选入组合中 如果学校不是层次聚 集因素的话,那么所 有学校的平均成绩应 该相同体现在图中 就是所有回归线的初 始有即截距相等,如 果不相等说明其中 有变皆,那么变异的 耒源就是最开始设定 的学校因素。SPS嗽据分析一混合线性模型(2)统计量按钮了可以 选择要输出的一些 统计量和检
7、髓值. 在此我们选择参数 估计和协方差参数 检辘,其中协方差 琴数橙脸就是用来 检验层次聚集因素 的匚计©|匕不常&8氤强变埔计«争竟沽计£3慢方狸豹肘衿验图争缺估值的相关性 多日皓计的由方整剧i 咫航汨果的他方花小.震的协方性也)匚期匕意做矩阵©量信息同。:/将应J觥的.部叽商即密理轮II微小1121 t13息一中二旧:16,中鸿"b -1 - - - t 11.5 RANDOM H)?,:" a*喇命令语法可嘘生不睥于先的版本的牯 M< Ml隼想在鼻阳版上11瑞法濡整砌当蒯K 法,号加阐】工口*更多出息,结果中首先输
8、出的是桎型 维教,也就是模型的情况 摘要,由于我ill及育纳入 任何因子,因此摘要程省 单,只有默认输出的固定 效应的赧距,和之前手动 设羞的随机效应截距,迁 有残差。注意这里值班效 位截距的肺方差结构类型 为就认的方差或分,也可 以在航机对话框市更改设 5-2受的柬的对效慨然值Akaike的悟息条件® C)Hu Meh和。j的条怦 (A1CC)Bazdogan 的条片(CA1C)Schwarz :Ei Bayesian f (BIC)1 101J,62411016.62411016,62711033.24111031 241信息党有r厂较少为较带的稻式显示信息条件,a 一囚二6 ”
9、成Q接下来输出的是信 息条件,也就是一 些信息准则,用来 判断模型中引入的 因素是否有筑计学 意义SPS嗽据分析一混合线性模型(2)定效应原仆尹审母5F显箸性162.529,060,807固定妓疫的恰眠鹏型犷.因变量;16支成谢接下来输出固定效应模 型,原假设为所有学校的 戌臻灼值为U*由于要有 纳入任何因子,因此 P=Q8(T(LQ5,是不能 指绝原假设的恢万姜参数wjuzirwiAiF呷出IW一irniB47T51缶1臼£1* “ 687OOQ611373能5配1塔画' ,inmSX用51sQ3撷而聒后输出的协方差参麴结果,就是对随机部分的分析结果,也述是g 学校是否是层
10、次皇集国妻的最终定论口此处,原岗设为随机翡应的方 差为。,也就是不存在受异”等同于不同学校网的成辖均殖没有差 异,可见£断。工的佶计值并不为口,龄魄结果也是拒匏原骨设,因此 可以利斯,学校确实是一个属次聚蕈因宏*上方的殛差走示每个欢凰值.也就是学生之冏是否存在不体差异也 是垢箔原毋设,即认为学生之目是存在个体差异的经过以上分析,我们知道学校确实是一个层次聚集因素, 不能按照一般线性模型 进行分析,那么影响16岁考试成绩的原因有很多,我们继续加入变量进行分析。首先加入11岁时的入学成绩,先将其加入固定因素,并观测和之前不加人任何 因子相比有何变化将11岁入学成绩纳入,由于是连续变量因此
11、选 人班变量,并且在固定按钮中,将其选入模型* f t4r,ndlrt.MSIT f "f" "7iJiJIFrit ij11118school朗军/总b :. 1U.>/切*Ft * - 'I '/; M 1 J 4J噂出f工窿楸*看片中 耐3浦制南,工七号用ku 阿,曲彳-2壹曲束的时数似熟值9368.735Akaike止息聚件脚。9372.735Hurvich和Tsai的条件 (AICC)9372.738Bozdogan 的爸 1 (CAIC)9387.351Schwarz 的 Bayesian "T (BIC)93B5.35
12、1陆配条件SPS嗽据分析一混合线性模型(2)以案少为较好冲的格式显示信息条件ail堡里:15岁喷缆接下来的国定效应分 析中,可看到尸(0.05,说明新加入 的变量硼实对因变量 产生影响,并且估计 值为正数.说明呈正 相关影响,即入学成 贵掂高,毕业成绩也 掳离。首先模型做况申固定效应多了新加入的变量,其次各个信息 条件的值,也比之前降低,说明有部分变异被朝加入的变量 所解客。.或i酊F190732OQJJ54sian-ain140$OOM r1口制顺国定蚂曲的怕冷不堪 ; .T61-.'.十固定效应施定总盘缶i/1函 1l如;IS rdrtWXh9£% .Ed同E/1 .MO
13、&331S0403S4an .7 3?-05f中加觇皎。ttandlft5t33D50121604050.07445190.0005髓髓十4: FF.'.梆方北堂行的i产m3 g超WsldZ/甲,_95% 匿 |埸弟SBfiflm弟$7J4C72OOD.541571.591 241,*:=函诩093839018SB64 943QOQ,063110U9503a 二16。改微H;时我和再来看重机部分的分析结果,估计值比原来小想多,说明之 前被归在随机效应中的费屏被翅加入固定效应中的费里所解烽掉了, 也说明if皿入的变壁使得原数据的层次第堇性再弱通过以上分析,我们看到,在固定因素中加
14、入入学成绩这个变量以后, 对于层次 聚集性起到了减弱的效果,但是该影响仍然存在,说明还需要引入其他变量以完SPS嗽据分析一混合线性模型(2)善模型,之前讲过,数据聚集性除了表现在聚集因素间指标的均值水平不同外,还表现在不同聚集因素间的指标离散度上,我们现在将11岁时的入学成绩这个变量加入随机因素中。点随机按钮.将变量 纳入模型2蹙灼束的时故似独整9335.677AgiK2的后息条件(AIC)9341 677Hurvich i. Tsai 的弟 (AICC)B341 683SoEdbgt 的条T (CAIC)9363.602Schwar2 h'j Bayesian 姓什 (BIC)93C
15、0.602信慧L条F产2因变量:16岁成射*信息条件值迸一步 降低说明将该变 量引入至随机效应 中是有效果的-2黑短曲廿数必然值9335.677岫的俨息果汁谒IC)9341 677Hunrt彘 1/ Tsai '.1|LAICC)93dl 683Bozdogn 的条;1 (CAIC)9363.602Scliwarz :Bsian :: C)93C0.602信恩条件“以“轻/号较好*的格式显不信息去件一 a.因变量:16岁咸靖,信息条件值进一步 降低,说明将诱变 量引入至随机皴应 中是有效果的SPS嗽据分析一混合线性模型(2)df5FFttJr1180 466041,l1Sfl.9317
16、68,207粒应物施制塞曾*a ,'i i D*衍h.(t 愚dr1u/产口95% q_rj,阻on-而MXU.4S4-上忙.:J -他&湖dnarsmndinS47021.02009727 71 J.oao_51frJ7j犯施宗海诵依计.固定效应结果没有太 大变化,检魄绪果也 相同协方差参数饰方垠冬熟惬i产X;唐小1 ± .-WsidZ并试性弼咻 *fJ-.-: nJ1由幅甚553636Q1219744Q00露R晔57S5&X1| n - t(hool0»1»4»。的490CMOHI 335"7mMamrt 卜 i !
17、 = tcho4iil) )星.tM 4749M3W3.U7MltmoBt必必9a. I" 1融式,随机效应检险中,可以看出新加入的变量是有统计学意义 的,说明U岁入学成绩度对16岁是存在器响的,并且妖差和 聚集性因素的方差也进一步降低,说明该变量的引入是有效 果的.在将11岁毕业成绩引入到随机效应之后,层次聚集性又进一步减弱了,实际上 我们可以不断的引入变量,这样最终层次聚集性就会消失,下面我们再来引入性 别、学校类型、各学校学生在11岁入学时的平均成这三个变量。由于性别和学校类型属 于分类变量,因此选人 因子选框,而学校平均 成绩是连犊变量,需要 选人协变量选框SPS嗽据分析一混
18、合线性模型(2)18.-*2 广-a-目r it si固守言第OMOsr rm啊d 空离"kt avsin 的 Wr*siandlrth还1!eAi'.133112WF41121121 gschoola 5.1 16b,干我* 11 5 ' RAMDOM ?嚼的诂主骥已*!丁丁标市”口祠广牛不冏于光m车的小果 可早产tht吁用股本11e小府裁m与莉 生布南”g一-母白由于我们认为学校 是层次聚集性因 素,因此兼加入的 变量都选入固定效 应中,输出的模型 摘要结果如左图-2财束的对数似数IB9305.974Akaike的信息美件(AIG)9311.974HuwichoT
19、sai 的转件 (AICC)9311.990Bozdogn 的桀件 CCAIQ9333.896Schwaiz的 Bayesiin 条件 (SIC)93 加 896府息条件以,转小£¥皆产的信式信息器件a因工量.16 3成功信息条件值 进营降 低,说明引 人变量起到 作用,实际 上我们可以 逐步引入变 量进行比较SPS嗽据分析一混合线性模型(2)耳/df分母(ifF品著性箴电一156956,499gender1403271624,5 羽口 QQschgend161.9422 573,094stan dirt157.164726.9S6,aooavelrt11.15S11 579,G01固定效磁的速松英理a.E直:16少成4随后输出的效应类型检 验中,新引入的变量 中,学校类型是没用统 计学宣文的唐MT内,册2:va列Nrt卜津int0550111OT :1T7«3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 社区心理危机干预考核试卷
- 耐火材料在太阳能热发电的利用考核试卷
- 外贸英语函电U7课件
- 探秘教育研究
- 四年级期末复习全攻略
- 南京艺术学院《粉末冶金模具设计》2023-2024学年第二学期期末试卷
- 上海市五十二中2025届高三下学期第二次诊断性检测试题语文试题含解析
- 江西财经大学《数字内容的基本概念》2023-2024学年第二学期期末试卷
- 石家庄科技信息职业学院《研学旅行概论》2023-2024学年第二学期期末试卷
- 西安明德理工学院《第二语言习得》2023-2024学年第二学期期末试卷
- 2025-2030农业机械化行业市场发展分析及前景趋势与投资研究报告
- 2024年中国铁路武汉局集团有限公司招聘笔试真题
- 《经济政策分析》课件2
- 自考《03203外科护理学》考试题库大全-下(多选题)
- 艺考生协议合同
- 女生高中生性教育
- 2025-2030中国香紫苏醇市场发展形势及未来投资风险预警研究报告
- 脑-肠轴与肠道菌群互作-深度研究
- GB/T 45214-2025人全基因组高通量测序数据质量评价方法
- 2025年住建部建筑工程合同范文与指导性范本
- 2025年新高考全国Ⅰ卷英语模拟试卷(含答案)
评论
0/150
提交评论