(概率论与数理统计专业论文)条件方差限制下社会交互影响识别问题.pdf_第1页
(概率论与数理统计专业论文)条件方差限制下社会交互影响识别问题.pdf_第2页
(概率论与数理统计专业论文)条件方差限制下社会交互影响识别问题.pdf_第3页
(概率论与数理统计专业论文)条件方差限制下社会交互影响识别问题.pdf_第4页
(概率论与数理统计专业论文)条件方差限制下社会交互影响识别问题.pdf_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果据我所知,除了 文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得 东北师范大学或其他教育机构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任何贡 献均已在论文中作了明确的说明并表示谢意 学位论文作者签名磷魄地位歪:7 学位论文版权使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北师范大学有权保留 并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论文被查阅和借阅本人授权东北师范大学 可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、 汇编学位论文 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:雄 指导教师签名: 日 期:厶阻上乒 日 期: 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编: 摘要 本文主要讨论在条件方差限制下的交互影响的识别问题 b r y a nsg r a h a m ( 2 0 0 8 ) 基于在 美国田纳西州进行的关于班级人数对学生成绩影响的教育实验( s t a r 项目) 给出了条件方差 限制下交互影响识别的新方法,然而在他文章中提出的模型比较特殊,本文在更一般的模型下 给出交互影响项的识别统计量本文在最后利用随机模拟的方法对交互影响项的识别效果进 行分析 关键词:条件方差限制,交互影响,识别 a b s t r a c t t h i sp a p e rm a i n l yd i s c u s s e st h ei d e n t i f i c a t i o n o fs o c i a li n t e r a c t i o n su n d e rc o n d i t i o n a lv a r i a n c e r e s t r i c t i o n s b r y a nsg r a h a m ( 2 0 0 8 ) h a sg i v e nan e wm e t h o do ft h es o c i a li n t e r a c t i o n s i d e n t i f i c a t i o n u n d e ras p e c i f i cm o d e l ,w i t ht h ed a t af r o mae d u c a t i o n a lp r o g r a mc a l l e d s t a r a b o u td i f f i r e n tt o t a l o fs t u d e n t si nd i f f e r e n tk i n d so fc l a s s f o l l o w i n gt h em e t h o dg i v e nb yb r y a nsg r a h a m ,w et a l ka b o u t t h ei d e n t i f i c a t i o ni nn o r m a lm o d e lw i t h o u ts p e c i a lf o r m s t h e nw et e s ta n da n l y s i st h ee f f e c to ft h e i n t e r a c t i o ne s t i m a t o rb ys t o c h a s t i cs i m u l a t i o n k e y w o r d s :c o n d i t i o n a lv a r i a n c er e s t r i c t i o n ,i n t e r a c t i o n s ,i d e n t i f i c a t i o n i i 目录 中文摘要 英文摘要 目录 引言 正文 1 模型的提出与模型假设 2 社会交互项的识别 2 1 基于条件方差假设下社会交互项的识别 2 2 对识另0 统计量的讨论 2 3 识别统计量的改进 3 随机模拟与结果分析 4 结论 参考文献 致谢 i i i 东北师范大学硕士生学位论文 引言 在以往关于分组实验的讨论中,我们通常建立模型讨论一些影响因素在不同的组之间影 响的差异,这些差异可能是由实验个体差异引起的,也可能是外界环境引起的。比如在药物试 验中,我们通过药物和安慰剂在两个实验组产生的影响进行对照来判断药物的效果再者,我 们对不同的年龄、患有相同疾病的两个组使用相同的药物治疗,以考察年龄对于药物所产生 的影响而对于另一类分组实验,我们获得的数据中不仅包含这一组的特征信息和这一组中每 个个体的特征信息,也会存在这样的状况:在实验的过程中同一组的个体之间存在着相互的影 响例如,同一班级的学生之间可能存在着相互促进或干扰的影响,同一省份中各个地区的经 济行为也可能存在相互促进或抑制的作用我们对这种交互影响的作用更加感兴趣,因此,我 们有必要对这种影响是否存在进行讨论,特别是对这种影响是好的方面还是不好的方面加以 区分,从而通过实验的改进获得我们更加满意的结果 关于交互影响的识别问题引起了众多学者的研究兴趣,也有很多研究成果产生 m a n - s k i ( 1 9 9 3 ) 给出了在条件期望下交互项系数识别的方法,之后有众多学者在不同的模型下对交互 项的识别展开讨论,如d u r l a u f ( 2 0 0 6 ) b r y a ns g r a h a m 和j i n y o n gh a h n ( 2 0 0 5 ) 在l i n e a r - i n - m e a i s m o d e l 下给出交互影响项的识别,随后g r a h a m ( 2 0 0 8 ) 给出了条件方差限制下的交互影响项的 识别方法,本文将在此论文基础上做进一步讨论 g r a h a m 的这篇论文是以美国田纳西州开展的一项教育实验( s t a r ) 作为研究背景,并利 用该实验的数据对研究结果进行论证下面我们首先介绍一下这项教育实验: s t a r 项目,全称为s t u d e n t t e a c h e ra c h i e v e m e n tr a t i o ,这是一项由美国田纳西州教育局 主持开展的教育研究项目,该项目持续时间长达四年,在田纳西州共有7 9 所中小学的7 0 0 0 多 名学生参加了本次教育调查,本次实验项目的目的在于考察师生比例对于学生的影响,教育主 管部门希望通过实验确定出更有助于提高学生成绩的班级类型 在具体的实验过程中,参与的学生被随机的分配进入如下三类班级: 第一类班级是小班,师生比为1t1 3 到1 :1 7 ; 第二类班级是大班,师生比为1 :2 2 到1 :2 5 ; 第三类班级是配备教师助理的大班,师生比例与第二类相同 另外,实验中保证授课教师也被随机地分配进上述三类的班级中 在g r a h a m 之前,已有不同的研究者利用田纳西州的教育实验从不同的角度进行分析此 次g r a h a m 的分析是针对前两种班级类型对于学生成绩的影响在不同大小的班级中,学生之 1 东北师范大学硕士生学位论文 间的相互影响大小可能会存在差异过小的班级可能会因为个别学生的突出作用而产生好的 或坏的影响,并且班级过小会增加教育成本;如果班级过大,学生受到的其他个别学生的影响 会相对较小,但是教师对于学生的影响也会被削弱因此,对于学校教育来说,合适的班级人 数对于学生的成绩和成长是非常重要的 基于s t a r 实验的数据,g r a h a m 对实验中可能产生的交互影响进行考察,并给出如下模 型假设:设有n 个班级,第c 个班级有 磊个学生, 圪= a c + ( 7 0 1 ) 瓦+ d 其中玩表示可观测的学生成绩,a 。表示外部影响( 教师的影响,不可观测) ,d 表示学生个体 水平,- g 。= 玉6 帆m c ( 岛= ( g c l ,c c m c ) 7 ,c 耽= ( 1 ,1 ,1 ) ,有尬个分量) ,表示个体的平均水 平设职= 1 表示小班,w c = 0 表示大班 在g r a h a m ( 2 0 0 8 ) 中,作者将学生个体因素的平均值手作为学生之间的相互影响项,但是 模型如此设定就存在这样一个后果:因为每个学生之间存在影响,即c 伽( e ( z ) ,( j ) ) 0 ,所以 模型中的交互项与学生个体因素项存在相关性 在g r a h a m 估计社会交互影响项7 0 的过程中,作者又给出这样的假设条件,即条件方差 的假设; 阶c 蔓i m ,”,= ( 0 :乙。程。m m 一吒篇东:叫m ,伽k 。,m ) 这里k 是m m 单位阵,吒s ( m ,伽) = c 伽 d ,锄im ,伽) = ( 1 一伽) 畦( o ) e ( o ) ( m ,加) + 盯刍( 1 ) e ( 1 ) ( m ,加) 伽, 畦( m ,伽) = ( 1 一t t ,) 盯盖( o ) ,叫) + 仃j ( 1 ) ,w ) w ,磋( m ,叫) 和。,伽) 也有类似的定义 由模型假设和条件方差限制可以算出样本的方差, y n r ( 匕lm ,w ) = 入2 ( r n ,伽) 厶。+ 【话( m ,) + ( 前一1 ) a 2 ( m ,伽) m 卜m 。, 其中,兰。= ( k 1 ,如,y c m c ) ,a 2 ( m ,) = 磋( m ,叫) 一( 7 e 。( m ,伽) ,匍( m ,w ) = 程( m ,w ) + 2 伽 ( m ,w ) - 4 - 镌。( m ,叫) 利用上述假设条件,g r a h a m 通过类似组内方差和组间方差的两个统计量的运算得到了社 会交互影响项加的识别统计量他定义: 畔2 瓦d 南( 圪一瓦) 2 ,铹= ( _ 一坩( 职) ) 2 其中,嚣= 磁1 答坛,f , y ( w c ) 为同一类班级学生成绩的平均值这里的g 芋可以看作为 组内样本方差,有学生之间的个人差异和教师等外部作用引起的;而g :,表示组间方差,如果 存在交互影响,并且交互影响受班级的大小影响,那么组间方差会在两组间存在差异 东北师范大学硕士生学位论文 通过计算我们可以得到这样的结果: 引畔】叫掣 e = 舳+ 前e 挈l 叫 这里匍) = 砖( 叫) + 2 7 0 e r a 。) + 9 0 2 e 。) 于是有下式成立。 e ( g ! lw = 1 ) 一e ( g :iw = 0 ) 一,2 7 - o ( 1 ) 一r o ( o ) e ( g w 可w 汇面= e ( g y 可w 汇珂02 筒十可可可w 瓦了1f e ( g w c 可w 瓦珂0= 1 ) 一= )e ( g 竽l= ) 一= ) 整理这个式子可以得到 e ( g ! iw = 1 ) 一e ( g :lw = 0 ) = 前e ( g 芋iw = 1 ) 一e ( g 善iw = 0 ) + 7 1 d ( 1 ) 一i o ( 0 ) 这个式子的左边是两组之间的差异,右边第一项是学生影响引起的两组的差异,而第二项 是教师因素引起的两组间的差异,前作为学生因素影响项的系数,也说明学生个体对于两组 的影响较小,而相互之间的作用产生的交互影响对于两组的差异贡献较大当教师的影响在两 组之间无差异的时候,就得到了 y o 的识别估计量 3 东北师范大学硕士生学位论文 模型的提出与模型假设 对于学生成绩来说,对其存在影响的主要因素有教师因素的作用和学生个体因素的作用 教师的不同教学特点和经验因素等对学生的成绩会有影响学生自身的特点,学习方法、受家 庭因素的影响等也会对学生的成绩有影响作用此外学校的外部环境等对学生的成绩也有影 响,在模型的设定中,我们可以将这些外部环境的影响与教师的影响作用看作一项,共同影响 学生的成绩除了上述所说的两点影响之外,模型中还可能存在学生个体之间相互影响作用而 形成的社会交互影响项我们建立这个模型的目的也就在于找出一个统计量来识别是否真的 存在这样的社会交互影响项 在g r a h a m 的讨论中,存在社会交互影响项与学生个体因素项相关的问题为了克服这个 问题,我们重新给出模型的设定在新的模型中,我们将表示学生的交互影响项肛。从学生的 个体因素中分离出来,另外表示学生个体因素的项和交互影响之间不存在相关关系 按照这样的想法,我们给出新的模型假设: l 乞= n 。+ y o p c - 4 - e d( 1 ) 其中,圪表示观测到的个体样本数据( 学生的成绩) ,q 。表示外部的影响( 教师的作用) , p 。表示学生之间的交互影响,s 西表示学生的自身状况,并且有比上c i 尥在这样的模型设 定下,我们克服了g r a h a m ( 2 0 0 8 ) 中的模型存在的问题 给出了基本模型之后,下面要解决的问题就是寻找社会交互影响项加的估计量为了解 决这一问题,我们先给出几个基本的假设既然模型的提出是根据s t a r 实验项目,因此部分 假设也是从实验的过程中总结出来的在建模的过程我们已经看到我们唯一能获得数据就是学 生的成绩坛,而其他项都是分析过程中考虑到的对学生成绩构成影响的项,基于这种情况, 我们将在符合实验规则的基础上尽可能的简化掉不必要麻烦,为我们给出伽的估计量提供尽 可能大的方便条件,从s t a r 实验中我们看到我们可以尽可能的去掉教师差异对学生成绩的 干扰,即给出随机分离性假设;简化掉实验分组造成的差异,即给出随机分配性假设;并且简 化学生的差异,即给出条件方差的假设综合以上的分析,并依照s t a r 项目的实验设计,类似 于g r a h a m ( 2 0 0 8 ) ,我们给出如下假设: 假设1 ( 独立随机分配假设) m c f ( a 。( t ,) ,星c ( 们) l 职) = f ( a 。( 伽) ) 1 - if ( 既( 加) i 职) i = 1 w w = o ,1 ) w :表示第c 个班级所属的类别( 大班或小班) 4 东北师范大学硕士生学位论文 a 。( 伽) = 给定w := w 条件下教师对第c 班学生产生的影响 ; 忍t ( 加) = 给定职= 伽条件下第c 班第i 个学生的自身能力) 即q 。= ( 1 一w c ) a 。( o ) + w c a 。( 1 ) ,d = ( 1 一i 圪) e & ( o ) + w c e c i ( 1 ) 这是一个针对实验过程的假设条件在实验的过程中,教师和学生是随机分配进入各个班 级和班级类型,这样也就说明有其他因素产生的随机干扰被排除掉了,并且教师对班级的影响 也得到了限制教师与学生的随机组合,使得教师在每个班所发挥的作用差别相对较小并且 学生的交互影响是由班级组成之后的因素决定的,而非由组成班级之前的因素决定,这也保证 了交互影响是由班级大小决定的 假设2 ( 随机分离性假设) a 。( 1 ) 一a 。( 0 ) + k o 这也是一个针对实验过程的一个假设条件这个条件表明对每个老师所起到的作用大体 相当,由于实验的过程中教师是随机分配的,所以我们做这样的假设以保证结果的差异并不主 要来自教师的影响差异 假设3 ( 同质方差假设) e ( c yi 矾= 1 ) e ( g 芋iw c = 0 ) 这里,g 芋= 瓦丽1 e 答( 坛一霹) 2 , 这是个技术性的假定,在社会交互影响项系数识别的过程中我们可以看到,e ( g 岁1w := 1 ) 一e ( c yl 职= 0 ) 作为分母出现在识别统计量之中因此,从技术上我们要保证分母不为 零另外从实验本身来看,这个假设条件也是合理的,如果两个实验组存在有交互影响项产生 的差异,那么两个组的组内方差也会存在差异,从而保证分母不为零 假设4 ( 条件方差限制条件) 驯矧州,= 匕 品。磋一吒委00:。厶) 吒 j ( 磋一吒。) k + 。厶 其中,k 是m m 的单位阵,是m 维分量均为1 的向量 定义: 吒s = c o v ( ,6 c j m ,叫) = ( 1 一伽) 盯刍( o ) e ( o ) ( m ,t l j ) + 伽盯刍( 1 ) e ( 1 ) ( m ,伽) 类似的, 畦= v a r ( a cm ,叫) ,= u ( q c ,dm ,们) ,并且吒是可以通过前期信息对其进行估计或者 利用经验信息获得 5 东北师范大学硕士生学位论文 在条件方差的设定中,我们也是主要参考各个解释变量之间的关系教师之间会存在差 异,因此我们设以的存在社会交互影响项也会随着班级不同存在差异,所以我们设定以的 存在,学生个体因素的方差也会不尽相同另外,我们保证教师和学生个体在给定班级类型和 班级人数之后与交互影响项之间是不相关的 6 东北师范大学硕士生学位论文 社会交互项的识别 2 1 基于条件方差假设下社会交互项的识别 从g r a h a m 的文章中我们可以看到,虽然最后给出的识别统计量看似从计算过程中得到 的,也就是说看似是和模型有着十分密切的关系但是,通过具体分析我们可以知道,识别统 计量是可以从实验本身得到解释的所以,这种方法并不会受到模型设定的强烈限制,也就是 说在改变模型的情况下,识别统计量依然可能是成立的,或者只是形式上稍作改动所以我们 希望在我们设定的新的模型下,得到社会交互影响项的识别统计量 在前一节给定的各个假设条件的基础上,我们对给定的模型( 1 ) 中的交互影响项加以识 别,及考察加是否等于零给出如下定理: 定理2 1基于模型;圪= o t 。+ 7 0 # 。+ s o 在假设l 、假设2 、假设3 和假设4 条件下, 社会交互影响项的系数镌可由下式左端进行识别 e ( g ! iw = 1 ) 一e ( g ! iw = 0 ) ,。话( 盯;( = 1 ) 一吒( = o ) ) + 7 1 d ( 1 ) 一匍( o ) e ( g ww = 1 ) 一e ( g ww = 0 ) e ( g ww = 1 ) 一e ( g ww = 0 ) r 7 其中掣= 磙瓦1 = 玎錾阢一_ ) 2 ,磷= ( 瓦一船( 比) ) 2 证明: 由模型( 1 ) ,可知 圪= n c + 7 0 # c + e d = ( 口c ,肛c ,) ( 1 ,7 0 ,e 1 ) 7 其中e t 为单位向量( 第i 个分量为1 ,其他分量为0 ) 根据假设4 ,由条件方差假设条件可以得到: 砖0 c 幺 c o v ( v ,场叫) = ( 1 ,7 0 ,e i ) i o 吒 o i ( 1 ,7 0 ,e 1 ) 7 0 ( 磋一黯) + a e e 6 m e = 蠢+ 2 。+ 吒。+ 稆以+ ( 蠢一吒。) e :勺 因此,y o r ( 圪lm ,t ,) = 饰2 c ,p 2 + 砖+ 2 + ,对于i j ,c d 钉( 圪,场im ,加) = 伽2 。p 2 + 以+ 7 东北师范大学硕士生学位论文 2 0 h e + 盯e 5 所以, j e 7 ( 畔叫警 e ( g 6w ) = e ( v a r ( y em , ) ) = e 瓦1y 凹( 坛伽) + 等伽( 圪,y 。j m 川) = e ( 硪1 一) i 伽) + 吲2 口p 2 + 砖+ 2 。+ 。) = e ( g 善ci 伽) + ( 饷2 口“2 + 2 - i - 2 0 a z + 。) e ( g 6w = 1 ) = e ( g 掣iw = 1 ) + 韬仃:( = 1 ) + 7 - ( = 1 ) , e ( g ! lw = 0 ) = e ( g 竽iw = 0 ) + 饷2 盯2 ( 1 彤= 0 ) + 7 - ( = 0 ) 其中,7 ( z ) = 畦( ) + 2 a a 。( t ) + 。( t ) ,i = 0 ,1 整理可得: e ( g ! iw = 1 ) 一e ( g ! lw = 0 ) ,镌( 仃:( = 1 ) 一( = o ) ) + 7 _ ( 1 ) 一7 - ( o ) 一=-i-_-_-_-_i_-l_一 e ( g yw = 1 ) 一e ( g yw = 0 ) e ( g yw = 1 ) 一e ( g ww = 0 ) 证毕 这样,我们就得到了在新的模型下社会交互影响项系数的识别统计量正如我们所估计的 那样,与g r a h a m 所给出的识别统计量相比,两个统计量的形式上是很接近的,换句话说,真 正对识别统计量起到作用的是实验本身,而非模型的假定模型的具体假定只是对其他引起差 异的部分形式有影响 2 2 对识别统计量的讨论 在前一节中,我i f p , 经得到了关于社会交互影响项的系数7 0 的估计量,下面我们对这一 结果做出简要的讨论 首先,在第一节中,我们给出了模型的假设条件,根据假设2 可知,a 。( 1 ) 一a 。( o ) + k o , 这个假设说明教师间的差异,在着重考查班级大小所产生的效应时,由教师不同引起的差异要 控制在一定的范围内,于是我们可以有这样的结论: ) 州心蜘) ,磅( 冷 8 东北师范大学硕士生学位论文 在实验的操作中,我们着重介绍了教师和学生在分配的过程中是随机进行的,可以理解为 学生在两类班级里受到教师的影响是一样的所以我们近似认为( 1 ) = 。( o ) 另外,由于 学生也是随机分配进各个班级,所以我们认为。( 1 ) = o e 。( o ) 根据第一节中的假设条件,有o l 。= ( 1 一w ) a ! + w a :,于是可以得到其方差: v a r ( a 。) = y 口r ( ( 1 一伽) a ! + w a l ) 一1 ( 1 一w ) v a r ( a o ) + 伽y o r ( a :) + 2 w ( 1 一w ) c o v ( a o ,a 1 ) = ( 1 一叫) 仃j + 叫以= 盯j 故程( o ) = 以( 1 ) 在求7 0 的估计量时,我们设r ( i ) = 以( i ) + 2 a o 峙( i ) + 。( i ) ,其中i = 0 ,1 ,结合上面的分析我 们能得到这样的结果: r ( 0 ) = f ( 1 ) 一 于是,估计量转化为: 星( 垡! 里三! ) 二垒! 垡! 堡三! ! :】+ 1 ; 堕! ! 三! ! 二重! ! 三尘 e ( c y w = 1 ) 一e ( g 掣lw = 0 ) 一1 。加e ( g yw = 1 ) 一e ( g yw = 0 ) 在吒已知的条件下,前的估计为: 社鲻盟尘掣嚣器鬟矬幽趔 ( 4 ) 在得到这个识别估计量之后,我们试图通过随机模拟的方法来检验这个估计量估计出社 会交互影响项的程度,然而从实际的模拟结果发现这个统计量并不能帮助我们获得准确的社 会交互影响项的系数,甚至得到的估计值与假定的真值间存在很大的差异,相关的具体结果我 们将在第三节中给出 通过分析也可以发现给出的估计量存在一些问题统计量g ! = ( 砭一f ) 2 损失了很多数据 信息,并且受数据影响很大,当一个班的个别数据发生异常时瓦就会出现明显变化,在n 比 较大的情况下f 的变化并不明显,因此g ! 会受到很大影响,这样也会导致q o 的估计量不稳 定 2 3 识别统计量的改进 通过前面的分析可以看出g ! 的选择并不理想,影响了对 7 0 的估计但是,从总的思路中 不难看出,如果我们能从圪的差异中去除e d 和引起的差异,那么就可以得到由交互项引 起的差异,从而得到7 0 的估计量在去除d 和a 。引起的差异的过程中,如同之前的方法, 将两个组统计量进行差值根据前面的假设,实验个体是随机的分入两个实验组,并且随机的 9 去 = 0 ) , = 1 、 东北师范大学硕士生学位论文 这样我们就得到了改进后的加的估计对于一般情况,且p 在模型( 1 ) f 加也司采用上式 进行估计在模型( 1 ) 下,圪= 口。+ j y o # 。+ e d 南i ( 坛一歼 = 击篓- - - - 1 ( 铲酬2 + 羔( ( 一) 2 硼旷_ ) 2 堠- _ ) 2 协( 旷- ) ( 瓦- _ ) ) 同学生个体因素相类似,考虑教师因素在两类班级中起到的作用近乎相同,于是 e ( 而等( 砺一_ ) 2l = 。) = e ( 而等( 砺一瓦) 2 i = 1 ) , 所以同样能得到估计式( 6 ) 下一节的模拟结果说明改进的估计量比原有的估计量对加的估计 更有效 东北师范大学硕士生学位论文 随机模拟与结果分析 通过b r y a nsg r a h a m ( 2 0 0 8 ) 我们可以看到利用s t a r 教育实验项目数据得到的估计结果 这是一项由美国田纳西州教育局主持开展的教育研究项目,该项目持续时间长达四年,在田纳 西州共有7 9 所中小学的7 0 0 0 多名学生参加了本次教育调查,本次实验项目的目的在于考察师 生比例对于学生的影响,教育主管部门希望通过实验确定出更有助于提高学生成绩的班级类 型b r y a nsg r a h a m 利用学校的数学和语文成绩对话进行估计,得到的结果是: 7 2 ( m a t h l ) = 3 4 7 ,y 2 ( m a t h 2 ) = 2 3 3 9 2 ( r e a d i n 9 1 ) = 5 2 8 ,y 2 ( r e a d i n 9 2 ) = 2 1 1 从结果来看,语文成绩受班级的大小的影响差异比较大,相比之下数学成绩受到的影响比 较小这与我们平时的认识是相符的,语言的学习对于环境的要求是比较高的,但是数学成绩 主要依靠个人的努力,与学生的个体因素关系较大,而与相互的影响关系没有语文所显现的突 出但是明显的,学生的学习成绩与学生之间的相互影响存在关系 由于目前没有s t a r 的实验数据,因此我们利用随机模拟的方法来对之前获得的统计量 的统计性质进行检验我们主要是想知道对于真实的两个存在差异的模型,一个是存在交互影 响项的模型,一个是不存在交互影响项的模型,利用得到的交互影响项的识别统计量是否能够 检测出两个模型的差异 下面我们将对得到的统计量做为非参数检验我们设在第一个模型中存在社会交互影响 项,而第二个模型中不存在社会交互影响项 模型一: 圪= q c + 伽p c + c d ; 模型二: 圪= a c + c i 我们利用统计检验来判断这两个模型的差异,以确定统计量的有效性如果两个模型所得 到的统计量的值存在明显差异,则说明该统计量是有效的,反之如果两个模型得到的统计量的 值不能被区分开,那么统计量的作用就值得怀疑 通过之前的讨论我们知道: e ( g ! iw = 1 ) 一e ( g ! lw = 0 ) 一,2吒( w = 1 ) 一( = 0 ) 一=l十y。_。_;_-。_-_-_-_-_-_-_-。一 e ( g ww = 1 ) 一e ( g yw = 0 )e ( g ww = 1 ) 一e ( g 竽lw = 0 ) 1 2 东北师范大学硕士生学位论文 所以,可以推出下式: 镌= ( e ( g ! lw = 1 ) 一e ( g ! iw = o ) ) 一( e ( g 芋i 哩三1 上皇! 堡兰! 堡三型 盯;( w = 1 ) 一盯;( = 0 ) 为了考察统计量是否能区分上述两个模型,我们做如下的随机模拟首先我们遵照之前给 出的假设条件产生随机数,通过讨论我们看到教师的影响在对韬的讨论中起到的影响并不明 显,因此方便起见,对于代表教师影响的n 。我们先取为常数项,这样并不影响其在两组中方 差相同的特点对表示学生个体影响的e d 采用正态随机数,其中均值取为5 0 ,标准差为5 肛。采用均匀随机数,对小班组取为( 0 , 4 石) 的均匀随机数,大班组取为( 0 , 6 ) 的均匀随机数, 这样选取的目的在于使得两组之间肛。方差的差值为1 通过这样的选取进一步将镌的表示式 简化为: 镌= ( e ( g ! jw = 1 ) 一e ( g :jw = o ) ) 一( e ( g yw = 1 ) 一e ( g 芋cw = o ) ) 通过模拟计算我们给出估计值散点图: 1 3 1 4 东北师范大学硕士生学位论文 从图形来看,利用估计量可以大体的估计社会交互影响项的存在以及其对于个体成绩的 贡献量,但是得到的结果普遍小于其真实值,可能是两组之间做差值的过程损失了一部分社会 交互影响项的贡献 进一步的,选取不同的的班数n 和不同的班级人数 磊,比较估计值的变化 ( 1 ) n = 2 0 0 时,分别选取为3 0 ,5 0 、i 0 0 ,考察 7 0 分别为0 和2 时估计值的变化情况 ,结果如下图示: 这个两个图都表明在n 不变的情况下, 磊变大使得估计量的值波动减小,更加稳定( 图中 实线表示 磊为3 0 的情况,点状虚线表示 磊为5 0 的情况,短线虚线表示尥为1 0 0 的情况) ( 2 ) m 。= 5 0 时,分别选取n 为5 0 、i 0 0 、2 0 0 ,考察加分别为0 和2 时估计值的变化情况 ,结果如下图示: 1 5 东北师范大学硕士生学位论文 这个两个图都表明在 厶不变的情况下,n 变大使得估计量的值波动减小,更加稳定( 图中 实线表示n 为3 0 的情况,点状虚线表示n 为5 0 的情况,短线虚线表示n 为i 0 0 的情况) 此外,我们进一步考察交互影响项p 。与数据圪比例不同的情况对这种估计方法的影响 眦分别选取( 0 , 6 ) 和( o ,2 侗、( 5 , 1 1 ) 和( 5 ,5 + 2 怕) 、( i 0 ,1 6 ) 和( 1 0 ,i o + 2 、- d ) 均匀分布模拟结 果如下; 从模拟的结果来看,p 。的不同分布的选取并不改变7 0 的估计值,也就是说估计方法并不依赖 分布的选取 1 6 东北师范大学硕士生学位论文 3 结论 通过前两节的论述,我们可以看到,在g r a h a m 给出的条件方差限制下的社会交互影响项 的识别方法的基础上,我们给出了一个更一般化模型下的社会交互影响的识别统计量并且通 过分析可以看出,这个统计量更加依赖实验的过程和现实存在影响的因素,而不是对社会交互 影响项的设定方法虽然在模型的设定上与g r a h a m 给出的模型存在着差异,但是最终的识别 统计量确实大体一致的这也预示着这种方法是一种普遍性的方法,而不是仅对于一些特殊模 型有效的方法 通过模拟的结果说明了基于方差限制下得到的估计量并不能较好的估计交互项的存在, 但是通过对估计量的改进,得到的新的估计量则能帮助我们得到与真实值接近的估计值,从而 有助于判断社会交互影响项的存在和对数据的影响并且这种估计方法并不依赖于模拟中对 于交互项分布的选取 通过随机模拟的结果来看,给出的社会交互影响项的识别方法能够确定出是否存在个体 影响造成的交互作用这对于以后判别其他类型的可能存在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论