第三讲 真实验设计.doc_第1页
第三讲 真实验设计.doc_第2页
第三讲 真实验设计.doc_第3页
第三讲 真实验设计.doc_第4页
第三讲 真实验设计.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲 真实验设计一、 实验设计概念的由来:广义的,实验者预料或者设计出来的,包括对实验变量的操纵,对无关变量的控制,对因变量的测量和统计分析方法的研究计划。:狭义的,对各种变量和实验程序加以安排和规定的实验模式。按照舒华(1994):实施实验处理的一个计划方案以及与计划方案有关的统计分析。实验设计包括如下活动:1 建立与研究假说的统计假说;2 确定实验中使用的实验处理(自变量)和必须控制的多余条件(无关变量);3 确定实验中需要的实验单元(被试)的数量以及被试抽样的总体。4 确定将实验条件分配给被试的方法;5 确定实验中每个被试要记载的测量(因变量)和使用的统计分析。 所谓真实验设计-在随机化原则基础上分配被试,能够充分控制全部内在的无效变异源和外在无关因素的影响,以获得比较准确的实验结果的设计。它是相对于准实验设计而言的。 所谓真实验设计是在各种设计方法中要求控制条件最严密、操纵自变量最有效和测定记录因变量最准确的一种。为了达到这些目标,常常需要将这类研究置于实验室条件下进行,也称为实验室研究设计(张一中,1998)。二、 心理学实验设计中的随机化问题1 随机化的概念和意义所谓随机化(RANDOMIZATION)就是研究者根据概率的原则进行选择或者分配变量的过程。随机化是近代实验设计的基本要求之一,是控制实验中无关因素的有效手段。2 实验设计中需要随机化的因素首先是被试的取样(抽样统计分析)心理学的实验研究是通过被试样本实现的,根据样本的研究结果来推断总体的某些特点。在实验研究中,要求被试样本完全是按照随机化的原则从总体中抽取得到的,因此,按照随机化的原则和方法获得的样本就称为随机样本。在取样之前,我们要懂得研究总体和样本的概念。所谓总体就是研究对象的全体,总体可以是无限的,也可以是有限的。一般而言,在具体研究中,被试的取样总是以有限总体为研究对象的。一般情况下,对总体全部进行研究是不可能的,也是不必要的。这时就涉及到从总体中取样的问题,采用能够代表总体的样本作为研究的被试。当总体同质性高时,抽样比较容易,总体同质性低时,抽样要求比较高。抽样之所以重要就在于它要真正能够代表研究总体。心理学研究中常用抽样的方法介绍随机抽样:按照随机性原则从总体中抽取样本个体的方法。就是在取样的过程中,使总体中的每一个个体都有同样的机会被抽取到样本中去。比较常见的有简单随机抽样和分层比例随机抽样。(1)简单随机抽样适应于总体中个体数量不太多的情况,例如将一个班级作为总体,丛中随机抽取一定数量的学生,就可以采用该方法。具体的做法是把总体中的每个对象编号,然后采用抽签或者查随机数字表的方法,取得足够数量的被试样本。(2)分层比例随机抽样:如果研究总体中情况和条件比较复杂,就需要按照研究的需要以一定的标准对总体区分出不同的层。例如,以一个城市的居民作为研究总体,就需要分为不同的年龄段、性别、文化程度、职业等各种层次,根据有关的资料掌握各种层次的居民在全市居民中所占的比例,然后按照这种比例计算出在每一层次中应抽取到样本中去的人数,并用简单随机抽样法在每一层次中抽取足够数量的被试,所有被抽取来的被试就构成了分层随机抽样的样本。抽样对于调查结果的影响无论如何估计都不过分。例如,1936年 Franklin Delano Roosevelt 和共和党的候选人Kansa 州州长Alfred Landon竞选下一任美国总统。当时绝大多数观察家认为Roosevelt会获胜,文学摘要却预言,Landon会以57% 对43%的压倒多数获胜。其根据是约有240万人参加的一次民意测验(poll)。在此之前,自1916年以来历届选举中,文学摘要(the literary digest)都准确地预测了获胜的一方。但结果是Roosevelt以62%对38%的绝对优势获胜。接受民意测验的人数绰绰有余,但预测误差幅度之大令人吃惊。与此同时,有一个较GEORGE GALLUP的人创立了一个调查机构,只调查大约50000人就正确预测了Roosevelt会以56%对44%获胜。那么,文学摘要预测的误差来自哪里呢?后来,研究者从样本抽取过程中发现了问题所在。文学摘要的程序是将问卷邮给1000万人,他们的名字和地址摘自诸如电话薄或者俱乐部会员名册。这样做的结果是筛选掉那些不属于俱乐部成员或者没有安装电话的穷人,而这些人正是支持民主党人Roosevelt的。在文学摘要的抽样程序中严重地存在着排挤穷人的选择偏向。而当时Roosevelt的主张有利于穷人,Landon的主张有利于富人。这是原因之一。这只是第一步的错误。当选择程序有偏向时,抽取一个大的样本并没有帮助。它只不过是在叫大的规模下重复基本错误。在确定样本后,还要去调查他们的想法。如果样本中的大多数人实际上不回答问卷或提问,那将产生严重的扭曲,称为不回答偏倚。例如,那一年中,给芝加哥登记的选民每三个人邮寄一份问卷,约20%回答,其中超过半数支持Landon ,但是在选举中是选民对Roosevelt和Landon的支持率为2:1。结论:不回答者可能非常不同于回答者,样本中不回答的个体比例很高时,防止不回答偏倚。结论:文学摘要的民意调查中,收到问卷的1000万人中只有240万人回答问卷。而在240万人并不能代表被测验的1000万人。有鉴于此,现代调查机构更喜欢采用亲自询问来代替邮寄问卷。尽管如此,亲自询问依然存在不回答偏倚问题。例如。访问者来访时,不在家的人和接受访问的人可能在工作时间。家庭关系,社会背景方面有较大的差异,从而看法也不一样。民意测验杜威(deway)当选年1948年共和党人THOMAS DEWAY , ALBANY州州长与在位的HARRY TRUMAN (罗斯福死后,接任总统)。三家主要的民意测验采访了竞选情况,代表HEARST报的CROSSLEY;联合了100家报纸的GALLUP,以及财富杂志FORTUNE的ROPER:统计资料使得ROPER相信杜威是胜利者,将领先5%。结果如下表所示: 预 测 实际结果候选人 CROSSLEY GALLUP ROPER TRUMAN 45 44 38 50DEWAY 50 50 53 45THURMOND 2 2 5 3WALLACE 3 4 4 2为什么会出现这么大的偏差呢?他们采用的是定额抽样方法。根据该程序,访问者访问的各种对象都规定了固定的名额,此外某些范畴也是固定的,例如,居住地区,性别,年龄,种族和经济状况。在其他方面,访问人员可以自由挑选。问题是:在规定的定额内,访问人员可以自由选择他喜欢的任何人,这就给人为选择留有过多的余地,而人为选择经常容易出现偏倚。英国统计学家Fisher(1890-1962)最早提出实验设计的概念。三、 实验设计的基本原则:随机化原则) 能够使可能存在的无关变量的效应受到控制,相互抵消;)可获得由每个自变量及其每个因素水平所引起的因变量的平均值以及他们之间的差异的恰当估计量。:局部控制原则) 即,力求在同一实验中的环境条件,仪器设备,技术措施,被试等都应尽可能一致。实验条件具有同质性。:重复原则即,每一因素水平或因素水平的组合,实验次数不得少于次。其作用有两个第一:可以得到更精确的实验误差估计量;第二:可以对样本平均数有一个更精确的估计。四、 良好的实验设计的特征:对诸多无关因素或新异变量建立实验控制,以便使实验组与控制组之间的差异确实是由实验处理引起的。:实验结果的普遍性和概括力,或者说代表性和可推广性。具体地说,可以分解为以下几点:1 充分的实验控制,指对实验条件有足够的控制,以便实验者能够解释结果。2 不加人为修饰,如果实验结果推广到非实验设定的情景时也成立。3 比较的基础,需要通过某种方式进行比较来确定是否有实验效果。控制组的引入;4 通过数据获得足够的信息,数据必须足以检验实验假说。5 非污染的数据,数据应充分反映实验效应。没有相关变量之间的干扰,实际上,这与充分的实验控制密切相关,可能存在其他对因变量有影响的变量,这些变量称为无关变量,这些影响不应被错误地理解为实验效应。6 代表性,研究者常常希望将实验的结果推广到其他场合。7 省力原则,如果所有其他特征相同,应该使用简单的而不是复杂的设计。良好设计的标准可以概括为增加实验效度,实验效度可以分为内在效度和外在效度(Campell, Stanley, 1963)。所谓效度指测量是否测到了它所需要的内容,或者说测量结果与所要达到的目标二者之间相符合的程度。例如,智力测量测量的是儿童的智力而不是知识,高考测量的是高中生对中学知识的掌握程度以及大学学习能力的潜力。在实际操作中,效度是采用相关系数来表示的,效度的分类标准有许多,比较常见的是三分法:内容效度,效标效度,结构效度;我们重点介绍效标效度,使用一种其他的测量作为参照标准,检查测量结果和预期结果的相关程度。它又可以分为两种:同时效度和预测效度。在实验设计的评价中,效度被分为内在效度和外在效度,内在效度指结果可以被精确解释的范围,外在效度指结果能够被推广的场合。我们希望两种效度都高,但事实上两者是相互冲突的。内在效度要求对无关变量的选择,测量方法等方面进行充分控制,以便研究者能够精确解释所发生的实验效应。控制得越严密,内在效度越好。但这样得到的结论很难推广,影响到外在效度。五、 实验设计的分类:完全随机,随机区组和拉丁方实验设计这是三种最基本的实验设计形式,它们的主要区别在于控制无关变异的方法。) 完全随机设计(completely randomized design)通过随机方法控制无关变异。使用随机分配被试的方法,通过随机分配被试给各个实验处理,达到实现各个处理的被试之间在统计上无差异。在方差分析中,所有不能由处理效应解释的差异全部被归结为误差变异,所以,检验不够敏感。(组间,处理引起)(组内,误差引起)例如:阅读理解随着文章中生字密度的增加而下降。自变量:生字密度;:;:;:;:四种生字密度。因变量:阅读理解测验分数被试名,随机分成四组,每一组接受一种处理(生字密度)的阅读材料。(),()()()。影响阅读理解的因素有很多,例如,文章的长度,文章的类型,被试的年龄,受教育的程度,阅读能力,但这里都不与考虑。特点是:第一,接受每个处理水平的被试数量可以不相等,不需要被试匹配,每个被试仅接受一个处理水平。第二:被试的个体差异带来的无关变异难以消除。随机区组设计(randomized block design)上面完全随机设计中,我们看到被试的个体差异可能混淆实验处理的效应。为解决这个问题,我们通过区组来控制。通过区组控制无关变异。先分同质组,将每个区组内的被试随机分配给各处理组。方差分析中,可以将无关变异从总变异中分离出去,减少了误差变异,增加了检验的精确度。举例说明区组的意思。例如:上面例题中,我们设想学生的智力可能对阅读理解测验分数产生影响,但它不是研究者感兴趣的因素,因此,研究者把他作为一个无关变量了来处理,可以通过实验设计将它的效应分离出去。先对个被试进行智力测验,并按照智力测验分数将学生分成个区组,然后将每个区组内的四个同质被试分别阅读一种生字密度的文章。这样就有两个效应,一个是生字密度效应,另外一个就是区组效应。特点:第一:在许多情况下,它比完全随机实验设计更加有效,它分离出去一个无关变量的效应,减小了实验误差。第二:如果实验中含有许多处理水平,可能给形成同质区组,寻找同质被试带来困难。第三:随机区组设计比完全随机设计有更多的限制,其前提假设是,实验中的自变量与无关变量之间没有交互作用。如果存在交互作用,使用随机区组设计是不合适的。拉丁方设计(Latin square design)和随机区组设计没有区别,只是它能同时区分两个无关变量,可以进一步提高实验的精度。例如:被试来自四个不同班级,实验在四个不同的时间内进行,这些因素都是可能影响实验结果的无关因素,我们把实验时间和实验班级叫做无关变量,他们分别具有四个不同水平,这样我们先将标准方块绘出来。标准块时间 t1 t2 t3 t4班c1a1 a2 a3 a4级 c2 a2 a3 a4 a1 c3 a3 a4 a1 a2c4 a4 a1 a2 a3也可以将标准块变为随机块。这里每个处理条件下各有两个被试接受该种处理。实验设计需要满足的条件。第一:有一个大于两个水平的自变量,还有两个大于两个水平的无关变量。一个无关变量的水平分配给行,另外一个分配给列。第二:处理水平和无关变量之间没有交互作用。第三:随机分配处理水平给个方格单元,每个处理水平仅在每行,每列中出现一次,每个方格单元中分配一个或者多个被试接受处理。 因此,实验中需要的被试数量是n。单因素和多因素实验设计) 单因素设计,只有一个自变量,有不同的处理水平;) 多因素设计,多个自变量,被试接受不同因素水平的处理。Factorial experimental design :主要作用在于能够探索几个自变量水平之间的交互作用。例如:与正常教学方法相比,使用独立学习和讨论的教学方法可能提高能力高的学生的学习成绩,却可能使能力低的学生学习成绩下降。自变量水平之间的交互作用往往比自变量的主效应提供更多的信息。被试间,被试内和混合设计BETWEEN-SUBJECT DESIGN , WITHIN-SUBJECTS DESIGN组间设计指实验中每个被试只接受一种自变量或者自变量水平的组合,完全随机,随机区组,拉丁方设计都是组间设计。他们的共同特点是对被试带来的无关变量控制得不够理想。这种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论