实验心理学课件_第1页
实验心理学课件_第2页
实验心理学课件_第3页
实验心理学课件_第4页
实验心理学课件_第5页
已阅读5页,还剩351页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,第一节,第二节,第三节,第四节,心理学实验中的变量及其操纵,实验研究的效度,实验设计,心理学实验报告的阅读和撰写,第二章实验研究的基本问题,主试就是主持实验的人,即直接操纵、控制和观测实验中的各种变量的人,也叫实验者(experimenter)。被试(subject/participant)就是在研究中被观测的人或非人类实验对象。实验对象或被观测的对象不等于“研究对象”,而往往只是研究对象中的一部分。潜在的或可能的研究对象的全体叫总体(population);从总体中抽取出来的实际参加实验的人或动物叫样本(sample)。进入到样本的人或动物才叫做被试。,第一节心理学实验中的变量及其控制,一、变量的定义及类型定义:变量(variable)是指在数量上或质量上可变的事物的属性(变量是至少有两种取值的事件或行为)。类型:三类最基本的变量刺激变量(stimulusvariable)机体变量(organismvariable)被试变量(subjectvariable)、属性变量(propertyvariable)反应变量(responsevariable),变量的类型,从实验研究的角度看,可把变量分为:自变量(independentvariable)、因变量(dependentvariable)和控制变量(controlledvariable)。凡是对因变量产生影响的实验条件均称作相关变量(relevantvariable),对因变量不产生影响的实验条件称作无关变量(irrelevantvariable),在相关变量中,用于研究的变量称作自变量,而不用于研究的变量称作额外相关变量(extraneousrelevantvariable),简称额外变量(extraneousvariable)。也称作控制变量,二、自变量的类型和控制,定义:在实验中实验者所操纵的、对被试者的反应产生影响的变量称为自变量。类型:课题变量(作业变量、刺激变量、任务变量)环境变量被试变量暂时的被试变量,问题与讨论,问题:许多研究者把被试特质作为自变量来处理,但它们本身并不是真正的自变量,为什么?讨论:真正的自变量必须是由实验者直接操纵的他们感兴趣的行为或事件。虽然实验者能操纵生理、经验、刺激自变量(控制自变量),但无法直接操纵被试特质。实验者不能创造被试的性别也不能使被试达到某个年龄。因此被试变量最好看作是分类变量(选择变量)而不是操纵变量。,自变量的控制,在实验中对自变量的操纵、变化称为自变量的控制。对自变量的控制,首先要对自变量进行严格的规定,对心理学中一些含混不清的变量必须使之操作定义化,只有这样才能进行实验。操作定义(operationaldefinition):指用可感知、度量的事物、时间、现象和方法对变量或指标作出具体的界定。例如,把“刚刚感受到”定义为“50%次感受到”,就可测定感觉阈限了。又如,疲倦(fatigue)没有一个共同的起点和尺度,怎么测量呢?如果定义为“工作效率的下降”,那么就可以进行测量和比较了。,讨论与练习,操作定义练习:焦虑记忆色情文学创造性学习强化自尊挫折惩罚死亡攻击性自我卷入态度,自变量的控制,其次,对于在刺激维度上连续变化的自变量,要做好三项工作:(1)要确定好自变量的范围(2)要选一定数量的检查点(处理水平)(3)要确定好各检查点之间的间距。假设有人想研究“随着动机强度的增加,作业成绩会怎样变化”这个问题则:,选择不同数量的检查点对实验结果的影响图示,强度增加成绩提高,强度增加成绩提高,强度增加成绩不变,强度增加成绩降低,至少三个检查点才能揭示变量间实际趋势,选择不同距离的检查点对实验结果的影响图示,强度增加成绩变化很小,二者无明显关系间距太小难以区分水平间差异,强度增加成绩先增后减检查点的间距适当,选择不同范围的检查点对实验结果的影响图示,强度增加成绩提高测试区段即范围不合理,强度增加成绩降低测试区段即范围不合理,测试区段即范围合理,自变量的控制,再次,校准测量自变量的仪器,保证研究的内在效度准确精密不失真。稳定。操作方便灵敏。不干扰所研究的心理现象。仪器的同质性要高。最后,控制刺激呈现的方式包括呈现时间长短、呈现次序、空间位置等。,三、因变量的指标及控制,定义:因为自变量的变化而产生的现象变化(行为表现),称为因变量(被测量的一种反应或行为。是实验所得的数据或结果)。把实验中的被试者的反应控制在主试者所设想的方向上,这就是反应的控制问题。以人作被试者,往往用指示语来控制被试者的反应。,使用指导语时应注意的的事项,指示语乃是心理实验中主试者给被试者交代任务时说的话。使用指导语时,应注意在允许的范围内做到引起动机,激发兴趣。被试者来到实验室时,不一定对参加实验感兴趣。因此主试者必须利用言词来引起他们的兴趣。在可能的范围内,告诉他们实验目的与应用价值,使他们认识到参与和合作的意义。,编制指导语时应注意,内容确定;完全;简单明确;标准化。,反应指标的选择,在心理学实验中,一般常用的指标有:绝对阈限差别阈限反应时反应持续时间反应程度完成量错误率完成一定的作业所需要的时间达到一定基准所需要的次数口头报告,选择指标的条件,条件:有效性,即指标充分代表当时的现象或过程的程度,也称为效度。客观性数量化避免量程限制:天花板效应(ceilingeffect)和地板效应(flooreffect)。根据实验的需要和参考前人研究来决定是否需要记录一个以上的因变量。问题:镜画实验中,是否需要记录两个因变量?良好因变量的特点:与测验量表一样,有效、可靠是其特点。,自变量与因变量的关系,补充:相关概念,调节变量(moderatingvariable):能增强、减弱或反转自变量和因变量之间关系的变量中介变量(mediatingvariable):假设既能够预测一个或多个因变量,同时又能够被一个或多个自变量所预测的变量协变量(covariantvariable):协变量指与因变量有线性相关并在探讨自变量与因变量关系时通过统计技术加以控制的变量。属于统计概念混淆变量(confoundingvariable):随着自变量系统性地变化的变量,同时也可能引起因变量的变化,四、额外变量的控制,实验者成为额外变量实验者特质:生理特质如性别、年龄、种族;心理特质如敌意、焦虑、内向或外向等人格特征。实验者的期望:Rosenthaleffect(指实验者对适当反应的预期影响着对待被试的方式以及被试的行为)实验者效应(experimentereffect)的控制控制实验者特质的一般步骤运用标准化的方法对主试进行培训对主试的外表、态度等因素进行标准化控制实验者期望标准化指导语使用仪器和自动化操作进行单盲试验(实验者或被试不知道哪组被试接受的是哪种实验处理的实验),被试知觉成为成为额外变量,要求特征与好被试Demandcharacteristics:来自实验本身的特征不经意地引导被试以特定的方式进行反应。典型例子就是霍桑效应(Hawthorneeffect)和安慰剂效应(placeboeffect)Goodparticipanteffect:被试按照他所感知到的主试期望来进行反应的倾向。,被试知觉成为成为额外变量,被试效应的控制使用单盲实验,但在这里被试将不清楚实验假设、实验的真实性质以及他们所在的组别。使用双盲试验(主试和被试双方都不知道哪组被试接受哪种处理)向被试提供有关实验性质的不真实信息但有两个弱点实验的道德问题被试对真实实验目的产生错误猜测,进而会针对这些虚假信息所提供的要求特征进行反应,控制额外变量,排除法(eliminationmethod):把额外变量在实验中完全去除的控制方法恒定法(constantmethod):额外变量只有单一取值并为所有被试所经历的控制方法匹配法(matchingmethod):使实验组和控制组中的被试属性相等的一种控制方法。成对匹配、共轭匹配统计控制法(statisticalcontrol):在实验结束后采用协方差分析(共变数分析)(analysisofcovariance),把影响结果的因素分析出来,以达到对额外变量的控制,匹配的技术:共轭控制(yokecontrol),共轭控制:给对照组被试的任务以实验组特定被试的作业为转移。冲突情景与猴子患癌症的关系。假设有一个理论,能够预测被试使用一种确定的回忆顺序,因为这个顺序使得词表容易记忆也许在一个特殊的顺序中,许多词存在联系,一个连着下一个。怎样用实验来检验这个假设呢?,控制额外变量,随机化法(randomization):保证每个被试有均等机会被分配到实验中任一种处理下的控制方法抵消平衡法(counterbalancingmethod):以呈现不同的处理顺序来控制顺序效应的过程,抵消平衡法,延续或痕迹效应(Carryovereffect):一种处理效应持续影响到被试对下一种处理的反应(处理本身的性质对后面的处理的影响)顺序或序列效应(Sequenceeffect):在一系列中处理出现的位置对被试的反应起着部分作用,顺序效应和痕迹效应,ABBA:可以抵消顺序效应和线性的痕迹效应ABBABAAB:只能抵消非线性的顺序效应而不能抵消非线性的痕迹效应抵消平衡与处理数:完全抵消平衡(completecounterbalancing)所有可能的处理顺序都出现。n!,四种处理就有4!4321=24。不完全抵消平衡(incompletecounterbalancing)或部分平衡(partialcounterbalancing)只出现一部分可能的处理顺序。选择哪种顺序?简单而且无偏的程序是构建拉丁方(Latinsquare),ABBA方法说明,A1B1B2A2。A1对B1B2A2都产生顺序效应。假设A1可使B1、B2和A2作业个增强2个单位,B1使B2和A2也各增强2个单位,B2使A2增强2个单位。这样,B1增强2个单位,B2增强4个单位,A2增强6个单位,A1前面没有作业,故A1增强0个单位。因此,A066,B246(顺序作用都相同,即线性关系)如果是非线性关系,如A1分别使B1、B2和A2分别增强2,1,0个单位,B1使B2和A1分别增加2个和1个单位,B2使A2增加2个单位,则A033,B235,显然不能抵消顺序效应,此时,需增加BAAB的安排。这样,A03238,B23038,就抵消了非线性的顺序效应,ABBA方法说明,ABBA可抵消线性的顺序效应,也可抵消线性的痕迹效应。ABBA加BAAB可抵消非线性的顺序效应,但不能低消非线性的痕迹效应,因为痕迹效应和前面发生的处理本身的性质有关。如当按AB顺序安排时,除顺序效应外,A对B还有痕迹效应;而当按照BA顺序时,B对A又没有痕迹效应,所一加上BAAB也不能抵消这种非线性的痕迹效应,平衡(balancing),是从恒定法的逻辑上延伸而来的,当实验中的每个组都接受所有的额外变量的影响,或以相同方式接受这些变量的所有水平,且程度相同,则可认为实验中每个组的到了平衡平衡:将额外变量的影响平均分配给所有组以达到组间平衡的方法,平衡额外变量,例如:检验两种教学方法,有两个教师。如果用恒定法控制教师这个额外变量就必须使用一名教师在两个班级上课。如果必须使用两个教师,可用平衡法来控制教师这个额外变量:让两个教师分别使用每一种方法教一半学生,问题:如果被试接受一个以上的实验处理,可以通过恒定法、平衡法控制相关额外变量,但无法控制顺序效应,抵消平衡法,抵消平衡法:一呈现不同的处理顺序来控制顺序效应的过程被试内抵消平衡法(within-subjectcounterbalancing):向同一被试呈现不同的处理顺序。用于控制每个被试所接受的顺序效应。如每个被试都按ABBA顺序来做实验。缺点:每个被试必须接受一次以上的处理条件,随着处理条件的增加,每一被试必须接受处理序列的长度随之增加,如A、B、C三种处理,则每个被试必须接受6个处理条件ABCCBA。组内平衡法(within-groupscounterbalancing):向不同被试呈现不同的处理顺序,即把处理条件按一个以上的顺序呈现给各组被试。用来控制对不同被试呈现不同顺序所造成的问题。,组内平衡法,组内平衡法,组内抵消平衡法的条件:每种处理必须以相同的次数呈现给每一名被试;每名被试各接收1次A和B处理每种处理在每个测验或练习阶段出现的次数相同;在第一次和第二次顺序中A和B均出现三次每种处理在其它处理前后出现的次数相同。A在B前后各出现三次观察下表,是否满足了组内抵消平衡法的要求?N!,2!2,3!6,4!24,5!120。,当完全使用所有的顺序时,就是完全抵消平衡法。尽管这样能够为顺序效应提供最好的控制,但当处理水平多的时候,就要考虑时间、经济、被试来源等问题。不完全抵消平衡法。右表是从所有(24)可能的顺序中随机选取12种。虽然每个被试接受每种处理的次数相同,但每种处理在不同测试阶段出现的次数不同,在其它处理阶段前后出现的次数也不同,不完全抵消平衡法,在此法中,随机选取第一名被试所接受的顺序,然后讲这个顺序在余下的被试身上依次有系统地旋转展开。如果第一名被试的实验顺序是BDAC,则。被试总数为12名,共采用4总顺序,每种顺序下3名被试。确保了每种处理在各测试阶段出现次数相同但不能满足每种处理在其它处理前后出现的次数相同。更好的方法:拉丁方设计,处理条件为偶数时,只需要一个拉丁方格就满足了抵消平衡法的要求,当处理条件为奇数时,如果仍按照前面的步骤排列,则不能满足每一处理条件在其它处理条件前后出现的次数相等的条件。如下左表格,每个处理条件出现在每一个可能的位置,但每一处理条件在其它处理条件两边出现的次数不相等,为此,需增加5个额外的序列,且与前面5个序列正好相反,这样就满足了要求。,PS:控制组(controlgroup),experimentalgroup:接受自变量处理的被试所组成的组即实验中的处理情景controlgroup:不接受自变量处理的被试所组成的组即实验中的无处理情景无处理控制组(no-treatmentcontrolgroup):目的是提供正常行为的标准或基线水平,以便将处理情境与之进行比较安慰剂控制组(placebocontrolgroup):是被试只接受安慰剂而不接受真正处理的情境,复习与讨论:实验中的变量分析,学习走迷津实验实验目的:研究随着学习次数的增加,走迷津所用的时间和错误次数的变化。实验材料:触棒迷津(见下图)、小棒、遮眼罩(见下图)、秒表、记录纸。,遮眼罩,实验程序,(1)三人一组,被试带上遮眼罩,用小棒走迷津(实验前被试勿看迷津,也勿用手触摸迷津)。主试对被试的指示语必须这样说明:“在排除视觉的条件下,尽快地学会用小棒走迷津,中间不要停顿,要积极运用动觉、记忆和思维,争取早些学会”。主试把小棒放在迷津的入口处,然后让被试用优势手拿住小棒,手臂悬空。,(2)被试手执小棒静候。主试在每次开始前2秒钟,先发出“预备”口令,主试再说“开始”时,被试才用小棒走动。在发出“开始”口令的同时,主试开动秒表。(3)被试在走迷津的过程中,凡进入盲巷一次就算出错一次,主试记下错误次数。,(4)当被试的小棒进入迷津终点,主试立刻说“到了”,同时停秒表,记录走一遍迷津所用的时间(秒)。再做下一次的准备工作。(5)学习遍数因被试者而异,均以连续三次不出错为学会的标准。(6)若被试在学习途中感到疲劳,可在某次走到终点后休息几分钟。,本实验的变量分析,自变量:学习次数因变量:时间、错误次数控制变量:刺激因素、被试自身因素、主试因素、环境因素,变量命名练习,因为理解自变量、因变量和控制变量非常重要,所以我们在这里再举一些例子以便你检查自己是否真的理解了。对于每一个例子都要说出三种变量。,汽车制造者想知道刹车灯多亮可最大程度地减少后面司机意识到前方正在停车的时间。实验就是回答这一问题。对变量命名。,答案自变量(被操纵变量):刹车灯的明度因变量(被观察变量):刹车灯亮到尾随车司机踩刹车踏板之间的时间控制变量(恒定变量):刹车灯颜色、刹车板的形状、刹车所需力气、额外照明度等,训练鸽子绿灯亮时啄键、红灯亮时停止。对作出正确反应的鸽子给予玉米的奖励。对变量命名。,答案自变量灯的颜色(红或绿)因变量啄键次数控制变量食物剥夺时间、键的大小、红灯绿灯的强度等,答案自变量用于奖励的语言种类。因变量语言数量(或频率)控制变量办公室情境、治疗者,治疗者试图改善患者的自我形象。每次患者描述自己积极的一面时,治疗者就以点头、微笑和额外注意予以奖励。对变量命名。,社会心理学家做了一个实验,为了发现当六个人挤在一个电话亭里时是男人还是女人感到更不舒服。对变量命名。,答案自变量参与者性别因变量不舒服的程度控制变量电话亭的大小、挤在电话亭的人数(6)、个体的大小等,变量命名练习,1、不同阅读过程文章信息保持特点的实验研究莫雷、陈雪枫,心理科学,1997年06期2、观察不同形状和颜色时眼运动的顺序性韩玉昌,心理科学,1997年01期3、强的和弱的学习者记忆监控能力的比较研究张萌,牛雄鹰,山东师大学报(社会科学版),1997年02期4、幼儿假设检验思维能力发展的实验研究杨春燕,张庆林,西南师范大学学报(自然科学版),1999年03期,第二节实验研究的效度,一、效度的概念,效度(validity)在词典中被定义为“真实性的质量或状态”。在研究情境中,效度关系到研究的可靠性或结果的精确性。通常,研究者会把效度作为研究质量的评估标准实验效度是指实验方法能达到实验目的的程度。实验目的是验证假设,验证自变量和因变量之间的关系,使实验结果的推论可用以解释和预测其他同类现象。,由于不同的实验者在设计上和在对额外变量的控制程度上极不相同,实验的效度也会有很大的不同。此外,每种实验都有几个不同的组成部分,其中每一部分也会影响整个实验的效度。了解影响实验效度的诸因素,将有助于我们评价实验设计的质量,提高实验设计的科学性。对效度的损害(threattovalidity):在研究中,任何导致研究质量或研究结果精确性的下降,都是“对效度的损害”传统上将与研究效度有关的问题分为两类:内部效度(internalvalidity)问题和外部效度(externalvalidity)问题,内部效度从实验内部评估你的实验研究,内部效度:一种评估实验的方式,检验自变量是否是因变量的唯一可能的解释。因此,实验的内部效度是指实验中的自变量与因变量之间的因果关系的明确程度。一项实验的内部效度高,就意味着因变量的变化确系由特定的自变量引起的。由于除了自变量以外,任何额外变量都可能对因变量产生影响,导致实验结果的混淆。这样我们就难以判定实验中自变量与因变量之间的关系的确定性。因此,要使实验具有较高的内部效度,就必须控制各种额外变量。,问题与讨论,研究者想比较两种教学法对一年级学生的影响,将一种教学法用于格林先生的班级,另一种教学法用于布朗先生的班级。到学年结束时,对所有学生进行一项阅读成绩测验,结果布朗先生的班级得分较高。在这次研究中,两位老师(格林与布朗)之间的差异会影响内部效度吗?请说明理由,威胁内部效度的因素任何能引起另一种解释的因素都会导致研究内部效度的降低,过去事件(history):是指在重复测量设计中在两次因变量测量之间发生的事件成熟(maturation):是指被试在实验中相当一段时间内发生的变化,可以包括实际的机体成熟或疲劳、厌倦、饥饿等因素测验(testing):是指对因变量的重复测量导致因变量的变化。练习效应和反应性测量(reactivemeasures)事实上改变了被测因变量的因变量测定方法,威胁内部效度的因素,测验设备(instrumentation):测验因变量的仪器或人在一段时间内改变了测验标准统计回归(statisticalregression):重测分数的提高或降低仅仅是由于统计上的原因,威胁内部效度的因素,选择(selection):如果实验前选择被试时两组被试并不等价,那么就很难确定实验后所产生的差异是仅由自变量引起的死亡率(mortality):不同组的被试以不同比率退出实验与选择的交互作用(interactionwithselection):基于成熟、过去事件或测验设备等所选择的不同处理组之间系统性的区别实验处理的扩散和仿效(diffusionorimitationoftreatment):一个处理组中的被试与另一个处理组中的被试熟识并仿照后者的处理方式,外部效度实验的外推,外部效度:一种评估实验的方式,你的实验结果是否适用于与你实验不同的总体或情景?实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性。以人的行为为对象所获得的实验结果,其推论法往往有相当的局限性。,外部效度实验的外推,一般化(generalization):一个实验的结果应用到不同的总体或情景中总体的一般化(populationgeneralization):实验结果应用到不同于原始实验的、范围更广的其他群体或被试中情境的一般化(environmentalgeneralization):实验结果应用到不同于原始实验的情景或环境中时间的一般化(temporalgeneralization):实验结果应用到不同于原始实验的时期,威胁外部效度的因素(方法角度),测验与处理的交互作用(interactionoftestingandtreatment):是指前测微妙地改变了被试,而此时处理还没有发生选择与处理的交互作用(interactionofselectionandtreatment):是指处理效应只对特定的样本或被试有效反应性的情景(reactivearrangements):是指实验情境改变了被试的行为,而无论自变量是否呈现多重处理的干扰(multiple-treatmentinterference):当被试在同一实验中经历了多个实验处理时发生,先前实验处理中习得的经验可能会影响在后来处理中的表现,这种处理所得到的结果对那些之前没有接受过处理的被试来说,是否具有普遍性?,威胁外部效度的因素(被试角度),声名狼藉的白鼠比较心理学(comparativepsychology)问题随处可见的大学生便捷取样(conveniencesampling)、随意抽样(haphazardsampling)、费用限制性取样(cost-restrictivesampling),被试选择性偏差(subjectselectionbias),威胁外部效度的因素(被试角度),关于女性被试问题性别歧视问题甚至老鼠和学生也都是白色的种族歧视问题甚至老鼠、学生、女性和少数群体也都是美国的跨文化心理学(cross-culturalpsychology)问题以及民族中心主义(ethnocentric)问题讨论魔鬼代言人:外部效度总是必要的吗?,内部效度与外部效度的关系,实验的内部效度和外部效度是相互联系、相互影响的。提高实验内部效度的措施可能会降低其外部效度,而提高实验外部效度的措施又可能会降低其内部效度。这两种效度的相对重要性,主要取决于实验的目的和实验的要求。一般而言,在实验中控制额外变量的程度越大,则对因果关系的测量就越有效。因此,可以在保证实验内部效度的前题下,采取适当措施以提高外部效度。,构思效度,构思(construct)是指一种理论上的构想或概念。特征在本质上他们是某些规则的抽象摘述(abstractsummariesofsomeregularity)他们与具体的可观察的实体有关或者相关联构思效度(constructvalidity)是指在研究历程中所涉及的变量成功操作化的程度。,影响构思效度的因素,对于研究假设的解释实验过程单一操作的偏向单一(实验)方法的偏向实验者期望和被试猜测自变量水平选择的误差造成的混淆不同实验处理的交互作用,统计结论效度,统计结论效度(statisticalconclusionvalidity)是指正确运用统计方法解释研究结果的程度统计结论效度主要取决于两个方面的条件:数据的质量统计检验的假设,影响统计结论效度的因素,统计功效低违反统计检验的假设测量信度低实验处理实施的可靠性研究背景中的随机的因素被试的随机异质性,第三节实验设计(experimentaldesign),二、实验设计的基本类型,一、实验设计概述,三、实验设计的基本类型,四、准实验设计,六、单被试设计,五、非实验设计,实验设计,一、实验设计概述,含义:实验设计乃是进行科学实验前做的具体计划。它主要是控制实验条件和安排实验程序的计划。它的目的在于找出实验条件和实验结果之间的关系,做出正确的结论,来检验解决问题的假设。,实验设计的内容,刺激变量(或刺激变项)的确定及其呈现的方式;反应变量(或反应变项)的指标及其测量方法;对一切有关变量(或变项)的控制措施;确定被试总体及被试样本人数和选择被试的方法;拟定主试在实验开始前对被试者要说的指示语;规定实验次数;安排实验程序;规定使用仪器的型号;规定处理实验数据的方法。,实验设计的功能,使研究变量的效果最大化;对额外变量进行有效控制;使实验误差变异最小化;充分体现自变量和因变量之间的关系和内在联系。,二、实验设计的基本类型,从对实验控制条件的严密程度的不同:真实验设计(trueexperimentaldesign)准实验设计(quasi-experimentaldesign)非(前)实验设计(non-experimentaldesignorpre-experimentaldesign)根据实验中要操纵变量的多少:单因素实验设计(one-factorexperimentaldesign)多因素实验设计(multiple-factorexperimentaldesign)根据在各种自变量及各种处理水平中是否用相同被试:被试内设计(within-subjectdesign)被试间设计(between-subjectdesign)混合设计(mixeddesign),PS:设计的基本概念,因素(factor)与因素实验设计(factoralexperimentaldesign):因素指研究者在实验中感兴趣的一个变量即自变量。实验中所操纵的变量的每个特定的值叫因素的水平(level)。因素设计通常指多于一个因素的实验设计。,PS:设计的基本概念,处理(treatment)与处理水平的结合(treatmentcombinations):处理与处理水平的结合都是指实验中一个特定的、独特的实验条件。例如,人在快速呈现条件下汉字命名的22两因素完全随机实验设计中,呈现速度(A)和汉字频率(B)各有两个水平,50毫秒(A1)、100毫秒(A2),高频字(B1)、低频字(B2);四种处理水平的结合:A1B1、A1B2、A2B1、A2B2。每个被试随机分配接受4种处理水平的结合之一,即接受一个独特的实验条件。在单因素设计中,自变量的每个水平相当于一个实验处理。,PS:设计的基本概念,主效应(maineffects)和交互作用(interaction):实验中由一个因素的不同水平引起的变异叫做因素的主效应。在多因素实验中,当一个因素的水平在另一个因素的不同水平上变化趋势不一致时,说明两个因素之间存在交互作用。当一个因素的水平在另一个因素的不同水平上变化趋势一致时,表明两个因素是相互独立的。,交互作用图示,交互作用图示,PS:设计的基本概念,简单效应(simpleeffects):在因素设计中,一个因素的水平在另一个因素的某个水平上的变异叫做简单效应。如在22因素设计中,A因素的两个水平在B1水平上的方差叫做A在B1水平的简单效应,A因素的两个水平在B2水平上的方差叫做A在B2水平的简单效应。当方差分析中发现一个两次交互作用时,常需进一步做简单效应检验,以说明两个因素之间交互作用的实质。,A因素在B1、B2水平的简单效应,PS:设计的基本概念,被试内变量(within-subjectvariables):被试内变量是指对于接受该变量的被试来说,每一个被试接受了自变量的所有处理水平,则该变量被称为被试内变量。被试间变量(between-subjectvariables):被试间变量是指对于接受该变量的被试来说,每个被试仅接受自变量的一个处理水平,那么该变量被称为被试间变量。,PS:设计的基本概念,处理效应(treatmenteffect):指实验的总变异中由自变量引起的效应,包括主效应、简单效应、交互作用等。误差变异(errorvariance):指总变异中不能由自变量或明显的额外变量解释的那部分变异。误差变异有两种:单元内误差(within-cellerror):指当几个被试接受同样的实验条件时,他们之间所出现的差异。当只有一个被试接受一种实验处理时,单元内误差不存在。残差(residualerror):实验的误差变异中除了单元内误差以外的误差。当只有一个被试接受一种实验处理时,只有残差。,PS:设计的基本概念,变异(variation):是指一组数据的离散程度。在统计学上,表示一组数据的变异程度有很多方式,这里主要介绍平方和(sumofsquares,SS或S2)以及均方(meansquare,MS)。一般来说,它们的值越大表明这组数据的离散程度越大。,平方和,总平方和(sumoftotalsquares)组间平方和(sumofsquaresbetweengroups)组内平方和(sumofsquareswithingroups),总平方和是指一组数据的观测值与平均数离差的平方总和,代表了该组数据总体的变异程度。其计算方法为每个观测值与该组数据的总平均值相减的平方之和。,组间平方和是指多个处理组的平方之和,代表了不同处理组数据之间的变异大小。其计算方法为各组平均数与总平均数之差的平方和,再乘以各组被试数。,组内平方和是指多个组内部各自平方和之和,代表了不同组内部变异的大小。计算方法为各组内部平方和之和。,均方即所谓的方差(variance),是指每个自由度(degreeoffreedom,df)上的平均变异。一般而言,它比平方和对变异的估计更准确,因为它不仅考虑到了数据变异的大小,同时也考虑到了造成变异的数据数目的多少。,总体自由度为总数据数减1,组间自由度为组数减1,组内自由度等于被试数减1之差再乘以组数,概念复习:样本自由度(degreesoffreedom,df),自由度:一组分数中,一个数取任何值的能力。假设有一组数据,其中有10个数,其总和为100。总和为100是一个没有自由变化的可能。,PS:方差分析的基本思想,使用方差分析去检验理论假设时,需满足两组假设:F分布的基本假设正态分布(normality)变异的同质性(homogeneityofvariance):F检验的一个基本思想是,当被试随机分配给K个处理水平时,K个处理组被试的观测值得变异是同质的,即个各组的变异是相等的。当各处理组的变异是同质的,才能进行F检验。独立性(independence):是指实验中一个被试的观测值应该独立与其它被试的观测值。在实验中,每个被试只被观测一次,且被试是随机分配给不同的实验条件时,独立性假设就满足了。,PS:方差分析的基本思想,分析真实验研究数据的方法常用的是方差分析(analysisofvariance)和t检验。t检验只适合检验两个平均数之间是否存在差异。方差分析可同时检验两个或多个平均数之间的差异,可检验几个因素水平之间的交互作用。,PS:方差分析的基本思想,方差分析在本质上是把“平均数之间是否存在差异”的检验转化为“变异是否存在”的检验。其主要功能是分析因变量的总变异中不同来源的变异。方差分析分析数据时,好像把组间变异放在一个噪音误差变异的背景上,当组间变异足够大时,明显不同于误差变异时,说明处理效应是存在的。如果组间变异和组内变异相比差不多,说明处理效应是不存在的,只不过是一种“噪音”或随机误差。,PS:方差分析的基本思想,实验设计模型及其假设实验设计模型(experimentaldesignmodel)需满的假设:模型反映了影响实验中观测之所有变异源。实验中包含了研究者感兴趣的处理水平。误差变异在每个处理总体内是以平均数为0、方差为的正态分布。每个被试的误差变异都独立与其它被试的误差变异。,(一)被试间设计,被试间设计(between-subjectdesign)是指每个被试只接受一种自变量水平或自变量水平的结合。也称作非重复测量设计(non-repeatedmeasuresdesign)。完全随机设计、随机区组设计和拉丁方设计都属于被试间设计。,被试间实验的结构,研究者创设的独立处理条件(自变量),使用分组程序将被试分成相等的独立组安排在各种条件下,来自总体的一个被试样本,被试间实验设计的特征,被试间实验设计要求在每一种被比较的处理条件下都要有一个独立的被试组,而且要尽量使用能产生相等组的程序将个体分派到不同组。本质特征是对独立的被试组进行比较在被试间设计中,每个被试最后只能有一个测试分数。在有些情况下,特别是当被测量的变量很不稳定时(如反应时),研究者可能要对每个个体进行多次测量,然后取其平均值,得到一个更可靠的分数。最终结果总是每个被试获得一个分数,因为每个分数代表一个独立的被试,所以被试间设计又常被叫做独立组测量设计(independent-measuresdesign)。,被试间设计的优缺点,优点:一种自变量(或实验条件)不会影响另一种自变量,因为每个被试只对一种自变量做反应。缺点:分配到各实验条件下的被试可能在各方面不是等同的,如果是这样,那不同实验条件造成的差异也可能是由于被试的差别引起的。,被试间设计关注个体差异的两个方面,在实验前被试间存在的差异(如性别、年龄、人格、家庭背景等)叫做现成的个体差异(pre-existingindividualdifferences)简称个体差异。个体差异可能成为混淆变量个体差异可造成分数上很大的变异性,使我们很难确定实验处理是否有效。个体差异引起的不可预测的变异性使数据变化模式不明显,研究结果模糊。,作为混淆变量的个体差异,混淆变量(confoundingvariable):通常是指一种违背控制的因而与被研究的两个变量一起变化的额外变量被试间设计中健在的混淆变量主要有个体差异和环境变量相等组:组建过程相等处理过程相等个体成分相等,控制组建相等组,随机分组:(有限的随机分组过程(restrictedrandomassignment)为了保证预定的各组特征(如容量相等),实验组分组过程受到限制)匹配分组:拆窝技术(split-littertechnique)保持变量恒定或限制其变化范围:,个体差异和变异,模拟实验结果1,模拟实验结果2,降低处理内变异,标准化的处理程序限制个体差异随机分配和配对样本大小,被试间设计中对内部效度威胁的其他因素,分组偏差(assignmentbias):缺席差异(differentialattrition):处理的扩散(diffusion)和仿效:补偿性取齐(compensatoryequalization):补偿性竞争(compensatoryrivalry):也称约翰亨利效应(JohnHenryeffect)怨气(resentfuldemoralization):,(二)被试内实验设计,被试内设计(within-subjectsdesign):也叫做重复测量设计(repeated-measuresdesign),被试内设计的优点,选择被试内设计的原因(优点),组内设计需要的被试较少。组内设计方便、有效。心理学的某些领域需要使用组内设计,即组内设计用于研究练习的阶段性最为理想。组内设计消除了被试的个别差异对实验的影响。,被试内设计的缺点(对内部效度的损害),时间相关问题历史(history)成熟因素(maturation)设备因素:设备(instrumentation)和设备偏差(instrumentalbias)统计学回归:统计学回归或平均数回归(statisticalregressionorregressiontowardthemean)顺序效应(ordereffects)问题后延效应(carryovereffect):累积误差(progressiveerror):也叫测验效应(testingeffects),常见的累积误差有练习效应和疲劳效应,时间关联效应的控制,时间控制不宜采用被试内设计的情况抵消平衡(counterbalancing)完全抵消平衡(completecounterbalancing)部分平衡法(partialcounterbalancing):选择顺序的一个简单且无偏的程序是构建拉丁方格(Latinsquare),(三)混合设计,在多因素设计中,自变量既包含有被试间因素,又包含有被试内因素,这种情况称之为混合设计。,24因素设计模式,三、实验设计的基本类型,真实验设计对实验条件的控制程度要求较高,在使用这类实验设计时,实验者可以有效地操纵实验变量,能有效地控制内在无效来源和外在无关因素的影响,能在随机化原则基础上选择和分配被试,从而使实验结果更能客观地反映实验处理的作用。真实验设计类型(从控制额外变异的角度)真实验设计之一:完全随机化设计真实验设计之二:多因素实验设计真实验设计之三:随机化区组设计真实验设计之四:拉丁方设计,R表示用随机原则分配被试,X表示实验处理,O的竖列表示在同一时间进行的前测或后测,O的横行表示在不同时间观测的结果,一行表示一个被试组,时间,“”表示对控制组未给予处理或给予与实验组相对照比较的条件,(一)真实验设计之一:完全随机化设计,完全随机化设计(completelyrandomizeddesign)也称简单随机化设计,是指用随机化方法将被试随机分为几组,然后依实验的目的对各组被试实施不同的处理。完全随机化设计的方差分析中,所有不能由处理效应解释的变异全部归为误差变异,因此处理效应的F检验不够敏感。,1.实验组控制组后测设计(experimental/controlgroupposttestdesign),该设计只有一个自变量,且自变量只有两个水平。基本模式如下:,设计模式,基本模式表示:首先采用随机分配的方法把被试分为同质的两个组,然后选择其一为实验组接受实验处理,另一组作为控制组不接受实验处理。在实验处理之后,两组接受相同的后测,并对观测结果的差异进行比较,以推论实验处理的效果。,实验组控制组后测设计的评价,优点:由于采用实验组接受处理,控制组不接受处理,从而控制了历史和成熟因素对内部效度的影响;由于实验是在同等条件下进行的,因此控制了选择和被试中途退出等影响内部效度的因素;由于没有进行前测,从而控制了测验和实验处理交互作用对实验外部效度的影响。局限性:仅适用于一个实验处理的实验研究。,实验组控制组后测设计的显著性检验,使用t-检验对两组后测成绩进行比较。非参数检验也常用曼-惠特尼(MannWhitney)U-检验或中位数检验法。,2.实验组控制组多组后测设计,在一个实验中,自变量有两个或两个以上的水平时,就需要两个或两个以上的实验组接受实验处理。,设计模式,模式说明:在这种单一自变量随机多组后测设计中,自变量包括k个水平,有k项实验处理,要求有k个随机被试组作为实验组,分别接受k项实验处理。此外还部署了一个不接受实验处理的控制组。最后对所有实验组控制组进行后测,从而获得主要由实验处理引起的k个因变量以及一个控制组的因变量。,设计评价,是实验组控制组后测设计模式的扩展,具有同样的优缺点。但实验组控制组多组后测设计还具有的一个优点是可以获得更多的因变量数据,有助于揭示自变量与因变量之间的系统关系,从而减少作出错误结论的可能性。,实验结果的统计分析,对于研究者而言,不仅要了解3种或以上实验处理的结果是否有显著性差异,还要了解其中任意两种处理之间是否有显著性差异,故而一般采用单因素方差分析,而不采用t-检验。如果F检验是显著的,也只能说明在几个平均数中至少有2个之间的差异是显著的。如果想知道是哪两个之间存在显著性差异,就需要进行N-K检验法(纽曼-丘尔斯检验,即q检验法),3.实验组控制组前测后测设计(experimental/controlgrouppre-posttestdesign),和仅有后测设计相比,在实施实验处理前,对实验组和控制组进行了前测。,设计模式,设计评价,优点:由于采用随机选取并随机分配被试的方法形成等组,从而可以控制选择、被试亡失以及选择与成熟的交互作用等因素对实验结果的干扰;由于安排了实验组和控制组,对于实验结果的分析是以实验组控制组后测成绩的比较为依据,因此在前测到后侧的阶段内,所发生的一切可能影响实验结果的因素对两组的影响是相同的,从而控制了历史、成熟、测验、仪器使用等影响内部效度的因素。缺点:被试由于前测而获得经验可能对后测产生敏感性,出现测验的反作用效果,从而影响到实验设计的外部效度(即实验结果不能推广到没有参加前测的样本群体中),设计的显著性检验,独立样本t-检验。首先对两组前测成绩进行比较,如果无显著性差异,则可以对两组后测成绩进行检验;如果前测成绩比较具有显著性差异,则不能直接进行后测成绩检验,此时,需要对两组后测的增值平均数进行检验。单因素协方差分析。将前测分数作为协变量,通过统计控制前测对后测的影响效果后,来比较两组后测的差异。,4.所罗门四组设计,所罗门四组设计(Solomonfour-groupdesign)也称重迭实验设计。该设计也是只有一种实验处理,随机选择被试和分组;一共4个组,两个实验组,两个控制组;两个实验组中,一个组有前测与后测,一个组只有后测;两个控制组中,也是一个组有前测与后测,另一个组只有后测。主要特点是把“有无前测”作为一个变量纳入实验设计中。在实验中,将此变量所造成的变异从总变异中排除出去,以此来检验实验处理所产生的效果是否显著。,设计模式,从模式上看出,所罗门四组设计,是把实验组控制组前测后测设计和实验组控制组后测设计结合而成的。与随机多组设计不同,仅由一个自变量的一个水平,两个实验组接受的是同样的一个实验处理。,设计评价,优点:所罗门四组设计实际上是进行了四个实验,从而可以通过检验O2O1,O2O4,O5O3和O5O6来验证实验处理X的效果。如果结果显著,则有充分理由推断结果的差异是有处理造成的。该设计还能够考察测验、历史和成熟等因素对因变量的影响。局限性:研究中很难同时找到四组的同质的被试。故在研究的初级阶段一般不使用这种设计,除非就实验假设作决定性检验才考虑使用。,所罗门四组设计的数据分析,如果对于前测的影响,或者前测和实验处理的交互作用允许忽略不计,可使用单因素方差分对四个组的后测平均数进行比较和检验。如果不能确信是否可以忽略前测效应,则可以把

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论