版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三节 实验设计,一、实验设计及评价标准 1、实验设计(广义):是指根据研究目的,经过周密的思考而制定出的整个研究工作的具体计划和安排(董奇,2004)。 2、实验设计(狭义):是指对人类或者动物的心理和行为进行实验性观察时,对控制条件的设计(Robert Solso,2002);包括如何选择被试、如何将被试分配到各实验条件、如何控制额外变量以及如何收集数据(Randolph Smith, 2004);目的在于使研究者观察到实验处理效应(张学民,舒华,2004)。 第二节内容偏重于变量的界定和控制;而本节的内容侧重变量与变量之间关系的考察,即自变量处理效应的考察。,3、好的实验设计的标准 宏观
2、评价(孟庆茂): (1)能够恰当地解决所欲解决的问题。 (2)恰当地控制实验中的无关变量。 (3)使实验结果有很高的可靠性。 微观评价(舒华): (1)使研究变量的效应最大化 (2)对额外变量进行有效控制 (3)使实验误差变异最小化 (4)充分体现自变量和因变量之间的内在联系。 构思效度和内部效度,二、实验设计的分类,(一)心理实验设计的宏观分类 真实验设计,准实验设计,非实验设计(前实验设计与事后设计 ) 真实验设计:就是通常所说的实验设计, 是以数理统计为基础的实验设计。其特征在于对影响内部效度的无关变量采取了严格的控制,能有效地控制研究中自变量的不同取值和因变量的指标,以及被试的分配情况
3、,并可应用统计方法分析实验结果。 优点:条件控制严密; 局限:自然性差,人为性强,生态效度低。,准实验设计:是指降低了实验控制的标准,通常在不易对被试进行随机取样,无法严格创设等组的条件下进行的设计。 如:教学方法与教学效果;工作压力与工作效率 优点:在真实性和生态效度上高于真实验设计。 局限:无关变量控制不够严格、因果关系确定性弱,知识问答 是先有真实验设计还是准实验设计? 真实验设计是否代表着实验设计的发展趋势?,准实验设计是由Campbell j=1,2,.,p) Yij 表示实验中第i个被试在第j个处理水平上的观测值。表示总体平均数,j表示水平j的处理效应,i(j)表示误差变异。 实验
4、设计模型的基本假设是: (1)模型 Yij = +j+i(j) 反映了影响实验中观测值Yij的所有变异源; (2)实验中包含了研究者感兴趣的处理水平(j); (3)误差变异在每个处理总体内是以均数为0,方差为2e 正态分布的。每一个被试的误差变异都独立于其他被试的误差变异。 实验设计最重要的功能就是使处理效应最大,使误差变异最小。,五、方差分析中的常用术语 主效应(main effects):实验中由一个因素的不同水平引起的变异。 交互作用(interaction):当一个因素的水平在另一个因素的不同水平上变化趋势不一致时,我们称这两个因素之间存在交互作用。 简单效应(simple effec
5、ts):一个因素的水平在另一个因素的某个水平上的变异。 处理效应(treatment effect):由自变量引起的变异。主效应、交互作用和简单效应均属于处理效应。 误差变异(error variance):不能由自变量或明显的额外变量解释的那部分变异。 单元内误差(within-cell error):几个被试接受同样的实验条件时,他们之间所出现的差异。被试个体差异导致的误差。 作用:用来估计实验误差。 残差(residual error):误差变异中除了单元内误差以外的误差,也应该是一种随机误差。如,只有一个被试接受一种实验处理时存在的误差。 作用:用来估计实验误差,六、真实验设计,(一)
6、单因素实验设计 1. 单因素完全随机实验设计 (1)单因素完全随机实验设计的基本特点: 适用条件:研究中有一个自变量,自变量有两个或多于两个水平。 基本方法:把被试随机分配给自变量的各个水平,每个被试只接受一个水平的处理。 误差控制:随机化法。假设被试之间的变异在各水平之间是随机分布的,在统计上无差异。 实验设计模型:Yij = +j+i(j) (i=1,2,.,n; j=1,2,.,p) Yij 表示实验中第i个被试在第j个处理水平上的观测值。表示总体平均数,j表示水平j的处理效应,i(j)表示误差变异。 即:总变异由两部分组成:实验处理引起的变异(j);误差引起的变异(i(j))。,(2)
7、数据处理方法(SPSS统计软件): 包含的统计变量:实验的自变量A,实验的因变量Y。 预期的统计结果:自变量A的主效应是否显著,即 F((P-1), P(n-1))的P值是否小于0.05。 实施的统计过程:analyzecompare meansOne- Way ANOVA (3)应用举例及延伸 与该设计相关的名称:随机组实验设计,独立组实验设计;下属的设计类型:实验组控制组前后测设计,实验组控制组后测设计,随机多组后测设计。,(3)单因素完全随机实验设计应用举例,研究题目:文章的生字密度对学生阅读理解的影响 研究假设:阅读理解随着生字密度的增加而下降 实验变量:自变量生字密度,含有4个水平(
8、5:1、10:1、15:1、20:1)。 因变量阅读测验的分数 实验设计:单因素完全随机实验设计 被试:32人,随机分为四组,每组接受一个自变量处理阅读一种生字密度的文章。 数据: a1:3 6 4 3 5 7 5 2 a2:4 6 4 2 4 5 3 3 a3:8 9 8 7 5 6 7 6 a4:9 8 8 7 12 13 12 11 思考:其他的例子?,2.单因素随机区组实验设计,(1)单因素随机区组实验设计的基本特点: 适用条件:研究中有一个自变量,自变量有两个或多于两个水平;研究中还有一个无关变量,也有两个或多个水平,并且自变量的水平与无关变量的水平之间无交互作用。 基本方法:首先将
9、被试在无关变量上进行匹配,然后把各匹配组的被试随机分配给自变量的各个水平,每个被试只接受一个水平的处理。 误差控制:区组法(无关变量纳入法)。通过统计处理,分离出由无关变量引起的变异,使它不出现在处理效应和误差变异中,从而提高方差分析的灵敏度。 实验设计模型:Yij = +j+i +i(j) (i=1,2,.,n; j=1,2,.,p) Yij 表示被试i在水平j上的分数;表示总体平均数或真值;j表示水平j的处理效应;i 表示区组效应;i(j)表示误差变异。 总变异组成:实验处理引起的变异;区组引起的变异;误差引起的变异。,(2)数据处理方法(SPSS统计软件): 包含的统计变量:实验的自变量
10、A,区组变量X,实验的因变量Y。 实施的统计过程:analyze General Linear Model Univariate 预期的统计结果:自变量A的主效应是否显著;无关变量即区组变量效应是否显著;若自变量主效应显著,则进行平均数多重检验。 (3)应用举例及延伸 与该设计相关的名称:随机化区组实验设计;下属的设计类型:随机化匹配组设计,随机化配对组设计。,单因素随机区组设计应用举例,研究题目:文章的生字密度对学生阅读理解的影响。 研究假设:阅读理解随着生字密度的增加而下降。 实验变量:自变量生字密度,含有4个水平(5:1、10:1、15:1、20:1); 因变量阅读测验的分数;无关变量被
11、试的智力水平 实验设计:单因素随机区组实验设计 被试及程序:首先给32个学生做智力测验,并按测验分数将被试分成8个组,每组4人(智力水平相等),然后随机分配每个区组内的4个被试阅读一种生字密度的文章。 数据: x1 x2 x3 x4 x5 x6 x7 x8 a1: 3 6 4 3 5 7 5 2 a2: 4 6 4 2 4 5 3 3 a3: 8 9 8 7 5 6 7 6 a4: 9 8 8 7 12 13 12 11 思考: 其他的例子?,3.单因素重复测量实验设计,(1)单因素重复测量实验设计的基本特点: 适用条件:研究中有一个自变量,自变量有两个或多于两个水平;当若干处理水平连续实施给
12、同一被试时,被试接受前面的处理对接受后面的处理没有长期影响(如学习、记忆效应)。 基本方法:实验中每个被试接受所有的处理水平。 误差控制:兼作组法(重复测量法)。利用被试自己做控制,使被试的各方面特点在所有的处理中保持恒定,以最大限度控制由被试的个体差异带来的变异。 但在这种设计的实验中,要注意控制顺序效应。 变异来源:自变量的处理效应;被试间个体差异的效应;随机误差变异。 优点:能全面控制被试变量对实验结果的影响;只需较少被试即可。 (2)数据处理方法(SPSS统计软件): 包含的统计变量:实验自变量A的各个处理水平:A1,A2,A3AP 实施的统计过程:analyzeGeneral Lin
13、ear ModelRepeated Measures 预期的统计结果:自变量A的主效应是否显著;不能做多重检验,但可以做两两相关t 检验。 (3)应用举例,单因素重复测量实验设计应用举例,研究题目:文章的生字密度对学生阅读理解的影响。 实验设计:为了更好地控制被试的个体差异对实验结果的影响,本实验采用单因素重复测量实验设计。 实验变量:自变量生字密度,含有4个水平(5:1、10:1、15:1、20:1); 因变量阅读测验的分数; 被试及程序:研究者选取8名被试参加实验,每个被试阅读4篇生字密度不同的文章。为了克服疲劳效应、练习效应等顺序效应,应以拉丁方排序实施4种生字密度的文章。 数据: s1
14、 s2 s3 s4 s5 s6 s7 s8 a1: 3 6 4 3 5 7 5 2 a2: 4 6 4 2 4 5 3 3 a3: 8 9 8 7 5 6 7 6 a4: 9 8 8 7 12 13 12 11,(二)两因素实验设计,1. 两因素完全随机实验设计 (1)两因素完全随机实验设计的基本特点: 适用条件:研究中有两个自变量,每个自变量有两个或多于两个水平;如果一个自变量有P 个水平,另一个自变量有q个水平,则实验中有pq个处理的结合,即具体的实验条件。 基本方法:把被试随机分配给各个实验处理的结合,每个被试只接受一个实验处理的结合。(注意:处理的结合而不是处理水平) 误差控制:与单因
15、素完全随机设计相同。 实验设计模型:Yij = +j+ k+ ()jk+i(jk) (i=1,2,.,n; j=1,2,.,p; k=1,2,q) j表示A因素水平j的处理效应; k 表示B因素水平k的处理效应; ()jk 表示水平j 与水平k的交互作用; i(j)表示误差变异。 即:总变异由四部分组成:自变量A引起的变异;自变量B引起的变异;AB交互作用的引起的变异;误差引起的变异(i(j))。,两因素完全随机实验设计的应用举例,研究题目:文章的生字密度与主题熟悉性对学生阅读理解的影响 研究假设:当文章的主题熟悉性不同时,生字密度对阅读理解有不同的影响。 实验变量:自变量A主题熟悉性,含有2
16、个水平(熟悉的,不熟悉的); 自变量B生字密度,含有3个水平(5:1、10:1、20:1);因变量阅读测验的分数。 实验设计:两因素完全随机实验设计 被 试:24人 实验程序:首先将自变A与B的水平结合成23即6个实验处理;然后把选取的被试分成6组,每组4人,分别接受一种实验处理水平的结合。如:有关春游的生字较少的文章,中等的文章和较多的文章; 有关激光技术的生字较少,中等和较多的文章。 模拟数据:a1b1 a1b2 a1b3 a2b1 a2b2 a2b3 3 4 5 4 8 12 6 6 7 5 9 13 4 4 5 3 8 12 3 2 2 3 7 11 思考: 其他两因素完全随机设计举例
17、?,(4)交互作用的含义及检验思路,交互作用的含义:当一个因素的水平在另一个因素的不同水平上变化趋势不同时,则这两个因素之间存在交互作用。,交互作用检验思路: (1)分析两因素之间的交互作用是否显著? 发现交互作用显著之后,不能停止不前,而应该进一步揭示交互作用的实质; (2)用图解法定性分析一个因素的水平在另一因素不同水平上的变化趋势;了解在什么种情况下因变量指标发生递增、递减变化,或保持不变。 (3)进行简单效应检验。分析图解中每一条线所代表的变化趋势是否显著。 (4)结合实验目的,对每条线所代表的心理学含义做出详细解释。,交互作用的具体检验方法: 图解法:首先计算出每个处理水平结合上所得
18、到的平均数,然后以平均数作图。优点:简单、直观。缺点:主观、缺乏统计依据。 思考: 如果两个因素交互作用显著, 那么有哪些可能的图解? 如果不显著, 又有哪些可能的图解? 简单效应检验法:是指分别检验一个因素在另一个因素的每一个水平上的处理效应,以便具体确定它的处理效应在另一个因素的哪个或哪些水平上是显著的,那些是不显著的。 在实际研究中,以上两种方法结合使用,才能从质和量上把握交互作用的含义。 SPSS for Windows下的简单效应检验程序: MANOVA 因变量Y BY 因素A(1,p) 因素B(1,q) / DESIGN = B WITHIN A (1) B WITHIN A (2
19、). MANOVA 因变量Y BY 因素A(1,p) 因素B(1,q) / DESIGN = A WITHIN B (1) A WITHIN B (2).,交互作用分析实例(1) 注意在空间记忆中的作用,无需注意转移条件,需注意转移条件,颜色辨别任务需注意转移和无需注意条件下的刺激流程,交互作用分析实例(2) 赌博成瘾者的情绪stroop效应,赌博成瘾者对不同三类词颜色命名的反应时(McCusker等,1997),思 考: (1)A、B的主效应都显著,二者是否可能存在交互作用? (2)A的主效应显著,B的主效应不显著,二者是否可能存在交互作用? (3)A、B的主效应都不显著,二者是否可能存在交
20、互作用? (4)如果上述情况存在交互作用,那么可能的交互作用模式有哪些? 注意:在研究报告撰写时,如果两个变量之间的交互作用显著,那么只需对交互作用的含义做出详细解释,而对主效应的含义不必解释。,生活中的交互作用现象举例 因材施教、众口难调、情人眼里出西施、冠军是不能选择的 心理学研究中的交互作用现象举例 能力倾向研究,2.两因素混合实验设计,一个既包含非重复测量的因素(被试间因素),又包含重复测量因素(被试内因素)的实验设计,叫做混合实验设计。 是现代心理与教育研究中应用最广泛的一种设计。 (1)两因素混合实验设计的基本特点: 适用条件:研究中有两个自变量,每个自变量有两个或多个水平; 其中
21、一个自变量是被试内的,即每个被试要接受他的所有水平的处理,另一个自变量是被试间的,即每个被试只接受一个水平的处理(从记忆效果和处理数过多考虑),或者它本身是一个被试变量,是每个被试独特具有,不可能同时兼备的; 研究者更感兴趣于被试内因素的处理效应以及两个因素的交互作用。 基本方法:首先确定研究中的被试内变量和被试间变量,将被试随机分配给被试间变量的各个水平,然后使每个被试接受与被试间变量的某一水平结合的被试内变量的所有水平。(被试分配模式见表) 误差控制:随机化法与重复测量法。 优点:被试内因素的方差分析精度高,适用范围广,实验设计模型:Yij = +j+ k+ ()jk+i(j)+i(j)
22、+i(jk) (i=1,2,.,n; j=1,2,.,p; k=1,2,q) j表示A因素水平j的处理效应; k 表示B因素水平k的处理效应; ()jk 表示水平j 与水平k的交互作用; i(j)表示 嵌套在j 水平内的被试i 的效应; i(j) 表示嵌套在k 水平和被试i 的交互作用中的残差;i(j)表示误差变异。 (2)数据处理方法(SPSS统计软件): 统计变量:实验的自变量A、B1,B2,B3。 预期结果:自变量A、B的主效应分别是否显著, AB的交互作用是否显著,若交互作用显著,需进行简单效应检验。 统计过程: analyzeGeneral Linear ModelRepeated
23、measures (3)应用举例,两因素混合设计应用举例,研究题目:文章的生字密度与主题熟悉性对学生阅读理解的影响 实验设计:为了重点考察生字密度对阅读理解的影响,本实验采用23两因素混合实验设计。其中主题熟悉性为被试间变量,含有2个水平(熟悉的,不熟悉的);生字密度为被试内变量,含有3个水平(5:1、10:1、20:1);因变量阅读测验的分数。 被 试:8人 实验程序:把八名学生随机分成两组,一组学生每人阅读一篇三篇生字密度不同的、主题熟悉的文章;另一组学生每人阅读三篇生字密度不同的、主题不熟悉的文章。实验实施时,阅读三篇文章分三次进行,用拉丁方平衡学生阅读文章的先后顺序。 模拟数据:见右表
24、。,其他更常见的研究情境: 探讨男女生,学优生、学困生,理科生、文科生等不同群体阅读能力的差异时,也可以运用类似的设计的数据模式。,两因素混合设计的简单效应检验程序 MANOVA ratio1 ratio2 ratio3 BY topic(1, 2) /WSFACTORS = ratio(3) /WSDESIGN = ratio /DESIGN = MWITHIN topic(1) MWITHIN topic(2). MANOVA ratio1 ratio2 ratio3 BY topic(1,2) /WSFACTORS=ratio(3) / WSDESIGN=MWITHIN ratio(1)
25、 MWITHIN ratio(2) MWITHIN ratio(3) /DESIGN=topic.,3.两因素重复测量实验设计(两因素被试内设计),(1)两因素重复测量实验设计的基本特点: 适用条件:研究中有两个自变量,每个自变量有两个或多于两个水平;如果一个自变量有P 个水平,另一个自变量有q个水平,则实验中有pq个处理的结合,即具体的实验条件。研究中的两个自变量都是被试内变量。 基本方法:每个被试都接受所有的实验处理的结合。实验刺激呈现给被试的先后顺序是随机的,或按拉丁方排序的。 误差控制:重复测量法。 实验设计模型:Yij = + i +j+ ()ij+ k+ ()j k +( )jk+
26、()jjk +ijk (i=1,2,.,n; j=1,2,.,p; k=1,2,q) i表示由被试 i 引起的变异,即被试间变异; ()jk 表示水平j 与水平k的交互作用; ()ij 表示j和被试 i 的交互作用的残差; ()j k表示k和被试 i 的交互作用的残差;i(j)表示误差变异。,两因素重复测量实验设计应用举例,研究题目:文章的生字密度与主题熟悉性对学生阅读理解的影响 实验设计:为了全面控制被试的个体差异,考虑到处理之间无显著学习效果,实验处理水平结合的数量不多,本实验采用23两因素的重复测量设计。所以两个自变量均为被试内变量。其中主题熟悉性有2个水平(熟悉的,不熟悉的);生字密度
27、含有3个水平(5:1、10:1、20:1);因变量阅读测验的分数。 被 试:4人 实验程序:把两个自变量的水平结合成6种实验处理,即6种文章。每个被试阅读6篇文章,其中3篇生字密度不同,主题熟悉,3篇生字密度不同,主题不熟悉。为了克服疲劳和顺序效应,实验分6次进行,每个被试每次阅读一篇文章,用拉丁方平衡学生阅读文章的先后顺序。 模拟数据: a1b1 a1b2 a1b3 a2b1 a2b2 a2b3 3 4 5 4 8 12 6 6 7 5 9 13 4 4 5 3 8 12 3 2 2 3 7 11,两因素被试内设计的简单效应检验程序,MANOVA A1B1 A1B2 A1B3 A2B1 A2
28、B2 A2B3 /WSFACTORS=A(2)B(3) /WSDESIGN= B WITHIN A(1) B WITHIN A(2). MANOVA A1B1 A1B2 A1B3 A2B1 A2B2 A2B3 /WSFACTORS=A(2)B(3) /WSDESIGN= A WITHIN B(1) A WITHIN B(2) A WITHIN B(3).,(三)三因素实验设计,多因素实验能使研究结果更加真实,更接近现实,从而更有价值。 1. 三因素完全随机实验设计 (1)三因素完全随机实验设计的基本特点: 适用条件:研究中有三个自变量;如果一个自变量有P 个水平,另一个自变量有q个水平,第三个
29、有r个水平,则实验中有pq r 个处理水平的结合。 基本方法:把被试随机分配给各个实验处理的结合,每个被试只接受一个实验处理的结合。 误差控制:与单因素、两因素完全随机设计相同。 实验设计模型:Yij = +j+ k + l + ()jk+ ()jl + ()kl + ()jkl +i(jk) (i=1,2,.,n; j=1,2,.,p; k=1,2,q;l= 1,2,r) j 、k 、l分别为自变量A、B、C处理效应; ()jk为AB的两次交互作用; ()jl 为AC的两次交互作用; ()kl 为BC的两次交互作用; ()jkl 为ABC三因素的三次交互作用; i(jk) 为误差变异。,(2
30、)数据处理方法(SPSS统计软件): 统计变量:实验的自变量A、B,C,实验的因变量Y。 预期结果:自变量A、B、C的主效应分别是否显著, AB,A C,B C、A B C的交互作用是否显著,并对交互作用进行简单效应和简单简单效应检验。 统计过程: analyzeGeneral Linear ModelUnivariate (3)应用举例及延伸 该设计思想及数据处理方法可更广泛地用于问卷、测验等调查研究。,三因素完全随机实验设计的应用举例,研究目的:同时探讨文章的生字密度、文章类型以及文章句子的长度对学生阅读理解的影响,以更深入研究影响阅读理解的因素。 实验设计:采用2 2 2完全随机实验设计
31、。自变量A生字密度,含有2个水平(5:1、20:1);自变量B文章类型,含有2个水平(说明文,记叙文);自变量C句子的平均长度,也有两个水平(平均句长20个词,平均句长30个词);因变量阅读测验的分数。 被 试:32人 实验程序:首先将自变A、B、C的水平结合成22 2即8个实验处理;然后把选取的被试分成8组,每组4人,分别接受一种实验处理水平的结合。如:生字较少的,句子较短的说明文;生字较多的,句子较长的记叙文等。 模拟数据:,(4)三因素实验设计交互作用的检验,1.两次交互作用和简单效应检验 当考察三因素实验中两个因素之间的交互作用时,应该忽略该两次交互作用中未涉及的一个因素,而仅考察两个
32、因素的数据。具体方法与两因素设计实验相同,即先作交互作用图解,然后进行简单效应检验。 2.三次交互作用及检验 (1)含义:表现为一个因素在另外两个因素水平的结合上的处理效应,或者表现为一个因素的各个水平上,两外两个因素的交互作用。,ABC交互作用图解(II),ABC交互作用图解(2),(2)简单简单效应检验 简单简单效应是指一个因素在两外两个因素水平的结合上的处理效应。如图(I)。 检验方法:(i)可通过条件筛选结合单因素方差分析进行显著性检验。如:当条件设为A=1 F2(2, 32)=7.35,P0.01 基于项目方差分析的步骤: 1.按常规方差分析要求输入原始数据; 2.用Data菜单中的
33、Transpose命令使原始数据做90度旋转,使被试成为变量,每个刺激项目作为case; 3.然后按常规方差分析命令进行分析,三、准实验设计,准实验设计是指在实际的社会情境中,不能用真正的实验设计来控制无关变量,但可以对一些影响实验结果的无关变量进行分类,将其作为自变量纳入,使用真实验设计的某些方法搜集、整理、统计分析实验材料的设计方法(孟庆茂等,2000)。其关键特征为:缺乏随机化。 适用条件:(1)以事先存在的被试组为研究对象;(2)被试不宜或无法随机分派到各实验处理 欧美分类方法:事后研究(Ex Post Facto Studies), 纵向设计(Longitudinal Designs
34、), 横向设计(Cross-Sectional Studies), 前后测设计(Pretest/Posttest Design),(一)单组准实验设计 1.时间序列设计 时间序列设计是指对一组非随机取样的被试实施实验处理,并在实验处理前后周期性地做一系列测量,然后分析前后测量是否具有连续性,从而推断实验处理的效果的设计方法。 (1)其设计模式为:一系列前测 实验处理 一系列后测; 也可表示为 :O1 O2 O3 O4 X O5 O6 O7 O8 时间序列设计的可能结果如下图所示。图A中前后测量结果基本上都是连续的,表明实验处理无效;B图中前后测量结果不连续,表明实验处理有效,其中,第一种情况有
35、稳定的正效应,第二种有短暂的作用,第三种有负效应。考察重点为总体趋向,而非某一段的局部特征。,1,思考:这种设计中主要的误差来源有什么? (2)优点:由于采用了一系列前测,时间序列设计对于成熟、历史、测验效应以及统计回归效应均有一定程度的控制。 缺点:无控制组,测验与处理可能有交互作用,练习或疲劳效应。 (3)统计方法:实验结果一般采用t检验进行考察。也可通过回归直线的差异检验进行(斜率、截距、残差)。 2. 相等时间样本设计 相等时间样本设计:是一种在没有控制组的情况下,对两种实验条件的效果进行比较的方法。具体做法为:对一组被试抽取两个相等的时间样本,前一个时间样本里出现实验变量,而在后一个
36、时间样本中不出现实验变量的设计方法。 (1)其基本模式如下: 处理测O1 无处理测O2 处理测O3 无处理测O4 (2)优点:相等时间样本通过比较多次测量的差异,可检验实验处理的效果并分析实验安排的顺序效应;可有效控制历史因素的影响及整个内部效度。 缺点:外部效度不高(练习效应、疲劳效应、被试选择偏差与实验变量的交互作用,实验安排的反作用)。它一般适用于一次实验处理对被试序列、行为只有暂时影响的研究。 (3)统计分析:T检验或简单效应检验。 批作业 X1 O1 O3 O5 不批作业 X0 O2 O4 O6,(二)多组准实验设计,1.不相等实验组控制组前后测设计 (1)这种设计的基本模式如下:
37、实验组:前测O1 实验处理(X) 后测O2 控制组:前测O3 后测O4 在不相等控制组前后测设计中被试不是随机抽取的,只是采用原有的静态的自然组,实验组和控制组之间可能存在选择偏差。 (2)优缺点:由于这种设计采用了控制组和前后测, 因此能有效控制历史、成熟、测验等因素。但是,由于该设计没有采用随机化法分配被试或实验处理,实验组与控制组是不对等的,因此,研究结果不能推广到对等和无前测的情境中。 (3)统计检验:这种设计一般采用独立样本的t检验或协方差分析,通过将两组前后测的分数变化进行比较,从而估计出实验处理的效果;也可采用非参数检验法进行,如曼-惠特尼U检验。,2.不相等实验组控制组前后测时
38、间序列设计 (1)设计的基本模式为: 实验组:一系列前测实验处理一系列后测 控制组:一系列前测一系列后测 也可表示为:O1 O2 O3 O4 X O5 O6 O7 O8 O9 O10 O11 O12 O13 O14 O15 O16 (2)评价:这种设计既采用了序列前后测又设置了非随机分配的控制组,能更好地控制成熟和历史的因素,而且测验的练习效应和敏感性也得到有效的平衡和控制。但测验的反作用效果,被试选择偏差与实验处理的交互作用仍可能影响该设计的外部效度。 (3)统计检验:T检验或直线回归方程检验。 (4)应用举例:,不相等实验组控制组前后测时间序列设计应用举例,一位教三个班的初一数学教师用这种
39、设计做了一项关于不同反馈类型对代数成绩影响的研究。在一个学期中, 这位老师进行了5次同等难度的持续一小时代数测验。尽管随着教学的进展,这些测验涵盖了不同的教学内容,但因为她精心采用了难度水平大致相等的题目设计试卷,因而每次测验具有大体相同的难度。在第2次和第3次测验之间, 她给1班以正反馈(X1);给2班以负反馈(X2),对第3班不做任何反馈(控制处理)。这项实验的图解如下: 班级 反馈类型(自变量) 1班 O1O2X1O3O4O5 代数测试 2班 O6O7X2O8O9O10 得 分 3班 O11O12O13O14O15 (因变量) 教学时间:1学期 ,1,3.分解样本前后测设计 这种设计的基
40、本形式如下 A组:前测O1实验处理后测O2 被试 B组:前测O3实验处理后测O4 这种设计实际上是将非实验设计的单组前后测设计进行两遍,适合于不能一次使所有被试都接受处理、但要求最终所有被试都接受处理的情况。 4.修补设计 修补设计实际上是将两个不同的非实验设计结合在一起。其基本形式为: A组: 实验处理后测O1 B组: 前测O2实验处理后测O3,四、非实验设计,(一)国外对非实验设计的看法 非实验设计就是不用实验作为研究手段的研究设计。 具体方法有: 1.现象学方法(phenomenology),是指对自己的直接经验进行描述的方法。 局限:(1)不能比较不同条件下被试的数据,因此不能得出因果
41、关系的结论;(2)对自身心理活动的关注可能会改变正常的心理活动;(3)其结论不一定完全精确、客观,而且其研究结果不能推广到别人身上。 2.个案研究法(case study),是指对他人的行为经验进行描述、记录的方法。常用于临床心理、特殊心理的系统研究。 3.现场研究法(field study),在现实情境中进行的研究。常用于研究在实验中看不见的心理和行为。 4.调查研究法(survey research),包括问卷法和访谈法。经常与其他方法结合使用,也可以独立使用。,(二)国内对非实验设计的看法,非实验设计是最为原始的实验设计,它是一种对任何无关变量都没有控制的。 实验设计。基本类型有: 1.
42、单组后测设计 是对一组被试实施实验处理,然后再对其进行观测,以评价实验处理的效果。其基本模式为:X O,X表示研究者操纵的自变量或研究者经过分析而推断的自变量。O表示后测成绩。 非实验设计方法与其说提供了一种研究策略,不如说是启发了一种评价研究结论可靠性角度,使我们能更理性地接受各种现实生活中和研究中的结论。 2.单组前后测设计 在实验处理之前增加了一次前测, 通过前测可以获得所抽取样本的最初水平或心理特征,再与单组后测结果进行比较,以分析实验处理的效应。 其基本模式为:O1 X O2。O1为前测成绩,作为基线观测值;X为实验处理;O2为实施处理X后的测验成绩。 优点:可比较处理前后的效果;全
43、体被试既做实验组又做控制组,有利于控制被试的个体差异。单组前后测设计(包括时间序列设计)也是被试内设计的一种。局限:讨论可能存在哪些误差? 经历、成熟、测验敏感性、统计回归、测验与处理的交互作用 成熟因素是指在前后测的时间间隔中,被试的某种特点会有某种自然的变化,如生理,心理的变化等。测量敏感作用来自于相同被试进行重复同样的测量,被试有了前测的经验,对后测可能有一定的影响。 统计检验方法:相关样本T检验;非参数的符号检验;非参数的符号秩次检验(F Wilcoxon)。,3.固定组比较设计,该设计除了接受实验处理的实验组外,另外设置了一个不接受实验处理的控制组。其基本模式为: 实验组:X O1
44、控制组: O2 优点:可比较有无实验处理的不同效果;可在一定程度上控制历史、成熟和统计回归等无关因素。 局限:在这种设计中,实验组与控制组被试的选取和分配不是随机的(选择偏差),存在选择与成熟的交互作用,选择与处理的交互作用,而且没有前测。因此也不能肯定地将实验组和控制组后测的差异归因于实验处理。 4.事后回溯设计 是指研究者不需要设计实验处理或控制自变量,将以自然发生的处理或自变量与某种结果或因变量联系起来加以考虑,从而二者之间关系的方法。 这是一种由果溯因的研究。包含相关研究和准则组设计两种。 参见朱滢P54-55。,第四节 心理实验研究的效度,1957,社会心理学家Campbell第一次
45、明确提出实验研究的效度问题。 1966,借用测验领域的“效度”概念,提出外部效度(external validity)与内部效度(internal validity) 的概念,作为设计与评价各种研究的标准。 1979,Campbell & Cook从外部效度中分离出构思效度(construct validity),从内部效度中分离出统计结论效度(statistical conclusion validity)。 效度:是指研究真实、正确地揭示所研究心理现象的本质及其规律的程度,也就是研究结果符合事物客观实际的程度。 主要有构思效度、外部效度、内部效度和统计结论效度等四种,一、构思效度 (一)构
46、思效度的含义 构思效度是指某项研究理论构思的逻辑合理性以及把抽象理论转化为操作性定义的恰当性程度。 (二)构思效度的影响因素 1、理论概念模糊、思路逻辑混乱,涉及选题、假设、研究框架; 2、单一方法和操作引起偏差,如焦虑包括状态焦虑、特质焦虑; 3自变量水平之间含义混淆,如自变量间距的设定; 4研究过程中主试的期望; 5因被试的猜测而发生被试心理与行为的改变,从而使被试的反应与不同实验处理之间可能存在交互作用。,(三)提高构思效度的方法 1.对某一项具体的课题研究,研究者必须全面深入地研读前人的研究成果,使自己的研究理论结构严谨、符合逻辑、层次分明。 2.对研究的各种变量作出明确、严格的说明,
47、尤其操作定义要明确、具体,有较强的可操作性。 3.对上述的各种影响构思效度因素要加以消除或严格控制。 (四)构思效度的检验方法 1.因素分析法,可以通过各因子之间的相关和因子负荷检验各维度的相对独立性;如智力、创造力、焦虑等指标的测定。 2相容分析法,通过求新指标分数与相类似指标分数的相关评价研究的构思效度 3.相异分析法,是指求两个不同性质的研究结果的相关,如果相关系数较小,则说明两个研究之间相对独立; 4.同质分析法,通过求相同研究的同质性系数即系数等内部一致性系数来考察构思效度的高低。 上述方法实际上,主要用于调查研究的构思效度分析,实验研究中的构思效度主要还是从逻辑合理上进行定性判断。
48、,二、外部效度,(一)外部效度的含义 外部效度是指研究结果能够概括化、普遍化到其他类似情境中去的程度,亦即研究结果的普遍代表性和适用性。包括总体效度和生态效度。 总体效度是指样本的研究结果能够适用于其所处的总体的程度与能力。要保证总体效度,,关键是被试的取样。 生态效度是指研究结果能够概括并适用于其他研究条件和情境的程度和能力。简言之,就是指研究能代表真实世界的情况。 要保证生态效度,关键看特定研究的变量、实验条件、工具、时间、程度等的代表性程度。,(二)外部效度的影响因素 1、 被试的代表性差; 2、研究变量的抽象与操作定义不明确,测量的信度、效度差 3、研究对被试的反作用; 4、前测与实验
49、处理的相互影响; 5、多重处理的干扰,如被试接受多个测验或参加多个实验而引起的互相干扰;如实验校和研究基地的研究成果代表性差。 6、实验者效应,如实验者的动机、行为、主观期望等影响被试 7、研究与实际情境相差较大,如实验室实验和现场实验的差距; 8、被试选择与实验处理的交互作用。,(三)提高外部效度的方法 1.提高被试方面的概括性。 如研究人类的心理现象,尽量要以人为被试,而不是通过动物研究的结论推倒人类的心理规律;对人类被试的取样要采用随机化的方法,样本容量足够大;采用统计推论推广研究结论时,概括不要超出研究总体。 2.提高实验材料和仪器的代表性 研究过程中,不能只根据一种材料或仪器而得出的结果作出广泛的概括,应采用不同的实验材料、测量工具对同样的现象进行测量。 如对于同样的心理现象可以通过行为实验法、眼动法、计算机模拟法和脑成像技术等多种范式去证明。 异法同证 3.提高实验任务和实验程序的代表性 如人们用不同的研究范式证实了负启动现象,这些范式有负启动范式、终止信号范式、flanke
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年度皖北卫生职业学院单招数学题库及答案详解(夺冠)
- 2024-2025学年度黑龙江生态工程职业学院妇产护理期末考试黑钻押题及完整答案详解(夺冠系列)
- 皮肤科银屑病患者药物管理方案
- 2024-2025学年度医师定期考核试卷及答案详解(基础+提升)
- 2024-2025学年宁夏体育职业学院妇产护理期末考试综合练习附答案详解(达标题)
- 2024-2025学年沧州航空职业学院电视播音主持期末考试测试卷含答案详解【新】
- 2024-2025学年度宜宾职业技术学院单招考试文化素质数学综合提升测试卷及答案详解(夺冠系列)
- 2024-2025学年度执业药师题库及完整答案详解(名师系列)
- 2024-2025学年中医执业医师练习题含完整答案详解【夺冠系列】
- 2024-2025学年度文化教育职业技能鉴定模拟试题及参考答案详解【综合题】
- 2026广东江门职业技术学院管理教辅人员招聘4人备考题库及一套答案详解
- 2026年知识产权保护知识竞赛试卷及答案(共五套)
- 2026浙江杭州市西湖区社区学院招聘融媒体中心管理人员(非事业)1人考试参考题库及答案解析
- 深度解析(2026)《NBT 10558-2021压力容器涂敷与运输包装》
- TAS倍智行测题库
- 2025年山东省春季高考数学试卷试题真题(含答案解析)
- 2025年西安学校财务岗笔试题库及答案
- 绿色食品安全课件
- 黑龙江省哈尔滨师大附中2025-2026学年高一上学期期末语文试卷(含答案)
- 新课改下高中篮球社团开展现状调查与研究
- 2026年1月浙江省高考(首考)英语试题(含答案)+听力音频+听力材料
评论
0/150
提交评论