多媒体学习的测试效应.doc_第1页
多媒体学习的测试效应.doc_第2页
多媒体学习的测试效应.doc_第3页
多媒体学习的测试效应.doc_第4页
多媒体学习的测试效应.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多媒体学习的测试效应摘要 当一个学习者学习了材料并且再次学习材料通过记忆力测试之后,在记忆测试中会表现得更好。在目前的研究中,282名被试观看了一个关于讲述闪电形成的动画片,接着再次观看动画演示(再学习),并接受实践保持测试(实践保持),或者是进行实践迁移测试(实践迁移)。首先,通过使用多媒体材料,测试效应再次被验证,这样在延时保持测试中,实践保持测试组的成绩会优于再学习组。其次,进行一个实践迁移测试,就会形成相应的测试效应。这样在延时迁移测试中,实践迁移组的成绩会优于再学习组。再次,这些结果提供了(支持)关于测试效应的迁移适当加工解释。实验结果显示:虽然实践保持组在延时保持测试中优于实践迁移组,但是我们从延时迁移测试中获得了与之相反的模型。 关键词 学习;记忆;测试;多媒体当一个学习者在学习材料后选择实践记忆保持测试与再次学习材料相比,在延时保持测试(但是即时保持测试不是必须的)表现会更好,这时测试效应也就产生了。通过使用例如单词列表、事实列表、散文诗等各种简单的实验材料这一发现已经被重复验证了。通过使用多种测试形式,我们发现了测试效应。这些测试形式包括多项选择测试、线索回忆测试、自由回忆测试等,它还包括其他不同的测试形式。它们可以测定对当前呈现的材料的记忆程度。 在一个典型的研究中(Roediger & Karpicke, 2006b),被试学习两次一篇科学小品文或者学习一次之后进行一次与最后的测试相同的实际记忆保持测试。再学习组在即时最终保持测试(学习结束5分钟后进行)中得分要高,然而实践测试组在延时最终保持测试中得分要高(学习结束2天或一周后进行)。因此,测试的效应仅仅明显地体现在延时测试条件中。进行第二次实验是为了检验记忆保持的多元化测试效应。Roediger和 Karpicke报告了相似的模型,在这个模型中通过再次学习至少有一个实际测试能够促进长时记忆。有趣的是,被试称,相对于测试条件,尽管在记忆保持测试中得到较低的分数,在再学习条件下,对未来记忆而言,还是拥有很高的自信度。研究者们总结说,测试不仅是一种知识评价的方法,还可以作为一种学习工具。 虽然测试效应似乎对教育存在有益的影响,但是大多数现有的研究只涉及人工材料和记忆保持测试。本实验共有三个目标。第一个目标是确定测试效应是否适用于更多与教育相关的材料,即用一个简短的多媒体课程解释雷暴的形成。一个积极的发现将是学习材料后并进行实践记忆保持测试(实践保持测试组)的学生优于学习两次材料(再学习组)后进行延时记忆保持测试的学生,但是这时即时记忆保持测试并不是必须的。检验测试效应的大多数研究是以言语学习材料为主的,例如词列表(例如,Carpenter & DeLosh,2006;Cull,2000; Hogan & Kintsch,,1971;McDaniel & Masson,1985; Tulving,1967),散文(例如, Nungester & Duchastel,1982;Roediger & Karpicke,2006b;Spitzer,1939)等。但是也有少数的研究运用简单的图片作为学习资料(Wheeler & Roediger,1992, Experiment 1)。可是,到目前为止还没有研究使用包括文字和图片的复杂学习材料研究测试效应。为此,在接下来的实验中使用的材料包括一个多媒体课程,也就是,一个包括文字和图片的课程。多媒体材料之所以与教育高度相关,尤其是在自然科学和数学领域,这是因为在线课程和教材使用用文字和图形来呈现信息。课堂教学还可以与多媒体相结合,尤其是PowerPoint在课堂上的普遍使用。因此,应用复杂的、与教育有关的材料评估测试效应可能带来的好处是很重要的。 本研究的第二个目标是确定测试效应是否适用于更多与教育有关的相关评估,即在迁移测试中,学习者必须在先前学习的多媒体课程的基础上来解决问题。先前的研究人员就已经在研究个体怎样记忆他们学到的知识(例如,Cull,2000;Glover,1989;Roediger & Cheryl I,Johnson and Richard E. Mayer,Department of Psychology,University of California,Santa Barbara. Karpicke,2006b)。但记忆评估的局限性在于他们没必要评估对材料的理解力。(梅耶,2001)为了解决这一问题的缺点,我们把迁移问题列入当前的研究内容中。迁移问题更加概念化,并且涉及解决一些新颖的问题。迁移问题的类型包括故障排除的问题,要求学习者诊断系统问题;重新设计的问题,要求学习者为了实现某一个目标而修正系统;或预测性问题,要求学习者说明事件或组成部分对系统的重要性。 虽然迁移测试问题的答案不能立即在课程中获得,但是学习者必须将新信息与先前的知识进行整合以便对材料达到更深层次的理解。(Anderson et al.,2001;Mayer,2001)。得到的比较积极的发现将是通过学习并进行实践迁移测试的学习者(实践迁移组)比经过两次学习(再学习组)并进行延时迁移测试的学生优秀,而此时即时迁移测试并不是必须的。第三个目标是检测关于测试效应的主流理论迁移适当加工过程。迁移适当加工过程的思想是,当学习者在编码中的认知加工过程与检索所需的认知加工过程相匹配时,测试的绩效将会提高。(Morris, Bransford, & Franks, 1977)。例如,McDaniel and Fisher曾经研究测试中反馈在学习过程中的影响。被试首先将54小事件进行编码,随后对其中的36个小事件进行实践测试,之后正确答案作为反馈呈现。两天以后,被试进行最终测试,这个测试包含一个问题,这个问题与54个经过原始编码的每个事件都相关。最后测试中的一些题目与实践测试中的一些问题是相似的(相同形式),相对地,最后测试中的另外一些问题解决了在实践测试(不同形式)中没有探查到的事件的其他方面。其他事件(因素)可以出现在编码阶段,但不是出现在实践测试中。实践测试中的题目比未被测试过的题目被重复使用的更多,这一发现与测试效应是一致的。仅仅当检验在实践测试中回答正确的题目时,McDaniel and Fisher 发现了一种问题类型的影响,这样被试在最后测试中在回答相同形式的问题比不同形式的问题表现要好。这一发现与迁移适当加工理论对于测试效应的解释一致,所以当时间测试中的问题形式与最终测试中的问题形式相匹配时,比问题形式不匹配时的绩效要高。 在当前的研究中,我们操控被试接受的实践测试类型,目的在于检测通过测试效应的迁移适当加工解释做出的预测。所有的被试都学习关于闪电形成的多媒体课程。接着,在中间阶段,被试获得一个额外的学习机会,或者进行实践记忆保持测试,或进行一个实践迁移测试。最后的记忆保持及迁移测试在5分钟后(例如,即时测试)或者是一周后(例如,延时测试)完成。迁移适当加工理论预测:当测试条件与干预条件相匹配时,学习者的表现应当是最好的。需要特别指出的是,迁移适当理论做出的另一预测:对于实践记忆保持组来说,在延时记忆保持测试中的得分应该是最高的;对于接受过实践迁移测试的被试来说,在延时迁移测试中的得分应该是最高的。假如更长的记忆间隔可以使测试效应更加有说服力,对于主要的延时条件来说,这些预测是站的住脚的。(例如,Roediger & Karpicke,2006b;Wheeler et al.,2003)。对于延时测试来说,为何测试效应最强,这并不在此项研究的范围内,因为我们重点在于文章中提到的三个目标。研究方法被试与实验设计我们从圣巴巴拉的加利佛尼亚大学的心理学被试库中招募了282名被试。被试的平均年龄是18.77岁(标准差=1.23),包括200位女性和82位男性。本研究应用一个32被试之间的设计。研究第一个要考虑的因素是测试条件:再学习、实践记忆保持与实践迁移,这三项之间的对比。研究要考虑的第二个因素是记忆保持间隔:即时测试与延时测试对比。在即时测试条件下,53名被试处于再学习情境中,53名被试处于实践记忆保持情境下,还有27名被试处于实践迁移情境中。在延时测试条件下,有59名被试处于再学习的情境中,59名被试处于实践记忆保持测试情境中,还有31名被试处于实践迁移情境中。实验材料 即将学习的材料包括一个简短带解说的动画,它揭示了闪电的形成原理,并在计算机上呈现出来。演示文稿时长为140秒,并载有图表来描绘闪电形成过程的16个主要步骤,同时伴随着286个字的解说。由于解说描述的事件即是动画描绘的事件,因此,所有的思想单元都以多媒体的形式呈现出来。这个动画同Mayer、Heiser和Lonn 的研究中使用的动画相同。研究包括两个主要的相关性评估,包括一个问题在内的记忆保持测试和由四个问题组成的迁移测试。 这些问题与 Mayer and Moren(1998)曾使用过的问题很大的相似性。每个问题呈现在单独的工作表上,并要求被试在同一工作表上撰写他们的答案。记忆保持测试询问被试的问题是:请写出对闪电的工作原理的解释,并给予被试5分钟的时间来回答这个问题。而实践测试和最终测试中使用的问题是相同的。实践迁移测试包括两个问题:你可以怎样做来减少雷电的强度;假设你看到天空中的云彩,但没有闪电,这是为什么呢?在实践迁移测试中,被试有 2.5 分钟的时间回答每个问题。最终迁移测试包括四个问题,其中两个同实践迁移的问题相同,另外还有两个新问题:空气温度对闪电的形成有什么影响,什么可以导致闪电的产生。在最终迁移测试中,被试给予3分钟的时间来回答每个问题。 这项研究进行过程中,共有两个问卷需要执行。它们分别是:被试统计调查问卷和主观评分调查问卷。人口统计问卷内容涉及与被试的年龄、SAT(学术能力评估考试)成绩和性别等方面相关的问题。为了评估被试先前的知识,我们使用被试统计调查问卷要求被试按照从1(非常低)倒5(非常高)的等级来评估他们的气象学知识,评估测得的平均分数为1.58(标准差= 0.79),这表明这些被试将他们关于气象学的先前知识评定为低等级。我们使用与先前知识相关的第二个评估来询问被试,目的在于表明下列各项题目是否都适用于他们。这些题目包括:(1)我经常在报纸或在网上阅读气象图。(2)我可以区分积和雨云。(3)我知道什么是低气压系统。(4)我可以解释是什么引起刮风。(5)我知道冷锋符号是什么。(6)我知道暖锋符号是什么。在这个评估中,复选标记会被叠加。测试的平均分数为0.99(SD= 1.23),这也再次表明被试关于这一主题的先前知识相对较少。主观评分调查问卷要求调查对象(被试)从三个方面评价学习资料,并1到7等级范围内进行打分。被试被问到的第一个问题是:从你研究的材料进行学习,你感觉有多困难。被试被问到的第二个问题是:你对学习的材料有多大兴趣。第三个问题问的是:你有多大可能记住学习的材料。实验过程 被试被随机分配,每节测试进行1到5个人在内的小组。每个学生坐在一台单独的计算机前,并在单独的房间中进行测试。首先,他们被告知,他们将会收到一个关于雷电形成的课程,然后用所学的知识回答相关的问题。接着,被试需要完成被试统计调查问卷。第三步,被试观看关于闪电形成的动画。第四步,被试需要在3分钟内完成测量空间的能力,也就是卡旋转测试(Ekstrom,French,& Harman,1976)。第五步,被试选择再次观看演示文稿(再学习组)并进行实践记忆保持测试(实践记忆保持组),或者是选择进行实践迁移测试(实践迁移组)。第六步,被试完成评估问卷。最后,被试需要在3分钟内完成第二次空间测量能力,也就是折纸测试(Ekstrom et al.,1976)。在这一点上,该过程在即时和延时组中会产生分歧。在即时组完成上述的步骤之后,被试要完成5 分钟记忆保持测试,测试要求他们解释闪电的工作原理。最后,被试回答四个迁移问题,每个问题有3分钟的时间作答。在延时组完成上述的7个步骤后,被试被通知在整整一周后返回继续完成实验。一周后,被试返回实验室,进行最终记忆保持测试和迁移测试。在延时条件下,给出问题的顺序同即时条件下的顺序相同,而且时间限制同个人在即时条件下的时间限制相同。实验完成时,被试都被感谢并做了简单的总结。实验结果被试特征我们进行了一个单独的32方差分析,以条件和记忆保持间隔作为因子,以方差分析在空间能力得分、先前知识、被试年龄、学习能力测验言语成绩,学习能力测验数学分数等方面的数据评估这些参数在组间的统计等价性。同样的,我们也进行了一个关于性别的卡方分析,这个卡方分析以条件和记忆保持间隔为因子,来确定性别分布在组间是否会有所不同。所有的测试显示这些变量处于.05的水平,在各组间并没有显著差异。实验数据评价 记忆保持测试的得分是通过确定被试在16个主要思想单元中书面回答的数目获得的。这16个思想单元相当于解说中呈现的关键点。这些关键点在附录1的括号里显示出来。被试含糊不清的答案或一部分答案不会被认可,只有与原文表达方式不同的正确答案才会被认可。记忆保持测试的正确率会遵循分析给出的报告。迁移测试中,对于每一个问题有可接受的答案,就可以获得一分。被试在每个问题中得到超过1分的分数也是有可能的,因为所有的问题都不止一种正确答案。迁移测试中供选择的答案汇总在附录2中。随后,我们把这四个问题的分数进行汇总来计算整体迁移的测试成绩。为了计算迁移测试的正确得分比例,我们用被试的分数除以迁移测试中的最高分数9.两位评估专家对测试的评分是140,运用皮尔逊积差对记忆保持测试和迁移测试成绩之间的相关性进行计算,结果分别为.96和.94。为了提高评估的可靠性,记忆保持测试和迁移测试剩余部分的评估由同一个人完成。图1展示了各组在记忆保持测试与迁移测试中的平均正确率(和标准差)。我们测试了关于三个研究问题答案的数据的各种子集。 图1 三组分别在5分钟后进行的记忆保持测试和一周后进行的延时测试中的平均正确率和标准差。测试效应可以扩展到多媒体材料吗?本研究的首要目标是确定测试效应是否能延伸至与教育相关的多媒体资料。针对这个问题,我们的重点在于比较再学习组和实践记忆保持组分别在在即时记忆保持测试和延时记忆保持测试中的平均正确率,结果如图1所示。与测试效应一致的一种结果模型是被试经过实践记忆保持测试与再次学习材料的方式相比,在最终的记忆保持测试中表现要好。表1:通过回忆记忆保持测试(在学习结束后5分钟或延迟1周后进行),将思想单元的平均正确率作为学习条件的函数。误差线表示使用方法的标准误差。 依据记忆保持测试的成绩,以测试中的条件(再学习和实践记忆保持比较)和记忆保持间隔(即时测试和延时测试比较)作为独立变量,我们进行了一个22的方差分析。由于实践迁移组的测试效应与先前研究的测试效应一致,因此在本次分析中排出这一因素的影响。如果这些数据与Roediger and Karpicke(2006,b)得到的测试效应模型一致,我们将会做出预测:测试条件和记忆保持间隔之间有显著的交互作用。与预期的一样,二者之间具有显著的交互作用。其中,F(1,220) =8.35, MSE=0.283,p=.004。从得到的数据中,可以知道再学习组的个体与实践记忆保持组的个体相比,在即时测试中的表现更好;然而,实践记忆保持组的个体在延时测试中的表现要优于再学习组的个体。测试效应的结果倾向于实践记忆保持组在延时测试中的表现,结果大小是 d = 0.41。因此,有证据表明运用多媒体材料的记忆保持测试是有测试效应的,多媒体材料利用单词列表、散文段落重复验证了先前的结论。其中,实验条件并没有明显的影响,F(1,220) =0.026,MSE =0.001,p .8。毫不奇怪,间隔一周的记忆保持测试也有证据表明确实存在遗忘。获得的数据为F(1, 220) =33.85,MSE = 1.15, p .001。进行延时测试的被试((M =0.35, SD= 0.19)比进行即时测试的被试(M=0.49, SD=0.19)记住的材料要少。测试效应是否适用于迁移测试?这项研究的第二个目标是确定测试效应是否将延伸到一种新型的相关性评估迁移测试。针对这个问题,我们将重点放在再学习组和实践迁移组分别在即时迁移测试与延时迁移测试中平均正确率,如表2所示。依据迁移测试中的数据,我们进行了22的方差分析,它以测试中的条件(再学习和实践迁移比较)和记忆保持间隔(即时测试和延时测试比较)作为独立变量。在本次分析中,我们把实践记忆保持组排除在外,因为我们的重点放在对迁移的测试效应上。结果表明,测试条件和记忆保持间隔之间的交互作用趋近于显著,分析获得的数据为F(1, 166) =3.16, MSE =0.14, p =.08。但是,测试条件的影响是显著的,获得的数据为 F(1, 166)=3.80, MSE=0.164, p =.05。分析结果也表明,实践迁移组与二次学习组在迁移测试中的成绩相比,实践迁移组优于再学习组。测试效应大小倾向于实践迁移组在延时迁移测试中的表现,获得的数据为d=.60。这一发现表明测试效应不仅适用于记忆保持问题,也适用于迁移问题。记忆保持测试的显著且重要的效应也为一周的延时时间存在遗忘这一结论提供了证据,方差分析获得的数据是F(1, 166) =18.65, MSE=0.805, p .3,但是测试条件会产生明显的影响,F(1,166)=5.03,MSE =0.20, p= .03。结果偏向于在新的迁移问题中的表现,实践迁移组(M = 0.29,SD=0.20)优于再学习组(M=0.19,SD= 0.18)。另外,记忆保持间隔也有明显的影响,F(1,166) =14.52,MSE=0.57,p.001。这表明一周的时间间隔也会产生遗忘。因此,我们又一次在仅仅使用两个新的迁移问题的数据的情况下,进行方差分析。结果得出了与使用完整的迁移测试(包括新的和旧的题目)进行的方差分析相同的结论。迁移适当加工过程理论可以解释测试效应吗?我们的第三个目标是检验迁移适当加工过程能否解释测试效应。在一般情况下,迁移适当加工过程假设预测实践测试和最终测试之间的比较将会促使最终测试中的更好的表现。由于测试效应已经在延时测试中呈现过,在即时测试中就没有必要呈现了。所以接下来的分析就仅仅包括延时测试的条件数据。我们对实践记忆保持组、实践迁移组这两组分别在延时记忆保持测试与延时迁移测试中的平均正确率进行了比较,如表3所示。我们进行的2X2混合方差分析,所要考虑的第一要素是测试条件(实践记忆保持和实践迁移作比较),并把测试条件作为被试之间的变量;要考虑的第二个要素是测试类型(延时记忆保持测试和延时迁移测试比较),并把测试类型作为延时组内部的被试之间的因素。 我们得到的结果符合迁移适当加工过程的解释,结果是条件测试的交互作用比较显著。实践记忆保持组的被试在延时记忆保持测试中表现更好,而实践迁移组的被试在延时迁移测试中的表现更好。我们得到的结果与测试效应的迁移适当加工过程解释相一致,因为测试条件测试有明显的交互作用,测得数据如下: F(1, 88)=17.39,MSE=0.399,p .001。t检验表明:实践记忆保持组与实践迁移组相比,在延时记忆保持测试中的表现要稍微优秀。 我们经过单侧检验得到的数据为t(88)=1.55, p=.06;实践迁移组与实践记忆保持组相比,在延时迁移测试中的表现明显优秀的多,进过单侧检验的到的数据为t(88)=3.03,p=.002。图3 把记忆保持测试和迁移测试(都在一周后进行)问题平均正确率作为学习条件(实际记忆保持、实际迁移)的函数。误差线表示使用方法的标准误差。主观问卷的评定结果在试验组间有何不同?学生们是否意识到再学习的局限性,是否意识到进行实践测试的优势,他们对三个问卷题目的反应为此提供了证据。在第一个问题上,我们用1到7来表示题目的难度,1表示很容易,7表示很难。测得再学习组的平均难度为2.29(标准差=1.10);测得实践迁移组的平均难度为3.62(标准差=1.90)。被试之间关于测试题目困难度的32方差分析表明了测试条件的主效应。方差分析获得的数据为F(2, 276) =18.89,MSE =43.10,p.001。Tukey的一个真实地显著性差异测试发现,再学习组与实践记忆保持组( p .001)、实践迁移测试组 ( p .3)第二个问卷题目涉及对学习材料的兴趣度评定,分析测得平均兴趣度为:再学习组3.37(标准差=1.6);实践记忆保持组3.34(标准差=1.72);实践迁移组3.60(标准差=1.86)。在这个评定中,1表示很有兴趣,7表示很乏味。进行的32被试间方差分析也没有产生显著的主效应或相互作用。问卷题目的第三个问题涉及被试学到的知识进行自我评估,这个评定中1表示可能性很大,7代表可能性很小。被试记住材料的可能性量度等级为:再学习组2.61(标准差=1.30);实践记忆保持组3.15(标准差=1.67);实践迁移组3.60(标准差=1.93)。进行的关于被试之间的32方差分析发现测试条件的主效应,测得数据为F(2, 276)=8.04, MSE=20.64, p.001. Tukey的真实地显著性差异测试发现再学习组与实践记忆保持组(p=0.03)、实践迁移组(p.1)。总而言之,再学习条件下的被试与实践测试条件(实践记忆保持测试与实践测试的条件)下的被试相比,他们认为学习材料比较容易也更容易记住,即使他们在延时测试条件下的表现不及在实践测试条件下的表现。这些结果表明,学生可能缺乏对实践测试优势的元认知意识。讨论实证贡献 本研究的第一个目标是确定测试效应是否仅仅局限于单词列表与散文片段。这些实验结果表明,包含与教育相关的内容的多媒体课程可以得到测试效应,如表1所示。本研究的第二个目标是确定测试效应是否仅仅局限于记忆保持测试。这个实验的结果表明,迁移测试包含与教育相关的题目,由迁移测试可以得到测试效应。理论贡献 本研究的第三个目标是检验测试效应的主要解释迁移适当加工过程理论。实验结果的模型与测试效应的迁移适当加工过程解释相一致:在延时测试中,实践记忆组的成绩比实践迁移组的成绩要好;但是在延时迁移测试中,实践迁移组的表现比实践记忆保持组的成绩要好。如表3所示。由于已经有一些研究调查对解释测试效应的迁移适当加工过程,但需要进一步的研究来解决它对于测试效应和合适的条件是否能够提供一个完整的解释。另一种用于补充这些结果的解释是关于检索尝试的深度或完整性。最近的一些研究显示越有效的加工越会促进更好的记忆保持,这会让我们联想到加工水平理论(Craik & Tulving,1975)。这样一个研究中,(Glover,1989年,实验4)被试学习了一篇300字的文章,2天后进行实践测试,在最初学习4天之后,进行了最终测试。我们需要灵活操作被试之间的实践测试和最终测试类型(自由回忆测试、线索回忆测试、识别测试)这两方面。Glover(1989年)发现:在所有类型的最终测试中,那些接受自由回忆实践测试的被试成绩超过其他所有组。这个发现表明进行越多精细加工的测试(例如,自由回忆测试与线索回忆测试、识别测试相比)越能促进长期的记忆。 Carpenter and DeLosh (2006) and Kang、McDermott和 Roediger (2007)应用单词列表、精短的杂志文章,纷纷发表了类似的研究结果。本研究通过包含多媒体材料和迁移测试进一步扩展了这些发现。实践贡献教育领域中测试的主要功能是对学习成果进行评估(Pellegrino,Chudowsky,& Glaser,2001)或者是在教学前,帮助计划教学;或者是在教学中,帮助教师调整教学;或者是在教学后对学生的学习进行总结。本研究强调测试在教学中一个新的有潜力的新功能测试可以作为一种教学方法,而进行实践测试可以作为促进学习的一种教学方法。通过展示测试效应适用于真实的学习材料,这指的是多媒体课程。这个研究赞成把实践测试在教育环境中作为一种教学方法使用。特别是,这项研究鼓励在整个教学计划中使用合适的实践测验,无论是正式的或非正式的测验。此外,这项研究的结果倾向于这个建议:实践测试的问题类型要与教师想要学生能够在最后测试或其他类型的测试中会的回答的题目类型一致。在许多的教育情境中,理想的学习目标涉及在新情境中表现出来的迁移能力。把迁移作为教学目标时,本研究支持在实践测验中使用迁移性问题。基于课堂的研究是用来确定怎样最好地把实践测试融入到教学实践中。例如,在一个大课堂中,Mayer(2009年)在讲座结束时,在屏幕上呈现一个或两个多选项的迁移问题,要求学生应用基于计算机的个人反应系统(有时叫做点击器)做出回答,然后在屏幕上显示对每个答案投票的学生人数,并指出了正确答案,最后引领学生做了简短的讨论阐释选择正确答案的理由。将这种非正式的测验与大学课程相结合的方式与讲授相同的课程却没有给予实践问题相比,结果是会提高最终考试的成绩,这只能产生小到中规模的效应(d=.40)。将实践测试融入课堂的一个主要挑战是确定实践测试的数量和形式,保证测试能够有效适用于教学材料和学习者类型。总之,需要更多的研究来确定如何最好地把实验室中发现的原则适用于真实世界的课堂中(Bangert-Drowns,Kulik,& Kulik,1991;Leeming,2002;McDaniel,Anderson,Derbish,& Morrisette,2007)。 研究的局限性和未来的发展方向 本研究的局限性是额外研究(2.5分)和实践测试(5分钟)的持续时间不相等。在一般情况下,写的时间比听的时间长。在基于引导测试的基础上,我们确定测试组将获得更多的时间来完成他们的任务。Glover(1989)发现,接触到的学习材料的数量并不能决定测试效应的大小,但是能确定检索事件或测试的数目。Nungester and Duchastel (1982)的研究和试验组花费了相同的时间,也发现了一个测试效应。这些发现表明学习中与测试益处相关的解释并不仅仅是时间长短的原因,而是发生在这段时间内的加工质量。 这项研究的另外一个局限是对最后迁移的绩效评估中仅仅包括两个迁移问题。(例如对实践迁移组的题目)。将来的研究应该包括更独特的迁移问题,以确定测试效应是否对迁移学习产生影响。然而,我们的补充分析也表明,即使最终的迁移测试只包括两个独特的迁移测试题目也能得到测试效应。在本研究中我们避免应用反馈,是因为我们想要检测独立于反馈的测试的潜在益处。然而,进行后续研究以检验反馈的效应是合理的,因为几项研究中显示出的反馈能够提升测试效应的等级。例如,Pashler、Cepeda、Wixted和Rohrer (2005)通过使用配对联想范式发现在实践测试中,在错误答案之后提供正确的答案,那么

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论