PISA评价体系.doc_第1页
PISA评价体系.doc_第2页
PISA评价体系.doc_第3页
PISA评价体系.doc_第4页
PISA评价体系.doc_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PISA评价体系一、概述PISA(Programme for International Students Assessment)是一个由经济合作与发展组织(Organization for Economic Co-operation and Development, OECD)策划并组织的评价临近义务教育末期(15周岁)学生的阅读、数学、科学素养的国际性学生评价项目,是一项集体协作研究计划。它主要评价学生是否具备了未来生活所需的知识与技能,以及在现实生活中运用这些知识和技能解决问题的能力。PISA的测评结果反映了教育系统和社会系统对义务教育阶段学生的影响,并在世界范围内为各国的教育政策制定和研究提供导向。二、评价特点国际学生评价项目(PISA)与其他国际性评价,如国际科学与数学调查趋势(TIMSS)只关注“学校”的知识、主要考察学生对学校课程的学习情况,有着显著的不同。第一,主要关注学生是否准备好去应对未来的挑战,他们是否具有有效地分析、推理与交流自己的思想观点及终身学习的能力;第二,强调通过在真实生活情景中,考查学生运用知识和思维能力的表现,来反映学生掌握关键能力的状态;第三,通过搜集各国学校教育、家庭、社会等方面的背景信息,运用评价框架对测试所取得的结果进行详细的解释,为各个国家和地区制定更加行之有效的教育政策提供依据。三、评价目的及意义“国际学生评价计划”的主要目的是评定主要工业化国家和地区及一些发展中国家和地区15岁的学生在多大程度上获得在今后成人生活中所需要的广泛的阅读、数学、科学、问题解决等方面的知识和能力,以便学校教育能较好地应对当今社会的挑战。“国际学生评价计划”旨在通过三年一度的周期性的评价,直接而有效地收集、整理、分析和提供相应的学生、学校、国家和地区等各层面的阅读能力、数学能力、科学能力和问题解决能力方面的信息,提供在家庭和学校里影响学生发展的因素的观察和分析,审查这些因素的相互作用的机理及对制定教育政策所具有的意义。PISA测评试图可以反映一下几个方面的情况:(1)学校教学努力的方向和课程的优势和劣势,是否可以使学生的学习更有效?(2)什么样的教育体制和教学实践能最大限度地提高不利背景的学生的学习效果?(3)学校资源的质量在多大程度上影响学生的学习效果等等。更重要的是,它对广泛的测试数据进行系统分析,找出这一阶段各国学生学习能力变化的特点,以及造成这些变化的社会、经济及政策原因,从而为各个国家和地区制定更加行之有效的教育政策提供依据。相应的,“国际学生评价计划”的研究结果对各国的政策制定者来说至少有三方面的作用。第一,政策制定者可对本国家和地区学生的知识和能力与其他参加国家和地区的学生的知识和能力作比较。第二,他们可建立教育工作改进的基准( benchmarking),即在参照其他国家和地区的平均成绩的基础上,改进教育机会的平等程度,提高教育的效能。第三,他们可理解本国家和地区教育系统的优点和缺点。“国际学生评价计划”是迄今为止最综合和严格的学生成就评价计划,它广泛收集学生、家庭、学校和社会方方面面的资料,能较好地解释学生成就的差异,在教育评价理论和实践方面提供了极为重要的第一手资料。四、评价领域及其更新调整2000年“国际学生评价计划”对学生的阅读能力、数学能力和科学能力作了评价。2003年在前三项评价的基础上它增加了问题解决能力的评价,从而使跨越各门课程的能力的评价,成为“国际学生评价计划”的一个有机组成部分。“国际学生评价计划”虽然每次对各个领域作一般性的评价,但每个评价周期有一个重点。2000年的评价重点是学生的阅读能力,2003年评价的重点是学生的数学能力,2006年评价的重点是学生的科学能力。另外,PISA2006的科学素养界定比PISA 2000和PISA 2003的科学素养界定范围要广,增加了对科学事件或技术发展的反应态度。五、测评框架及结构分析PISA的每个领域的测评框架都分为三个维度:知识的内容或结构、运用过程、在现实情境中相关的知识和技能的运用。以下表PISA2003为例,概括了各个素养领域在这三个维度上的布局。表PISA2003领域内容维度过程维度情境维度阅读素养阅读材料的形式:*连续性文本,如:叙述文、说明文、议论文*非连续性文本,如:图表、表格、目录阅读任务或过程的类型:*提取信息*解释文本*反思及评价文本PISA的重点是为了学习而阅读,而不是为了阅读而学习,因此并没有对学生最基本的阅读技能进行测评。阅读情境:(文本建构的情境)*私人的(如:个人信件)*公开的(如:官方文件)*职业的(如:报告)*教育的(如:与学校相关的读物)数学素养主要是相关的数学领域群或概念丛:*数量*空间与形状*变化与关联*不确定性其次是相关的课程线索(如算术、代数、几何)用“能力丛”定义数学所需技能:*再现(简单的数学运算)*关联(解决简单问题)*反思(更深、更广泛地进行数学思考)这些过程与任务难度递增有关,但每个能力丛的评分有重叠部分。数学情境:(按与个人生活密切度排序)*个人的*教育的与职业的*局部或更广阔的社会的*科学的科学素养科学知识和概念的各类领域,如:*生物多样性*力与运动*生理变化*地球与外部空间理解及运用科学知识的能力,收集、解释和运用证据的能力:*描述、解释、预测科学现象*理解科学探究*解释科学证据和结论科学情境:(重点是与实用性相关联)*生命与健康*地球与环境*技术1.阅读素养评价结构阅读能力是对书面文字的理解、运用和反思的能力,以实现个人目标,丰富自身知识及开发自身潜能,以便更好地参与社会活动。PISA不再把阅读能力看作仅仅是儿童在早期学校教育中掌握的能力,而是认为阅读能力是学生在各种情境下,与同伴及社区进行互动,不断扩充个人所掌握的知识、技能和策略的能力。1)评价的维度第一维度文本形式。PISA把阅读材料分成连续文本和非连续文本。连续文本格式包括记叙、释义、描述、议论、说明、文件或记录、超文本等类型。非连续文本格式包括图表和图形、表格和矩阵、图解、地图、数据表格、信息单、邀请和广告、凭证、证明等类型第二维度阅读任务的类型。有一些任务是让学生搜索信息,也就是在文本中查找单一或综合的信息。有一些任务是让学生解释文本,也就是从书面材料中建构意义并做出(construct meaning)推论。第三种类型的任务是让学生反思并评估文本,也就是将文本材料和他们先前的知识、概念、经验相联系。第三维度情境或用途。根据作者不同的写作意图、材料中的人物关系以及大体的内容,在最大程度上扩展了阅读素养测评中内容的多样性,涵盖个人应用(个人阅读)、公共应用、为工作(职业阅读)、为教育而进行的阅读。2)评价的标准PISA中的阅读成绩根据项目的难易度分为5个等级。学生处于某一个等级,不仅表明掌握了那个等级所需要的知识和技能,而且也说明具备了更低等级的要求。规定具备某个等级水平的PISA学生,需要正确回答那个等级至少一半以上的题目。下面是PISA2000中使用的阅读素养评价标准:5级水平(625分以上):能够胜任精读任务。例如,在不熟悉的文章中把握隐藏的信息,对任务有细致的理解并能推断出和任务相关的信息,能够精确地评价和建立假设,能运用专门知识,能提供反例。4级水平(553-625分):能胜任较难的阅读任务。例如,发现隐含的信息,把握语言的细微差别,精确地评价一篇文章。3级水平(481-552分):能完成中等难度的阅读任务。例如,发现多个信息,在文章的不同部分之间建立联系,并同日常知识建立联系。2级水平(408-480分):能完成基本的阅读任务,例如,发现最明显的信息,在文章的不同部分之间建立低水平的联系,知道文章特定部分的意思,能运用相关知识帮助理解。1级水平(335-407分):只能完成最简单的阅读任务,例如,发现一个信息,识别文章的大意,或者和日常知识建立简单联系。1级水平以下(335分以下):不能稳定地表现出PISA要评估的最基础的知识和技能。这个水平的学生在运用阅读素养作为在其他领域加深和拓展知识技能的手段时可能会遇到一系列困难。我们可以发现,PISA制订的阅读素养评价标准不仅能够将学生的成绩划分等级,而且能够描述哪些事情是学生可以做到的,对个体的结果反馈可以更具描述性和针对性。学生阅读水平与难度逐步递增的任务要求相关联,每一级水平的任务达成情况由专家小组作出评判,这样就可以看出哪些特征和要求是较高等级或较低等级共同具备的,哪些是有区分的。2.数学素养评价结构数学能力是一种个人能力,学生确定并理解数学在社会所起的作用,得出有充分根据的数学判断和能够有效运用数学。PISA数学能力领域关注的是学生在各种学科和情境下提出数学问题、表述问题、解决问题和解释问题解决方法中的分析、推理和观点交流的能力。PISA是通过数学思想、数学过程、应用情景三个维度来描述和评价学生数学素养的。1)评价的维度第一维度是数学思想,PISA将“量、空间和形状、变化和关系、不确定性”作为数学最重要的四个主要观念,并根据这四个主要观念定义数学内容;第二维度数学过程。PISA要求学生面对现实生活中的数学问题时,首先把它们转换成数学形式,然后进行数学运算,再把结果运用到原来的问题并写出答案。这样学生就要完成一个多步骤的“数学化”过程。这个过程包括提出假设,概括和整合信息,运用有效的方法呈现问题,理解问题表述语言,找出规律,并把问题和已知问题或者其它熟悉的数学公式联系起来,确定或提出一个适当的数学模型。第三维度问题情境。PISA的数学问题设置在个人的、教育或职业的、公共的和科学的情境中。个人情境与学生个人的日常活动直接相关。教育或职业的情境出现在学生的学校生活或工作环境中。公共情境要求学生观察更广泛周边环境的某些方面。科学情境更加抽象,可能会涉及了解一个技术过程、理论情境或明确的数学问题。2)评价的标准与阅读素养测评相似,学生的数学成绩被分成6个等级水平,这6个水平代表了任务的难易程度。下面是数学素养的评价标准:6级水平:学生能进行复杂的数学思考和推理,能够洞察和理解,提出新的解题方法和策略。这个水平的学生能有条理和准确地交流他们的做法以及对发现、解释、论证作出反思。5级水平:这个水平的学生能够有策略地处理问题,具有娴熟的思考和推理能力,能深入洞察问题情境,能反思他们的行为,并形成和交流他们的解释和推理。4级水平:这个水平的学生具有一定的洞察力,能运用娴熟的技能和灵活的推理,能够形成和交流自己的解释和推理。3级水平:这个水平的学生能够根据不同的信息进行直接推理和解释,他们能进行简短的交流,报告他们的解释、结果和推理。2级水平:这个水平的学生能运用基本算法、公式、步骤和方法,能够进行直接推理和解释结果。1级水平:学生能回答熟悉的背景中的信息且界定明确的问题,能够根据具体情境的直接指示找到信息并按常规程序进行操作。3.科学素养评价结构PISA 2006中的科学素养是指个体能够掌握科学知识,应用科学知识来确定问题,获得新知识,解释科学现象,得出科学相关问题的有根据的结论;理解作为人类获取知识和探究方式的科学的特征;关注科技塑造我们的物质、精神和文化生活的方式;愿意从事与科学相关的事务,有科学观念,成为会思考的公民。PISA认为科学素养这一领域不仅考察学生在涉及科学和技术的生活情境中对科学知识的分析、推理及灵活运用的能力,还要求评价学生表现出来的对科学的兴趣态度,即对科学的兴趣,支持科学探究,对自然资源、环境等表现出的责任感等。1)评价的维度第一维度科学知识或概念。PISA认为科学素养包括科学的知识(有关自然世界的知识)与关于科学的知识。科学的知识是指基本科学概念和理论,涉及物理系统、生命系统、地球空间系统的关键概念;关于科学的知识主要是指理解人类科学活动的属性与科学知识的作用与局限,主要涉及科学探究、科学解释、社会中的科技等方面。第二维度科学能力。评估三个主要的科学过程:首先要做的是描述、解释、预测科学现象。学生要确认问题或观点;辨别出可以通过科学探究来回答的问题;第二,寻找解决问题的事实依据,用科学方法解决问题,得出或评价结论。学生要确定哪些信息对某一观点的有效验证是必须的,还要从给定的信息、数据中产生结论,或者选择适用于数据的结论,或者根据数据来支持或反驳某一结论;第三,传播、交流有效的结论。将有效的结论用适当的方法清晰地传递给特定人群,其中这些结论的形式是基于特定的情境和数据的,或是基于相关的附加信息的。第三维度是科学态度,PISA认为科学素养的形成过程取决于个人对科学的态度及其从事科学相关事务的意愿,态度主要是指对科学有兴趣、支持科学探究、对自然资源与环境有意识地采取负责任行动。2)评价的标准PISA建立了一个比较粗略的科学素养评价等级:成绩在690分左右:学生能够在复杂的情境中,确定为验证某一观点或探索某一问题而必须收集的信息及条件;基于对科学概念的复杂、抽象的理解,进行预测和解释;能通过科学的调查研究进行分析。例如,进行实验设计或验证假设;为了评估不同的观点或看法,能对数据进行比较;以及能够准确地传达科学的论点和描述。成绩在550分左右:学生能够运用科学概念来建立假设或作出解释;能够通过科学调查以及鉴别科学调查的详细资料,来确认能回答哪些问题;能够从数据或推理的步骤中选择相关信息,完成或评估结论。成绩在400分左右:学生能够在熟悉的情境下使用较容易掌握的简单实用的科学概念;能够运用普通的科学常识来完成或评估结论。通过上述分析可以看出,PISA制定了严谨的测评结构。虽然考核的是学生在阅读、数学、科学领域的成绩,注重的是学生在相应学习领域的基础能力,但是设计的初衷是检验学生是否PISA具有了充分参与未来社会生活的能力,所以在测评的内容和过程上强调知识和技能要与每天的生活相关,注重从日常生活中取材。学生需要理解知识内容、关键概念,需要掌握特定的过程,同时也要在各种不同的真实情境中运用所学的知识和技能。在PISA的测评结构中还有很重要的一部分内容,就是对学生、学校和教育系统背景信息的收集。分析所收集的信息与不同成绩水平的相关,有助于研究促进教育成功的各种因素,这也使得PISA成为许多国家主要的政策诊断工具。4.问题解决能力评价结构问题解决能力是指个人通过认知过程来面对和解决现实、跨学科情境下无明显解决方法的问题的能力。PISA的问题解决不同于学科内部的问题解决,体现在以下三个方面:第一,跨学科,对跨学科问题解决能力评价重点是学生解决问题过程和解决方法的正确性;第二,现实情景,情境可能是在无学科领域,也可能是在多学科的交叉领域;第三,复杂性,评价强调复杂任务、动态过程及推理任务,强调知识的综合运用。问题解决能力的评价框架由问题类型、现实生活情境、相关学科、问题解决过程、推理技能五个方面构成。1)评价的框架a)问题类型PISA 2003跨学科问题解决评价,把学生问题解决能力限制在三个问题解决的类型中,即决策制定(Decision Making),系统分析和设计(System Analysis and Design),疑难排除(Trouble Shooting)。决策制定问题类型要求学生在考虑特定的限制后做出决定,如决定购买哪种轿车。系统分析和设计问题类型要求学生分析复杂情境以找出要解决的问题原因,或设计一个系统以发挥作用,实现特定的目标,如夏令营如何合理安排住宿。疑难排除问题类型要求学生能找出缺点或操作系统的运行机制,如找出自行车气筒为何打不出气来。b)现实生活情境这种要素涉及了学生的问题解决经验。PISA的问题解决评价要求学生灵活运用所学的知识和技能;在不同情境中自由切换能力类型;调节自身认知水平,运用知识来处理困境、冲突、决策和问题。OECD/PISA 2003中的问题解决情境不同于课堂情境和学校课程。因此,PISA问题使用“个人生活”、“学校生活”、“工作和休闲”、和“当地社区和学校”等情境。c)相关学科为了反映现实生活问题解决的重点,PISA问题解决领域将会覆盖数学、科学、文学、社会科学、技术、商贸等各类学科。d)问题解决过程由于每个人解决问题的方法多种多样,很难归纳出标准的格式。前述的三种问题类型的解决过程一般会涉及“理解给定的信息、识别关键特征及其相互关系、建构或运用外部表征、解决问题、评价判断和交流问题解决方法”等五个方面。e)推理技能问题解决过程中涉及的分析推理、类比推理、定量推理及批判性思考能力。2)评价的标准在问题解决总体框架中建立整体性评价量规,以评价学生对测试题的回答。在这样的量规中,一般采用五级计分:最高级别的计分,表明该学生的行为反映了其能够完全正确地理解问题,问题解决的方法也是清晰、恰当的,并进行了充分的展开;回答逻辑正确,书写清楚,没有错误;例子选择合适,并对其进行了充分展开。第二级的计分中,学生的行为表明了其对问题理解较清晰,也有可接受的问题解决方法,但是在展开回答时有些小错误;也有举例,但是没有对其进行充分展开。第三级的计分中,学生的行为反映了其理解了问题中的概念,问题解决方法和表述方式有逻辑性;但是,总体上回答并没有充分展开;推理中会存在严重逻辑错误或缺点,回答中只有部分正确合理;所举的例子不正确或不恰当。第四级的计分中,学生行为表明了其对所提问题理解较少,而且没有提出可行的问题解决方法;少量的正确行为有逻辑性,回答不完整,推理中有严重错误;这个层次的问题回答没有举例。最低的级别是零分级别,回答完全不正确或不相关。在该层次中,要么是不正确、不相关的回答,要么是空白,反映测试时间不充分或思路不对。三种国际阅读评价体系给我们的启示阅读能力不仅是学生语文素养的重要组成部分,更是学生在这个信息社会中参与社会生活的必备能力之一。学生阅读能力的培养是学校语文教育的一项重要内容,学生的阅读能力发展水平也是学业评价的重头戏。对阅读能力的评价一直是语文评价中的难点。在我国目前的中小学语文考试中,阅读测试内容的确定、测试材料的选择、评分标准的制定等方面都是经验性的,没有建立起清晰的阅读能力评价的指标体系。这就使阅读能力的评价具有比较大的主观性和随意性,影响了阅读能力评价的科学性和客观性,因而也难以保证评价结果的信度与效度。如何公平、客观、高效地对学生的阅读能力进行评价,成为语文教育工作者一直在探索的难题之一。国际学生评价项目PISA、国际阅读能力进展研究PIRLS、美国国家教育进展评价NAEP都是在国际上有很大影响的学业能力评价体系。在这些评价体系中,阅读能力评价都有非常系统、明确的评价框架设计和具体的操作规划,对于国内学生阅读能力评价有很多可资借鉴之处。 一、阅读测试内容的确定 关于阅读能力的构成要素,我国的教育学工作者、心理学工作者们或者基于经验分析,或者基于实证调查,进行了大量的研究和探讨,观点不下几十种。至今尚未形成较为统一的认识。然而,反观这三种国际上比较有影响的阅读评价体系,虽然对阅读能力测试内容的具体指称不一,测试内容本身却大体趋于一致。 PISA中的“获取信息”基本上涵盖了PIRLS中的“关注并提取出明确陈述的信息”和“进行直接推论”。PISA中的“获取信息”要求读者关注文章的细节,把所提问题与文本中的具体信息建立联系。学生一方面要能够找到文本中直接陈述的时间、地点、人物等具体信息;另一方面,还要能够对这些字面信息加以比较和区分,得到一些隐含在文中的、文章没有直接说明的信息。PIRLS中的“关注并提取出明确陈述的信息”要求学生找到文章中明确陈述出来的信息,这些信息就在文章的句子或词语中出现,学生可以直接获取。这项考查内容和PISA中“获取信息”的第一方面内容是一致的;而PIRLS中的“进行直接推论”,则要求学生联系两个或更多的观点或信息片段,对没有明确陈述的信息或观点进行推论。这项考查内容和PISA中“获取信息”的第二方面内容是基本一致的。 PISA中的“形成总体上的理解”和NAEP中的“整体感知”大体上是等同的,都要求学生把文章看成一个整体来全盘考虑。例如:要求学生给文章加个题目,明确文章的写作目的,思考文章的主题,以及解释地图或表格的主要涉及范围和作用等等。 PISA中的“形成解释”和PIRLS中的“解释并整合观点和信息”以及NAEP中的“形成解释”和“联系自身”大体上是等同的。PISA中的“形成解释”要求学生扩展他们对文章的初步理解,从而形成对文章更为具体和完整的理解。学生应该能够在全面阅读文本的基础上,联系各个部分的相关信息,对文本进行逻辑上的理解。PIRLS中的“解释并整合观点和信息”要求学生超越句子和词语的层面来加工文本,将文本的各部分信息综合起来建立联系,或是更为深入、广泛地思考文本的内涵。NAEP中的“形成解释”要求学生扩展最早对文章形成的初步印象,对所读内容形成一个完整的理解。这要求学生把文章的各个部分联系起来思考。PISA中的“形成解释”与NAEP中“形成解释”的考查内容基本是相同的:而PIRLS中的“解释并整合观点和信息”则在此基础之上。更强调学生在“形成解释”的过程中结合自己的既有知识经验来建构意义。这一点。NAEP通过“联系自身”进行了补充。NAEP中的“联系自身”要求学生超越文本去思考,将文本与自身建立联系,与现实生活建立联系。PISA的“形成解释”中虽然没有明确强调这一点,但是在任何阅读活动中,读者都是带着自己的既有知识经验来进行阅读的,在对文章“形成解释”的过程中,是不可能抛开这一切的。因此,可以认为PISA中的“形成解释”也并不排斥“联系自身”这一层涵义。 PISA中的“反思和评价文本的内容”“反思和评价文本的形式”和PIRLS中的“检验并评价内容、语言和文本成分”以及NAEP中的“做出评价”大体上是等同的。PISA中的“反思和评价文本的内容”,要求学生能够把文本中的信息和从其他渠道获得的知识建立联系,利用自己的已有经验对文本中表达的观点进行评价。这就要求读者首先应该能够全面理解文章中所表达的观点,然后和自己所支持的或根据已有知识经验所形成的观点作比较,证明、维护自己的观点。“反思和评价文本的形式”要求学生不受文本影响,客观地思考文本,评价它的性质和适用性。PIRLS中的“检验并评价内容、语言和文本成分”要求学生展开对文本的批判性思考。这种对文本的批判性思考包括两个方面,一方面是对文章内容的评价,另一方面是对文章的结构和语言特征等方面的评价。NAEP中的“做出评价”,要求学生跳出文本,客观地看待文本,对它进行批判性的衡量、比较。综观PISA、PIRLS、NAEP三大评价体系的这一方面考查内容,都是对文章的内容和形式的反思和评价。 综上,阅读能力考查的内容大致可包括以下几个方面:获取信息,整体感知,形成解释,反思与评价。但是,PISA在对几十个国家的学生大样本取样,进行阅读能力的实际测试过程中,发现“整体感知”作为一项独立的阅读能力要素进行测试并不合适。“整体感知”和“形成解释”具有较大的相关性,它们同属于对文本的“解释”能力范畴。因此,在实际的测试中,PISA将二者合为“解释文本”一项。同时,由于“反思和评价文本的内容”“反思和评价文本的形式”两项同属于“反思与评价”能力范畴,为了最终的统计数据更为科学合理,更具说服力,这两项也被合为“反思与评价”一项,这与PIRLS和NAEP达成了一致。如果吸取PISA阅读能力评价的经验,那么所评价的阅读能力要素就将调整为:获取信息(包括字面信息和隐含信息)、解释文本、反思与评价(包括形式和内容)三项。 二、阅读测试材料的选择PISA、PIRLS和NAEP阅读评价体系都对测试材料进行了分类,与国内不同的是,这种分类的标准不是文体,而是“阅读情境”。需要说明的是,这里的“阅读情境”不能简单地被理解为阅读活动发生的环境,它所强调的是不同的阅读目的。根据阅读情境或者阅读目的的不同,阅读材料被划分为不同的种类。 PISA认为人总是在某一特定情境下进行阅读活动的,所以将阅读能力的测评放置在各种阅读情境中。PISA将阅读情境分为以下四类:为了个人应用而阅读,为了公共应用而阅读,为了教育而阅读,为了工作而阅读。相应地,阅读测试材料也分为四类:学生“为了个人应用而阅读”,是为了保持或发展与他人的联系,或满足个人的兴趣需要而读书。阅读的材料一般包括个人信件、小说、传记以及为满足好奇心而阅读的信息性材料,这种阅读是作为休闲、娱乐活动的一部分。学生“为了公共应用而阅读”,是为了参与更大范围社会活动的需要。阅读的材料一般包括官方的文件和关于公共事务的信息等,如通知、布告、规章、计划方案等等。学生“为了教育而阅读”,通常是为了获取知识,是更大的学习任务的一部分。这里的阅读材料通常不是由阅读者自己选择的,而是由教师指定的,阅读的内容是为了教学的需要而具体设计的,包括课本、地图、纲要等,是“为了学习而阅读”。此外,据PISA调查,在大多数国家,十五岁的学生中很多在一到两年之内都会跨入劳动大军之列,所以测评他们的阅读能力是否能满足工作的需要是十分必要的。因此,PISA还提出了“为了工作而阅读”的情境。在这种情境下,阅读的材料一般包括说明书、手册、计划表、报告、备忘录、项目表等,是“为了做事而阅读”。 PIRLS认为,学生以不同的方式和文本互动来构建意义,他们构建意义的方式因阅读目的和文本类型的不同而不同,某种阅读目的对应某种类型文本。PIRLS区分出了两种不同的阅读目的:为文学体验或娱乐而阅读,为获取和使用信息而阅读。学生“为文学体验或娱乐而阅读”,主要目的是理解和欣赏文学性作品,阅读的材料属于文学型文本。学生“为获取和使用信息而阅读”,主要目的是了解周围的世界,阅读的材料属于信息型文本。 NAEP认为,学生在进行阅读时,不同的阅读情境会导致有差别的阅读活动。NAEP将这种阅读情境分为三类:为获取文学体验而阅读,为获取信息而阅读,为完成任务而阅读。后两者的区别就在于,“为完成任务而阅读”不只是获取和理解信息,还要运用信息。阅读的材料一般包括汽车或火车时刻表、课程表、说明书、地图等等。 从以上分析可以看出,PIRLS和NAEP对阅读材料的划分较为一致。PIRLS将阅读材料分为“为文学体验或娱乐而阅读”的文学型文本,和“为获取和使用信息而阅读”的信息型文本;NAEP将阅读材料分为“为获取文学体验而阅读”的文学型文本,“为获取信息而阅读”的信息型文本,以及“为完成任务而阅读”的信息型文本。PIRLS的“为获取和使用信息而阅读”实际上涵盖了NAEP的“为获取信息而阅读”和“为完成任务而阅读”,将“获取”和“使用”信息合为一种阅读目的。这样的做法更为合理。因为使用信息毕竟是以获取信息为前提的,不可能将获取信息的因素剔除出去而只谈使用信息;而且,在实际的阅读过程中,这两种阅读目的有时是很难清晰地区分开来的。所以说,NAEP的“为获取信息而阅读”和“为完成任务而阅读”二者之间有交叉。在实际的阅读测试中命题者难免会因此而出现认识上的分歧,容易给测试带来主观性和随意性:而PIRLS的做法则较为可取。PISA从另一个角度对阅读材料作了四类划分,虽然具体的类别和HRLS、NAEP的不尽一致,但划分出来的阅读材料却是大体相同的,可以打散后相应地划归人文学型文本和信息型文本两大类中。 三、评分标准的制定 无论是HSA、HRLS还是NAEP,其阅读测试中的开放题都给出了十分详细的评分标准。在命制阅读测试题目的时候,每道题的评分标准也就初步拟定好了。这时的评分标准一般是命题者基于对题目本身的认识和对学生作答该题的预期而制定的,因此此时的评分标准只是命题人员主观的“理想构架”,还不能直接运用到具体的评分过程中。这种“理想构架”需要根据学生在试测中的实际作答情况做出进一步的修整和完善。例如,在对能够代表所有被试的小样本群体做试测时,可能会出现这样的情况:所有学生的回答都没有达到命题者预期的最高水平的答案。这时就需要对评分标准的满分要求做出相应的调整命题者预先设定的最高水平的答案是成人对文本解读的结果,而并不是特定年龄阶段的学生所能达到的,评分标准中的满分答案应该根据学生所能达到的最高水平做出修订。此外,还要对试测中学生丰富多彩的回答情况做出归类,确定哪些是可接受的,哪些是不可接受的,可接受的又可分为几种水平这样,根据试测所反映出来的学生的具体答题情况对预设的评分标准进行修改、丰富、完善,把题目的每一种赋分情况都配以若干学生的回答样例,这样的评分标准就非常明确而具体,评分者在给分的时候就会有据可依,评分的主观性就大大降低了。 四、三种国际阅读评价体系给我们的启示(一)理性构建阅读测试的框架体系 上述三大国际阅读评价体系都有非常系统、明确的评价框架设计,在测试内容的确定、测试材料的选择、评分标准的制定方面的有益经验值得我们借鉴。 首先,在阅读能力测试之前明确所要考查的内容,即主要的阅读能力要素,这样就使得命题的指向性很明确,避免了命题的盲目性与随意性;也便于根据命题意图和考查目标对学生的作答情况进行有针对性的分析,并提出相应的教和学的改进策略,这是我国的阅读能力测试首先值得借鉴的。在我国的语文考试中,阅读测试题目往往是依赖命题者的经验和个人对测试材料的理解和把握而命制的,对所要考查的目标阅读能力要素没有事先做出全盘性的把握和设计,例如,未预先对目标阅读能力要素进行清晰的认定,未设计各能力要素的考查权重和题目比例,等等。这样命制出的测试题目受命题者的主观经验和测试材料本身特点的影响很大。题目可能从表述上、形式上看来是不同的,但题目背后所考查的阅读能力要素却是雷同的,即所需学生完成的智力动作是相同的,或者也可能题目本身就偏离了考查的主旨,没有围绕着所要考查的核心阅读能力要素命制试题。这样的阅读能力测试就可能会造成有些能力要素重复考查,有些能力要素却被忽略或遗漏,考查结果很难代表学生的真实阅读水平。例如,2005年某课改实验区的语文中考试卷中,有这样一组阅读题目: 阅读下文,完成16-22题。(共21分,其中2分为附加分) 华语情结(文略)1说得真好,语言像山岳一样伟大。不管哪一种,堆垒到20世纪,都成了山。华语无疑是最高大幽深的巨岳之一了,延绵的历史那么长,用着它的人数那么多,特别有资格接受ESapir给予的“庞大”、“广博”这类字眼。一度与它一起称雄于世的其他古代语言大多已经风化、干缩,唯有它,竟历久不衰,陪伴着这颗星球上最拥挤的人种,跌跌撞撞地存活到今天。就是这种声音,就是这种语汇,就是这种腔调,从原始巫觋口中唱出来,从孔子庄子那里说下来,从李白杜甫苏东坡嘴里哼出来,响起在塞北沙场,响起在江湖草泽,几千年改朝换代未曾改掉它,二十五史中的全部吆喝、呻吟、密谋、死誓、乞求都用着它,借大一个版图间星星点点的茅舍棚寮里全是它,这么一座语言山,还不大么?2但是,山一大又容易让人迷失在里边。苏东坡早就写好一首哲理诗放着呢:“横看成岭侧成峰,远近高低各不同。不识庐山真面目,只缘身在此山中。”终身沉埋在华语圈域中的人很难辨识华语真面目,要真正看清它,须走到它的边沿,进出一下山门。3我揣想最早进出山门的比较语言学家是丝绸之路上的客商。听到迎面而来的驼铃,首先要做的是语言上的判断。那时唐朝强盛,华语走红,种种交往中主要是异邦人学华语。这就像两种溶液相遇,低浓度的溶液只能乖乖地接受高浓度溶液的渗透。尽管当时作为国际都市的长安城大约有百分之五的人口是各国侨民、外籍居民及其后裔,华语反而因他们的存在而显得更其骄傲。请读这一阕词:4“云带雨,浪迎风,钓翁回掉碧湾中。春酒香熟妒鱼美。谁同醉?缆却扁舟蓬底睡。”5这竟然出自一个沿着“丝绸之路”而来的波斯商人后代的手笔!他叫李殉,在唐代诗歌领域已占有一席之地。就从这几句便足可看出,华语,连带着它背后的整个华夏文化人格,曾经被一个异邦人收纳到何等熨帖的程度。语言优势与心理优势互为表里,使得唐代的中国人变得非常大度。潇潇洒洒地请一位波斯大酋长代表中国出使东罗马,请一位日本人担任唐朝国家图书馆馆长(秘书监),科举考试也允许外国留学生参加,考上了称作“宾贡进土”,也能在朝廷担任官职。这些外国人当然都讲华语,都在一种无形强磁波的统摄下,不必深加防范的。在这种情况下,华语对于别种语言,不太平等。6抱着极平等的心态深入往返于两种语言文化间的,或许应首推玄奘。他如此艰辛地走啊走,为的是走出实在太辽阔也太强大的华语文化圈。但是,无论是他的出去还是回来,他对华语文化和梵文文化完全不存一丁点儿厚此薄彼的倾向,在他的脚下和笔下,两种语言文化只有互补性的发现,还不构成争胜式的对峙。于是,一些极为温煦的场景出现了:并不太信仰佛教的唐太宗愉快地召见了这位远游归来已经多年没说华语的大师,还亲赐一篇圣教序来装点玄奘带回来的一大堆梵文经典。这位很有文化见识的皇帝特地请人用晋代书法家王羲之的字拼集出这篇圣教序,让华语文化更增添一层形式美去与域外文化联姻。从此,玄奘安静地主持弘福寺和慈恩寺译场,天天推敲着两种语言间的宗教性转换。在他身后,九州大地佛号声、诵经声此起彼伏,无数目不识丁的中 国老太太的瘪嘴中,倾吐出一种镶嵌着不少梵文词汇的华语方式,并且代代相传,他无意中实现了对华语文化吞吐能力的一次测试和开拓。7到得明清时期,华语文化与西方文化的交往就再也不会出现玄类那样的安详气韵了。不管是欧洲传教士的纷至沓来还是中国文人的厕身洋务,心情都有点怪异,敏感、窥测、自尊、叹息,拌和成一团驱之不散的烟雾,飘浮在两种语言的交接间。这全然不是个人的事,欧洲文明的崛起使曾经极为脆响的华语稍稍变得有点嗫嚅。另一种不太平等的态势出现了,而且越到近代越甚,在国内国外有些地方,华语简直有点“虎落平阳”的景况了。 8这些年在华语圈边沿上晃荡进出的人数之多,可能已达到历史之最。青年知识分子中很少有完全不理会外语的,这实在是中国走向世界、走向现代、走向未来的吉兆,一点也不应该抱怨。从趋向看,进出华语圈的人还会多起来。几乎所有大城市里的父母亲,都在关注着子女们的外语成绩。至于华语的好不好,反而已不是关心的重点。前不久听一位中年学者演讲,他讲到自己曾默默与一个外国同行作过对比,觉得除了英语,其他都可超过。“我英语不如他,但他华语不如我呀,扯平了!”学者说到这里引得全场哄笑。大伙不能不笑,他们似乎已经不习惯把华语放在与英语平等的地位上。据说产生笑的机制之一是把两个完全没有可比性的东西比到了一起。酿发出一种出人意料的不谐调感。难道,华语在世界语言丛林中真已变成了这样的角色? 16,结合具体语境,解释文中的加点词语。(三选一,多答不加分)(2分) (1)风干、干缩(2)跌跌撞撞(3)嗫嚅 17,文中为什么说华语是一座高山?请用原文句子或自己的话来回答。(2分) 18,作者在文中叙述了华语从古至今的发展状况,请用恰当的词语(自己概括也可)完成下列表格。(2分) 19,文中流露出作者怎样的“华语情结”?(2分)20,我们每天都在学习自己的母语,你喜欢上语文课吗?说出你的理由。(2分) 21,生活中处处有语文。举一个具体事例,说说你在课外学习语文的收获。(3分) 22,综合探究(6分,见解独到、语言精彩另加2分) 请你任意组合至少两则材料(上文也可算一则),提取材料中的关键信息,从一个或多个角度思考,谈谈你对母语现状的认识。(60字以上) 从这组题目整体来看,没有充分体现出命题者对所要考查的阅读核心能力要素全盘性的把握和设计。16小题考查的是理解词语在文中的具体意思,171819小题主要考查学生从文本中获取信息和初步概括的能力。这4道题共8分,仅占整组题目分值的38;而202122三道试题则相对独立于阅读材料华语情结之外,题干内容均与阅读选文的关系不大(只有第22题题干有“上文也可算一则”之语),脱离了阅读材料。从题目的参考答案及评分标准中,很难看到阅读文本的影子和作者在文中所抒发的华语情结,而且题目的考查目标也偏离了阅读的核心能力要素;但从分值比例上看,202122三道小题赋分共13分,占这组阅读测试题目总分值的62。这样的试题命制得显然不够合理。 如果命题者没有对所要考查的目标阅读能力要素做出清晰的认定与整体上的把握和设计,那么所命制的题目势必难以反映出学生的真实阅读水平。诚然,阅读理解过程是一个复杂的心智活动过程,从完整而连贯的阅读理解过程中准确离析出每一种阅读能力要素是很困难的,前文也提到过,我国学者对阅读能力要素的划分不下几十种,难以达成一致。例如。章熊认为阅读能力包括认知和筛选的能力、阐释的能力、组合和调整能力、扩展能力。祝新华认为阅读能力包括认读能力、理解能力、吸收能力、速读能力、语感鉴赏能力。各家有各家的道理。然而我们所关心的是,怎样的划分使得基于纸笔测验的阅读能力测试更具可操作性?显 然,我们国内的划分很难作为有效的测评框架应用到实际的阅读能力测试中。因为在设计阅读测试题目时,很容易出现题目考查的能力要素不能清晰认定,有的题目考查到了几种能力要素,有的能力要素却难以通过纸笔测验来考查的状况。相比国内,上述国际上的三大评价体系对阅读能力要素趋于一致的认识则更为可取。它们在阅读能力测试之前都将其测试对象具体化、行为化,便于认定和把握,使得命题过程可操作性很强。获取信息、解释文本、反思与评价是完整的阅读心智活动中三种主要的智力动作,三者之间不可避免地有一定的相关性和依赖性,但各自也能保持相对的独立性。在命制阅读测试题目的时候,三者能够较为清晰地区分开,使得每道题目的考查点比较明确,便于测试之后的解释和反馈。 其 次,相比国内主要按照文章体裁来选择阅读测试材料,根据阅读情境或阅读目的来选择测试材料更为合理。这样做主要有两方面的优点:一方面,按照这种标准划分的阅读材料覆盖面更广,不局限于课堂教学中的记叙文、说明文、议论文等,它基本上可以涵盖学生在学校内外的阅读活动中所接触到的所有阅读材料的种类,更贴近学生丰富多彩的阅读生活,更能真实地反映学生的实际阅读水平:另一方面,人们在真实的阅读活动中,很少是按照文章体裁来阅读的,更多的是根据自身的兴趣、爱好或需要来阅读。文章的体裁本来就是人为划分的,近些年来,义务教育中逐渐提出了“淡化文体”的要求,目的就是要解放学生的思想,避免其在阅读、写作中被强烈的文体意识束缚住了思维。而这种按照阅读目的对阅读材料的划分则更符合人们真实的阅读生活,也更为合理。 除了在宏观上对阅读材料进行了分类。用以指导阅读测试材料的选择之外,上述三大评价体系还都提出了选材的具体要求。例如,PISA特 别强调了表格、图表、地图等类型的阅读材料应作为阅读测试材料的一部分。在我们国内以往的阅读测试中,这种类型的阅读材料往往是被忽视的,很少出现在试卷中。然而,在我们日常生活真实的阅读活动中,这些阅读材料又是很常见的,在读者的阅读活动中占有很大的比重,读者需要具备阅读这种类型文本的能力。PISA将它们作为阅读评价的一类材料提出来,是值得借鉴的。 第三,三大国际阅读评价体系在制定主观性试题评分标准方面为我们保证主观题评分信度提供了良好的思路。在我国,长期以来,由于对标准化考试的追求,人们更多地关注采用客观题,例如选择题的形式来进行测试。但是阅读能力测试本身的特点决定了单纯使用客观性试题难以很好地反映出学生的阅读水平,一定量的主观性试题是必不可少的。主观性试题对于考查学生的思维过程和某些复杂的智力动作有其独特的优势和适用性,那么如何保证主观性试题的评分信度就成了首要问题。在我们国内的语文考试中,阅读部分本来就很简单的评分标准中不难见到类似“意思对即可”“酌情给分”的语句,这无疑是将给分大权完全交给了评分者个人,在评分标准含糊不清的情况下,评分者每人拿着自己的一把“尺子”去衡量学生的作答情况,结果可想而知。教育部初中毕业考试评价组在2006年语文中考命题指导中就强调:“有些(课程改革)实 验区的开放性强的主观性试题,参考答案及评分标准不明晰、模糊性强,缺乏可操作性,评卷教师很难准确把握评价的尺度。例如,有的试卷只要求言之成理即可,有的试卷只给出示例。为了避免具体评卷过程中存在的模糊性和不确定性。应当注重制定科学性、弹性和可操作性相结合的参考答案和评分标准。”在合理制定阅读开放性试题评分标准、保证评分信度方面,三大国际上的阅读评价体系给了我们有益的启示。当然,我国也有我国的特殊国情。在我国,国家或者是省、市级的大规模教育考试一般都是高利害性的考试,比如高考、中考,一般不具备在正式考试前进行一定规模试测的客观环境。我们虽然不能完全仿效国外通过试测来修订评分标准的做法,但依然可以从他们的这种思路中获益。例如,我们可以在正式阅卷前抽取一定量的样本进行试评,将试评做细做精,根据试评中的学生答题样例来修订和充实评分标准,这也不失为一种好的方法。 (二)深入反思语文教学的最终指归 在我国的各级各类考试中,阅读测试一直是稳定而重要的考试内容之一。但国内现在的阅读测试多是停留在凭经验操作的层面上,往往不够清晰明确,缺乏系统化、理性化的思考与设计。上述国际三大阅读评价体系在明晰确定测试内容、理性选择测试材料、合理设计评分标准方面,确实有很多值得我们思考和借鉴的地方。虽然我国是个考试大国,自隋唐兴科举以来已有千余年的考试历史,但毋庸置疑,我们国内在测试方法和技术层面还须向国外学习借鉴。 然而,抛开具体操作层面上的方法和技术,测试的内容确定、材料选择等呈现形态直接投射出了其所承载的理念阅读教学,甚至是语文教学,它的最终指归在哪里?杜威在批评“传统教育”时曾经说过,传统教育“最大的浪费是由于儿童在学校中不能完全、自由地运用他在校外所获得的经验:同时,另一方面,他又不能把学校所学的东西应用于日常生活。”这种学校学习和社会生活互不相干、“两层皮”的现象是我们所不愿看到的。教育教学的最终目标应该是让学生掌握必要的参与社会生活的能力,应该是“为生活”的,而语文的学习更是学生将来参与生活、融入生活的基础。以此为立足点来审视国内外的母语测试或是其中的阅读能力测试,我们不难发现之间的差异。上述三大国际阅读评价体系无一例外都将阅读测试置于各种真实的生活情境中,考查学生的阅读能力是否已经满足了实际生活的需要。如PISA考查学生在生活中四种主要阅读目的下的阅读能力发展状况:为了个人应用而阅读,为了公共应用而阅读,为了教育而阅读,为了工作而阅读。这样的测试植根于生活,其取向是“为生活”的,其背后的教育教学思想也是为了学生的现实生活和未来发展的。然而反观我们国内的语文考试及语文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论