已阅读5页,还剩70页未读, 继续免费阅读
(汉语言文字学专业论文)PSC“说话”测试项的现状与新的设想.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论文提要 普通话水平测试( p s c ) 测查应试人的普通话规范程度、熟练程度,认定其普 通话水平等级,属于标准参照性考试。在普通话水平测试的各项考核内容中,。说 话”测试是唯一没有文字凭借的测试项,无论从应试人应试的角度,还是从测试 员评分的角度来看,该测试项是整个普通话水平测试的难点。本研究以普通话水 平测试中“说话”测试项为主要研究对象,对。说话”测试的学理依据、评分标 准设置、评分实践等问题进行了初步的探讨,并在此基础上提出。说话”测试的 设想与对策。 本文第一部分阐述了“说话”测试项研究的现实意义。以标准参照性测试理 论为主要视角,论述了该测试项在普通话水平测试中的实际意义和重要地位。第 二部分通过对“说话”测试项测试目标、测试界域的分析定位,以国内外大型口 语测试的评分作为参照,结合普通话水平测试的特点,对现行“说话”测试项评 分标准的设置进行了解析。第三部分从评分实践的现状出发,简要介绍了评分人 员的培训、评分方式以及成本经济,重点对现行“说话”测试项的评分实践与理 论误差进行了实证分析与思考,指出影响目前“说话”测试项信度与效度的主要 因素是考核形式的单一、评分标准的缺失和主试人员的评分误差。在前三部分的 基础上,第四部分针对现行测试的缺失与不足,以测评操作为重点,提出“说话” 测试项的设想与对策:注重交际功能,进一步改进考核方式;明确评分内涵,厘 定现行评分标准:加强队伍建设,提高测试员综合素质。 本文主要采用文献研究与调查分析相结合的研究方法。通过对“说话”测试 项学理和测评现状的分析,寻求提高测评效度与信度的对策,从而进一步完善“说 话”测试项的测评机制。 关键词:普通话水平测试;“说话”测试;现状:设想 s t a t u sq u oo fp s c s p e e c ha n dn e wi m a g i n a t i o n a b s t r a c t p u t o n g h u ap r o f i c i e n c yt c 瓯w h i c hb e l o n g st oc r i t e r i o n - r e f e r e n c e d t c s t i i l 吕e x a m i n e st h el e v e lo f p u t o n g h u as t a n d a r d i z a t i o na n dp r o f i c i e n c yo f e x a m i n e e sa n de v a l u a t e st h eg r a d eo fp u t o n s h u ap r o f i c i e n c yt e s t i n p u t o n b h u ap r o f i c i e n c yt e 啦s p e e c ht e s ti s t h eo n l yi t e mo ft e s tw i t h o u t c h a r a c t e r s t h ei t e mo ft e s ti st h em o s td i 蛾c u l te i t h e rt ot h ee x a m i n e r so r t h ee x a m i n e e s t h ea r t i c l em a i n l ys t u d i e st h ei t e mo fs p e e c hi np u t o n b h u a p r o f i c i e n c yt c s t m a k e si n i t i a t i v ee x p l o r a t i o nt o t h e o r e t i c a lb a s i sa n d a s s e s s m e n tc r i t e r i a , a s s e s s m e n tp r a c t i c ea n ds oo n , o nt h eb a s i so fw h i c hi t p u t sf o r w a r d t h ei m a g i n a t i o na n dc o u n t e r m e a s u r e si ns p e e c ht e s t t h ef i r s tp mo ft h ea r t i c l ee x p o u n d st h er e a l i s t i cm e a n i n go ft h e r e s e a r c ho ns p e e c ht e s ta n di t sp r a c t i c a lm e a n i n ga n dt h ei m p o r t a n c ei n p u t o n g h u ap r o f i c i e n c yt e s tb a s e do nt h et h e o r yo fc r i t e r i o n - r e f e r e n c e d t e s t i n g t h es e c o n dp a r te x p l a i n sa s s e s s m e n tc r i t e r i ai nt h ep r e s e n ts p e e c h t e s tb ya n a l y z i n gt h eg o a la n dr e s t r i c t i o no fs c o p eo fs p e e c ht e s t ,r e f e r r i n g t ot h ea s s e s s m e n to fl a r g e - s c a l eo r a lt e s t sa th o m ea n da b r o a da n d c o m b i n i n gt h ec h a r a c t e r i s t i co f p u t o n g h u ap r o f i d c i e n c yt e s t t h et h i r dp a r t i n t r o d u c e sb r i e f l yt h et r a i n i n go fe x a m i n e r s ,m o d eo fa s s e s s m e n ta n dc o s t e c o n o m y , a n a l y z e sw i t hm a t e r i a l sc o n c e r n e da n d t h e o r e t i c a le r r o r sa ts o m e l e n sa n dp o i n t so u tt h a tt h em a i ne l e m e n t s i n f l u e n c i n gv a l i d i t ya n d r e l i a b i l i t yo f t e s ta l et h es i n g l e n e s so f t h et e s tm o d e , t h e l a c ko f a s s e s s m e n t c r i t e r i aa n da s s e s s m e n td e v i a t i o no fe x a m i n e r sf r o mt h ea n g e lo ft h es t a t u s q u oo fa s s e s s m e n t f o rt h el a c ka n dd e f i c i e n c yo fa s s e s s m e n tc r i t e r i at h e f o u r t hp a r tb a s e do nt h ef i r s tt h r e ep a r t s ,p u t se m p h a s i s0 1 1t e s to p e r a t i o n a n dp u t sf o r w a r dt h ei m a g i n a t i o na n dc o u n t e r m e a s u r e si ns p e e c ht e s t , t h a t i s , a t t a t c h i n gi m p o r t a n c et oc o m m u n i c a t i o ns l d l l s ,i m p r o v i n gt e s tm o d e s , d e f i n i n gt h ec o n n o t a t i o no fa s s e s s m e n t , r e g u l a t i n gt h ep r e s e n ta s s e s s m e n t c r i t e r i a , s t r e n g t h e n i n gt h ec o n s t r u c t i o no fp e r s o n n e l s a n d i m p r o v i n g c o m p r e h e s i v eq u a l i t i e s t h ea r t i c l e a d o p t st h em e t h o dc o m b i n i n gl i t e r a t u r er e s e a r c hw i t h i n v e s t i g a t i o na n da n a l y s i s i te x p l o r e st h ec o u n t e r m e a s u r e st oi m p r o v e v a l i d i t ya n dr e l i a b i l i t yo ft e s ta n dp e r f e c t sf u r t h e rt h et e s ts y s t e mb y a n a l y z i n g t h et h e o r e t i c a lb a s i sa n ds t a t t 塔q u oo f s p e e c ht e s t k e yw o r d s :p u t o n g h u ap r o f i c i e n c yt e s t ;s p e e c ht e s t :s t a t u sq u o : i m a g i n a t i o n p s c “说话一测试项的现状与新的设想 前言 普通话水平测试( p s c ) 是我国新时期推广普通话工作的一项重大举措,它的 诞生和推行,标志着我国推广,普及普通话工作开始向纵深发展,逐步走上制度 化、规范化、科学化的新阶段。普通话水平测试由政府的专门机构主持实施,依 据全国统一的标准,在全国范围内开展的一项测试,是重要的国家级考试。普通 话水平测试的基本着眼点是评定应试人普通话水平所达到的等级,即对不同的人 群提出不同的普通话等级要求;其重要目的是通过测试,更好地贯彻新时期推普 工作方针,促进普通话的进一步普及,并在普及的基础上逐步提高全社会的普通 话水平,提高现代汉语规范化的程度。 普通话水平禊试测查应试人的普通话规范程度、熟练程度,认定其普通话水 平等级,属于标准参照性考试。普通话水平测试以口试的方式进行,测试的内容 包括普通话语音、词汇和语法。 从普通话水平铡试试卷的各项题型构成来看,。说话”测试项主要溯查应试入 在无文字凭借的情况下说普通话的水平,是各项题型中唯一没有文字依托的考核 项目,分值所占的比重最大( 见第4 页详列) 。从测试员操作的层面看,对“说话” 测试项语音标准程度的把握、词汇语法规范程度的界定等存有一定的差异:从应 试人受测的层面看,对。说话”测试项考核目标的明确、应试策略的运用等也有 不同的差异;这两者都具有不确定性,测评、应试的难度最大。“说话”测试项采 用语言测试中常用的定量和定性相结合的评价模式,并将评价的结果用具体的分 值体现出来。一方面,评分标准自身的科学性体现了该项考核的效度,另一方面, 测试员对评分标准的理解和把握又影响到整个测试的信度,同时也体现了测试员 自身的专业素质和测评水准。因此该项的测评成为整个普通话水平测试的关键。 现阶段“说话”测试项在实践操作中,由于评分机制不够完善,出现了评分实践 与理论上的部分偏差,在一定程度上影响了。说话”测试的信度与效度。 本文通过对考核形式、评分内涵、测试员培训等方面的思考与分析,提出一 定的设想,以迸一步完善“说话”测试项的评分机制。从现实意义上来说,本研 究将进一步加深对普通话等级标准内涵的理解,在“说话”测评实践中为测试员 提供较为科学的理据及操作范式;有利于对普通话的培训教学提供反馈信息,为 普通话水平测试管理机构提供决策的参考依据。从语言测试理论和实践的角度来 看,将有助于进一步丰富和完善普通话水平测试理论,提高整个普通话水平测试 的信度和效度。 2 一、p s c 。说话”测试项研究的现实意义 ( 一) p s c 。说话”测试项设置的理论依弦和实际意义 “语言测试,是对一组言语行为进行测量,这组行为是表征目标能力的全部 行为的一个抽样。测试的结果,是为了可以对目标能力作出推论。”o 普通话水 平测试大纲( 2 0 0 3 年版) ( 以下简称“0 3 版大纲”) 指出:“普通话水平测试 铡查应试人的普通话规范程度、熟练程度,认定其普通话水平等级,属于标准参 照性考试。”o “标准参照性测试( c r i t e r i o n - r e f e r e n c e dt e s t i n g ) ”是从对考试分数解释的参照 形式进行的归类。它是指在对应试人的成绩作出评定时,将应试人的分数与某一 特定的标准相比,看应试人是否达到了既定的要求。普通话水平测试有明确的参 照标准:一是评定的等级标准( - - 级六等) 是明确和规范的;二是评定时的语音、 词汇、语法标准是明确的;三是评分标准是明确的;四是试卷的拟定是标准化的; 五是测试的大纲、内容、试卷、方式、证书等是明确和统一的。普通话水平测试 用于评定应试人普通话水平等级,从而确定应试人员是否达到工作岗位所要求的 最低标准,这个测试实际上也是一种资格证书考试,属于达标性质测试的范围。 “我们所说的普通话水平测试,严格地说,应当称作普通话口语测试。”o 口语测试是语言测试的一个部分,它检测应试者全面的口语表现能力,即测 试能否在特定语境中准确地说出恰当内容的能力。普通话水平测试属于语言能力 的考察和评价。“所要测试的语言能力主要是指从方言转到标准语的口语运用能 力,即应试人按照普通话语音、词汇、语法规范说话的能力,而不是指通常所说 的包括听说读写全部内容的语文能力。”o “要测量考生的口语水平,就必须让考生开口说话,通过让考生开口说话来 对其口语能力作出评估。” 海内外具有一定规模并有影响的语言测试,如英国的 国际英语考试( 砸l t s ) 、剑桥初级证书英语测试( p c e ) ;美国的英语口语测试 ( t s e ) 、口语能力测试( 0 l p i ) ;中国的大学英语四、六级口语考试( c e t - s e t ) 、 汉语水平考试( 高等) ( h s k ) 等,其1 2 1 语测试中都有“说”的考核内容。“一种 。李筱菊:语言测试科学与艺术,湖南教育出版杜1 9 9 7 年第3 3 页。 搴国家语言文字工作委员会普通话培训测试中心:普通话东平测试实旖纲要) ,商务印书馆2 0 0 4 年,第2 页。 厉兵:普通话测试可行性分析) ,语文建设1 9 8 8 年第4 期。 。仲哲明:普通话水开测试若干f l 哥题的讨论,语言文字应用1 9 9 7 年第3 期。 。刘润清、胡牡麓主编:语言铡试和它的方法 ,外语教学与研究出版社1 9 9 1 年。第1 5 7 页。 3 科学、实用的语言水平考试应当具备这样的条件:能够对适应某种需要所达到的 语言水平做出科学的界定:能够较为准确地测量出测试对象的实际语言水平;能 够对教学发挥积极的反馈作用。”o 说话由于是口语能力的集中体现,因此在普通话水平测试中,“说话”测试项 的设置,可以检测应试人普通话运用的真实水平。它作用于普通话教学系统,可 以评估教学效果,改进教学方法;作用于应试个体,可以衡量学习效率;作用于 测试本身,可以完善测试体系,促使评价标准更加科学。 ( 二) p s c 。说话”测试项在普通话水平测试中的地位 普通话有口语和书面语两种形式,普通话水平测试的内容包括有文字凭借的 和无文字凭借的两部分。普通话水平测试试卷包括4 个组成部分:读单音节字词 ( 1 0 分) 、读多音节词语( 2 0 分) 、朗读短文( 3 0 分) 、命题说话( 4 0 分) 。o 普通话水平测试中的读单音节字词、读多音节词语、朗读短文三项,评分的 量化程度很高,从语言测试对信度的要求来看,可以确保较高的测评信度。信度, 一般来说就是指测试结果是否可靠可信,它说明考试结果与语言行为的关系。没 有信度意味着测试结果不可信,不是应试人语言行为的真实反映,我们就难以籍 此测量任何东西。前三项由于是有文字依托的项目,重点检测应试人“读”的水 平,但是。读”并不能完全体现应试入的语言运用能力,在测评的效度上有所欠 缺。效度指的是测试在多大程度上测出预期要测量的东西,或者说测试在多大程 度上完成了预期的测量任务,达到了预期测试的目标。效度反映所测试的语言行 为与语言能力的关系,没有效度的测试毫无意义,因为它测量了与语言能力不太 相关或毫不相关的东西。 说话是应试人语言运用能力的综合反应,普通话水平测试的目的在于检测应 试人按照普通话语音、词汇、语法规范说话的能力,是语言运用能力检测的重点, 也是实现普通话水平测试效度的关键。在信度和效度难以兼得的情况下,首先要 保证效度。“有时为了提高效度而牺牲一定程度的信度是必要的,然而如果为提高 信度而牺牲效度,我们的测试就变成了准确测量我们测量目标以外东西的工具。”国 。刘镰力主编:汉语水平测试研究,北京语言文化大学出版社1 9 9 7 年,第4 页 。普通话水平测试大纲( 2 0 0 3 年版) 规定,各省、自治区、直辖市语言文字工作部门可以根据测试对象或 本地区的实际情况决定是否免裾。选择判断”翮试项。如免莉此项。命题说话”测试项的分值由3 0 分调 整为4 0 分。参见国家语言文字工作委员会昔通话培训测试中心编制;普通话水平测试实旎纲要商务印书 馆2 0 0 4 年,第5 页。 。枉先锋:从信度与效度的相互关系看语言测试的取向) ,株洲师范高等专科学校学报 2 0 0 0 年第2 期。 4 在普通话水平测试中,“说话是口试中难度较大的一项,是测试的主要项目。 说话测试难在于稍作准备后既要说得言之有物,又要标准、规范。对于普通话水 平不高的人,这两项常常难以协调,顾了标准,说不上几句话;顾了内容,顾不 上标准。这样,说话测试就能真实地了解到受试人的语言状况,这是其他几项测 试不能代替的。”。 。孙修章:r 普通话水平测试标准”的研制与实践,语言文字应用) 1 9 9 2 年第l 期。 二、p s c 。说话”测试项评分标准设置 ( 一) l s c 。说话”测试项测试目标定位 任何一项语言测试在实施之前必须进行合理的设计,其中测试目标的确立是 进行测试设计的前提,测试目标决定测试的形式,也进一步决定测试的具体内容。 普通话是我国的国家通用语言。是汉民族的共同语,也是规范化的现代汉语。 罗常培、吕叔湘先生在现代汉语规范问题这篇文章中指出:。语言的规范指的 是某一语言在语音、词汇、语法各方面的标准。”“共同的语言和规范化的语言是 不可分割的,没有一定的规范就不可能做到真正的共同。”奶普通话作为一种制度 化的规范语言,在国家公务用语、大众传媒用语、教育教学用语方面提供统一的 信息传递手段。由于社会的发展和语言规范化的要求,普通话水平测试应该测试 应试人说普通话的规范程度,这个规范包括语音的规范、词语的规范、也包括表 达习惯的规范。这对于评定高等级的普通话尤其重要,而熟练地表达则是推广普 通话最低层次的要求。 普通话水平测试的性质是对应试人掌握和运用普通话所达到的规范程度和熟 练程度的检测。“说话”测试项测试目标的定位是以普通话水平测试的性质为重要 依据。普通话水平测试实施纲要“总论”部分指出:“有文字凭借的测试项应分 别体现语音、词汇、语法和阅读理解与朗读程度的检测,各类题目要有明确的目 的、要求;无文字凭借的说话部分,全面( 语音、词汇、语法) 检测和评估应试 人使用普通话时所达到的规范程度。”。 0 3 版大纲把“说话”测试项的日标定位为:。测查应试人在无文字凭借的 情况下说普通话的水平,重点测查语音标准程度、词汇语法规范程度和自然流畅 程度。”这是对说普通话。规范”与“熟练”要求的具体化描述,同时也为。说话” 评分项的设置确立了依据。 ( 二) p s c 。说话”测试项测试界域定位 1 测试标准 “罗伯特格莱瑟( r o b e r tg l a s e r ) 在解释成就测量时提出这样一种构想:掌 握知识的程度是一个连续体,从极端生疏到完全熟练,一个人的成就水平就落在 。罗常培,吕叔湘:现代汉语规范问题,中国语文1 9 5 5 年第1 2 期。 。国家语言丈字工作委员会普通话培训测试中心编制:普通话水平测试实旄纲要) ,商务印书馆2 0 0 4 年,第2 页。 6 这个连续体的某一点上和显示在他完成某种测验的行为中。”o 掌握普通话的程度 与过程是一个连续体,应试人从只能说简单的普通话词语到掌握纯正的普通话, 其普通话水平是逐步提高的。由于不同地区、不同行业、不同文化程度、不同年 龄的人掌握和运用普通话的水平存在明显的差别,因此有了统一的尺度才能对应 试人韵普通话水平作出客观评定,同时还可以促进现代汉语规范化,提高普通话 的社会教育水平。 制定普通话的等级标准,其理论依据来源于普通话连续体及普通话习得中所 呈现的阶段性特点。普通话韵标准只有一个,就是。以北京语音为标准音,以北 方话为基础方言,以典范的现代白话文著作为语法规范”。普通话水平测试等级 标准,是普通话水平测试的基本依据。其中的一级、二级、三级标准,不是普通 话本身的标准,而是反映学习普通话进程的不同阶段。 等级标准厘定了言语面貌是普通话还是方言的分界线,每个等级的划分,既 有明确的得分标准,又有总体的说明和附加的规定;等级标准一方面对应试人的 普通话水平作出评价,同时又与社会各交际领域的目标要求具有一定的相关性, 这就使普通话的运用有了社会化的评价体系。普通话一个统一标准和三级六等的 评价体系之间,反映了语言和言语的辩证关系,是符合语言应用和规范豹实际情 况的。 等级标准在对三级六等的描述时对“自由交谈”提出了明确的参照标准,这 个参照标准实际上对应试人“说普通话”提出了具体的要求,也是“说话”测试 项制订评分细则的依据。 2 测试对象 任何测试( 考试) 都是针对某一部分社会群体设立的。普通话水平测试是一 项新的语言测试,规模大,涉及面广。在测试工作开展之初,国家语委对普通话 水平测试的对象与范围的划定是比较谨慎的。 普通话水平测试大纲( 1 9 9 4 年版) ( “以下简称9 4 版大纲”) 对测试的 对象和范围作了如下描述:“掌握和使用一定水平的普通话,是进行现代化建设的 各行各业人员,特别是教师、播音员、节目主持人、演员等专业人员必备的职业 素质。因此,有必要在一定范围内对某些岗位的人员进行普通话水平测试,并逐 。参见刘英林:普通话水平考试的理论思考与标准化,载语文测试的理论和实践,商务印书馆( 香港) 2 0 0 1 年,第4 4 8 页。 7 步实行持等级证书上岗制度。”回从这一划定的范围可以看出,9 4 版大纲对测 试对象的定位是那些中等以上文化程度,能听会说普通话,普透话相对比较标准 的人员。 随着中华人民共和国国家通用语言文字法的颁布实施,国家推广普通话 工作的逐步深化,普通话水平测试有了明确的法律依据。凡年来,普遥话水平测 试经过大量的实践,拥有了良好的声誉和巨大的影响力,产生了一定的社会效应; 因此应试人的范围开始扩展,逐步由播音员,节目主持入、影视话剧演员、教师、 师范专业学生等向国家机关工作入员、在校大学生、公共服务行业人员等拓展; 普通话水平测试在港澳地区也受到的广泛认同,海外对普通话水平测试的需求量 也逐渐增多。由于测试对象范围的急剧扩大,应试人的普通话水平等级开始向低 等级延伸。在这种背景下,0 3 版大纲明确提出:。普通话水平测试测查应试人 的普通话规范程度、熟练程度,认定其普通话水平等级,属于标准参照性考试。” 对照9 4 版大纲,我们不难发现,0 3 版大纲对应试人的身份进行了开 放性的表述,不再进行限制。从对测试对象范围的开放程度来看,由原先具有语 言示范作用的行业人员向社会其他行业人员延伸,说普通话的要求也是在普及基 础上的逐步提高。不同行业群体普通话水平的最低线( 三级乙等) 都要能够达到 实现一般社会交际的最低要求。 3 测试形式 从语言测试的组织形式来看,目前口语测试的形式主要有三种类型:直接型 测试、半直接型测试和问接型测试。 普通话水平测试全部采取口试的形式。从测试形式来看,目前全国绝大多数 地区的普通话水平测试主要采取直接型测试的方式,即由两位或三位主试人面对 一位应试人进行施测,考评过程主试人当场评分,同时采取同步录音。这种方式 的优点是测试的可信度较高,现场听测清楚,出现评分差异时主试人可以及时商 议解决;缺点是考试费时,需要大量的主试人,考场众多,工作量大,且应试人 面对主试人,容易产生畏惧心理,影响测试成绩。部分地区采取半直接型测试的 方式,采用录音室对应试人进行录音测试。这种方式的优点是可以对应试人进行 批量测试,主试人需求少,考场集中,省时、效率高,便于管理,同时可以减轻 应试人的考试畏惧心理;缺点是缺乏现场交际环境,应试人的非语言特征无法观 。刘照雄主编;普通话水平测试大纲( 修订本) ,吉林人民出版杜1 9 9 4 年,第6 页。 8 察,出现突发事件较难控制,评分听测过程易受到录音清晰程度的干扰。 0 3 舨大纲规定应试人“说话”的考核采取单向说话的形式,话题从普 通话水平测试用话题中选取,由给定的两个话题中选定一个话题,连续说一段 话,时问为三分钟。这种考核形式类似于其他语言测试中的。口头作文”,主要考 核其普通话的思维组织能力和口头表达能力。单向说话”的选题非常关键,选题 既要能使应试人有话可说,又要对说话的范围加以必要的限定,以便子对应试人 的对比与评分。从理论上来说,这种考核形式往往具有较高的效度,使测试更接 近与语言运用的实际,增强测试的真实性。 ( 三) p s c 。说话5 测试项目标评分项的配置 口语测试中存在的最大问题是评分的主观性。在对口语测试实施评分时,应 该明确评定的内容,设置科学韵评分标准。 评定言语质量应包括对许多语言特征的鉴定,以及对语言特征的相互作用所 产生的总效果的评定。从总体口语表现来推断考生的口语水平还是从口语表现的 几个方面来推断考生的口语水平,这是评分操作的不同方式,同时也决定了口语 测试目标评分项的设置。从国内外影响较大的口语测试( 如美国外交服务学院口 语测试、英国国际英语考试、中国汉语水平考试等) 对“说话”目标评分项的设 置来看,语音,词汇语法以及流利性这三方面是评价应试入口语水平的主要指标 要素,能够较好地支持对语言水平结构的预先假设。其他实证性的研究也发现, 在衡量口语水平时这三个维度应该分别被关注。 普通话水平测试是标准参照性浸9 试,重点关注的是语言的运用能力。现阶段 由于推普的需要,主要侧重在语言的形式上,测查应试人说普通话的规范程度、 熟练程度,因此可以从语音、词汇语法以及熟练程度( 流利性) 这几个方面来推 断其说普通话的水平。这是因为从普通话习得的过程来看,发音是最基本的,词 汇语法的规范程度要在一定的发音基础上才能实现,而熟练程度则是在前两者的 基础上才能达到。这表明发音、词汇语法和熟练程度这几个方面在普通话习得过 程中是不平衡的,因此在评价普通话水平时可以区别对待。“从评价口语水平的角 度来看,人们在评价口语水平时总带有偏向性的,从几个方面来评价可以在一定 程度上防止偏向性的产生,同时还可以清楚地把握考生在这几个方面的不同表 9 现。”o 0 3 舨 大纲。说话”测试评分项的设置以语音、词汇语法、流利性三个维度 为核心,同时对测试时间作出了明确的限定。评分框架对普通话三级六等标准中 “自由交谈”的评分进行了具体的表述,为评定应试人说普通话的水平提供了依 据,基本上体现了普通话水平测试作为标准参照性测试的特点。 。王佶曼:三类口语考试题型的评分研究,世界汉语教学2 0 0 2 年第4 - 期。 毒参见国家语言文字工作委员会普通话培训测试中心编制:普通话水平测试实施纲要 ,商务印书馆2 0 0 4 年, 第4 页。 三、p s c 。说话”测试项评分实践的现状 ( 一) p s c 。说话。测试项评分人员的上岗培调 评分标准确定之后,关键在于要将这些评分标准充分体现在评分人员的评分行 为之中,才能得出测评的结果。评分人员在口语测试中起着举足轻重的作用,评 分人员质量的高低直接影响着口语测试的实施及考分的可信度,因此评分人员培 训是口语测试成功的关键。酱通话水平测试的评分人员称为普通话水平测试员( 以 下简称“测试员”) 。 测试员的上岗培训主要是指学员经过普通话培训测试机构举办的测试员资格 培训班,获得测试员资格认定的过程。目前我国测试员的任职培训分为省级测试 员资格培训和国家级测试员资格培训两类,主持培训的机构分别是省级普通话培 训测试中心和国家语委普通话培训测试中心。 省级测试员上岗培训的内容主要是进行系统的测评能力训练,这些训练内容 包含语音审音训练、单项测评评分训练、综合测评评分训练等,训练过程中始终 贯穿定量定性原则。培训内容的重点以评分操作训练为主。省级测试员必须经过 省级普通话培训测试中心考核后方能取得任职资格,考核的内容包括汉语拼音注 音、普通话水平等级测试、测评能力考核三项。 国家级测试员上岗培训属于高层次的培训。该培训班的培训特点以研修为主, 测试员的评分基础训练已不再是培训的主要任务。培训的内容主要是两个方面: 一是从政策性方面加强对普通话水平测试本质和规律的认识,努力维护普通话水 平测试这项国家级考试的严肃性和权威性。二是从考试学的角度对普通话水平 测试大纲及评分标准进行研究。在坚持测试大纲、测试标准的前提下,交流测 试经验,对评分细则进行研讨,迸一步提高学员普通话水平测试的科研能力。国 家级测试员必须经过国家语委酱通话培训测试中心考核后方能取得任职资格,考 核的内容包括汉语拼音注音、普通话水平测试试卷拟卷、普通话水平等级测试、 测评能力考核四项。 ( 二) p s c 。说话。测试项评分方式与成本经济 1 评分方式 口语测试的评分一般可以分成两大类:分析型评分和综合型评分。 分析型评分是从语音、词汇,流畅度等各个方面,分别对考生的口语表达进 行评分,然后根据每个方面的得分折算出口试总分或相应的等级。口试的具体打 分、各部分的评分标准及在总成绩中所占的比重都是预先设置的。综合型评分是 对考生的口语能力按照不同的等级作出简短的总体描述,然后根据评分员对考生 口语表现的整体印象将其划入相应的等次。综合型评分一般主要用于评价考生的 口头交际能力,者眼于其口头表达的交际效果。 从目前“说话”测试项各评分要素的设置来看,该项的评分方式属于分析型 的评分。为了尽可能缩小评分误差,确保评分的客观性,普通话水平测试采取口 试中集体阅卷评分的模式。 ( 1 ) 评分队伍由经过培训考核的测试员组成。测试员的评分经验和个体素质, 在对评分标准及评分细则的把握上。起着重要的作用,使评分质量有了最基本的 保障。 ( 2 ) 以测试组的形式施测。测试组由两人或三人组成。测试员必须在测试机 构的组织下,依照测试规程执行,原则上测试员个体无权执行测试任务。 ( 3 ) 测试组成员讲求分合,构成交叉流动。测试组成员应彼此交叉搭配组合, 排除固定测试组带来的评分片面性,避免出现偏宽偏严的现象,从而保证组际评 分的相对平衡,减少组际评分误差。 ( 4 ) 测试成绩的评定。普通话水平测试成绩的评定采取以下方式得出:两人 组测试通常以两名测试员相同等级( 即。三级六等”标准中的等级必须一致) 的 各自独立打分的平均分值为应试人的最终成绩;当出现等级评定不一致对,要请 第三位测试员加入评分,以多数人意见为准。三人组测试以三名测试员相同等级 的各自独立打分的平均分值为应试人的最终成绩,等级评定以多数人的意见为准。 2 成本经济 测试的成本经济核算是测试组织的重要环节。普通话水平测试是大规模的口 语测试,从测试命题的角度来看,成本经济相对较低。尤其像目前。说话”测试 项的命题,拟定若干个相对固定的话题比较简便。从施测的角度来看,测试员的 脑力劳动强度高,日测试量大。采用传统的面对面、当场评分的形式,无论是三 人评分还是两人评分,都会涉及到一定的测试成本,其中重要的一个方面是测试 员的劳务支出。一般来说,采用两人评分的评分模式成本较低。但信度较低;三 人评分成本较高,但信度较高。目前全国绝大多数地区采取的是传统的评分模式, 从总体来看,整个普通话水平测试的施溯成本较高。个别地区己借助计算机、网 络等手段,采取机器测试或“机助人测”的评分模式,在一定程度上降低了测试 的成本,但在降低成本的同时如何确保测评的信度是该评分模式的难点之一。 ( 三) p s c 。说话”测试项评分实践与理论误差 普通话水平测试是规模宏大的口语测试实践。任何一项测试从开始试行到逐 渐成熟,总是需要较长对问的实践检验。普通话水平测试经过十几年的测试实践 论证,应该说这项测试的总体设计是客观科学的。在普通话水平测试中,“说话” 测试项的评分一直是个难点。从0 3 版大纲的各项题型构成来看,“说话”测 试项在测试中所占的比重最大。由于说话属于应试入主动的表达,其内容的语言 形式在语音、词汇、语法等方面难易程度不同,必然存在一定的差异。我们发现 大多数测试员对于此项的评分争议较大,标准也难于把握。测试中对于“说话” 测试项的理解、评判,不但影响到应试入的普通话等级水平,而且直接反映出测 试员的授i 评水准,因此该项的测评成为整个普通话测试的关键。为了进一步了解 “说话”测试项的现状,笔者一方面整理了浙江省普通话培训测试中心近几年对 全省普通话水平测试质量的抽检结果:另一方面,进行了一次面向测试员与应试 人的问卷调查。从质量抽检和问卷调查的结果来看,“说话”测试项在实践操作 中,存有一定的问题,值得我们作进一步的思考。 1 测查形式单一,试题固定,测试目标有所偏移。 关于“说话”测试项的测试目的,0 3 版大纲描述为:“测查应试人在无文 字凭借的情况下说普通话的水平,重点测查语音标准程度、词汇语法规范程度和 自然流畅程度。”应该说,0 3 版大纲的测试目的主要是为了测查应试人。说普 通话的水平”。但在测试的实践操作中,我们发现“说话”测试项的测试结果与应 试人的普通话实际水平存在一定的差距,尤其是对。说普通话的水平”目标的考 察,与0 3 版大纲制定设计的初衷并不完全吻合,测试目的有所偏移。 现代汉语词典对于。说话”的解释是:“用语言表达意思。”国根据语言学 的理论,说话应该属于言语的范畴,是人与人之间的口头交际行为。一般来讲, 9 本次问卷以测试员和应试人为调查对象,采用无记名、选点阎卷的形式,时闻为2 0 0 6 年1 0 月- - 1 2 月共 投放测试员阀卷1 2 0 份,杭州,湖州,温州、宁波各3 0 份,回收有效问卷8 9 份( 杭州2 2 份,湖州1 8 份, 温州2 9 份,宁波2 0 份) 。共投放应试人向卷6 0 0 份,地点选择在湖州市。考虑到目前测试的主要群体是学生、 教师和国家公务员,因此问卷根据测试群体量的大小进行了投放( 学生3 0 0 份,教师1 5 0 份,公务员1 5 0 份, 比例为2 :l :1 ) ,回收有效甸卷4 8 3 份( 学生2 4 8 份,教师1 2 5 份公务员1 1 0 份) 。问卷要求参加调查的测 试员和应试人就问卷中的所有问题作单一选择,若有其他观点则请另行表述。文中所涉及的问卷内容和数据 详见本文附录。 o 中国社会科学院语言研究所词典编辑室编;现代汉语词典 ( 修订本) 商务印书馆1 9 9 6 年,第1 1 8 9 页。 口头表达有七种情形:。日常会话( 包括问答、对话) 。在动作或事件中作出 反映的偶发的话。 夹杂动作的话。毫无准备地说一段连贯韵话。有提纲的 即兴发言。离不开讲稿的讲话。念稿子。”西普通话水平测试的“说话”从宽 泛的角度来说应当属于上述类型中的第种,但其概念内涵小于日常。会话”概 念的内涵,测试项。说话”只是舀常“会话”的更高要求的一种表达方式:无文 字凭借;用普通话作为交际用语:要有一定的规范程度( 语音、词汇,语法符合 现代汉语的规范程式) :以单向表达的形式为主( 必要时才辅以双向交流) 。这样 一些限定条件的设立,使得我们在测试时,经常面艋一些尴尬的局面,主要体现 在以下几个方面: ( 1 ) 测查形式单一,容易引发应试人投机应试。 a 背稿复述 现行“说话”测试项的“3 0 则话题仅是对话题范围的规定,并不规定话题的 具体内容”,。至于说话具体内容的质量、完整程度、真实与否,并没有进行明确 的限定。在测试中,我们发现不少应试人在准备“说话”项的测试时往往先拟好 稿子( 或拿参考书、报刊杂志上现成的说话示范稿) ,将稿子背得滚瓜烂熟,等到 考试时就背诵给测试员听;或是一组应试人,用统一印发的稿子来应付考试,第 一位应试人与最后一位应试人讲的都是大致相同的内容,连遭词造旬都相差不大; 更有甚者,套用大纲现成的朗读文本,说话内容机械复述。 以话题。我的学习生活”为例: 语料1 - 今天我说的话题是“我的学习生活”。说起我的学习生活,真是丰富 多彩,其中我最喜欢的就是看书我看过的文章很多,但印象最深的是关于陶 行知教育孩子的故事。“育才小学校长陶行知在校园看到学生王友用泥块砸自己 班上的同学,陶行知当即喝止了他,并责令他放学后到校长室去 ( 以下即转述普通话水平朗读作品3 9 号陶行知的“四块糖果”) 语料2 :我的话题是。我的学习生活,今天就谈谈我小时候的学习生活。读 小学的时候,我的外祖母去世了外祖母生前最疼爱我,我无法排除自己的忧 伤” ( 以下即转述普通话水平朗读作品1 4 号和时间赛跑) m 陈建民:汉语口语,北京出版社1 9 8 4 年,第1 页 。国家语言文字工作委员会普通话培训测试中心编制:普通话水平测试实捕纲要,商务印书馆2 0 0 4 年,第 ”5 页。 影二 9 1 9 口非常多母比鞍多很少 口柜离岛不走膏 且妊且报证 图3 1 测试员对应试人。背稿”现象的关注图3 2 测试员对应试 说话真实性的看法 从图3 - - 1 可以看出,当测试员被闯及“您在测试时遇到应试人背稿现象出现 的频率”时,选择。非常多”( 1 9 1 ) 与。比较多”( 7 0 8 ) 的人数占到了绝大 部分。这说明在现行的测试模式下,应试人“背稿”应试的现象还是相当普遍的。 “语言测试中的真实性指受试者在测试中使用目标语进行交际活动的相似程度, 也就是语言测试和语言交际的统一程度。”o 说话本应体现说话者的思想、情感等 因素,但这时我们听到的内容只是机械式的复述,应试人呈现给考官是种与真 实口语表达水平不相吻合的“虚假”的语音面貌状态,完全背离了口语测试真实 性的原则。图3 - - 2 中的统计结果反映了测试员对应试人说话真实性程度的看法, 其中选择。不太高”的最多( 7 1 9 ) ,其次是“低”( 1 9 1 ) 。说话”测试项的 目的是检测应试人“说普通话的水平”,测试中出现的“背稿”现象,很明显偏离 了“说话”测试的测查目的。 b 内容离题 “说话”测试项对应试人说话话题的选题进行了限定:“说话话题从普通话 水平测试用话题中选取,由应试人从给定的两个话题中选定1 个话题,连续说 一段话”。o 说话由于采取“二选一”的抽题模式,应试人选择的余地较小,如果 抽到的题签都是自己不熟悉或不喜欢的话题,考核时势必心情紧张,影响普通话 水平的正常发挥。 在普通话应试培训中我们经常遇到的情况是,个别应试人几乎把所有的话题 都集中在一个内容上进行准备,考核时如果抽到的题签不理想,索性就偏离话题, 用同一内容套题表达。试举例: 。黄大勇:语言测试中的真实性概念,语言教学与研究2 0 0 4 年第2 期。 。国家语言文字工作委员会普通话培训测试中心编制:普通话水平疆5 试实掩纲要孔商务书馆2 0 0 4 年,第5 页。 话题1 我最尊敬的人:“我最尊敬的人是我爸爸,说起我的爸爸,他是一 个非常善良、勤劳,正直的人” , 话题2 我和体育:。我平时很喜欢体育运动,只要一有空,我总是争我爸 爸一块儿打羽毛球说起我的爸爸,他是一个非常善良、勤劳,正直的人。 话题3 ( ( 我的成长之路:。在我的成长之路上,对我影响最大的是我爸爸 说起我的爸爸,他是一个非常善良、勤劳,正直的人” 话题4 谈谈个人修养:“说起个人修养,我首先得感谢我的爸爸,爸爸以 他正直的为人感染了我。说起我的爸爸,他是一个非常善良、勤劳、正直的 人一 以上例子,只有话题l 的内容是相对切题的,其余话题均用话题1 的内容来 “套题”,整个3 分钟的说话,应试入只介绍了他的爸爸,内容完全偏离话题。我 们认为,既然“说话”测试项规定必须根据抽签确定的话题来表达,那么应试人 说话的内容应该紧扣相应的话题,不能牵强附会,更不能离题万里,否则3 0 则谈 话题目就变得形同虚设,毫无意义。 c 放慢语速 正常的口语语速一般可以分为三类:舒缓语速为1 8 0 音节分钟;中等语速为 2 4 0 音节,分钟;较快语速为2 7 0 - - 3 5 0 个音节份钟。语速还有一个“准极限数”: 每分钟少于1 2 0 个音节为过慢,每分钟多于3 6 0 个音节为过快。根据对应试人说 话音节量进行统计的结果,我们发现在正常的情况下,3 分钟说话的音
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 西瓜嫁接换根种植方案
- 痛风患者尿酸控制饮食规范
- 腰椎间盘突出康复护理
- 草莓无土栽培基质配方
- 家政员背景调查作业实施细则
- 职业高中机电技术应用题库及答案
- 航空航天飞行器设计题库及答案
- 个人防护用品质量验收标准
- 种鹅秋季换羽产蛋管理技术方案
- 水稻插秧机调试维护保养规范
- 企业董事长助理岗位职责书
- 林光互补光伏发电项目可行性研究报告
- 民兵军事训练教案
- 教师形体与礼仪(成都师范学院)知到智慧树网课答案
- 2025年黑龙江省公安辅警招聘知识考试题(含答案)
- 打叶复烤设备操作工职业考核试卷及答案
- 矿山工程质量监理评估报告范文
- 《数字图像与视频处理》课件-第8章 数字水印技术
- 2025至2030中国UDCA的药物行业发展趋势分析与未来投资战略咨询研究报告
- 2025年贵阳贵安面向退役军人选拔培养中小学“兵教师”40人考试参考试题及答案解析
- 医养结合机构运营管理规范
评论
0/150
提交评论