




已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
y 5 649 1 4 对上肢力量类测验项目等值的实证研究 摘要: 目的:在体育实践中,一些上肢力量测验常被采纳,如引体向上、 屈臂悬垂、双杠屈臂,但相应的评分标准f 司的等价关系式还没被确定 起来。本实验利用等值技术对三个上肢力量类测验项目作实证性研究, 确定三者之间的等值关系式,并比较不同等值方法对它们进行等值的 准确性和稳健性。 方法:4 5 3 名大学男生分别进行了三项测验,每项测验f 司隔一周, 测验项目顺序为均衡设计。等值方法包括线性等值、一般的等百分位 等值和平滑的等百分位等值。测试数据随机分成两部分:等值样本、 交互验证样本。三测验的等值关系式通过等值样本来确定,而各种等 值方法的等值精确性和稳健性则由交互验证样本通过r m s d 指标来评 估。 结果:1 ) 在进行平滑等百分位等值时,平滑模型的选取应视不同 的测验项目而定。2 ) 在对三种上肢力量类测验等值的方法中,线性等 值方法的效果最好。3 ) 根据本实验得出的- - n 验间的等值转换表,对 照国家体育锻炼标准,发现其中的测验评分标准在部分成绩段等值 性较好,部分成绩段等值性不太满意。 关键词:等值上肢力量实证研究 a n e m p i r i c a ls t u d y o ne q u a t i n gu p p e rb o d ys t r e n g t ht e s t s a b s t r a c t : o b j e c t i v e :a n u m b e ro f u p p e rb o d ys t r e n g t h t e s t sa r e b e i n gf r e q u e n t l y e m p l o y e di nt e s t i n gp r a c t i c e t h ee q u i v a l e n c eo f t h es t a n d a r d s ,h o w e v e lh a sn o tb e e n c o n f i r m e d t h e r e f o r e ,t h ep u r p o s eo ft h i ss t u d yw a st od e t e r m i n et h ee q u i v a l e n c eo f t h r e eu p p e rb o d ys t r e n g t ht e s t s ,i n c l u d i n gp u l l u p ,p u s h 。u pa n df l e x e d l a l t t lh a n g m e t h o d s :t h r e et e s t sa r ea d m i n i s t e r e dt o4 5 3m a l ec o l l e g i a n s e a c ht e s t w a s a d m i n i s t e r e di naw e e ka p a n ,a n dt h et e s t i n go r d e rw a sc o u n t e r b a l a n c e d t h ee q u a t i n g m e t h o d si n c l u d e dt h eu n s m o o t h e da n ds m o o t h i n ge q u i p e r c e n t i l ee q u a t i n ga n dl i n e a r e q u a t i n g t h ec o l l e c t e dd a t aw e r er a n d o m l ys p l i t i n t ot w os a m p l e s :e q u a t i n gs a m p l e , c r o s s v a l i d a t i o ns a m p l e t h ee q u i v a l e n tr e l a t i o n s h i p so ft h et e s t sw e r ed e t e r m i n e db y e q u a t i n gs a m p l e ,u s i n g t h ec r o s s v a l i d a t i o n s a m p l e ,t h ee q u a t i n ga c c u r a c y w a s e v a l u a t e db yt h ei n d e xo fr o o tm e a ns q u a r e dd i f f e r e n c e ( r m s d ) r e s u l t s :1 ) i ns m o o t h i n ge q u i p e r c e n t i l ee q u a t i n g ,s m o o t h i n gm o d e ls h o u l d b e c h o s e na c c o r d i n gt od i f f e r e n tt e s t s 2 ) a m o n gt h ee q u a t i n gm e t h o do ft h r e eu p p e rb o d y s t r e n g t ht e s t s ,t h e l i n e a r e q u a t i n g f u n c t i o n e dt h eb e s t 3 ) b a s e do nt h ee q u i v a l e n t r e l a t i o n s h i pd e r i v e df r o mt h i ss t u d y t h ee q u i v a l e n c eo f t h es t a n d sw a se v a l u a t e d i tw a s f o u n dt h a t ,w h i l et h ee q u i v a l e n c eo fs o m eo ft h es t a n d a r d sw a sw e l le s t a n i s h e d t h e e q u i v a l e n c eo f o t h e r sw a sn o ts a t i s f a c t o r y k e yw o r d s :e q u a t i n gu p p e rb o d ys t r e n g t h e m p i r i c a ls t u d y 刘瑜:剥上肢力颦类测验项目等值的实证研究 一、论文研究综述 1等值的意义 在测量实践中,常常会遇到个测验配备有多种测验形式的情况,特别是 出于对测验的保密性要求而发展了一些“平行”测验形式,而要使得这些不同 测验形式的结果能相互可比,统一进行评价,就要将它们转换到同一分数量表 上,这个过程即为等值化( e q u a t i n g ) 。 对笔试测验来说,等值尤为重要。尽管在测验时总是尽量保持考试难度的 稳定性,但不同试卷之间在难度、信度、分数分布方面的差别很难完全避免, 这种差别会影响到评价标准的客观性,造成使用不同试卷的考生受至i 不公平的 对待。而等值的核心就是在统一量表上标定试题参数,实现各个考生所答题1 间的等值,因此等值是测验公平性的保证。并有研究通过等值确定了某职业能 力评价的笔试测验与多媒体测验的可比性。 等值是题库建设的需要。为了避免在测验编制中的盲目性和偶然性,许多 考试机构都在致力于建设题库,而实现等值是建设科学化题库的前提。 等值是实现计算机辅助自适应性测验的前提。随着计算机技术的迅速发 展,测验的计算机化正在成为一种重要的发展趋势。实现计算机辅助自适应性 测验的意义不仅在于可以提高测验的效率,更重要的是可以提高测验的信度。 计算机化自适应性测验开发中的一一个核心环节是实现各个考生所回答的不同 题目之间的等值。 迄今,等值是我国测验研究中最薄弱的一个环节,包括高考、目学考试、 高中会考、公务员考试、各级各类职业资格证书考试在内的许多重要的考试都 尚未完全实现统计等值,尽快实现等值是国内许多考试所共同面临的重要任 务。 日前,实现了统计等值的考试有h s k ( 中国汉语水平考试) 、浙江省的高 中会考以及英语水平考试( e p t ) 2 1 。h s k 所采用的等值数据的收集方式为“共 同题测验”设计,其等值所依据的理论模型为经典测验理论,所采用的计算方 扬州人学硕士学位论文 法为t u c k e r 等值方法;浙江省高中会考所采用的等值数据收集方式是共同组 没计,将不同试卷同时施测于外省的同一组考生 3 1 ;e p t 所采用的等值数据 收集方式为“共同题测验”设计,其等值所依据的理论模型既非经典理论模型, 也不是项目反应模型,而是自己创造的一种方法,基本上属于平均数等值 4 l 。 而美国教育测验服务社e t s ( e n g l i s ht e s ts e r v i c e ) 在等值过程中是同时采用 多种等值模型之后再求平均数。 2 等值问题的研究状况 在心理和教育测量领域中,有关等值f 7 题的理论和应用研究较多。虽然从 5 0 年代就有一些零星的研究,但到8 0 年代,j 引起比较广泛的注意( rl b r e m l a n a c t , 1 9 8 7 ) 。在7 0 、8 0 年代出版的有关心理测量的教科书中几乎见不 到关于等值问题的讨论,甚至一些9 0 年代出版的大学心理测量学教科书中都 未涉及测验的等值问题。 随着测验事业的发展,我国测量学者从九十年代初开始关注和研究测验等 值,所使用的是经典测验理论指导下的各种测验等值方法。稍后,随着项目反 应理论在我国的传播,有些学者开始研究项目反应理论的等值方法,研究内容集 中在能力等值方面,少数是项目参数等值,所建基的模型都是r a s h 模型、双或三 参数l o g i s t i c 模型等用于1 、0 记分的简单模型, e s - 有人问津建立基于多级模 型的测验等值问题。 近年来,心理测量学家们对测验等值问题关注越来越多,不仅提出了许多 等值方法而且围绕等值问题展丌了多方面的研究。研究的问题主要有以下几方 面。 2 1 不同等值设计之间的比较 要对测量同一能力的不同测验形式进行等值,必须收集可以用于等值 的数据,如果两次不同测验的结果间没有统计关系,就无法使用统计方法 使之产生联系。为此需要在两个欲等值的测验之间架设相互联系的“桥梁”, 这种工作即为等值设计。其设计既要考虑实施的可能性又要考虑统计方法 的配备,但设计的最主要的原则还是要使得所采集的数据能最有效地提供 刘瑜:对上肢力鼙类燕验项目等值的实i i e 研究 不同测验形式的差异信,鲁、”bj 。目前国内外在等值设计方面主要有以下几 种: 单组设汁:将欲等值的两个或多个测验同时同一受试组施测,然后借助 于同受试组将测验结果进 ,等值。这种方法的缺r 点是由于要对同一受 试组实施两个平行测验,受试者列两个测验的练习效应和疲劳厌倦效应 等会对等值结果带来偏差月i 明的影唰4 。 随机等组设计:从同一总体刚随机抽耿能力水平上相同或相近的两受j 式 组,让这两组受试者分别接受两个欲等值的测验a 和b ,然厅亏把所得 测验结果加以等值,这种方活的缺点是在等值过程中混杂了不同受试能 力水平的差异效应。 平衡等组设计:这种设计方法把上面两种设计方法结合起来,将受斌脊 随机分成能力相同或相近的两组,第一组先进行a 测验后进行b 测验 第二组先进行b 测验再进行a 测验,然后再进行等值。 共同题测验设计:将欲等值的测验分别向不同的受试组施测,但存这两 个测验上都附加上出一批共j 刊项目绢所组成的附加测验。要求辨加测验 是两个测验的一个缩影,然后利用附加测验作为桥梁建立两份! l 验的等 值关系,故又称为“共同题非等纽设训”。由于该设计不要求受试群体 的相同能力分布,这使得实际中在考虑到两群体能力分布有差异,但义 不可能作多次测验时特别确用,该方法的缺点是要使附加测验是两个测 验的个缩影实际上难以做到,而共同题与测验在难度或内容上的蒡异 都会给等值结果带来误差,其中尤其是在难度上的影响更大。 另外,对等值设计既可采用以“题”为媒介的“共同题测验设计”,岜 可采用以“人”为媒介的“共同受试组设计”。陈希镇对等值方法和等值设 计进行研究,得到改进后的线性等值公式,该公式不仅与两测验相天系数 有关,且由两测验的信度有关,是常用线性等值公式的一个推广,同附给 出了置信区间估计,提出了新的等值设训方法:试卷分半组合的率组设计 法,即将欲等值的两个测验a 与b 分别根据要求各分成两个半测验a ,、a , 4 扬州大学硕士学位论文 与b l 、b 2 ,然后把a 的半卷a lf 或a 2 ) 与b 的半卷b i ( 或b 2 ) 结合组 成一份新测验c ,让同一组考生参加测验c ,这样可通过该组考生,建立 a ,与b l 、a 1 与a 、b 】与b 的等值公式,综合这三个等值公式就可得到测 验a 与b 的等值转换公式。h 1 2 2 不同等值理论模型的比较 基于不同的测验理论,等值的理沦模型主要有经典测验理论( c t t ) 和 项目反应理论f i r t ) 等值两种j 。 c t t 等值主要方法有线性等值和等百分位等值两种。线性等值将不同 测验形式的结果基于各自的均值和标准差调整成相等,因此在概念上可:恪 线性等值理解为两测验形式的z 分相等。等百分位等值将不同形式测验处 于相同百分位上的结果认为“等值”。以往,等百分位等值被认为更难进行, 因此很少实用,而如今,归因于计算机的迅速发展,普遍使用的计算机等 值程序中均包括这几种方法 9 】,可操作性已不是主要问题,准确性成为主 要的考虑,这经常是用真实的或模拟的数据通过交互验证进行检验,另外 等值精确性也可通过精确性指数或统计检验方法来检验。在理论上等百分 位等值比线性等值有更大的误差,这样如果测验的z 分分布是近似相等的 话,线性等值的效果一般较好,但线性等值仍然依赖于所使用的受试样本 组,除非是采用单组设计法并且样本数要充分大。 i r t 等值则致力于使组成测验的项目处于同一量表,这样就可通过选 择项目而将不同形式的测验进行等值【】。i r t 最基本的优点是受试者能力 的估计值和所施测的项目无关,同时项目参数的估计值和受试群体无关, 并且受试者能力与项目难度处于同一量表上。 一些研究认为i r t 等值方法优于c t t 等值方法加1 ,另一些研究却没 有为i r t 提供支持 l 3 , 1 4 1 。而且i r t 是建立在强假设的基础上的,n ;l l ,在 用i r t 模型进行测验等值时,研究假设不满足时模型的稳健性与数据一模 型问的拟合性就尤为重要( k o l e na n db r e n n a n ,1 9 9 5 ) 。有研究( g l e ea n dd f r e s b i e ,1 9 9 7 ;h w a i n e ra n d d t h i s s e n ,1 9 9 6 ;s s i r e c i ,d ,t h i s s e n ,a n d h 刘瑜:列= 肢,j 量类测验项目等值的实证研究 w a i n e r , 1 9 9 1 ) 指出,二值汁分i r i 模型的假设经常得1 i 到满足,但町月 多坝 目总分来代替单个项目得分以消除在多项目内项目相关性的影州i l “。事史 上,各种等值模型,各种计算方法都具有或强或弱的定假设,都仪仪适 台一定的测验条件,这些假设都与某些造成等值误差的因素有关,有些假 设可以通过一定方式来检验,有些假设是很难被检验的。 l e e g u e m i n 等1 1 “用c t t 等值结果作为标准,比较了多值记分i r t 模 型和二值记分3 - p l m 等值的效能,表明多值记分i r t 模型比二值记分 3 - p l m 更与传统等值结果一致。 有关多维特质存在时等值方法的使用问题,争议较多。b o l td m 用模 拟数据研究表明单维i r t 真分数等值法在多维特质存在时,若维度删相关 系数高( = o 7 ) ,其结果与线性等值法差不多,而若维度问相关系数较低 ( c = 0 5 ) ,则会比等百分位等值效果差。 还有一一些有关不同等值方法的研究,发现除了非等组群体的共同题测 验设计以外,c t t 等值法和i r t 等值法一样效果不差,但i r t 等值法经常 比传统方法更为复杂。另外,两种方法的差异程度因不同的测验情景和0 : 同的测验结果分布而不同 1 7 , 18 ) 。 在等值模型的选取上,不仅要考虑误差因素的影响,还需要考虑洲验 所关注的结果分布、测验对结果精确性的要求水平、测验结果的应用、计 算条件等因素。 2 3 不同等值系数估计方法之间的比较 c a 于大多数多维i r t 参数估训程序都假设所测的多维能力分布是i l 态 分布n ( o ,i ) ,故多维i r t 项曰参数量表转换是相对于标准正交参照轴的,这 样就可通过正交一致旋转变换将欲等值组的参照系转换到基准组上。 i 。i ,y u a nh 对3 种多维项目反应理论( m i r t ) 等值法的精确性进行了研究, 并指出m i r t 模型能用来处理单维特质数据。 基于i r t 的参数转换方法,尤其是平均数和标准差( m s ) 参数转换方 法是得到较多介绍的等值方法 2 0 , 2 1 , 2 2 1 ,参数转换也可采用平均数和平均数 扬州大学硕士学位论文 方法( m m 法) ,另外,对系数估计还可用整体估计方法:在测验a 的参 数估计过程中引入来自测验b 的限定,以便有更多的信息参加整个等值过 程 2 3 】。谢小庆采用h s k 正式考试数据,对4 种c t t 等值法和1 1 种i r t 等值法进行比较研究,表明至少对于h s k 数据,不论是单、双、三参数, 不论是m s 法、t r i m 法,i r t 参数转换等值方法的误差都较大,均不足取。 2 4 等值误差因素研究 影响等值的误差因素包括:欲等值测验的同质性;欲等值测验之间的 难度差别;被等值测验结果的分布特点,包括偏度、峰度等;欲等值测验 的单维性;共同题对测验的代表性,或共同题结果与测验结果的相关性: 用于等值估计的受试样本的容量;用于等值估计的受试群体测验结果分布 的相似性;测验长度:共同题数量;共同题在测验中的位置 2 4 , 2 5 】。 罗照盛口6 j 以高考成绩分析了t u c k e r 法及l o r d 随机等值法的等值结果 及抽样标准误,指出:数据连续化后可减小抽样标准误,促进等值精确性, 但处理后可能会使数据存在偏性;等百分位等值抽样标准误受各样本点简 单次数影响较大,故对数据连续化处理时,各个选取的样本点要具有充分 代表性( 即要符合数据资料的期望分布) ;正态假设比无限制所计算得的抽 样标准误更大,故计算等值标准误时,最好使用无限制假设条件法。 s u a n t h o n g 2 7 1 研究了i r t 共同题等值中5 个影响因素:( a ) 分布形式( 正 态与均匀分布) :( b ) 项目难度的标准差( o 6 8 ,o9 5 ,0 9 9 ) ;( c ) n t l 验长度( 5 0 , 1 0 0 ,2 0 0 ) :( d ) 共同题数量( 1 0 ,2 0 ,3 0 ) :( e ) 受试人数( 1 0 0 ,3 0 0 ,5 0 0 ) 。结 果显示有3 对两因素交互效应显著:共同题数量测验长度;项目难度标 准差x 分布形式:项目难度标准差受试人数。并指出了它们的最佳组合 为:偏态,项目难度标准差o 9 9 ,测验长度1 0 0 ,共同题数量2 0 ,受试人 数1o o 。 y a n g ,w e n l i n g 2 8 1 用共同题设计,研究了三种等值方法( t u c k e r 线性等 值,两种3 - p l m 等值) 及共同题的代表性,对等值结果精确性的影响。数 据来自两种分别含1 9 7 与2 0 3 个项目的职业能力测验,两者间共同题量为 刘瑜:对上肢力量类测验项目等值的实证研究 1 4 5 ,两受试群体没有随机抽取。结果表日月三种等值方法都得到中等程度的 精确结果,而且共同题列整个测验的代表性越好,等值结果就越精确,但 不同等值方法的精确性间差异不显著。w i l e y ,a n d r e w 2 9 1 研究电证实等值误 差最受受试者能力的影响,它比等值设计或等值方法的影响更大。 2 5 等值误差估计方法与误差控制研究 等值误差有两类:一类是随机误差,另一类是系统误差。 在测验等值中我们多数只能以来自总体的某个样本的数据来估计两小 测验间的等值关系,这时等值随机误差就会出现。在测量学中等值的随机 误差用等值标准误差来描述。 在实际等值中等值标准误差的估计方法有两种,一种称为b o o t s t r a p 法,另一种称为d e l t a 法。用b o o t s t r a p 法估计等值标准误差,思路比较接 近于等值标准误的定义,具有实汪性特征,其缺点是反复抽样及多次估计 等值关系需要大量的计算机时,而且只有在原样本容量较大的条件下估计 值才趋于稳定。在上述条件不能满足时可采用第二种等值标准误差的方法 即d e l t a 法( 基于t a y l o r 展丌式) ,它是用数学方法推导各种统计量的标准 误差的方法,在此用来估计等值怀准误差。 虽然影响等值标准误差人小的主要因素是样本容量,并随样本容量i :j 增大而减小的,但对标准误差的估计却必须根据具体的等值方法而进r 一般说来,影响等值标准误差实际估计值大小的因素还有数据的采集万法、 相等采用的定义、估计等值的计算方法、受试者的能力分布等等。 在等值中控制随机误差的首选方法当然是增大样本容量,但是增大样 本容量需要增加人财物的投入。在样本容量不变的条件下控制随机误差, 可采用样本数据平滑技术,通过平滑样本数据,改善两极端数据稀疏状况, 从而降低抽样误差,有事实证明应用平滑技术处理数据,能使所估等值关 系的精度明显提高,但等值中引进平滑技术在减少随机误差的同时会引进 系统误差,而且是平滑哇 j 线的次数越高,系统误差越大 3 0 , 3 1 。为此,应1 亥 通过拟合检验来选择平滑曲线,选用样本数据的所有同效果拟合曲线中玖 扬州大学硕士学位论文 数最低的鄢一条作为实际使用的平滑曲线,以达到统筹控制随机误差与系 统误差的目的1 3 “。 另外要控制误差,些评估标准和程序被推荐 3 3 3 4 35 ,如w e a k e q u i t y ( y e n ,1 9 8 3 ) 、s t a n d a r de r r o r ( a n g o f f , 1 9 8 4 ) 、s t a n d a r d i z e d d i f f e r e n c e s c o r e ( w r i g h t ,1 9 6 8 ) 、c r o s s - v a l i d a t i o n ( k o l e n ,1 9 8 1 ) 。不幸的是,据一细致的 研究( h a r r i sc r o u s e ,1 9 9 3 ) 表明,这些标准与程序中没有一个适用于所有等值 情况 3 6 jo k o l e na n db r e n n a n 2 叫在1 9 9 5 年曾提供过一个详致的有关等值条件 特点和相关评价计划与方法的描述,并指出了增大样本量并用正确的数据 采集设计在降低随机误差的有用性。 3 测验等值与体育测量评价 在休育领域中,1 9 9 8 年w e i m o ,z h u 将测验等值介绍到体育测量与评价中 来,并用于实际研究中 3 6 1 。例如:1 ) 对3 4 4 8 名韩国青少年6 18 岁) 进行 三种形式的仰卧起坐测验,采用单组设计平滑百分比等值法建立了三种仰卧起 坐测验问的等价关系式,使得采用不同成套测验中不同形式仰卧起坐的受试者 成绩可以直接进行比较。2 ) 为便于国际间儿童耐力素质的比较,对1 m i l e 跑 f 美国) 与1 2 0 0 m 跑( 韩国) 成绩建立了等值关系式,丰富了跨文化研究的 内容。 目前测量人的功能状况已有多于7 5 种测验方式,但各自的题量、项目难 度、量表等不尽相同,直接地相互比较不太可能。m c h o r n e yc a 3 7 1 用共同题 设计i r t 等值法,将一系列日常活动等值到同一量表上,使得能更好地理解 特定范围内项目的结构和顺序,以及项目间的内在相关性。 在国内,对等值技术在体育领域中的应用却少有报导。在体育测量与评价 领域中,虽已认识到在同一量表上对分数进行评价的重要性,如在比较不周测 验内容的分数时就运用标准分( z 分、丁分等) 来对成绩进行评价,这在大多数 教材中均有介绍,但有关测量同- - i 1 7 ;的1 i 同测验形式分数间比较的测验等值 内容却往往被忽略,少有介绍,这可能是出于体育测验本身的特点和对等值知 识的缺乏所引起的。 刘瑜:对上肢力量类测验项目等值的实证研究 在体育领域中t 尤其是对运动技能测试而言,测验内容与形式大多数都为 受试者所知,在测验前经常要进行练习,因此测验也就无所谓保密性而者。舄 外,些测验项目,其结果仅是由简单的而非多种复杂反应结果所组成,这使 得发展另外的测验形式来测量同 能力显得并不寸。分迫切、重要。但这些并不 意味着在体育领域中就不需要测验等值。 首先,在体育领域中,即使是一个简单的测试能覆盖整个所要测验的受试 者能力域,但这并不能保证测验的难度对不同能力水平的受试者来说都是最合 适的,这就导致测验对受试者来说出现偏难或偏易的情况,降低了测验成绩反 映受试者能力的准确性,干扰了对受试能力的评价。 其次,在多种测验形式被用来测验同一能力时,出于各测验分数是设定在 各自不同的量表上的,而在比较叫刨很少将这些分数转换到同一量表上,缩粜 这些分数间的关系或被任意确定,或者否定在它们之恻进行转换比较的【j j 能、 性。例如,在国家体育锻炼标准中,对男子上肢力量和耐力的测试中,包 括了引体向上、屈臂悬垂、双杠屈臂三种测验形式。由于这些项目在难度t 并 不一样,在计分方法上也有区别( 计次数或时间) ,这些测试的分数就不能直 接进行比较,而一系列各自的常模评分标准已被给出,但这些标准之间是否“等 价”,是否符合等值可比的要求,很值得探讨。若评分标准不恰当,就会使受 试者能力的解释在不同测验形式之间将不一致,不具有较好的可比性,为此需 要按测验等值的要求和步骤将它们等值到同一量表上去,并制定合理的评分标 准。 其三,在测量与评价的实践中 能力或特质的变化与发展,这样 常用多种测验形式来研究不同能力水平上 测验的难度会被有目的地设计成不相同, 如在测量不同年级的学生运动能力的变化情况时,人们就会有意识地发展一些 针对不同年级的不同测验形式,然而仅单改变测验的难度还不能保证所测得的 是能力变化情况,而是要求将不同年级水平的测验结果设置在同一量表上,这 也就需要测验等值技术的协助处理此类问题。 另外,在跨文化研究中,如进行国家或地区间青少年体质的比较时,测验 扬州大学硕十学位论文 内容和所用量表都应是一样的,但后者往往由于多种原因( 如度量衡制不同等) 较难以满足,如前述进行美韩儿童耐力素质比较时,由于分数( 即时问) 是住 不同量度的测验形式中得出的,它们之间也就不能直接进行比较,而需要将一 量表中分数等值到另一量表中去,以便进行比较研究。 4 研究背景 国家体育锻炼标准是大学生体育合格标准的重要组成部分,也是 衡量大学生在校期间身体素质的熏要标准。国家体育锻炼标准的等级是以 五类项目( 速度类、耐力类、弹跳类、投掷类和力量类) 综合起来进行评定, 即每个受试者从每类项目中任选一个项目参加测验,根据五个项目总分的多少 评定达到标准的等级。 3 8 , 3 9 , 4 0 1 国家体育锻炼标准是原国家体委于1 9 9 0 年1 月6 日开始发布实施的, 距今已有十年,有关其评分标准的合理性争论较 4 1 4 2 , 4 3 , 4 4 , 1 。例如朱雅敏【4 1 1 通过数年对女生跳高、跳远和立定跳远成绩的随机抽样,发现同属跳类项目的 立定跳远的与跳高、跳远的评分标准之间存在着极显著的差异。又如黄永良 4 2 1 对大学男生速度类评分表研究指出,1 9 9 0 年版5 0 m 、1 0 0 m 评分表已不适应目 前大学男生速度素质的整体发展水平,并提出了一些修改建议。再如马晓 4 3 通过研究表明国家体育锻炼标准中的同一类素质中可任选的两个测试项目 的评价标准不等价;同类素质中男女性别不同的具有代表性的测试项目,难易 程度相差太大:部分素质测试项目达标成绩呈i f 态分布,而评分结果则是呈p 重偏态。 出于众多原因,实践中对同一身体素质类的测试常采用不同的测试项目, 然而很少有人致力于这些测试项目的等值研究,这就往往使得不同测试项目的 结果不能互相进行比较,这是由于它们是设定在各自不同的量表上的。这样对 于同一素质类测试采用不同测试形式的受试者来说,即使能力相同,电会因为 评分标准间没能较好地用等值技术建立起等值关系式而可能得分差异较大,而 等值技术的运用将提高和改善对测验分数解释的完整性、可转换性和连续性。 同类素质不同测验项目间的等值可为编制稳定的常模创造条件,为进一步 刘瑜:对上肢力量类洲验项旦等值实证研究 拓宽分数的解释与应用范周提供方便,还可为教育部门提供学生水平的真实信 息,也为运动员选材提供准确的依据。为此,实验研究将采用等值技术建立三 种常用的上肢力量与剥力测验形式:引体向e 、屈臂悬垂、双杠屈臂的等值关 系式,并对几种1 i 同的减少等值随机误差的方法进行比较,以及对相应的评分 标准的合璀性进行探讨。 参考文献: 1 s t a p l e sj a n eg ,l u z z o ,d a r r e l la n t h o n ym e a s u r e m e n tc o m p a r a b i l i t yo fp a p e r - a n d p e n c i la n d m u l t i m e d i av o c a t i o n a lb s s e s s m e n ta c t r e s e a r c hr e p o r ts e r i e s 】9 9 9 ( 】) 1 2 谢小庆关亍h s k 等值的试验研究世界汉语教学,1 9 9 8 ( 3 ) :8 8 3 蔡建民高中会考等值标准分及其应用第五届全国教育考试科磅讨论会论文集,高譬毂 育出版社,1 9 9 7 4 孙玉荣英语水平考试客观性试题的等值方法中国考试1 9 9 7 5 5 3k o l e nm j ,h a r r i sd j c o m p a r i s o no fi t e mp r e e q u a t i n ga n dr a n d o mg r o u p se q u a t i n gu s i n gi r t a n de q u i p e r c e n t i l em e t h o d j e m ,1 9 9 0 ,2 7 ( 1 ) :2 7 2 9 f 6 jl i v i n g s t o nsae l a lw h a tc o m b i n a t i o no fs a m p l i n ga n de q u a t i n gm e t h o d sw o r k sb e s t a p p l i e dm e a s u r e m e n ti ne d u c a t i o n ,1 9 9 0 ,3 d ) 。7 3 9 5 1 陈希镇关于测验等值儿个问题的研宄应俐概率统计,2 0 0 0 ,l6 f :l :2 l3 - 2 1 9 【9 z e n gl ,k o l e nm j , e ta lr a n d o m g r o u p se q u a t i n gp r o g r a m ( r a g e v e r s i o n20 ) i o w ac i bl a : a m e ti c o nc o l l e g e t e s t i n g ( 1 0 】许祖慰项目反应理论及其在测验中的应用上海:华尔师范大学出版社,】9 9 2 c o o kll ,p e t e r s o nnsp r o b l e mr e l a t e dt ot h eu s eo fc o n v e n t i o n a la n di t e mr e s p o n s et h e o r v e q u a t i n gm e t h o d si nl e s st h a no p t i m a lc i r c u m s l a n c ea p m ,1 9 8 7 ,! ) ( 3 ) :2 2 5 2 4 4 u 2 1 国家教委考试管理中心统计处,在我国离教英语考试中应用i r t b c t t 分数等值的比较 研究中国考试,1 9 9 2 ( 3 ) :3 0 - - 3 3 】3 h a r r i sdj ,h o o v e rhda na p p l i c a t i o no f t h et h r e e - p a r a m e t e ri r t m o d e lt ov e r c i c a le q u m i n g a p m 1 9 8 7 ,11 ( 2 ) ,15 1 - 15 9 1 4 1s k a g g sg ,l i s s i t zrv ni r tl e s te q u a t i n g :r e l e v a n ti s s u e sa n dar e v i e w 。fr e c e n tr e s e a r c h 12 扬州大学硕士学位论文 r e v i e wo fe d u c a t i o n a lr e s e a r c h ,1 9 8 6 ,5 6 :4 9 5 5 2 9 15 l e eg u e m i n ,k o l e n ,m i c h a e lj ,e t d i c h o t o m o u sa n dp o l y t o m o u si r tm o d e l s a s s o c i a t i o n ,a p r i l ,i9 9 8 a 1 e q u a t i n g t e s tf o r m sc o m p o s e do ft e s t l e t s u s i n g a n n u a lm e e t i n go ft h ea m e r i c a ne d u c a t i o n a lr e s e a r c h 【16 b o l td me v a l u a t i n gt h ee f f e c t so fm u 曲n e n s i o n a i i t yo ni r tt r u e s c o r ee q u a t i n g a p p l i e d m e a s u r e m e n ti ne d u c a t i o n 1 9 9 9 ,v 1 2 ,n 4 :3 8 3 4 0 7 1 7 1h u ) r n hh ,f e r r a r as ac o m p a r i s o no fe q u a l p e r c e n t i l e a n d p a r t i a l c r e d i t e q u a t i n g f o r p e r f o r m a n c e b a s e da s s e s s m e n tc o m p o s e do f f r e e r e s p o n s ei t e mj e m ,1 9 9 4 ,3 1 ( 2 ) :1 2 5 1 4 1 i8 h a r tt k o l e nm ac o m p a r i s o na m o n gi r tt r u e - a n do b s e r v e d s c o r ee q u a t i n ga n dt r a d i t i o n a l e q u i p e r e e n f i l ee q u a t i n g a p p l i e dm e a s u r e m e n ti ne d u c a t i o n ,1 9 9 7 ,l o ( 2 ) :1 0 5 1 2 1 19 l iy n a nh a ne v a l u a t i o n o fm u l t i d i m e n s i o n a li r t e q u a t i n g m e t h o d sb y a s s e s s i n g t h e a c c u r a c yo ft r a n s f o r m i n gp a r a m e t e r so n t oat a r g e tt e s tm e t r i cv o l u m e5 8 1i ao fd i s s e r t a t i o n a b s t r a c t si n t e r n a t i o n a k 4 2 4 6 1 2 0 k o l e nmj ,b r e n n a nrl t e s te q u a t i n g ,n e wy o r k :s p r i n g e r - v e r l a g ,19 9 5 ,10 5 2 0 9 2 1 h a m b l e t o nrki t e mr e s p o n s et h e o r y , b o s t o n :k l u w e rn i j h o f f p u b l i s h i n g 1 9 8 5 :2 0 7 2 2 漆书青戴海崎项目反应理论及其应, = l j 研究南吕:江吐高校出版什,1 9 9 2 :2 2 9 2 3 5 2 3 b a k e rfb a i iaac o m p a r i s o no ft w op r o c e d u r e st o rc o m p u t e r r te q u a t i n gc o e f f i c i e n t s j e m 1 9 9 1 28 f 2 ) :1 4 7 1 6 2 2 4 2 5 】 e m 谢小庆,对1 5 种测验等值方法的比较研究,心理学报,2 0 0 0 ,3 2 ( 2 ) :2 t 7 2 2 3 p a r s h a l lcg ,e t a 1 e q u a t i n ge r r o r a n ds t a t i s t i c a lb i a si ns m a l l s a m p l e l i n e a r e q u a t i n g , 1 9 9 5 3 2 2 6 1 罗照盛经典测量理论等值的误差研究心理科学,2 0 0 0 ,2 3 ( 4 ) :5 0 2 7 s u a n t h o n g ,s u r i n t o m a ni n v e s t i g a t i o no ff a c t o r sa f f e c t i n gt e s te q u a t i n gi nl a t e n tt r a i tt h e o r y v o l u m e5 9 0 7 - ao f d i s s e r t a t i o na b s t r a c t si n t e r n a t i o n a l :2 4 6 5 2 8 1y a n gw e n l i n g t h ee f f e c t so fc o n t e n tm i xa n de q u a t i n gm e t h o do nt h e a c c u r a c y o ft e s t e q u a t i n gu s i n ga n c h o r i t e md e s i g n a n n u a l m e e t i n g o ft h ea m e r i c a ne d u c a t i o n a lr e s e a l c h a s s o c i a t i o n 、19 9 7 刘瑜:对上肢力量类测验项目等值的实证研究 f 2 9 w i l e y ,a n d r e wa ni n v e s t i g a t i o ni n t ot w om o d e l sf o re q u a t i n ge x a m i n a t i o n sw i t hm u l t i p l ei t e m f o r m a t sd i s s e r t a t i o na b s t r a c t s i n t e r n a t i o n a l :s e c t i o nbt h e s c i e n c e e n g i n e e r i n g 、 19 9 9 ,o c t ,v 6 0 ( 4 一b ) :i910 , 3 0 戴海崎等值误差理论与我国高考等值的误差控制江西师范大学学报( 哲社版) ,1 9 9 9 , 3 2 ( 2 ) :2 9 3 4 【3 1 漆书青,戴海崎等现代教育与心理测量学原理南昌:江西教育出版社,1 9 9 8 【3 2 l i v i n g s t o nsa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年电力安全常识知识测试题及答案
- 2025年事业单位招聘考试化工类专业能力测试试卷答案与解析
- 多语言布局优化方法-洞察与解读
- 2025年事业单位招聘考试综合类无领导小组讨论面试真题模拟试卷答案详解
- 2025年事业单位招聘考试新闻类综合专业能力测试试卷真题模拟训练
- 2025年青海省事业单位招聘考试综合类公共基础知识真题模拟试卷
- 项目预算编制及成本管控工具包
- 恒大足校考试题目及答案
- 网上教学安全知识培训课件
- 2025国考大庆市行政执法岗位申论题库含答案
- (2025)营养指导员考试真题库(含答案)
- 2025年全国成人高等学校招生考试(高等数学二-专升本)历年参考题库含答案详解(5套)
- 消化内科临床科室发展规划与实施方案
- Revit参数化族课件
- 民间借贷法律知识讲座
- 学堂在线 现代生活美学-插花之道 章节测试答案
- 供货周期保证措施
- 基于人工智能的个性化学习路径研究
- 麻醉气道痉挛处理
- 学前卫生考试试题及答案
- 2025春季学期国开电大专科《液压与气压传动》一平台在线形考(形考任务+实验报告)试题及答案
评论
0/150
提交评论