(基础心理学专业论文)3~4年级语文基本技能测验的编制.pdf_第1页
(基础心理学专业论文)3~4年级语文基本技能测验的编制.pdf_第2页
(基础心理学专业论文)3~4年级语文基本技能测验的编制.pdf_第3页
(基础心理学专业论文)3~4年级语文基本技能测验的编制.pdf_第4页
(基础心理学专业论文)3~4年级语文基本技能测验的编制.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(基础心理学专业论文)3~4年级语文基本技能测验的编制.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 目的:初编3 4 年级语文基本技能测验,对测验条目进行项 目分析,并对测验的信、效度进行初步检验,旨在为小学语文技 能评价、临床诊断治疗提供测评工具,为课程改孳提供评估方法。 方法:本研究在课程改革的背景下,以晶体智力理论为基本 理论框架,采用理论与经验相结合的方法、课程取向和广泛取向 并重的策略,初步编制了3 4 年级语文基本技能测验,测验内容 兼跨3 、4 二个年级,由拼音、汉字、词语、句子、短文和书面表 达6 个分测验构成。通过初步试测和预测筛选,汇成测验内容、 难度基本平行的a 、b 正式实测题本。我们抽取株洲地区城市和农 村两种类型的学校( 共8 所) 进行了实测,共获得项目分析有效 样本13 7 0 例,其中a 卷6 7 8 份,b 卷6 9 2 份,获重测信度有效样本 a 卷3 9 例,b 卷3 8 例,获复本信度有效样本1 1 9 例,获重测复本信度有 效样本7 6 例,另获效标样本a 卷8 6 例,b 卷9 2 例。采用各种测量学 指标对测验进行项目分析和信效度的检验。并用多层线性分析考 察班级层变量对学生层变量和语文基本技能测验关系的影响。 结果:样本特征统计分析表明各题本、年级和性别样本容量 均无显著差异。测验的原始分随年级呈递增趋势,符合年级特征。 项目分析表明各分测验的平均难度为0 5 3 o 8 2 ,平均5 8 7 的 项目难度为0 2 0 0 8 0 。a 、b 题本鉴别力指数达到优良水平的条 目( d o 3 0 ) 分别为7 6 19 和61 91 ,符合可接受水平以上的 条目( d o 2 0 ) 分别为9 0 4 8 和8 8 8 9 。信度分析结果:a 、b 题本重测信度分别为0 8 8 和0 8 6 ,复本信度为0 81 ,重测复本信 度为o 7 6 ,a 、b 题本口系数分别为o 9 2 和o 9 0 ,说明测验具有 良好的可靠性。采用专家判断法和复本法对内容效度进行评定, 表明本测验的内容效度较高;结构效度分析表明不同类型学校、 不同年级之间均存在统计显著差异,在部分测验中存在性别差异 的现象,探索性因素分析表明本测验可以分为结构相同的四个因 素,分别是:拼音技能、字词运用技能、阅读技能和书面表达技 能;本测验的得分与学生语文成绩以及语文能力倾向测验成绩呈 显著的正相关。教师教学水平对学生的语文基本技能平均成绩影 响非常显著,且对学生的学习素质变量与语文基本技能成绩的关 系影响非常显著。 结论:本测验难度中等偏易,鉴别力优良;本测验的各项信 度指标基本上达到了成就测验的测量学基本要求;测验的内容效 度和结构效度较好,同时具有良好的同时效度和预测效度;a 、b 题本基本平行。在解释学生语文基本技能成绩的变异时,引入班 级变量是必要的。 关键词:语文基本技能项目分析信度效度 l i a b s t r a c t o b j e c t i v e :t h ec h i n e s eb a s i cs l ( i l lt e s t ( c b s t ) o ft h e3 4 ( 溉d e sw a s p r e l i i n i n 撕l yd e v e l o p e d i t si t e i i l s w e r ea n a l y z e d ,a n di t sr e l i a b i l i t i e sa n d v a l i d i t i e sw e r et e s t e d t h ea i mo ft h es t u d yw a st op r o v i d ear i l e a s u r i 】舱n t i n s t m r n e n tf o rm ec l l i n e s ep e r f o m a n c eo ft h e3 4g r a d e s ,a n df o rm ec l i n i c d i a g n o s i sa i l dc u l t i c u l u mr e f 6 咖 m e t h o d s :t h ec bs t sd e v e l o p m e mi sb a s e do nt h et h e o uo fc r y s t a l l i z e d i n t e l l i g e n c e , c o u r s e o r i e n t e da n d b r o a d l y o r i e n t e ds 仃a t e g i e s , a n dt 1 1 e n l e t h o di nt h ew a yw ep a ye q u a la t t e n t i o nt oe x p e r i e n c ea n dm e o r y t h e c b s tc o n t a i n s6s u b t e s t s ,w h i c ha r es p e l l i n g ,w o r d ,p l l r a s e ,s e n t e n c e ,t e x t a n dw r i t t e ne x p r e s s i o no ft h e3 4g r a d e s t h r o u g ht e s t i n ga n de l e c t i n gt h e i t e m s ,w e v ef b m e dc b s t - aa n dc b s t - bw h i c ha r eb e l i e v e de q u a l f o r m a l s a i n p l ec o n s i s t so f1 3 7 0s t u d e n t s ( 6 7 8i nc b s t - aa n d6 9 2i nc b s t - b ) i n a d d i t i o n ,7 7s u b j e c t sd i dt h es a m et e s t sa r e raw e e k ( 3 9i nc b s t - aa n d3 8i n c b s t - b ) ,1 1 9s u b j e c t sd i dt h ep a u r a l l e lt e s t st h es a i n ed a ya n d7 6s u b j e c t s d i dt h ep a r a l l e lt e s t sm eo m e rd a y w ec o l l e c t e d17 8s u b j e c t s a c a d e i i l i c p e r f o r m a n c e s 1 l l ec b s t si t e i i l s ,r e l i a b i l i t i e sa n dv a l i d i t i e sw e r et e s t e d b y t h ed i f f 色r e n tm e a s u i 。e m e n tm e t h o d s ,a n dm er e l a t i o n s h i pb e t w e e ns t u d e n t s v a r i a t i o na i l dc h i n e s eb a s i cs b l l sa c h i e v e i i l e n tw a sm e a s u r e db yt h es o f t w a r e h l ma sw e l l r e s u l t s :t h es t a t i s t i c a l a n a l y s i so fm es a m p l ei n d i c a t e s i l o s i g n i f i c a n t d i f ! f e r e n c ea b o u tt h eq u a n t i t yo ft h ev a r i a n te d i t i o n s ,g r a d e sa n dg e n d e r s t i l e :lh i g h e rg r a d ei s ,t h eh i g h e rr a ws c o r eo ft h ec b s ti s t h ei t e md i f f i c u l t yo f 5 8 7 r a n g e s 仔o mo 2 0t oo 8 0a n dt h a to ft h es u b t e s t sr a n g e s 行o mo 5 3t o i i i o 8 2 t h ei t e md i s c r i i i l i n a t i o n so f7 6 1 9 a n d6 1 9 1 a r eb e t t e ra b o v e o 3 0i nc b s t aa n dc b s l - b c o r r e s p o n d i n g l y , a n d9 0 4 8 a n d 。 8 8 8 9 a r ea b o v eo 2 0r e s p e c t i v e l y t h er e t e s tr e l i a b i l i t ya r eo 8 8a n d o 8 6o fc b s t aa n dc b s t b t h ep a r a l l e lr e l i a b i l i t yi so 9 0 t h e r e t e s t p a r a u e lr e l i a b i l i t yi so 7 6 a n dt h ec r o n b a c h s 口c o e f f i c i e n t s a r eo 9 2a n do 9 0o fc b s t - aa n dc b s t - bc o r r e s p o n d i n g l y t h er e s u l t s h o w st h a tt h ec o n t e n tv a l i d i t yw h i c hi sw e i g h t e db ye x p e r tj u d g m e n t a n dp a r a l l e l i s mi s r e l a t i v e l yh i g h t h es c o r e so ft h ec b s ta r e s i g n i f i c a n t l y d i f f e r e n ti nv a r i o u s s c h 0 0 1 sa n d g r a d e s ,p a r t i a l l y c o m p l e t ew i t hs e xd i f f e r e n t i a t i o n i nt h ec b s t a a n dt h ec b s t b ,w e e x t r a c t4 f a c t o r sb ye x p l o r a t o r yf a c t o ra n a l y s i s t h e ya r es k i l l so f s p e l l i n g ,d i c t i o n ,r e a d i n g ,a n de x p r e s s i o n t h es c o r e so ft h ec b s ti s s i g n i f i c a n t l yp o s i t i v ec o r r e l a t i v ew i t ht h ea c a d e i i l i cp e i f o n n a n c e sa n d t h es c h o l a s t i cs p e e c ha p t i t u d et e s tp e r f o m l a n c e s t h e t e a c l l i n gl e v e lh a s 1 铲e a ti n n u e n c eo ns t u d e m s a v e r a g ea c h i e v e r n e n to fc b j n e s eb a s i cs l ( i l l s ,a s w e ua so nt h er e l a t i o n s l l i pb e t w e e ns t u d e n t ss t u d yq u a l i t yv a r i a t i o na n d c h i n e s eb a s i cs 虹u sa c h i e v e i n e n t c o n c l 哪i o n :1 1 1 ec b s t sd i m c u l t i e sa r ea p p r o 皿a t ea n dd i s c m i ! i n a t i o n sa r e g o o d as e r i e so fr e l i a b i l i t i e sa n dv a l i d i t i e sc o n f o 加舱dt ot l l em e a s u r e i n e n t s t a i l d a r d s t h ec b s t - aa n dt h ec b s t - bi s p a r a l l e lo nm ew h o l e n s n e c e s s a 巧o fb r i n g i n gf b r 吐lc l a s sv a r i a t i o nw h e n w ee x p l a j nt l l ev a r i a t i o no f t h ec h i i l e s eb a s i cs l 【i 1 1t e s t k e yw b r d s :c h i i l e s eb a s i cs l 【i u ,t h ea n a l y s i so fm ei t e i i l s , r e l i a b i l i t y 、i d i t y i v 3 4 年级语文基本技能测验的编制 1 绪论 1 1 问题提出 成就测验( a c h i e v e i n e n tt e s t ) 国内也称作学绩测验,其主要用于测量 个人( 或团体) 经过某种正式教育或训练之后对知识和技能掌握的程度。 它被广泛运用于各级各类学校教学与评价工作中,通过成就测验,学校 可以了解教师的教学效果和学生对知识和技能的掌握情况,因此,成就 测验是一种重要的测评工具。 目前,许多国家都运用全国性的学生成就测验来评价课程实施的效 果,其趋势之一就是发展不同学龄段的定期性国家级和地区性评估方案。 而自中共中央国务院关于深化教育改革全面推进素质教育的决定( 中 发 1 9 9 9 9 号) 发布后,我国也进入了新一轮基础教育改革时期。小学 学业成就的评价,是基础教育教学过程中不可缺少的重要组成部分,也是 基础教育考试改革的重心。2 0 0 1 年6 月7 日,国家教育部颁布了基础 教育课程改革纲要( 试行) ,要求改变以往考试过分强调甄别与选拔的功 能,发挥考试评价作用,促进学生发展。2 0 0 2 年1 2 月2 7 日教育部制定 了关于积极推进中小学评价与考试制度改革的通知,提出了对学生评 价的内容应包括基础性发展目标和学科学习目标两个方面,对学科学习的 评价主要依据各学科的课程标准。在教育部政策的指导下,目前学科学 习评价改革初见成效,但仍存在一些问题: ( 1 ) 在基础教育改革之下,全国统一课程标准,取消统一教材,国 家、地方、学校三种课程同时并存,这样全国各地的教学、教材情况很难 进行比较和衡量,使教学评估陷入窘境。我国现行的有一定影响的九年义 务教育小学语文教材有1 9 种,其中包括人民教育出版社、北京师范大学 出版社、江苏教育出版社出版的三套小学语文义务教育课程标准实验教 材。因此,各个地方各个学校所使用的教材不同,比如我们经过调查发现 郑日昌心理测量长沙:湖南教育出版社,l9 8 7 :2 6 高民,周卫亚太地区中小学课程发展的现状及趋势教育研究,1 9 9 7 ,( 7 ) :6 6 中华人民共和国教育部基础教育课程改革纲要( 试行) 中国教育报,2 0 0 1 7 2 7 第2 版 中华人民共和国教育部关于积极推进中小学评价与考试制度改革的通知2 0 0 2 1 2 2 7 l 硕士学位论文 长沙市各区大多使用北师大版和人教版的实验教材,而湖南其它许多市、 县仍使用人教版2 0 0 1 年经全国中小学教材审定委员会审查通过的教材。 如何对采用不同教材的学生进行教学效果、教学质量的科学、客观、公平 的评价,是目前急待研究和解决的重要问题。 ( 2 ) 我国当前基础教育中缺乏广泛适用的以课程标准为依据的测验。 小学大多数现行考试多为教师自编课堂测验和各地区教研室编制的统一 测验。命题者大多仍以教材为中心或依据个人的经验进行命题,而不是真 正意义上的以课程标准为中心的命题方式;而试题的知识面是否合乎课程 标准、能否测出学生的真实水平与命题教师的经验相关;并且大多试题编 制没有依据测验学的理论与技术,缺乏信效度信息,测验质量很难得到保 证。此外,对测验结果的解释,方法比较单一,只重视绝对分数的意义, 而没有对学生在学科内容的优势和劣势作进一步的分析,更没有考虑班级 等因素对测验的影响,从而无法对教师的教学和学生的学习提供相关的信 息和建议,以致削弱了语文测评的作用,因而难以做出极为科学的评价。 ( 3 ) 传统线性模型的缺陷。在学校教育研究中,很多问题都体现为 多水平、多层的数据结构。即学生镶嵌于班级,而班级又镶嵌于学校,或 者可以简单地把学生看成是镶嵌于学校。在此,学生代表了数据结构的第 一层,而班级或学校则代表了数据结构的第二层或第三层。传统的线性模 型,比如a n o v a 或回归分析,只能对涉及某一层数据的问题进行分析, 而不能将涉及两层或多层数据的问题进行综合分析。在教育研究中,更为 重要和令人感兴趣的正是关于学生层的变量与班级或学校层变量之间的 交互作用问题,这就必须借助多层线性模型来解决。其次,传统线性模 型的基本假设是线性、正态、方差齐性及独立,后两项假设在镶嵌型的取 样中往往不能成立,同组内的个体比不同组的个体之间更加接近或相似。 因此,传统线性模型的应用很有限。此外,多层线性模型的统计估计和验 证方法较之传统线性模型更为稳定。大多数线性分析( 比如a n o v a 或回 归分析) 依靠的是普通最小二乘法估计( o l s ) ,多层线性模型所使用的 是收缩估计,即使在样本规模不相等时( 比如,不同的班级有不同数量的 学生) ,也可以对方差和协方差成分进行估计。 语文是重要的交际工具,是人类文化的重要组成部分。语文学科是一 张雷,雷雳,郭伯良多层线性模型应用北京:教育科学出版社,2 0 0 3 :2 2 3 4 年级语文基本技能测验的编制 门基础学科,对于学生学好其他学科、今后工作和继续学习,对于弘扬民 族优秀文化和吸收人类的进步文化,提高国民素质,都具有重要意义。 各个地方各个学校所用教材不同,各地又缺乏统一标准化的测验进行教学 评价,因此帮助学校和教师了解学生是否达到预期的教学要求,及时了解 学生对语文知识和技能的掌握情况,促进小学语文考试的改革是很有必要 的。人类学习语言的进程,是先口头语言后书面语言。儿童在小学一年级 书面叙述与口头叙述的词量比例是2 0 :4 0 ;二年级是4 2 :4 6 ;三年级时 则基本持平为7 3 :7 5 ;至四年级时书面语言开始占优势,其比值为1 0 6 : 7 6 。三、四年级作为九年义务教育的第二学段,它是学生在小学阶段语 言发展的重要时期。有研究表明:三年级是小学语言发展的低潮期,而四 年级是语言发展的敏感期 。国内外许多阅读测验等一般也选择以三年级 为起点建立。因此,本研究考虑到学龄儿童语言发展的规律和当前语文教 学及评价的实际情况,在借鉴国内外基础教育考试经验的基础上,以全 日制义务教育语文课程标准( 实验稿) 为依据编制3 。4 年级语文基本技 能测验( 纸笔测验) ,旨在为小学语文基本技能的评价提供一辅助量表。 1 2 文献综述 1 2 1 成就及成就测验研究回顾 1 2 1 1 成就及成就测验 成就可概括为经过一定的学习和训练所获得的知识和技能,它是在一 个比较明确的、相对限定的范围内的学习效果。成就测验是对个体在经 过一定阶段的学习或训练之后所习得的知识、技能学习效果的测量。而 标准化成就测验是从事教育测量的专业人员根据心理测量学的原理所编 制的一种代表学科内容的、经过标准化的成就测验,它主要用于测量个体 对学科知识的掌握程度。 中华人民共和国教育部编全日制义务教育语文课程标准( 实验稿) 北京:北京师范大学 出版社,2 0 0 2 :1 。黄仁发,中国儿童青少年语言发展与教育( 二) 中国儿童青少年心理发展与教育中国卓 越出版公司,1 9 9 0 :1 2 8 。同。:2 2 6 马惠霞,龚耀先成就测验及其应用中国心理卫生杂志,2 0 0 3 ,( 1 ) :6 0 顾海根学校心理测量学南宁:广西教育出版社,1 9 9 7 :1 2 l 回龚耀先心理评估北京:高等教育出版社,2 0 0 3 :1 7 4 1 7 5 3 硕士学位论文 1 2 1 2 成就测验与语文成就测验 按照不同的标准,成就测验有不同的划分。成就测验按其内容可分为 二大类:一是成套成就测验或综合成就测验,一般用于教育调查,对学生各 学科知识和技能的“学习程度”的测量,如c a l i f o r n i a 成就测验。二是单 科成就测验,主要用于评定被试在某一领域成就的高低。单科成就测验按 其用途又可分为调查性测验、诊断性测验和准备性测验,语文调查性测验 主要用于对学生语文学习结果的评定,通常在学期期末进行测试,主要有 n e l s o n d e n n y 阅读测验;语言诊断性测验主要用来测查个人在语文学习 某一领域的优缺点,分析其学习困难所在,以作改进之用,如s t a n f o r d 阅读诊断测验;语文准备性测验与诊断性测验有一定的相似,但这类测验 更重视被试的准备性,通常在入学时进行测试。 成就测验按施测人数又可分为团体成就测验、个人成就测验和可团体 可个别施测的形式特异的成就测验。如m e t r o p 0 1 i t a n 成就测验等属于团 体成就测验;p e a b o d y 个人成就测验、w o o d c o c k j o h n s o n 心理教育成套测 验等属于个人成就测验;而n e l s o n d e n n y 阅读测验等属于第三种形式的 测验。 成就测验还可根据被试反应的行为方式分为口试、笔试和实验操作 三种。如p e a b o d y 个人成就测验、j a s t a k 的广泛成就测验, w o o d c o c k j o h n s o n 心理教育成套测验心理教育成套测验等都属于笔试性 质的成就测验;口试成就测验主要有a m a p 语言艺术操作测验、美国心理 公司出版的i a s 一语言艺术操作测验( 英语) ;而操作成就测验主要包括 与c t b 操作测验和美国心理公司出版的i a s 一数学操作测验等。 此外,按照测验编制的标准化程度,可分为非标准化、准标准化和标 准化测验三种;根据解释分数的方法不同,又可分为标准参照测验( c r t s ) 和常模参照测验( n r t s ) ; 1 2 1 3 语文成就测验的国外研究进展 基本技能测验最初源于西方。2 0 世纪2 0 年代,测量基本技能( 如算 术、拼写和书法) 的单一标准化测验最先出版发行,随后出版发行的是成 套成就测验:斯坦福成就测验和衣阿华中学测验。二战后,作为一种科 。l e w isr a i k e n 著,张厚粲译心理测验与考试:能力和行为表现的测量北京:中国轻工业 出版社,2 0 0 2 :1 2 6 4 3 4 年级语文基本技能测验的编制 学、客观的评价学生学术进步的方式,标准化测验得到了传播:它已经从 单一的学科考试扩展到更广阔的领域,如人文科学和自然科学。如今, 成就测验被广泛运用于欧美各级各类学校的教学测量与评价工作中,学校 通过成就测验来测量学生对己学知识与技能的掌握情况,评价学生是否达 到课程标准要求的水平,帮助教师更好地了解每个学生的学习情况;同时 也可反映教师教学的效果,作为改进教学和教材的参考。西方国家在成 就测验的标准化编制方面成果比较多,尤其是美国。1 9 9 6 年出版的心 理测量年鉴( m e n t a lm e a s u r e i n e n t sy e a r b o o k ,t w e l f me d i t i o n ) 中列出了 4 7 7 个测验,其中有关成就测验的就有1 1 4 个,占2 5 5 。常见的成套成 就测验有:s t a n f o r d 成就测验、c a l i f o r n i a 成就测验、m e t r o p 0 1 i t a n 成就测验、w e c h s l e r 个人成就测验、广泛成就测验以及p e a b o d y 个人 成就测验。比较常见的阅读成就测验有:n e l s o n d e n n y 阅读测验、 g a t e s - m a c g i n i t i e 阅读测验、渐进阅读成就测验、阅读理解测验1 1 、多 水平m a t 6 阅读诊断测验1 2 、s t a n f o r d 阅读诊断测验1 3 和w o o d c o c k 阅读掌握 测验修订版1 4 。 1 2 1 4 语文成就测验的国内研究进展 相对于西方国家,我国成就测验的标准化研究工作做的较少。查阅 1 9 7 9 2 0 0 5 年初公开发表的国内刊物,查到有关心理与教育测量的文献 5 8 0 篇左右,据统计其内容主要集中于:测量理论( 2 6 ) 、能力( 1 4 ) 、 王玉衡美国标准化测验的问题与质疑比较教育研究,2 0 0 2 ,( 9 ) :1 8 r o b e r t ,j g p s y c h 0 1 0 9 i c a lt e s t h is t o r y ,p r i n c i p l e ,a n d a p p li c a t i o n s ( 2 加,e d ) p r e s s b ya 1 1 9 na n db a c o n ,1 9 9 6 :3 1 0 一3 1 1 哪j a n ec l o s ec o n o l e ya n dj a m e sc i m p a r a t h et w e l f t hm e n t a lm e a s u r e m e n t sy e a r b o o k t h e u n i v e r si t yo fn e b r a s k ap r e ss ,1 9 9 5 ,x ii 唧h t t p :w w w h e m w e b c o m t r o p h y e s e a s a t l 0 一f a c t s h e e t h t m w t h em c g r a w h il 1c o m p a n i e s o v e r v i e wo fc a t 6 h tt p :w w w c t b c o m 哪j a n ec l o s ec o n o l e va n dj a c kj k r a m e r t h et e n t h l e n t a lm e a s u r e m e n tsv e a r b o o k t h e u n i v e r s i t vo fn e b r a s k ap r e s s ,1 9 8 9 : 5 0 3 o h t t p :w w w p s y c h c o r p c o m a u w i a t 2 h t m l h t t p :w w w s t o e l t i n g c o c o m t e s t s c a t a l o g w r a t 3 h t m 。 哪j a c kj k r a m e ra n dj a n ec l o s ec o n o l e v t h ee l e v e n t hm e n t a lm e a s u r e m e n tsy e a r b o o k t h eu n i v e r sit yo fn e b r a s k ap r e s s ,1 9 9 2 :6 4 7 6 4 8 h t t p :b u r o s u n l e d u b u r o s j s p r e v i e w s j s p ? i t e m = 1 5 1 3 2 7 9 2 h t t p :w w w a g s n e t c o m g r o u p a s p ? n g r o u p i n f o i d 。= a 1 9 0 2 5 1 2 l e w isr a i k e n 著,张厚粲译心理测验与考试:能力和行为表现的测量北京:中国轻工业 出版社,2 0 0 2 :1 1 5 h t t p :w w w h e m w e b c o m t r o p h y r e a d t e s t s d r t 4 h t m hh tt p :w w w a g s n e t c o m g r o u p a s p ? n g r o u p i n f o i d = a 1 6 6 4 0 5 硕士学位论文 个性( 1 9 ) 、智力( 1 1 ) 、人事及职业( 1 1 ) 、临床( 1 9 ) ,其中国外量 表的修订和试用研究报告居多,而有关成就测验编制研究却只有很少的几 篇。我国台湾地区有关成就测验编制的研究遥遥领先于大陆。 1 2 1 4 1 大陆研究进展 大陆的综合成就测验主要有:北京师范大学心理系与总参政治宣传部 编制的中小学学绩水平的综合测验、2 0 0 2 年中南大学的马惠霞、龚耀先 编制的适用于7 1 2 年级的多重成就测验( 简称m a t s ) 、2 0 0 4 年中南大 学范晓玲、龚耀先初步编制出一套4 6 年级多重成就测验、2 0 0 4 年湖 南师范大学刘成伟、范晓玲初步编制了小学六年级学习困难学业成就筛查 测验。 语文基本技能测验包括单字测验、书法测验、语句测验、阅读测验、 作文测验等形式。单字测验有我国儿童心理学家陈鹤琴自编的小学默字 测验,用于测量小学3 6 年级儿童的识字能力。书法测验有郑冠平、陈 孝禅的小学3 6 年级钢笔正书书法量表,主要用于客观评价儿童的书法, 为小学写字教学提供指导 。语句测验主要有艾伟、丁祖荫合编的语顺测 验、艾伟编制的四言辞句测验和陈鹤琴所编的小学语法测验。阅读测验主 要有艾伟、王金桂合编小学默读测验和艾伟、杨清编制的小学国语默读诊 断测验。2 0 0 5 年湖南师范大学闰春平、范晓玲初步编制了7 9 年级语文 成就测验 。此外,我国每年的高考语文试题是典型的集字词、语句、阅 读、文学常识和作文等方面于一体对学生语文学习进行考查的试题,标准 化程度相对较高。 1 2 1 4 2 台湾研究进展 台湾的成就测验编制与应用都很盛行,1 9 5 0 1 9 5 5 年期间候蟠、宗亮 东编制了一些学校成就测验,1 9 6 0 年台湾省国教研习会编制了国民小学 。顾海根学校心理测量学南宁:广西教育出版社,1 9 9 7 :1 2 7 。马惠霞多重成就测验的初步编制: 博士学位论文】中南大学湘雅二院心理中心中南 大学,2 0 0 2 5 。范晓玲,龚耀先4 6 年级多重成就测验的编制中国临床心理学杂志2 0 0 5 ,( 3 ) :2 5 3 2 5 7 刘成伟小学六年级学习困难学业成就筛查测验的初步编制:【硕士学位论文】湖南师范 大学教育科学学院湖南师范大学,2 0 0 4 。郑冠平小学三至六年级钢笔正书书法量表的编制: 硕士学位论文】湖南师范大学教育科 学学院湖南师范大学,1 9 8 6 闫春平7 9 年级语文成就测验的初步编制: 硕士学位论文】湖南师范大学教育科学学 院湖南师范大学,2 0 0 5 6 3 。4 年级语文基本技能测验的编制 各科测验,1 9 7 0 年左右国立台湾师范大学教育研究所应教育部中等教育 司之约,根据1 9 6 8 年1 月台教育部公布的国民中学暂行课程标准,编制 了适用于国民中学的几套成就测验,主要有:自然科( 生物、物理、化学) 成就测验、社会科( 公民、历史、地理) 成就测验、英语成就测验、数学 成就测验、国文成就测验。 早期就语文测验而言大体有:祁致贤、林天明分别编制的注音符号诊 断测验、司琦所编的标点符号测验、中华儿童教育社编制的作文基本测验、 林天明编制的多段短文写作测验、唐守谦的作文量表、孙邦正的书法量表、 国文成就测验。1 9 8 0 年以后台湾的成就测验成果主要有:1 9 8 9 年吴裕益 等编制的国民小学高年级国语科成就测验、1 9 9 4 年由周杰台编制的国民 小学语文成就测验 、2 0 0 1 年由黄秀霜编制的中文年级认字测验、2 0 0 3 年由洪俪瑜、张郁文等编制的基本读写字综合测验 。 1 2 2 多层线性模型介绍 1 2 2 1 多层线性模型( h l m ) 2 0 世纪7 0 年代e m ( e x p e c t a t i o nm a ) 【i i l l i z a t i o n ) 算法的出现和计算 机技术的发展,带来了新一代的统计和测量理论及方法。其中一大突破 性发展就是多层线性模型( h i e r a r c l l i c a l1 i n e rm o d e l i n g ) 的理论和方法。 多层和嵌套分析的思想由来己久,但直到2 0 世纪9 0 年代才发展成一套 完整而系统的理论和方法,并逐渐推广和为研究人员所接受。甩m 在不 同的领域中有着不同的名称。在统计学上被称之为共变量成分模式 ( c o v 撕a n c ec o m p o n e n t si n o d e l s ) ;在社会学研究中,称为多阶层线性模 式( i n u l t i l e v e ll i n e rm o d e l s ) ;在生物统计学中,称之为混合效果模式 ( 血x e d e 能c t si n o d e l s ) ;在计量经济的文献中,称之为随机系数回归模 式( r a n d o mc o e f ! f i c i e n tr e g r e s s i o nn l o d e l s ) 。但综合言之,相当多的文献 使用“h i e r a r c h i c a ll i n e rm o d e l s 一词,因为此名称能正确反映所分析之 数据具有“阶层结构的特性 ,所以仍以h l m 统称之。 转引自闫春平7 9 年级语文成就测验的初步编制: 硕士学位论文】湖南师范大学教育 科学学院湖南师范大学,2 0 0 5 :1 0 h tt p :1 6 3 1 9 2 6 2 q z h s u b 3 e x m 3 1 1 h t m h t t p :t e a c h e r s d a l e n h c t c e d u t w v e r s i o n t o o ls z 10 2 h t m 蛳h t t p :w w w p s y c o m t w p s y t e s t i n t r o t e s t 8 3 0 6 0 a s p 。h t t p :w w w p s y c o m t w p s y t e s t i n t r o t e s t 8 5 0 3 0 a s p 陈正昌,程炳林,陈新丰,刘子键合著多变量分析方法统计软件应用北京:中国税务出版 社,2 0 0 5 :4 6 1 4 6 2 硕士学位论文 1 2 2 2 多层线性模型的原理及基本类型 在多层线性模型诞生之前的一段时间内,研究者通常是在个体层上 进行回归分析。他们把回归系数保存下来,并把这些统计量与在第二层 所观察到的变量混合在一起来进行另一个分析。这种两阶段的方法有时 被称做“回归的回归”( 哪s s i o no f r e g r e s s i o n ) ,这基本上就是多层线性 模型的运算原理,并且有些人也仍然喜欢把多层线性模型叫做“回归的 回归 。 多层线性模型的参数估计方法尽管与进行两次回归的方法在概念上 是相似的,但是它们的统计估计和验证方法却是不同的,并且多层线性 模型的方法更为稳定。大多数线性分析( 比如a n o v a 或回归分析) 依 靠的普通最小二乘法估计( o r d i n a 叫l e a s ts q u a r e se s t i i i l a t i o n ,o l s ) ,多层 线性模型所使用的是收缩估计( s l l r i i l l 【a g ee s t i l a t i o n ) ,它比使用o l s 进 行“回归的回归更为稳定或精确。 多层线性模型的基本类型可分为二种:( 1 ) 零模型( t h en u um o d e l ) : 当研究者只是感兴趣于把方程分解为由个体差异造成的部分和由组差异 造成的部分时,使用第一层和第二层都没有预测变量的零模型就够了, 即方差成分分析。( 2 ) 完整模型( t h ef u nm o d e l ) :当研究者对因变量的总 体变异是怎样受第一层和第二层的因素影响感兴趣时,就需要使用这种 第一层和第二层都有预测变量的完整模型。在零模型和完整模型之间, 还有一系列的模型可以用来估计不同的第一层和第二层的参数。使用者 可根据自己研究的目的和实际情况,通过往各层方程中添加不同的变量 和设定不同的随机成分和固定成分,建构各种分析模型。最常用的这类 模型有协方差模型( a n c o v am o d e l ) 和随机效应模型( r a n d o me 朊c t r e 目- e s s i o nm o d e l ) 。 1 2 2 3 多层模型的应用及意义 运用多层模型对多层结构数据进行分析的研究主要表现在五个领域 。首先,多层模型可以广泛用于组织和管理研究;第二是用于对个体进 行追踪、多次观测的发展研究中;第三种多层模型的应用可以视为第一 和第二类的综合,在教育研究中广为适用;第四,多层模型还可以用来 。张雷,雷雳,郭伯良多层线性模型应用北京:教育科学出版社,2 0 0 3 :6 7 8 3 。4 年级语文基本技能测验的编制 做文献综述,即对众多研究的成果进行定量综合;最后,利用多层模型 较为高级的统计估计方法来改善单层回归的估计和分析,回答单层数据 的问题。 多层模型的应用范围比传统线性模型的要广。因为传统线性模型的 基本假设是线性、正态、方差齐性及独立,而后两项假设在镶嵌型的取 样中往往不能成立,同组内的个体比不同组的个体之间更加接近或相似。 此外,多层线性模型的统计估计和验证方法较之传统线性模型更为稳定。 即使在样本规模不相等时( 比如,不同的班级有不同数量的学生) ,也可 以对方差和协方差成分进行估计。 香港中文大学的张雷教授运用多层模型在我国教育研究中的实例主 要有:关于教师的行为和观念对儿童在班级内交往活动的影响研究,关 于认知能力、言语记忆、言语知觉对语音意识中的略音测量结果的影响 研究。此外,北京师范大学的刘红云、孟庆茂对教师背景变量对教师教 学效果影响的研究;中南大学的蒋莉等人做过关于学生高考语文成绩影 响因素的多层线性分析。 多层分析技术系统地解决了困扰社会科学半个多世纪的生态谬误 ( e c o l o g i c a lf a u a c y ) 问题。在教育、管理、经济以及社会学、心理学等 领域的研究中,取样往往呈嵌套结构,这种嵌套型的样本用传统的o l s 回归方法分析会导致估计误差。多层分析方法不仅可以减少这种统计误 差,而且可以避免由人为选择分析单位而可能出现的错误。在多层分析 中各层样本均可作为分析单位,而且还可以研究他们之间的交互作用, 从而拓宽了各专业的研究范围,深化研究思路。 1 3 研究目的 ( 1 ) 本测验旨在测量小学三、四年级学生的语文基本技能,为教师 提供一个评价学生语文基本技能的辅助工具,帮助学生认识到自己在语文 。张雷,雷雳,郭伯良多层线性模型应用北京:教育科学出版社,2 0 0 3 :4 8 。张雷,雷雳,郭伯良多层线性模型应用北京:教育科学出版社,2 0 0 3 :9 1 。刘红云,孟庆茂教师背景变量对教师教学效果影响的多层线性分析心理发展与教育, 2 0 0 2 ,( 4 ) : 7 0 一7 5 回蒋莉,杨志明,姚树桥学生高考语文成绩影响因素的多层线性分析中国临床心理学杂 志,2 0 0 5 ,( 4 ) :4 1 4 4 1 6 o 硕士学位论文 学习过程中的长处和不足,以便更好地实施针对性的教育。 ( 2 ) 为语文课程评价提供方法。该测验按照统一的课程标准编制, 可以克服教学方法不同、课程不同与教材变迁引起的弊端,为小学语文教 学提供依据,及时调整和改善教学过程,并可用于教学实验与教学评价。 ( 3 ) 为临床诊断和治疗提供筛选工具。学习困难是学校教育中普遍 存在的现象,该语文基本技能测验可以在一定程度上筛查学生在小学语 文学习中的问题所在。 ( 4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论