教育统计与测量学原理.ppt

上传人：优*** IP属地：广东上传时间：2020-03-16 格式：PPT 页数：81 大小：2.71MB 积分：68 举报 版权申诉

已阅读5页，还剩76页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

教育统计与测量学原理 Z x x s 教育科研所张国威教育统计与测量学原理学习教育统计与教育测量的重要意义1 教育统计和测量是认识教育本质的有力武器 2 是分析处理教育工作中各种数据资料进行教育督导与评价的有效工具 3 对教育管理科学化具有重要意义 4 是教育科学研究中发现探索教育教学规律指导教育教学实践为教育行政部门决策提供依据的重要思想方法 5 是党和政府制定教育方针政策以及认清教育事业和整个国民经济发展关系的重要工具第一部分教育统计学一概述1 什么是教育统计学2 教育统计学的历史3 教育统计学的内容二描述统计1 常用的统计表图与统计量2 相关分析3 正态分布三推断统计1 相关概念2 总体平均数估计3 平均数差异的显著性检验四实验设计简介一概述教育统计学概念发展历史内容 1 概念教育统计学就是运用数理统计的原理和方法研究教育问题的一门应用科学它是研究如何收集整理分析和解释教育方面的数据从而表明教育上某些现象的特征及规律的一门科学它是处理教育实际工作和进行教育研究以及提高管理质量的科学水平提高教育质量的重要工具教育统计学的主要任务对教育现象进行调查和实验在占有充分数据资料的基础上经过对数据的整理计算统计分析和统计检验等方法对研究结果予以科学说明即从数量方面的研究来探索教育和心理现象的发展变化的特征和规律或根据研究结果的数据处理统计推断做出正确决策教育统计学概念发展历史内容 2 教育统计学发展史教育统计学产生于上个世纪初发展于五六十年代广泛应用于八十年代以后 1 国外 20世纪初统计学传入美国桑代克 E L Thorndike 为了达到极力以心理学与统计学为工具研究教育学使教育科学化的目的 1904年出版世界上第一本有关教育统计学的专著心理与社会测量导论 2 国内我国的教育统计学是在辛亥革命以后随着西方科学技术成就一起被引入当时的大学教育系和中等师范学校都把教育统计学作为必修课程很多学者撰写专著如薛鸿志教育统计方法 1925 王书林教育测验与统计 1935 等 1979年随着全国教育科学规划会议的召开教育统计学恢复了新生各师范大学又都开设了教育统计学课程教育部组织叶佩华万梅亭郝德元陈一百等教授编写教育统计学作为全国通用教材经过100多年的发展各种教育统计方法已相当丰富但每一种方法的运用在我国还处于推广和适用阶段因此不少人对它的作用缺乏足够的认识特别是对复杂的教育问题由于统计方法本身的限制还有十分重要的实验设计和统计推断的问题不能在理论上得到有力解决还有待于教育学家亲自动手来推进统计理论和改进统计工具教育统计学概念发展历史内容 3 教育统计学的内容教育统计学按应用分为描述统计推断统计实验设计多元统计三部分内容 1 描述统计的主要作用就在于就所关心的教育现象进行全面调查和观测然后将所得的大量数据加以整理简缩制成图表或就这些数据的分布特征如集中趋势离散趋势相关度等等计算出具有概括性的数字作为标志借助这些概括性的数字我们就可以从杂乱无章的数据中取得有意义的信息 2 推断统计也叫抽样统计它是在描述统计的基础上发展起来的是用抽样的方法根据部分数据来推断一般情况即通过局部对全局的情况加以推断的一种方法它可以帮我们透过现象看到本质对客观现象作出本质性的判断它是从样本的研究中得出统计量来推断总体的有关特征以便作出具体的措施和决策常用的方法有 u检验 t检验卡方检验和非参数检验还有多元分析中的主成份分析和因素分析等 3 实验设计通常指实验程序的计划和安排而实验程序的计划和安排离不开统计和检验二描述统计第一章常用统计表统计图及统计量一常用统计表1 统计表的结构由标题项目标目数据线条表注数据来源组成1983年我国普通中学教师学历统计表学历人数百分比大学本科以上30088711 6大专毕业56686321 8中专毕业以下172975066 6合计2596900100 0注引自中国教育成就统计资料 1984年人民教育出版社标题项目线条数据表注二描述统计第一章常用统计表图及统计量数 2 制表的一般要求A 统计表的内容要简要最好一个表说明一个中心内容标题的措词要简明扼要正确说明内容使人一望便知 B 分项要准确以能说明问题为主分项的好坏是决定统计表质量的关键切忌分项太细 C 数据是统计表的语言说明内容要求准确书写整齐一律用阿拉伯数字单位要统一位数对齐有效数字要一致表格内不能有空白 D 线条不要太多表的上下端有顶线与底线左右两边不要用线封死纵项目用细线格开横项目一律不画线条合计项目用粗线条或双线与其它项目分开二常用统计图 1 统计图结构图题图目图尺图例图形图注第一章常用统计表统计图及统计量 2 统计图的类型及绘制要求绘制统计图的要求A 根据数据和目的选择合适的图形B 图形所表示的面积或距离要比例适当C 表示不同的事物要用不同的颜色与线条类型 1直条图2圆形图3曲线图4直方图二常用统计图 3 次数分布表与直方图对一批数据按一定次序排列并加以分组编成反映这群数据在各组上出现次数的统计表和图就是次数分布表和直方图例一次考试之后某班48名学生的成绩如下 86 77 63 78 92 72 66 87 75 83 74 47 83 81 76 82 97 69 82 88 71 67 65 75 70 82 77 86 60 93 71 80 76 78 57 95 78 64 79 82 68 74 73 84 76 79 86 68将该组数据整理成次数分布表与直方图二常用统计图 1求全距 R max xi min xi 用该组数据最大数减最小数2定组数和组距数据划分组数每组上下限之间距离全距除以组数 3列组限从最高分至最低分以组距为单位依次分组4归组划记计算数据出现次数并计算累积次数及相对次数步骤例一次考试之后某班48名学生的成绩如下 86 77 63 78 92 72 66 87 75 83 74 47 83 81 76 82 97 69 82 88 71 67 65 75 70 82 77 86 60 93 71 80 76 78 57 95 78 64 79 82 68 74 73 84 76 79 86 68 1412108642 4550556065707580859095100 分数直方图三常用统计量集中量数 1 集中量数代表一组数据的集中趋势和典型特征常用的有平均数中数众数第一章常用统计表统计图及统计量 2 中数中位数用Md表示是在一组按大小顺序排列的数据中位置居中的那个数数据是奇数个时正好是中间位置的数即第 N 1 2个那个数数据是偶数个时求中间位置两个数的平均数如 13679Md 6 36792021Md 7 9 2 8 3 众数用M0表示是一组数据中次数出现最多的那个数在众数不明显的情况下一般可看众数段即哪个分数段的次数多就以该段中点值作众数一般用观察法求得众中平众中平平中众正态分布正偏态分布负偏态分布平均数中数众数在数据常态分布中的相对位置 2 差异量数全距平均差标准差差异量数是描述次数分布中离中趋势这一特征的统计量简称差异量一组数据若离中趋势小则集中量的代表性就大反之若离中趋势大则集中量的代表性就小但是仅考虑集中量数是不够的要了解两组学生成绩分布的全貌还必须研究两个组的差异量数最常用的差异量有全距平均差和标准差 1 全距符号为 R 指一组数据中由最大量数到最小量数的距离 R小说明离散程度小比较整齐 2 平均差指一组数据内的每个数与均数差的绝对值的算术平均数通常用AD表示平均差的计算公式为常用统计量差异量数差异量数方差与标准差 3 标准差指一组数据中每一个数值与它们的平均数之差的平方的算术平均数的平方根其符号为S 样本标准差总体标准差用表示 S的计算公式为 S越大表明离散程度越大数据不均匀集中量的代表性小方差与标准差除具有平均差的优点之外还具有受抽样影响小和适于代数运算等优点是最优良的差异量数标准差的应用变异系数标准分数标准差的应用变异系数变异系数计算公式主要用于同一团体不同观测值离散程度的比较对于水平相差较大但进行的是同一种观测的各种团体离散程度的比较例已知某小学一年级学生的平均体重为25千克标准差是3 7千克平均身高110厘米标准差为6 2厘米问体重与身高的离散程度那个大解 CV体重 3 7 25 14 8 CV身高 6 2 110 5 64 答通过比较差异系数可知体重的分散程度比身高的分散程度大 14 8 5 64 变异系数是一种相对差异量常用cv表示标准差的应用标准分标准分数又称Z分数它是一种以平均数为参照点以标准差为单位的表示一个分数在团体分数中所处位置的量数其计算方法为由原始分数与平均分数的差除以标准差所得的量数其符号为 Z 计算公式是标准分是以标准差为单位的故称为标准分它是一种相对地位分标准分有正负之分一般在 3 3 中几率为99 74 平均值为零标准分可比性根据在于标准正态分布 T分数 T 10Z 50 一般20 T 80 E分数 E 20Z 90 一般30 E 150 例有某生三次数学考试的成绩分别为70 57 45 三次考试的班平均分为70 55 42 标准差分别为8 4 5 如何看待该生的三次考试成绩答如果仅从原始分数看肯定认为第一次最好其实不然要计算出各次的标准分数才能说明问题根据公式得出 Z1 70 70 8 0Z2 57 55 4 0 5Z3 45 42 5 0 6这说明原始分数为70 其位置正在平均线上而原始分数为57的其位置在平均线上0 5处而原始分数为45的其位置在平均线上0 6处很显然第三次成绩最好第一次最差标准差的应用标准分标准分数运用标准分比较不同教育测验成绩总分的优劣更为合理例甲乙两学生五科考试成绩如下试分析哪名学生成绩好些科目XSXZ 如果按原始分数乙生总分是354分优于甲生的342分总分但按标准分数则甲生的3 24分优于乙生的3 03分标准差的应用标准分二描述统计相关分析研究两自变量之间的关系紧密程度的过程统计学上称为相关分析事物的变化总是伴随着一定的量的变化有些是单变量有些是双变量或多变量也有些是复变量集中量数和差异量数反映的是单变量数据特征相关分析主要研究双变量数据特征我们都知道事物现象间的相互关系如果从数量关系的角度考察可分为函数关系和相关关系两种类型相关关系可分为正相关负相关直线相关曲线相关完全相关函数关系高度相关低相关和零相关如教育经费的投入与教育事业发展规模和速度之间的关系是正相关复习次数与遗忘量之间的关系是负相关相关分析的方法有二一是图示法一为计算法第二章相关分析图示法将两组观测值标在坐标系中二描述统计相关系数是描述两组数据之间相关程度的量数种类有积差相关系数等级相关点二列相关和相关积差相关系数皮尔逊系数是描述来自正态总体两个连续变量之间线性相关程度的一种相关量数 r n xy x y n X2 X 2 n y2 y 2 相关系数的范围 1 r 1当r是正值时为正相关当r是负值时为负相关 r 0为零相关通常1r 0 70为高度相关 0 70r 0 40为较显著相关0 40 r0为低相关当然在下结论时还要进行显著性检验第二章相关分析对相关系数的解释注意以下问题 A在小样本中要做显著性检验 B相关系数大小差异不是绝对的 C相关系数不是等距的不能进行大小比较 D相关关系不一定是因果关系第二章相关分析例数学与物理物理与英语相关性比较第三章正态分布在社会教育现象中大多数随机变量都呈现是或近似正态分布的情形正态分布是统计理论与统计应用中最重要应用最广泛的一种分布正态曲线的特点二描述统计一个正态分布是由总体的平均数和总体的方差所决定的 1 正态曲线及其特点第三章正态分布 2 正态分布曲线的重要性质 z x 3 正态曲线理论的应用 1 推求学生成绩中某些分数的人数例假定500个学生某科成绩近似正态分布其X 70 10 试问 1 75分以下有多少人 2 85分以上有多少人 3 75 85分之间有多少人解 1 z 75 70 10 0 5 查正态分布表中值为0 6915 因此75分以下的学生占69 15 75分以下的人数是500X69 15 346 人 2 z 85 70 10 1 5 查正态分布表中值为0 93319 85分以下的学生占93 319 因此85分以上的学生占100 93 319 6 681 所以85分以上的人数是500X6 681 33 人 3 75分至85分之间实际上是75分以上至85分以下的范围因此85分的百分率减去75分以下的百分率即为所求93 319 69 15 24 169 500 x24 169 121 人正态曲线理论的应用 2 推求某一特定百分率的成绩界限例某县对初一年级学生1000名学生进行能力测验其结果为X 75 10 现拟根据此次结果选取25名学生作为尖子班培养假定测验成绩近似正态分布问多少分以上才能被选到尖子班学习在正态分布表中查表中值0 975所对应的标准分数 z 1 96 既是说1000名学生中有97 5 的人数在标准分数1 96以下因此有2 5 的人数在标准分1 96以上再将标准分数1 96化为原始分数得 1 96X10 75 94 6 分答分数在94 6分以上才能进尖子班分析尖子班的人数占全年级的百分比为 25 1000 2 5 正态曲线理论的应用 3 分析测验试题的难度例某校学生在一次测验中第一题的答对率为15 第二题的答对率为25 第三题的答对率为35 假设这三题所测量的能力近似正态分布问1 2 3题的难度值各为多少各题之间的难度差异怎样在正态分布中通常是根据答错率找出所对应的标准分数界限值此值即为该题的难度比值由左表可知虽然三题的答对率都相差10 但第二题与第三题的难度差异却比第一题与第二题的难度差异要小三推断统计教育现象和一切客观物质世界中的现象一样不仅存在质的方面同时也存在量的方面而且这两方面是辩证统一的教育统计学就是在教育现象的质与量中专门研究其数量方面特征的重要工具在建立了以概率论和抽样方法为主要依据后教育统计学便具有了以局部推知全体以样本资料推知总体性质的科学推断功能根据样本信息对总体参数状况的推断有两种不同形式既总体参数估计和假设检验二者既有区别也有联系三推断统计 1 总体和样本所要研究对象的全体叫做总体其中每一个研究对象叫做个体从总体中抽取的一部分叫做总体的一个样本样本中个体的数目叫做样本容量例1 对家用电器质量抽查确定次品率不能采用全部检测的方法例2 全市要检查初中学生体育锻炼达标情况对每名学生一一测试工作量很大不仅耗费人力物力和时间而且没有必要有没有一种科学的方法只抽测一少部分学生然后根据这部分学生的测试成绩去推知全市中学生的体育达标情况 2 参数与统计量总体参数是指一切由观察测定总体的全部个体而得到的统计量数样本统计量是指为估计总体参数从样本所得的统计 s 第一章相关概念推断统计 4 抽样方法 3 随机误差样本统计量与总体参数之间的差距从某市参加高考的1200名学生中抽取200名试卷组成一个样本计算这200份试卷的平均分和标准差这200份试卷的平均分和标准差与1200名考生的平均分和标准差是有差距的不同的抽取带来不同的差距这种差距称之为随机误差 A 随机抽样抽签法随机数字法 B 机械抽样C 分层抽样D 整群抽样抽取样本应遵循的原则第一总体中每一个个体被抽中的机会均等即抽中与抽不中纯属偶然第二任一个体与其它个体在抽取时无联带关系即抽中的个体与抽不中的个体无关第三在条件允许的情况下尽量使样本容量大一些 5 小概率事在随机事件中概率很小的事件被称为小概率事件习惯上约定在0 05以下即当P A 5 时则称A为小概率事件在统计推断中认为小概率事件在一次试验或观察中是不可能发生的第二章总体平均数的区间估计总体平均数的置信区间推断统计的基本理论之一就是抽样理论而推断统计的任务则是根据样本资料来推断总体的特征从而揭示总体的本质和规律抽样分布的几个重要定理统计推断的理论依据 1 从总体中随机抽出容量为n的一切可能样本的平均数的平均数等于总体的平均数 E x 2 容量为n的平均数在抽样分布上的标准差等于总体标准差除以n的方根 3 从正态总体中随机抽取的容量为n的一切可能的样本平均数的分布也呈正态分布 4 虽然总体不呈正态分布如果样本容量较大反映总体和的样本平均数的抽样分布也接近于正态分布第二章总体平均数的区间估计总体平均数的置信区间一原总体的方差已知样本平均数的总体分布在样本容量很大时其分布近似于正态分布样本平均数分布的标准差为 n 根据正态分布的性质U X X服从正态分布对于给定的值 0 1 则称 1 为置信度可求出满足P U U 1 一般取 0 01或 0 05 对应的U0 05 1 96U0 01 2 58 置信区间 0 05 x 1 96 n x 1 96 n 为总体平均数95 的置信区间 0 01 x 2 58 n x 2 58 n 为总体平均数99 的置信区间根据样本平均数估计总体平均数的所在区间称为总体平均数的区间估计基本原理按一定概率要求根据样本平均数估计总体平均数的所在区间 x 1 96 n x 1 96 n x 1 96 n x 1 96 n 二原总体的方差未知对于总体方差未知且容量n 30 则用S代相应的有置信区间为 0 05 x 1 96S n x 1 96S n 为总体平均数95 的置信区间 0 01 x 2 58S n x 2 58S n 为总体平均数99 的置信区间例从某地区高考初试的数学试卷中随机抽取40份分析后得到如下数据平均成绩为51 2 标准差为3 8 问这一地区初试数学平均成绩在怎样的范围内答已知X 51 2S 3 8n 40 本题属于总体方差未知且大样本n 30 因此置信区间的下限 51 2 1 96x3 8 40 50置信区间的上限 51 2 1 96x3 8 40 52这一地区初试数学平均成绩有95 的可能性在 50 52 范围内同理也可以计算出有99 的可能性在 49 6 52 7 范围内三推断统计第三章显著性检验平均数差异的显著性检验 Z检验与t检验一显著性检验的基本思想显著性检验是统计推断的一种方法它是确定一个具有已知统计量的样本是不是从已知对应参数的总体中抽出来的或是两样本的统计量是来自同一总体还是来自不同的总体或从另外的角度说样本统计量与总体参数的差异或两个样本统计量的差异究竟是由于抽样所引起的随机误差还是本质上的误差这需要检验才能加以确定判断这种差异是否显著要用概率来回答如果差异是由于抽样误差而引起的可能性大那末两者的差异就不显著反之两者的差异就显著抽样误差的概率大小是由显著性水平来衡量的通常采用的显著性水平为0 05或0 01 如果P 0 05为差异不显著如果0 05 P 0 01差异显著如果P 0 01则特别显著需要注意的是显著性检验是以随机样本为前提的以概率论原理为基础的所以进行检验时应注意样本的随机性以及样本的可比性观测指标的所有条件应尽可能相同或基本相同二显著性检验的一般方法一般来说统计检验先对总体的分布规律作出某种假说然后根据样本提供的信息对假说作出肯定或否定的决策具体步骤为提出假设如假设两个群体平均数没有差别其数学符号为 H0 1 2 这种对群体所作的无差别的假设称为零假设或称虚无假设用符号 H0 表示与此同时实际上存在第二种假设两个总体平均数有差别其符号为 H1 1 2 称为备择假设显然零假设与备择假设是两个对立的假设肯定是此否定彼根据不同条件和样本提供的信息即数据从零假设出发代入相应的公式计算出零假设的概率作出统计决断根据小概率事件实际上不可能性原理研究H0成立的概率如果H0的概率P 0 05 表示零假设不是一个小概率事件则H0成立便否定被择假设H1从而确定 1 2 如果H0的概率p 0 05 表明是个小概率事件H0不成立就肯定备择假设H1的成立从而确定 1 2 结论当P 0 05时差异不显著当0 01 p 0 05时差异显著当P 0 01时差异特别显著三推断统计第三章显著性检验推断统计显著性检验三显著性检验的一般步骤 1 建立检验假设 H0 或 1 2 2 选择和计算统计量 z值或t值 3 确定P值4 判断结果当P 0 05为差异不显著接受检验假设当0 05 P 0 01差异显著拒绝检验假设当P 0 01差异特别显著拒绝检验假设平均数差异的显著性检验 Z检验 1 两个独立大样本平均数差异的显著性检验 Z检验是一般用于大样本即样本容量大于30 平均值差异性检验的方法它是用标准正态分布的理论来推断差异发生的概率从而比较两个平均数的差异是否显著 Z检验公式例1987年上海市初中三年级语文教学调查中对男女生语文测试成绩作如下统计试检验男女生语文成绩是否存在显著差异抽取的两个样本均大于30 属两个独立大样本平均数差异的显著性检验用Z检验平均数差异的显著性检验 Z检验检验步骤提出零假设z H0 1 2即假定男女写作阅读及读写总分均无显著差异现在的差异是抽样误差所致计算统计量代人Z值公式 41 可编辑平均数差异的显著性检验 Z检验计算出的Z值与下表进行对照作出判断因为 Z写 2 27 显然 Z写 1 96 表明概率P 0 05 男女生写作成绩差异显著因为 Z读 2 00 显然 Z读 1 96 表明概率P 0 05 男女生阅读成绩差异显著因为 Z总 2 15 显然 Z总 1 96 表明概率P 0 05 男女生语文成绩差异显著结论当P 0 05时拒斥H0 肯定H1 1987年调查说明上海市初三语文成绩男女生存在显著差异女生高于男生平均数差异的显著性检验 t检验 2 小样本与总体均数的差异检验 t检验是用于小样本样本容量小于30 时的平均值差异程度检验方法它是用t分布理论来推断差异发生的概率从而比较两个平均数的差异是否显著例某校初一年级抽出一组20人对数学自学辅导教材进行试验期末全年级测试平均成绩为70分而这20人的平均分为 77 7 标准差为15 试检验实验效果本例随机抽样样本容量为20人属小样本因此适用t检验所谓检验实验效果就是以样本 20人的平均数与某已知总体平均数之间的差异程度的显著性检验既检验样本所取自所代表的总体的平均数与 0 是否有差异 t检验公式平均数差异的显著性检验 t检验检验步骤提出零假设 H0 0 即假定样本所代表的总体平均数与已知平均数无显著差异如有差异仅是抽样误差所致本题 0 70分计算检验统计量t值用如下公式式中样本平均数77 7 0 已知总体平均数70 s 样本标准差15 n 样本容量20 代人公式得平均数差异的显著性检验 t检验作出判断与正态分布曲线不同 t分布的曲线形式随自由度大小而不同自由度记作 df 作总体平均数的假设检验时统计量t的自由度df n 1 据此本题的df 20 1 19 查t值表得出理论t值为 t 19 0 05 2 093再与计算所得t值比较可得 t 2 24 t 19 0 05 2 093依据 t值与差异显著性关系表推断H0发生的概率作出结论 t值与差异显著性关系因为t 2 31 t df 0 05 从上表可知概率P 0 05时和 0之间的差异显著因此可下结论为拒斥H0 0 而肯定H1 0 又因 0 故结论表明新教材实验有成效平均数差异的显著性检验 t检验 3 其它检验公式如果是按同一组样本不同情况的测试所得的平均值1和2来检验平均值的差异程度其计算公式为式中 D为两次测试中每对分数之差即D X2 X1 对于两个独立的正态总体如果已知两总体方差相等但未知总体方差具体数值从中各抽取一随机样本两样本平均数之差将服从自由度为的t分布其检验统计量的计算公式实验设计简述实验设计实验者为了揭示实验中的自变量与因变量的关系在实验之前所作的实验计划通常指实验程序的计划和安排而实验程序的计划和安排离不开统计检验实验设计的内容包括怎样选择被试实验对象控制那些因素指出什么假设观察那些内容如何安排实验步骤采取何种统计方法来处理和分析实验结果等等例控制变量指示语一目的通过把指示语作为自变量观察被试对反应变量的不同影响从而了解到不是以指示语为自变量的实验中控制指示语的重要性二材料数学试卷一份马表三程序 1按全班被试的数学程度分为数学能力相同的甲乙两组 2主试仅向甲组被试着重指出你们在运算时必须注意试题中数字之间的关系余内容两者相同 3主试说明实验要求发给各被试试题一张覆置桌上主试发预备口令时被试把题纸翻转正面写好姓名等项主试发开始口令时同时开动马表被试答题 4被试做完题目立即停笔并问得答题时间记录在试题纸上 5全组做完主试宣布答案被试加以核对并记录成绩以便整理全组结果四结果 1统计甲乙两组的平均成绩做对题数和做题的时间 2检验两组时间或成绩差异的显著性五讨论 1在本实验中你是怎样发现题目的规律的2指导语在解题中所起作用如何实验设计简述附数学试题如下姓名组别时间在下列各数列后的横线上填写你认为应该填写的数字 1 26101418 2 31248192768 3 8421 4 31 4833 4 5 455667 6 38131823 7 134679 8 72503 2 9 1346101222 10 1222428 第二部分教育测量学原理简介第一章教育测量概述一教育测量的含义与特点二教育测量发展的历史三教育测量的要素和种类四教育测量的功能及对教育测量应持的态度第二章测验的信度效度难度与区分度一测验的信度二测验的效度三测验的难度四测验的区分度第三章测验的编制与实施一确定测验目的二教育目标分类三编制测验双向细目表四试题的编制五试题评分六试卷的编辑与测验实施七试卷分析第四章题型编制的一般原理与方法第一章教育测量概述一教育测量的含义与特点1 教育测量的含义测量 Measurement 通常指人们对客观事物进行某种数量化的测定测量是以数量来表述结果的没有数量来表述的结果不能称为测量教育测量 EducationalMcasufement 就是对学生的学习能力学业成绩兴趣爱好思想品德以及教育措施上许多问题的数量化测定教育测量主要对学生精神特性的测定凡物之存在必有其数量凡有数量的东西都可以测量测不准原理一教育测量的含义与特点测量测验考试评价的联系与区别测量与测验测验 Test 是引起某种行为的工具通常是指运用某些仪器试题来引起人们的某种行为从而测定人们的某种特性它是进行数量化分析和科学推断的前提和手段测量比测验的含义要广泛测量不仅包括着运用仪器试题来进行测定事物的质量与特性而且还包括着运用调查观察等方法来测量事物的质量与特性测量既包括对事物的测验又包含对事物进行数量化的分析并对测验结果进行一定的解释和评价测验与考试 Examination 也不尽相同我们平时所说的考试通常只凭教师自己的经验去出试题和评分带有主观随意性测验是经过较细致的科学分析才编制出测验的题目在测验的程序和评分方面也有较严格的要求考试一般用于考核学生的学业成绩测验不仅用于考核学生的学业成绩还用于心理特性的测量测量与评价 Evalution 既有联系也有区别测量强调的是数量化评价则是突出价值观充分重视对问题的分析与评断一教育测量的含义与特点 2 教育测量的特点 1 教育测量一般是间接测量我们只能通过学生对测验题目的反应和一些行为表现运用推理判断的方法来间接的测量出他们的知识水平智力高低和品德好坏 2 教育测量的度量单位是相对的学生的学业成绩好坏智力高低和能力大小等都是就其在所在团体的整个分数序列行为序列中的地位来说的其测量的分数单位并非绝对的 3 教育测量是为实现教育目的服务的是为改进教育工作提高教育质量更好地实现教育目的服务的不能脱离教育目的和教材的要求随意地制定测验量表任意地进行测量对各种教育测量结果的评价也都应依据教育目的的要求来进行第一章教育测量概述二教育测量发展的历史主观经验性考试阶段 1864年以前教育测量起源于我国的科举考试制度客观标准化测验阶段 1864一1940年法国的比纳西蒙美国的推孟桑戴克麦柯尔比纳被称为智力测量的鼻祖桑戴克被称为教育测量学的鼻祖客观测验的深入发展阶段 1940年过去教育测量多为对学生知识的测量很少测量学生的心理和品德现在的教育测量不仅重视测量学生的知识而且重视学生的智力和思想品德的测量过去教育测量的量表编制多为单一答案的求同式思维缺乏多种答案的求异式思维现在教育测量的量表中也包括有多种答案的求异式思维题和论文题过去教育测量多用于对学生的学习成绩的测量很少涉及课程设置教材教育改革方案等效益方面的测量现在在教育工作的各个方面都运用教育测量过去教育工作中的客观测验一般是常模参照测验现在教育工作中的客观测验不仅有常模参照性测验而且有目标参照性测验第一章教育测量概述三教育测量的要素和种类单位教育测量中的单位不是绝对等价值的参照点教育测量的参照点都属于人为设定从参照点起计算的分数不能以倍数的方式解释量表具有单位和参照点的连续体教育测量所使用的量表有四种百分量表年龄量表等级量表 T量表2 教育测量的种类以测量的对象来分学业成绩测验智力测验人格测验特殊能力测验以测量的目的来分预测测验形成性测验总结性测验诊断性测验难度测验速度测验以测量的方式来分个人测验团体测验以试题的形式来分客观性测验论文式测验投射测验情景测验 1 教育测量的要素第一章教育测量概述四教育测量的功能及对教育测量的认识态度 1 教育测量的功能教育测量是改进教学的良好工具教育测量是教育管理的重要手段教育测量是教育研究的重要方法2 对教育测量应有的认识态度教育测量是一种工具教育测量尚需完善对教育测量应持严肃的态度教育测量学原理第二章测验的信度效度难度与区分度测验的信度效度难度与区分度是衡量测量质量的基本标准作为教育测量的工具测验它的编制是一项十分复杂的工作它需要懂得一些教育测量基本知识和基本方法的人来完成一个连信度效度难度和区分度等教育测量基本概念都不甚了解的人是难以编出高质量的测验的从教育测量的理论上来讲一个良好的测验应该具备以下条件测验的试题与测量的目标吻合测验的试题应具有代表性测验的试题有恰当的难度和区分度测验的试题的语言陈述简单明确测验的结果有效和可靠即效度信度高测验的实施符合经济性原则其中测验的信度效度难度和区分度是衡量测验质量的基本指标测验的信度效度难度与区分度一信度 reliability 所谓测验的信度是指测验的可靠性或者可靠程度具体地说测验的信度是指同一组学生用同一测验实施两次后所得分数的一致性或者同一组学生经过一次测验后用另一个同质的测验再测一次这两次测验所得分数的一致性根据统计学的基本原理刻划测验的信度有三种方法稳定性系数稳定性系数的求法是先对某个测验实施一次过了一段时间后再用这个测验实施一次然后计算学生在前后再次测验中所得分数的相关系数这个相关系数就是稳定性系数等值性系数等值性系数的求法是等值性系数是以两个等值题型题数难度区分度相等但具体内容不同的量表在最短时距内对相同应试者先后施测两次的两组对应分数的相关系数内部一致性系数内部一致性系数的求法是将一个测验分数分为两个相等而独立的部分例如奇数题和偶数题然后求两者的相关系数对于这个相关系数再用斯皮尔曼布朗公式r信 2r 1 r来校正其中r是相关系数 r信就是内部一致性系数测验的信度效度难度与区分度在前述三种类型的信度系数中前两个都要学生接受同一或同质内容的两次测验这在实际的中小学教育过程中是不现实的因此在中小学教育或从事教育科学研究的过程中信度系数的计算一般以内部一致系数为主测验的信度是十分重要的不可靠的测验是没有什么意义的如用一杆秤去称肉第一次称的的重量是1500克第二次称得的重量是1000克那么这种秤还有什么用呢教育测量也是如此如用一次去测量学生的数学学业水平第一次测验的成绩是92分第二次测验的成绩却只有61分这样就无法确定这个学生的数学学业水平当然这个测验是根本不可靠的就测验的内容而言学业成绩测验要求信度系数在0 9以上常达到0 95 智力测验应达到0 85以上个性测验和兴趣测验稍低应在0 7 0 8 测验的信度效度难度与区分度提高测验信度的方法延长测验的长度量表题目越少得分越容易受试题抽样的偶然因素影响当然测验的信度也越低新增加的试题必须与原试题同质平均难度一样且不使被试感到厌倦测验的难度要适中同一测验中的试题难度水平接近施测内容尽量单一不要妄图在一次测验中测量被试的所有能力信度很低测验的时间要充分使被试从容回答问题测验的程序要统一进行多次测验开始时的指导语回答问题方式分发收回试卷的办法时间掌握都要尽量一致评分要客观客观性测验评分标准明确有助于提高测验的信度主观性试题受偶然因素影响大往往评分者的量尺不统一信度差加大应试者之间的差异因为信度系数的大小与实得分数成正比加大被试能力的差异可提高信度测验的信度效度难度与区分度二效度 Validity 所谓测验的效度是指一个测验真正能确实测量到它所要测量的东西的程度它是针对测量的目的和结果而言的根据测量的目的可以把测验的效度分为内容效度结构效度和效标关联效度三种内容效度内容效度是指测验目的代表准备测验的内容和引起的预期反应所达到的程度如在教育实验研究的测量中准备测量的内容是指实验自变量的变化预期反应是指实验因变量的变化目前对测验的内容效度没有恰当的计算方法尚不能用一个简单数字来刻划它现在判断测验的内容效度一般是用逻辑分析法或内容分析法结构效度测验的结构效度是指测验结果能够说明教育学和心理学理论的某种结构或特征的程度它可以理解为测验实际上测量了准备测量的结构特征所达到的程度测验的结构效度问题比较复杂一般在中小学教育和教育科学研究中所使用的自编测验是不考虑这个问题的效标关联效度测验的效标关联效度是指测验结果与作为效标的另一个独立的测验结果之间的一致性程度这种一致性程度一般是用本测验结果与另一个独立的测验结果之间的相关系数来描述的那个独立的测验结果是用来估计本测验效度的标准所以叫做效标实际上效标在一定程度上用另一个独立测验结果反映本测验准备测量的某些特征由于效标是计算测验的效标关联效度的主要依据因此效标必须确实能反映某个方面的特征只有这样才能成计算测验效标关联效度的依据测验的信度效度难度与区分度效度的统计定义提高效度的方法控制系统误差精心编制量表妥善组织测验扩充样本的容量和代表性合理处理信度和效度的关系从某种意义上讲效度比信度更重要三难度被试完成题目 item 任务时所遇到的困难程度在教育测量中某测验的难度一般是用正确解答该测验题的人数与参与测验的学生数的比值来刻划的用公式表示即P R N其中 P表示某测验题的难度 R表示答对该测验题的人数 N表示参加测验的人数难度对测验有很大的影响这种影响主要体现在影响测验成绩的分布影响测验成绩的离散程度影响测验的区分能力等三个方面难度计算常用的以下几个公式 P X W其中P表示某测验题的难度 X表示接受测验的学生在该测验题上的平均分数 W表示该测验题的最高得分 P PH PL 2其中P表示某测验题的难度 PH表示接受测验的高分组学生占总数的27 在该测验题的通过率 PL表示接受测验的低分组学生占总数的27 在该测验题的通过率 P XH XL 2NL 2N H L 该公式只适宜计算论文式测验题的难度其中P表示某测验题的难度 XH表示接受测验的高分级学生的得分总数 XL表示接受测验的低分级学生的得分总数 N表示接受测验的学生总数 H表示该测验题的最高可能得分 L表示该测验题的最低可能得分测验的信度效度难度与区分度四区分度区分度又叫鉴别力它是测验对学生实际水平的区分程度的指标一个具有良好区分度的测验题实际水平高的学生应该得高分实际水平低的学生应该得低分测验的区分度有积极区分度和消极区分度两种积极区分是指区分的方向与测验总分的方向一致的区分区分的方向与测验部分的方向不一致的区分是消极区分测验题的区分度的取值范围在 100至100之间如果区分度是负值则表示该区分是消极区分如果区分度为0 则表示该测验题没有区分如果区分度是正值则表示该区分是积极区分测验的信度效度难度与区分度四区分度测验题的区分度的计算方法很多在中小学教育和教育科学研究中使用的测验题的区分度一般用下列公式来计算客观性测验题区分度计算公式D PH PL其中D表示某测验题的区分度 PH表示测验高分组学生对该测验题的通过率 PL表示测验低分组学生对该测验题的通过率论文式测验题区分度计算公式D XH XL N H L 其中D表示某测验题的区分度 XH表示接受测验的高分级学生的得分总数 XL表示接受测验的低分级学生的得分总数 N表示接受测验的学生总数 H表示该测验题的最高可能得分 L表示该测验题的最低可能得分测验的信度效度难度与区分度测验的信度效度难度与区分度区分度的一般评价标准0 2以下应淘汰 0 2 0 3合格题目可能需加以改进 0 3 0 4良好 0 4 1性能颇佳测验题目难度与区分度的关系题目难度区分度与测验信效度之间关系复杂测验中题目的总体难度过高或过低都会导致测验的总体区分能力降低所以一般说来中等难度的题目应占40 60 教育测量学原理第三章测验的编制与实施一确定测验目的要编制测验首先要明确测验的目的在教育活动中测验无论多么重要它也只能是为目的服务的工具测验的质量如何关键在于能否有效地促进教育目标的实现把握常模参照性测验与目标参照性测验的区别常模参照测验是指以学生团体测验的平均成绩作为参照标准说明某一学生在团体中的相对位置将学生分类排队重在个人与个人之间的比较主要用于选拔或编组编班要求试题难度适中尽量对所有学生都有较强的鉴别力和区分度常模参照测验以鉴别学生个别差异为指导思想目的是为了测得学生在所处团体中的相对水平常模实际上即是该团体在测验中的平均成绩学生成绩便是以常模为参照标准来确定的这一测验衡量的是学生的相对水平故其评分属相对评价范畴目标参照测验是以达到教学目标为标准参照点它提供的信息是完成教学目标的情况旨在检查学生的成绩与教学之间的差异不比较个人之间成绩的差异测验试题必须完全能代表教学目标要求才能发挥作用考试成绩就代表学生掌握教学目标要求达到的程度二教育目标分类 1956年布鲁姆 B S Bloom 制定出了教育目标的分类系统认知目标情感目标运动目标三大类每类目标又分成不同的层次排列成由低到高的阶梯 1998年霍恩斯坦教育目标分类学是在批判继承布卢姆教育目标分类学的基础上推出的一个全新的教育目标分类体系它的主要特点是以建构主义为理论基础体现了人的行为的整体性突出了过程性它将全部教育目标划分为认知领域情感领域动作技能领域和行为领域4个部分每个领域包含5个层次的教育目标它对布卢姆教育目标分类学的超越主要表现为适当地减少了教育目标类别的数量增强了平稳性和可比性更适合于指导课堂教学测验的编制与实施霍恩斯坦于1998年推出了一个全新的教育目标分类这个分类将全部教育目标划分为4个领域认知领域情感领域动作技能领域和行为领域每个领域包括5个类别的目标霍恩斯坦教育目标分类与布卢姆教育目标分类之间存在一些共同点也存在重要的区别霍恩斯坦教育目标分类实现了对布卢姆教育目标分类的超越六评价五综合四分析三应用二理解一知识布鲁姆认知目标是指与智力活动有关的教学目标分为六个层次每一层次又有若干小层次形成了由简单到复杂的阶梯简单目标在下复杂目标在上高层目标包含低层目标并在低层目标基础之上发展起来教育目标分类测验的编制与实施三编制测验双向细目表测验双向细目表 tabieofspecification 具有极大的实用性无论对教学还是对测验都有重要作用它可以帮助我们明确如下问题教学内容是什么如何支配教学时间教授相应知识的内容目的是什么如何用测验来测量相应教学内容的目标实现的程度编制测验双向细目表的步骤 1 列出教材大纲 2 对列出教材大纲赋予权重 3 对各种教育目标赋予权重 4 编制双向细目表自然常识测验双向细目表测验双向细目表顶端列出了应测验的认知目标表的最下端列出了与各项目标对应的分配权重表的左端列出的是测验内容大纲表的最右端列出的是对各项内容的分配权重表的主体部分是对认知目标及测验内容的权重分解在保证权重分配不太偏离的情况下可以灵活调节测验的编制与实施小学数学毕业考试水平测试知识与能力双向细目表题量数学知识三编制测验双向细目表教育测量学原理四试题的编制以双向细目表为依据编制试题命题命题是测验编制中的核心环节它包括选择试题类型编拟试题确定评分方法编制测验说明搭配并组织试卷等项工作 1 试题类型根据不同的标准可以把试题分为不同的类型客观性试题选择题单选多选填空题配对题排列题是非题简答题等客观性试题答案明确回答简便评分可靠并可用计算机评卷在固定考试时间内包含较多题量等优点缺点是试题不易编制对考生的阅读能力要求高难以排除被试对试题的猜测非客观性试题主观性试题作文题论述题自由反应性试题等优点是易于编制便于考察被试的书面表达能力缺点是没有标准答案评分困难且不可靠在限定时间内不能扩大题

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

教育统计与测量学原理.ppt

文档简介

温馨提示

最新文档

评论

教育统计与测量学原理.ppt

文档简介

温馨提示

最新文档

评论

相关文档