教育统计与测量.ppt_第1页
教育统计与测量.ppt_第2页
教育统计与测量.ppt_第3页
教育统计与测量.ppt_第4页
教育统计与测量.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育统计与测量,职教学院 张阔,主要参考文献,黄光扬主编:教育测量与评价, 华东师范大学出版社,2002年。 张厚粲主编:心理与教育统计学, 北京师范大学出版社,2004年。 A. Anastasi : Psychological Testing, Prentice Hall Inc. ,1997。,名人谈教育统计与测量,从事教育的人若不懂教育统计学就不能称为教育科学家。 心理学家、教育学家 艾伟 在一些教育科学论文里大都是抽象文字描述和典型事例说明,缺乏定量分析,很难说有多高的科学性。 姚依林 “统计是制定政策的主要依据” 怎样运用数据和我们的科学水平有关,停留在生动和突出事例来说明问题这样的水平是危险的,容易犯宽大的毛病,结果会导致脱离实际的偏向。 费孝通 “开展教育社会学研究”,绪论,概念 教育统计学:是运用数理统计的原理和方法研究教育问题的一门应用科学。 教育测量学:对学校教育影响下学生各方面的发展,定量地予以确定和描述的学科。 学习教育统计与测量的意义 教育科学研究的基本方法 定量分析的重要工具 教育工作者的必备知识,一、教育统计初步知识,集中量数: 代表一组数据典型水平或集中趋势的量。 差异量数: 代表一组数据离散程度、变异程度的量。 相关系数: 用于描述两个或多个变量间关联程度的量。 正态分布 学生成绩的初步分析,集中量数和差异量数,算术平均数 中位数:按大小顺序排列,位于中间位置的数。 众数:出现频数最多的数。,全距 平均差 方差 标准差,相关系数,积差相关:两变量均为正态连续变量,(一般n30)。,相关系数的取值范围在-11之间,其绝对值越大,表明两变量间的线性关联越强。,正态分布和正态曲线,最为常见一种概率分布形态,在理论和实践中均有广泛的应用。 密度函数 简记 特征:单峰、对称,学生成绩的初步分析,分数分布形态,注: (1)各分数段的区间大小应根据实际需要确定。 (2)一般要求学生的成绩分布为正态或负偏态。,二、教育测量的质量特性,教育测量的特点:间接性、相对性 测验的信度 测验的效度 题目的难度 题目的区分度,测验的信度,信度(reliability):测验的稳定性、可靠性程度。 信度的统计定义 信度的种类 重测信度:同一测验对同组被试先后两次施测所得结果 的一致性程度。 复本信度:两平行测验对同组被试施测所得结果 的一致性程度。 同质性信度:测验内部所有题目间的一致性程度。,复本信度的估计方法,测验的效度,效度(Validity):测验的有效性程度,即测验实际测量出其所要测量特性的程度。 效度始终是针对一定测量目的而言的 效度只有程度上的差异 效度要从多方面、多角度加以验证 效度的统计定义 从某种意义上说,效度比信度更重要。,测验的效度,效度的种类及其分析方法 内容效度:测验题目样本对于应测内容与行为领域的代表性程度。 逻辑分析 结构效度:测验反映某种理论构想的准确性程度。 因素分析 效标关联效度:测验对于特定情境下个体行为进行预测的有效性程度。 相关分析 效标:判断测验效度(预测有效性)的外部标准。,提高测验信、效度的方法,测验中题目的数量应适当,不能太少。 紧密围绕教学大纲和教学目标命题。 考核内容应全面,并能有效代表学生应掌握的知识领域。 测验的整体难度适当,不同类型、不同难度的题目应保持恰当比例。 少出偏题、怪题,一般应以考察基础知识和基本能力为主。,题目的难度,难度:被试完成题目(item)任务时所遇到的困难程度。 难度系数:定量地刻画被试作答题目时困难程度的量值。P 难度系数的估计 全体考生得分率(或失分率) 高低分组法:两端组被试(各27%)得分率的均值,题目的区分度,区分度:题目区分被试能力、水平的能力,又称鉴别力。 D 区分度的估计方法 相关法:计算题目得分与总分相关。其中 积差相关适用于多值计分题目; 点二列相关适用于二值计分题目。 高低分组法:以高分组和低分组在特定题目上得分率之差作为衡量区分度的指标。,多值计分题目(如简答、论述),区分度估计值:题分与总分的积差相关系数。,二值计分题目(如选择、填空、判断),区分度估计值:题分与总分的点二列相关系数,题目的区分度,区分度的一般评价标准 0.2以下 应淘汰; 0.20.3 合格题目,可能需加以改进; 0.30.4 良好; 0.41 性能颇佳。 测验题目难度与区分度的关系 题目难度、区分度与测验信、效度之间关系复杂。 测验中题目的总体难度过高或过低,都会导致测验的总体区分能力降低。所以一般说来,中等难度的题目应占4060%。,题目分析之三:作答反应分析,目的: 对教与学过程中可能存在的问题进行诊断。 内容:选择题中不同选项被选频数的分析;学生集中出现的错误反应及其原因等。示例:,正常: H组选择正确答案最多,其他均匀分布 异常:H、L组对不正确答案选择过多表明题目或教学存在疏失; H、L组对正确答案选择很接近说明题目缺乏鉴别力。,三、测验编制的一般原理与方法,题目类型及其测量功能 选择题 填空题 判断题 简答题 论述题 标准化测验编制的一般程序 教师自编测验,选择题,优点 可以测量学生多种层次的学习结果 评分标准统一、客观,有利于提高评阅的速度 允许较大的试题容量,可以保障题目的覆盖范围和代表性 可根据学生对似真选项的选择情况进行诊断 缺点 无法了解被试作答时的思维过程 难以考核被试的综合能力 具有似真性的干扰选项有时不好编制 存在猜中答案的几率,选择题,编制原则 题干意义完整,问题表述明确 题干及选项的语言均应简明,避免滥用否定结构、复杂句式 诱答项应具有似真性 同一测验中各题目应尽量保持独立,避免相互牵连 正确答案不能有明显组型,填空题,特点 主要用于考察被试对基本知识的记忆和理解能力。 受被试猜测影响小,评分较客观。 无法测量高级的学习结果。 使用过多容易造成被试的死记硬背。 编制原则 题意要明确,限定要严密,以保证空白处应填答案的唯一性。 题目中空白部分以一处为宜,过多则使题干支离破碎。 所有空白处的线段长度应一致,避免产生暗示作用。 若答案是数字,应指明单位或数字的精确程度。,简答题,特点 适合于考察被试对基本知识、概念和原理的掌握、记忆情况。 编制简单、灵活。 编制原则 问题叙述清楚、明确。 答案要简短具体,使被试可以用简洁的语言来回答,避免繁琐的计算和长篇大论。 避免只出机械记忆性的题目,应注重知识的应用。,论述题,优点 可以用来对高层次、复杂学习结果的测量。可以用于各学科领域,特别适用于人文、社会科学领域。 可以增进学生的思考、应用及解决问题的能力,对于被试的学习态度和学习方式可以产生积极的影响。如可以促使学生注意教材内容的内在联系和对所学知识进行有机的组织。 试题编制相对容易,可以增进被试的写作能力。 缺点 论述题一般都是大题,因此在一次考试中试题的取样范围比较小,且分布不均匀,难以做到全面考察。 评分的主观性强。即使有参考答案和评分标准,但因被试的回答自由,回答问题的方向也不尽相同,评分的主观性仍难以避免。 被试作答和评分阅卷均较为费时。,论述题,编制原则 试题应该用来测量较高层次的学习目标(如分析、综合、评价),特别是那些小型客观题不易测量的学业成就。如要求学生陈述理由、解释变量间关系,描述与评价资料、推理证明等。 要明确而系统地陈述问题,使被试能清楚地了解题目的要求。使每道题都能真实地反映被试实际能力而不受阅读理解等其他因素干扰。 不同的论述题之间很难做到等值,因此一般不要让被试选择问题回答,否则不同被试的得分难以比较。,标准化测验编制的一般程序,明确测验的性质和目标 选择和收集测验材料 编

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论