




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一讲 教育统计与评价概述一、教育统计学的定义、内容与作用 (一)教育统计学的定义:教育统计学是应用统计学的一个分支,是统计学与教育学的一门交叉科学。它是运用统计学的原理和方法,研究和把握教育现象数量方面的一门方法论科学。1 教育统计学的学科属性:是应用统计学的一个分支,是统计学与教育学的一门交叉科学。2 教育统计学的本身性质:是运用统计学的原理和方法,研究和把握教育现象的数量方面。3 教育统计学的主要特点:在于它所研究的是教育现象的数量方面,而对教育现象的本质及其规律性,从量的方量作出具体的说明,从而使对教育现象的研究分析基于可靠的数量基础上,或者对制定教育决策提供可靠的数量依据。4 教育统计学的主要任务:是研究如何搜集、整理和分析关于教育现象数据资料,并进行科学的推断,从而揭示教育现象所蕴含的客观规律。(二)教育统计学的内容主要分为描述统计与推断统计两部分内容。1 描述统计:对调查获得的数据资料进行整理、概括或计算出能够反映教育现象的综合指标。借助于这些综合指标,进行比较并作出结论。2 推断统计:根据样本提供的数据资料特征并以一定的置信度推断或预测总体的有关情况。在教育研究以及教育实际工作中,往往所要调查的总体很大,不能或难以进行全面调查,这时往往运用推断统计的方法,由局部(样本)推论总体,由已知推论未知。(三)教育统计学的作用1 教育统计学是教育科学研究中定量分析的重要工具唯物辩证法告诉我们,任何客观事物都有其质与量的两个方面,教育现象作为客观存在的一种事物也不例外,因此,教育教学研究中必须对事物进行全面的分析,不仅要有质的研究分析,也要有量的研究分析。2 教育统计学是教育评价技术中的重要方法在众多的教育评价技术中,定量评价是很重要的一个方面,而教育统计方法又是定量评价中分析资料的重要方法。教育统计的结果可以为教育评价提供数量的依据。3 教育统计学有助于增强教育决策的科学性。教育统计学中收集资料、分析资料的科学方法以及科学的推断,都可以为教育决策提供依据,提供资料,从而增强教育决策的科学性,提高管理的科学水平。4 教育统计学有助于培养科学的思维方式在新的时期,思维应具有科学性。在教育统计学内容中,无论是描述统计或是推断统计,都可以培养人们的科学思维,学会科学的推论与思考问题的方法,形成实事求是地对待一切事物的辩证唯物主义态度。二、教育评价的定义及作用(一)教育评价定义见教材第3页最后一段(二)教育评价定义的理解1 教育评价包含评价依据、评价技术和评价作用三部分2.教育评价是一个系统的综合性的活动过程。3.教育评价强调定量分析判断与定性分析判断的结合4 教育评价贯穿于一切教育活动之中(三)教育评价的作用(见教材第6页至第7页)1导向作用; 2.管理作用; 3.激励作用; 4.诊断作用; 5.鉴定作用这些作用在教育过程中的具体体现如图示:三、教育评价的类型及工作程序(一)教育评价的类型1 依评价的方法分(见教材第8页第11页的四对八种)自我评价与他人评价(谁来评)横向评价与纵向评价(与谁比)绝对评价与相对评价(评价标准)定性评价和定量评价(角度)2.依评价功能分(见教材第11页第12页)安置性评价:为作出某种安排,一般在教育教学活动前进行。诊断性评价:为发现问题,一般在教育教学活动前或活动中进行。形成性评价:为提供过程中的信息,一般在教育教学活动中进行。终结性评价:为作出某种鉴定,一般在教育教学活动结束时进行。(二)教育评价的工作程序(见教材第13页)四、教育统计与教育评价的关系教育统计与教育评价既有联系,也有区别。1 联系:教育统计是教育评价技术中的重要方法,而教育评价是教育统计的深化,它是在统计基础上进一步对事物作出价值判断。2 区别: 教育统计 教育评价主要目的: 数据分析 价值判断技术特点: 数量化 定量与定性结合活动特点: 单一性活动 综合性活动第二讲 教育评价指标体系概述一、指标体系的概念1狭义的概念:指 标被评价的因素。 指标体系被评价的全部因素的集合。2广义的概念:指标包括因素、权重、标准和文字描述。二、设计教育评价指标的目的:规定评价哪些因素,将评价所依据的目标具体化、行为化,即把评价变为分项评价。三、指标体系在评价中的作用1 对评价对象的行为起质的导向作用。2 有助于评价反馈功能的发挥。3 有助于提高评价的客观性和精确性。4 有助于增强评价结果的可比性。总的来说,指标体系即是评价工作的基础,也是评价工作的核心,它对评价起着统揽全局的作用。四、指标体系的设计原则(p2226)1方向性(思想)2.一致性(思想)3.系统性(技术)4独立性(技术)5.可测性(操作)6.可接受性(操作)三讲 教育评价指标体系的设计方法一、指标设计的方法1 目标分解法特点:对评价的目标逐级分解为主指标、亚指标等适用:一般用于非学业方面的评价。2布鲁姆的分类学法特点:对教育目标分解为认知领域、情感领域和动作技能领域。认知领域又分为 识记 、理解 、应用 、分析 、综合 、评价 六个方面。适用:重点是认知领域的分类,它主要用于学业方面的评价,比如学科考试的命题可灵活运用认知领域的分类,例如p338表12-2,p55 表3-1以及p30表2-3。3问卷调查法4多元统计法二、指标权重确定的方法(介绍四种,重点在第2、3两种)1 经验法(定性)2 对照配权法(定量与定性结合)步骤:对每两个指标进行对照比较赋分(满分值为1)分别计算各个指标的得分和将每个指标的得分和除以全部指标的总得分即为每个指标的权重。(见p35表2-5)3.咨询法(定性和定量结合)步骤:让每个被咨询者对已设计好的指标进行排序,重要至次要的序数从大到小排列(如p36表2-7)把众多被咨询者排序结果全部放在一个表(如p37表2-8)计算各个指标的总序数将每个指标的总序数除以全部指标的总序数即为每个指标的权重。(见p37表2-8)4.主成分分析法(定量)三、指标评价标准的制定 1 标准的含义:临界点 一种规定 中介物 在教育评价中,出现较多的是作为一种规定。2规定的形式:定性标准和定量标准。3 制定标准的原则:方向性、时效性、客观性、可行性、激励性(见p40)第四讲 教育评价中收集资料的方法在教育评价中,最常用的收集资料的方法有观察法、问卷法、访问法、测量法一、 观察法观察法的主要特点是到现场观察,特别适用于行为表现方面的评价。(一)观察种类:最主要的一种分类是分成参与观察和非参与观察,主要区别在于是否直接参加被观察的活动过程。参与观察直接参加对方的活动,收集的资料较为直接具体,但较为容易影响对方的活动进程。而非参与观察是从旁观察对方的活动,不那么容易影响对方的活动过程,但收集的资料不够直接具体。从收集资料的目的看,如有条件的话还是尽可能采用参与观察,但要遵循某些规则。(二)观察记录常用的观察记录有快速记录,卡片记录,表格记录、观察日记和录音录像。但最主要的是卡片记录和表格记录,见p47-48。二、问卷法问卷法的主要特点是填答问题表格,主要适用于内隐的心理活动方面的评价,比如思想性、认识性比较强的问题。(一)问卷种类主要有限制式、开放式、半限制式三种问卷。1 各种问卷的特点 限制式问卷:对提出问题事先安排好答案,让对方从中选择。限制式问卷又分为单选、多选和排序三种。 开放式问卷:对提出问题事先不安排答案,让对方自由回答。 半限制式问卷:对提出问题事先既有安排好答案,也有自由回答。2 选用问卷种类一般原则 能比较简明扼要表达答案意思的可用限制式问卷。 能比较简明扼要表达答案意思,但把握不到安排的答案能否包含所有的想法,可用半限制式问卷。 对于一些复杂的探讨性的问题,不易简明扼要提安排答案的,可采用开放式问卷(二)设计问卷的原则p50-51列举五点,应特别注意第(2)(4)两点三、访问法访问法的主要特点是直接交谈,特别适用于深入了解情况以及不具备填答问卷能力的对象。(一) 访问法的步骤:见p51。(二) 访问法注意的问题:p52。四、测量法测量法的主要特点是具体测试。主要适用有量表可测的事物。(一) 测量量表1 类别量表:表示事物的分类。2 顺序量表:表示事物的顺序。3 等距量表:既可表示事物的分类、顺序,也有相等的计量单位和相对零点。4 比率量表:既可表示事物分类、顺序,也有相等的计量单位和绝对零点。一般来说,类别量表测量得到的数据称为类别数据;顺序量表测量得到的数据称为顺序数据,等距量表和比率量表测量得到的数据均称为测量数据。(二)测量误差任何测量都不可能绝对精确的,尤其是教育测量,由于教育现象的复杂性和测量的间接性,误差是存在的。一般有三种误差影响测量的效果:系统误差抽样误差随机误差。测量时应尽量控制或者降低误差,但随机误差是最不容易控制的一种,所以说随机误差是影响测量效果最主要的一种误差。对于随机误差,可以通过p60(3.4)公式予以估计。(三)测量结果的解释鉴于测量误差是不可避免的,尤其是随机误差,所以对测量结果应给予正确的解释,可见p60第五段。 第五讲 描述性统计分析评价方法综合指标 实际上,从这一讲开始的教学内容都是介绍教育评价技术中的重要方法教育统计分析方法,也即是分析资料的方法。其中包括描述性统计分析方法和推断性统计分析方法两大部分。一、描述性统计分析评价方法的主要特点。对数据资料计算综合指标,然后根据综合指标值对教育客观事物给予评价。所谓综合指标指的是从数量方面综合说明事物特征的指标。常用的综合指标有绝对数、相对数、平等数和标准差。重点介绍后面两种。二、综合指标的计算及解释(一) 绝对数(规模)(二) 相对数(程度)(三) 平均数(水平)通常可用符号表示平均数1 算术平均数(未经分类汇总的测量数据资料)计算方法见p62的(4.1)公式。2 加权平均数(已经分类汇总的资料)组距数列平均数(对测量数据分组统计人数)例如p63表4-1的资料。计算方法如p63的(4.2)公式及83名教师平均年龄的计算。* 为了减少计算的麻烦,在此介绍计算器统计功能的使用:a、操作步骤计算器的统计功能的计算只能得到如下六个统计结果:n(数据个数)、(数据和)、(数据平方和)、(平均数)、(总体标准差)和s(样本标准差)。操作步骤如下:1) 显示统计状态:2ndf stat(或sd)2) 输入数据: 每输入一个数据按data3) 取出统计结果:这时六个统计结果均处于待取状态,可根据需要取出其中的结果。b、注意事项1) 若需继续进行第二组数据的统计运算时,需取消统计状态,再按上述步骤操作。按2ndf stat即可取消统计的状态。2) 若不需要计算、和s时(即进行其他一般运算时),也应取消统计状态)。3) 加权平均数输入数据时每输入一类即按data,例如对p63表4-1的输入如下:52.55 data,47.513 data,22.53 data。 总平均数(已知各个平均数)例如p66表4-4的资料。计算方法见p66的(4.5)公式及对表4.4的计算。同样可用计算器操作。等级平均数(对个体赋不同等级并按等级归类汇总)计算方法见p63的(4.3)公式及对表4-2的计算,同样也可以用计算器操作。注意编号可以倒数编,如表4-2的优、良、中、及、不及按5、4、3、2、1的顺序编号,计算的等级平均数是3.95,但最终的价值判断是一样的,即都是处于良好的水平。等级平均数适用于类别数据的计算,如品德、兴趣、情感等非学业成绩方面的分析评价,常常需要用到等级平均数,它既可以用于对集体的评价,也可以用于个体的评价。评分平均数(对各个方面赋不同比重并评分) 例如p65表4-3的资料,计算方法见p65的(44)公式及对表4-3的计算,同样也可以用计算器操作。 根据评分平均数的特点可知,它是一种全面性的分析评价,因此,常常用于评比、选拔等。而且可按如下程序进行:设计指标确定指标权重制定评选标准评分计算评分平均数确定人选。(3)平均发展速度指事物在某一时期内的平均发展情况.计算方法见p66的(4.6)公式,由于根据公式往往需要开高次方,不容易做到,所以把(4.6)公式转换为对数的形式计算,即(4.7)公式,但仍然比较麻烦.因此,可以利用计算器非统计功能中的开高次方,使用直接取得结果,但必须取消统计状态。平均发展速度是一个相对数,例如p67算得表示平均每年在校生都是上一年的1.083倍。平均发展速度的作用有两点:分析评价事物在一定时期内的平均发展情况。可以用于预测未来的情况,预测公式为:,可用计算器中的乘高次方取得结果。(四)标准差(差异)通常用符号式s表示。1. 标准差的计算方法未经分类汇总的资料:见p68(4.7)公式以及对甲、乙两组成绩的计算。可用计算器中的统计功能,按照算术平均数的方法输入数据,即可同时得的结果。已经分类汇总的资料:见p68的(4.8)公式以及83名教师年龄的标准差计算。同样可用计算器中的统计功能,按照加权平均数的方法输入数据,即可得的结果。对于前面所举的加权平均数的例子,计算器操作时均可同时算得平均数和标准差。2. 标准差的解释: 标准差的值愈大,则说明差异愈大,否则说明差异较小。但究竟标准差大好还是小好?这不能一概而论需要具体问题具体分析。第六讲 描述性统计分析评价方法平均数与标准差的综合应用 一、全面评价比较总体(一)数据的主要特征1 集中趋势:指大多数数据比较趋近的水平。通常把描述集中趋势的量数称为集中量数,平均数是最常用的一种集中量数。2 离中趋势:指数据之间的变异程度或离散程度。通常把描述离中趋势的量数称为差异量数,标准差是最常用的一种差异量数。(二)传统的评价比较总体方法只是考察数据的集中趋势,也即是说只以平均数对总体进行评价比较,仅就平均数的高低而下结论,这是片面的。因为平均数只反映了集中趋势,即水平特征,由于许多偶然性的因素影响,数据还具有变异性的特征。但传统的评价方法并未顾及这一点。(三)全面评价比较总体的方法作为全面评价比较总体的方法,必须抓住数w据的两个主要特征进行综合分析,既要分析集中趋势,也要分析离中趋势。也即是说,必须综合应用平均数和标准差对总体予以评价比较。例如p69甲、乙两班成绩的比较;又如思考与练习的第6题。二、正确评价学生的学习成绩(二)标准分数的解释1z0时,该成绩高于集体平均水平。2z0时表示正相关;当结论:不显著()显著()非本质本质偶然条件统计检验的审题 第十讲 考试质量的评价 对于考试质量的评价,主要通过对效度、信度、区分度和难度四个指标的分析来实现。一、效度(一)效度的含义:考试的有效性。(二)效度分析1内容效度内容效度含义:考试内容与预定要考内容一致性程度。内容效度的分析方法:利用双向细目表进行分析。注意编制双向细目表的步骤和要求。2效标关联效度效标关联效度含义:考试结果与效标的一致性程度。注意效标的含义及效标的选择。效标关联程度的分析方法:主要是通过考察考试结果与效标之间的相关程度,即计算两者之间的相关系数并进行显著性检验。二、信度(一) 信度含义:考试的可靠性。(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 矿产勘查钻孔质量评价考核试卷
- 编织工艺在海洋石油平台防护中的应用考核试卷
- 纺织品企业市场营销与品牌推广考核试卷
- 空调器湿度控制技术创新考核试卷
- 稀土金属矿选矿厂环境保护设施与技术考核试卷
- 合成材料在医疗设备制造中的应用考核试卷
- 紧缺人才招聘与专业技术服务外包合同
- 绿色环保建筑屋顶保温施工服务合同
- 资产评估审计补充协议
- 环保节能设备省级代理销售及售后服务合同
- 名著复习之革命烈士诗抄
- 人工智能与机器视觉技术应用
- 思想道德与法治2021版第六章第二节
- 地球物理勘探-第三章磁法勘探1
- Django 3 Web应用开发实战(上篇)
- DB32/T 4454-2023智慧化工园区建设规范
- 10kV保护定值计算明细表
- 酒店值班检查表新
- 新媒体文案写作完整全套教学课件
- 六安市人民医院招聘考试真题2022
- 闽教版五年级下册信息技术教案带反思
评论
0/150
提交评论