




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育统计与评价复习提纲教育统计与评价测试一填空描述性评价的主要特点是:计算综合指标 。标准分数的作用是把各类原始分数统一在高于或低于平均数多少的标准上衡量的。显著性水平指的是显著时犯错误的可能性。二、选择题对两个独立总体的比较即是何种比较?.横向一般来说,复习次数与遗忘程度是何种相关情形?负相关欲比较学生德、智、体、美四个方面是否均衡发展时,应使用何种综合指标?.标准差欲研究辅导是否有效的问题,分别对学生辅导前后进行同一难度不同题目的测验,这时对测验分数的检验方法是哪种?t检验欲研究考试结果能否反映学生的真实水平时,应作何种分析?信度6若统计检验结果在0.05的水平上显著,则在0.01水平上是否也是显著?.不一定三、应用题某高三教师自编一套英语测试题,用来预测学生的高考英语成绩,问:据下列测验结果能否说明自编测验对高考有预测效果?分析效标关联效度,应计算积差相关系数并且检验。2.据某题数据资料计算难度并给予评价。按主观题难度系数公式计算,再判断属难易或适中四、简述题 全面说明等级平均数的作用。根据等级平均数适用的数据及评价对象进行思考应用哪些统计方法可以全面评价教学实验后学生的学业成绩?独立总体和相关总体平均数差异分析结合。教育统计与评价测验二一、填空题1定量评价的主要特点是从量的方面说明教育问题 。2标准差是反映现象内部差异的一个综合指标。3显著性水平愈小,叫推断结果犯错误的可能性愈小。二、选择题1设计调查问卷时,应尽可能采用何种问卷形式?限制式2欲全面评价个人或集体时,宣使用何种平均数?评分平均数 3欲评价某事物的水平时,应使用何种综合指标?平均数4欲研究某校干部和教师对该校某一改革方案的看法是否一致的问题,属何种检验情形 A两个独立总体比例5欲研究性格与性别的关系问题,应使用何种检验方法?检验6欲研究某班统计学考试成绩是否存在显著的性别差异,应使用何种表?t分布表三、应用题1试比例下列两学生某科两次考试总绩哪个优?其中学生第二次考试是否退步?甲、乙生两次成绩分别转为标准分数再相加或比较2.试对下列某校办二厂两个班组职工的月收入情况予以比较,并说明理由。(单位:元)甲组:672,672,666,660,654,648,648乙组:690,684,672,660,648,636,630综合应用平均数和标准差比较四、简答题如何理解一个人的测量结果只是他的真实水平的估计值?据随机误差进行思考应用哪些统计方法可以全面评价教学实验后学生的学习兴趣情况?独立主体和相关总体比例差异分析结合教育统计学:教育统计学是应用统计学的一个分支,是统计学与教育学的一门交叉科学。它是运用统计学的原理和方法,研究和把握教育现象数量方面的一门方法论科学。教育评价:教育评价是按照一定 的教育性质、教育目标,采用定量和定性等手段对教育客观事物进行测量、分析、价值判断以及提供决策有用信息的一个过程。描述统计:对调查获得的数据资料进行整理、概括或计算出能够反映教育现象的综合指标。借助于这些综合指标,进行比较并作出结论。推断统计:根据样本提供的数据资料特征并以一定的置信度推断或预测总体的有关情况。在教育研究以及教育实际工作中,往往所要调查的总体很大,不能或难以进行全面调查,这时往往运用推断统计的方法,由局部(样本)推论总体,由已知推论未知。横向评价:是将评价对象与其他对象进行比较。它的特点是在评价时不考虑评价对象的背景情况和今后的发展趋势,只是考察评价对象在特定的时间和特定的空间中的现实状态,所以又称静态评价。纵向评价:是对评价对象的过去和现在进行比较,即考察其历史情况,注意其发展的潜力和发展趋势,所以又称动态评价。绝对评价:是将病人对象与评价对象总体外的某一客观标准进行比较,又称目标参照性评价。相对评价:是将评价对象与评价对象总体内的特定元素进行比较,或者对评价对象放在评价对象总体内排序。相对评价也称常模参照性评价。定性评价:是对教育客观事物的性质进行分析,即从质的方面说明教育问题。定量评价:是对教育客观事物的数量方面进行分析,即从量的方面说明教育问题,或者说对教育问题的说明提供数量的依据。安置性评价:是采用摸底测验的形式,了解学生已具备的知识基础与技能,以便决定教育教学的起点或者作出某种安排等。即为作出某种安排,一般在教育教学活动前进行。诊断性评价:是采用诊断测验的形式,研究和发现学生学习中存在的问题和实际困难,以便采取恰当的补救措施。即为发现问题,一般在教育教学活动前或中进行。形成性评价:旨在改进和发展正在进行着的教育教学活动或方案,即为揭示存在的问题,及时反馈信息,及时进行调控管理。即为提供过程中的信息,一般在教育教学在活动中进行。终结性评价:是在教育教学活动的终止时,对成果的核定、鉴定,或对评价对象作出某种资格证明。即为作出某种鉴定,一般教育教学在活动终进行。限制式问卷:是对提出的问题,根据测评的需要以及实际情况,事先安排好答案,由对方从中选择适当的答案。即找出问题后安排答案,让对方从中选择。限制式问卷又分为单选、多选和排序三种。开放式问卷:是对提出的问题不事先安排答案,而留出空位,让对方自由回答。即找出问题后不安排答案,让对方自由回答。半限制式问卷:找出问题后既安排答案,也有自由回答。类别量表:表示事物的分类。(统计人数)顺序量表:表示事物的顺序。(排名次)等距量表:既可表示事物的分类、顺序,也有相等的计量单位和相对零点。比率量表:既可表示事物分类、顺序,也有相等的计量单位和绝对零点。一般来说,类别量表测量得到的数据库的类别数据;顺序量表测量得到的数据称为顺序数据,等距量表和比率量表测量得到的数据均称为测量数据。描述性评价:是对数据资料计算综合指标值,然后根据综合指标值对教育客观事物给予评价。综合指标:指的是从教学方面综合说为事物特征的指标。常用的综合指标有绝对数、相对数、平等数和标准差。集中趋抛:指大多数数据比较趋近的水平。通常把集中趋势的量数称为集中量数,平均数是最常用的一种集中量数。离中趋势:指数据之间变异程度或离散程度。通常把描述离中趋势的量数称为差异量数,标准差是最常用的一种差异量数。标准分数的作用:把各种不同类型的分数统一在高于或低于集体平均分多少的标准上衡量。标准分数的具体应用1 正确评价同一学生科目的成绩,如前面例子。2 正确评价同一学生同一科目不同阶段的成绩。如前面例子。3 正确评价不同学生多科总成绩。例如p129表8-10。高考标准化考试报告的分数是已经对z进行了线性变换,即y=500+100Z,这并不会改变原来z的排序,线性变换避免了负数的出现,且有利于选拔。推断性评价:对数据资料进行统计检验,然后依据统计检验的结果并以一定的置信度对教育客观事物给予评价。统计检验:数据资料进行统计检验独立总体:两个总体的对象不同,对它们的差异评价,也可称为横向评价。相关总体:两个总体的对象相同,对它们的差异评价,也可称为纵向评价。t检验:独立总体和相关总体的检验都应用了t分布表,这种应用t分布表进行统计检验的方法,通常称为t检验。显著性水平:效度是考试的有效性。内容效度:考试内容与预定要考内容一致性程度。内容效度的分析方法:利用双向细目标进行分析。注意编制双向细目表的步骤和要求。效标关联效度:考试结果与效标的一致性程度。效标关联程度的分析方法:主要是通过考察考试结果与效标之间的相关程度,即计算两者之间的相关系数并进行显著性检验。信度:考试的可靠性。再测信度:用同一份试卷对同一组学生不同时进行前后两次考试,然后分析两次考试结果的一致性。再测信度的分析方法:主要通过考察两次考试结果的相关程度,即计算两次考试成绩的相关系数并且进行显著性检验。再测信度的不足之处:前后两次考试的时间间隔不易把握。分半信度:有意识的把试卷编制成等效的两个部分,然后分析这两部分考试结果的一致性程度。这相当于一份试卷对同一组学生同时进行两次考试,避免了再测信度两次时间间隔的问题。需理解的问题1、四种收集资料方法及各自所适用的情况观察法(1)、观察法的主要特点是到现场观察,特别适用于行为表现方面的评价。(2)、问卷法的主要特点是填答问题表格,主要适用于内隐的心理活动方面的评价,比如思想性、认识性比较强的问题。(3)、访问法的主要特点是直接交谈,特别适用于深入了解情况以及不具备填答问卷能力的对象。(4)、测量法的主要特点是具体测试。2、选用问卷种类的原则(1)、能比较简明扼要表达答案意思的可用限制式问卷。(2)、所比较简明扼要表达答案意思,但把握不到安排的答案能否包含所有的想法,可用来限制式问卷。(3)、对于复杂的一些探讨性的问题。可采用开放式问卷3、对测量结果的正确理解(重要)鉴于测量误差是不可避免的,尤其是随机误差,所以对测量结果应给予正确的解释,可见p55第五段。我们不能把测试结果看作一个确定的点,而是具有一定分布范围的或带状的。一个人测试的结果只是他的真实结果的估计值。一个人测试的结果只是他的真实结果的估计值。认识到这一点,我们即可避免对两次测试结果之间小的差别作过分的解释,或不会将两位被测者之间分数不甚大的差别当作有意义的事情看待。4、各种综合指标的作用绝对数说明事物的规模。相对数说明事物的程度或幅度。平均数说明事物的水平。标准差说明事物或现象内部差异情况的一个指标。5、对标准差的解释标准差的值愈大,则说明差异愈大,否则说明差异较小。但究竟标准差大好还是小好?这不能一概而论需要具体问题具体分析。6、等级平均数:是对总体中各个体根据一定的标准、条件赋予不同等级并按等级归类汇总以后再计算加权平均数的方法。公式:X为代表各等级编号,为代表各等级次数,N代表总次数。等级平均既可用于总体的评价,也可用于对个体的评价。标准分数: 标准分数的解释1Z0时,该成绩高于集体平均水平。2Z0.7时较易2)P0.3时较难3) 时较适中客观题:公式p=k/N。K为某题答对人数,N考生总人数。一般来说,全卷的平均难度应在0.45-0.55之间。全卷的题目难度分配一般为 易:中:难=3:5:2。当然结合考试目的灵活处理。区分度:试题的鉴别能力。区分度分析:1相关法:计算学生试题得分与试卷总分的相关系数并且进行显著性检验。2两端分组法 两端分组法区分度(D)的计算公式; D= 其中 分别为学生高分组和低分组中的难度。注意高分组和低分组各取27%的学生。两端分组法区分度D的解释1)当D 时区分度属好2)当 时区分度比较好3) 时区分度还可以4) 计算公式及应用一、独立总体差异检验规则若 则认为两个比例差异不显著,否则认为差异显著。可查正态分布(附表一)得到。例1:某方案的态度:80教师70赞成,100学生74赞成则P1=70/80=0.875 P2=74/100=0.74 n1=80 n2=100计得Z=2.360查得Z1-0.05/2=0.975=1.96因l2.3601.96故该方案的态度存在显著差异例2:某市甲校参加课外活动的学生占64%,忆校占58%。解:本题属于“独立总体比例的差异分析”情形。但本题缺少条件:假定甲120人,忆110人。1、 算也z值,将数据代入公式算得Z=0.942、 检验:因为Z=0.94 Z1-0.05/2=0.975=1.96所以可以认为两校参加课外活动的人数比例没有差异。二、相关总体差异检验规则若 则认为两个比例差异不显著,否则认为差异显著。公式中的b、c是看法不一致的两类人数。例如100人对两个方案的表态有下面四种情况:a=55 b=5 c=15 d=25其中第、两类人数即为b和c以上关于比例的差异分析,无论是独立总体还是相关总体的检验都应用了正态分布表,这种应用正态分布表进行统计检验的方法,通常称为u检验。例1解:1、算出Z值,将数据代入公式, 计得Z=2.242、检查:因为Z=22.4 Z1-0.05/2=Z0.975=1.96说明教师对两个方案的态度存在显著差异,方案2比方案1容易接受例2 100青年作两个实验。结果:两个都通过有45人,实1通过而实2未通过有23人,实1未通过而实2通过有5人,两个实验都不通过有27人。解:本题属“相关总体比例的差异分析”情形1、算出Z值,将数据代入公式, 计得Z=3.42、检查:因为Z=3.4 Z1-0.01/2=Z0.9995=3.29说明两个实验的成绩结果相差非常显著,方案1比方案2简单得多。三、 检验(两事物均为类别数据)x21(0.05)=3.841 x21(0.02)=5.412 x21(0.01)=6.635 x21(0.001)=10.82722的 检验规则(均为二分型的类别数据)若 则认为两事物关系不显著,否则关系显著例1 参加公益态度:积极:男20 女30消极:男25 女16解:本题属“ 检验”情形1、 算出x2值将各数据代入公式x2= =3.172、 检验:df=(r 1)(k-1)=(2-1)(2-1)=1查表x21(0.05)=3.841因为x2=3.17x21(0.05)=3.841,所以学生参加公益活动与性别不存在显著关系(青年的地区来源对电影的评价态度没有差异)作业1:数学成绩是否存在显著差异?男:96 -72-83-67-78-92-89-54-87-74-74-68-71-63女:95-76-88-81-68-77-47-72-83-62-67-59-74-85-87-76解:本题属于:独立总体平均数的差异分析”情形.1、 算标准差代入数据,算得S1=11.91同理,算得S2=12.252、 算t值算得t=0.3333、 检验:df=n1+n2-2=14+16-2=28查表得t(28)0.05=2.048因为|t|=0.333t(28)0.05=0.05所以该班男女生的数学成绩不存在显著差异。作业2:教师宣称,他的学生在期中和期未考试成绩相似,为检验他所宣称的是否属实,随机抽取九名学生考察,结果如下,这些资料是否证实教师所宣称的结果是事实?学生号1 2 3 4 5 6 7 8 9期中66-67-80-83-92-54-89-67-85期未81-82-73-84-87-68-97-76-91解:本题属于“相关总体平均数的差异分析”情形1、 求数据差的平均数Xx1-x2(期未为1、期中为2)代入数据算得Xx1-x2=52、 求配对数据差的标准差S x1-x2代入数据算得S x1-x2=7.48333、 算得t值4、 检验:df=9-1=8 查表得t(8)0.05=2.306因为|t|=2.004t(8)0.05=0.05所以期中、期未考试成绩不存在差异。该教师所宣称的结果属实作业3:下列学生的历史、地理成绩,能说明学生的历史、地理成绩有显著的关系吗?学生号1 2 3 4 5 6 7 8 9-15历史81-86-73-81-77-78地理80-84-80-72-77-72解:本题属于“积差相关”情形1、 算出标准差。可算出S x=5.26, S y=5.99 S x-y=7.32、 计算相关系数r将以上的数据代入公式r=3、 检验 df= 15-2=13查p381的附表得r(13)0.05=0.5139, r(13)0.01=0.641因为r =0.163r(13)0.01=0.641所以认为历史与地理成绩差异不显著。作业4:20名同龄青年的身高,能说明身高与性别有显著的关系吗?性别 女 男 女 男 女 男 女 男 女 男 女 男 身高153 155 146 156-156 169解:本题属于“点双列相关”情形:1、 分别算得X指标 Xp=158.839(男生) Xq=151.25(女生) P=0.6 q=0.4 Sx=6.722、 算出相关系数rpq=3、 检验df =20-2=18查表r(18)0.05=0.444, r(18)0.01=0.5614因为rpq=0.553r(18)0.05=0.444所以身高与性别有显著差异。第一讲教育统计与评价概述一、 要记忆的问题1教育统计学:教育统计学是应用统计学的一个分支,是统计学与教育学的一门交叉科学。它是运用统计学的原理和方法,研究和把握教育现象数量方面的一门方法论科学。2教育评价:是按照一定的教育性质、教育目标,采用定量和定性等手段对教育客观事物进行测量、分析、价值判断以及提供决策有用信息的一个过程。(教材第3页最后一段)3描述统计:对调查获得的数据资料进行整理、概括或计算出能够反映教育现象的综合指标。借助于这些综合指标,进行比较并作出结论。4推断统计:根据样本提供的数据资料特征并以一定的置信度推断或预测总体的有关情况。在教育研究以及教育实际工作中,往往所要调查的总体很大,不能或难以进行全面调查,这时往往运用推断统计的方法,由局部(样本)推论总体,由已知推论未知。5横向评价:是将评价对象与其他对象进行比较。横向评价又称静态评价。P8 6纵向评价:是对评价对象的过去和现在进行比较,即考察其历史情况,注意其发展的潜力和发展趋势,所以又称动态评价。P97绝对评价:是将评价对象与评价对象总体外的某一客观标准进行比较,又称目标参照性评价。P98相对评价:是将评价对象与评价对象总体内的特定元素进行比较,或者对评价对象放在评价对象总体内排序。相对评价也称常模参照性评价。P109定性评价:是对教育客观事物的性质进行分析,即从质的方面说明教育问题。P10 10定量评价:是对教育客观事物的数量方面进行分析,即从量的方面说明教育问题,或者说对教育问题的说明提供数量的依据。P1011安置性评价:是采用摸底测验的形式,了解学生已具备的知识基础与技能,以便决定教育教学的起点或者作出某种安排等。P11 (为作出某种安排,一般在教育教学活动前进行。)12诊断性评价:是采用诊断测验的形式,研究和发现学生学习中存在的问题和实际困难,以便采取恰当的补救措施。P11 (为发现问题,一般在教育教学活动前或活动中进行。)13形成性评价:旨在改进和发展正在进行着的教育教学活动或方案,即及时揭示存在的问题,及时反馈信息,及时进行调控管理。P12(为提供过程中的信息,一般在教育教学活动中进行。) 14终结性评价:是在教育教学活动的终止时,对成果的核定、鉴定,或对评价对象作出某种资格证明。P12 (为作出某种鉴定,一般在教育教学活动结束时进行。)二、需理解的问题1教育统计学的作用:(模仿课件中举例)1) 教育统计学是教育科学研究中定量分析的重要工具唯物辩证法告诉我们,任何客观事物都有其质与量的两个方面,教育现象作为客观存在的一种事物也不例外,因此,教育教学研究中必须对事物进行全面的分析,不仅要有质的研究分析,也要有量的研究分析。2) 教育统计学是教育评价技术中的重要方法在众多的教育评价技术中,定量评价是很重要的一个方面,而教育统计方法又是定量评价中分析资料的重要方法。教育统计的结果可以为教育评价提供数量的依据。3) 教育统计学有助于增强教育决策的科学性。教育统计学中收集资料、分析资料的科学方法以及科学的推断,都可以为教育决策提供依据,提供资料,从而增强教育决策的科学性,提高管理的科学水平。 4) 教育统计学有助于培养科学的思维方式在新的时期,思维应具有科学性。在教育统计学内容中,无论是描述统计或是推断统计,都可以培养人们的科学思维,学会科学的推论与思考问题的方法,形成实事求是地对待一切事物的辩证唯物主义态度。2教育评价的作用:(见教材第6页至第7页)(模仿课件中举例)1)导向作用; 2).管理作用; 3).激励作用; 4).诊断作用; 5).鉴定作用这些作用在教育过程中的具体体现如图示:3教育统计与教育评价的联系与区别: 1)联系:教育统计是教育评价技术中的重要方法,而教育评价是教育统计的深化,它是在统计基础上进一步对事物作出价值判断。2)区别: 教育统计 教育评价主要目的: 数据分析 价值判断技术特点: 数量化 定量与定性结合活动特点: 单一性活动 综合性活动第二讲教育评价指标体系概述一、需记忆的问题1指标:(狭义的 指标:被评价的因素。)广义的指标包括因素、权重、标准和文字描述。2指标体系:被评价的全部因素的集合。二、需理解的问题1设计指标体系的六个原则:(P2226)(要学会举例)1).方向性原则(思想): 在设计指标体系时思想上必须重视体现教育性质、教育目标这个大方向。具体地说,就是要体现办学的社会主义方向,体现教育事业发展、改革和提高的方向。所以,从哪个方面去评价,如何分配表示重视程度的权数,均要有明确的导向,要克服片面性。(关于重智育、轻德育,重考试分数、轻素质培养等倾向都是与我们的教育性质、教育目标不相符合的。又如对教师的评价也应注意克服重业务能力,轻思想表现和工作态度的这种片面性,必须坚持又红又专、教书育人的方向。对于这些,设计指标体系时都应有所体现。)2).一致性原则(思想):指的是具体设计指标体系时,指标和目标的一致。这就要求指标体系既是具体的、行为化的,又是反映事物本质的。例如对学生的品德评价,其指标体系应该与国家教委颁发的德育大纲取得一致。(比如对中学生的思想政治品质方面的评价可具体为政治理论知识、政治态度、理想志向等,而对道德品质方面的评价可具体为遵纪守法、集体精神、公益活动表现、尊重关心他人的态度、艰苦俭朴作风等方面。)又如评价班主任工作时,要和班主任工作的条例、规定取得一致。3).系统性原则(技术):指评价指标体系应具有全面性(即整体性)、联系性和层次性。全面性指设计指标体系时要注意评价对象自身的全面考核,不能片面。无论是评价校长、教师、学生或是评价班级、教学过程等,均要求考核内容要全面,比方有结果也有过程,有人的方面也有物的方面,有静态也有动态等。(如对教学的评价,不能只是结果,还要有过程。对学业的评价,不能只是评价学业成绩,还要评价学生的非智力因素。)联系性:是指当评价对象处于更大的系统中时,要注意它与周围的纵向及横向的联系。比如对学校的评价,应该注意到它的学生来源,所处的社会、地理环境等,并且应在指标体系中有所体现,以示评价的公平合理性。层次性,指就评价对象的不同类型制定不同的指标体系和评价标准。如重点学校与普通学校,城镇学校与乡村学校,经济发达地区与贫困山区等,或初中生与高中生的品德,在要求上有不同的层次,因此在设计指标体系时均应有所考虑。4).独立性原则(技术):指各项指标之间要相互独立,不能有所重叠。也就是说,相互之间不能有交叉或重叠,是独立地提供信息的。比如,对学生品德、道德品质的评价,如遵纪守法、关心他人、帮助他人,其中帮助他人和关心他人有点类似,有些交叉和重叠的关系,这样就不利于评价的科学性和精确性,增加了评价的工作量,也增加了评价的复杂性。5).可测性原则(操作):指的是使抽象的目标具体化,使它具有直接的可测性。如行为表现、出勤率等可直接测到的,但关于一些内隐的思想品德则是抽象的,它的质和量是无法觉察与度量的。如对学生社会理想的评价,表面上是不可测的,但可通过其人生价值观念、政治思想倾向、个性心理品质以及学习活动表现四个方面测评学生的社会理想。6).可接受性原则(操作):要求设计指标体系时应从实际出发,并且按照指标进行评价时是可行的。可接受性原则,具体地说包括以下五点:指标既要体现原则,又要切合实际。如对初中生品德的评价,按高中生的要求,就不切合实际,大家都不能接受,也就不具备可操作性了。指标应有鉴别力。设计指标时要考虑有足够的信息可资利用。设计的指标要考虑人力、物力、财力以及时间所允许的条件。指标的量化方法不宜过于复杂。2指标体系在评价中的作用:1) 对评价对象的行为起质的导向作用。2) 有助于评价反馈功能的发挥。3) 有助于提高评价的客观性和精确性。4) 有助于增强评价结果的可比性。总的来说,指标体系既是评价工作的基础,也是评价工作的核心,它对评价起着统揽全局的作用。第三讲教育评价指标体系的设计方法一、需记忆的问题:权重:每个指标在整个指标体系中的重要性。二、需理解的问题:1.布鲁姆“分类学”中认知领域的作用及分类作用:它主要用于学业方面的评价,比如学科考试的命题可灵活运用认知领域的分类。布鲁姆“分类学”中认知领域的分类: 识记 、理解 、应用 、分析 、综合 、评价 六个方面。(确定指标权重的方法有哪些?该如何操作?主要掌握如下两种方法及操作程序)(注意:以下2. 3题不但要知道步骤,还要知道如何操作。因为出题如:用对照配权法确定老师德、智、体、美、劳各占百分之几或老师德能值的权重?)2对照配权法确定权重的步骤 (对照配权法: 定量与定性结合):步骤:对每两个指标进行对照比较赋分(满分值为1);分别计算各个指标的得分和;将每个指标的得分和除以全部指标的总得分即为每个指标的权重。(见P35表2-5)表2-5 课堂讲授评价指标权重分配评价指标对 照 比 较 赋 分得分和权重教学目标0.4 0.2 0.61.20.20教学内容0.6 0.3 0.61.50.25教学方法0.8 0.7 0.92.40.40教学进程0.4 0.4 0.10.90.15总计1 1 1 1 1 1613咨询法确定权重的步骤 (咨询法: 定性和定量结合):步骤:让每个被咨询者对已设计好的指标进行排序,重要至次要的序数从大到小排列(如P36表2-7)把众多被咨询者排序结果全部放在一个表(如P37表2-8)计算各个指标的总序数将每个指标的总序数除以全部指标的总序数即为每个指标的权重。(见P37表2-8)表2-8 学生品德评价指标权重分配 指标排序被咨询者思想政治品质道德品质个性心理品质能力总计1432123421.123412总计45392214120权重0.380.320.180.121第四讲 教育评价中收集资料的方法一、需记忆的问题:1限制式问卷:对提出问题事先安排好答案,让对方从中选择。限制式问卷又分为单选、多选和排序三种。2开放式问卷:对提出问题事先不安排答案,让对方自由回答。3半限制式问卷:对提出问题事先既有安排好答案,也有自由回答。4类别量表:表示事物的分类。5顺序量表:表示事物的顺序。 6等距量表:既可表示事物的分类、顺序,也有相等的计量单位和相对零点。7比率量表:既可表示事物分类、顺序,也有相等的计量单位和绝对零点。二、需理解的问题1四种收集资料方法各自所适用的情况1) 观察法:适用于行为表现方面的评价。2) 问卷法:适用于内隐的心理活动方面的评价,比如思想性、认识性比较强的问题。3) 访问法:适用于深入了解情况以及不具备填答问卷能力的对象。4) 测量法:适用有量表可测的事物。2选用问卷种类的原则: 能比较简明扼要表达答案意思的可用限制式问卷。 能比较简明扼要表达答案意思,但把握不到安排的答案能否包含所有的想法,可用半限制式问卷。 对于一些复杂的探讨性的问题,不易简明扼要提安排答案的,可采用开放式问卷。3对测量结果的正确理解鉴于测量误差是不可避免的,尤其是随机误差,所以对测量结果应给予正确的解释。比如,不能把测试结果看作一个确定的点,而是具有一定分布范围的或带状的。一个人测试的结果只是他的真实结果的估计值。认识到这一点,我们即可避免对两次测试结果之间小的差别作过分的解释,或不会将两位被测者之间分数不甚大的差别当作有意义的事情看待。(P60倒数第二段)。第五讲描述性统计分析评价方法综合指标一、需记忆的问题:1描述性评价: 对数据资料计算综合指标,然后根据综合指标值对教育客观事物给予评价。2综合指标: 指的是从数量方面综合说明事物特征的指标。(常用的综合指标有绝对数、相对数、平均数和标准差。)3.各种综合指标的计算方法:(自己听课件后重新整理)(一) 绝对数(规模):即平常说的总数。主要说明事物规模的特征。(二) 相对数(程度):即平常说的百分数。用来说明事物的程度或幅度的特征。(三) 平均数(水平):主要用来说明事物水平的特征。通常可用符号表示平均数1)算术平均数(未经分类汇总的测量数据资料)计算方法见p62的(4.1)公式。 (例如,某小组九位学生的数学成绩分别为:76,98,85,64,86,79,90,60,88.根据(4.1)式可求得该小组的平均分数为:这就是该小组学生数学考试成绩的水平.)2)加权平均数(已经分类汇总的资料)组距数列平均数(对测量数据分组统计人数)例如P63表4-1的资料。计算方法如P63的(4.2)公式及83名教师平均年龄的计算。P63的(4.2)计算公式为:式中 为各组中值,f为各组次数。例如据表4-1(某校教师年龄次数分布表)可算得平均年龄为:以此可反映出该校教师的年龄水平。表4-1 某校83名教师年龄次数分布表年龄组组中值次数f505552.55455047.51340 - 4542.51735 - 4037.52030 - 3532.51625 - 3027.5920 - 2522.53总 计83附注:各组不包括上限值(即终点值)* 为了减少计算的麻烦,在此介绍计算器统计功能的使用:A、操作步骤计算器的统计功能的计算只能得到如下六个统计结果:n(数据个数)、(数据和)、(数据平方和)、(平均数)、(总体标准差)和S(样本标准差)。操作步骤如下:1) 显示统计状态:2ndF STAT(或SD) 2) 输入数据: 每输入一个数据按DATA键3) 取出统计结果:这时六个统计结果均处于待取状态,可根据需要取出其中的结果。B、注意事项1) 若需继续进行第二组数据的统计运算时,需取消统计状态,再按上述步骤操作。按2ndF STAT即可取消统计的状态。2) 若不需要计算、和S时(即进行其他一般运算时),也应取消统计状态)。3) 加权平均数输入数据时每输入一类即按DATA,例如对P63表4-1的输入如下:52.55 DATA,47.513 DATA,22.53 DATA。 总平均数(已知各个平均数)例如P66表4-4的资料。计算方法见P66的(4.5)公式及对表4.4的计算。同样可用计算器操作。计算公式为:式中 代表总平均数, 代表各平均数, 代表各平均数所对应的次数,K 代表平均数的个数。例如,根据公式(4.5)我们可以算得表4-4 全年级数学成绩平均分为:表4-4 某年级各班学生人数与数学平均成绩班 次一二三四人数( )40384341平均成绩 ( )75.5807881.5等级平均数(对个体赋不同等级并按等级归类汇总)计算方法见P63的(4.3)公式及对表4-2的计算,同样也可以用计算器操作。注意编号可以倒数编,如表4-2的优、良、中、及、不及 按5、4、3、2、1的顺序编号,计算的等级平均数是3.95,但最终的价值判断是一样的,即都是处于良好的水平。P63的(4.3)计算公式:式中X 代表各等级编号,f 代表各等级次数,N 代表总次数。例如,对表4-2我们可根据公式(4.3)算得等级平均数为:由此可知,该班学生的品德是处于良好的水平。表4-2 某班学生品德考核情况等 级编 号次 数优 秀113良 好216中 等36及 格43不 及 格51总 计39等级平均数适用于类别数据的计算,如品德、兴趣、情感等非学业成绩方面的分析评价,常常需要用到等级平均数,它既可以用于对集体的评价,也可以用于个体的评价。评分平均数(对各个方面赋不同比重并评分)例如p65表4-3的资料,计算方法见p65的(44)公式及对表4-3的计算,同样也可以用计算器操作。P65的(44)计算公式:式中X 代表各方面的分数,P 代表各方面的比重。 例如,表4-3 是对甲、乙两名学生按德、智、体、美 四个方面以五分制分别评分,两人的总分是相同的,均为15分。但如果根据所给的比重以及公式(4.3),我们则可算得:甲平均分数 乙平均分数由此可知,综合评判这两名学生,甲生稍强于乙生。表4-3 甲、乙两学生的考察评分情况项 目评分 ( X )重 ( P )甲乙德5430智4440体3420美3310总 计1515100根据评分平均数的特点可知,它是一种全面性的分析评价,因此,常常用于评比、选拔等。而且可按如下程序进行:设计指标;确定指标权重;制定评选标准;评分;计算评分平均数;确定人选。3)平均发展速度指事物在某一时期内的平均发展情况.计算方法见p66的(4.6)公式,由于根据公式往往需要开高次方,不容易做到,所以把(4.6)公式转换为对数的形式计算,即(4.7)公式,但仍然比较麻烦.因此,可以利用计算器非统计功能中的开高次方,使用直接取得结果,但必须取消统计状态。P66(4.6)计算公式 :式中代表平均发展速度, 为初期的数值, 为末期的数值,N为初期至末期的时间间隔数。有时N往往大于2,需要开高次方,所以计算时可用对数法计算,即公式(4.6)可改为下面的公式:然后求反对数即得平均发展速度 。例如,根据我国普通高等学校在校学生1980年为114万人,1985年为170万人,我们可应用公式(4.6)算得:再求0.0346 的反对数可得“六五”时期高等学校在校学生的平均发展速度或108.3%,即“六五”时期高等学校在校生的平均每年发展水平是108.3%,每年平均增长速度为0.083或8.3% .平均发展速度是一个相对数,例如p67算得表示平均每年在校生都是上一年的1.083倍。平均发展速度的作用有两点:分析评价事物在一定时期内的平均发展速度。可以用于预测未来的情况,预测公式为:,可用计算器中的乘高次方取得结果。(四)标准差(差异)通常用符号(总体标准差)或S(样本标准差)表示。1. 标准差的计算方法 未经分类汇总的资料:见P68(4.7)公式以及对甲、乙两组成绩的计算。可用计算器中的统计功能,按照算术平均数的方法输入数据,即可同时得的结果。P68(4.7)计算公式: S = 式中 为每个数据, 为平均数,N 为数据个数。例如 甲、乙两个小组某科成绩如下:甲组:55,58,63,75,80,88,93,95,100,100乙组:68,70,72,75,80,83,85,89,90,95可算得: =80.7, =80.7 (平均数),因此可算得:S甲 = S乙 = 以上甲、乙两个小组的平均成绩虽然是相同的,但据S甲 S乙 可知, 乙组学生成绩的差异比甲组小,也即是说,乙组学生的成绩比甲组的整齐.已经分类汇总的资料:见p68的(4.8)公式以及83名教师年龄的标准差计算。同样可用计算器中的统计功能,按照加权平均数的方法输入数据,即可得的结果。对于前面所举的加权平均数的例子,计算器操作时均可同时算得平均数和标准差。P68的(4.8)计算公式: 式中X为分类汇总后各类的数值,f 为各类的次数。例如就前面的表4-1(某校83名教师的年龄次数分布表)可算得该校83名教师年龄的标准差为:S = 注意,此例各类的数值即是各组的组中值。二、需理解的问题:1 各种综合指标的作用:(要通过例子理解)1)绝对数:说明规模。2)相对数:说明程度。3)平均数:说明水平。4) 标准差:说明差异。2对标准差的解释:(要会操作,如一道计算题,要求算标准差,并解释)标准差的值愈大,则说明差异愈大,否则说明差异较小。但究竟标准差大好还是小好?这不能一概而论需要具体问题具体分析。3. 总体标准差与样本标准差的区别:1)分母不一样。(总体标准差)的分母是n, 而S(样本标准差)的分母是n-1 ; 2) 总体标准差是根据总体的数据计算的,而样本标准差是根据样本的数据计算的。第六讲 描述性统计分析评价方法平均数与标准差的综合应用一、需记忆的问题1集中趋势:指大多数数据比较趋近的水平。通常把描述集中趋势的量数称为集中量数,平均数是最常用的一种集中量数。2.离中趋势:指数据之间的变异程度或离散程度。通常把描述离中趋势的量数称为差异量数,标准差是最常用的一种差异量数。3标准分数的计算方法:正确评价学生的学习成绩 1)Z0时,该成绩高于集体平均水平。2)Z S乙 可知, 乙组学生成绩的差异比甲组小,也即是说,乙组学生的成绩比较整齐,甲组的成绩比较参差不齐。又如思考与练习的第6题。P385(除了算平均数外,还要算标准差。标准差小的,说明大家对他的任职情况的看法比较一致。标准差大的,说明干部职工对他的任职情况不那么一致。)2) 因为数据既有集中趋势的特征,也有离中趋势的特征,要把两种特征都反映出来,就既要有平均数,也要有标准差。而传统的评价比较总体方法只以平均数对总体进行评价比较,只顾及了平均数,而忽略了标准差, 这是片面的。2标准分数的解释(要学会操作。如算出某个学生的成绩并解释。)1)Z0时,该成绩高于集体平均水平。2)Z0时,该成绩低于集体平均水平。3)Z=0时,该成绩就处于集体平均水平。4)Z值愈大,该成绩愈好。3. 标准分数的作用及应用标准分数的作用:把各种不同类型的分数统一在高于或低于集体平均分多少的标准上衡量。标准分数的具体应用:1)正确评价同一学生不同科目的成绩,如前面例子。2)正确评价同一学生同一科目不同阶段的成绩。如前面例子。3)正确评价不同学生多科总成绩。例如p136表8-10。表8-10 甲、乙两生成绩表科 目全班考试分数标准分数平均分标准差甲乙甲乙语文7014.080850.711.07数学853.590881.430.86地理554.057510.50- 1.00历史425.045400.60- 0.40政治708.070900.002.50总计3423543.243.03高考
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《新型黄病毒研究报告》课件
- 《急性脊髓炎》课件
- 《讲师张小铁》课件
- 《高层管理的任务与课件制作》课件
- 《有限责任公司战略发展》课件
- 快乐木偶综合征的临床护理
- 养成记录型理财管理
- ThinkPHP之配置源码执行流程
- 妇女自信心培训
- 个人工作总结发言稿模版
- 游戏室电竞椅行业跨境出海战略研究报告
- 初二下学期期中家长会发言稿
- 福建省福州市2025年初中毕业班教学质量检测二生物学试卷(无答案)
- 山东省济南市东南片区2024-2025学年七年级下学期期中考试英语试题
- 2025-2030中国城市规划行业深度分析及发展前景与发展战略研究报告
- 2025年全国焊工作业人员职业技能理论考试练习题库(900题)含答案
- 道岔区无砟轨道我国高速铁路道岔区采用的无砟轨道主要有长枕埋
- 《行政法与行政诉讼法》课件各章节内容-第二十六章 行政赔偿及诉讼
- 【9物一模】2025年安徽省合肥市45中(橡树湾)中考一模物理试卷
- 计算机系统规划与管理考试内容试题及答案
- 药店质量负责人聘用合同范例二零二五年
评论
0/150
提交评论