第六章 资料的整理与分析(教育统计测量法)_第1页
第六章 资料的整理与分析(教育统计测量法)_第2页
第六章 资料的整理与分析(教育统计测量法)_第3页
第六章 资料的整理与分析(教育统计测量法)_第4页
第六章 资料的整理与分析(教育统计测量法)_第5页
已阅读5页,还剩155页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、教育统计与测量教育统计与测量 赖燕玲 赣南师院教育科学学院第七讲 教育统计测量在教育科研中 的运用 第一节、教育统计测量的基本含义 第二节、教育统计法的基本内容 第三节、教育测量法的基本内容 第一节、教育统计测量的基本含义 1.教育统计教育统计主要研究如何收集、整理、分析由 教育调查和教育实验所获得的数据资料,并 以此为依据进行科学推断,揭示教育现象所 蕴涵的客观规律。 2.教育测量教育测量就是对教育领域内的事物或现象, 根据一定的客观标准,作缜密地考核,并依 一定的规则将考核的结果予以数量描述。如 对学生的思想品德、健康状况、学业成绩等 的测量。 3.教育统计与测量

2、在教育科研中的作用教育统计与测量在教育科研中的作用 把统计与测量用于教育科研内容的分类整理、编 制试卷或统计各种图表,进行变量之间关系的定 量分析或由样本推论总体等,形成教育现象的量 化描述,将会大大增强教育问题解释的科学性和 有效性。 例如,我们可以用标准差s这个统计学的差异量 数更准确地表示某个群体考试成绩的离散程度; 用标准分z更可靠地定位个体在群体中的水平,并 可以把不同学科无相加性的原始分数转化为z分数 求代数和,用以说明个体的综合学习成绩;还可 以用查关量数科学地判断两个变量共同变化的伴 随关系 等等。 表一:高一(表一:高一(2 2)班)班3030名学生语文、数学、英语期末考试成

3、绩名学生语文、数学、英语期末考试成绩 (三科成绩均服从正态分布) 问题:如何整理这些数据资料,从而以方便进一步的分析研究?问题:如何整理这些数据资料,从而以方便进一步的分析研究? 学号 语数英 学号 语 数英 学号语数英 018793851180727621676571 026567741276818222807883 037372801366707323848795 049486821453576024867775 058078761544525325616264 067875651649504526687274 077580761774818027726966 08636058186970

4、7328788688 095866671973747229828178 107074742052435430767585 例如,例如,某校初一共有某校初一共有3个班,某次语文测验中,一班个班,某次语文测验中,一班50人均分为人均分为68,二班,二班45 人均分为人均分为75,三班,三班40人均分为人均分为80,问全校初一语文的平均成绩?,问全校初一语文的平均成绩? 例如:某市近几年来高中毕业生人数如下表,试求平均增例如:某市近几年来高中毕业生人数如下表,试求平均增 长率;照此速度增长,到长率;照此速度增长,到1995年预计有多少高中毕业生?年预计有多少高中毕业生? 又如:某班甲乙两组在一次测验

5、中的成绩分别为又如:某班甲乙两组在一次测验中的成绩分别为65,68,71,72, 74(均分为(均分为70分)和分)和 30,50,86,90,94(均分为(均分为70分)。如何评分)。如何评 价两组的学习情况?价两组的学习情况? 再如某一统一考试中,学生甲语文得67.2分,数学得61分,则其两科 原始分数相加共128.2分;学生乙语文得 75分,数学得50.5分,则其 两原始分相加共125.5分。那么到底谁的成绩更优秀一些? 假如一次考试要录取百分之二十的人,那么录取分数线如何确定? 从体育达标测验的学生中随机抽取60人,其中男、女达 标情况见下表,问本次达标测验是否与性别有关? 为调查小学

6、生对两种不同教学法的识字情况,随机抽取 了10名小学生记录下旧教学法与新教学法的识字得分如 下,问两种教学方法是否一样?(附表数据) 你想自己编制一套测验,如何编制?测验的信度、效度 如何?项目的难度和区分度怎么样?等等。 碰到这样的问题你该如何解决? (学习教育统计学可以帮助你科学合理的解决上述问 题。) 第二节、教育统计基本方法介绍 一、描述统计法-研究如何对客观现象的数量特征 进行计量、观察、概括和表述。 二、 推断统计法-据数据所提供信息对数据所来 自的总体(母体)的性质作推断。 描述统计的主要方法 集中量数集中量数: : 描述集中趋势描述集中趋势 差异量数差异量数: : 描述离散程度

7、描述离散程度 相关系数相关系数: : 描述关系程度描述关系程度 偏态系数偏态系数 峰态系数峰态系数 次数分布图次数分布图, 如如直方图直方图 发展趋势折线图发展趋势折线图 相关散点图相关散点图 描述数据的 正态程度 目的:目的:对总体特征作出推断。 内容:内容: 推断统计 均数差异显著性检验均数差异显著性检验 次数分布差异显著性检验次数分布差异显著性检验 比例数差异显著性检验比例数差异显著性检验 变量间关系显著性检验变量间关系显著性检验 一、描述统计统计法(一) :统计表 构成:统计表一般由标题、表号、标目、 表注等构成。 横标目的总标目 (亦可空白) 纵标目 (一般设谓语) 横标目数字 表的

8、标题 ? ? ? 注脚:说明资料来源等 x x x (顶线) (底线) 统计表基本格式 编制统计表的要求 ()表的结构要简单明了,层次清楚。 ()表的标题要简明扼要地、确切地反映表的内容,写 在表的上端的中央位置。 ()表的标目有横、纵标目之分。 一般将统计表所要叙 述的主要对象放在横标目 上,而将用以叙述的统计指标在纵标目上。 ()表内数据排列要整齐,小数点位置要对齐,缺数据 格或无数据格要划斜线。 ()表的标题、标目或数字有未尽之意的地方,应加脚 注说明,表中资料的来源应在底线下加以注明。 简单表 表2 重庆2中各年高考录取人数 年份 1993 199 4 1995 1996 1997 合

9、计 高考录取 人数 101109110150190560 复合表 表2。4 某高级中学各年级文理科男女学生人数 科别文科理科总计 男女男女男女 高一 12085180110305195 高二 11090170105280195 高三 14011019095340205 总计 370285545310915595 频数分布表频数分布表 对于一组大小不同的数据划出等距的分组区间 称为组距(i),然后将数据按其数值大小列入 各个相应的组别内,便可以出现一个有规律的表式。 这种统计表又称之为次数分布表。 编制次数分布表的步骤编制次数分布表的步骤 (1)求全距。全距指最大数与最小数之间的差距:r=max

10、-min (2)定组数(k): k=1.87(n-1)2/5 (3)定组距(i)-组距是指每一组的间距:i=r/k 取整 (4)列出分组区间。分组区间又称为分组阶段。 列分组区间要注意以下几点:最高组区间内应能包含最大值 的数据,最低组区间应能含最小值的数据。最高组或最低组的下 限最好是组距的整数倍。分组区间可写为10一,20一,30一,40一 等,但我们必须明确,实际上各组的精确界限应是9.5一19.499 (5)求组中值:组中值=(组实上限+组实下限)2 (6)登记次数。依次将数据登记到各个相应的组别内,一般用划线 记数或写正字的方法。 (7)计算各组绝对次数(f)、相对次数(f/n)、累

11、积次数、累积相 对资料(累积百分比)。各组的次数计算好后,还要计算总和即 总次数(f)。一是为了以后计算的需要,二是为了核对各组总 和与数据总数(n)是否相等。 (8)抄录新表。登记核实后,重新制表。 以前面表一:高一(以前面表一:高一(2 2)班)班3030名学生语文、数学、英语期末考试成绩中的语文名学生语文、数学、英语期末考试成绩中的语文 成绩为例成绩为例 上表中高一(2)班30名学生语文成绩频数分布表 数据的初步整理,比整理前的数据更方便进行分析。数据的初步整理,比整理前的数据更方便进行分析。 分组 区间 组中值 xc 简单 频数f 相对次数 f/n% 累积 频数fb fa累积百 分比%

12、 90-94.513.333013.33 80-84.5723.3329826.67 70-74.51033.34221860 60-64.5723.33122583.33 50-54.531052893.33 40-44.526.67230100 x30 累积频数分布表及累积百分比分布表累积频数分布表及累积百分比分布表 利用计算机制表 常用的计算机软件: excel,spss制表 用excel软件制表 语文语文数学数学英语英语物理物理化学化学政治政治体育体育 高三(1)75698976798384 高三(2)82659065778976 高三(3)72888789856789 高三(4)67

13、817981896963 1.1.统计图的功用统计图的功用 所谓统计图就是依据数字资料,应用点、线、面、体、色彩导的 描绘制成整齐而又规律,简明而又知其数量的图形。统计图一般 采用直角坐标系,横坐标用来表示事物的组别或自变量x,纵坐标 常用来表示事物出现的次数或因变量y. 2.2.统计图的结构与制图要点:统计图的结构与制图要点: 图号及图题 图目 图形图形 图注图注 3.3.统计图的种类:统计图的种类:统计图可按形状、数字性质、图的用途等标志 分为多种类别。教育统计中常用的统计图可按形状划分为直条图、 直方图、曲线图、圆形图、散点图等等。 一、描述统计法(二):统计图 统计图:由标题、图号标目

14、、图注等项构成。 单式条形图 0 20 40 60 优良及格不及格 图2 。 3 某 中 学考核结果 人数 第一节 统计表与统计图 复式条形图 0 20 40 60 80 100 高三(1 )高三(2 )高三(3 )高三(4 ) 语文 数学 英语 物理 圆形图(饼图) 图2 。 2 某中 学考核成绩人数 优 23% 良 47% 及格 18%不及格 12% 优 良 及格 不及格 圆形图(饼图) 折线图 图2 。 5 某 市 教育系统1 9 9 5 - 2 0 0 0年 人 员 平 均 工 资 和经费投入变化情况(1 9 9 5 年= 1 ) 0 1 2 3 1995 1996 1997 1998

15、 1999 2000 平均工资 经费投入 4. 线条图 5. 频数颁布直方图 图.4中考化学统计成绩直方图 6. 累积频数图 图.5 2004年中考化学抽样得分情况累积频数图 10 20 30 40 50 60 70 80 90 100 图2.6:高一语文 7、面积图面积图 北京、四川城镇居民消费性支出比较 0.00 1000.00 2000.00 3000.00 4000.00 5000.00 6000.00 食 品 衣 着 家庭设备 医疗保健 交通和通讯 文化教育 居 住 杂项商品 四 川 北 京 利用计算机制图 常用的计算机软件: excel,spss制图 用excel软件制图 级 别

16、2001级2000级 count 12 10 8 6 4 2 0 去 向 高 校 研 究 所 企 业 国 家 机 关 读 博 中 小 学 excel,spss制图 一、描述统计法(三):特征量 最常用的统计量有三类: 一类是代表一组数据典型水平或集中趋势的量,即集中量集中量; 另一类是反映一组数据的变异程度或离散程度的量,即差异量差异量 第三类是反映数据的相关程度的量,即相关量相关量。 一、集中量 定义:代表一组数据典型水平或集中趋势的量。 常用的集中量有平均数、中位数和众数。 其中平均数又有以下几中类型,它们分别有着 不同作用。 算术平均数 加权平均数 几何平均数 平均数 1、算术平均数 2

17、、加权平均数 3.几何平均数 1、算术平均数 (1)未分组数据平均数的计算方法 (2)数据分组后计算平均数的方法 (3)平均数特点 (4)平均数的意义与应用 算术平均数:简称为平均数或均数(mean)。 ,xym (1)未分组数据平均数的计算方法(原始数据) 当一组数据未进行统计分 类时,若想描述其典型情况, 找出其代表值,可计算算术 平均数,公式为: 公式中xi表示所有数据 的和,即 xi=xi+x2+xn n为数据的个数。. 1 n i i x x n 例如,求某小组10个学生的数学测验分数 78,79,62,84,90,71,76,83,98, 77的平均数。 表一表一 高一(高一(2)

18、班)班30名学生语文、数学、英语期末考试成绩名学生语文、数学、英语期末考试成绩 (三科成绩均服从正态分布) 学号 语数 英 学号 语数英 学号语数英 018793851180727621676571 026567741276818222807883 037372801366707323848795 049486821453576024867775 058078761544525325616264 067875651649504526687274 077580761774818027726966 086360581869707328788688 095866671973747229828178

19、107074742052435430767585 (2)数据分组后计算平均数的方法(频数 分布表) 公式为: c xf x n 表二:高一(2)班30名学生语文成绩频数分布表 分组 区间 组中 值xc 简单 频数f 相对 次数 f/n% 累积 频数 fb fa累积百分 比% 90-94.513.333013.33 80-84.5723.3329826.67 70-74.51033.34221860 60-64.5723.33122583.33 50-54.531052893.33 40-44.526.67230100 x30 (3)平均数特点: 离均差之和等于0。 在一组数据中,每一个数都加上

20、一常数c,则所得 的平均数为原来的平均数加常数c。 在一组数据中,每一个数都乘以一个常数c,则所 得的平均数为原来的平均数乘以常数c。 (4)平均数的意义与应用 算术平均数具备一个良好的集中量数应具备的一些条件: 反应灵敏。 确定严密。 简明易解。 计算简单。 符合代数方法进一步演算。 较少受抽变动的影响。 缺点: 易受极端数据的影响。 若出现模糊不清数据时,无法计算 平均数。 此外,必要注意,凡不同质的数据不能计 算平均数。 2、加权平均数 (1)加权平均数的概 念 加权平均数是不同比 重数据(平均数), w表示各观察值的权数; x表示具有不同比重的观察值。 ii w i w x m w 例

21、 :某校初一共有3个班,某次语文测验中, 一班50人均分为68,二班45人均分为75,三 班40人均分为80,问全校初一语文的平均成绩? 89.73 404550 804075456850 wx 不能用:(不能用:(68+75+80)/3=74.33 3.几何平均数 (1)什么情况下要用几何平均数? 当一组数据中任何两个相邻数据之比接近常数, 即数据按一定的比例关系变化时,在教育与心理 研究中,如求平均增长率或对心理物理学中的等 距与等比量表实验数据的处理均应使用几何平均 数。 当一组数据中存在极端数据,分布呈偏态时,算 术平均数不能很好地反映数据的典型情况,此时 应用几何平均数或其他集中数据

22、(如中数、众数) 来反映数据的典型情况。 (2)几何平均数的基本公式 12 n g n xxxx 例如:某市近几年来高中毕业生人数如下表,试求平 均增长率;照此速度增长,到1995年预计有多少高中 毕业生? 年度学生人数 19872000 19882200 19892430 19902600 19912880 1.先根据公式求平均变化率: 4 12 1.1000 1.1045 1.0700 1.1077 1.0954 n g n xx xx 2.从而平均增长率:1.0954-1=0.954 3.四年后该市的高中毕业生预计为: 4 1994 2880 (1.0954)4147 n ng xxx

23、4.根据前面两个步骤,我们可以推导出平 均变化率的变式: 1 1 / n gn xxx 5.在excel中如何实现: 二、差异量数 1.全距:最大值与最小值之差: maxmin rxx 2.平均差:平均差是根据分布中每一个观测值计算求得的, 它较好地代表了数据分布的离散程度,但由于取绝对值,不 利于做统计分析,是一种低效差异量数。 3.方差(varance)也称变异数、均方。作为统计量,常用符 号s2,x2表示,作为总体参数,常用符号2表示。 4.标准差(srandard deviation)即方差的平方根,常用s 或sdx表示。若用表示,则是指总体的标准差。 例 方差与标准差的意义方差与标准

24、差的意义 返回前面提出的问题 通过spss解决 例:有5名被试的错觉实验数据如下,求其平均差。 被试 12345 错觉量(单 位:毫秒) 1618202217 总体和样本的方差与标准差的计算公式总体和样本的方差与标准差的计算公式 2 2 1 2 1 2 2 1 2 1 () () () 1 () 1 n i i n i i n i i n i i xx n xx n xx s n xx s n 方差与标准差的意义方差与标准差的意义 方差与标准差是表示一组数据离散程度的最好指标, 其值越大,说明离散程度大,其值小,说明数据比较 集中,它是统计描述与统计分析中最常应用的差异量 数。 它基本具备一个

25、良好的差异量数应具备的条件:(1) 反应灵敏;(2)有一定的计算公式严密确定;(3) 容易计算;(4)适合代数运算;(5)受抽样变动的 影响小,即不同样本的标准差或方差比较稳定;(6) 简单明了;(7)具有可加性。 又如:某某研究者对实验班用计算机辅助教又如:某某研究者对实验班用计算机辅助教 学,而对照班仍用传统的讲授方式进行教学,期学,而对照班仍用传统的讲授方式进行教学,期 末进行统一测试,两班学生的成绩如下,试比较末进行统一测试,两班学生的成绩如下,试比较 两种授课方式产生的效果有何不同?两种授课方式产生的效果有何不同? 实实验验班班 对对照照班班 8 83 3 8 86 6 8 87 7

26、 7 78 8 7 72 2 7 75 5 7 76 6 9 92 2 8 87 7 7 78 8 9 90 0 8 88 8 7 76 6 8 89 9 8 84 4 8 87 7 8 82 2 9 95 5 7 79 9 7 77 7 8 86 6 8 84 4 8 83 3 8 81 1 9 91 1 9 90 0 8 89 9 8 87 7 8 86 6 8 85 5 8 88 8 8 87 7 8 85 5 7 79 9 7 78 8 9 91 1 8 89 9 8 84 4 9 92 2 7 79 9 8 85 5 8 82 2 7 76 6 7 74 4 8 80 0 8 81

27、1 7 75 5 8 84 4 8 87 7 8 83 3 7 78 8 8 83 3 7 79 9 6 68 8 7 74 4 8 83 3 7 77 7 6 69 9 7 76 6 8 87 7 8 84 4 7 78 8 8 87 7 9 90 0 8 83 3 8 85 5 8 88 8 7 76 6 7 78 8 7 73 3 8 87 7 8 80 0 8 84 4 7 76 6 7 75 5 7 79 9 8 84 4 8 89 9 8 87 7 7 75 5 7 71 1 7 72 2 7 76 6 8 85 5 8 88 8 8 85 5 8 83 3 8 82 2 7 78

28、 8 6 66 6 6 65 5 总平均数=81.81 平均 分 标准 差 d方差和平方 和 实验 班 (45) 83.76 5.471.9529.92 38533241 07 对照 班 (46) 79.82 6.361.9940.45 35922885 44 差异系数 当所观测的样本水平比较接近,而且是对同一个特 质使用同一种测量工具进行测量时,要比较不同样 本之间离散程度的大小,一般可直接比较标准差或 方庆功的大小。标准差的单位与原数据的单位相同, 有时称它为绝对差异量。 差异系数,又称变异系数、相对标准差等,它是一种相 对差异量,通常用符号cv表示,其计算公式如下: (1)同一团体不同观

29、测值的离散程度的比较; (2)对于水平相差较大,但进行的是同一观测的各种 团体,进行观测值离散程度的比较。 %100 x cv 例题:某校期末考试语文平均成绩为 69.3分,标准差为11.2分;英语平均成绩 为94.8,标准差为13.8分。问哪一学科 离散程度大? %2 .16%100 3 .69 2 .11 )(语文cv %6 .14%100 8 .94 8 .13 )(英语cv 例题:设某考区已录取高中学生语文平 均分为69分,标准差为12.5分,而未录 取高中的学生语文平均分为40分,标准 差为12.5分。比较他们语文成绩的离散 程度。 cv1=12.5/69 *100%=18.12%;

30、 cv2=12.5/40 *100%=31.25%。 未录取学生的离散程度大。 相关量:用于描述两个或多个变量间关联程度的量。 相关关系 相关系数相关系数:用来描述两个变量相互之间变化方向 及密切程度的数字特征量称为相关系数。 积差相关 等级相关 点二列相关 相关 三、相关量 数学与物理、物理与英语相关性比较 数学物理英语物理 170757675 260636063 382756575 444605660 552557055 690978597 780894889 r0.91 0.26 相关系数与相关程度表一览表相关系数与相关程度表一览表 | r | 00.3 0.3|r| 0.5 0.50.

31、81.0 相关 程度 零相 关 微相关切实相关密切相关 高度相 关 完全相 关 相关关系 正相关 相关关系 零相关 负相关 积差相关系数 积差相关 两组(n30)的正态、且呈线性关系的连续变 量之间的相关。 积差相关系数的定义公式:积差相关系数的定义公式: yx n yyxx xy r )( 积差相关系数的定义 用原始数据计算: 用特征量计算: 例:p46 back nyynxx nyxxy r /)(/)( / )( 2222 yx n yxnxy r 等级相关系数 等级相关系数 以等级次序排列或以等级次序表示的变量之间的相关 spearman 二列等级相关: n不一定必须大于30 ) 1(

32、 6 1 2 2 nn d r r 数学d1物理d2d 1704753.50.5 26056350 3822753.5-1.5 44476061 5526557-1 69019710 78038921 902.0 )17(7 5.56 1 )1( 6 1 5.5 2 2 2 2 nn d r d r 由计算器算得 例:10个学生数学和物理成绩的等级相关分 析(p47 ) 序号序号数学分数数学分数x x物理分数物理分数y yx x等级等级y y等级等级d dd d2 2 194931100 2909222.5-0.50.25 386923.52.511 486703.57-3.512.25 57

33、2825411 6707665.50.50.25 7686579-24 8667685.52.56.25 964689811 106160101000 n=10n=1026 84.0 9910 266 1 )1( 6 1 2 2 nn d r r 点二列相关 在来自总体的两个变量中,一个变量是连续 变量,另一个变量是两分变量(男、女;对、 错;及格、不及格),点二列相关研究这样 两个变量之间的相关关系。 pq xx r t qp pb 相关系数 p、q两类变量的平均值 连续变量 的标准差 另一类别频 数的比例 一类别频数 的比例 性 别 男 男 男 男 女 男 男 女 女 女 男 女 女 男

34、男 成 绩 86 91 90 66 58 99 74 88 72 89 62 65 78 67 85 80 9 8566909186 p x 75 6 788858 q x 例:某班期末语文考试,从全体考生中随机抽取15名学生的考 试成绩,见下表。问该次考试成绩是否与性别有关? p48 201. 0 4 . 06 . 0 19.12 7580 pq xx r t qp pq 6 . 0 15 9 p4 . 0 15 6 q 19.12 t 例题:下表为某一测验中10名考生的卷面总分和一道选择题的 得分,试求该选择题的区分度.(与部分的相关) 考生abcdefghij 选择 题得 分 11110

35、01001 卷面 总分 75 57 73 65 67 56 63 61 65 67 66.667,62.25,5.804 66.667 62.25 0.6 0.4 5.804 0.373 pqt pq pq t xx xx rpq 由计算器算得:p=0.6,q=0.4, 相关 两个变量都是二分变 量,或者可以人为地 分为二分变量时,使 用 相关分析其相关 程度。 另一类数据合计 及格不及格 一类 数据 是aba+b 否cdc+d 合计a+cb+d )()()(dbcadcba bcad r 例:从体育达标测验的学生中随机抽取60人,其中男、女达 标情况见下表,问本次达标测验是否与性别有关? 另

36、一类数据合计 达标未达标 一类 数据 男201232 女111728 合计312960 )()()(dbcadcba bcad r 232. 0 28293132 11121720 254. 0 05. 0)58( r (一)统计检验的基本问题 1.假设与假设检验 假设一般专指用统计学术语对总体参数所做的假定性说明。 假设检验:通过样本统计量得出的差异作出一般性结论,判断总 体参数之间是否存在差异,这种推论过程称做假设检验. 2.一般原理:根据概率论中“小概率事件实际上不可能发生” 这一原理。一般小于0.05或0.01的概率称这小概率。0.05或 0.01也称为显著性水平,小概率值越小显著性水

37、平越高。因而 在一次观察中,小概率事件居然发生了,就有充分理由怀疑某 事件是小概率事件的假设前提是不正确的,就可以推翻原假设。 二、推断统计法:双总体平均数差异显著性检验法 (二)假设检验的步骤 1.建立原假设与备择假设, 双侧检验的原假设和备择假设为: h。:=。h1:。; 单侧检验的原假设和备择假设为: h。:。,h1:。 或h。:。,h1:。 这种只强调 差异而不强 调方向性的 检验叫双侧 检验。 这种强调某一方 向的检验叫单侧 检验。通常适用 于检验某一参数 是否大于或优 于、快于及 小于、劣于、 慢于另一参数 等一类问题。 2.在h。成立的前提下,寻找和决定合适的 统计量及其抽样分布

38、(常见的抽样分布有 正态分布和t 分布及f分布;对应的检验方 法称为z检验、t检验和f检验。 ),并计 算出统计量的值。 3.选定显著性水平,查相应的分布表来 确定临界值,从而确定出h。的拒绝区间或 接受区间。 4.对h。作出判断和解释。 即把临界值与统计量值相比较,若统计量 值勤落在h。拒绝区间中,则拒绝h。; 若统计量值落在h。接受区间中,则接受h。 两个总体都是正态分布、两个总体方差都已 知,独立大样本n30,进行z检验。 22 112212 1212 1212 12 2 2 dx dx n sn snn se nnnn xx t se dfnn 22 12 12 1212 d x d

39、x s e nn xx z s e 当总体正态分布、总体方差未知时,独立小 样本或相关样本要用t检验来检验差异。 22 1212 12 22 1212 2 1 2 1 1 xxxx dx xxxx r se n xx t r n dfn 其 中 两独立样本时 两相关样本时两相关样本时 返回前面提出的问题 正态 负偏态 正偏态 教育测量篇 教育测量概述教育测量概述 测验的信度测验的信度 测验的效度测验的效度 题目的难度题目的难度 题目的区分度题目的区分度 教育测验的编制与实施教育测验的编制与实施 测量是根据法则给事物赋予数量。测量是根据法则给事物赋予数量。 测量的三要素(参照点、单位、量具)测量

40、的三要素(参照点、单位、量具) 参照点:为测定事物的量,事先确定的参照点:为测定事物的量,事先确定的计量起点计量起点 绝对零点:计量起点在内容丝毫不存在一点量绝对零点:计量起点在内容丝毫不存在一点量 相对零点:共同约定的零点作为测量的起点(不存在倍数关系)相对零点:共同约定的零点作为测量的起点(不存在倍数关系) 单位:实施测量必须有统一的单位单位:实施测量必须有统一的单位 具有明确的意义,即:大家对同一个单位的理解一致具有明确的意义,即:大家对同一个单位的理解一致 测量过程中单位测量过程中单位“距离距离”的不变性,即:单位的实际价值处处相同的不变性,即:单位的实际价值处处相同 量具:测量工具量

41、具:测量工具 具有准确性具有准确性 具备操作的简约性具备操作的简约性 教育测量工具:试卷教育测量工具:试卷 测试题测试题 重视命题的研究重视命题的研究 量表:根据测量目的所设计的测试项目和赋值规则量表:根据测量目的所设计的测试项目和赋值规则 第一节、教育测量的概述 教育测量 教育测量就是对教育领域内的事物或现象,根据 一定的客观标准,作缜密地考核,并依一定的规 则将考核的结果予以数量描述。如对学生的思想 品德、健康状况、学业成绩等的测量。 特点: 间接性和推断性 测量对象的模糊性和测量误差的不可避免性 量表的多样性,结果具有相对抽象性 量表的类型 1.称名量表称名量表 类别量表,最低层次的量表

42、,用于分类,表示事物的不同类别和性质类别量表,最低层次的量表,用于分类,表示事物的不同类别和性质 用数字表示每一个研究个体:学号、准考证号用数字表示每一个研究个体:学号、准考证号 用数字代表事物的类别:用数字代表事物的类别:“1”、“0”表示表示“好好”、“坏坏” 2. 顺序量表顺序量表 也称位次量表,根据事物的特性和设定的法则在分类的基础上确定同类客也称位次量表,根据事物的特性和设定的法则在分类的基础上确定同类客 体中各元素之间的相对顺序体中各元素之间的相对顺序 只关心研究对象的顺序,不问津间距是否一致只关心研究对象的顺序,不问津间距是否一致 合格与否、优良中差等合格与否、优良中差等 3.

43、等距量表等距量表 间距量表,在赋值时有相等的度量单位,采用相对零点,被测所对应的测间距量表,在赋值时有相等的度量单位,采用相对零点,被测所对应的测 量值由明确的距离关系量值由明确的距离关系 原始测验分数经过统计处理后推导出一种新的量表分数,此分数的原始测验分数经过统计处理后推导出一种新的量表分数,此分数的“零点零点” 是一个相对零点是一个相对零点 4. 比率量表比率量表 具有等距量表的一切性质,采用绝对零点。具有等距量表的一切性质,采用绝对零点。 针对总体而不是样本针对总体而不是样本 不但能确定一个被测比另一个被测大(小)多少,而且还能得出其间的倍不但能确定一个被测比另一个被测大(小)多少,而

44、且还能得出其间的倍 数关系数关系 有关量表水平的说明 事物的复杂性决定测量量表的不同层次和水平 四种量表的测量水平由前往后逐渐提高,信息量不断 增大,前一种量表的特点和功能蕴涵于后一种量表之 中。(定性、定量) 不可过分苛求测量的高层次 不能把低层次量表的数据按高层次量表的意义理解或 作统计处理 教育测量是在顺序量表上进行的,但需要用等距量表 报告分数 加强命题的研究 把原始分数转换到一个有相等单位的量表上,通常转化 为标准分 教育测量的种类 一、按测评在教学中运用的时机分类 1、形成性测验 在教学过程中经常实施的,在性质上大致相当于现在的中 小学单元测验。形成性测验对于教师以及学生的作用。

45、2、诊断性测验 对经常表现出学习困难的学生所作的测量与评价, 它的目的是对个人的问题行为及其原因进行诊断。 诊断性多半是在形成性测评后实施。 3、终结性测验 用于教学结束后,在性质上相当于现在学校中所 进行的期末考试。其目的有两个:其一是在教学 目标之下,检查学生一学期的学业程度;其二是 根据终结性测评的结果,评定学业成就,并通知 学生家长或记入档案。 二者的区别: 第一,形成性测验在每个教学单元结束时 都要进行,是经常性的。终结性评价是在 整个教学或其中重要部分结束时才进行。 第二,形成性测验的主要目的不是为学生 提供证明,而是致力于引导学生掌握他所 具备的知识面,并试图发现学生错误的起 因

46、,从而采取因人施教的补救措施。而终 结性测验的主要目的是评定学生成绩,为 学生具有某种能力或资格作证明。 第三,形成性测验的内容一般限制在一个 教学单元的范围内;而终结性测验内容涵 养一门学科,对学生能力的概括水平高于 形成性测验。 三、按测评被试行为表现的性质分类 1、最佳行为测验 以测量被试的最佳行为表现为目的。凡是以成就或能力的 高低行为评价基础的,都属最佳行为测验。 2、典型行为测验 典型行为测验目的不在测评被试能力的高低,而是测评其 是否具备某种典型行为。 四、按测验的内容分类 1、智力测验 目的在于测量被试的智力并对被试的智力发展水平和特点 作出评价。 2、能力倾向测验 目的在于测

47、量与评价个人的潜在才能,预测个人能力发展 倾向。分为两种:一是关于能力测验;一是特殊能力倾向 测验。 3、成就测验 目的在于测评个人在接受教育或者训练后的成就。 常见的两种:一是学科成就测验;一是综合成就 测验。 4、人格测验 也称为个性测验,其目的在于测评被试的人格心 理特征。本测量与评价所涉及的内容层面也很多。 五、教育测验的其他分类 (一)按测量对象 1、个别测验 指的是同一主试在同一时间内只能测量一个被 试。主试与被试有更多的交流机会,对于一些 特殊的被试,如幼儿、文盲等,只能采用个别 测量与评价。但是个别测量费时、费力,特别 主试必须经过严格的训练才能胜任。 2、团体测验 指的是同一

48、时间内由一位主试测量多位被试。优 点是节省时间,可以在短时间内收集到大量的数 据,不足是不易有效控制被试的行为,容易产生 误差。 (二)按测量材料 1、文字测验 测量的内容是以文字的形式表现的。 2、非文字测验 测量的内容是通过图形、仪器、工具、实物、模 型等形式表现的。 (三)按量具的标准化程度可分为标准 化测验和非标准化测验 标准化测验是指由测量专家按照测验程序而编成 的一种测验。 非标准化测验是指测验的编制相对自由,没有严 格按照测验编制的程序进行。 (四)按测验的范围分类 宏观的教育测验:以教育的全领域或涉及宏观决策方面的 教育现象、措施为对象的教育评价。 中观的教育测验:以学校内部各

49、方面工作为对象的教育评 价。 微观的教育测验:以学生的发展变化为对象的教育评价。 良好测验的特征 一、可靠性(信度) 二、有效性(效度) 三、难易性(难度)和鉴别性(区分度) 四、实用性(可操作性) 第二节 测验的信度 信度信度(reliability):测验的稳定性、可靠性程度。 信度的统计定义 信度的种类 重测信度重测信度:同一测验同一测验对同组被试先后两次施测先后两次施测所得结果 的一致性程度。 复本信度复本信度:两平行测验平行测验对同组被试施测施测所得结果 的一致性程度。 同质性信度:测验内部所有题目间的一致性程度。 22 222 / xtxx etx r etx 复本信度的估计方法

50、高数高数x高数高数yx=x- y= y-x2y2xy 李安李安7177+1-4116-4 李连杰李连杰6888-2+7449-14 赵明赵明7882+8+16418 何其兵何其兵6276-8-5642540 郭宇郭宇6478-6-336918 成小亮成小亮6675-4-6163624 露思露思7184+1+3193 玛丽玛丽7380+3-191-3 汤姆汤姆7783+7+249414 杰克杰克70870+60360 7008100024418686 31. 4 10 186 y 40. 0 31. 494. 410 86 yx xy n xy r 94. 4 10 244 x xy 内部一致性

51、系数 这是求同一次测验的奇数测题 与偶数测题这两部分得分的相 关系数。 分半信度的计算方法: (1)先计算两半测验得分的皮 尔逊积差相关系数。 (2)再用斯皮尔曼布朗公式校正: r = yx n yxnxy xx r 例题: 被试010203040506070809101112131415 奇数 题(x) 20 18 23 21 17 18 20 17 16 13 14 13 12 88 偶数 题(y) 20 22 19 22 18 15 14 17 15 16 14 12 10 76 解:计算两个“半测验”得分的积差相关系数为:0.86。代入校正公式 得:0.92 。 所以,该测验的分半信度

52、系数为0.92。 923.0: 923.0 855.01 855.02 1 2 : 855.0 717.4334.415 133.15867.15153864 15,717.4,133.15 ,334.4,867.15,3864: 测验的信度为答 用斯皮尔曼公式校正 由计算器算得 xy xy xx n yxnxy xy y x r r r r n yx 提高测验信度的方法 第一,测题要有一定数量。题目较少,测 题抽样越受偶然性影响信度也越低。 第二,测题难度要适中。难度太大或太小 得分普遍高或普遍低,就会降低信度。 第三,测题内容要单纯集中,不宜过于庞 杂。 第四,测验时间要充分。 第五,评分

53、要客观。 1、设有、设有14名学生,经过一项测验,成绩如下表:本拟再名学生,经过一项测验,成绩如下表:本拟再 测一次以估计其信度,由于学生放假离校,不便再测。现测一次以估计其信度,由于学生放假离校,不便再测。现 拟估计其测验结果的信度。用什么方法估计?测验的信度拟估计其测验结果的信度。用什么方法估计?测验的信度 系数如何?系数如何? 14名学生某项测验成绩如表名学生某项测验成绩如表 rx1x2=0.948, rxx=0.97 974. 0: 974. 0 949. 01 949. 02 1 2 : 949. 0 158. 2737. 214 357. 5714. 714657 14,158.

54、2,357. 5 ,737. 2,714. 7,657: 测验的信度为答 用斯皮尔曼公式校正 由计算器算得 xy xy xx n yxnxy xy y x r r r r n yx 第三节 测验的效度 效度效度(validity):测验的有效性程度,即测验 实际测量出其所要测量特性的程度。 效度始终是针对一定测量目的而言的 效度只有程度上的差异 效度要从多方面、多角度加以验证 效度的统计定义 从某种意义上说,效度比信度更重要。 22 222222 / xvxy eivetx r eivetx 内容效度内容效度:测验题目样本对于应测内容与行为领域 的代表性程度。 逻辑分析 结构效度结构效度:测验

55、反映某种理论构想的准确性程度。 因素分析 内容效度与结构效度一般没有适当的计算方法。效标关联效度一般用 积差相关系数表示,如,求出入学测验分数与期末测验分数的相关系 数。效度指标一般认为在0.6以上是有效测验。 效标关联效度效标关联效度:测验对于特定情境下个体行为进行 预测的有效性程度。 相关分析 效标:判断测验效度(预测有效性)的外部标准。 效度的种类及其分析方法 一个测验要具有较高的 内容效度必 须具备两个条件: 1、测验内容范围明确、测验内容范围明确 测验内容范围明确是指测验必须明确界定所要测验的内容范围。对于测验内容范围明确是指测验必须明确界定所要测验的内容范围。对于 学生学业成绩测验

56、,我们较容易确定内容范围。因为这种测验的主要学生学业成绩测验,我们较容易确定内容范围。因为这种测验的主要 目标在于测验学生在某一学科中学习的效果,因此测验题目必须符合目标在于测验学生在某一学科中学习的效果,因此测验题目必须符合 教材内容,依据教学大纲,把握教学大纲所界定的重点难点,同时,教材内容,依据教学大纲,把握教学大纲所界定的重点难点,同时, 教学目标必须由试题反映出来。对于心理测验,内容效度不容量明确,教学目标必须由试题反映出来。对于心理测验,内容效度不容量明确, 因此,内容效度一般用于考查学生学业成绩测验的有效性。因此,内容效度一般用于考查学生学业成绩测验的有效性。 2、取样具有代表性

57、、取样具有代表性 取样具有代表性是指测验题目对欲没的全部内容覆盖面要大。对学生取样具有代表性是指测验题目对欲没的全部内容覆盖面要大。对学生 学业成绩测验而言,在编制题目时应对有关的教学大纲、教科书乃教学业成绩测验而言,在编制题目时应对有关的教学大纲、教科书乃教 学目教学目标进行系统分析,然后确定各种行为目标题目所占比重,学目教学目标进行系统分析,然后确定各种行为目标题目所占比重, 最后选择和确定好测验题目。最后选择和确定好测验题目。 内容效度的评估 1、逻辑分析法 用逻辑分析法估计内容效度,主要是指依据教材内容,教学大纲的 范围及教学目标分析测验内容,检查测验内容究竞在体现教材内容和 教学目标

58、方面达到多大程度。教材内容由教学大纲规定,学生预期的 行为变化情况由教学目标规定,教学目标主要是指布卢姆的认知目标, 包括对教材内容的认记、理解、应用、分析、综合以及评等方面的能 力。因此,判断内容效度时,必须按照教学大纲和教学目标对测验试 题逐一进行认真而细致的分析审查。审查包括各种测验类型题目的比 例是否恰当,题量是否合理,难易是否适度,题目对教材内容和教学 目标是否具有代表性和典型性。即对测验内容进行逻辑推理的评 判分析。其缺点是没有数量指标来描述教材内容、教学目标与测验试 题的一致性程度;主观性评判难以做到客观、准确。 内容效度的评估 2、用测验题目与教材内容比较的方法、用测验题目与教

59、材内容比较的方法 此法第一步便是内容范围的确定。在教育测验中,测验欲测之内容范围 是以命题双向细目表来确定 和详细描述。它包括教育目标和教育内容两个大 难度,各难度又分为若干小类,表中列出每一类的相对比例。 第二步是分析测验的每一项目,确定它们所涉及的知识和技能,列出同 类题目(涉及同一内容和目标)及其分数在测验中所占比例。 最后得测验的内容结构与测验欲测之内容范围结构(即双向细目表)相 对照。制定评定量表,计算测验内容对其内容范围的覆盖率,从而得到内容 效度的指标。 3、统计分析法(简介)、统计分析法(简介) 统计分析法主要是采取定量分析手段来描述测验的内容 效度。有以下 几种方法: (1)

60、克龙巴赫法 (2)评分一致性考查方法(3)前后测比较法 提高测验信、效度的方法 第一,要控制系统误差,即控制测验过程的误差,包括:第一,要控制系统误差,即控制测验过程的误差,包括: 测量标准的失真,题目的复杂现象,题目与指导语有暗测量标准的失真,题目的复杂现象,题目与指导语有暗 示性,答案具有明显的规律性。示性,答案具有明显的规律性。 第二,精心编制测题,分析教学目标,编制双向细目表,第二,精心编制测题,分析教学目标,编制双向细目表, 测题表述简明易懂,测题有必要的覆盖面。另外:测题表述简明易懂,测题有必要的覆盖面。另外: 测验中题目的数量应适当,不能太少。测验中题目的数量应适当,不能太少。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论