教育统计的基本方法_第1页
教育统计的基本方法_第2页
教育统计的基本方法_第3页
教育统计的基本方法_第4页
教育统计的基本方法_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育统计的基本方法,参考书目,教育统计学,王孝玲编著,华东师范大学出版社2001.7。现代教育统计与测评技术,朱德全、宋乃庆主编,西南师范大学出版社1998.7。教育统计的基本理论与SPSS操作技术,王秀玲、刘兰英编著,杭州出版社2000.7。统计分析指导,吴亚萍,教育科学出版社2003.9。,一、统计的含义,统计:搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断。教育统计:搜集、整理、分析有关教育研究和教育实践工作中的数字资料,并以此为依据进行科学推断,揭示教育现象所蕴涵的客观规律。,二、统计的作用,统计是进行定量分析的方法与工具。可用于教育科学研究、教育评价、教育管理等方面。注意:统计不是万能的工具!,课题实例,现代中小学教育2005.3对中小学教师教育科研情况的实证分析(陈桂梅、南纪稳)教育硕士求学动机的调查研究(黄文锋、徐富明)兴趣项目优先教学后学生若干体质指标的研究(胡加匡)中学生合作学习能力评价的探讨(陈木兰),现代中小学教育2005.-后进生家庭因素的调查与研究(屠丰庆、葛松定)歧义容忍度与外语学习成绩的相关分析(邵玲)新课程师资培训的问题与对策(杜志强,靳玉乐)课程.教材.教法2005.5,三、教育统计资料的来源,经常性资料:平时就有记载的资料。例如日常工作记录、学生档案、作业、统计报表等。专题性资料:平时没有记载,为某个目的或需要而专门去搜集的资料。通过调查、实验、观察、测验等方式进行搜集。,四、抽样设计,基本概念总体:所研究的具有某种共同特性的一类事物的全体。个体:总体中的基本单元或每个单位。样本:从总体中抽出来的对总体具有代表性的一部分个体。,抽样:从总体中抽出一部分个体使其成为该总体的样本的过程。样本容量:样本中所包含个体的数目。通常用字母n表示。大样本:样本容量大于30的样本。小样本:样本容量小于或等于30的样本。,抽样原则,随机性原则。即保证总体中每个个体被抽到的机会均等。目的:保证样本对总体有比较好的代表性。,抽样方法,单纯随机抽样机械抽样分层抽样整群抽样,单纯随机抽样,是保证抽样的随机性和独立性的抽样方法。例如:抽签法随机数字表法,机械抽样,把总体中所有的个体按一定顺序编号,然后依固定的间隔取样。可保证被抽到的个体在总体中的分布比较均匀。如何确定取样间隔?根据所需样本容量与总体中个体数目的比率而定。例如,要在100人中抽取10人,则需要从总体中抽取1/10的人,即间隔10人抽一人。可将单纯随机抽样和机械抽样结合使用。,分层抽样,按照与研究内容有关的因素或指标先把总体划分成几部分(即几个层),然后从各部分(即各层)中进行单纯随机抽样或机械抽样。步骤:确定分层的标准。确定样本容量的分配。确定具体的抽样方法。,整群抽样,从总体中抽出来的研究对象不是以个体为单位,而是以整群为单位的抽样方法。整群抽样经常与分层抽样相结合,即先把总体分层,然后再在各层中进行整群抽样。,例:新课程师资培训的问题与对策杜志强,靳玉乐课程.教材.教法2005.5,采用随机抽样的方式,抽取100名参加新课程师资培训的中小学教师,进行问卷调查,回收有效问卷97份。,例:小学新课程实施现状调查报告(胡卫平等)课程.教材.教法2005.2,本次调查采取分层整群抽样的方法,在山西省东、西、南、北、中各取一个市,并在每一个市随机抽取2所城市小学和3所农村小学,参加调查的对象共有10所城市小学的校领导22人(男10人、女12人)、参与课改的教师154人(男3人、女151人)和15所乡村小学的校领导24人(男15人、女9人)、参与课改的教师89人(男3人、女86人)。,五、数据的种类,根据来源可分为:点计数据:计算个数所获得的数据。如教师人数、班级数、教学仪器数、近视人数等。测量数据:用一定的工具或标准测量所获得的数据。如身高、智商、完成作业的时间、学科成绩等。,根据随机变量取值情况可分为:间断变量的数据:取值个数有限的数据。例如,人数、等级、名次等。连续变量的数据:取值个数无限的数据。例如,身高、体重、百分制记分、完成作业的时间等。,六、数据的统计分类,统计分类的含义统计分类是指按照研究对象的本质特征,根据分析研究的目的、任务以及分析时所用统计方法的可能性,将搜集到的数据进行分组归类。统计分类是整理数据的第一步。,分类的步骤,删除不准确、不真实的无效数据。确定分类标志。分类的标准和依据称为分类标志。标志要明确。分类标志可分为性质标志和数量标志:性质标志是按事物的不同性质进行分类。例如,按性别、成绩等级、学校类别等分类。数量标志是按数值大小进行分类。例如,按工龄、年龄、工资水平等分类。对全体数据进行分类。每次分类不能有遗漏。,例1:后进生家庭因素的调查与研究(屠丰庆、葛松定),学生类别:好生组、学习后进组、行为习惯后进组、学习与行为习惯后进组,例:教育硕士求学动机的调查研究黄文锋徐富明现代中小学教育2005.3,分类一:性别男、女分类二:学校类别重点与非重点分类三:教龄五年一个阶段,七、特征量,集中量(平均指标)差异量(差异指标)相对量(相对指标)相关量(相关系数),集中量,集中量的含义与用途集中量是反映一组数据的集中程度或典型水平的特征量。它能反映一组数据的分布中大量数据向某一点集中的情况。,常用的集中量,集中量有算术平均数、中位数、众数、加权平均数、几何平均数和调和平均数等。最常用的是算术平均数和加权平均数。,算术平均数,算术平均数是所有观察数据的总和除以数据个数所得的商,简称为平均数或均数、均值。定义公式为:,优点:反应灵敏严密确定简明易懂计算简单受抽样变动影响较小适合代数运算等。是运用最广的集中量指标。不足:易受极端数值的影响;当一组数据中某些数据不清楚或不准确时,不能计算其算术平均数。适用条件:一组数据中每个数据都比较准确可靠;无极端数值的影响。,加权平均数,加权平均数是权数不同的数据的平均数。有时在一组数据中,数据的单位权重不相等,这时如果要计算平均数就不能用算术平均数,而应该使用加权平均数。权数可能是百分比、频数等。在教育工作中,加权平均数的使用主要有两种类型。,例:某县采取自评和他评相结合的方式对学校进行评价,学校自评和他评的分数在学校最后的得分中各占40%和60%,一所学校自评的分数是85分,他评的分数是80分,这所学校最后的得分是多少?解:,例:某年级对三个班进行了英语统一测验,一班共40人,平均分是86分;二班共45人,平均分是90分;三班共42人,平均分是75分。全年级的平均分是多少?解:,中位数、百分位数,中位数是位于依一定顺序排列的一组数据中央位置的数值。它将数据分成较大的一半和较小的一半。中位数简称为中数,常用Md表示。百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。一般用Pp表示。例如,P60、P50等。中位数是第50百分位数。,中位数计算法,排序:将原始数据其按一定顺序(从大到小或从小到大)排列;确定中位数:如果数据个数N为奇数,则取序列为第(N+1)2的那个数据为中位数;如果N为偶数,则取序列为第N2与第(N2)1个这两个数据的平均数为中位数。例1:16、14、13、11、10、7、6、5、3这9个数的中位数是10。例2:2、4、5、6、8、10、13、14这8个数的中位数Md=(68)2=7。,众数,众数可分为粗略众数和理论众数。粗略众数是指一组数据中出现频数最多的那个数。理论众数是指与频数分布曲线中的最高点相对应的横坐标上的一点。通常用Mo表示众数。,差异量,差异量的含义与用途是表示一组数据变异程度或离散程度的一类特征量。差异量越大,说明数据分布的范围越广,分布越不整齐;差异量越小,说明数据变动范围越小,分布就越集中。,常用差异量,常用的差异量有全距、方差、标准差、差异系数等。,全距,全距是一组数据中的最大值与最小值之差,又称为极差。用R表示。,方差和标准差,方差和标准差是通过离差来定义的。离差:是指一组数据中的各个数据与该组数据算术平均数之差。方差:是一组数据离差平方的算术平均数,即方差可由离差的平方和除以数据个数所得。标准差:是方差的算术平方根。,方差和标准差的定义公式,例:某校对5个教师的教学效果进行测评,满分为20分,5个教师的得分为14分、15分、13分、12分和14分,这五个教师得分的方差和标准差各是多少?,方差和标准差的优缺点及应用,优点:反应灵敏、严密确定、计算简单、适合代数运算等。缺点:意义不易理解、易受两极端数值的影响、有个别数据不清楚时无法计算。应用:是最常用的差异量数,标准差的应用尤其广泛。标准差往往和算术平均数配对使用,以反映一组数据的差异程度和集中程度。,例:兴趣项目优先教学后学生若干体质指标的研究胡加匡现代中小学教育,实验前女生身体生理机能指标测试(平均数标准差),相对差异量,前面的全距、方差和标准差都是带有单位的绝对差异量。相对差异量(即差异系数):是指一组数据的标准差与算术平均数的百分比。它是没有单位的相对数。用CV表示差异系数,计算公式为:,差异系数的用途,差异系数越大,则该组数据内部的差异程度就越大,反之,差异程度就越小。因此,我们可以通过计算两组数据差异系数的大小来比较它们差异程度的大小。具体用途:比较不同单位数据组资料的差异程度。比较单位相同而平均数相差较大的数据组资料的差异程度。,相对量,相对量是两个相互联系的现象数量的比率。用以反映现象的发展程度、结构、强度、普遍程度或比例关系等。对于点计数据,通常通过计算比率来反映其特征。例如,学生的近视率、男女教师比例、完成任务的比例等。,相关量,相关关系的含义与种类,相关关系:是两个变量之间的不确定关系,它反映的是变量之间不十分严格,但却存在的依存关系。相关关系反映了偶然现象的规律性,它是一种大概如此但非绝对如此的关系,它不能用精确的数学表达式来表达。例如,教育投资与教育发展速度的关系、教师教学水平和学生的学习效果之间的关系等。,根据两个变量变化的方向,可将相关关系分为正相关、负相关和零相关。正相关:两个变量的变化方向一致的相关,即一个变量值变大时,另一个变量值也随着变大;一个变量值变小时,另一个变量也随着变小。例如,学生的学习能力与学习成绩的关系。,负相关:两个变量的变化方向相反的相关,即一个变量值变大时,另一个变量则变小;一个变量值变小时,另一个变量值则变大。例如,教师的身体状况与缺勤率的关系。零相关:两个变量的变化方向无一定的规律的相关,即一个变量值变大时,另一个变量值可能变大,也可能变小,并且变大或变小没有规律。例如,教师的身高与教学能力的关系。,相关量的含义与用途,相关量也称为相关系数,是用来描述变量之间变化方向和密切程度的数字特征量,一般用表示。它的数值范围在1到+1之间,它的正负号反映变量之间变化的方向;它的绝对值的大小反映变量之间关系的密切程度。,相关分析的含义与方法,研究两个变量之间是否存在相关关系,如果存在相关关系,其相关的方向和密切程度如何,这个过程在统计学上称为相关分析。注意:统计中的相关分析不探讨产生相关的本质原因。相关分析的主要方法是计算相关量。,常用的相关系数,积差相关系数两个变量都是连续数据。两个变量的观测值是成对的,并且观测值对数要大于30。,例:小学生识字总量与语文成绩的相关研究陶保平,上海教育科研.,歧义容忍度与外语学习成绩的相关分析(邵玲),对象:高二40个学生歧义容忍度:用歧义容忍度量表测量而得的分数(分数越高,歧义容忍度越弱)英语成绩:英语期末和平时成绩总评r=-0.67经过检验,外语成绩与歧义容忍度存在显著相关。,斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。样本容量的大小不限.依据两列成对等级的各对等级数之差进行计算.,斯皮尔曼等级相关系数,例.对8名被试分别进行了两种测验,测验结果用等级表示,见表1,根据两种测验的等级数据X、Y可计算等级相关系数。,表1:8名被试两种测验的等级数据,表2两种测验的等级相关系数计算表,两种测验成绩的等级相关系数是0.857。,根据各对等级数据分别计算D,然后求出D2和D2,点二列相关,当一个变量是连续变量,另一个变量是真正的二分变量,可计算点二列相关系数。例:学生体育成绩与性别的相关学生心理健康水平与家庭状况(单亲双亲)的相关。,二列相关,一个变量是连续变量,另外一个变量是人为划分的二分变量,可计算二列相关系数。例:学生体育成绩与身高(高、矮)的相关学生心理健康水平与父母教育方式(民主专制)的相关,八、标准分数,标准分数的含义标准分数是从原始分数转化而来的一种分数,又称为Z分数。是将原始数据与其所在数据组的平均数之差除以所在数据组的标准差所得之商。其公式为:,标准分数的性质,标准分数是以标准差为单位的一种量数。把一组原始数据转化成Z分数之后,这组Z分数的平均数为0,标准差为1。标准分数值的大小和正负可以反映某一个数据在全体数据中的地位。,1.在教育测验、评价中的应用。明确每个原始分数在分布中的相对地位;比较不同测验成绩的优劣;计算不同测验的总分和平均分。2.在统计推断中的应用。,标准分数的应用,例:某校对全体教师进行了两项测验,成绩记为X和Y,请用标准分数来比较张、王两个教师总成绩的优劣。,方法:分别计算两个教师两项测验成绩的标准分数,然后求他们标准分数的总和,从而比较出两位教师总成绩的优劣。,解:张老师成绩的标准分数分别为:两个标准分数的和为:1+1.5=0.5同理,可求出王老师成绩的标准分数分别为1和0.5,二者之和为1.5因为0.51.5,所以,张老师的总成绩没有王老师好。,九、假设检验,假设检验的基本原理假设:用统计术语对总体参数或分布所作的假定性说明。假设检验:根据一定概率,利用样本信息对总体参数或分布的某一假设作出拒绝或保留的决断。假设检验是推断统计的重要内容。,假设检验的步骤,提出原假设和备择假设(相互对立)原假设(零假设)H0:备择假设H1:选择和计算检验统计量根据检验形式,选择公式,利用样本信息计算检验统计量的值。统计决断根据显著性水平查相应的理论概率分布表,寻找相应的临界值。把计算所得结果与临界值进行比较,然后根据统计决断规则作出决断。,小概率事件:发生可能性很小的事件。小概率事件原理:小概率事件在一次抽样中不会发生。显著性水平():确定小概率事件的概率范围,通常=0.05或0.01。这也就是拒绝零假设的区域。,假设检验是一种概率意义上的反证法。它从“零假设是真”出发,根据样本计算出一个统计量的值进行推理,如果出现矛盾则拒绝零假设而接受备择假设,反之则接受零假设。判断是否出现矛盾的依据是小概率事件原理。,双侧检验:把拒绝零假设的概率(显著性水平)分置于理论抽样分布的两侧,在抽样分布的两侧尾端各有一个拒绝区,其面积各为/2。单侧检验:把拒绝零假设的概率(显著性水平)置于理论抽样分布的一侧,拒绝零假设的区域在抽样分布的一侧尾端(左侧或右侧),面积为。,临界值,临界值:划分保留与拒绝区域的界限值。可查与检验统计量相应的分布表来寻找临界值。例如,对于正态分布,在0.05的显著性水平上,双侧检验的拒绝区域在分布的两个尾端,面积各为0.025,Z的临界值为-1.96和+1.96。,平均数差异的显著性检验,根据两个样本平均数之差检验两个相应总体平均数之差的显著性,即推断两个总体的平均数相同或不相同。常用双侧检验,其假设为:H0:两个总体平均数差异不显著(1=2)H1:两个总体平均数差异显著(12),.独立样本平均数差异的显著性检验,独立样本:两个样本内的个体是随机抽取的,它们之间不存在一一对应关系。两个独立样本的容量可能相等,也可能不等。独立大样本:两个独立样本的容量都大于30。独立小样本:两个样本容量都小于30,或其中一个小于30的两个独立样本。,检验方法,根据独立样本的容量来决定具体的检验方法。独立大样本采用Z检验.(利用分布,即正态分布,进行的检验。)独立小样本采用t检验.(利用t分布进行的检验。),独立大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论