02数据整理_第1页
02数据整理_第2页
02数据整理_第3页
02数据整理_第4页
02数据整理_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二讲,数据整理与图表呈现,第一节数据的来源、种类及其分类,1经常性资料:主要是日常工作中的记录(如学校中关于教师资历、教学情况、教学进度的记录;关于学生学期、学年成绩和操行评定的记录;关于学生健康状况,流失情况的记录;关于学校经费的使用,学校建设的记录等;教师的工作记录等)和统计报表(如教师职称变动的年报表,学生流失率的季报表,学生入学率的年报表等 )等。 2专题性资料:主要通过研究者对自己所感兴趣的或者是一些亟待解决的问题,通过调查或实验的方法来搜集的。 (1)教育调查:在没有预定因子、不施行控制的条件下,对现成的教育方面有关客观事实所进行的观察和分析。 (2)教育实验:在预定的控制因子影

2、响下,对教育方面有关客观事实所进行的观察和分析。,一、教育统计资料的来源,二、数据的种类,数据就是随机变量的观察值。 1.按来源分:点计数据和度量数据。 点计数据是指计算个数所获得的数据。如教育学院的学生数、教师数等。 度量数据是指用一定的工具或一定的标准测量所获得的数据。如用测高器测得学生身高的数据、用某种智力测验测得学生智商的数据等等。,2.按随机变量取值是否具有连续性分:间断型随机变量的数据和连续型随机变量的数据 取值个数有限的数据,称为间断型随机变量的数据。这种数据的单位是独立的,两个单位之间不能再划分成细小的单位,一般用整数表示。如三好学生人数、某门学科不及格人数;学生的智力、学科成

3、绩等指标按优劣程度分别排列的名次。,取值个数无限(不可数)的数据,称为连续型随机变量的数据。它们可能的取值范围能连续充满某一个区间。数据的单位之间可以再划分成无限多个细小的单位。数据可以用小数表示。如学生的智商、身高、体重等。,3、按对象的特征分: 分类数据(名义数据):说明一事物与它事物属性上的不同或类别上的差异,但不能说明事物之间的差异大小。其数值一般都取整数形式,如性别(男、女)、学历、职业、地区等。 顺序数据:既无相等的单位,又无绝对的零点的数据,如成绩排名、等级评定、喜爱程度、品质等级等,只能排出等级顺序,不能指出其间的差别大小。 等距数据:有相等的单位没有绝对零点的数据。不仅能将事

4、物分为不同类型并进行排序,而且还可以准确地指出类别之间的差距是多少,表现为数值。如考试成绩百分制;温度等。 比率数据:有相等的单位又有绝对零点的数据。表现为数值,它具有上述三种尺度的全部特性外,还可以计算两个测度值之间的比值。如长度、质量、重量等。,数据类型,测量数据,连续型数据,第二节、统计表,统计表是用来表达研究变量与被说明的事物之间数量关系的表格。它可以将大量数据的分类结果清晰、概括、一目了然地表达出来,便于分析、比较和计算。,1.标题:表的名称;上方;简明扼要; 2.表号:表的序号;左方;时间顺序。 3.标目:表中对统计数据分类的项目。 4.线条:四条基本线条;不宜多。 5.数字:一般

5、用阿拉伯数字表示;如有小数,数位要一致,要对齐;尽量不要有空格;暂缺数字可用“”或问号表示;无数字画“”。 6.表注:不是必要组成部分;下方;补充说明表的来源或补充说明数字;字号不要大于表中的其他文字。简单明了、重点突出,一、统计表的结构及其编制的原则和要求,表2.1 统计表的格式,顶线,底线,表线,表号,标题,标目,标目,表注,注:,例: 表2.2 北京市四街道智力落后患者分布,资料来源:见心理学报1979年第1期103页,选部分引用,二统计表的种类,简单表:只按研究现象(或变量)的名称、地点、时序等列出数据的统计表。 分组表:只按一个标志分组的统计表称为分组表。 复合表:按两个或两个以上标

6、志分组的统计表称为复合表。,简单表,表2.3 各校学生数一览表,分组表,表2.4 上海市区男幼儿20米跑步用时,资料来源:引自华东师范大学学报,1985年第2期第30页,复合表,表2.5 某年级操行评定结果,例: 表2.6 中学生心理烦恼调查被试分布,三、频数分布表列法,频数:某一个随机事件在n次试验中出现的次数称为这个随机事件的频数。一般用f表示。 频数分布:各种随机事件在n次试验中出现的次数分布称为频数分布,即把随机事件出现的次数都呈现出来。 频数分布表:把频数分布用表格的形式表示出来就是频数分布表。,频数分布表分类:1.简单频数分布表(1)间断变量的频数分布表,(2)连续变量的频数分布表

7、 第一步:求全距(用R表示) 第二步:决定组数和组距 k:一般分为1015组。 (k=1+Lgn/Lg2, n为数据个数。) i:一般定为1、2、3、5、10。 第三步:决定组限,即决定各组的上下限有时还需计算组中值。 组中值=(上限+下限)/2 第四步:登记频数,按照刚才介绍的方法分为四步来完成频数分布表。第一步:求全距R=最大值最小值=12881=47第二步:决定组数和组距k=10,i=R/k=47/105第三步:决定组限第四步:登记频数,2.累积频数和累积百分比分布表:累积频数就是把频数一组一组累加起来,得到的频数叫累积频数。 累积百分比就是把频数用百分比变成相对频数。 用表格把这两种频

8、数表示出来就是累积频数分布表和累积百分比分布表。,(1)累积频数分布表制作 A.先制作频数分布表 B.从最低一组的频数开始登记,每降下一组,须将以上各组的频数累积起来。 (2)累积百分比分布表制作 将各组的累积频数除以总频数再乘以100。,第三节、统计图,统计图是整理和呈现数据的另一种方法,它把研究变量与被说明事物之间的数量关系用图形表现,直观、形象地表达出事物的全貌及其数据的分布特征,使人一目了然,便于理解和记忆,印象深刻。,1、统计图的构成,统计图一般由图号、标题、标目、图形、图注等几部分构成。 统计图中的标目由基线和尺度线构成。对于有纵、横轴的统计图,一般以基线表示被观察的现象,而尺度线

9、则表示其数量。,2、统计图的分类,条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。,单式条形图,图2.1 某年级操行评定结果,基线,尺度线,图形,复式条形图,图2.2 某年级操行评定结果,例: 图2.3 三项影响较大的SARS信息对不同文化程度民众的影响,圆形图,图2.4 某年级操行评定结果圆形图,基线,尺度线,绘制圆形图的步骤,求出各组成部分所占的百分比 求出各部分的中心角度 以顺时针方向画出扇形 标出不同颜色及百

10、分比,线形图,线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。 基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。,例如:对有意义的词汇,小学一年级至初中三年级学生视觉、听觉记忆再现率的情况。,图2.5 有意义的材料再现率比较线形图,频数分布图在编制频数分布表的基础上,可以绘制频数分布图,使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 绘制频数分布图可以用已有的计算机程序,如EXCEL,也可以用专门的统计程序。,频数分布直方图,直方图 ( histogram )又称为等距直

11、方图,是以矩形的面积表示连续性随机变量次数分布的图形。一般用纵轴表示数据的频数,用横轴表示数据的等距分组点,即各分组区间的上下限。 直方图是统计学中常用而且又有特殊意义的一种统计图,有着重要的应用价值。,身高(CM),145,142,139,136,133,130,127,124,121,118,115,频数,20.00,18.00,16.00,14.00,12.00,10.00,8.00,6.00,4.00,2.00,0.00,图2.6 二年级80个学生身高的频数分布直方图,直方图,直方图与直条图的异同,同:都是用矩形来表示数据; 异:直条图表示间断变量,而直方图用来表示连续变量;直条图各直条之间有间距,直方图各直条之间没有间隔;直条图是以直条的长短高低来表示数量关系,而直方图是以面积来表示频数分布。,次数分布多边图,次数分布多边形图(frequency polygon)是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。,图2.7 52名学生数学成绩分布图,人 数,利用次数分布多边图还可以把几组资料放

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论