第二讲统计图表.ppt_第1页
已阅读1页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计图表,第二章,各种科学研究的结果大多以数据的形式出现,这些直接获得的数据称为原始数据或观测数据,他们纷乱无章,只有经过整理分析才能从中提取出有用的信息构成规律性的知识。,第一节 数据的初步整理 第二节 次数分布表 第三节 次数分布图 第四节 其他类型的统计图表,第一节 数据的初步整理,一、数据排序 二、统计分组 三、统计表 四、统计图,统计图和统计表是两种是对数据进行简化的两种最简单的方式。 把统计指标和被说明的事物之间的关系用表格的形式表示就是统计表。(简明,清晰,准确) 统计图是依据数字资料,应用点、线、画、面、体、色等描绘而成。(具体形象),一、数据排序,数据排序(order)就是按

2、照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列。 排列后会使数据之间的某种关系有所显示。 数据排序是整理数据最简单的方法。 排序方法:升序和降序。,不同数据的排序,(一)字符型数据 汉字按拼音或笔画;英文按字母顺序。 (二)数值型数据 排序后可以划分等级,确定名次。 等级的划分要看数据及其所反映的事物本身的性质和研究目的而定。如智商、身高、跑步时间、错误次数等。,二、统计分组,所谓统计分组(grouping),就是根据被研究对象的特征,将所得数据划分到各个组别中去。 (一)统计分组前的准备 (二)统计分组应注意的问题 (三)分组的标志,(一)统计分组前的准备,将数据进行分组前,先

3、要对观测数据做进一步的核对和校验。 核对和校验数据的目的是为了尽可能地消除记录误差,以便使后续的统计分析建立在一个坚实的基础上。 (如果有充分的理由证明某个数据是受到了过失的影响,可考虑将此数据删除,否则不能随意删除。对于一些变异性较大的数据,要遵循三个标准差的准则。),(二)统计分组应注意的问题,1、分组要以被研究对象的本质特征为基础。(如:智力测验的结果,可按言语智力、操作智力和总的智力分数分类。) 2、分类标志要明确,要能包括所有的数据。,(三)分组的标志,两种分组: 性质类别 主要是根据事物的属性不同将被观测的事物加以划分,反映事物在组别、种类上的不同,不说明事物之间的数量差异。(按性

4、别分为男女,按年龄分为老年、中年和青年) 数量类别 这是以数据的取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来。,三、统计表,基本内容, 表号 标题 标目 数字 表注,表2.4 高一班成绩表,1、线条,原则:越少越好。 基本线 辅助线,顶线,横线,纵线,合计线,底线,常见错线, 封口线, 斜线, 多余横线,2、标题和表号,1)标题:表的名称,要求:简明扼要,表B 高一班成绩表,2)表号:表的顺序,表示方法 数字法 符号法,3、标目,作用:说明统计数字意义,纵标目,横 标 目,纵标目的总标目,横标目 总标目,标目位置,横标目,纵标目,原则 阿拉伯数字 数位对齐 不留空格

5、不带单位或%(放在标目中),4、数字,意义:统计表的基本语言。,空格处理 暂缺或未记录: 无数字: 0或极小数: 0,5、表注,表注,表中内容的说明 底线下,如:表中数据来源于例2-1,心理学研究常用三线表的形式,四、统计图,制图要求 图形类型,统计图一般采用直角坐标系,通常横坐标或横轴表示事物的组别或自变量X,称为分类轴;纵坐标或纵轴表示事物出现的次数或因变量Y,称为数值轴。,统计图的基本内容,(一)制图的基本要求,1、图题和图号 图题:图的名称 要求简明扼要,字体最大 图号:图的序号 图题和图号之间要空一个汉字 与统计表不同,统计图的标题置于图的正下方,等距,左右,小大,等距,0起点,下上

6、,纵轴:频数,百分频数。,图轴,横轴(基线):图目内容。,2、图目和图轴 图目:基线上观察对象的内容 类别 名称 时间 成绩 统计量等,图形 主要内容 线条最粗,图例 图形内容的说明,12 10 8 6 4 2 0,30 40 50 60 70 80 90 100,成绩,次 数,其他 图注:补充说明; 图轴比例:纵横之比,3:5;,尺度线,基线,图目,图形,图2-1 某班参加课外学艺人数统计图,图号,图题,图例,第二节 次数分布表,一. 简单次数分布表 二. 分组次数分布表的编制,次数分布(frequency distribution)显示初步整理后一组数据的分布情况,如:同一观测值出现的次数

7、,每一个分数区间内包含的观测分数的个数,主要表示数据在各个分组区间内的散布情况。,一、简单次数分布表,简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。,比较适用于按类别分的计数资料,二、分组次数分布表表的编制,当一列连续性测量数据的数据个数很多,分数的分布范围又比较大时,就适合使用分组次数分布表了。 分组次数分布表(grouped frequency table):当数据量很大时,应把所有的数据先划分为若干分组区间,然后将数据按其数值大小划归到相应的组别中,分别统计各个组别包括的数据个数,再用列表形式呈现出来,就构成了分组次数分布表。,(一)次数分布表的编制,

8、1、求全距(range):全部数据的距离,即极差。 Rg=XmaxXmin,2、定组数(k)分组的个数。 和组距(interval)(i)每组包含的数据单位。,经验法 k:一般1020;最佳1016; i:2、3、5、10 、 20,Rg=9862=36,计算法:总体正态时,K=1.87(N-1)2/5 K=1.87(100-1)2/5=11.7512 i=R/K或i=R+1/k i=36/12=3 如何掌握分组的标准?,3、定组限每组的起止点,也叫分组区间。 组限有表述组限和精确组限两种。 一组组距为10的分组数据,它们的表述组限为:1019,2029,3039,4049; 它们的精确组限(

9、实际组限)为:9.519.499, 19.529.499,29.539.499等。 组限的三种表达方式: 1019 9.519.5) 10 在呈现表格时,一般用表述组限,但对数据进行归类时,一定要按实际组限。,4、登记频数(frequency) 某事件在某类的数目。 方法:选举唱票法。,5、次数分布表,计算组中值(mid-point):,每组的中点值。,次数分布表,第一列为分组区间,第二列为各分组区间的组中值,第三列为次数。,(二)分组次数分布表的意义与缺点 意义:可将一堆杂乱无序的数据排列成序。 缺点: 原始数据不见了,根据组中值计算出的平均值和用原始数据计算出的平均值是有出入的。这个误差,

10、我们称为“归组效应”。(次数分布表假定各区间的数据分布是均匀的,但实际上并不一定均匀。 同一组数据,分组的组距越大,分组越少,误差越大。,三、相对次数分布表,96 2 93 3 90 4 87 8 84 11 81 17 78 19 75 14 72 10 69 7 66 3 63 1 60 1,分组 f, 100 1.00 100,.02 .03 .04 .08 .11 .17 .19 .14 .10 .07 .03 .01 .01,P,2 3 4 8 11 17 19 14 10 7 3 1 1,P%,相对次数是各组的次数f与总次数N的比值。,分组次数分布表与相对次数分布表 它们各有不同的

11、用途,既可以单独使用也可以联合使用。 当我们主要对各组的绝对次数感兴趣时,我们编制分组次数分布表,如果侧重于各组次数的相对比例结构时,可编制相对次数分布表。,四、 累加次数分布表 CF(cumulative frequency),意义:上限以下,下限以上,方法:向上累加,向下累加,五、双列次数分布表 又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 有联系的两列变量:同一组被试中每个被试两门学业成绩分数,同一组被试在两种实验条件下获得的结果。,六、不等距次数分布表,一般次数分布表都是等距的。但实际研究中常遇到不等距的情况,如工资级别、年龄分组等,若按等距分组不能确切地反映实际

12、情况,这时可采取不等距分组的方法。,第三节 次数分布图,次数直方图 次数多边图 累加次数分布图,一、直方图(histogram),直方图是由若干宽度相等、高度不一的直方长条紧密排列在同一基线上构成的图形。 纵轴表示数据的次数f,横轴表示各分组区间的上下限,有时也用组中值表示。 纵轴的刻度通常从零开始,横轴的刻度可以从任何合适的数字开始,但应与数据的分布范围和组距有关。 直方长条的宽度直接受组距大小的影响,底边的两端点分别为精确上下限,直方长条的高度由各组的次数决定。,直方图长条的面积表示连续性随机变量次数的分布。直方图下的面积与总次数相等,所以一个直方长条的面积大小与每组的次数分布大小是等价的

13、。如果将总面积定为1,那么,直方图中每一个直方长条的面积就是该直方长条表示的分组内的次数与总次数的比值。,二、次数多边图(frequency polygon),次数多边图是利用闭合的折线构成多边形以反映次数变化情况的一种图形。 直角坐标系的纵坐标表示数据的次数,横坐标表示每个组的组中值。以每个组的次数为纵坐标标点,以相应的组中值为横坐标标点,画出各个点并连接起来,就成为一条折线。为构成闭合多边形和计算面积,可将折线两端分别增加前一组和后一组的组中值点。,12 10 8 6 4 2 0,30 40 50 60 70 80 90 100,成绩,次 数,次数多边图和直方图都是以面积来表示连续性数据的

14、次数分布,但次数多边图对次数的轮廓显示的更好,组与组之间的次数过渡是连续和直接的。 当一批数据个数足够多时,随着分组间距的不断变小,绘制成的次数多边图会越来越连续和光滑,若分为无数组,就形成一条极其光滑的曲线,这种曲线在统计上称为次数分布曲线。,将简单次数换成相对次数,就可以画出相对次数多边图。优点是可以在一个图上比较多组次数分布(总次数不同,但组距相同,则可在一个图里表示两个或两个以上不同总数的次数分布)。,三.累加次数分布图,累加直方图 横坐标分组区间,纵坐标是累加次数。可以看出某上限以下的次数或者某下限以上的次数。 累加曲线图 先同上,标出各交点,再连接各交点。,累加曲线的形状,正偏态

15、曲线的上支长于下支,说明大数端各组次数偏少且组数较多,各组次数变化小。 负偏态 曲线的下支长于上支,说明小数端各组次数偏少且组数较多,各组次数变化小 正态 曲线上下支相当,说明次数分布的大数端与小数端的分组数目及各组的次数相当,变化也相当。,第四节 其他类型的统计图表,一、其他常用的统计表类型 二、其他常用的统计图的类别,简单表:横标目或纵标目未分组,只列出名称、地点时序或统计指标名称。,数值 25.0 37.5赫兹 2.8mm 178.6ns,指标名称 人数 闪光融合 错觉量 反应时,表2 某运动队队员几项心理指标测试结果,一、其他常用的统计表类型,分组表 标目按一个分类标志分组,也叫单向表

16、。,表4 不同年级控制组和实验组成绩的人数分布,复合表 横标目按两个或两个以上分组标志进行多层分组,二、其他常用的统计图的类别,除了次数分布图,心理与教育统计中常用的统计图还有条形图、线性图、圆形图、散点图等等。 条形图 圆形图 线性图 散点图,1、条形图 (bar chart),条形图,也叫直条图,主要用于表示离散型的数据资料,即计数资料。它以条形的长短表示各事物间数量的大小与数量之间的差异情况。 条形图的一个轴为分类轴,表示类别,描述计数数据;另一个轴是数量轴,表示大小多少,描述计量数据。,简单条形图,分组条形图,分组条形图,分段条形图,绘制条形图要注意以下几点: 尺度必须从零点开始,要等

17、距分点。一般不断开,不得已断开时需要在折断处标明。 条宽与间隔的比例要适当。宽度与数量大小无关,过宽与过窄影响美观。各直条的宽窄要一致,各条形间的间隔要一致,一般为直条宽度的0.5-1倍比较合适。 直条的排列顺序根据具体情况来定。(按时间、数量多少、固有序列)相比较的数目不宜太多。 条形的底端和顶端尽量少用数据标签,如数值、系列名称。 在分组和分段这种复式条形图中,互相比较的长条拼在一起,不留空隙。各组内的长条排列次序必须一致,以便比较。,条形图与直方图的区别,(1)描述的数据不同。 计数数据;连续性数据。 (2)表示数据多少的方式不同。 长短或高低表示数据的多少和大小;用面积表示。 (3)坐标轴上标尺分点意义不同。 分类轴;刻度值。 (4)间隔 有间隔,但无意义;无任何间隙。,2、圆形图(circle graph),也叫饼图,主要用于描述间断性的资料,目的是显示各部分在总体中所占的比重,资料多以百分数来表示。 一般以圆的上方,即时钟的指针在12时的位置的半

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论