单元三数据的整理与显示.ppt_第1页
单元三数据的整理与显示.ppt_第2页
单元三数据的整理与显示.ppt_第3页
单元三数据的整理与显示.ppt_第4页
单元三数据的整理与显示.ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单元三 统计数据的整理与显示,任务一 统计数据整理概述,任务三 频数分布,任务二 统计分组,任务四 统计图与统计表,统计调查,统计整理,统计分析,有组织、 有计划地 搜集资料。 要求:准确、 完整、及时,对调查资料 去伪存真、 去粗取精、 科学分类、 浓缩简化,描述性分析 推断分析、 决策分析。 要求:定性 定量结合,统计工作的三个中心阶段,统计整理,将统计调查得到的原始资料进行科学的分类和汇总,使之成为系统化、条理化的综合资料,以反映研究总体的特征的工作过程。,是统计调查的继续,统计分析的前提和基础,起着承前启后的作用。,意义,任务一 统计整理概述,一、统计整理的意义和步骤,(一)统计整理的意义,(二)统计整理的步骤,1.设计和编制统计数据整理方案,2.对原始资料进行审核 (逻辑检查和计算检查),3.对原始资料进行统计分组与汇总,4.编制统计表和绘制统计图,是指原始资料是否准确可靠,准确性,1、逻辑检查,检查调查资料内容是否合理,各个项目之间有没有相互矛盾的地方,答案是否合乎逻辑,是指所有的调查表格或问卷是否都已收齐,所有的问题是否都有答案。,完整性,2、计算检查,检查调查表格或问卷中各项数字在计算方法和计算结果上有无错误,数字的计量单位有没有差错,等等。,准确性的审核 方法,注:统计资料的审核,任务二 统计分组,一、统计分组的概念,指根据事物的内在特点和统计研究的需要,按一定的标志将统计总体区分为若干性质不同的组成部分的统计研究方法。,统计分组,对总体而言,是“分”,即将总体区分为性质相异的若干部分。,对总体单位而言,是“合”,即将性质相同的个体组合起来,在同一组内则保持着相同的性质。,(二)统计分组的作用,1区分现象性质的差别,例:按所有制性质划分,我国现有8种经济类型: 国有经济;集体经济;私营经济;个体经济;联营经济;股份制经济;外商投资经济;港澳台投资经济,2反映总体内部结构,例:上海市按GDP计算的三次产业结构(%) 1980年 1990年 1996年 1997年 GDP 100 100 100 100 第一产业 3.2 4.3 2.5 2.3 第二产业 75.7 63.8 54.5 52.2 第三产业 21.1 31.9 43.0 45.5,3研究现象之间的依存关系,例:中国农民家庭按收入分组的恩格尔系数(1984年),按收入分组(元) 200 300 400 500 600 800 1000 恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6,二、统计分组的方法,(一)正确选择分组标志,1.根据统计研究的目的选择分组标志,正确选择分组标志是做好统计分组的前提。,恩格尔系数是食品支出总额占个人消费支出总额的比重。 19世纪德国统计学家恩格尔根据统计资料,对消费结构的变化得出一个规律:一个家庭收入越少,家庭收入中(或总支出中)用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中(或总支出中)用来购买食物的支出比例则会下降。推而广之,一个国家越穷,每个国民的平均收入中(或平均支出中)用于购买食物的支出所占比例就越大,随着国家的富裕,这个比例呈下降趋势。 一个家庭或国家的恩格尔系数越小,就说明这个家庭或国家经济越富裕。反之,如果这个家庭或国家的恩格尔系数越大,就说明这个家庭或国家的经济越困难。 根据联合国粮农组织提出的标准,恩格尔系数在59%以上为贫困,50-59%为温饱,40-50%为小康,30-40%为富裕,低于30%为最富裕。,恩格尔系数(Engels Coefficient),2. 根据现象的本质特征选择分组标志,3. 根据现象所处的历史、经济条件选择 分组标志,(二)按品质标志分组和按数量标志分组,1.按品质标志分组,2.按数量标志分组,选择反映事物属性差异的标志作为分组依据。,选择反映事物数量差异的标志作为分组依据。,(三)拟定分组数目、分组原则和方法,即决定分成哪些组,各组的内容、名称和界限。,2.原则,互斥性,指各组之间界限明确,总体中的每一个单位,都只应属于其中的一个组。,指在一个分组方案中拟定的所有组,能够包容总体的全部单位,不能排斥和遗漏任何一个单位。,包容性,1. 拟定分组数目,对大学生月生活费支出情况进行分组研究: 按家庭收入水平分组; 按城乡分组; 按性别分组; 按年龄分组。,3. 统计分组的方法,对父母亲下岗情况进行分组研究 单亲下岗; 双亲下岗; 双亲在岗。,不符合科学性,不符合完备性和互斥性,城乡区别离退休 是否健在,?,4. 按数量标志分组的形式,(1)单项式分组,指用单一的数值作为分组标志的分组。每个数值作为一个组。,如某班学生按年龄分组:17岁,18岁,19岁,20岁, 21岁,22岁。,(2)组距式分组,将作为分组依据的数量标志的整个取值范围依次划分为若干个满足互斥性和包容性的区间,用这些数值区间作为组的名称。,某班学生统计学成绩分组,60分以下6070分7080分8090分90分以上,(3)组距式分组中的一些概念,a. 组限,上限,下限,区间数值的最大值,区让数值的最小值,b. 组距,每一组的区间长度,组距=上限-下限,c. 组中值,每一组中点位置的数值,组中值=(上限+下限)2,d. 开口组,缺少上限数值或下限数值的组,注意,开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。,某地区100个百货商店 月销售额与流通费用情况,上组限U,下组限L,如:组距d=U-L =100-50=50(万元),如:组中值x=(U+L)/2 =(100+200)/2 =150(万元),e. 等距分组,f. 异距分组,例如,60分以下6070分7080分8090分90分以上,组中值为 (60+50)2=55,组中值为 (90+100)2=95,各组组距相等的分组称为等距分组。,各组组距不全相等的分组称为异距分组。,上限不在内原则,1、简单分组,2、复合分组,即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。,复合分组是指对所研究的总体按两个或两个以上的标志层叠起来分组。可用于对事物多方面、多层次的分析研究。,(三)统计分组的形式,任务三 频数分布,又称次数分布,在统计分组基础上,将总体所有单位按组归并排列,所形成的总体单位在各组间的分布。,1.频数分布,3. 分 类,异距数列,等距数列,一、频数分布的概念,例:某校学生性别分布表,a. 品质分布数列,各组名称,频数,频率,例:某市商业企业增加值统计表,b. 变量分布数列,各组变量值,频数,频率,(一)单项变量数列,指每个组值只用一个具体的变量值表现的数列。,同时 具备,二、变量数列的编制,【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,2、编制结果如下:,组距数列,指每个组的变量值用一个区间来表现的变量数列,(二)组距变量数列,变量值变动区间的长度相等,变量值变动区间的长度不完全相等,2、种类:,等距数列适用于总体单位的标志值变动比较均匀的情况;而异距数列则适用于不均匀的情况。,3、适用范围:,4、频数分布表,a. 人口按年龄分组编制的等距数列,b.人口按年龄分组编制的异距数列,此表将全部人口划分为七个类型,与等距分组表相比更清楚地显示出了人口的年龄结构。,5、频数 分布图,绘制频数分布图,一般是绘制直方图或折线图。用矩形的面积来表示各组的频数(频率)分布。在直角坐标中,用横轴表示数据分组,纵轴表示频数密度或频率密度,各组与相应的频数(频率)密度就形成了一个矩形,即直方图(Histogram),20,14,8,2,100,300,500,700,900,1100,工业增加值(万元),企 业 数,图 某市商业企业增加值的折线图,三、变量数列的编制,原始数据,计算组中值,排序,确定组限,计算变异全距,确定组数、组距,汇总组单位数,制作组距数列统计表,变量数列的编制步骤或内容,(一)将原始资料按数值大小依次排列并计算全距,(二)确定组数(k)和组距(i),R组距(i) 组数(k),确定组距的原则:,要能反映总体资料的分布特征 要能区分各组的性质差异 为方便计算,尽可能为5或10的整数倍,计算组数(组数不宜过多,也不宜太少),(三)确定组限和组限的表示方法,例:己知某班35个学生统计学期末考试成绩如下,单 位(分) 44 50 56 60 62 63 65 65 69 69 69 70 74 76 77 78 78 79 80 83 84 85 85 86 87 88 89 90 91 91 92 93 94 94 要求编制组距数列。,解:编制步骤如下:,求变异全距,确定组距及组数,R组距(i) 组数(k),(四)编制变量数列,取 i =10,则有,某班统计学考试成绩表,3. 形成等距变量数列,四、频数分布的主要类型,(一)钟型分布,分布特征:“中间大、两头小”,即靠近中间变量值分布的频数多,靠近两端的变量值分布的频数少。,(二)U型分布,分布特征:“两头大、中间小”,即接近两端的变量值分布的频数多,接近中间的变量值分布的频数少。如人口死亡率、产品的失效率等。,U型分布,(三)J型分布,J型分布分正J型分布和反J型分布。正J型分布是频数随着变量值的增大而增多,如投资额按利润大小分布;反J型分布是频数随着变量值的增大而减少,如人口总体按年龄分布。,(a) 正J型分布,(b) 反J型分布,任务四 统计图与统计表,一、统计表,统计表是以表格来显示统计数据的一种方法。,意义,1、是表达和运用统计资料的特有形式,是进行定量分析研究的基本方法 。,2、使统计资料系统化、条理化、规范化、生动化。,3、科学合理的组织统计数据,便于阅读、对比和分析。,(一)统计表的定义和构成,总标题,(二)统计表的构成,数据资料,横行标题,纵栏标题,(三)统计表的内容,主词,宾词,总标题是表的名称,用来概括统计表中全部统计资料的内容。,横行标题是横行的名称,在统计表中通常用来表示各组的名称,代表统计表所要说明的对象,纵栏标题是纵栏的名称,在统计表中通常用来表示统计指标的名称,数据资料排在各横行标题与纵栏标题交叉的方格里,统计表所要说明的对象,宾词是用于说明主词(总体及总体各组)特征而采用的统计指标,例:统计表的结构,2000年我国工业总产值和增加值,横行标题,主词,宾词,总标题,纵栏标题,指标数值,资料来源:中国统计年鉴2001年注释:工业总产值按工厂法计算。,表外资料,(二)、统计表的分类,1、按用途不同统计表可分为,调查表,整理表,分析表,在统计调查中用于登记、搜集原始数据的表格。,又称汇总表,是在统计整理或统计汇总过程中用于显示统计整理或汇总结果的表格。,在统计分析中用于显示统计数据,并对其进行定量分析的表格。,2、按统计数列的性质不同可分为,空间数列表,时间数列表,时空数列 结合表,又称静态表,反映在同一时间条件下,不同空间范围内的统计数据的表格。,又称动态表,反映在同一空间条件下,不同时间的统计数列的表格。,又称动静结合表,同时反映时空两方面内容的统计表格。,简单表,简单分组表,复合分组表,指统计总体未经任何分组的统计表。,指统计总体按一个标志进行分组后形成的统计表。,指统计总体按两个或两个以上的标志分组后形成的统计表。,3、按分组情况不同可分为,a. 简单表,例:统计表按主词的分组情况为:,指主词未经过任何分组的统计表,某地区2002年铁矿计划完成情况,b. 简单分组表,指总体按一个标志分组的统计表,某地区2009年各类型企业总产值表,c. 复合分组表,指总体按两个或两个以上标志进行层叠分组的统计表,某中学学生构成情况表 单位:人,宾词简单排列,宾词分组 平行排列,宾词分组 层叠排列,宾词不进行任何分组,按一定顺序排列在统计表上。,宾词栏中各分组标志彼此分开,平行排列。(如表3-14),统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论