统计数据的描述_第1页
统计数据的描述_第2页
统计数据的描述_第3页
统计数据的描述_第4页
统计数据的描述_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第一节 统计数据的整理 一、统计分组一、统计分组 1、统计分组:是按照统计研究的目的和要求,将统计总 体按照一定的标志区分成若干个组成部分的一种统计分 析方法。总体中的组成部分称为“组”。 2、分组标志的选择 (1)必须根据统计研究目的与任务选择分组标志 (2)必须选择最主要的或最本质的标志作为分组标志 (3)要考虑社会经济现象所处的具体的历史条件和经济 条件 3、统计分组遵循原则: (1)“不重不漏”。“不重”即任意一个单位数只能分 配在其中的一个组中;“不漏”即不能有遗漏单位出现。 (2)“上限不在内原则”。统计分组中,当相邻两组的上 下限重叠时,为了“不重”,遵循上组限数值不算在该组

2、内。 4、统计分组的种类 (1)按分组标志的多少,可分为简单分组和复合分组 (2)按分组标志的性质不同,分为品质分组和数量分组 【例】某车间30名工人周加工零件数 (单位:个): 106 84 110 91 109 91 111 107 121 105 99 94 119 88 118 97 103 106 95 106 85 106 101 105 96 105 107 128 111 101 【例】工人按周加工零件数分组: 按加工 零件数 分组 频数频率%组中值向上累 计频数 向下累 计频数 80-9031085330 90-100723.3951027 100-1101343.31052

3、320 110-120516.7115287 120-13026.67125302 合计30100 二、频数分布数列二、频数分布数列 1、频数分布:在统计分组的基础上,将总体中的单位按组 归类整理,形成总体单位在各组间的分布,称为频数分布。 分配在各组的总体单位数叫频数(或次数); 各组单位数与总体单位数之比,叫频率,即频率/总体单 位数=频率 2、分布数列:将各组组别与频数依次编排而成的数列称为 频数分布数列。 构成要素:一是各组的组名(总体按某标志分的组);二是各 组所分配到的单位数或频率(频数或频率)。 3、意义:将杂乱无章的数据进行归类整理,能够显示出总 体单位的分布特征和结构状况,为

4、进一步研究总体的构成、 计算统计指标提供了方便。 4、分布数列的分类 根据分组标志特征的不同,分为 (1)属性分布数列(品质数列)。将总体按品质标志分组形 成的数列,如学生按性别分组。 表2.1 某班学生性别分布表 性别人数(人)比重% 男 女 22 18 55.0 45.0 合计30100.0 (2)变量分布数列(变量数列)。将总体按数量标志分组形 成的数列。变量数量由两部分组成:各组的变量值和各组的 单位数。 根据数量标志的分组类型分: 单项式数列:只用一个变量值表示的数列。 组距式数列:各组都由两个变量值界定的变量区间表示的 数列,根据各组组距是否相等,分为: 等距数列:每组距离都相等的

5、数列,在各组标志值变动比较 均匀的情况下采用。 不等距数列:各组距离都不相等的数列,当总体各单位标志 值变动不均匀时采用。 三、分布数列的编制三、分布数列的编制 1、属性分布数列的编制 根据品质标志确定各组的组名和组数 2、变量分布数列的编制 (1)单项式变量分布数列的编制。编制步骤: 第一步,将变量值由小到大排列; 第二步,计算各组分配到的单位数(频数或频率); 第三步,编织成频数分布表。 (2)组距式变量分布数列的编制 几个基本概念: 全距:变量数列中的极大值与极小值之差。 组限:变量数列中每组的极大值和极小值。 每组的最大值称为该组的上限,最小值称为该组的下限; 变量数列中每组上下限都齐

6、全时叫闭口组,缺上限或缺下 限的叫开口组。 组距:上组限与下组限之差。 组中值:每组上限与下限的算术平均数。 组中值=(上限+下限)/2 缺上限的组中值=该组下限+邻组组距/2 缺下限的组中值=该组上限-邻组组距/2 编制步骤: 第一步,将所有变量值由小到大排序,计算全距(极差)。 全距=max-min 第二步,根据全距确定组距、组数。 组数=全距/组距 第三步,确定组限。注意: (1)组限最好用整数表示,如果组距是5或10等,则每组 的组限最好是它的倍数; (2)第一组下限略小于资料中的最小变量值,最末组上限 略大于资料中的最大变量值; (3)无极大或极小的极端数值时,则采用闭口组;如果变

7、量值相对比较分散,为了不出现空白组,更好地反映 总体的分布情况,则应采用开口组。 对于连续型变量,应采用重叠式组限,而对于离散 型变量,二种方法都可以采用。 第四步,计算各组单位数(频数)和频率,并编制频数或频 率分布表。 四、累计分布数列四、累计分布数列 在频数分布的基础上,将各种频数或频率依次相加求和所 形成的分布数列,叫累计分布数列。 1、向上累计分布数列:将各组频数或频率由变量值小 的组向变量值大的组依次累计形成的分布数列。 2、向下累计分布数列:将各组频数或频率由变量值大 的组向变量值小的组依次累计形成的分布数列。 特点:第一组的累计频数或频率等于第一组本身的频数 或频率;最后一组的

8、累计频数或频率等于1或100%。 【例】将某班统计学考试成绩编制成频数分布表,见表2.3. 3、在经济学中的应用 (1)洛伦茨曲线(L)。根据意大利经济学家帕累托提出的收 入分配公式绘制成的描述收入和财富分配性质的曲线。 图2-1.洛伦茨曲线与基尼系数 (2)基尼系数:20世纪初意大利经济学家基尼(G. Gini)根据 洛伦茨曲线给出了衡量收入分配平均程度的指标 -A表示实际收入L曲线与绝对平均线之间的面积;B表示实 际收入L曲线与绝对不平均线之间的面积. -如果A=0,则基尼系数=0,表示收入绝对平均; -如果B=0,则基尼系数=1,表示收入绝对不平均; -基尼系数取值在0-1之间。一般认为

9、,基尼系数若小于0.2, 表明分配平均;基尼系数在0.2-0.4之间比较适当,即一个 社会既有效率又没有造成极大的分配不公;基尼系数为0.4 时,被认为是收入分配不公平的警戒线,超过了0.4应该采 取措施缩小这一差距。 洛伦茨曲线绘制方法: 将分配对象和接受分配者的数量均化成结构相对数并进 行向上累计; 纵轴和横轴均为百分比尺度,纵轴自下而上,用以测度 分配的对象(如一国的财富、土地或收入等),横轴由左向 右用以测定接受分配者(如一国的人口)。 根据计算所得的分配对象和接受分配者的累计百分数, 在图中标出相应的绘示点,连接各点并使之平滑化,所得 曲线就是要求的洛伦茨曲线。 一、统计表一、统计表

10、 把经过调查整理的统计资料按一定的结构和顺序,系统的 排列在一定的表格内,就形成了统计表。 1、结构 总标题:统计表的名称,放在表的上端正中。 横行标题:横行名称,表示各组名称或数值,是统计表 所要说明的对象,放在表的左端。 纵栏标题:表示统计指标的名称,放在表的上方。 指标数值:横行标题与纵栏标题的交叉部分。 3、分类 (1)简单表。对主词未经任何分组的统计表(一览表)。 表2.4 某年某高校毕业生人数 绝对数(人)比重(%) 研究生 本科生 专科生 500 5500 450 7.75 85.30 6.97 合计6450100 (2)分组表。 简单分组表:对主词只按一个标志分组形成的统计表。

11、 复合统计表:对主词按两个或两个以上标志分组形成的统 计表。 4、统计表的设计 (1)统计表形式的设计 统计表应设计成由纵横交叉的线条组成的长方形表格,长 宽比例应适中,过于细长或过于短粗的表格均不符合要求。 统计表的上、下基线应用粗线或双线绘制,表中其它横纵 线用细线绘制,习惯上统计表是左右两端不封口的开口表。 统计表中一般必须列出合计数,横行合计一般列在表的在 最前一栏或最后一栏。纵列合计一般列在最后一行;复合表 的合计一般列在最上面一行。 统计表的栏次较多时,通常应进行栏次编号,一般将非填 写统计数字的各栏(主词栏)变为“甲、乙、丙、丁”,宾 词栏用自然数(1)、(2)、等为序号。各栏之

12、间有计算 关系的,应在编号栏说明,如(4)=(3)+(2),表示第四栏等 于第三栏加第二栏。 (2)统计表内容的设计 标题设计。 指标数值。统计表中的数字应填写整齐,数位对齐,当数 字为“0”时,要写出来;当某项缺数字时,用“”表 示;无数字的空格用“”表示。同栏的数字要有同样的 精确度;当某项数字与相邻数值相同时,要如实填写,不 得用“同左”、“同右”、“同上”等字样代替。 计量单位。统计表中必须注明计量单位,当全表只有一个 单位时,可以放在表的右上方;如果同栏计量单位相同而 各栏不同时,应在各标题栏注明;当同行计量单位相同, 而行与行之间不同时,应在前面或后面加一栏“计量单 位”,用于注明

13、各行的计量单位。 注释或资料来源。 二、统计图二、统计图 1、直方图:用直方型的宽度和高度表示频数分布的图形,实 际上是用矩形的面积面积来表示各组的频数分布。 图2.1某车间工人周加工零件直方图 2、折线图(也称频数多边形图) 在直方图的基础上,把直方图顶部的中点(组中值)用直线 连接起来 折线图绘制时应注意:折线起点在最小变量值前1/2组距 处,落点在最大变量值后1/2组距处。 图2.2 某车间工人周加工零件直方图 3、曲线图:当变量数列的组数无限多时,曲线便近似的 表现为一条平滑曲线。 4、饼图:用圆形及园内扇形的面积来表示数值大小的图 形。表示总体中各部分占总体的比率。主要用于研究结 构性问题。 【例】表2.3,学生按学习成绩分组。 5、条形图:由一组宽度固

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论