版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 统计整理,学习目的及重难点提示,本章学习目的 了解数据整理在统计活动中的地位、数据整理的内容、数据审核与汇总的技术。 领会统计分组的概念、作用、统计分组体系及次数分布的类型和特征。 明确统计数据的表现形式统计表和统计图的基本内容。 掌握统计分组、分配数列和统计图表的编绘制方法。 本章重难点提示 本章重点:统计分组、变量数列的编制、统计数据的显示方法统计表和统计图。 本章难点:统计分组、变量数列的编制、次数分布图的绘制。,第一节 统计整理的内容与技术,一、统计整理的含义与作用,概念:是指根据统计研究的目的和任务,对统计调查所得的原始资料进行科学的分类和汇总或对已初步加工的次级资料进行再加
2、工,使其系统化、条理化、科学化,以反映所研究想象总体特征的工作过程。,作用,统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中发挥着承上启下的作用。,统计工作,统计调查,统计整理,统计分析,二、统计整理的内容,审核前提 分组基础 汇总中心 制表结果,三、统计整理的技术,不同统计表上重复出现的指标值,指标值复核计算,指标值与实际值,统计、会计、业务,四、统计整理的组织,逐级汇总 集中汇总 综合汇总,一、统计分组的含义 统计分组就是根据统计研究目的的需要,将统计总体按照一定的标志区分成若干组成部分的一种统计方法。,第二节 统计分组,二、统计分组的作用,按所有制类型分组,区分现象的类
3、型,揭示现象内部结构,统计分组法是研究总体内部结构的前提,所谓总体内部结构是指总体内各部分占总体的比重。 例如:人口统计中的各种年龄构成、国民经济中三次产业的构成等,都是统计分组的结果。,分析现象之间的依存关系,社会经济现象之间不同程度的存在着相互依存关系,通过统计分组,可以从数量上研究现象之间依存关系的规律性。 居民家庭随着月收入的增加而月支出也在增加的相关关系。,(一)根据分组变量(标志)的性质不同 品质变量分组 数值变量分组 (二)根据变量的取值不同 离散变量分组 连续变量分组 (三)根据采用的分组标志的个数多少 简单分组:只按一个标志分组 复合分组:按两个或以上的标志分组,三、统计分组
4、的类型,(四)按照数量标志分类,单项式分组,离散变量而且变动范围小、变量值个数较少,所有的连续变量和取值范围较大的离散变量,即每组只包含一个变量值,将变量取值范围认为地划分为若干个区间,每组包含多个变量值,组距式分组,(一)统计分组的原则 根据统计研究目的与任务 选择最能反映被研究现象本质特征的标志 根据现象所处的历史条件或经济条件,四、统计分组的方法,选择反映事物属性差异的品质标志为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分为若干个性质不同的组成部分。 如:人可以按照性别分为:男女;按照名族划分汉族、壮族等;工业企业按照经济性质可以划分国有经济、集体经济、个体经济、联营经济等
5、。,(二)品质分组的方法,(三)变量分组的方法 根据统计研究的目的,选择反映事物数量差异的数量标志作为分组标志,在数量标志值的变异范围之内划定各组数量界限,将总体划分为性质不同的若干组成部分。 如:人口按年龄分组,企业按照职工平均水平分组等。,第 三 节 分配数列,一、分配数列,(一)概念 (二)分配数列的要素 组别 次数(频数):分布在各组的总体单位数。各组的 次数(频数)之和等于总体单位总数。 频率(比重):各组次数占总次数的比重。各组比 重之和等于100%(或1)。,在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,表现为一定的数列形式
6、,称为分配数列。,分配数列实例,表3-1 我国土地状况分组表,(三)分配数列的种类,1.按分组标志的性质不同 品质变量数列:按品质变量分组形成 数值变量数列:按数值变量分组形成 2.数值变量数列又可分为: 单项数列:每组只有一个变量值的变量数列 组距数列:每组变量值是一段区间的变量数列 连续变量数列:按连续变量分组形成的数列 离散变量数列:按离散变量分组形成的数列,品质变量分配数列实例,表3-2 某高校在校生性别状况分组表,数值变量分配数列实例,表3-3 某市餐饮业按营业额分组,单项式变量数列实例,表3-4 某市居民家庭按家庭人口数分组,组距式变量数列实例,表3-5 某车间工人按月工资分组,1
7、.概念术语 (1)全距(R)数列中最大变量值最小变量值 (2)组限:每一组的最大变量值与最小变量值 上限:每一组的最大变量值 下限:每一组的最小变量值 (3)组距(d):每一组的最大变量值与最小变量值之差 组距=上限下限 (4)组数:数列中的分组个数。,(四)分配数列的编制,定性关系:全距一定的情况下,组数和组距呈反方向变动。 定量关系: 式二为确定组距的经验公式,其中N代表组数。,组数和组距的关系,组数全距/组距=R/d,组距=R/(13.322lgN),(四)分配数列的编制,1.概念术语 (5)频数(次数)与频率(比重) (6)品质数列与变量数列 (7)等距数列与异距数列 (8)次数密度:
8、单位组距内分布的总体单位数。 公式:,次数密度各组次数 / 各组组距,开口组:缺上限或缺下限的组 闭口组:上下限齐全的组 (10)组中值及计算* 闭口组 临近组组限重合时:组中值=(上限下限)/ 2 临近组组限间断时:组中值=(下限下组下限)/2 开口组 缺上限时: 组中值=下限邻组组距/ 2 缺下限时: 组中值=上限 -邻组组距/ 2,1.概念术语,(9),(四)分配数列的编制,2.注意事项 (1)组距最好为5或10的倍数。 (2)最小组的下限略低于最小变量值,最大组的上限略高于最大变量值。 (3)离散型变量分组,相邻组的组限可以间断,也可以重叠;连续型变量分组,相邻组的组限必须重叠。 (4
9、)组限重叠时,临界点的总体单位按“上限不在内”的原则归组。,(四)分配数列的编制,3.简单次数分布数列的编制步骤 数据排序并计算全距 确定变量数列的形式(单项式或组距式) 确定组数和组距 确定组限 计算各组次数和频率 绘制表格,简单次数分布数列的编制实例,例3-1数据资料 某车间40名工人日产零件如下: 65 72 66 57 90 86 83 68 75 84 66 59 67 70 79 51 81 54 78 86 94 64 77 74 76 96 62 98 85 71 79 84 65 72 89 75,简单次数分布数列的编制实例,编制步骤之一数据排序并确定全距 将数据从低到高排列
10、,形成如下变量序列: 51 54 57 59 62 64 65 65 66 66 67 68 70 71 72 72 74 75 75 76 76 77 78 78 79 81 83 84 84 84 85 86 86 88 89 90 93 94 96 98 计算全距=98-51=47 编制步骤之二确定变量数列的形式 因变量值较多、变动幅度较大,适宜采用组距式数列。,简单次数分布数列的编制实例,编制步骤之三确定组数和组距 分析 全距为47,分为5组,组距为10。 编制步骤之四确定组限 分析 离散型变量分组,相邻组的组限可以重叠,也可间断,本例选择重叠。 编制步骤之五计算各组的频数和频率 分析
11、 根据排序后的变量序列清点各数据区间的频数并计算比重,也可利用Excel统计软件进行。,简单次数分布数列的编制实例,编制步骤之六绘制表格 表3-6 某车间工人日产零件分组表,4.累计次数分布表(图)的编制,(1)累计次数和累计频率 反映总体单位分布特征的指标,用以说明总体中在某一变量值水平上下总共包含的总体单位次数和频率。 (2)累计次数和频率的计算方法 向上累计:是将各组的次数和频率,由变量值低的组向高的组累计。说明各组上限以下包含的总体单位数和比率。 向下累计:是将各组的次数和频率,由变量值高的组向低的组累计。说明各组下限以上包含的总体单位数和比率。,累计次数分布数列的编制实例,例3-2
12、根据例3-1编制的累计次数分布表如下:,表3-7 某车间工人日产零件累计分组表,二、次数分布,社会经济现象的分布主要有以下三种类型: (一)钟形分布/丘形分布 1.含义: 特点是“两头小,中间大”,即越靠近中间的变量值分布次数愈多;愈远离变量值中点分布的次数愈少,形态如钟或山丘。 正态分布:左右两侧对称分布 2.种类 左偏分布:存在极小变量值时曲线向左偏的 偏态分布 非对称分布 右偏分布:存在极大变量值时曲线向右偏的 非对称分布 正态分布 左偏分布 右偏分布,二、次数分布,(二)U形分布:是指较大和较小的变量值出现的次数多,而中间变量值出现的次数少,特点是“两头大,中间小” 。 (三)J形分布
13、:J形分布的特征是“一边大,一边小”。即次数随着变量值的变化大多数集中在某一端的分布。其曲线形如英文字母的“J”字,具体有正J形分布和反J形分布两种类型。 U形分布 正J形分布 反J形分布 *思考题:以下现象的次数分布符合哪种分布的特征? A 人群中身高、体重的分布 B 学生考试成绩的分布 C 按人口年龄分布的死亡率 D 餐饮企业销售额的分布,第四节 统计资料的表现形式,统计表的结构,从形式上看,统计表是由总标题,横行标题、纵栏标题和数字资料四部分组成 从内容上看,统计表是由主词和宾词两部分构成。 主词是统计表要说明的总体及其分组。 宾词是说明主词的统计指标。,统计表的结构,二、统计表的份类,
14、根据主词是否分组及分组情况分: 简单表 主词不经过任何分组的统计表 简单分组表 主词按某一标志进行分组的统计表 复合分组表 主词按两个或两个以上标志进行复合分组的统计表,简单表,1999年国际旅游收入居世界前十名的国家,简单分组表,1998年某公司所属两企业自行车合格品数量表,复合分组表,1999年我国人口数及构成,宾词的指标设计,平行配置 平行配置是对宾词栏中的分组指标按分组标志做平行排列。 层叠配置 层叠配置就是将宾词栏中的分组指标按分组标志进行层叠排列。,平行配置,某专业课程期末考试成绩,2层叠配置,某专业课程期末考试成绩,编制统计表应该注意的问题,1、标题简明、概括; 2、主词各行和宾
15、词各栏,先局部后整体; 3、栏数多,加编号; 4、表式一般开口; 5、数字对齐; 6、纵栏有细线,横行不一定; 7、注明计量单位; 8、必要加注解。,(一)概念 用点的位置、线段的升降、直条的长短及面积的大小等几何图形表达事物的统计指标大小、对比关系及变化趋势。 (二)作用 统计数据形象化; 便于分析比较; 具有吸引力。,二、统计图,(三)统计图的结构,标题:放在图的下方。 标目:横标目说明横轴的内容,通常为分组 因素。 纵标目说明纵轴的指标和单位,通常 为被描述事物的指标。 刻度:坐标轴的刻度单位。 图例:对统计图中的线条、颜色进行说明,位 于右上角或下方中间位置。,按资料的性质和分析目的选
16、用适合的图形: 间断性资料 条图、圆图、百分条图; 连续性资料 线图、直方图。 要有标题,扼要说明资料的内容,必要时注明时间、地点,一般写在图的下面。 条图、线图和直方图都有纵轴与横轴。 纵横坐标长度的比例一般约5:7为宜。 比较不同事物时,用不同的线条或颜色表示,要附图例说明。,(四)绘制统计图的基本要求,5 : 7,1:3,3:1,(六)常用统计图形的选择和绘制,1.柱形图(bar chart)条图 用等宽直条的长短来表示相互独立的各统计 指标的数值大小。分为: 单式条图:一个统计指标,一个分组因素; 复式条图:一个统计指标,两个分组因素; 分段条图:两个有隶属关系的统计指标, 一个分组因
17、素。,单式条图,复式条图,分段条图,绘制条图的注意事项,(1)纵轴刻度必须从“0”开始,否则会改变各对比组之间比例关系;,(2)横轴各直条一般按统计指标由大到小排列,也可按事物本身自然顺序排列; (3)各直条的宽度要一致,间隔的宽度一般与直条的宽度相等或为直条宽度的一半。,2. 圆图(pie chart), 定义:用圆的总面积表示事物的全部,用各个扇形面积(圆心角大小)表示各部分比重,适用于各构成比相加为100%的资料。 绘制: (1)计算各部分的角度: 圆心角(度)=各部分百分比360 (2)绘制图形:先画出圆形,再借助量角 器画出各圆心角。 (3)图例:各扇形内要注明简要的文字和 百分比,
18、还可绘入花纹或色彩。,(某居民小区家庭按月收入分组情况),3.线图,线图 (line chart)用线段的升降来表示一事物随另一事物变化的趋势,适用于连续性资料(如时间、年龄等)。,(1)绘制线图的方法,横轴代表分组标志,纵轴为统计指标(相对数、绝对数或平均数均可)且均为算术刻度。 两轴的刻度可以不从“0”开始,但每个点应描在组段的中间,相邻两点以直线连接。 同一线图中可以用不同的线条表示不同的对比组,但不宜太多,应附图例说明。,4.直方图(histogram),定义:即频数分布图,用矩形面积表示某个连续型变量的频数(频率)分布。 绘制:通常根据频数分布表以横轴表示连续型变量的组段,以纵轴表示频数或频率。 注意事项: (1)纵轴的刻度必须从“0”开始,而横轴刻度只需标出实际范围。 (2)各矩形的高度为频数或频率,宽度为组距。若各组段组距不等,则应调整各矩形高度:矩形高度=组段频数/组距。,本章小结,一、统计数据整理 统计数据整理是统计数据调查的继续和数据分析的前提,是感性认识上升到理性认识的连接点。数据整理的前提是审核,分组汇总是核心。按品质变量分组的关键是界定各类型组的性质差异,按数值变量分组的关键是正确确定各组的数量界限,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中医针灸推拿操作规范
- 2025四川成都益民集团所属企业招聘财务综合岗等岗位28人考试笔试备考试题及答案解析
- 关注女性术后护理常规
- 2025河南洛阳瀍河区北窑社区卫生服务中心招聘专业技术人才3人考试笔试备考试题及答案解析
- 鼻肠管营养支持
- 静脉采血的健康宣教和注意事项
- 版权无形资产评估
- 景点景区的翻译课件
- 2025浙江台州市温岭市交通旅游集团有限公司招聘编外工作人员1人考试笔试模拟试题及答案解析
- 智能语音家居系统实训
- 申论笔试题目及答案
- 基于显性核不育的棉花分子轮回选择育种体系的建立
- 网络游戏跨平台兼容性测试计划制定
- 有限空间作业中毒窒息应急处理预案
- DB46T665-2025 乡镇(街道)民政服务站建设和管理规范
- 承插式盘扣脚手架专项施工方案
- 《教育技术学导论》课件
- 《客家文化之擂茶》课件
- 【MOOC】计算机网络-中国科学技术大学 中国大学慕课MOOC答案
- 【MOOC】行政法与行政诉讼法学-西南政法大学 中国大学慕课MOOC答案
- 当代中国政治制度-004-国开机考复习资料
评论
0/150
提交评论