版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章统计整理第一节、统计整理概述第二节、统计分组第三节、分布数列第四节、统计表与统计图统计整理统计调查客观现象数量表现统计总体数量特征统计研究的程序统计研究目的统计设计推断分析描述分析《统计学原理》第三章统计整理
通过统计调查可以搜集到大量的统计资料,是统计研究的基础。但是这些资料只是反映总体单位具体情况的分散的、不系统的资料,不能用以反映总体的特征。
统计整理将统计调查得到的原始资料进行科学的分类和汇总,使之成为系统化、条理化的综合资料,以反映研究总体的特征。是统计调查的继续,统计分析的前提和基础,起着承前启后的作用。地位第一节统计整理概述统计整理的种类定期统计资料的整理专题统计资料的整理历史统计资料的整理根据定期统计报表资料进行综合整理
一般是根据专门调查资料进行整理的,是为研究某项专门问题而进行的,目的性明确,政策性强,时效性也很强利用年报(或定期报表)资料,系统地综合汇总、积累资料的一种整理工作《统计学原理》第三章统计整理编制整理纲要统计资料的审核统计资料的分类汇总编制统计表
一、统计资料整理的基本程序《统计学原理》第三章统计整理二、统计整理的内容和技术(一)统计整理的步骤(内容)
1.对原始资料进行审核
☀2.按要求进行分组或分类,编制分配数列
3.根据分组分类情况进行汇总(现在主要采用电脑汇总)和计算,得出各项指标值。
4.编制统计表,用统计表体现分组、汇总的结果《统计学原理》第三章统计整理(二)统计整理的技术(1)审核:包括汇总前审核和汇总后审核,确定资料的完整性、及时性和准确性;(2)分组:确定应整理的指标和确定应分的组;(3)汇总:对各项指标进行汇总,确定各组和总体的单位数和标志总量;(4)编表:用统计表现分组、汇总的结果。《统计学原理》第三章统计整理是指原始资料是否准确可靠.准确性
一是逻辑检查,检查调查资料内容是否合理,各个项目之间有没有相互矛盾的地方,答案是否合乎逻辑.是指所有的调查表格或问卷是否都已收齐,所有的问题是否都有答案。
完整性
二是计算检查,检查调查表格或问卷中各项数字在计算方法和计算结果上有无错误,数字的计量单位有没有差错,等等。审核方法统计资料的审核《统计学原理》第三章统计整理数据审核统计工作的基本程序收集数据科学地计算与分析得出结论真实数据正确结论虚假数据错误结论假数真算《统计学原理》第三章统计整理数据审核数据完整性审核准确性审核单位缺失项目缺失口径、方法、计量单位等等审核种类审核内容审核方法与调查方案比较逻辑审核平衡校验经验判断全员劳动生产率<工人劳动生产率销售收入-销售成本费用=利润某指标是否符合正常水平《统计学原理》第三章统计整理三.统计整理的组织常用的组织形式有
1、逐级汇总
2、集中汇总
3、综合汇总《统计学原理》第三章统计整理第二节统计分组指根据事物的内在特点和统计研究的需要,按一定的标志将统计总体区分为若干性质不同的组成部分的统计研究方法统计分组对总体而言,是“分”,即将总体区分为性质相异的若干部分。
《统计学原理》第三章统计整理对总体单位而言,是“合”,即将性质相同的个体组合起来,在同一组内则保持着相同的性质。
分组分组前分组后25%33%42%1·区分事物的性质作用:
例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济
《统计学原理》第三章统计整理2·反映总体内部结构例:上海市按GDP计算的三次产业结构(%)
1980年 1990年1996年 1997年
GDP 100 100100100
第一产业 3.2 4.3 2.5 2.3
第二产业 75.7 63.8 54.5 52.2
第三产业 21.1 31.9 43.0 45.5 3·研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(1984年)按收入分组(元)<200<300<400<500<600<800<1000恩格尔系数(%)64.960.256.754.450.549.943.6
《统计学原理》第三章统计整理研究贫富差别的基本方法:将人口按收入水平等分为5组,观察收入差别。20%20%20%20%20%中国九十年代:最富的20%家庭拥有全部财富的48%,最穷的20%家庭拥有全部财富的4%。《统计学原理》第三章统计整理统计分组的方法选择分组标志根据统计研究的目的选择分组标志
根据现象的本质特征选择分组标志根据现象所处的历史条件选择分组标志正确选择分组标志是做好统计分组的前提。《统计学原理》第三章统计整理统计分组的程序与原则选择分组标志确定分组体系总体单位归类科学性:组间差异大,组内差异小。完备性和互斥性:每个单位均能且只能归到某个组中。《统计学原理》第三章统计整理对大学生月生活费支出情况进行分组研究:按家庭收入水平分组;按城乡分组;按性别分组;按年龄分组。?统计分组的方法对父母亲下岗情况进行分组研究单亲下岗;双亲下岗;双亲在岗。不符合科学性不符合完备性和互斥性城乡区别离退休是否健在?《统计学原理》第三章统计整理拟定分组数目即决定分成哪些组,各组的内容、名称和界限。
原则互斥性包容性指各组之间界限明确,总体中的每一个单位,都只应属于其中的一个组。指在一个分组方案中拟定的所有组,能够包容总体的全部单位,不能排斥和遗漏任何一个单位。按品质标志分组按数量标志分组选择反映事物属性差异的标志作为分组依据。选择反映事物数量方面的差别的标志作为分组依据《统计学原理》第三章统计整理按数量标志分组的形式单项式分组指用单一的数值作为分组标志的分组。每个数值作为一个组。
如某班学生按年龄分组:17岁,18岁,19岁,20岁,21岁,22岁。组距式分组将作为分组依据的数量标志的整个取值范围依次划分为若干个满足互斥性和包容性的区间,用这些数值区间作为组的名称。某班学生统计学原理成绩分组60分以下60—70分70—80分80—90分90分以上《统计学原理》第三章统计整理组距式分组中的一些概念组限上限下限区间数值的最大值区让数值的最小值组距每一组的区间长度组距=上限-下限组中值每一组中点位置的数值组中值=(上限+下限)÷2开口组缺少上限数值或下限数值的组注意开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。《统计学原理》第三章统计整理某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)《统计学原理》第三章统计整理组距式分组中的一些概念等距分组异距分组例如60分以下60—70分70—80分80—90分90分以上组中值为(60+50)÷2=55组中值为(90+100)÷2=95各组组距相等的分组称为等距分组。各组组距不全相等的分组称为异距分组。上限不在内原则《统计学原理》第三章统计整理1、简单分组2、复合分组
即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。
复合分组是指对所研究的总体按两个或两个以上的标志层叠起来分组。可用于对事物多方面、多层次的分析研究。
统计分组的形式《统计学原理》第三章统计整理统计分组体系指根据统计研究的要求,对同一总体进行多种不同的分组而成的一种相互联系,相互补充,从不同角度说明总体的内部状况的认识体系。
对同一总体选择两个或两个以上标志分别进行简单分组。各分组标志表现并列使用。
各分组标志表现交叉结合使用。平行分组体系交叉分组体系《统计学原理》第三章统计整理平行分组体系对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年共计7组2+3+2《统计学原理》第三章统计整理复合分组体系按性别分类按职称分类按年龄分类男女高级中级初级青年中年共计12组2×3×2对教师的分类《统计学原理》第三章统计整理统计资料的再分组统计资料的再分组就是把统计分组资料按某种要求,重新划定各组界限,再将资料中的单位数或比重分布重新做出调整。见书中P64页例《统计学原理》第三章统计整理第三节分布数列
变量数列品质数列在统计分组基础上,将总体所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为分布数列.分布数列分类总体按某标志所分的组各组的次数或频率构成要素异距数列等距数列组距数列单值数列射击射击体操体操乒乓球举重乒乓球羽毛球举重乒乓球羽毛球举重举重跳水跳水跳水乒乓球跳水射击体操羽毛球柔道柔道举重田径羽毛球跆拳道中国体育代表团在悉尼奥运会上获金牌的项目《统计学原理》第三章统计整理品质数列的编制获金牌项目
金牌数占总数比例跳水5枚0.1786举重5枚0.1786乒乓球4枚
0.1429羽毛球4枚
0.1429体操3枚
0.1071射击3枚
0.1071柔道2枚
0.0714田径1枚
0.0357跆拳道1枚0.0357品质数列《统计学原理》第三章统计整理品质数列的编制获金牌项目
金牌数占总数比例跳水5枚0.1786举重5枚0.1786乒乓球4枚
0.1429羽毛球4枚
0.1429体操3枚
0.1071射击3枚
0.1071柔道2枚
0.0714田径1枚
0.0357跆拳道1枚0.0357变量值x次数(频数)f频率f/∑f《统计学原理》第三章统计整理品质数列的编制单项数列指每个组值只用一个具体的变量值表现的数列同时具备变量数列的编制变量是离散变量变量的不同取值个数较少编制条件:【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。《统计学原理》第三章统计整理日产量(件)X工人数(人)f202122232425263564321合计24编制结果如下:《统计学原理》第三章统计整理组距数列指每个组的变量值用一个区间来表现的变量数列变量数列的编制变量是连续变量;或:总体单位数较多变量不同取值个数也较多的离散变量。
编制条件:变量值变动区间的长度相等变量值变动区间的长度不完全相等等距数列异距数列《统计学原理》第三章统计整理编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某班35个学生统计学原理期末考试成绩如下,单位(分)44505660626365656969697074767778787980838485858687888990919192939494要求编制组距数列。《统计学原理》第三章统计整理组距数列的编制原始数据《统计学原理》第三章统计数据的整理与显示计算组中值排序确定组限计算变异全距确定组数、组距汇总组单位数制作组距数列统计表编制步骤或内容编制步骤:⒈求变异全距⒉确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R≤组距(d)×组数(m)编制等距数列《统计学原理》第三章统计整理计算组数(组数不宜过多,也不宜太少)上例中,取d=10,则有编制等距数列(当的结果为整数时)(当的结果为小数时)《统计学原理》第三章统计整理⒊确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法编制等距数列《统计学原理》第三章统计整理《统计学原理》第三章统计整理4、计算各组次数5、制作组距数列
按考试成绩分组(分)学生人数(人)60以下60~7070~8080~9090以上38897合计35某班统计学原理考试成绩表累计次数(频率)
从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。向上累计向下累计
从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。频率各组单位数占总体单位总数的比重《统计学原理》第三章统计整理频率与累积频率
销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计50100《统计学原理》第三章统计整理
销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向上累计5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合计50100——《统计学原理》第三章统计数据的整理与显示《统计学原理》第三章统计整理
销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————《统计学原理》第三章统计整理例题:某车间同工种的40名工人完成个人生产定额百分数如下:
9788123115119158112146117108105110107137120136125127142118103871151141171241291381001039295113126107108105119127104
根据上述资料,试编制分配数列,进一步再编制累计频数和累计频率数列。《统计学原理》第三章统计整理采用划记法计算全距=158-87=71带有根本性的质量界限:100%以组距为10%,可分7组(71/10=7.1)用划记法分组,▲◎●
◆★☆《统计学原理》第三章统计整理各组标记100以下▲100——110◎110——120●120——130
130——140◆140——150★150以上☆《统计学原理》第三章统计整理划记、计数9788123115119158112146117108▲▲
●●☆●★●◎105110107137120136125127142118◎●◎◆
◆
★●10387115114117124129138100103◎▲●●●
◆◎◎
9295113126107108105119127104▲▲●
◎◎◎●
◎▲=5◎=10●=11
=8◆=3★=2☆=1
《统计学原理》第三章统计整理建立分配数列、计算累计频数和累计频率个人生产定额完成程度(%)工人数(人)比重(%)向上累计工人数比重(%)100以下512.5512.5100—11010251527.5110—1201127.52655120—1308203475130—14037.53782.5140—150253987.5150以上12.540100合计40100——《统计学原理》第三章统计整理次数分布的表示
(一)列表法
1、某高校学生性别分布表(品质数列)
性别
人数(人)次数(频数)
频率(%)
男73257.14
女54942.86
合计1281100.00《统计学原理》第三章统计整理2、某厂工人日产量分布表(单项数列)按日产量分组(件)
工人数(人)
比率(%)9124.00103812.67116521.67128528.33136020.00143010.0015103.33
合计300100.00《统计学原理》第三章统计整理3、某班学生按考试成绩分组(组距数列)
按成绩分组(分)
人数(人)
比率(%)60以下78.860—702126.270—802531.280—901923.890以上810.0
合计80100.0《统计学原理》第三章统计整理(二)图示法
1、直方图
(1)单式直方图
2002年我国旅客周转量(亿人公里)《统计学原理》第三章统计整理(2)复式直方图
1998—2002年我国进出口总额(亿美元)《统计学原理》第三章统计整理2、折线图《统计学原理》第三章统计整
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年区块链交易所安全审计流程优化
- 燃气公司巡检外包合同
- 2025年氢燃料电池测试平台网络安全方案
- 2025年高考重庆卷物理真题(1-1115题)(无答案)
- 2025年ACCA《财务会计》专项测试卷
- 2026年房地产估价师之估价原理与方法能力提升试卷A卷附答案
- 陶瓷合闸电阻国内研发基地项目可行性研究报告模板-立项备案
- 护理给药的药物配伍禁忌
- 电动汽车充电设施投资合作协议合同三篇
- 母婴护理教育背景图集
- 2025ACG临床指南:成人溃疡性结肠炎(更新版)课件
- 口腔器械清洗消毒培训
- PADI潜水OW理论知识课件
- 健身房设计方案
- 车队车辆防汛安全培训课件
- 《AutoCAD 2021基础与应用案例教程》全套教学课件
- 2025岩棉板购销合同范本
- 化工车间级安全培训内容课件
- 2025年河南省信阳市羊山新区小升初数学试卷
- 2025年全国技能大赛试题及答案
- 空调安装应急预案方案
评论
0/150
提交评论