第2章 统计数据的搜集、整理与显示.ppt_第1页
第2章 统计数据的搜集、整理与显示.ppt_第2页
第2章 统计数据的搜集、整理与显示.ppt_第3页
第2章 统计数据的搜集、整理与显示.ppt_第4页
第2章 统计数据的搜集、整理与显示.ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.统计学导论,周主讲;2.统计数据的收集、整理和显示;1.收集统计数据;2.统计数据的排列和显示;3.统计数据的收集(见魏源等人的统计P8-9,非常简单);统计数据收集是指根据统计研究的预期目的和任务,运用科学的调查方法和手段,包括统计数据的收集是统计工作的基本环节。四,一。统计数据的收集方法根据收集的数据是否经过处理来划分。统计数据有两种形式:(见魏源等的统计P8)原始数据:直接从被调查者处收集的反映调查单位的统计数据;二手数据:经过处理和分类并说明整体现象的数据。五,一。统计数据的收集方法根据被调查单位是否处于人为控制之下进行划分,原始数据有两种类型:试验数据:反映在既定控制条件下试验过

2、程和结果的数据(适用于自然科学);调查数据:根据既定的调查方案(适用于社会经济现象)通过统计调查获得的数据。收集统计数据的方法,收集被调查单位的原始数据(即调查数据),常用的方法有:直接观察、报告(交流)、访谈、登记等。此外,计算机辅助电话调查、网络调查和卫星遥感技术正被广泛用于收集统计数据。统计调查方法:指从调查对象中选择调查单位的方法。全面调查:对调查对象中的所有单位逐一进行调查。非全面调查:只对调查对象中的一部分单位进行调查。常用的统计调查方法:普查抽样调查侧重于统计报告制度;8,1。人口普查(见魏源等人的统计P8);普查:专门组织的综合调查,主要用于收集一些不能或不应由定期报告收集的统

3、计数据。普查一般用于调查国情和国力。人口普查的特点是:(1)人口普查是不定期的综合调查;(2)普查能比任何其他调查形式更好地掌握大量详细而全面的统计数据。第二次全国经济普查于2008年12月31日24: 00进行,普查时间为2008年1月1日至12月31日。普查对象:中国从事第二、三产业的法人、工业活动单位和个体经营户。普查涵盖采矿、制造业、电力、建筑、运输、仓储和邮政服务、批发和零售、住宿和餐饮、金融、房地产、租赁和商业服务。普查内容:基本属性、财务状况、生产经营、产能、能源消耗等。抽样调查(见魏源等统计P8),抽样调查:不完全调查,抽样调查可分为概率抽样和非概率抽样。概率抽样是根据随机原理

4、从调查对象中抽取一些单元作为样本进行观察,然后根据样本数据计算调查对象的总体特征。非概率抽样是指随机或有意识地抽样调查单位,一般不使用样本数据来推断人口的数量特征。(魏源和其他统计P8没有提到这一点。通常讨论概率抽样。11,概率抽样,概率抽样的特征:抽样单位是根据随机原则选择的,排除了主观因素对抽样选择的影响。根据一些调查的实际数据,对受访者的总体数量特征进行了估计。采样误差可以预先计算和控制。抽样调查的适用场合:对不可能或没有必要进行全面调查的社会经济现象,采用抽样调查;对普查数据进行必要的修改。12,3重点调查(魏源等统计没有谈及),重点调查:在调查对象中,只有部分重点单位被选中进行非全面

5、调查。关键单位:虽然它们的数量很少,但它们在所研究现象的符号总数中占很大比例,在whol起着决定性的作用调查这些单位可以从标志的总量上定量地反映整个人口的基本情况。重点调查的特点:我们可以了解具体情况,但不能对现象的整体定量特征进行准确计算,也不能衡量调查的误差。重点调查适用场合:当调查任务只要求掌握基本情况,部分单位能够集中反映研究项目时,应采用重点调查。13,4统计报告制度(魏源等统计没有谈及),统计报告制度:根据国家有关法律法规自上而下统一安排,以一定的原始记录为基础,按照统一的表格样式、统一的索引项目、统一的提交时间和提交程序,自下而上定期提供统计数据的一种调查方法。统计报表系统的主要

6、特点是:报表数据来源基于各基层单位的原始记录;由于统计报表是逐级上报和汇总的,各级领导部门都可以获得本辖区内的报表材料;这是一次定期(连续)调查,调查项目相对稳定,有利于积累数据和进行动态对比分析。统计调查制度(魏源等人没有谈到统计学),统计调查制度:一个国家统计调查方法和制度的总称。中国现行的统计调查制度:以必要的定期普查为基础,以定期抽样调查为主体,辅以重点调查、科学计算和综合应用一些综合报表的统计调查方法体系。4.统计调查方案的设计(魏源和其他统计学家没有谈及这一点)统计调查方案的设计是指在背景分析的前提下制定一个周密的方案来指导整个调查过程。4.统计调查方案的设计,一般包括以下内容:1

7、 .阐明调查的目的。就是要搞清楚统计调查应该解决什么问题。2.确定调查的对象和单位。调查对象:指被调查的整体现象。调查单位:指被调查的具体单位,是被调查和登记的标志的持有人。4.统计调查方案设计报告单位:也称报告单位,是负责报告调查内容和提交统计数据的单位。报告单位一般是一个独立的行政和经济单位;调查单位可以是人、企事业单位或事物。有时它们是一致的,有时它们不是。例如,国家人口普查在报告单位和调查单位之间不一致。18和3设计调查项目。调查项目:是调查中登记的调查单位的特征,即调查单位的标志。4.设计调查表和问卷。将每个调查项目按一定的顺序排列在一定的表格上就构成了问卷。问卷类型:核对表和单式问

8、卷:一种特殊形式的调查表;4.统计调查方案的设计;19.确定调查时间和周期。调查时间:指调查数据所属的时间。在统计调查中,如果调查是一个周期现象,就必须具体说明调查数据中反映的开始和结束日期;如果要调查时间现象,调查时间是指定的统一标准时间。调查期限:是调查的期限。包括数据收集和提交所需的时间。6.制定实施调查的进度计划。包括培训调查人员、落实调查经费和提交调查数据的方法。7.撰写调查报告。、4、统计调查方案的设计、20、5、二级数据的主要来源(见魏源P9统计局等)、1中国统计年鉴、国际统计年鉴、地方统计年鉴、中国统计摘要、中国劳动统计年鉴、中国金融年鉴、中国西部统计年鉴、中国区域统计公报、中

9、国人口年鉴等。2相关期刊中国经济景气月报(国家统计局主办)中国经济数据分析(中国信息中心主办),21,摘要:统计数据收集,统计调查方案,22,第2节:统计数据整理(见魏源等统计p15-23,“2.1统计数据整理”);一、数据整理概述(魏源等的统计中没有)1统计数据整理的含义:统计数据整理是指对统计调查收集的各种数据进行分类和汇总,也称汇总整理。2.统计数据排列方案的设计决定了如何对研究人群进行统计分组;确定描述总体量化特征的统计指标体系。23,3统计数据的整理程序(不包括魏源等统计数据)(1)统计数据的审核(2)统计数据的分组和汇总(3)统计表格的编制或统计图表的绘制(4)统计数据的积累、存储

10、和发布,24,2。统计分组(要点),(1)统计分组的概念和类型1。统计分组的概念是基于统计研究的目的(魏源对P16的定义并不严格。)统计分组标志:可以是质量标志,也可以是数量标志。(魏源和其他统计学家没有定义“质量标志”和“数量标志”这两个概念,但P16使用了它们),25,2。统计分组的性质(魏源和其他统计学家没有),它具有“划分”和“组合”的双重含义。对于现象整体来说,它是“点”;对于整体单元,它是“组合的”。当统计分组突出一个差异时,它将不可避免地掩盖其他差异。因此,根据统计研究的任务和分组对象的特点,必须正确选择分组标志。26,3。统计分组的类型(在魏源的统计中没有,等等)。)根据分组标

11、记的数量分为简单分组和复合分组。许多简单的分组从不同的角度描述同一个群体,这构成了一个平行的分组系统。复合分组是通过叠加两个或多个分组标记对研究现象进行分组。也就是说,先按一个符号分组,然后按第二个符号分组,依此类推。复合分组构成了复合分组系统。翻到第27页,一个班的学生按年龄分组,返回28,大学教师按专业技术职务和年龄分组,返回29,3。统计分组的类型分为质量分组和数量分组(或属性分组):按质量标志分组(或变量分组):按数量标志分组,30,(2) 1统计分组必须遵循两个原则:(魏源等,统计P18将其概括为:“无权重,无泄漏”)用尽原则:人口中的每个单位都应该分组,或者每个分组加在一起就足以包

12、含人口中的所有单位。根据互斥:原则,人口中的任何单位只能属于某一个群体,但不能同时属于几个群体。31,2统计分组方法(魏源和其他统计没有解释),(1)按质量分数分组:有些很简单,如按性别分组。有些是复杂的,如按职业分组、划分城乡等。这时,又叫分类,国家统计部门有必要制定统一的分类标准。32,2统计分组方法(魏源等统计没有展开描述),(2)按数量标记分组:数量标记的每个值都用作组的名称。分组距离分组:将数量符号的取值范围分成几个满足互斥和穷尽原则的区间,并将这些数值区间作为组的名称。,33,例1:一个班的学生按年龄分组,返回,34,组距离分组的几个概念,组极限:在组距离分组中,每个组变量值的最大

13、值称为上限,最小值称为下限。根据组限的不同写法,有两种组间距分组:间歇组间距分组:相邻两组的组限不相连的组间距分组;连续组间距分组:指相邻组的组界限相连(重叠)的组间距分组,即取相同的值作为相邻组的共同界限。对于连续组间距分组,为了满足互斥原则,应遵循“不包括组上限”的原则。“不包括群体上限”的原则是指当群体中某个单位的变量值是相邻两个群体的极限值时,该单位应归类为群体下限。(魏源等统计P18)组距离:每组数字区间之间的距离。等距分组和不等分组(魏源等的统计p18),35,案例2:人口按年龄分组,返回,36,案例3:全班按统计结果分组,返回,37,组距分组相关指标的计算, (1)组距计算连续组

14、距分组的组距=该组的上限,间歇组距分组的组距=该组的上限,相邻组的组距(2)组中值的计算(上下限之间的中点值,代表各组得分值的平均水平),(3)开放组的组距和开放组的组中值:参照开放组“上”和“下”组距的未指定上限:以相邻组的组距作为开放组的组距。此公式不适用于通过连续变量的离散化(舍入)获得的组间距分组!补充,38,全班根据统计结果分组,返回,39,企业根据员工人数分组,返回,40,学生根据身高分组,返回,此时教材P27中的公式(2.2)不适用!说明:“间歇群距分组的群距=该群的上限和该群的下限1”公式只适用于相邻群的群限区间为1的情况。41,人口按年龄分组,返回,注意这一栏!42,补充:关

15、于间歇群距离分组的群距离和群中位数的计算方法,最好是计算群边界(群之间的实际边界)。当分组标志是离散变量时,组边界是相邻组的组界限的中点;当通过连续变量的离散化获得分组标记时,组边界的确定取决于离散化方法:舍入方法(例如,年龄表示为年龄)、尾部拾取方法(例如,年龄表示为虚拟年龄)和舍入(例如,表示多少厘米高)。间歇组间距=上组边界和下组边界,翻页,43,企业按员工人数分组,返回,44,人口按年龄分组,返回,45,学生按身高分组,返回,46,3,频率分布,(1)频率分布的基本概念1。频率分布的定义根据某个符号对统计总体进行分组。(魏源等,统计P17)每组时间分布的名称与相应的时间组合在一起,形成

16、一个反映各组间总体单位分布的系列,因此也称为分布系列。47,根据他们的统计分数将整个班级分组形成的频率分布,返回48,2。分布序列的两个元素是由某个符号作为一个整体划分的组。如果用数量标记对整个群体进行分组,则每组中的分组标记具有不同的数量表现,形成一系列标记值,也称为变量,通常用x表示。其次,每组中的单位数,即频率(也称为频率),通常用F表示.频率可以通过将每个组的频率除以总单元数来获得。49,频率的性质:4。频率密度和频率密度对于不等距离分组,每个组的次数也受(魏源等统计P19使用“累计”一词),51,4,60对新婚青年按其婚嫁费用分组,返回,翻页,52,这表明累计频率分布可分为向上累计(累计低于上限)和向下累计(累计高于下限):(魏源等统计P19的词和表2.9有问题!向上累加:分数值低的组按顺序累加到分数值高的组,某个组的累加频率或频率是指低于该组上限的每个组的累加频率或频率;向下累加:从高分组到低分组依次累加。某一组的累计频率或频率是指每一组的累计频率或频率高于该组的下限。53,累积频率或累积频率具有以下特征:第一组的累积频率或累积频率等于第一组本身的频率或频率;累计频率或累计到最后一组的累计频率等于总体的总频率或总频率(总频率为1)。54,第三节统计数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论