




已阅读5页,还剩69页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,统计学导论,2,统计数据的收集、整理与显示,第一节统计数据的收集第二节统计数据的整理第三节统计数据的显示,3,第一节统计数据的收集(参见袁卫等统计学P8-9,交代得很简单),统计数据收集:是指根据统计研究预定的目的和任务,运用科学的调查方法与手段,有计划、有组织地收集反映客观现实的统计资料的过程。统计数据的收集是统计工作的基础环节。,4,一、统计数据的收集方法,按所收集数据是否经过加工来划分,统计数据有两种表现形式:(见袁卫等统计学P8)原始资料:是直接向调查对象收集的反映调查单位的统计数据;二手资料:是已经加工、整理过的、说明总体现象的数据。,5,一、统计数据的收集方法,按被调查单位是否处于人为控制之下来划分,原始资料又有两种类型:试验数据:是在既定的控制条件下进行试验,反映试验过程和结果的数据(适用于自然科学);调查数据:是按照既定的调查方案,通过统计调查所取得的数据(适用于社会经济现象)。,6,一、统计数据的收集方法,收集被调查单位的原始资料(即调查数据),常用的方法有:直接观察法、报告法(通讯法)、采访法、登记法等。此外,计算机辅助电话调查、网络调查、卫星遥感技术等,正被广泛地用于统计数据的收集。,7,二、统计调查方式,统计调查方式:是指从调查对象中选取调查单位的方式。全面调查:对调查对象中的所有单位一一进行调查。非全面调查:仅对调查对象中的一部分单位进行调查。常用的统计调查方式:普查抽样调查重点调查统计报表制度,8,1.普查(见袁卫等统计学P8),普查:是专门组织的一种全面调查,它主要是用以收集某些不能或不宜用定期报表收集的统计资料。对国情国力的调查一般采用普查。普查的特点:(1)普查是一种非经常性的全面调查;(2)普查比任何一种调查形式更能掌握大量、详细、全面的统计资料。,9,第二次全国经济普查,普查时点为2008年12月31日24时,普查时期为2008年1月1日12月31日。普查对象:在境内从事第二、第三产业的法人单位、产业活动单位和个体经营户。普查范围:采矿业,制造业,电力,建筑业,交通运输、仓储和邮政业,批发和零售业,住宿和餐饮业,金融业,房地产业,租赁和商务服务业等。普查内容:单位基本属性、财务状况、生产经营情况、生产能力、能源消耗等。,10,2抽样调查(见袁卫等统计学P8),抽样调查:是一种非全面调查,抽样调查可以分为概率抽样和非概率抽样。概率抽样是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。非概率抽样是随便地或有意识地抽取单位进行调查,一般不用样本数据推断总体的数量特征。(袁卫等统计学P8没有提及)通常讨论的是概率抽样。,11,概率抽样,概率抽样的特点:样本单位按随机原则抽取,排除了主观因素对选样的影响。根据部分调查的实际资料对调查对象总体的数量特征作出估计。抽样误差可以事先计算并加以控制。抽样调查的适用场合:不可能或不必要进行全面调查的社会经济现象,采用抽样调查;对普查资料进行必要的修正。,12,3重点调查(袁卫等统计学没讲),重点调查:在调查对象中,只选择一部分重点单位进行的非全面调查。重点单位:它们的数量虽少,但在所研究现象的标志总量中占有绝大比重,在总体中具有举足轻重的作用。对这些单位进行调查,能够从数量上反映整个总体在该标志总量方面的基本情况。重点调查的特点:可以了解较详细的情况,但无法对现象总体的数量特征作出准确的推算,也无法测算调查误差。重点调查的适用场合:当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,宜采用重点调查。,13,4统计报表制度(袁卫等统计学没讲),统计报表制度:依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。统计报表制度的主要特点:报表资料的来源建立在各个基层单位的原始记录的基础上;由于统计报表是逐级上报和汇总的,各级领导部门都能获得管辖范围内的报表资料;是一种经常性的(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。,14,三、统计调查体系(袁卫等统计学没讲),统计调查体系:一个国家开展统计调查的方法和制度的总称。我国现行的统计调查体系:以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。,15,四、统计调查方案的设计(袁卫等统计学没讲),统计调查方案的设计,是指在背景分析的前提下,制定出一个周密的方案,用以指导调查工作的全过程。,16,四、统计调查方案的设计,统计调查方案一般包括以下内容:,一明确调查目的。就是明确统计调查要解决什么问题。二确定调查对象和调查单位。调查对象:是指需要调查的现象总体。调查单位:是指所要调查的具体单位,它是所要调查登记的标志的承担者。,17,四、统计调查方案的设计,报告单位:亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。报告单位一般是在行政上、经济上具有一定独立性的单位;而调查单位可以是人、企事业单位,也可以是物。二者有时一致,有时不一致。例:全国人口普查,属于报告单位和调查单位不一致的情形。,18,三设计调查项目。调查项目:是调查中所要登记的调查单位的特征,也就是调查单位的标志。四设计调查表格和问卷。将各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表。调查表的种类:一览表和单一表调查问卷:一种特殊形式的调查表格,四、统计调查方案的设计,19,五确定调查时间和调查期限。调查时间:是指调查资料所属的时间。在统计调查中,如果所调查的是时期现象,就要明确规定调查资料所反映的起止日期;如果所要调查的是时点现象,调查时间就是规定的统一标准时点。调查期限:是进行调查工作的时限。包括收集资料和报送资料的工作所需的时间。六拟定实施调查的进度计划。包括培训调查人员、落实调查经费、调查数据的报送方式等。七调查报告的撰写。,四、统计调查方案的设计,20,五、二手资料的主要来源渠道(参见袁卫等统计学P9),1统计年鉴中国统计年鉴、国际统计年鉴、地方统计年鉴、中国统计摘要、中国劳动统计年鉴、中国财政年鉴、中国西部统计年鉴、中国地区统计公报、中国人口年鉴等2有关期刊中国经济景气月报(国家统计局主办)中国经济数据分析(中国信息中心主办),21,小结:统计数据的收集,统计调查方案,22,第二节统计数据的整理(参见袁卫等统计学P15-23“2.1统计数据的整理”),一、数据整理概述(袁卫等统计学没有)1统计数据整理的含义统计数据整理是指对统计调查所收集到的各种数据进行分类和汇总,又称为汇总性整理。2统计数据整理方案的设计确定如何对所研究的总体进行统计分组;确定描述总体数量特征的统计指标体系。,23,3统计数据整理的程序(袁卫等统计学没有概括)(1)统计资料的审核(2)统计资料的分组与汇总(3)编制统计表或绘制统计图(4)统计资料的积累、保管和公布,24,二、统计分组(重点),(一)统计分组的概念和种类1.统计分组的概念根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。(袁卫等统计学P16的定义不严谨)统计分组标志:可以是品质标志或数量标志。(袁卫等统计学没有定义“品质标志”和“数量标志”这两个概念,但P16用到了),25,2.统计分组的性质(袁卫等统计学没有),统计分组兼有“分”和“合”双重含义。对于现象总体,是“分”;对于总体单位,是“合”。统计分组在突出一种差异时,必然掩盖其他差异。所以,必须根据统计研究的任务和分组对象的特点,正确选择分组标志。,26,3.统计分组的种类(袁卫等统计学没有),按分组标志的多少,分为简单分组和复合分组简单分组是对研究现象按一个标志进行分组。许多简单分组从不同角度说明同一总体,就构成一个平行分组体系。复合分组是把两个或两个以上的分组标志层叠起来对研究现象所作的分组。即:先按一个标志分组,在此基础上再按第二个标志分组,依此类推。复合分组构成一个复合分组体系。,翻页,27,某班学生按年龄分组,返回,28,高校教师按专业技术职务和年龄分组,返回,29,3.统计分组的种类,按分组标志的性质不同,分为品质分组和数量分组品质分组(或属性分组):就是按品质标志分组数量分组(或变量分组):就是按数量标志分组,30,(二)统计分组的原则和方法,1统计分组必须遵循两个原则:(袁卫等统计学P18将其概括为:“不重不漏”)穷尽原则:总体中的每一个单位都应有组可归,或者说各个分组一起足以包容总体所有的单位。互斥原则:在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时可以归属于几个组。,31,2统计分组的方法(袁卫等统计学没有展开说明),(1)按品质标志分组:有的简单,如按性别分组。有的很复杂,如按职业分组、城乡划分等。此时也叫分类,需由国家统计部门制定统一的分类标准。,32,2统计分组的方法(袁卫等统计学没有展开说明),(2)按数量标志分组单项式分组:用数量标志的每个取值作为组的名称。组距式分组:把数量标志的取值范围依次划分为若干个满足互斥原则和穷尽原则的区间,用这些数值区间作为组的名称。,33,例1:某班学生按年龄分组,返回,34,组距式分组的几个概念,组限:在组距式分组中,每一组变量值中的最大值称为上限,最小值称为下限。按照组限的写法不同,组距式分组有两种:间断型组距式分组:指相邻两组的组限不相连的组距式分组;连续型组距式分组:指相邻两组的组限相连(重叠),即以同一数值作为相邻组的共同界限的组距式分组。对于连续型组距式分组,为满足互斥原则,需遵循“上组限不在内”原则。“上组限不在内”原则:是指总体某个单位的变量值是相邻两组的界限值时,这个单位应归入作为下组限的那一组内。(袁卫等统计学P18)组距:每组数值区间的距离。等距分组与不等距分组(袁卫等统计学P18),35,例2:人口按年龄分组,返回,36,例3:全班同学按统计学成绩分组,返回,37,组距式分组相关指标的计算,(1)组距的计算连续型组距式分组的组距=本组上限本组下限间断型组距式分组的组距=本组上限本组下限+相邻组的组限间隔(2)组中值(上下限之间的中点数值,代表各组标志值的平均水平)的计算,(3)开口组的组距与组中值开口组:指“以上”、“以下”这种未规定上限或未规定下限的组。开口组的组距:以相邻组的组距作为开口组的组距。,该公式对连续变量离散化(舍尾)得到的组距式分组不适用!,补充,38,全班同学按统计学成绩分组,返回,39,企业按职工人数分组,返回,40,同学们按身高分组,返回,此时教材P27的(2.2)式不适用!,说明:公式“间断型组距式分组的组距=本组上限本组下限+1”,仅适用于相邻组的组限间隔为1的情形。,41,人口按年龄分组,返回,注意这一列!,42,补充:关于间断型组距式分组的组距、组中值的计算方法,间断型组距式分组的组距、组中值,最好采用组界(组与组之间的真实界限)来计算。分组标志为离散变量时,组界是相邻组组限的中点;分组标志为连续变量经过离散化处理得到时,组界的确定要视离散化处理的方式而定:舍尾法(如:年龄表示为周岁),挑尾法(如:年龄表示为虚岁),四舍五入(如:身高表示为多少公分)。,间断型组距式分组的组距=上组界下组界,翻页,43,企业按职工人数分组,返回,44,人口按年龄分组,返回,45,同学们按身高分组,返回,46,三、次数分布,(一)次数分布的基本概念1.次数分布的定义将统计总体按某个标志分组,并将总体中的所有单位按组归类,计算各组的单位数,这样得到的特殊分组就叫次数分布(或次数分配)。(袁卫等统计学P17)次数分布的各组名称与相应的次数结合在一起,形成反映总体单位在各组之间分布状况的数列,所以也叫作分布数列。,47,全班同学按统计学成绩分组形成的次数分布,返回,48,2.分布数列的两个要素一是总体按某标志所分的组。若总体按数量标志分组,分组标志在各组有不同的数量表现,形成标志值数列,亦称变量,一般用x表示。二是各组所出现的单位数,即次数(亦称频数),一般用f表示。,3.频率用各组频数与总体单位总数相除,可以得到频率。,49,频率的性质:,4.频数密度与频率密度对于不等距分组,各组次数的多少还受到组距大小的影响。为消除不等距分组所造成的这种影响,需计算频数密度与频率密度。(A)频数密度=频数/组距(B)频率密度=频率/组距,50,四、累计频数与累计频率,1累计次数分布在数量标志分布数列的基础上,将各组频数或频率依次累计,可以得到累计频数或累计频率。(袁卫等统计学P19用的是“累积”二字),51,例460对新婚青年按结婚费用分组,返回,翻页,52,可见,累计次数分布有向上累计(上限以下累计)和向下累计(下限以上累计)之分:(袁卫等统计学P19的文字表述和表2.9都有问题!)向上累计:是由标志值低的组向标志值高的组依次累计,某一组的累计频数或频率是指该组上限以下各组频数或频率的累计数;向下累计:是由标志值高的组向标志值低的组依次累计,某一组的累计频数或频率是指该组下限以上各组频数或频率的累计数。,53,累计频数或累计频率有如下特点:开始累计第一组的累计频数或累计频率等于第一组本身的频数或频率;累计到最后一组的累计频数或累计频率等于总体的总频数或总频率(总频率为1)。,54,第三节统计数据的显示,1统计表的定义和结构(1)统计表的定义把统计数据按一定的顺序排列在表格上,就形成了统计表。,一、统计表(参见袁卫等统计学P39-40),55,(2)统计表的结构,从表式上看,统计表包括总标题、横行标题、纵栏标题和指标数值四个部分。从内容上看,统计表由主词栏和宾词栏组成。主词:统计表所要说明的总体及其组成部分;宾词:统计表用来说明总体数量特征的各个统计指标。,翻页,56,统计表的结构,2005年我国三次产业比例,指标数值,横行标题,总标题,纵栏标题,主词栏,宾词栏,返回,57,2统计表的分类,(1)按主词的结构分类根据主词是否分组和分组的程度,分为简单表、简单分组表和复合分组表。简单表:主词未经任何分组的统计表。简单分组表:主词只按一个标志分组的统计表。复合分组表:主词按两个或两个以上标志复合分组的统计表。,58,2统计表的分类,(2)按宾词设计分类按宾词的排列方式不同,可分为宾词简单排列、宾词分组平行排列和宾词分组层叠排列等三种。宾词简单排列:宾词未进行任何分组。宾词分组平行排列:宾词栏中各指标按几个分组标志分组,平行排列。宾词分组层叠排列:宾词栏中各指标按几个分组标志分组,层叠排列。,翻页,59,高校教师按专业技术职务和年龄分组,返回,60,我国独立核算工业企业的生产及销售成果,返回,61,各地区社会商品零售总额,返回,62,地区各种经济类型房地产企业经营情况表,单位:亿元,返回,63,3统计表的设计,统计表的设计,需特别注意以下几个方面:(1)开口式(2)标题(3)合计栏(4)数据(5)计量单位(6)注释或资料来源,64,二、统计图(袁卫等统计学P40-50有补充!),常用的统计图有:直方图、折线图、曲线图和累计曲线图。,1直方图(袁卫等统计学P19-20)以横轴表示分组变量,以纵轴表示频数或频率,以各组的组距为宽,以各组的频数或频率为高,绘制直立于横轴上的长方形,便成为分布直方图。例:见袁卫等统计学P19图2-1但是,对于异距分组,在绘制直方图时,应以频数密度或频率密度为纵轴。(教材未提!),65,二、统计图,2折线图是用直线段依次连结分布直方图各直条顶端中点画成的。在直方图的左右两侧应各延伸一个相邻组组距的长度,以其中点作为折线图的两个端点。(教材未提,但画图正确!)例:见袁卫等统计学P20图2-2,66,二、统计图,3曲线图当把组距式分组分得无穷多(无限地密),以至各组组距趋近于0时,次数分布折线便演变成一条平滑的曲线,称之为分布曲线图。(见袁卫等统计学P20)曲线图的绘制方法与折线图基本相同,只是用平滑曲线连接各个坐标点。例:见袁卫等统计学P20图2-3,67,二、统计图,4累计曲线图以分组变量为横轴,以累计频数(频率)为纵轴。绘制向上累计分布图时,由变量值低的组开始,用各组的累计频率与该组上限确定坐标点,然后从最低组的下限开始将这些点依次连接。绘制向下累计分布图时,由变量值高的组开始,用各组的累计频率与该组下限确定坐标点,然后从最高组的上限开始将这些点依次连接。,68,洛伦茨曲线(参见袁卫等统计学P21),洛伦茨曲线:一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年航空航天领域3D打印金属材料表面处理技术创新应用报告
- 企业预算编制及成本控制方法
- 全科主治医师资格考试历年模拟题集
- 小学科学综合实验操作指导书
- 建筑施工安全专项分项方案指导
- 电力工程施工技术方案及安全措施
- 在线教学中学生评价方法探讨
- 2025年纺织服装制造业智能化生产智能生产设备智能化改造市场竞争力提升策略优化策略报告
- 中学英语听力训练课程资源包
- 幼儿园英语初级听力教学教案范文
- T/CHC 1005-2023破壁灵芝孢子粉
- 图像几何变换讲解
- 高一上学期《国庆假期安全教育+时间规划》主题班会课件
- 分拣部管理制度
- 2025年铁路货装值班员(高级)职业技能鉴定参考试题库(含答案)
- 2024年单招数学函数的性质专项复习试题和答案
- 星级酒店的各类客房类型介绍
- 2024-2025学年高一下学期《唤醒内驱力-开启自主学习成长之旅》主题班会课件
- 养成良好习惯遇见更好自己-2025年春季学期习惯养成教育主题班会课件
- 光缆通信基础知识
- 事业单位国有资产无偿划转意向协议书(2篇)
评论
0/150
提交评论