版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章统计数据的收集与整理第一节统计数据及其计量尺度第二节统计调查的意义与要求第三节统计调查的设计第四节统计调查的组织第五节统计数据整理一、统计数据第一节统计数据及其计量尺度统计数据:即统计资料(statisticaldata)统计资料是统计工作过程中所取得的各项数字资料以及与之相关信息的总称。统计资料是统计工作取得的能够说明所研究对象的数据。例如国内生产总值数据,说明整个国家的生产规模。直接向调查对象搜集反映调查单位的统计资料。例如:企业通过市场调查活动可以在市场直接获得,没有经过任何的处理的大量个体资料。统计资料按取得途径分为:原始资料二手资料根据研究目的,从各种数据渠道搜集已经加工、整理过的、说明总体现象的资料。例如:企业通过报纸、杂志、网站等渠道可以方便快捷取得所需的市场信息。二手资料通常不需要直接对调查个体进行登记,而是从有关媒介或政府部门公开发表的资讯中获得,也可以是从专业的市场调查机构定期或不定期的发表的资料中获取,且资料获取的费用要大大低于企业专门组织的市场调查,通过对二手资料的获得,可以方便快捷取得所需的市场信息。经常性收集市场二手资料可以帮助企业建立起自己的市场资源数据库,为企业建立起现代经营模式,从事市场营运,适应数字化时代生存法则的要求。需要注意的是二手资料由于来自不同的部门和机构,其最初的调查目的和调查方案方法的设计是不一致的,其资料的内涵和口径是不一样的。所以对二手资料的引用要特别谨慎。首先,对二手资料的设计口径和计算方法要有充分的了解。只有这样才有可能根据自身的市场调查目的二手资料进行再整理和再分组,以使其符合企业市场调查的需要。其次,要对二手资料的调查对象有着充分的了解和认识。不同的调查对象对同一问题的回答是不一样的,企业在不同的时期有不同的调查任务,在不同的市场上目标消费者是不一样的,市场调查的对象自然也不可能是一样的。没有弄清楚二手资料的调查对象绝对不可随意引用。第三,要了解二手资料原来的调查过程。不同调查过程会样本的选取过程和选取方法,最终影响调查资料的误差大小以及调查误差的控制方法。第四,对于来自商业性的市场调查的数据,要有高度的警惕和充分的认识。目前,我国市场调查行业还十分不规范,这些机构中还有许多企业未能摆脱生存的威胁,其公布的调查资料往往无法真正做到公平公正,更有甚者在公布的资料中明显带有人为的痕迹,谁出资赞助调查的结果就偏向谁,谁赞助多谁的排名就有利。对于这类资料,企业在引用时要足够的警惕,否则就会误导企业作出错误的调查结论,给企业带来不可估量的损失。二、数据的计量尺度1.定类尺度,也称类别尺度或名义尺度;
2.定序尺度,也称等级尺度或顺序尺度;3.定距尺度,也称间隔尺度或区间尺度;4.定比尺度,也称比例尺度或等比尺度;一、统计调查的意义第二节统计调查的意义与要求统计调查就是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集资料的过程。应当正确理解社会调查在人们认识中的地位;应当正确理解统计调查在统计工作中的地位;应当正确理解统计调查理论和方法在统计学原理中的地位。二统计调查的基本要求准确性要求和及时性要求是相互结合相互依存的,及时性在准确性要求的前提下才有意义,而准确性也不能损害及时性的要求。准确性及时性第三节统计调查的设计(即统计调查方案)调查对象就是我们需要进行研究的总体范围,即调查总体。它是由性质相同的许多调查单位所组成的。作为调查单位乃是进行登记的标志表现的直接承担者。1.确定调查的目的
——即调查些什么2.确定调查对象和调查单位
——即向谁做调查3.拟订调查提纲和制定调查表
——即用什么方法调查拟订调查项目时要注意几个原则:-调查项目要少而精;
-调查项目含义要明确;-尽可能做到各个调查项目之间有一定的联系。调查表分为:一览表把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是分不开,故调查深度不够;单一表将一个调查单位的项目登记在一份表或一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是繁琐。4.确定调查时间
——
即在什么时间调查要区别调查时间和调查期限的不同:-调查时间是指调查资料所属的时间(时点或时期);-调查期限是指调查工作的起讫时间。5.制定调查的组织实施计划第四节统计调查的组织(即调查的形式及方法)统计调查分类调查对象调查时间组织形式搜集资料方法全面调查非全面调查连续调查不连续调查定期报表专门调查普查全面报表抽样调查重点调查典型调查周期性调查普查一次性调查抽样调查重点调查典型调查直接观察报告法问卷调查访问调查卫星遥感对调查对象的所有单位一一进行调查。对调查对象其中的一部分单位进行调查,以取得调查对象的一部分资料,用来推断总体或反映总体的基本情况。一种专门组织的、一次性的全面调查,用来调查属于一定时点上或一定时期内的社会经济现象的总量。主要是用以搜集某些不能或不宜用定期报表搜集的统计资料。特点:①普查一般用来调查属于一定时点上社会经济现象的总量②普查比任何其它调查都更能掌握大量全面的统计资料。组织方式:专门组织的普查机构派出调查人员,直接登记。利用调查单位的原始记录和资料,发一定的调查表格,由调查单位填报。作用:
①可以为抽样调查提供抽样框②可以收集统计报表所不能提供的反映重大国情国力的基本统计信息,如:人口普查、经济普查局限:由于需要大量的人力、物力和财力,不宜经常进行指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度。要求:统一的表式,统一的指标项目,统一的报送时间和报送程序。根据统计调查项目的不同,统计报表制度分为:国家统计报表制度、部门统计报表制度和地方统计报表制度。优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要。缺点:统计报表过多会增加基层负担;有可能由于虚报瞒报而影响统计资料质量。
按照
随机原则
从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。随机原则:指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会。为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。
重点单位是数目不多的一些单位,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况
优点:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料。
局限:只适用于客观存在着重点单位的情况。在对调查对象有一定了解的基础上,有意识地选择少数典型单位进行调查的一种非全面调查组织方式。典型单位:指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量特点。作用:一定条件下能估计总体指标数值;可以补充全面调查的不足;可以用来研究新生事物。局限:不能确定推断的把握程度,无法计算和控制推断误差。连续调查要求随着事物在时间上的发展变化而连续不断地进行登记。一般用于调查时期现象,如:产值、产量、原料消耗等。不连续登记的调查,是对事物每隔一段时间后在一定时点上的状态进行登记。一般调查时点现象,如:例如:人口数,固定资产总值。卫星遥感法是一种使用卫星遥感技术进行调查的方法。主要用于农作物产量调查、森林植被调查等。图1安徽省2007年6月上旬植被指数(归一化植被指数)NOAA监测图调查人员亲自到现场对调查单位进行观察和计量以取得资料的一种调查方法。特点:就调查对象的行动和意识,调查人员边观察边记录以收集所需信息;调查人员不是强行介入;能够在被调查者不察觉的情况下获得资料。调查者与被调查者通过面对面地交谈而获得资料。可采用方式:入户调查、座谈会、个别采访等。优点:可提高回答率,可提高数据的质量。
由报告单位依据统计报表的格式和要求,按照隶属关系,逐级向有关部门提供统计资料。特点:统一性和时间性、周期性、相对可靠性、灵活性差问卷调查是研究者把研究问题设计成若干具体问题,按一定规则排列,编制成书面问题表格,交由调查对象填写,然后收回整理分析,从而得出结论的研究方法。问卷调查是一种标准化的调查方法,在市场调查和社会调查中的应用非常广泛。第五节统计数据整理统计数据整理:根据统计研究的任务与要求,对统计调查所搜集到的数据资料进行分组、汇总,使其条理化、系统化的工作过程。统计整理包括对原始资料和次级资料的整理。统计整理是将反映总体单位特征的标志表现向反映总体综合特征的统计指标的转化。一、数据整理的内容与程序二、统计分组三、分配数列四、统计表一、数据整理的内容与程序1.编制统计整理方案2.审核数据3.处理数据4.显示数据处理结果5.积累和保管数据统计整理方案规定了整理的具体要求和实施办法,其主要内容包括:根据统计研究目的的确定对统计调查中所搜集的哪些资料进行整理,还要确定如何进行统计分组,要得到哪些指标以及统计资料如何显示等。统计数据处理是对统计调查所搜集到的数据进行分类和汇总。具体操作包括:筛选、排序、分组、汇总等。筛选:剔除有明显错误的数据和不符合要求的数据。排序:排序就是按一定顺序排列数据。作用:发现数据的变化趋势;为分类或分组提供依据;直接利用排序结果作分析。方法:定类数据按类排序;定量数据按序排序。含义:是指在统计分组的基础上,把总体单位各方面的标志表现进行综合和加总,最终得到总体指标的过程。意义:统计的直接目的就是要得到指标,没有汇总,就没有指标。因此,汇总是统计整理的主要内容,中心环节,在此基础上才能根据各种形式的指标进行统计分析。二、统计分组1.统计分组的概念2.统计分组的作用3.统计分组的程序与原则4.统计分组的种类根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。类型1999年2000年2001年2002年农业14106.213873.614462.814931.5林业886.3936.5938.81033.5牧业6997.67393.17963.18454.6渔业2539.02712.62815.02971.1合计24519.124915.826179.627390.81999年至2002年我国第一产业各大类产值单位:亿元区分社会经济现象的类型,反映各类型的特点。“九五”期间我国国内生产总值构成(%)年份19961997199819992000第一产业20.419.118.617.615.9第二产业49.550.049.349.450.9第三产业30.130.932.133.033.2合计100.0100.0100.0100.0100.0反映社会经济现象的内部结构。揭示经济现象之间的依存关系。耕作深度分组(cm)地块数平均收获率(斤/亩)10-12740012-141046014-161654016-1818-20125620680某乡某种农作物的耕作深度与收获率的关系选择分组标志确定分组体系总体单位归类科学性:组间差异大,组内差异小。穷尽性和互斥性:每个单位均能且只能归到某个组中。统计分组的程序与原则
1.根据研究任务和目的选择分组标志
2.选择能反映事物本质特征或重要特征的标志
3.结合现象所处的历史条件和社会经济条件选择分组标志.按品质标志分组——
反映事物属性差异4.统计分组的种类1).根据分组标志的性质不同分为:按数量标志分组
——反映事物数量差异例如:按性别分组:按民族分组:例如:按年龄分组:2).根据分组标志的多少不同分为:简单分组:只按一个标志对总体进行分组复合分组:按两个或两个以上标志结合起来对总体进行分组。例如:三、分配数列1.分配数列的概念及种类2.变量数列的编制3.次数分布的特征1.分配数列的概念及种类分配数列的概念在统计分组的基础上,将总体的所有单位按组归类整理,计算各组的单位数,并按组的顺序加以排列,就形成了说明总体单位总数在各组分配情况的次数分布,又称次数分配、分布数列或分配数列。次数分布是统计整理的一种重要形式,也是统计描述和统计分析的一种重要方法。它可以表明总体的分布特征、结构情况等,并可据此研究总体某一标志的平均水平及其变动的规律性等。例分类品质数列变量数列单项数列组距数列某厂工人完成产量分组表工人平均日产量(件)工人数频数(人)频率(%)2345610153040208.713.026.134.817.4合计115100.0各组的总体单位数称为次数或频数。各组次数与总次数之比叫频率(比重)。2.变量数列的编制单项数列的编制组距数列的编制需要熟悉的一些概念组距式分组步骤编制等距数列实例单项数列的编制变量是离散变量变量的不同取值个数较少编制条件:某市居民家庭按家庭人口数分组
组距数列的编制变量是连续变量;或:总体单位数较多,变量不同取值个数也较多的离散变量。编制条件:组距数列的每个组的变量值用一个区间来表现。一个区间表现为“从……到……”距离,把每个区间内的所有变量值归为一组。某班同学统计学考试成绩表成绩(分)人数(人)比重(%)60以下61260~70122470~80193880~90102090~10036合计50100需要熟悉的一些概念间断组距式分组与连续组距式分组间断组距式分组的组限不相连。连续组距式分组的组限相连。等距分组与异距分组等距数列的变量值变动区间的长度相等;异距数列的变量值变动区间的长度不完全相等组限组距组中值组限指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限组距是每组变量值变动区间的长度,为上下限之差,即:组距=本组上限-本组下限组中值是每组变量取值范围的中点数值。闭口组组中值=开口组与闭口组开口组是缺少上限数值或下限数值的组
例如:7岁以下,或者,60岁以上闭口组是有上限数值和下限数值的组。开口组组中值计算开口组的组距与组中值的计算:首组假定下限=首组上限-相邻组组距末组假定上限=末组下限+相邻组组距先计算开口组的假定上、下限:
因此有:首组组中值末组组中值开口组的组距以相邻的组距为本组组距例:60分以下60—70分70—80分80—90分90分以上组中值为(60+50)÷2=55或60-10÷2=55组中值为(90+100)÷2=95或90+10÷2=95组距式分组步骤1、确定数据的全距(R)
R=xmax-xmin(即最大变量值与最小变量值之差)。2、确定组距、组限和组数(具体计算在后面讲解)
(1)组限分为上限和下限,上限是各组的最大变量值,下限是各组的最小变量值。(2)各组上限与下限之差称为该组的组距。(3)所谓组数是指某个变量数列划分为多少个组。说明:组数的多少与组距的大小成反比关系,组距越大,则可分的组就越少。组距式分组步骤(4)间断组距式分组与连续组距式分组凡是组限不相连的,称为间断组距式分组。
例如儿童按年龄分组:未満1岁,1~2岁,3~4岁,5~9岁,10~14岁。凡是组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限,称为连续组距式分组。
例如学生按考试成绩分组分为:60以下,60~70,70~80,80~90,90以上等组。统计上规定,如果总体某一个单位的变量值是相邻两组的界限值,则这一个单位归入作为下限值的那一组内,即所谓的“上限不在内”原则。例如,70分不归入60~70分组,而归入70~80分组。组距式分组步骤3、组距、组数、组限与组中值的确定
组距 连续组距式分分组:组距=上限-下限 间断式分组:组距=本组上限-前组上限或组距=本组上限-本组下限+1
例如:3~4岁,5~9岁,则5~9岁组的组距5(=9-4)
组数:与组距大小成反比
以下是美国学者斯特杰斯(H.Sturges)经验公式:
n=1+3.322logN(n:组数;N:总体单位数)
d=R/n=(xmax-xmin)/n(n为组数,d为组距,R为全距)分组组数参考表N15~2425~4445~8990~179180~359n56789上述数据仅供参考,不能生搬硬套,实际分组时要依所研究资料的性质而定。根据上述公式,可以得出如下的组数参考标准组距式分组步骤3、组距、组数、组限与组中值的确定
组中值:上下限之间的中点数
连续式分组:组中值=(本组上限+本组下限)÷2
间断组距式分组:组中值=(本组上限+前组上限)÷2
开口组的组距和组中值
开口组的组距是以相邻组的组距为本组的组距。 “XX以上”组的组中值=下限+邻组组距/2 “XX以下”组的组中值=上限-邻组组距/2编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某地区某年50个商店商品销售额的资料如下(单位:百万元):
7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求编制组距数列。编制步骤:⒈求变异全距⒉确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R≤组距(d)×组数(m)编制等距数列计算组数(组数不宜过多,也不宜太少)上例中,取d=5,则有编制等距数列(当的结果为整数时)(当的结果为小数时)⒊确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法编制等距数列⒋计算次数编制等距数列编制结果:销售额(百万元)组中值商店数5以下5~1010~1515~2020~2525以上2.57.512.517.522.527.5410161343合计—50(5+(5-5))/2=2.5(25+(25+5))/2=27.53次数分布的特征(1).次数分布的表示方法
用统计表来表示次数分布。例某班统计学考试成绩次数分配考分次数向上累计
(以下累计)向下累计
(以上累计)人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50-6025.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820.040100.0820.0合计40100.0----
向上累计次数(或频率)是把次数(或频率)从变量值低的值向变量值高的组累计,用来反映小于某组上限的次数(或频率),所以又称为(上限)以下累计——即较小制累计。
向下累计次数(或频率)是把次数(或频率)从变量值高的值向变量值低的组累计,用来反映大于某组下限的次数(或频率),所以又称为(下限)以上累计——即较大制累计。用统计图来表示次数分布。直方图折线图曲线图直方图仍以上例考试成绩数据,画成如下直方图:405060708090100110折线图在直方图的基础上连接各条形顶边的中点成折线图。如下图红线围成的,即为次数分配曲线图:405060708090100110折线图还可用来表示累计次数分布(仍以上例数据为例):曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。向下累计向上累计(2).次数分布的主要类型一般次数分布呈正态分布曲线,或称正态曲线。对称型YY
右偏型(上偏型)
左偏型(下偏型)
XX很多是偏态分布曲线,或称偏态曲线还有其他形态J型分配曲线U型分配曲线双峰曲线
四、统计表1.统计表的结构和内容例例分组总产值(万元)职工人数(人)劳动生产率(元/人)P123大型中型小型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 徽商职业学院《特殊教育概论》2025-2026学年期末试卷
- 安徽卫生健康职业学院《外科学总论》2025-2026学年期末试卷
- 芜湖航空职业学院《土地经济学》2025-2026学年期末试卷
- 福州软件职业技术学院《病原微生物与免疫学》2025-2026学年期末试卷
- 长春师范高等专科学校《中国文化概论》2025-2026学年期末试卷
- 乙炔安全操作标准讲解
- 《安塞腰鼓》课件
- 陶瓷工艺品成型师风险评估与管理能力考核试卷含答案
- 粮食经纪人安全管理知识考核试卷含答案
- 市场管理员持续改进水平考核试卷含答案
- DB37∕T 5263-2023 《民用建筑氡检测与防治技术标准》
- 2025年中国华能集团蒙东公司招聘笔试参考题库含答案解析
- 全国内地西藏班2025届九年级下学期中考二模英语试卷(含答案)
- 2025年河南省高考化学试卷真题(含答案及解析)
- 国家中医药管理局《中医药事业发展“十五五”规划》全文
- 2025公需课《新质生产力与现代化产业体系》考核试题库及答案
- 湖北省竞技体育:现状剖析与发展路径探索
- 职场沟通课件
- 数据质量管理-技术实施方案
- 3.3 街心广场 课件 北师大版数学四年级下册
- 马里体育场施工组织设计
评论
0/150
提交评论