




已阅读5页,还剩15页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四部分 统计二十一、统计与统计数据(一)统计学统计学的含义:统计学是关于收集、整理、分析数据和从数据中得出结论的科学。统计学的两大分支(描述统计和推断统计)类型含义及内容举例描述统计研究数据收集、整理和描述的统计方法。其内容包括:(1)如何取得所需要的数据;(2)如何用图表或数学方法对数据进行整理和展示;(3)如何描述数据的一般特征。为了解与居民生活相关的商品及服务价格水平的变动情况,收集统计局发布的CPI数据,利用统计图展示CPI,利用增长率计算CPI的走势。推断统计研究如何利用样本数据推断总体特征的统计方法。其内容包括:1、参数估计:利用样本信息推断总体特征; 2、假设检验:利用样本信息判断对总体假设是否成立。某公司评测顾客满意度,随机抽取部分顾客进行调查,再对顾客总体满意度进行评估,此时需要用到参数估计法,然后验证满意度高的客户更倾向于成为忠诚客户。(二)变量和数据项目含义分类变量变量是研究对象的属性或特征,它是相对于常数而言的。常数只有一个固定取值,变量可以有两个或更多个可能的取值。定量变量(数量变量)变量的取值是数量。 如企业销售额、注册员工数定性变量分类变量变量的取值是类别。 如企业所属行业、员工性别顺序变量变量的取值是类别且有顺序。 如员工受教育水平数据数据是对变量进行测量、观测的结果。数据可以是数值、文字或者图像等形式定量数据(数值型数据)是对定量变量的观测结果,其取值表现为具体的数值。 如企业销售额1000万元。定性数据分类数据分类变量的观测结果,表现为类别,一般用文字来表述,也可用数字描述。如,用1表示男性,2表示女性。顺序数据顺序变量的观测结果,表现为类别,一般用文字描述,也可用数字描述。如用1表示硕士及以上,2表示本科,3表示大专及以下。对于不同类型的数据,可以采用不同的统计方法处理和分析。对分类数据可以计算出各类别的频率,而数值型数据则可以计算均值和方差等统计量。(三)常用的数据特征测度对统计数据特征的测度,主要从三个方面进行:一是分布的集中趋势,反映数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的偏态和峰度,反映数据分布的形状。一、均值和中位数(测度数据的集中趋势)集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。集中趋势的测度也就是寻找数据水平的代表值或中心值。1、均值均值也就是平均数,就是数据组中所有数值的总和除以该组数值的个数。公式:【注1】它是集中趋势中最主要的测度值,是一组数据的重心所在,解释了一组数据的平均水平。【注2】均值主要适用于数值型数据,但不适用于分类数据和顺序数据。【注3】均值易受极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。2、中位数(1)含义:把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数。中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。(2)计算:根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n为数据的个数,其公式为:(1)n为奇数:中位数位置是,该位置所对应的数值就是中位数数值。(2)n为偶数:中位数位置是介于和(+1)之间,中位数就是这两个位置对应的数据的均值。(3)适用:中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值的影响,抗干扰性强。二、方差和标准差(测度数据的离散趋势)离散程度反映的是各变量值远离中心值的程度。集中趋势的测度值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性就越好。1、含义:(1)方差是数据组中各数值与其均值离差平方的平均数。是实际中应用最广泛的离散程度测度值。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。(2)标准差:方差的平方根,不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位。2、计算:3、适用:只适用于数值型数据,容易受极端值的影响。(四)数据的来源分类类别内容按收集方法观测数据通过直接调查或测量而收集的数据。观测数据是在没有对事物施加任何人为控制因素的条件下得到的。 几乎所有与社会经济现象有关的统计数据都是观测数据,如GDP、CPI、房价等。实验数据通过在实验中控制实验对象以及其所处的实验环境收集到的数据。如,一种新产品使用寿命的数据,一种新药疗效的数据。 自然科学领域的数据大多都是实验数据。按来源一手数据来源于直接的调查和科学实验的数据,对使用者来说这是数据的直接来源。其来源主要有:调查或观察;实验。二手数据来源于别人的调查或实验的数据。对使用者来说这是数据的间接来源。(五)统计调查统计调查的概念和和分类1.统计调查过程有两个重要特征:一是调查是一种有计划、有方法、有程序的活动;二是调查的结果表现为搜集到的数据。2.统计调查的分类:种类具体内容按调查对象的范围不同全面调查全面统计报表和普查非全面调查非全面统计报表、抽样调查、重点调查和典型调查按调查登记的时间是否连续连续调查观察总体现象在一定时期内的数量变化,说明现象的发展过程,目的是为了解社会现象在一段时期的总量。如工厂的产品生产、原材料的投入、能源的消耗、人口的出生、死亡等。不连续调查间隔相当长的时间所作的调查,为了对总体现象在一定时点上的状态进行研究。如生产设备拥有量、耕地面积等。(二)统计调查的方式调查方式含义特征、分类及应用场合统计报表按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方式。1.按调查对象范围的不同分为全面报表和非全面报表。目前的大多数统计报表都是全面报表。2.按报送周期长短,分为日报、月报、季报、年报等。3.按报表内容和实施范围不同分为国家的、部门的、地方的统计报表。普查为某一特定目的而专门组织的一次性全面调查,主要用于了解处于某一时点状态上的社会经济现象的基本全貌。特点:1.普查通常是一次性的或者周期性的;2.一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。3.数据一般比较准确,规范化程度较高,可以为抽样调查或其他调查提供基本的依据。4.使用范围比较窄,只能调查一些最基本及特定的现象。抽样调查从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的一种非全面调查(1).经济性:是抽样调查的一个显著优点。(2).时效性强:可以迅速、及时的获得所需要的信息。(3).适应面广:可用于全面调查能够调查的现象,也能调查全面调查所不能调查的现象,特别适合特殊现象的调查。如:产品质量检验、农产品试验、医药的临床实验。(4).准确性高:重点调查从调查对象的全部单位中选择一部分重点单位进行调查。重点单位虽然只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比重。调查的目的只要求了解基本状况和发展趋势,不要求掌握全面数据,而调查少数重点单位就能满足需要时,采用重点调查比较适宜。(1)为了及时了解全国城市零售物价的变动趋势,就可以对全国的35个大中型城市的零售物价的变化进行调查就是重点调查。(2)要及时了解全国工业企业的增加值和资产总额情况,只需对全国大中型工业企业进行重点调查即可。(3)国家统计局的全国5000家工业企业联网直报制度属于重点调查。典型调查有意识的选择若干具有典型意义的或有代表性的单位进行的调查。作用:弥补全面调查的不足;在一定条件下可以验证全面调查数据的真实性。【注】抽样调查和重点调查、典型调查的区别:抽样调查是随机的抽取调查单位,可以根据抽样结果推断总体的数量特征;重点调查和典型调查的单位不是随机抽取的,具有一定的主观性,因此调查结果不能推断总体。二十二、抽样调查 (一)抽样调查基本概念几个基本概念(总体、样本、样本量、总体参数、样本统计量与抽样框),概率抽样和非概率抽样,抽样调查一般步骤,抽样调查中的误差来源(抽样误差、非抽样误差、抽样框误差、无回答误差、计量误差)等。概念含义例子总体和总体单元调查对象的全体,组成总体的各个个体称作总体单元或单位。如研究某公司所有注册在职人员(共有1000名)的工资状况,总体是公司所有注册在职员工,每个注册在职人员是总体单元。样本、样本单位及样本量样本是总体的一部分,由从总体中按一定原则或程序抽出的部分个体所组成。样本也是一个集合。每个被抽中进入样本的单位称为入样单位。样本中包含的入样单位的个数称为样本量。上例中,按一定原则从所有注册在职人员中抽取出200人调查。这200名注册在职员工就是样本;而抽出的每一名员工就是入样单位;该样本的样本量是200.抽样框供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。常见的抽样框有名录框,如企业名录、电话簿、人员名册。抽样框也可以是一张地图或其他适当的形式,不管是那种形式,抽样框中的单位必须是有序的,便于编号。高质量的抽样框应当提供被调查单位更多的信息,并且没有重复和遗漏。上述例子中,企业1000名注册在职职工的名册,就是抽样框。抽样单元构成抽样框的基本要素,抽样单元可以只包括一个总体单元,也可以包括多个总体单元。要调查城市拥有两套以上住房的人口比例,总体单元是该城市的每个人,但抽样单元可以是该城市的每户家庭或是每个居委会。总体参数总体参数就是总体指标值,它是未知的常数,是根据总体中所有单位的数值计算的,是通过调查想要了解的,不受样本的抽选结果影响。常用的总体参数有总体总量、总体均值、总体比例、总体方差。如研究某公司所有注册在职人员(共有1000名)的工资状况,公司所有注册在职人员的平均工资就是总体参数。样本统计量(估计量)是根据样本中各单位的数值计算的,是对总体参数的估计,也称估计量。它是一个随机变量,取决于样本设计和正好被选入样本的单元特定组合。常用的样本统计量有样本均值、样本比例、样本方差。如上例中,200名注册在职职工的平均工资就是该公司所有员工平均工资的一个估计量(样本统计量)二、概率抽样和非概率抽样抽样方法含义特点具体方式概率抽样(随机抽样)依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的方法。1.按一定概率以随机原则抽取样本。 2.总体中每个单元被抽中的概率是已知的或者是可以计算出来 3.当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率。若每个单位被抽中的概率相等,则成为等概率抽样;否则称为非等概率抽样。1.简单随机抽样; 2.分层抽样 3.系统抽样; 4.整群抽样 5.多阶段抽样非概率抽样(非随机抽样)调查者根据自己的方便或主观判断抽取样本的方法。抽取样本时并不是依据随机原则。1.判断抽样:调查者依据调查目的和对调查对象的了解,人为确定样本单元; 2.方便抽样:拦截式 3.自愿样本:网上调查 4.配额抽样:总体划分若干类型,将样本数额分配到各类型,从各类型中抽取样本的方法没有严格限制,一般采用方便抽样。三、抽样调查的一般步骤1、确定调查问题:2、调查方案设计:明确如何实施调查,包括抽样方案的设计和问卷设计。3、实施调查过程:获得样本单元的调查数据,关键的问题是要保证原始数据的质量。4、数据处理分析:对数据进行检查核对、编码、录入、预处理、统计分析、对总体参数进行估计。5、撰写调查报告:调查活动的最终成果。四、抽样调查中的误差样本估计值和总体参数值之间的差异称为误差,一般来说调查中的误差分为抽样误差和非抽样误差两类。误差形成原因抽样误差由抽样的随机性造成的,用样本统计量估计总体参数时出现的误差。抽到哪一个样本完全是随机的,而抽到不同的样本,对总体的估计就会不同。非抽样误差除抽样误差外,由其他原因引起的样本统计量与总体真值之间的差异。(1)抽样框误差:样本框不完善造成的。如用工商局签发的营业执照作为个体商业的抽样框,对个体商业实施抽样调查,以掌握个体商业零售额的情况。但有些商贩无照经营、有些商贩虽有执照但转行,不再经商;有些虽有一个摊点却办理多个营业执照。这些情形均会导致估计结果失真。(2)无回答误差:调查人员没能够从被调查者那里得到所需要的数据。无回答分为:由于随机因素造成的。如被调查者恰巧不在家,这种会减少有效样本量,造成估计量方差增大。由于非随机因素造成的:如被调查者不愿告诉实情而拒绝回答,这时,回答者与不回答者在调查指标上存在数量的差异,调查的结果中只有回答者的信息,却没有无回答者的信息,这种无回答不仅造成估计量方差增大,还会带来估计偏差。(3)计量误差:由于调查所获得的数据与其真值之间不一致造成的误差。这种误差可能是由调查人员、问卷设计、受访者等原因造成的。 (二)几种基本概率抽样方法一、简单随机抽样(一)含义1、有放回简单随机抽样:从总体中随机抽出一个样本单位,记录观测结果后,将其放回到总体中去,再抽取第二个,如此类推,一直到抽满n个单位为止。【注】单位有被重复抽中的可能,容易造成信息重叠而影响估计的效率,较少采用。2、不放回简单随机抽样:从包含N个单元的总体中逐个随机抽取单元并无放回,每次都在所有尚未被抽入样本的单元中等概率的抽取下一个单元,直到抽取n个单元为止。【注】每个单位最多只能被抽中一次,不会由于样本单位被重复抽中而提供重叠信息,比放回抽样有更低的抽样误差。(二)优缺点优点:简单随机抽样是最基本的随机抽样方法,操作简单,且每个单位的入样概率相同,样本估计量形式也比较简单。缺点:没有利用抽样框更多的辅助信息,用样本统计量估计总体参数的效率受到影响,样本的分布可能十分分散,增加了调查过程中的费用和时间。(三)适用条件1、抽样框中没有更多可以利用的辅助信息2、调查对象分布的范围不广阔3、个体之间的差异不是很大二、分层抽样(一)含义先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。分层抽样样本量在各层分配的方法有两类,如下表:分配方法含义优缺点等比例分配层中单位数越多,抽取的样本单位就越多,该层样本单位比例与该层中的总体单位比例相一致.操作容易,易于理解,在实践中广泛使用。但各层单位数相差悬殊或层内方差过大时抽样误差会很大。不等比例分配层样本单位比例与该层中的总体单位比例不一致。如果各层的总体方差已知,不等比例抽样的抽样误差可能比等比例抽样更小。(二)优缺点优点:1.不仅可以估计总体参数,同时也可以估计各层参数【例】调查某市中小企业就业的相关指标,可以按照行业将该市中小企业进行分层,再在每个行业内独立随机抽取一部分中小企业进行调查,这样不仅能估计全市中小企业就业的相关指标,还可以在各行业进行推算。2.便于抽样工作的组织。3.每层都要抽取一定的样本单位,这样样本在总体中分布比较均匀,可以降低抽样误差。(三)适用条件抽样框中有足够的辅助信息,能够将总体单位按某种标准划分到各层之中,实现在同一层内,各单位之间的差异尽可能小,不同层之间各单位的差异尽可能大。(层内差异小,层间差异大)三、系统抽样(一)含义系统抽样指先将总体中的所有单元按一定顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。最简单的系统抽样是等距抽样。其步骤:1.将总体N个单位按直线排列,依次编号1N;2.根据样本量n确定抽样间隔K抽样间隔=【例】N=24,n=4,抽样间隔是24/4=6若N=23,n=4,抽样间隔是23/4=5.663.在1K的范围内随机抽取一个整数i,令位于i位置上的单位为起始单位,往后每间隔k抽取一个单位,直至抽满n。【接上例】N=24,n=4,抽样间隔是24/4=6,在16之间,随机抽取一个整数2作为起始单位,以6为间隔,可得到样本2;2+6=8;8+6=14;14+6=20(二)优缺点1、优点:(1)操作简便;(2)对抽样框的要求比较简单,它只要求总体单位按一定顺序排列,而不一定是一份具体的名录清单。系统抽样的估计效果与总体排列顺序有关。、无关标识排列:排列顺序与调查内容没有联系。这时系统抽样估计与简单随机抽样估计效率相仿。【例】对汽车尾气排放情况的调查中,是按汽车牌号排列,牌号与尾气排放没有关系,即属于无关标识排列。、有关标识排列:排列顺序与调查内容有关。其抽样精度一般比简单随机抽样的精度高。【例】对汽车尾气排放情况的调查中,按汽车价格排列,价格与尾气排放量有相关性。2、缺点:方差估计比较复杂,这就给计算抽样误差带来一定困难。四、整群抽样(一)含义整群抽样是将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查其全部的基本单位,对没有抽中的群则不进行调查。【例】调查某市在职的房地产行业人员工资水平,将房地产行业所有在职人员按照所属企业分群,直接抽取企业单位,入样的企业单位内所有职工接受调查,没有入样的企业单位员工都不调查。(二)优缺点1、优点:(1)实施调查方便,可以节省费用和时间。(2)抽样框编制得以简化,抽样时只需要群的抽样框2、缺点群内各单位之间存在相似性,差异比较小,而群与群之间的差别比较大,使得整群抽样的抽样误差比较大。(三)适用如果群内各单位之间存在较大差异,群与群的结果相似,整群抽样会降低估计误差。【例】调查某地区的男女比例,以家庭为群,整群抽样估计男女比例的误差就低于简单随机抽样。整群抽样特别适合于对某些特殊群结构进行调查。(五)多阶段抽样(一)含义在大规模抽样调查中,一次抽取到最终样本单位很难实现,往往需要经过二个或二个以上阶段才能抽到最终样本单位,这就是多阶段抽样方法。首选从总体中采用随机方法抽取若干个小总体,称为初级单元;再在这些中选的初级单元中随机抽取若干个单位。(二)优缺点在大范围的抽样调查中,采用多阶段抽样是必要的。首先,多阶段抽样是分阶段进行的,抽样框也可以分级进行准备。其次因为多阶段抽样是在中选单位中的再抽选,这样就使样本的分布相对集中,从而可以节省调查中的人力和财力。多阶段的抽样设计比较复杂,其抽样误差计算也比较复杂。(三)估计量和样本量一、估计量的性质(一无有,可记忆为“一无所有”)性质内含一致性随着样本量的增大,估计量的值如果稳定于总体参数的真值,这个估计量就有一致性,可称为“一致估计量”。无偏性对于不放回简单随机抽样,所有可能的样本均值取值的平均值总等于总体均值(样本均值的平均数等于总体均值),这就是样本均值估计量的无偏性。有效性在同一抽样方案下,对某一总体参数,如果有两个无偏估计量1、2,由于样本的随机性,如果1的可能样本取值较2更密集在总体参数真值附近,则认为1比2更有效,此时1的方差小于2的方差。二、抽样误差的估计抽样误差无法避免,但是可计算的。在不放回简单随机抽样方法中,将样本均值作为总体均值的估计量。则估计量的方差为:样本估计量的方差=【结论】(1) 抽样误差与总体分布有关,总体单位值之间差异越大,即总体方差越大,抽样误差越大。(2) 抽样误差与样本量n有关,其他条件相同,样本量越大,抽样误差越小。(3) 抽样误差与抽样方式和估计量的选择也有关。例如分层抽样的估计量方差一般小于简单随机抽样。(4) 利用有效辅助信息的估计量也可以有效的减小抽样误差。2、实践中,总体方差是未知的,可以利用样本方差来估计,因此估计量方差的的估计公式为:样本估计量的方差=三、样本量的影响因素1、调查的精度:用样本数据对总体进行估计时可以接受的误差水平,要求的调查精度越高,所需要的样本量就越大。2、总体的离散程度:在其他条件相同情况下,总体的离散程度越大,所需要的样本量也越大。3、总体的规模:对于大规模的总体,总体规模对样本量的需求则几乎没有影响(样本量n可大致用公式表示)。但对于小规模的总体,总体规模越大,为保证相同估计精度,样本量也要随之增大(但不是同比例的)。4、无回答情况:无回答减少了有效样本量,在无回答率较高的调查项目中,样本量要大一些,以减少无回答带来的影响。5、经费的制约:事实上,样本量是调查经费与调查精度之间的某种折中和平衡。6、其他:调查的限定时间,实施调查的人力资源也是影响样本量的客观因素。二十三、相关与回归分析 (一)变量之间的相关分析1.变量间相关关系的分类客观现象的相关关系可以按照不同的标准进行分类。(1) 按相关的程度可分为完全相关、不完全相关和不相关。一般的相关现象都是指这种不完全相关。(2) 按相关的方向可分为正相关和负相关(3) 按相关的形式可分为线性相关和非线性相关。需要注意的是,相关关系不等同于因果关系。2.散点图(两变量)在散点图中,每个点代表一个观测值,横纵坐标值分别代表两个变量相应的观测值。3.Pearson相关系数的含义、计算方法和分析。相关系数是度量两个变量之间相关关系的统计量。最常用的相关系数是Pearson相关系数,它度量的是两个变量之间的线性相关关系。R的计算公式为:Pearson相关系数的取值范围在【-1,+1】之间,若r在(0,1】,表明变量X和Y之间存在正线性相关关系,若r在【-1,0),表明变量X和Y之间存在负线性相关关系。若r=1,表明完全正线性相关,若r=-1,表明完全负线性相关,当r=0时,表明Y和 X之间不存在线性相关关系(只能判断不存在线性关系,不表明变量之间没有关系)当IrI=0.8时,可视为高度相关,当0.5=IrI0.8时,可视为中度相关,0.3=IrI0.5时,视为低度相关;IrI0.3时,说明两个变量之间的相关成都极弱,可视为无线性相关关系。(二)回归分析4.自变量和因变量回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。回归分析与相关分析的关系联系:具有相同的研究对象。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归需要依靠相关来表明现象数量变化的相关程度。只有当变量之间存在这高度相关时,进行回归分析才有意义。区别:在研究目的和方法上有明显的区别。相关分析研究变量之间相关的方向和程度,但不能指出变量之间相互关系的具体形式,无法从一个变量的变化来推测另一个变量的变化情况。回归是研究相互关系的具体形式,对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学方程式,为估算和预测提供重要的方法。进行回归分析首先确定因变量和自变量。因变量:被预测和被解释的变量,一般用Y来表示。自变量 :用来预测和解释因变量的变量,一般用X表示。5.一元线性回归模型是描述两个变量之间相关关系的最简单的回归模型,只涉及一个自变量的回归问题。描述因变量如何依赖自变量和误差项的方程称为回归模型。Y=误差项是随机变量,表述除线性关系之外的随机因素对Y的影响,是不能由线性关系所解释的Y的变异性。6.最小二乘估计原理估计的回归直线,其方程形式:式中, 表示估计的回归直线在Y轴上的截距; 为估计的回归直线的斜率,表明X每变动一个单位时,Y的平均变动量。最小二乘法就是使得因变量的观测值 与估计值 之间的离差平方和最小来估计参数 和 的方法。根据最小二乘法,有 =最小根据微积分的极值定理,求出:7.回归模型的拟合效果分析(1)一般情况下,使用估计的回归方程之前,需要对模型进行检验:结合经济理论和经验分析回归系数的经济含义是否合理;分析估计的模型对数据的拟合效果如何;对模型进行假设检验。(2)决定系数概念:也称R2 ,可以测度回归直线对样本数据的拟合程度,是一种回归模型拟合效果的测度方法。公式:取值范围:在0到1之间,大体上说明了回归模型所能解释的因变量变化因变量总变化的比例。R2=1,说明回归直线可以解释因变量的所有变化。R2=0,说明回归直线无法解释因变量的变化,因变量与自变量无关。拟合效果:决定系数越高,拟合效果越好,即解释因变量的能力越强。二十四、时间序列(一)时间序列及其分类1、时间序列及其分类时间序列,也称动态数列,是将某一统计指标在各个不同时间上的数值按时间先后顺序编制形成的序列。时间序列由两个基本因素构成:1)被研究现象所属时间;2)反映该现象一定时间条件下数量特征的指标值。同一时间序列中,各指标值的时间单位一般要求相等。时间序列按照其构成要素中统计指标值的表现形式,分为绝对数时间序列、相对数时间序列和平均数时间序列三种类型。绝对数时间序列,是由绝对数指标值按时间先后顺序排列后形成的序列。依据指标值的时间特点,绝对数时间序列又分为时期序列、时点序列。时期序列,每一指标值反映现象在一段时期内发展的结果,即“过程总量”如国内生产总值。时点序列,每一指标值反映现象在一定时点上的瞬间水平,如年底总人口数。由绝对数时间序列可以派生出相对数时间序列、平均数时间序列。它们是由同类相对数或平均数指标值按时间先后顺序排列后形成的序列。前者如城镇人口比重,后者如人均国内生产总值。(二)时间序列的水平分析2、时间序列的水平分析分为:发展水平、平均发展水平、增长量与平均增长量。3、发展水平,时间序列中对应于具体时间的指标数值。时间序列中第一项的指标值称为最初水平,最末项的指标值称为最末水平,处于二者之间的各期指标值称为中间水平。根据各期指标值在计算动态分析指标时的作用来划分,又可以分为基期水平、报告期水平。 4、平均发展水平,也称序时平均数或动态平均数,是对时间序列中各时期发展水平计算的平均数,它可以概括性描述现象在一段时期内所达到的一般水平。时间序列类型不同,计算方法也不同。5、绝对数时间序列序时平均数的计算由时期序列计算序时平均数。对于时期序列,序时平均数计算公式为: 由时点序列计算序时平均数第一种情况,由连续时点计算。又分为两种情形。一种是资料逐日登记且逐日排列,可采用简单算术平均数方法计算,计算公式同上:另一种情形是,资料登记的时间单位仍然是l天,但实际上只在指标值发生变动时才记录一次。此时需采用加权算术平均数的方法计算序时平均数;权数是每一指标值的持续天数。计算公式为: 由间断时点计算。又分为两种情形。 一种情形,是每隔一定的时间登记一次,每次登记的间隔相等。间隔相等的间断时点序列序时平均数的计算公式为:即间隔相等的间断时点序列序时平均数的计算思想是“两次平均”:先求各个时间间隔内的平均数,再对这些平均数进行简单算术平均。 另一种情形,是每隔一定的时间登记一次,每次登记的间隔不相等。间隔不相等的间断时点序列序时平均数的计算公式为:间隔不相等的间断时点序列序时平均数的计算也采用“两次平均”的思路,且第一次的平均计算与间隔相等的间断序列相同;进行第二次平均时,由于各间隔不相等,所以应当用间隔长度作为权数,计算加权算术平均数。 6、相对数或平均数时间序列序时平均数的计算相对数或平均数时间序列是派生数列,要计算相对数或平均数时间序列的序时平均数,不能就序列中的相对数或平均数直接进行平均计算;而必须分别求出分子指标和分母指标时间序列的序时平均数,然后再进行对比。用公式表示:总结:计算方法绝对数时间序列序时平均数的计算时期 序列时点 序列连续时点资料逐日登记且逐日排列,即已掌握了整段考察时期内连续性的时点数据资料登记单位仍是1天,但实际上只是在指标值发生变动时才记录一次间断时点间隔相等间隔不等相对数或平均数时间序列序时平均数 7、增长量与平均增长量增长量。报告期发展水平与基期发展水平之差,反映报告期比基期增加(减少)的绝对数量。用公式表示为: 增长量=报告期水平基期水平 根据基期的不同确定方法,增长量可分为逐期增长量、累计增长量。1)逐期增长量,报告期水平与前一期水平之差。它表明现象逐期增加(减少)的绝对数量。2)累计增长量,报告期水平与某一固定时期水平(通常是时间序列最初水平)之差,它表明报告期比该固定时期增加(减少)的绝对数量。 同一时间序列中,累计增长量等于相应时期逐期增长量之和。 平均增长量,时间序列中逐期增长量的序时平均数,它表明现象在一定时段内平均每期增加(减少)的数量。其计算公式为:(i=1,2n)根据逐期增长量与累计增长量之间的数量关系,平均增长量还可以用下式表现:一定要注意分母是(时间序列项数-1)(三)时间序列的速度分析8、时间序列的速度分析,主要有发展速度与增长速度、平均发展速度与平均增长速度。 9、发展速度与增长速度发展速度 ,是以相对数形式表示的两个不同时期发展水平的比值。计算公式为:发展速度=报告期水平/基期水平由于基期选择的不同,发展速度有定基与环比之分。 1)定基发展速度,是报告期水平与某一固定时期水平(通常是最初水平)的比值,用表示 它说明社会经济现象相对于某个基础水平,在一定时期内总的发展速度。2)环比发展速度,是报告期水平与其前一期水平的比值,用表示它说明所研究现象相邻两个时期(逐期)发展变化的程度。定基发展速度与环比发展速度的数量依存关系:(掌握)1)定基发展速度等于相应时期内各环比发展速度的连乘积。2)两个相邻时期定基发展速度的比率等于相应时期的环比发展速度。 增长速度,报告期增长量与基期水平的比值。计算公式为:增长速度=报告期增长量/基期水平,由于基期选择的不同,增长速度也有定基与环比之分。1)定基增长速度,用表示。定基增长速度=累计增长量/某一固定时期水平=定基发展速度-12)环比增长速度,用Bi表示。环比增长速度=逐期增长量/前一期水平=环比发展速度-1发展速度与增长速度应用中要注意的问题是:定基增长速度与环比增长速度不能像定基发展速度与环比发展速度那样互相推算。定基增长速度与环比增长速度之间的推算,必须通过定基发展速度和环比发展速度才能进行。 10、平均发展速度与平均增长速度 平均发展速度,反映现象在一定时期内逐期发展变化的一般程度,平均增长速度则反映现象在一定时期内逐期增长 (降低)变化的一般程度。平均增长速度与平均发展速度之间的数量关系:平均增长速度=平均发展速度-l。目前计算平均发展速度通常采用几何平均法(也称水平法)。平均发展速度的计算公式: 10、速度的分析与应用当时间序列中的指标值出现0或负数时,不宜计算速度。在这种情况下,适宜直接用绝对数进行分析。速度指标的数值与基数的大小有密切关系,“增长1%的绝对值”,是进行这一分析的指标。它反映同样的增长速度,在不同时间条件下所包含的绝对水平。计算公式为:增长1%的绝对值=逐期增长量/环比增长速度 时间序列的水平分析和速度分析 类别具体指标关系水平分析发展水平时间序列中对应于具体时间的指标数值,可以分为基期水平、报告期水平平均发展水平对时间序列中各时期发展水平计算的平均数 增长量与 平均增长量增长量是报告期发展水平与基期发展水平之差,可分为逐期增长量和累计增长量平均增长量是时间序列中逐期增长量的序时平均数 速度分析发展速度与增长速度发展速度是以相对数形式表示的两个不同时期发展水平的比值。发展速度有定基与环比之分。 1)定基发展速度等于相应时期内各环比发展速度的连乘积;2)两个相邻时期定基发展速度的比率等于相应时期的环比发展速度。增长速度是报告期增长量与基期水平的比值,有定基与环比之分。1)定基增长速度=定基发展速度-12)环比增长速度=环比发展速度-1平均发展速度与平均增长速度平均增长速度=平均发展速度-l平均发展速度二十五、统计指数 (一)指数的概念和分类1、指数的概念、分类统计指数,常常被称为经济指数。广义地讲,任何两个数值对比形成的相对数都可以称为指数;狭义的指数是用于测定多个项目在不同场合下综合变动的一种特殊相对数。指数的类型 分类标准类别定义按所反映的内容不同数量指数反映物量变动水平的。例如:产品产量指数、商品销售指数等质量指数反映事物内含数量的变动水平的。例如:价格指数、产品成本指数等。按计入指数的项目多少不同个体指数反映某一个项目或变量变动的相对数。例如:一种商品的价格或销售量的相对变动水平。综合指数反映多个项目或变量综合变动的相对数。例如:多种商品的价格或销售量的综合变动水平按计算形式不同简单指数又称不加权指数,它把计入指数的各个项目的重要性视为相同加权指数对计入指数的项目依据重要程度赋予不同的权数,而后再进行计算(二)加权综合指数2、加权综合指数,是通过加权来测定一组项目的综合变动状况。较常用的是基期加权综合指数、报告期加权综合指数。基期加权综合指数拉氏指数在计算一组项目的综合指数时,把作为权数的各变量值固定在基期。用基期变量值加权的拉氏质量指数和数量指数的一般计算公式:(204页)质量指数: 数量指数:掌握结果的含义:拉氏价格指数在实际中应用得很少,拉氏数量指数在实际中应用得较多。报告期加权综合指数帕氏指数在计算一组项目的综合指数时,把作为权数的变量值固定在报告期。用报告期变量加权的帕氏质量指数和数量指数的一般计算公式:205页质量指数: 数量指数: 掌握结果的含义:在实际应用中,常采用帕氏公式计算价格、成本等质量指数,而帕氏数量指数在实际中应用得较少。(三)指数体系3、指数体系总量指数与指数体系 总量指数:由两个不同时期的总量对比形成的相对数。综合总量指数的一般形式可以写为: (206页)为分析总量指数变动中各因素的影响方向和程度,可以对总量指数进行分解,得到各个因素指数。我们把由总量指数及其若干个因素指数构成的数量关系式称为指数体系。指数体系的分析与应用利用指数体系既可以对现象发展的相对变化程度及各因素的影响程度进行分析,也可以对现象发展变化的绝对数量及各因素的影响数额进行分析。在实际分析中,比较常用的是基期权数加权的数量指数和报告期权数加权的质量指数形成的指数体系。该指数体系可表示为:(206页)就绝对水平看,关系式为:即:总量变动=质量变动的影响额+数量变动的影响额三者之间的数量关系为:销售额指数=价格指数销售量指数从绝对变动水平来看: 三者之间的数量关系为:销售额变动=价格变动的影响额+销售量变动的影响额 (四)几种常用的价格指数4、几种常用的价格指数零售价格指数我国目前编制的价格指数中与人民生活关系最为密切的是商品零售价格指数和居民消费价格指数。零售价格指数是反映城乡商品零售价格变动趋势的一种经济指数。我国零售商品价格指数编制中的一些主要问题说明:1)代表规格品的选择, 在编制价格指数时,只能选择部分具有代表性的商品。首先应对商品进行科学的分类,在此基础上分别选择能代表各类别的代表规格品。2)典型地区的选择,典型地区的选择既要考虑其代表性,也要注意类型上的多样性以及地区分布上的合理性和稳定性。 3)商品价格的确定,对所选代表商品使用的是全社会综合平均价。一种商品的综合平均价是该商品在一定时期内的牌价、议价、市价的加权平均。4)权数的确定,我国目前的零售价格总指数是采用加权算术平均形式计算的,其权数是根据上年商品零售额资料,并根据当年住户调查资料予以调整后确定的。 5)指数的计算,从1985年1月起,我国开始采用部分商品平均价格法计算全社会商品零售价格总指数。计算公式为: 了解具体计算过程(208-209)消费价格指数,我国称为居民消费价格指数。居民消费价格指数,是反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。居民消费价格指数编制过程与零售价格指数类似,但内容有所不同。消费价格指数包括消费品价格、服务项目价格两个部分。居民消费价格指数除了能反映城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度外,还具有以下几个方面的作用:1)反映通货膨胀状况通货膨胀率一般以居民消费价格指数来表示。计算公式为:通货膨胀率= 2)反映货币购买力变动居民消费价格指数上涨,货币购买力则下降,反之则上升。因此,居民消费价格指数的倒数就是货币购买力指数。3)反映对职工实际工资的影响消费价格指数的提高意味着实际工资的减少,消费价格指数下降则意味着实际工资的提高。因此,利用消费价格指数可以将名义工资转化为实际工资。计算公式为: 股票价格指数股票价格,是一个时点值,通常以收盘价作为该种股票当天的价格。正常情况下,股票价格通常与两个直接因素相关:一是预期股息,二是银行存款利息率。股票价格的高低与预期股息成正比,与银行存款利息率成反比。因此,股票价格的形成可以用下列公式表示:用某一种股票的价格不能反映整个股票市场的价格变动,这就需要计算股价平均数和股票价格指数。 1)股价平均数 ,股票市场上多种股票在某一时点上的算术平均值,一般以收盘价来计算。计算公式为:股价平均数(股票价格指数也是一样)只能就样本股票来计算,所选择的样本股票必须具有代表性和敏感性。2)股票价格指数,反映某一股票市场上多种股票价格变动趋势的一种相对数,简称股价指数。股票价格指数一般以发行量为权数进行加权综合。计算公式为:大多数股价指数是以报告期发行量为权数计算的。第一节 会计报表的概念(2013年新增)(一)会计报表的概念会计报表是以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网上借款合同转让协议
- 服装漂染加工合同范本
- 矿山机器转让合同范本
- 物流下乡运输合同范本
- 采购弹性元件合同范本
- 私人地皮出租合同范本
- 门面转让标准合同范本
- 淘宝物流货运合同范本
- 饭店包房租赁合同范本
- 民间小吃售卖合同范本
- 理财规划大赛优秀作品范例(一)
- 一级烟草专卖管理师理论考试题库(含答案)
- 小学数学《分数除法》50道应用题包含答案
- 教学第七章-无机材料的介电性能课件
- 应急值班值守管理制度
- 外国文学史-总课件
- 《中小企业划型标准规定》补充说明
- 房屋租赁信息登记表
- 六年级上册数学课件-1.6 长方体和正方体的体积计算丨苏教版 (共15张PPT)
- 质量总监.安全生产责任制考核表
- 小学生汉字听写大赛题库
评论
0/150
提交评论