文档统计学整理_第1页
文档统计学整理_第2页
文档统计学整理_第3页
文档统计学整理_第4页
文档统计学整理_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

选择和判断:统计学含义:统计学是一门认识方法论科学,它是研究如何收集数据、整理数据、分析数据,以便从中作出正确推断的认识方法论科学。描述统计学与推断统计学的区别:描述统计学是研究如何反映客观现象的数据资料,对所收集的数据进行加工整理,通过图、表等读者易于理解的形式汇总显示。推断统计学是研究如何根据样本数据推断总体数量特征的理论和方法,具体包括:抽样调查、假设检验、相关回归分析等。描述统计是整个统计学的基础,推断统计则是现代统计学的核心和主要内容。选择:统计学的基本概念:总体:指客观存在的、在同一性质的基础上结合起来的许多个别单位的整体。总体单位:构成总体的每个个别单位称为总体单位。标志:说明总体单位的属性和特征的名称。标志分为:品质标志(只能用文字来说明总体属性,eg:文化程度)数量标志(说明总体单位数量的特征,eg:职工人数,销售额,工资额等)不变标志(某个标志上的答案都相同)可变标志(一定有一个标志是可变的)数量标志的答案叫数量标志表现,也叫标志值指标:说明总体数量特征(分为指标名称和指标数量两部分)eg:男性比重,英语平均成绩,学生人数。按计算方法不同分:数量指标:说明总体规模大小和数量多少的指标。(总量指标)质量指标:说明总体内部数量对比关系和一般水平的指标。(相对指标,平均指标)按其数值的表现形式分:总量指标:也就是数量指标,数值是绝对数形式相对指标:数值是相对形式。平均指标:数值是平均数形式。标志与指标的区别:名称说明对象表示方式标志总体单位的属性特征或数量特征文字或数值指标总体的数量特征数值四个数据的区别:定性数据:品质变量的答案就是定性数据,定性数据本身是文字。eg:性别为品质变量,它的答案“男”“女”就是定性数据。名义级数据:品质变量的一种答案,仅是一种代码来表示品质变量的不同类型。不能比较大小四则运算eg:“性别”是品质变量,用变量值“1”表示男性,“2”表示女性,这是“1”“2”或“男”“女”就是名义级数据。次序级数据:品质变量的一种答案。次序级数据可以比较大小判断优劣。eg:产品等级“1”为合格“0”为不合格。定量数据:数值变量的答案是定量数据,定量数据的本身是数值。间距及数据:本身可以为0,0有意义。可以进行加减运算,但不能乘除,eg:今天的气温比昨天高了多少度,不能说今天的气温是昨天的几倍。比率级数据:本身不能为0,0没有意义,可以进行加减乘除运算。eg:100米比50米长50米,100米事50米的两倍。数据的来源:1、直接来源:实验、统计调查;2、间接来源:公开出版或报道的数据、网络、别人调查过实验后已经加工整理过的第二手数据。统计报表:按照国务院或国家统计局颁发的表格,由各级调查单位按照一定日期和程序向上级提交统计报告的一种制度。全面统计报表:全面调查(选择)专门调查;普查、重点调查、典型调查、抽样调查普查特点;一次性调查、全面调查。通过组个调查属于一定时点或一定时期内的社会经济现象的情况,全面、系统地收集真理和提供反映国情国力基本情况的统计数据。抽样调查:非全面调查,既可以一次性也可以经常性。是根据概率理论,从调查对象总体中应用随机原则抽取一部分调查单位构成样本,由样本指标值(统计量)推断总体相应指标值(参数)的一种调查方法。重点调查:非全面调查,既可以一次性也可以经常性。它是从调查对象的全面调查单位中选择一部分重点单位进行调查的一种调查方法。典型调查:非全面调查,既可以一次性也可以经常性。是根据研究目的,在对总体进行初步的全面分析基础上从调查总体中有意识地选择一个或几个有代表性的单位而进行的调查,代表性的单位也叫典型单位。调查对象与调查单位的区分:调查对象:是所要研究的现象总体,即统计总体,它是若干个性质相同的调查单位组成的。调查单位:是构成总体的每一个个体单位,在某项调查中登记其具体特征的单位,是调查项目的承担者。调查时间与调查期限划分:调查时间:是指调查资料所属的时间。调查期限:是具体进行调查工作的时间期限,包括收集资料和报送资料的整个工作所需要的时间。统计调查的误差:什么情况下的。分为登记性调查误差、代表性调查误差。登记性误差:调查过程中各个环节的工作不准确而造成的。不能说非全面调查的误差一定比全统计分组品质标志分组数量标志分组单项式分组组距式分组等距式分组异距式分组分组中的几个基本概念:全距(R)=数列中的最大值-最小值组距(R)=一组中的较大值-较小值或上限-下限n=1+3.3lgN(不必记住)n:组数N:总体单位数在实际操作中数组在5~10之间组限:组距两端的变量值上限:一组中的最大值。下限:一组中的最小值组中值:上、下限之间的中点数值开口组:缺少上限或下限的组。如:60分以下;60—70;…80—90;90分以上。闭口组:上、下限都齐备的组。如:70—80分;500—600公斤;90—100岁开口组的组中值计算:缺少上限:1、计算假定上限:假定上限=下限+相邻组的组距如:假定上限=90+10=100(分);2、计算组中值:组中值=(90+100)÷2=95(分)缺少下限:1、计算假定下限:假定下限=上限-相邻组的组距如:假定下限=60-10=50(分);2、计算组中值:组中值=(50+60)÷2=55(分)分配数列的概念;在统计分组的基础上,将总体所有的单位按某一标志进行归类排列。可分为:品质数列和变量数列。分布数列的两个要素:一是总体按某标志所分的组;二是各组所出现的单位数,即频数,亦称次数(一般用f来表示)。频数:分布在各组的总体单位数叫次数,又叫频数。频数的表现形式:绝对数形式:即次数(f)相对数形式:即频率,各组次数与总次数之比(f/∑f)。在加权算术平均数的计算中,次数亦称为权数。分配数列的种类:品质分配数列:品质分配数列是按品质标志分组成为品质数列。编制品质数列时,只要分组标志一旦确定,组数和各组的界限也就随之确定了。品质数列一般比较稳定,能准确地反映总体的分布特征。变量分配数列:变量分配数列是按数量标志分组形成为变量数列。编制变量数列与编制品质数列相比较,其编制就要复杂些。等距数列的编制步骤:第一步:将考试分数按大小顺序排列。第二步:根据数列的数量特征确定分组的形式。考试成绩是连续变量且分布比较均匀,确定采用等距分组的形式。第三步:找出数列中的最大值和最小值,再计算全距。第四步:确定组数。在实际操作中数组在5~10之间第五步:确定组距。为了方便计算和绘制统计图,组距一般取5或10的整倍数,因此确定组距为10。第六步:确定首组的下限和末组的上限。注:首组的下限一般应小于数列中的最小值,末组的上限应大于数列中的最大值。具体考虑到考试成绩中,60分为一个重要的量的界限,即及格线。因此,首组应为60以下,末组应为90以上。第七步:统计总体单位在各组的次数分配,并编制统计表或统计图。异距数列转化为等距数列:频数密度=频数/组距频率密度=频率/组距标准组距次数=频数密度×标准组组距(最小组的组距)累计频数与累计频率:向上累计:由标志值小的方向向标志值大的方向累计。表示的意义是:上限以下。向下累计:由标志值大的方向向标志值小的方向累计。表示的意义是:下限以上。茎叶图和帕拉图:62-63相对指标:是把两个有联系的指标加以对比而得到的统计指标。相对指标通常表现为相对比率,是从数量上反映事物在不同时间、空间、事物本身内部和事物之间的联系程度或对比关系,所以,相对指标也通称为相对数。(一)结构相对指标1.概念和计算公式结构相对指标(RelativeIndicantofStructure)即结构相对数,是在统计分组的基础上,以总体中的部分数值除以总体数值而得的比重或比率。其计算公式为:结构相对数=(总体部分数值÷总体全部数值)×100%2.表示形式结构相对指标为无名数,一般用百分数、系数或成数表示。各组比重之和应为100%或1。其分子和分母可以同是总体单位数,也可以同是总体的标志数值,当然分子的数值仅是分母数值的一部分。(二)比例相对指标1.概念和计算公式比例相对指标(RelativeIndicantofProportion)即比例相对数,是总体内部各组成部分之间对比求得的比率。它反映了总体中各组成部分之间的比例关系和数量联系程度。其计算公式为:比例相对数=总体中某部分数值÷总体中另一部分数值2.表现形式比例相对指标的数值通常用百分比或几比几的形式来表示,3.比例相对指标与结构相对指标的联系和区别(1)比例相对指标的作用与结构相对指标相同。(2)在实际工作中,比例相对指标和结构相对指标往往结合使用。(三)比较相对指标1.概念和计算公式比较相对指标(ComparativeRelativeIndicant)即比较相对数,是同类现象在同一时期的不同国家、地区、部门或单位之间的对比,用来说明现象在各种不同条件下静态数量的对比关系,从而反映某一类现象在同一时期内,在不同空间发展的不均衡程度。计算公式如下:比较相对数一般用百分数或倍数表示。(四)动态相对指标1.概念和计算公式动态相对指标(DynamicRelativeIndicant)也称动态相对数,是指某一指标在不同时间上的数值对比,表明现象在不同时间上的发展变化程度。其计算公式为:动态相对指标一般用倍数或百分数表示。(五)强度相对指标1.强度相对指标的概念强度相对指标(RelativeIndicantofIntensity)也称强度相对数,是两个性质不同但有一定联系的指标数值对比求得的比率,是用来反映现象的强度、密度和普遍程度的综合指标。其计算公式为:(六)计划完成程度相对指标1.概念和计算公式计划完成程度相对指标(RelativeIndicantofFulfillmentofPlan)即计划完成相对数,是现象在某一时期内的实际完成数值与计划任务数值对比形成的比率。其计算公式为:计划完成相对数=(实际完成数÷计划任务数)×100%2.计划完成程度相对指标的计算和运用必须注意的问题(1)公式中分子、分母的指标含义、计算口径、计算方法、计量单位、时间和空间范围必须一致;(2)判断计划完成程度的好坏应根据计划任务数的类型而定。如何判断计划完成程度:当计划任务数是以最高限额规定的,如产品单位成本、费用率等。超过100%的部分为未完成计划部分;未超过100%的部分为超额完成计划部分。当计划任务数是以最低限额规定的,如产品产量、销售额等。超过100%的部分为超额完成计划部分;未超过100%的部分为未完成计划部分。3.计划完成程度相对数的计算方法(1)当计划数是总量指标即绝对数时,计划完成程度相对指标的计算公式为:(2)当计划任务数是由两个总量指标对比所得比率时,可以将比率直接计算计划完成相对数。(3)当计划任务数是比上期(年、季度、月)提高或降低百分之几出现时,其计算公式为:例1:某工业企业2010年的工人劳动生产率计划规定比上年提高10%,实际提高了15%,则劳动生产率计划完成程度为:计算结果表明,该企业工人劳动生产率比计划提高了4.55%,超额4.55%完成计划。例2:某企业2010年计划产品的单位成本比上年降低5%,实际降低6%,则该企业产品单位成本降低率计划完成程度为:计算结果表明:该企业产品单位成本超额1.05%完成计划。算术平均数是分析社会经济现象一般水平的最基本指标,其基本计算公式是:2、加权算术平均数:单项式数列:组距式数列:调和算术平均数:调和平均数是常用的另一种平均指标,它是根据标志值的倒数计算的,又称为倒数平均数例4:已知某产品在三个生产企业的平均生产成本及产值资料如表所示,计算该产品的平均生产成本。企业单位生产成本(元)(X)总成本(元)(M)生产量(件)(M/X)(甲)(1)(2)(3)=(2)÷(1)甲1003000030014035000250合计-95000750简单几何平均数:式中:表示几何平均数;表示连乘符号。几何平均数主要用来计算平均比率和平均速度加权几何平均数例、某投资银行有笔投资的年利率是按复利计算的,25年的年利率分配如下:有1年为3%,有4年为5%,有8年为8%,有10年为10%,有2年为15%,求平均年利率。根据计算结果,25年的平均年利率的发展速度为108.65%,即年平均利率为8.65%。偏度和峰度的判断:偏度是次数分配的非对称数,右偏(正偏)和左偏(负偏)峰度是指次数奉陪的曲线顶端的尖峭程度,也是次数分配的另一个重要指标。峰度分为三种:正态峰度,尖顶峰度,平顶峰度数据上时属于怎么偏指数的概念:广义的指数:泛指一切说明现象数量变动或差异程度的相对数。上面简单现象总体的数量变动是广义指数,即一般的动态相对数。狭义的指数:只是相对数中的特殊部分,是特指不能直接加总的复杂现象总体的综合变动程度的相对数。本章主要研究的是狭义指数。质量指标指数:(帕式)数量指标指数:(拉式)指数体系的应用:如何利用两个指数推算出第三个指数相关分析回归分析相关系数(小计算):eg:相关系数=1代表什么小于0代表回归系数(小计算):计算:(填表保留两位小数)一、1、众数:是一个统计总体或分布数列中出现频数最多、频率最高的标志值。由单项式数列确定众数:只需找出出现次数最多的标志值。2、算数平均数:3.中位数:第一:计算向上累计数(下限公式)或向下累计数(上限公式);第二:确定中位数所在组;∑f/2第三;按公式计算中位数4、全距(R)=最大值—最小值5、四分位差也称四分位距或修正极差,是将总体各单位标志值按大小顺序排列后,将数列四等分,形成三个分割点(Q1、Q2、Q3),这三个分割点称为四分位数。其中,第二个四分位数(Q2)就是数列的中位数Me;第三个四分位数(Q3)与第一个四分位数(Q1)的差就是四分位差6、标准差:也是平均差的意义。只是采用了平方的方法解决正负方向问题。其计算过程简便且数学性质也最优。是最常用,也是最重要的标志变异指标。7、标准差系数:8.结论(过程)掌握:分组未分组数据的计算:(未分组按未分组算,分组按分组算)水平分析指标和速度分析指标之间的关系1、发展水平:时间数列中各时间上对应的指标数值称为发展水平。发展水平通常用表示发展水平的位置分类:最初水平a0中间水平:a1a2……an-1最末水平:an2、增长量:是报告期水平与基期水平之差,反映报告期比基期增加(减少)的绝对数量。增长量=报告期水平-基期水平逐期增长量:基期水平为报告期水平的前一期水平。累计增长量:基期水平为某一固定时期水平(通常为最初水平)。逐期增长量与累计增长量的数量关系:累计增长量=相应时期的逐期增长量之和3、发展速度:是两个不同时期发展水平之比,表明报告期水平已发展到基期水平的百分之几或若干倍,常用百分数或倍数表示。4、增长速度:增长速度是报告期增长量与基期水平之比,表明报告期水平比基期水平增长(或降低)了百分之几或若干倍。增长速度计算公式为:注:过程,直接填表,保留两位有效数字平均发展水平平均发展水平是将时间数列中各期发展水平加以平均而求得的平均数,统计上又称这种平均数为序时平均数或动态平均数。它从动态上反映了现象在一段时间内发展水平的一般情况。做题前先区分用哪个公式书上例题1、由绝对数时间数列计算序时平均数:(1)时期数列:(2)时点数列:连续:(可以视为时期数列)间断:相等不相等:2、相对数、平均数时间序列计算序时平均数的方法由相对数、平均数时间数列计算序时平均数正确的方法是:先平均,后对比。分别求出分子分母的平均数再进行计算1)分子、分母项数列均为时期数列2)分子、分母项数列均为间隔相等的时点数列3)分子、分母项数列属于不同性质的时间数列四、直线趋势方程的理合1、选择趋势方程可以通过二条途径:一是以时间为横轴、指标值为纵轴画出散点图,然后根据对所研究现象的认识,仔细观察散点的分布规律,选择合适的趋势方程。二是根据时间数列的分析指标来确定,当时间数列指标值的一级增长量大致相等时,可选用直线趋势方程;当时间数列指标值的二级增长量(一级增长量的增长量)大致相等时,可选用抛物线;当时间数列指标值的环比发展速度大致相等时,可选用指数曲线。2、未知参数确定:作为一条理想的趋势线,必须满足以下两个条件:第一条:原时间数列各期指标值与相应趋势值之间的离差平方和要最小。第二条:原时间数列各期指标值与趋势值之间的离差和等于零建立趋势方程的主要步骤:直线趋势方程的一般形式为:利用最小二乘法估计模型的待定参数;计算趋势变动测定值五、同期水平法(季节比率的计算,要过程,季平均数怎么来的,总平均数。不一定以季为单位,可以是以月为单位,给月就计算月,给季就算季。最后要进行校正,最后要有结论,什么时候是旺季,小于1淡季,大于1旺季,0.8~1.2不说明淡季旺季,计算过程。不能用分数形式表示,保留两位是百分号情况下保留两位)当时间数列的长期趋势不存在或不明显时,可采用同期平均法。同期(月,季)平均法测定季节变动的一般步骤如下:1、计算若干年内同月(季)平均数。2、计算总的月(季)平均数。3、用同期平均数除以总平均数,得季节比率。4、计算出的季节比率之和应该等于12或4,但实际上由于计算过程的舍入误差,往往季节比率之和与理论值不相等,需要进行调整,即用调整系数乘以各季节比率,调整系数的计算公式如下:六、总量指标的双因素分析:178分析总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论