统计数据分布特征的度量.ppt_第1页
统计数据分布特征的度量.ppt_第2页
统计数据分布特征的度量.ppt_第3页
统计数据分布特征的度量.ppt_第4页
统计数据分布特征的度量.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章 统计数据分布特征的度量,4.1 绝对数与相对数 4.2 集中趋势的测度 4.3 离散程度的测度 4.4 偏态与峰度的测度,4.1绝对数和相对数,4.1.1绝对数 1.绝对数的概念与作用 绝对数又称总量指标、数量指标、绝对指标,它是反映社会经济现象总体在一定时间、地点和条件下的总规模、总水平或工作总量的一个综合概念。 绝对数的作用主要有: (1)通过绝对数可以了解社会经济现象总体的基本情况 (2)绝对数是编制计划,实行管理的主要 (3)绝对数是计算相对数和平均数的基础,2.绝对数的种类 (1)按其反映总体内容的不同,可分为总体单位总量和总体标志总量 (2)按其反映时间状况的不同,分为时期数和时点数,3.绝对数的计量单位 (1)实物单位 实物单位是根据事物的自然属性和特点而采用的计量单位,包括自然单位、度量衡单位、标准实物单位、多重单位与复合单位。 (2)货币单位 货币单位是以货币作为价值尺度来计量的绝对数,如国民生产总值、国民收入、商品销售额、工资总额等都是以货币单位(“元”、“万元”、“亿元”等)计量的。 (3)劳动量单位 劳动量单位是用劳动时间表示的计量单位,也是一种复合单位,是工人数与劳动时间的乘积,如“工时”、“工日”等。,4.绝对数的计算及应用 绝对数的计算及应用应注意以下几点: (1)正确确定绝对数的含义、构成内容、计算范围 (2)使用统一计量单位 (3)选择恰当的计算方法 绝对数的计算方法主要有两种:直接计量法、推算和估算法。,4.1.2相对数 1.相对数的概念和作用 相对数又称相对指标,它是指两个有联系的现象数值的比率,用以反映社会经济现象发展的程度、结构、强度、普遍程度或比例关系。其数值有两种表现形式:无名数和有名数。 相对数的作用主要有: (1)相对数可以使人们清楚了解现象的相对水平和普遍程度 (2)相对数可以使无法直接对比的现象找到可以对比的基础 (3)说明总体内在的结构特征,为深入分析事物的性质提供依据,2.相对数的种类及其计算方法 (1)结构相对数 结构相对数是在对总体分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。 用公式表示如下:,(2)比例相对数 比例相对数是反映总体内部各个组成部分之间的比例关系和均衡状况的综合指标。计算公式为:,(3)比较相对数 比较相对数是将不同地区、单位或企业之间的同类指标数值作静态对比而得出的综合指标,表明同类事物在不同空间条件下的差异程度或相对状态,用以说明某一同类现象在同一时间内不同空间发展的不平衡程度,以表明同类实物在不同条件下的数量对比关系。其计算公式为:,(4)强度相对数 强度相对数是指在同一地区或单位内,两个性质不同但有一定联系的绝对数对比得出的相对数,用来分析不同事物之间的数量对比关系,表明某一现象在另一现象中发展的强度、密度和普遍程度。 其计算公式为: 强度相对数有正指标、逆指标之分。,(5)动态相对数 动态相对数又称发展速度,是同一空间同类现象数值在不同时间状态下对比的结果,表明同类事物的报告期(被研究的时期,又称本期、现期、计算期)水平与基期(作为比较基准的时期)水平对比发展变化的相对程度。其计算公式如下:,(6)计划完成程度相对数 计划完成程度相对数是用来检查、监督计划执行情况的一个分析指标,它是以现象在某一段时间内的实际完成数与计划数对比,来观察计划完成程度,一般用百分数来表示计划完成程度相对数基本计算公式为:,3.正确计算相对数的原则 (1)可比性原则 (2)多种相对数综合应用的原则 (3)相对数与绝对数结合应用的原则,4.2集中趋势的测度,4.2.1集中趋势的含义 集中趋势(central tendency)是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。 集中趋势的测度,主要是计算各种平均数,平均数,也称平均指标,是表示同类社会经济现象在一定的时间、地点、条件下所达到的一般水平的代表值,如平均工资、平均价格、平均单位成本、平均亩产量等。,1.平均数的特点 (1)反映集中趋势 (2) 平均数是抽象值 (3)平均数是代表值 (4)所计算总体的同质性,2.平均数的作用 (1)利用平均数可以比较同类现象在不同单位的发展水平 (2) 利用平均数可分析研究事物之间的依存关系 (3) 利用平均数可以比较同类现象在不同时间上的发展变化趋势 (4)利用平均数作为企业管理的依据,并可进行数量上的推算,4.2.2数值平均数 1.算术平均数 算术平均数,也称均值,是对全部数据进行算术平均,是集中趋势的最主要测度值,是计算平均数的最常用方法,它的基本计算形式是用总体标志总量除以总体单位总量。 在实际数据的分析中,根据掌握的数据资料的不同,算术平均数有两种计算形式:即简单算术平均数和加权算术平均数。,(1)简单算术平均数 简单算术平均数适用于未分组的统计资料,如果已知各单位标志值和总体单位数,可采用简单算术平均数方法计算,其计算公式为: 由于算术平均数受极端数值的影响很明显,为了消除极端数值的影响,在实际应用中还可以计算截尾平均数。截尾平均数的计算公式可以表示为:,(2)加权算术平均数 如果数据资料经过统计整理环节,形成了变量数列,如果在已知各组的变量值和变量值出现的次数,则可采用加权算术平均数计算。其计算公式为: 在加权算术平均数的计算公式中,权数除了用绝对数形式(即各组次数、也称频数)表示外,还可以用相对数形式即频率表示,此时加权算术平均数可以变形成如下形式:,(3)算术平均数的数学性质 算术平均数有两个重要数学性质: 各变量值与其算术平均数的离差之代数和等于零 各变量值与其算术平均数的离差平方之和为最小值,2.调和平均数 调和平均数是各个变量值倒数的算术平均数的倒数,又称为倒数平均数。调和平均数有独立的计算形式,但在实际应用中,调和平均数常常被作为算术平均数的变形来使用。 (1)简单调和平均数 (2)加权调和平均数,3.几何平均数 几何平均数是变量值的连乘积开变量值的项数次方。 (1)简单几何平均数 简单几何平均数是个变量值乘积的n次方根。 (2)加权几何平均数 如果各个变量值出现的次数不等,则可采用加权几何数公式进行计算。,4.2.3位置平均数 数值平均数是根据所有变量值计算的平均数,而位置平均数是根据变量值所处的特殊位置确定平均数的,具体有众数与中位数两种。 1.众数 众数是指一组数据中出现次数最多的变量值,用Mo表示。众数的确定分两种情况: (1)资料未经整理或单项式数列 如果数据资料未经整理或者是单项式数列确定众数比较简单,只需找到数据中哪个变量值出现的次数最多即可确定众数了。,(2)组距数列 由组距式数列确定众数,是先根据出现次数确定众数所在组,然后利用下限或上限公式计算众数的近似值。,上限公式:,下限公式:,2.中位数 中位数是指一组数据按大小顺序排列后,处于中间位置的那个变量值,用Me表示。中位数的确定分两种情况: (1)资料未经整理 对未分组数据计算中位数时,可先对数据进行排序,然后确定中位数的位置。 具体确定中位数的方法是: 设有n个数据,进行有序排列后,中位数的位置为(n+1)/2,如果数据为奇数项,则中位数为中间一项的数据;如果数据为偶数项,中位数为中间两项数据的简单算术平均数。,(2)资料经过整理 数据资料经过统计整理后通常形成单项式数列或者组距数列,如果是单项式数列,可先根据公式 确定中位数所在的位置,然后用累计频数(向下累计)确定中位数所在组后即可确定中位数的具体值了。,对于组距数列计算中位数时,先根据前述公式确定中位数所在的位置,然后用累计频数(向下累计)确定中位数所在组后采用下列下限或上限公式计算中位数的近似值。,下限公式:,上限公式:,4.2.4几种平均数的比较 1.算术平均数、调和平均数与几何平均数的数量关系 如果不研究算术平均数、调和平均数与几何平均数的实际应用条件,仅仅从数学角度去分析三者之间的数量关系,针对同样的数据资料,同时采用这三种算法计算平均数,可以证明,三者之间的数量关系为: 当且仅当所有变量值都相等时三者相等。,2.算术平均数、众数和中位数的比较 算术平均数是根据所有变量值计算的集中趋势值,众数与中位数是根据数据分布形状以及变量值所处的位置确定的集中趋势值,作为集中趋势的代表值,这三种平均数的不同计算特点决定了在实际应用中应根据研究目的与数据特征来选择恰当的集中趋势测度值。在实际应用中可以把这三种平均数结合起来,通过比较三者之间的数量关系分析变量分布的特征。,(1)当总体分布呈对称状态时,三者合而为一,如图:,f,X,(2) 当总体分布呈非对称状态时,右偏分布时:,如图:,f,X,左偏分布时:,所以,4.3 离散程度的测度,4.3.1离散程度的含义 所谓离散程度是指各变量值离开中心值的程度。,4.3.2离散程度的测度方法 变量离散程度的测度主要可通过全距、四分位差、异众比率、平均差、标准差、离散系数等进行测度。 1.全距 也称极差,是一组数据的最大值与最小值之差。全距是测度变量值离散程度最简单的方法,其计算公式为:,2.四分位差 将总体各单位的标志值按大小顺序排列,然后将数列分为四等分,形成三个分割点(Q1、Q2、Q3),这三个分割点称为四分位数,(其中第二个四分位数Q2就是数列的中位数Me)。 四分位差 Q.D.=Q3-Q1,3.异众比率 又称离异比率或变差比,是指非众数组的次数占总次数的比率,异众比率主要用于衡量众数对一组数据代表程度大小的,异众比率越大,说明非众数组的频数占总频数的比重越大,数据分布的集中趋势越不明显,离散程度越大,众数的代表性就越差;反之则相反。,4.平均差 平均差是数列中各单位标志值与平均数之间绝对离差的平均数。,5.标准差 标准差是离差平方平均数的平方根,故又称“均方差”。其意义与平均差基本相同。,在实际计算中,有时可将上述标准差公式进行变形,这样会更简便些,例如:,对于末分组的资料:,对于分组的资料:,6.离散系数 离散系数是各种变异指标与平均数的比率。反映总体各单位标志值的相对离散程度,最常用的是标准差系数。,4.4 偏态与峰度的测度,4.4.1偏态与峰度测度的目的 全面了解数据分布的形状与特点,不仅需要通过均值与方差等反映数据分布的集中趋势与离散程度,还需要测度数据分布是否对称、偏斜程度以及分布的扁平程度等,这就需要测度偏态与峰度。,4.4.2偏态的测度 偏态是测度数据分布的偏斜方向和程度的 。可通过算术平均数、众数和中位数分析测度分布的偏斜方向,如果要进一步定量测度数据分布的偏斜方向和程度,则主要是用偏态系数(skewness)来测定,偏态系数的计算方法又多种,常用的有以下两种:,1. 算术平均数与众数比较法,2.动差法 动差又称矩,可用来说明数据次数分布的特征。一般取数据中的a点为中心,所有数据与a之差的k次方的平均数 称为数据关于a的k阶动差(k阶矩)。 简单形式与加权形式:,可以根据计算出的偏态系数的大小、符号方向判断数据分布的偏态情况,具体判断如下:SK=0时为对称分布;SK0时为右偏分布;SK0时为左偏分布。,4.4.3峰度的测度 峰度(kurtosis)是分布集中趋势高峰的形状,通常是与正态分布相比较来测度数据分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论