平均指标和变异指标(参考资料).ppt_第1页
平均指标和变异指标(参考资料).ppt_第2页
平均指标和变异指标(参考资料).ppt_第3页
平均指标和变异指标(参考资料).ppt_第4页
平均指标和变异指标(参考资料).ppt_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第五章 平均指标和变异指标 (对应于教材第三章),本章要求: 1、数值平均数、位置平均数的种类及计算; 2、极差、平均差、方差、标准差、变异系数的计算;,2,第一节 平均指标的概念、特点、种类,测度数据集中趋势的指标是平均指标,平均指标包括两大类:数值平均数和位置平均数。数值平均数是根据全部数据计算得到的,位置平均数是根据数据所处位置或部分指标值计算得到的; 一、概念:平均指标就是反映同质总体内各单位某一数量标志值一般水平的综合指标。如:某企业的工人的平均工资可以代表这个企业工人工资收入的一般水平;全国粮食平均亩产量可以代表我国粮食生产的一般水平;,3,二、特点 1、平均指标把总体各单位数量标志值之间的差异抽象化了。 2、平均指标是总体各单位标志值的一般水平,反映了事物变动的集中趋势; 三、种类 最通常的分类:数值平均数(包括算术平均数、调和平均数和几何平均数)和位置平均数(中位数和众数);,4,第二节 数值平均数,一、算术平均数 (arithmetic mean)(又可分为简单算术平均数和加权算术平均数) 1、计算公式: 算术平均数=总体标志总量/总体单位总量 注意:1)算术平均数的分子、分母是同一总体的两个总量指标,分子与分母存在着对应关系;2)算术平均数与强度相对指标虽然都是两个总量指标的对比关系,但两者存在实质差别;,5,2、具体计算 1)简单算术平均数:根据未分组整理的原始数据计算的平均值; 计算公式为: 式中: 代表算术平均数;x代表各单位标志值;n代表总体单位数; 是总和符号; 例:某班组有10人,某日的生产量分别为14、15、16、16、18、19、20、20、22、24件,则该班组的平均每人日生产量为:(14+15+16+16+18+19+20+20+22+24)/10=18.4件;,6,2)加权算术平均数:次数就是权数。根据分组整理的数据计算的算术平均数;分两种情况:单项式数列:、当权数为绝对数: 式中的f代表各组变量值出现的频数;例:,7,根据上述资料,计算该生产小组平均日产量为: 注意:简单算术平均数是这种情况的特例; 、当权数为相对数: 式中: 代表权数,是相对数。,8,注意:权数为绝对数或相对数,计算结果是一致的;仍以上例为例:,9,根据组距数列计算加权算术平均数:与单项数列条件下计算加权平均数的方法相同,只需要以各组的实际平均数乘以相应的权数即可;但是,在编制组距数列时,由于原始数据量很大或原始数据根本没有给出来等原因,无法计算实际的组平均数,此时,只能用组中值来代替。由于组中值来代替组实际平均数,要求组内部的标志值是均匀分布的,因此,按组中值计算的加权算术平均数只能是个近似值。组中值的含义和计算?,10,知识回顾:组中值:每一组标志值中点位置的数值叫组中值。该数值代表各组数值的一般水平。成立前提:变量在组内的变化是均匀的或在组中值两侧呈对称分布状态;计算方法: 闭口组的组中值=(上限+下限)/2 只有上限的开口组组中值=上限-相邻组组距/2 只有下限的开口组组中值=下限+相邻组组距/2,11,其计算也分两种情况: 、当权数为绝对数: 其中xi代表组中值,而不是实际的变量值; fi代表每组的频数; 、当权数为相对数: 式中: 代表权数,是相对数。,12,例:权数是绝对数的组距数列的加权平均数的计算:,13,例:权数是相对数的组距数列的加权平均数的计算:,14,3、加权算术平均数与简单算术平均数的最大区别在于:加权算术平均数受到变量值大小、次数两个因素的影响,而简单算术平均数只受变量值大小的影响。 4、算术平均数的不足: 容易受极端变量值的影响,使平均数的代表性变小; 当组距数列为开口组时,由于组中值不好确定或不太准确,使平均数的代表性变小;,15,5、算术平均数的数学性质(P52) (1)算术平均数与其总体单位数的乘积等于各单位标志值的总和; (2)各个变量值与其算术平均数的离差之和等于0;即: (3)各个变量值与其算术平均数的离差平方和为最小值,即 为最小值;以简单算术平均数为例证明:,16,设 为不等于 的任意数, 则,17,二、调和平均数(harmonic mean),1、含义:是算术平均数的变形。是根据变量值的倒数计算的算术平均数的倒数,故又称倒数平均数,通常用 表示。 2、计算方法:分为简单调和平均数和加权调和平均数。 (1)简单调和平均数:,18,先看一个例子: 在菜市场上,某青菜早晨卖0.67元/千克,中午卖0.5元/千克,晚上卖0.4元/千克,请计算这种菜这一天的平均价格; 1、用简单算术平均数方法计算: 2、用简单调和平均数计算方法:,19,前一种计算方法是依据早、中、晚的单价简单平均计算出来的,它只受早、中、晚单价的影响;而后一种简单调和平均数,不仅受早、中、晚不同价格的影响,还受早、中、晚买的商品重量的影响(隐含着早、中、晚各买一元钱,如果购买金额不同,则是我们后面将要讲解的加权调和平均数的概念了),所以计算出来的价格是不同的。那么那种价格更具有代表性呢?在销售量不同的情况下,应考虑销售量这个因素对平均价格的影响,因此第二种价格更具有代表性;,20,再看一个例子:某市场上三种不同蔬菜的价格分别是0.5元/斤,0.8元/斤,1.0元/斤,如果每种蔬菜各买一元钱的,则平均价格是多少? 即各买一元钱的蔬菜的平均价格为0.71元; 注意:从这个例子我们可以体会调和平均数的经济意义。在这个例子中,平均价格=总金额/总数量,符合平均价格的基本计算公式;,21,(2)加权调和平均数,计算公式为:,22,例:根据下表某公司所属三个厂生产某种生产资料的情况,计算产品平均单位成本。,23,注意两点: (1)简单调和平均数是加权调和平均数的特例;当m1=m2=m3=mn=1时,加权调和平均数就是简单调和平均数; (2)从上例可以看出,调和平均数仍然是以总体标志总量除以总体单位总数计算的,在经济内容和计算结果上与算术平均数一致,只是由于计算时依据的资料不同,而在计算公式和计算过程方面有别于算术平均数;如当m=xf时,加权调和平均数就是加权算术平均数;,24,例:某公司员工工资情况如下表,请分别计算加权算术平均数和加权调和平均数;,25,3、调和平均数的特点 如果数列中有一标志值等于0,则无法计算; 4、调和平均数与算术平均数比较:方法和资料不同,调和平均数一般是分子项已知,分母项未知;算术平均数一般是分母项已知,分子项未知。,26,三 几何平均数,1、含义:也称为几何均值、对数平均数,是n个变量值乘积的n次方根。当某些经济现象存在“总比率等于各个比率的连乘积”这种关系时,需要计算几何平均数。 凡是变量值的连乘积等于总比率或总速度的现象都适用于计算几何平均数。最典型的两种现象是流水作业线和银行存款。请大家思考一下流水作业线的平均合格率该怎么计算?,27,2、分类及计算 (1)简单几何平均数:假定有n个变量值x1,x2,x3,xn,则简单几何平均数的基本计算公式为: 式中: 代表几何平均数;x代表变量值,n代表变量值的个数, 是连乘符号;,28,例:某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95%、92%、90%、85%、80%,整个流水生产线产品的合格率为:,29,(2)加权几何平均数,计算公式为: 式中的fi代表各个变量值出现的次数; 例:将一笔钱存入银行,存期为10年,按复利计息。10年的利率分别为:第1年和第2年为0.05,第3年至第5年为0.08,第6年至第8年为0.10,第9年至第10年为0.12,求平均利率; 年平均利率 则年平均利率为:1.0877-1=0.0877,30,四、几种平均数的比较 算术平均数 几何平均数 调和平均数 成立前提:标志值都属于正数,而且至少两个数不等; 请大家用两个数的例子证明?,表示为:,32,第三节 位置平均数,算术平均数、调和平均数和几何平均数都是根据总体全部标志值计算的。中位数和众数不是根据全部标志值计算的,而是根据其在总体中所处的特殊位置确定或根据部分标志值(实际上也是处于特殊位置的一些标志值)计算的,因此叫位置平均数。 一、分类:众数(mode)和中位数(median) ;,33,二、众数 1、含义:总体中最常见的数值,也即是数列中重复出现次数最多的数值,通常用Mo表示。如果分布曲线没有明显的集中趋势或最高峰,则该变量无众数;如果分布曲线明显地存在一个众数,则称为单峰分布;如果有两个不邻近的数据具有相对较高的频数(即使频数不相等),则称为双峰分布;也有可能出现多峰分布的情形; 2、适用条件:n 较多且有明显集中趋势时适合用众数作为总体一般水平。 3、确定方法: (1)对于原始数据或单项式分组资料:可以直接观察,即出现次数最多的数值;,34,例:,35,(2)组距式分组资料:先找出 众数所在组 , 然后再用比例插值法推算众数的近似值;计算公式为: 下限公式为: 上限公式为: 式中:L代表众数所在组下限,U代表众数所在组上限,d代表组距, 代表众数所在组次数与其下限的邻组次数之差, 代表众数所在组次数与其上限的邻组次数之差;,G,E,F,D,C,A,B,f,X,f3,f2,f1,d,XL,XU,M0,1,2,众数的两个计算公式可以从几何图形得到证明:,37,例: 从表上数据看,最大的频数是350,即众数组为700-800这一组,分别利用公式来计算众数:,38,课堂练习:请指出下面几组数据的众数; 1、10个民工的年龄:15,19,35,38,39,42,43,45,46,52; 2、某班15个学生的年龄:19,19,19,19,19,20,20,20,20,20,21,21,21,21,21; 3、某部门10名员工月工资:1300,1500,1800,1800,1800,2100,2100,2100,2500,3000;,39,注意:1、众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值和开口组数列的影响。 2、众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。,40,三、中位数 1、含义:把某种观察值按大小顺序排队后,处在该数列中点位置的观察值,通常以Me表示。在明显存在极端数值的情况下,用中位数比平均数更能代表总体的一般水平。 2、确定方法:根据资料的分组情况不同,确定中位数可分为:未分组资料、单项式分组资料和组距式分组资料三种情况。,41,(1)未分组资料:排序 确定位置(n +1)/2 (其中n为标志值的个数或总体单位数) 若n为奇数项,则居中点位置的数值即为中位数; 若 n为偶数项,则居中的两个数值的平均数为中位数。 例:有5个同学的年龄依次为16、17、18、19、21,则中位数的项次为(5+1)/2=3,则中位数是第三位上的标志值18岁;如果5位同学的年龄分别依次为16、17、18、21、24,则中位数是多少? 如果有6个同学的年龄依次为16、17、19、20、21、23,则中位数的项次为(6+1)/2=3.5,则中位数是中间位置的两个标志值的算术平均数,即(19+20)/2=19.5;,42,(2)单项式分组资料:累计次数(可以向下也可以向上累积,结果一样) 确定中位数位置,当某一组的累积频数最先达到总频数的一半,即(f/2), 找出中位数:该组所对应的变量值即为中位数。例:,43,填好数字的表如下: 计算f/2=21/2=10.5。看哪一组的累积次数先达到10.5:不论是由低到高还是由高到低,中位数都在第3组,即标志值167件为产量中位数;,44,(3)组距式分组资料:前两步骤同上,找到中位数所在位置 根据公式(下限或上限)求出中位数的近似值。 下限公式为: 上限公式为:,45,式中:Me代表中位数; L代表中位数所在组的下限; U代表中位数所在组的上限; d代表中位数所在组的组距; Sm-1代表中位数所在组以下的累积次数; Sm+1代表中位数所在组以上的累积次数; 请大家先试着证明?,46,例: 第一步:确定中位数位置= =1500/2=750;根据由低到高或由高到低累积次数,中位数所在的组为第四组,即700-800这一组; 第二步:根据公式计算;,47,如果根据下限公式: 如果根据上限公式:,48,课堂作业:,49,注意:1、中位数也是一种位置平均数,它也不受极端值及开口组的影响,具有稳健性。(同众数同) 2、各单位标志值与中位数离差的绝对值之和为最小值(相对于中位数和任一标志值而言)。(同算术平均数比较) 3、对某些不具有数学特点或不能用数字测定的现象,可以用中位数求其一般水平。(例:印染厂对颜色的排列),50,四、众数、中位数和算术平均数的比较 (一)算术平均数是数值平均数; (二)算术平均数和中位数在任何一组数据中都存在而且具有唯一性; (三)算术平均数只能用于定量数据,中位数适用于定序数据与定量数据,众数适用于所有数据类型; (四)算术平均数受极端值的影响,而众数、中位数则不受; (五)算术平均数可以推算总体的有关总量指标,众数、中位数则不宜;,1.当总体分布呈对称状态时,三者合而为一,如图:,f,X,2. 当总体分布呈非对称状态时(P58),如图:,f,X,所以,一组工人的月收入众数为700元,月收入的算术平均数 为1000元,则月收入的中位数近似值是:,1.平均指标只能适用于同质总体。(同质异量),2.用组平均数补充说明总平均数。(例子),五、平均指标的运用原则,某生产小组基期有工人15人,报告期人数增加到30人,两时期各技术等级的工人数和工资总额如下在下表中,每一级工的工资都涨了,但总平均工资却下降了!,某工业部门100个企业年度利润计划完成程度资料如下:,经计算,100个企业年度平均利润计划完成程度为103.35。,3.用分配数列补充说明平均数,59,第四节 变易指标,一、变异指标的概念:反映总体各单位标志值的差别大小程度的综合指标,又称为标志变动度。 二、意义:平均指标是反映总体一般水平的综合指标,掩盖了总体各单位标志值的数量差异,而变异指标反映总体内各个观察值之间差异程度,可以说明标志值的分散程度,还可以说明平均指标代表性的大小。它与平均指标结合运用,可以达到对现象总体的全面认识。 三、作用: 标志变动度是评价平均数代表性的依据。,甲、乙两学生某次考试成绩列表,甲、乙两学生的平均成绩为80分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。,61,四、种类:极差、四分位差、平均差、方差和标准差、变异系数;,全 距 R 四分位差 Q.D. 平 均 差 A.D. 标 准 差 S.D.() 离散系数 V,62,五、极差 1、含义:极差(R)又称全距,是总体单位各标志值中最大值与最小值之差。 2、计算(1)未分组或单项分组资料(见例1): R=最大标志值-最小标志值 (2)组距式分组资料:仅限于首末两组为闭口组,而且计算出来的全距要比实际全距大一些(见例2): R=末组上限-首组下限 3、局限:由于极差是根据总体的极端变量值计算的,没有考虑中间变量值的变动情况,所以不能全面反映总体各个变量值的离散程度。因此,其应用受到局限。在实际中,仅限于检查产品质量的稳定性等,应用范围很小。对于开口组,无法计算全距。,63,例1:有两个学习小组的学习成绩分别为: 甲组:60 70 80 90 100 乙组:78 79 80 81 82 两组的平均成绩都是80分,通过平均成绩的计算看不出两组学生的成绩差别,但计算全距: R甲=100-60=40分,而R乙=82-78=4分,因此通过全距的计算,可以判定:乙组的平均成绩更能代表乙组学生的成绩水平;,64,例2:给定下列数据: 根据未分组资料计算全距: R=最大标志值-最小标志值=139-107=32 对上面数据进行组距分组的方法?,65,第一步:对数值进行大小排序; 第二步:确定全距:139-107=32; 第三步:用经验公式确定组数: m=1+lg50/lg2(约)=7 第四步:确定组距:=全距/组数=32/7 (约)=4.6;为便于计算统计,也为了与组限的确定(以尾数5或0)衔接,确定组距为5; 第五步:确定组限;第一组的下限应低于最小变量值(本例中为107),故第一组的下限取为105;最后一组的上限应大于最大变量值(本例中为139),故最后一组的上限取为140;,66,组距分组的结果如下: 根据组距分组结果运用公式计算: 全距=末组上限-首组下限=140-105=35, 根据未分组资料求Q.D.,2.计算:,1.概念: 将总体各单位的标志值按大小顺序排列,然后将数列分为四等分,形成三个分割点(Q1、Q2、Q3),这三个分割点称为四分位数,(其中第二个四分位数Q2就是数列的中位数Me)。 四分位差 Q.D.=Q3-Q1,六、四分位差Q.D.P113,69,当n+1不能被4整除时的处理方法: 如一列数:1,1,2,7,9,11,16,21; Q1的位置=(8+1)/4=2.25; 这时Q1的计算方法为:整数部分即第2的数1+第3个数与第2个数的差的0.25,Q1为1.25;同理计算Q3;, 根据分组资料求Q.D.,2) 若单项数列,则Q1与Q3所在组的标志值就是Q1与Q3的数值;,若组距数列,确定了Q1与Q3所在组后,还要用以下公式求近似值:,根据某车间工人日产零件分组资料,求Q.D.,这表明有一半工人的日产量分布在11.41件至 17.36件之间,且相差5.95件。, 四分位差不受两端各25%数值的影响,能对开口组数列的差异程度进行测定;, 用四分位差可以衡量中位数的代表性高低;该数值越大,表明Q1Q2之间变量值分布越远离它们的重点Q2,即远离中位数,则说明中位数的代表性越差;该数值越小,则说明中位数的代表性越好;, 四分位差不反映所有标志值的差异程度,它所描述的只是次数分配中一半的离差,所以也是一个比较粗略的指标。,3. 四分位差的特点,74,七、平均差 1、含义:平均差是总体各单位标志值与其算术平均数离差绝对值的平均数,通常用A.D表示。平均差是各标志值对平均数的平均距离,其数值越大,说明标志值的差异程度越大,各标志值的分布也越分散; 请大家根据定义来计算下列一组数据的平均差:5,7,8,10,20;?,75,2、计算: (1)未分组资料: 采用简单平均差方法,计算公式为: 以上面所给数据5,7,8,10,20来计算:第一步:计算平均数=10;第二步,用各标志值减平均数得到离差,分别为:-5,-3,-2,0,10;第三步,对离差取绝对值,得到:5,3,2,0,10;第四步:用离差绝对值之和除以离差的个数,即得到简单平均差A.D=(5+3+2+0+10)/5=4;,76,(2)单项式分组和组距式分组资料:采用加权平均差方法,计算公式为: 例1:单变量分组示例:,77,第一步,计算平均数: 第二步:计算平均差:,78,例2 组距数列计算平均差,例如:某企业一生产车间100名职工日产量资料分组如下。 日产量(件) 人数(人)组中值(件) 离差 离差绝对值 离差绝对值*人数 515 10 10 -16 16 160 1525 35 20 -6 6 210 2535 40 30 4 4 160 3545 15 40 14 14 210 合计 100 740 平均数A=xf/f=2600/100=26(件) 平均差A.D=740/100=7.4(件),79,八、方差与标准差 1、方差与标准差 (1)含义:方差( )是总体各单位标志值与其算术平均数离差的平方的算术平均数。标准差( )是方差的平方根,故又称均方差。由于其计算结果一般稍大于平均差,这对于在抽样估计时,提高推断的把握程度具有一定的意义,因此标准差是应用最广泛的标志变异指标; (2)计算: A、未分组资料:(简单法),计算公式为:,80,例:某汽车销售商2004年1-6月的宝马汽车销售量分别为:120、125、128、130、135、142;计算其销售量的标准差与方差; 计算平均数: 计算方差: 计算标准差:,81,B、分组资料:(加权法) 计算步骤:平均数 离差 离差平方乘以次数 代入公式得到标准差。 计算公式为:,82,例:,83,2、是非标志的标准差 A、什么是是非标志:在对经济现象进行分析时,常把其全部单位划分为具有某种属性和不具有某种属性的两组,例如,将学生按性别划分为“男”、“女”,将产品划分为“合格”、“不合格”两组,由于这些反映单位属性或性质的标志不是数量标志,而是质量标志,且只有“是”与“非”两种表现,所以称之为“是非标志”,有时也称为“交替标志”。在进行抽样推断时,是非标志的标准差有着重要的意义。,84,B、成数:在总体中,是非标志只具有两种表现,把具有某种表现或不具有某种表现的单位数占全部总体单位数的比重称为成数。用字母表示为: P=N1/N 或Q=N0/N,P+Q=1或Q=1-P 例:某公司进口一批彩电共1000台,其中合格品980台,不合格20台,合格品占全部产品的98%,不合格产品占全部产品的2%。在这里,98%、2%都是成数,98%+2%=1;,85,C、成数的平均数 是非标志表现了现象质的区别,因此计算平均数首先要把是非标志的两种标志表现进行量化处理。一般以1表示具有某种标志表现,以0表示另外相对的那种标志表现,然后再根据平均数计算公式进行计算。 练习:某公司进口一批彩电共1000台,其中合格品980台,不合格20台,合格品占全部产品的98%,不合格产品占全部产品的2%。请计算合格品的平均数;,86,解:先对两种标志表现进行量化处理,即赋值,我们用1代表合格,0代表不合格; 注意:1、是非标志的平均数就是具有某种标志表现的单位数占总体单位数的比重,即成数P。2、一般我们将所研究、关注的标志的标志表现赋值为1(这点将在计算成数的标准差时应用);,87,D、成数的标准差:其计算根据标准差的计算公式: 注意:是非标志的标准差为具有被研究的标志表现的成数P与不具有该标志表现的成数(1-P)乘积的平方根;在上面公式的推导中,平均数取的是P,而在上例中Q是不合格产品的平均数,也是平均数之一,如果平均数取Q,请大家试着计算? 例:对前面那个例子,其是非标志的标准差为,88,3、方差的主要数学性质 (1)常数的方差等于0; (2)变量的线性函数的方差等于变量系数的平方乘以变量的方差。设a、b为常数,y=a+bx,则有 (3)分组条件下,总体方差等于组间方差与各组组内方差的平均数之和;,89,4、标准化值 也称标准分数,给出某一个值在一组数据中的相对位置,可用于判断一组数据是否有离群点;计算公式为, 与R的关系, 与A.D.的关系,经验表明,当分布数列接近于正态分布时,R和之间 存在以下经验公式: R为4至6个: 当标志值项数较少时,R4 当标志值项数较多时,R6,对同一资料,所求的平均差一般比标准

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论