第四章 统计资料初步描述1_第1页
第四章 统计资料初步描述1_第2页
第四章 统计资料初步描述1_第3页
第四章 统计资料初步描述1_第4页
第四章 统计资料初步描述1_第5页
已阅读5页,还剩162页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计资料初步描述

2023/10/24第四章统计资料初步描述

原始数据统计指标总量指标相对指标平均指标标志变异指标偏度和峰度加工整理由于指标是反映总体特征的,所以说统计指标具有综合性,也称为“综合指标”2023/10/24第一节总量指标一、总量指标的概念和作用1.总量指标:反映总体现象在一定时间和空间条件下达到的总规模或绝对水平的统计指标。分为两类:1)事物总体的总量。2)事物总量的差异量。2023/10/24说明:1)总量指标的数值表现形式为绝对值。2)总量指标的数值大小随总体范围的大小而增减。3)只有对有限总体才能计算总量指标。2023/10/242.作用1)是认识事物总体特征的起点。2)是实行各项管理的基本依据之一。3)是计算相对指标和平均指标的基础。2023/10/24二、总量指标的计量单位1、实物单位

是根据事物的自然属性和物理属性而确定的计量单位,包括自然单位、度量衡单位和标准实物量单位。1)自然单位:根据研究对象的自然状态度量其数量的计量单位,是人们长期以来习惯形成的。如:人口按“人”,电视用“台”,汽车用“辆”2023/10/242)度量衡单位:按照统一的度量衡制度的规定来度量客观事物数量的一种计量单位。度量衡单位能准确反映客观事物的数量。如:粮食产量以“千克”、天然气以“立方米”适用:①无法采用自然单位的现象,如水、粮食、棉花等。②由自然单位但不如度量衡单位准确,如鸡蛋、蔬菜、水产等。2023/10/243)标准实物单位:按统一的折算标准(折算系数)来度量客观事物数量的一种计量单位。2023/10/24总量指标的这些实物量指标既可以单独使用,也可结合使用,结合使用时分为①复合计量单位:两种事物单位的乘积表示事物的数量,如货物周转量“吨公里”,发电量“千瓦时”。②多重计量单位:两种或两种以上的计量单位来度量事务的数量,如船舶用“艘/吨/马力”。2023/10/242、货币单位:货币作为价值尺度的一种计量单位。特点:代表一定的社会必要劳动量,具有广泛的综合性和概括能力。3、劳动单位:用劳动时间(如工时、工日、学时)来表示总量的计量单位。如果生产一定量的产品所消耗的工作时间越少,说明生产的效率越高。2023/10/24二、总量指标的种类(一)按总量指标反映事物的内容不同,可分为:总体单位总量:反映总体中单位数多少的总量指标,又称为总体单位数。通过对总体各单位计数直接得到。若每个“人”为一总体单位,“总体中一共有4个人”就是总体单位总量。2023/10/24总体标志总量:反映总体中各单位某一数量标志的标志值总和的总量指标,通过对某一数量标志的标志值加总得到。这四个人的总体重为:50+65+55+60=230公斤这“230公斤”为总体标志总量50公斤65公斤55公斤60公斤问:再举出两个“总体标志总量”的例子。2023/10/24说明:

1、对一个整体而言总体单位总量指标只有一个,总体标志总量指标可以有许多。2023/10/242、对某一总量指标,是总体单位总量还是总体标志总量,要具体情况具体分析。如:“全校学生人数8000人”是一总量指标。•••共8000人,这时是总体单位总量。统计系360人+金融系1000人+•••共8000人,这时是总体标志总量。+++以每个“人为单位”以每个“系”为单位2023/10/24(二)按反映的时间状况不同,可分为:时期指标:反映事物在一段时期内达到的规模或水平。时点指标:反映总体在某一瞬间上存在状况的总量指标。时期指标与时点指标的三个特点:1、时期指标各期数值可以直接相加,时点指标各期数值一般不能直接相加,如:各月工业增加值相加就是全年工业增加值。每天的产品库存额相加无意义。2023/10/242、时期指标的数值与计算期长短有关系,计算期越长,指标数值也就越大,计算期短,指标数值也就小;时点指标的数值大小与时点间的间隔长短没有直接关系。3、时期指标的数值通过连续登记取得;时点指标的数值大小是通过一次性登记取得。2023/10/24小练习1.判断以下是时期指标还是时点指标?1)河南省2010年减少的耕地面积2)河南省2010年新增人口数3)河南省2010年人口数4)河南省2010年人均国民生产总值

1)时期指标2)时期指标3)时点指标4)都不是2023/10/243、按计量单位不同,总量指标可分为:1)实物量指标:以实物单位计量的总量指标。2)价值量指标:以货币单位计量的总量指标。2023/10/24第二节相对指标一、相对指标的概念和作用(一)相对指标的概念相对指标是将两个有联系的指标数值进行对比,以一个抽象化的数值表现事物间在数量上联系的形式和程度的统计指标,其表现形式为相对数,所以又被称为相对指标。2023/10/24案例已知某公司某年的总产值为3000万元。如果本年度的利润为210万元,则产值利润率为:如果本年度的计划产值为2500万元,则计划完成程度为:如果上年产值为2400万元,则发展速度为:增长速度为:如果同类企业中甲企业的产值为2000万元,则该企业的产值是甲的多少倍:

2023/10/24(二)相对指标的表现形式1.无名数:是一种抽象化的数值,常以系数、倍数、成数、百分数、千分数等表示,其中倍数、百分数最常用。2.有名数:同时使用相对指标中的分子和分母的计量单位,以表示现象的密度、普遍程度等,如人口密度“人/平方千米”等。

2023/10/24(三)相对指标的作用(一)揭示现象之间的对比关系,以反映现象的发展速度、密度、结构、比例关系等;如:某地区历年GDP的资料如下:年份199519961997199819992000GDP(亿元)3002.73661.24079.34356.64576.15137.7与上年相比的发展速度(%)-121111106105112我们不便看出哪一年发展得快,则计算发展速度如下:(二)使某些不能直接对比的现象找到对比的基础。2023/10/24二、相对指标的种类(一)结构相对指标(又称为结构相对数)概念:是总体中的部分数值占全部数值的比重或比率。计算公式为:例1:2000年我国第五次人口普查资料如下:我国人口总数为:126743万人,其中,男性65437万人,女性61306万人,那么,可计算结构相对指标:男性、女性各所占比重?注:请大家再举两个结构相对数的例子。2023/10/24说明:1.总体中各部分所占比重之和为100%或者1。

2.结构相对指标数值的表现形式为无名数。3.分子分母不能互换。2023/10/24(二)比例相对指标概念:是总体中一部分数值与总体中另一部分数值之比。计算公式:

我国1990年第四次人口普查的结果表明,全国人口总数为11.34亿人,其中,男性人口为5.85亿人,女性人口为5.49亿人,则计算男、女人口的性别比例为:比例相对数主要用来计算人口的性别比例。2023/10/24说明:

1.比例相对指标的表现形式为无名数。2.分子分母可以互换。2023/10/24(三)比较相对指标概念:是同一时间、不同条件或不同空间的两个不同总体同类指标数值的对比。计算公式:例1:甲班有学生60人,乙班有学生50人,则甲班人数为乙班人数的120%(即:60/50);例2:甲企业人均月工资800元,乙企业人均月工资1000元,则甲企业人均月工资为乙企业的80%(即:800/1000);例3:甲地区有人口8000万,乙地区有人口4000万,则甲地区人口为乙地区的2倍(即:8000/4000)。2023/10/24说明:1.分子与分母可以互换。2.结构相对指标数值的表现形式为无名数。3.可以是绝对指标对比,也可以是相对数或平均数对比。2023/10/24(四)强度相对指标概念:是两个性质不同,但又有一定联系的统计指标之比。计算公式:例1:例2:2023/10/24说明:1.强度相对指标的表现形式有两种:

a.有名数:将用来对比的分子与分母的计量单位同时使用。如:人口密度“人/平方公里”。

b.以百分数或千分数表示的无名数。如:人口自然增长率。2023/10/242.有些强度相对指标中,分子与分母可以互换。这就有正指标和逆指标两种形式:

正指标:强度相对指标的大小与现象的强度、密度或普遍程度的变化趋势同向。

逆指标:强度相对指标的大小与现象的强度、密度或普遍程度的变化趋势反向。2023/10/24例子例2:2003年底我国城市园林绿地面积为340444万平方米,城市人口数为52376万人,则人均占有公共绿地面积为?以绿化程度为研究目的,正逆指标分别为?

正指标:人均公共绿地面积逆指标:公共绿地服务人口数2023/10/243.强度相对数不同于统计学上的平均指标,尽管有时用“平均”的字眼。2023/10/245、判断1)、社会商品零售额中,按经济类型分,国有企业占58.2%。2)、2005年我国国民生产总值相当于美国的1/8。3)、2003年某市平均每家医院为158516人服务。

4)、某班性别比例3:2。

5)、某市工业总产值是上年118%。2023/10/24(五)动态相对指标概念:动态相对指标,又称为动态相对数,是将同一总体不同时间指标数值之比。计算公式:说明:1.分子分母不能互换。2.动态也称发展速度。例1:我国钢的总产量,在2001年为15163.44万吨,在2000年为12850.00万吨,那么钢总产量的动态相对指标为2023/10/24(六)计划完成情况相对指标概念:计划完成情况相对指标,又称为计划完成百分数,是将现象在一定时期内实际完成数与计划任务数对比,以反映计划执行情况的相对指标,通常用百分数表示。计算公式:说明:1.分子、分母不允许互换。例:某企业2002年计划工业增加值为400万元,实际完成440万元。则工业增加值的计划完成情况相对指标为110%。2023/10/24计划任务数的表现形式可以为总量指标、相对指标或平均指标,对应计划完成情况相对指标的表现形式有三种:①计划任务数为绝对数形式时,例1:某企业某年某种产品计划产量为500吨,实际产量为600吨,则计划完成程度为:解:计划完成程度②计划任务数为以无名数表示的相对数形式时例2:某企业某种产品产量计划比去年提高8%,实际比去年提高10%,试计算该产品产量的计划完成程度。解:计划完成程度2023/10/24例3:某企业2001年甲产品的单位成本水平计划降低率为5%,实际的降低率为6%,则计划完成情况相对指标为?解:计划完成程度③计划任务数是平均数形式时,例4:2001年某工业企业甲产品单位成本水平计划为50元,实际为45元,则:该企业甲产品单位成本水平计划完成程度为多少?解:计划完成程度2023/10/24注意:不能一概的认为计划完成情况相对指标值大于100%,就是超额完成了计划,而小于100%就没有完成计划。

计划完成的好坏,要视指标的类型而定:以最低限额制定的计划,结果大于等于100%,才算完成;以最高限额制定的计划,结果小于等于100%,才算完成。2023/10/24第三节平均指标的意义和种类2023/10/24

一名统计学家遇到一位数学家,统计学家调侃数学家说道:“你们不是说若X=Y且Y=Z,则X=Z吗!那么想必你若是喜欢一个女孩,那么那个女孩喜欢的男孩你也会喜欢喽!?”

数学家想了一下反问道:“那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均的温度不过是五十度而已!”统计学家与数学家

2023/10/24一、平均指标的意义和种类(一)概念平均指标在同质总体内,运用一定方法将总体各单位在某一标志下的数量差异抽象化,以反映总体在一定时间、地点和条件下所达到的一般水平的统计指标,也称统计均值或平均数。说明:1、平均指标是一个抽象化的数值;

2、平均指标是一个代表性的数值。2023/10/241.可以进行对比分析。19961997199819992000城镇9101200134014601520乡村380482510670740某地区1996—2000年人均收入资料(单位:元)(二)平均指标的作用2023/10/242.可以分析现象之间的相互依存关系。

3.可以反映总体分布的集中趋势。

按劳动生产率分组(元)平均工资(元)3000以下26623000-500037535000-700046207000-10000528110000-15000603215000-20000688520000以上71102005年一季度某市工业企业职工工资与劳动生产率资料2023/10/24(三)、平均指标的种类1.从其计算方法上看,分为数值平均数和位置平均数。数值平均数:根据统计分布数列中所有单位的变量值计算出来的。包括:算术平均数、调和平均数、几何平均数。位置平均数:根据变量值在统计分布数列中所处的特殊位置确定的。包括众数、中位数。2023/10/242.从其反映的时间状况上看,分为静态平均数和动态平均数静态平均数:反映同一时间条件下事物或现象一般水平,又称一般平均数。动态平均数:反映事物或现象在某一段时间内发展变化的一般水平,又叫序时平均数。本章所介绍的主要是静态平均数。2023/10/24二、平均指标的计算和分析数值平均数:算术平均数、调和平均数、几何平均数位置平均数:众数、中位数2023/10/24基本形式:例:直接承担者(一)算术平均数说明:计算算术平均数时,基本公式中的分子与分母必须属于同一统计总体,并且分母的每个总体单位是分子中每个变量值的承担者。2023/10/24A.简单算术平均数——适用于总体资料未经分组整理、尚为原始资料的情况式中:为算术平均数;为总体单位总数;为第个单位的标志值。算术平均数的计算方法2023/10/24平均每人日销售额为:算术平均数的计算方法某售货小组5个人,某天的销售额分别为520元、600元、480元、750元、440元,则【例】2023/10/24B.加权算术平均数——适用于总体资料经过分组整理形成变量数列的情况式中:为算术平均数;为第组的次数;为组数;为第组的标志值或组中值。算术平均数的计算方法2023/10/24【例】某企业某日工人的日产量资料如下:日产量(件)工人人数(人)101112131470100380150100合计800计算该企业该日全部工人的平均日产量。算术平均数的计算方法2023/10/24解:算术平均数的计算方法若上述资料为组距数列,则应取各组的组中值作为该组的代表值用于计算。说明2023/10/24例:某组工人按某日的日产量分组资料如下表:求平均日产量。日产量(件)工人数(人)20-3030-4040-5050以上10709030合计

20025354555

250245040501650则:平均日产量为f组中值Xfx8400-2023/10/24分析:成绩(分)人数(人)甲班乙班丙班603915010013950平均成绩(分)619980起到权衡轻重的作用算术平均数的计算方法决定平均数的变动范围2023/10/24表现为次数、频数、单位数;即公式中的表现为频率、比重;即公式中的算术平均数的计算方法指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各组的标志值对平均数的影响程度权数绝对权数相对权数2023/10/24成绩(分)人数(人)甲班乙班6036301002420合计6050案例2023/10/24成绩(分)人数(人)甲班比重(%)乙班比重(%)603660306010024402040合计6010050100平均成绩(分)76—76—案例2023/10/24练习:某企业工人按月工资分组资料如下表:月工资(元)各组工人数占总人数的比重(%)400以下400-450450-500500-550550以上1020352411合计100组中值x375425475525575-试计算该企业工人的月平均工资。解:=375×10%+425×20%+475×35%+525×24%+575×11%=478(元)2023/10/24说明:1.以组中值代表各组变量计算的平均数与实际平均数略有出入,因为以组中值代表各组变量有一个假定前提,即假定组内是均匀分布的,而实际并非如此。因此,它是一个近似值。2023/10/24

(即:如果各组次数都相等,可以不考虑次数,而用简单算术平均法计算平均数。)证明:各组次数都相等,即(A为常数)则:

2.简单算术平均数是加权算术平均数各组次数都相等条件下的一种特殊情况。2023/10/24在未分组情况下,有:证:在分组情况下,有:证:=03.算术平均数的数学性质性质1:各个标志值与其算术平均数的离差之和等于0。即=02023/10/24

性质2.各个标志值与其算术平均数的离差平方之和为最小值,即:在未分组情况下,有:在分组情况下,有:证:

(以未分组情况为例)设:即A为以外任意值,并设因为,总是大于0,所以,证毕。即则:2023/10/244.强度相对指标与平均指标的区别:平均指标,是在一个同质总体内标志总量与单位总量之比,分母的每个总体单位是分子中每个变量值的承担者,反映总体各单位某一标志值的平均数,不涉及不同总体。而强度相对指标是两个不同总体指标值对比结果,不存在标志总量与单位总量相适应问题。5.算术平均数容易受极端数值的影响。2023/10/24【例】

设X=(2,4,6,8),则其调和平均数可由定义计算如下:⒉再求算术平均数:⒈求各标志值的倒数:,,,⒊再求倒数:是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数(二)调和平均数2023/10/24例1:有一种蔬菜,早晨的价格每千克0.5元,中午0.2元,晚上0.1元。如果早、中、晚各买1元钱的蔬菜,则当天所买的蔬菜平均价格是多少?

2023/10/24A.简单调和平均数——适用于总体资料未经分组整理、尚为原始资料的情况式中:为调和平均数;为变量值的个数;为第个变量值。调和平均数的计算方法2023/10/24B.加权调和平均数——适用于总体资料经过分组整理形成变量数列的情况式中:为第组的变量值;为第组的标志总量。调和平均数的计算方法2023/10/24例2:有一种蔬菜,早晨的价格每千克0.5元,中午0.2元,晚上0.1元。如果早、中、晚各买1元2元3元钱的蔬菜,则当天所买的蔬菜平均价格是多少?

2023/10/24日产量(件)各组工人日总产量(件)10111213147001100456019501400合计9710【例】某企业某日工人的日产量资料如下:计算该企业该日全部工人的平均日产量。2023/10/24即该企业该日全部工人的平均日产量为12.1375件。解2023/10/24——作为算术平均数的变形使用。因为:调和平均数的实质2023/10/24例:某管理局所属5个企业某年的产值完成情况资料如下表:企业名称12345上半年下半年计划产值(万元)计划完成程度(%)实际产值(万元)计划完成程度(%)100400150300500103105100100102124.8459160.8367.5618104102100.5105103试分别计算上半年、下半年和全年的产值平均计划完成程度。解:xf上半年产值的平均计划完成程度xM平均数的应用2023/10/24下半年产值的平均计划完成程度:下半年实际产值(万元)M计划完成程度(%)X124.8459160.8367.5618104102100.5105103全年产值的平均计划完成程度2023/10/24练习题1:

甲乙两个农贸市场三种蔬菜的价格和成交额资料如下表:蔬菜品种价格(元/公斤)成交额(元)甲市场乙市场ABC0.440.480.50220004800095000440002400090000试分别计算甲、乙两市场的平均价格。x2023/10/24练习题2:某公司下属三个企业某年第一季度生产完成情况资料如下表:企业计划产量(件)计划完成程度(%)实际一级品率(%)甲乙丙50034025010310198969895要求:(1)计算产量的平均计划完成程度;(2)计算平均一级品率。xfx2023/10/24是n项变量值连乘积的开n次方根(3)几何平均数各个比率或速度的连乘积等于总比率或总速度;相乘的各个比率或速度不为零或负值。应用的前提条件:2023/10/24A.简单几何平均数——适用于总体资料未经分组整理尚为原始资料的情况式中:为几何平均数;为变量值的个数;为第个变量值。几何平均数的计算方法2023/10/24B.加权几何平均数——适用于总体资料经过分组整理形成变量数列的情况式中:为几何平均数;为第组的次数为组数;为第组的标志值或组中值。几何平均数的计算方法2023/10/24【例2】某金融机构以复利计息。近12年来的年利率有4年为3﹪,2年为5﹪,2年为8﹪,3年为10﹪,1年为15﹪。求平均年利率。解:2023/10/24说明:(1)几何平均数的对数是各个变量值对数的算术平均数。

2023/10/24将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用表示㈣中位数不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。中位数的作用:2023/10/24

如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。比如有5笔付款:9元,10元,10元,11元,60元平均付款为100/5=20元。很明显,这并不是一个好的代表值,而中位数10元是一个更好的代表值。2023/10/24中位数的应用特点(1)中位数处于频数分布的中点,总体中有一半单位的标志值大于中位数,另一半单位的标志值小于中位数。它不受极端值、开口组的影响,所以当总体单位标志值分布十分偏斜时,用中位数或众数进行集中趋势分析较好。(2)中位数的测定要将变量值按大小顺序排列,如果资料不全时就无法确定。(3)中位数对分布数列中除中间一项或两项以外的其他数值的变化反映不出来。2023/10/242.计算方法1).由未分组数据资料确定中位数。先对数据进行排序,然后利用求出中位数的位次。

2023/10/24

例:设有5个人的年龄分别为:17、15、16、19、20(岁)。试求这5个人年龄的中位数。解:先把这5个人年龄按大小顺序排列:15、16、17、19、20,再求中位数的位次数即第三位上的数(17岁)为中位数。

注:①如果N为奇数,则该位次对应的那个数据即是中位数。②如果N为偶数,则此时中位数是中间位置相邻的两个数据的平均值,即中间两个数值之和的1/2。

2023/10/242).由分组数据资料确定中位数分组数据已按大小顺序排列,先累计各组次数,用确定中位数所在的组,然后再视分组情况确定。补充:累计次数(频数)数列、2023/10/24

某企业工人按生产定额分组

按生产定额情况分组(%)次数向上累计向下累计人数比重人数比重人数比重90~100100~110110~120120~130130~140140~150481513730.080.160.300.260.140.06412274047500.080.240.540.800.941.00504638231031.000.920.760.460.200.06合计501.00————2023/10/24①由单项数列确定中位数对各组次数顺序累计后,确定所在的组即为中位数所在组,该组的变量值就是中位数的具体数值。2023/10/24例:某班学生按年龄分组的资料如下表:年龄(岁)人数(人)19202122512304合计51试计算该班学生年龄的中位数。解:先计算累计次数(见表末栏)。累计次数-再计算中位数的位次数可见,中位数的位次数(25.5)在第三组,第三组的标志值(21岁)即该班学生年龄的中位数。中位数

51747512023/10/24②由组距数列确定中位数仍用上述方法确定中位数所在的组,而后再用下述公式计算中位数的近似值。其中,:中位数;:中位数所在组的下限;:中位数所在组以前各组的累计次数;:中位数所在组的次数;:中位数所在组的组距。公式12023/10/24其中,:中位数;:中位数所在组的上限;:中位数所在组以后各组的累计次数;:中位数所在组的次数;:中位数所在组的组距。公式22023/10/24

按月工资分组(元)职工人数(人)500以下500-600600-700700-800800以上2024262010合计100试计算该企业职工月工资的中位数。向上累计次数向下累计次数--解:中位数所在组下限公式:例:某企业职工按月工资分组的资料如下表:上限公式:

2044709010010080563010中位数的位次数:2023/10/24例:根据下表所示资料求中位数按日产量分组(千克)工人数(人)50——601060——701970——805080——903690——10027100——11014110以上82023/10/24指总体中出现次数最多的变量值,用表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。㈤众数2023/10/24有时众数是一个合适的代表值

比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。

2023/10/24说明:①只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。②总体单位数较少,或单位数虽多,但无明显集中趋势时,计算众数是没有意义的。③若有两个变量值出现次数相等,则称存在复众数。2023/10/242.计算1).根据单项数列确定众数。只需找出哪个变量值出现的次数最多,这个变量值就是众数。某种商品的价格情况

(元)销售数量(千克)2.00

202.40

603.00

1404.00

80合计300例:某商店一商品销售价格与销售量资料,求价格的众数。2023/10/242).根据组距数列确定众数第一步:根据各组次数确定众数所在的组。第二步:根据下述公式计算众数的近似值。其中,:众数;:众数所在组的下限;:众数所在组次数与前一组次数之差;:众数所在组次数与后一组次数之差;:众数所在组的组距。公式12023/10/24其中,:众数;:众数所在组的上限;:众数所在组次数与前一组次数之差;:众数所在组次数与后一组次数之差;:众数所在组的组距。公式22023/10/24例:某企业职工按月工资分组的资料如下表:按月工资分组(元)职工人数(人)500以下500-600600-700700-800800以上2024262010合计100试计算该企业职工月工资的众数。次数最多众数组解:下限公式请同学们用上限公式计算众数。(元)2023/10/24按日产量分组(千克)工人数(人)50以下1060——701970——805080——903690——10027100——11014110以上8例:某工厂按日产量对工人进行分组,资料如下,根据下表所示资料求工人日产量的众数。2023/10/24(六)各种平均数之间的关系1.算术平均数、调和平均数、几何平均数的关系:若仅仅从数量关系上讲,这三种平均数存在如下关系:当各个标志值相等时,等号成立。2023/10/242.算术平均数、中位数、众数之间的关系1).一组数据具有单一众数,且呈现对称分布时,三者合一。(即次数分布呈现出单峰钟形对称分布)f如图:x2023/10/242).一组数据中具有单一众数,但呈现非对称分布时,则:①如果分布右偏,则fx2023/10/24②如果分布左偏,则:

Xf2023/10/24③根据经验,分布适度偏斜的情况下,算术平均数与众数的距离约等于算术平均数和中位数之间距离的三倍,即:2023/10/24例:从自动包装机包装的食品中,抽出100袋检查,发现平均重量为1001克,中位数为999克。要求:1.求该批食品重量的众数;2.对该批食品重量分配的偏斜情况进行说明。解:1.绘制三种平均数之关系的示意图:=999-2(1001-999)=995(克)2.因为995<999<1001,该批食品的重量呈右偏分配,即有可能某包的重量过重。练习:某批零件,直径小于806mm者占全部的半数,测定结果,多数零件的直径表现为810mm,试估计该批零件直径的算术平均数,并指出零件直径尺寸分配的偏斜情况。解:依题意:Me=806mm,M0=810mm所以,零件尺寸为左偏。2023/10/24七.计算和应用平均指标应注意的问题(一)要在同质总体内计算平均数;(二)要把总平均数和组平均数结合应用。例:甲、乙两企业职工平均工资计算表:职工组甲企业乙企业职工人数(人)平均工资(元)职工人数(人)平均工资(人)工人管理2109063013002003006001250合计300831500990各组人数占的比重(%)7030100各组人数占的比重(%)4060100低工资人数占的比重高高工资人数占的比重高2023/10/24(三)平均指标与分布数列相结合;(四)平均指标与典型事例相结合;(五)平均指标与标志变异指标相结合。2023/10/24第四节标志变异指标一、标志变异指标的概念标志变异指标:反映了总体各变量值的差异程度,亦即反映分配数列中以平均数为中心的各变量值变动的范围或离差程度,又称标志变动度。

2023/10/24例:如果你是一家制造业公司的供应部门经理,与两家原材料供应商联系供货,两家供应商均表示能在大约10个工作日内供齐所需原材料。几个月的运转之后,你发现尽管两家供货商供货的平均时间都是大约10天,但他们供货所需天数的分布情况却是不同的(见下页图)。你认为两家供货商按时供货的可信度相同吗?考虑它们直方图的差异,你更愿意选择哪家供货商供货呢?2023/10/24两家供货商供货图2023/10/24二、标志变异指标的作用1.标志变异指标是反映变量的离中程度。

数据分布越分散,离散程度越大,标志变异指标的数值也就越大;

数据分布越集中,离散程度越小,标志变异指标的数值也就越小。2023/10/24集中趋势弱、离中趋势强集中趋势强、离中趋势弱2023/10/242.利用标志变异指标,可以衡量平均数的代表性高低。标志变异指标的数值越小,数据分布越集中,离散程度越小,平均数作为各变量值一般水平的代表,代表性越高。3.标志变异指标可以反映研究现象变动的均衡性、稳定性。标志变异指标的数值越小,数据分布越集中,离散程度越小,总体各单位的发展越均衡,总体在不同时间上的发展越稳定。2023/10/24三、标志变异指标的具体计算常用的标志变异指标有:极差、平均差、方差、标准差、变异系数。(一)、极差1.概念极差又称全距,它是指所研究的数据中,最大值与最小值之差。通常用R表示。说明数据变动的最大范围。

2023/10/24式中,:该组统计数据中的最大值;:该组统计数据中的最小值。例:假定某车间两组工人的日产量(件)资料如下,求其极差。甲组:80、90、100、110、120乙组:90、95、100、105、1102.计算2023/10/243.说明1).极差计算简单,容易理解,常用它粗略的说明数据的变异程度。2).极差没有考虑数据中各项数值的变动情况,只受两个极端数值的影响。3).极差的应用范围较窄。2023/10/24(二)、平均差1.概念离差:一组统计数据中的某一个与该组数据算术平均值的差。平均差:一组统计数据中的各个数据与其算术平均数的离差绝对值的算术平均数。通常用A.D.表示。表明数据的平均变动程度。思考:为什么要对离差取绝对值?注:平均差不是平均离差之意,而是平均绝对离差的简称。

2023/10/242.计算根据所掌握的资料不同,可分为简单算术平均法和加权算术平均法两种。1).用简单算术平均法计算平均差。适用于未经分组的资料。计算公式为:2).用加权算术平均法计算平均差。适用于掌握资料是经过加工整理后形成的分配数列,即分组资料。计算公式为:2023/10/24例:设有四个人的年龄分别为20、21、23、24岁,试计算这四个人年龄的平均差。解:2023/10/24例:设有某班学生按年龄分组如下:年龄(岁)人数(人)20212324412286合计50

80252644144试计算全班学生年龄的平均差。xf总年龄

xf1120解:

9.616.816.89.652.82023/10/24练习:某班学生按考试成绩分组资料如下:考分(分)人数(人)60以下60-7070-8080-9090以上2481610合计40试计算该班学生考试成绩的平均差。

f组中值x5565758595-xf11026060013609503280解:

54685648130356|x-82|f2023/10/24(三)说明1.平均差是利用全部数据信息计算出来的,能全面地反映各个数据与其算术平均数差异的一般水平,克服了极差的不足。2.计算平均差需要给离差取绝对值,在数学处理上不够方便,在实际中运用较少,较常用的是由它变异出来的方差和标准差。2023/10/24(三)、方差和标准差方差和标准差是计算数据变异程度时最重要、最常用的指标。1.方差各个数据与其算术平均数离差平方的算术平均数。常用表示。2.标准差标准差是方差的正平方根,用σ表示。

2023/10/242).计算方差的计算同平均差一样,也有简单算术平均法和加权算术平均法之分,只是把绝对值符号变成了平方。①简单算术平均法计算方差、标准差的公式(适用于未分组资料):②加权算术平均法计算方差、标准差的公式(适用于已分组资料):2023/10/24年龄(岁)人数(人)20212324412286合计50例:某班学生按年龄分组资料如下表:试计算该班学生年龄的标准差。xf总年龄xf

802526441441120解:(x-22.4)2f23.0423.5210.0815.3672.002023/10/24练习1:某班学生按考试成绩分组资料如下:考分(分)人数(人)60以下60-7070-8080-9090以上2481610合计40试计算该班学生考试成绩的标准差。f组中值x5565758595-xf

11026060013609503280解:(x-82)2f14581156392144169048402023/10/24练习2

:对甲、乙两班学生各抽查10人,得某课程的考试成绩如下表:学生编号12345678910甲班考分70777980828588919296合计840乙班考分70747880828689919496840

试比较哪班的平均考分代表性更大些?xx196492516411649641445641961003616442549100144674解:所以,甲班的平均考分代表性更大些。2023/10/24练习3:某餐饮集团所属67家加盟店2005年上半年平均营业额为562.7万元,营业额标准差为59.4万元;同期营业利润平均为85.3万元,营业利润的标准差为15.4万元。比较营业额与营业利润的离散程度。2023/10/24可比变异系数指标2023/10/24标志变异系数:又称离散系数。是用来比较两组相同类型数据的离散程度大小或平均数对各组数据代表性高低的统计分析指标,用相对数形式来表示。①平均差系数:数据的平均差与其算术平均数之比。公式:②标准差系数:数据的标准差与其算术平均数之比。公式:应用普遍,不加说明时,标志变异系数指的就是标准差系数。标志变异系数越小,平均值的代表性越好(四)、标志变异系数2023/10/24例子某餐饮集团所属67家加盟店2005年上半年平均营业额为562.7万元,营业额标准差为59.4万元;同期营业利润平均为85.3万元,营业利润的标准差为15.4万元。比较营业额与营业利润的离散程度。可见,利润额的离散程度大。2023/10/24标志变异系数的适用条件:当比较的两个总体的平均数不相等时。当对比的两个变量计量单位不相同时。总结:关于判断两组数据稳定性或判断两组数据平均值的代表性的题目,解题思路是:第一步,分别计算两组数据的平均值。第二步,若两组数据的平均值大小相等,且单位也相同,则可利用标准差来判断;若两组数据的平均值大小不相等,或单位不同,则要进一步计算标准差系数来判断。2023/10/24例1:有甲、乙两个工厂工人劳动生产率及标准差资料如下:工厂工人平均劳动生产率(元/人)标准差(元)甲乙160008000600400比较哪工厂的平均劳动生产率更具有代表性。解:可见,甲工厂的平均劳动生产率更具有代表性。2023/10/24作业:对某车间甲、乙两工人当日产品中各抽取10件产品进行质量检验,得如下资料:零件直径(mm)零件数(件)甲工人乙工人9.6以下9.6-9.89.8-10.010.0-10.210.2以上1233112232合计1010试比较甲、乙两工人谁生产的零件质量较稳定。组中值xf1f29.59.79.910.110.3-甲工人乙工人xf19.519.429.720.310.399.2xf29.519.419.830.320.699.60.17640.09680.00120.09720.14440.51600.21160.13520.00720.05880.23120.64402023/10/24作业:对某车间甲、乙两工人当日产品中各抽取10件产品进行质量检验,得如下资料:零件直径(mm)零件数(件)甲工人乙工人9.6以下9.6-9.89.8-10.010.0-10.210.2以上1233112232合计1010试比较甲、乙两工人谁生产的零件质量较稳定。组中值xf1f29.59.79.910.110.3-甲工人乙工人xf19.519.429.720.310.399.2xf29.519.419.830.320.699.60.17640.09680.00120.09720.14440.51600.21160.13520.00720.05880.23120.6440解:甲工人产品质量较稳定。2023/10/24例2:设有两组工人各5人,某日日产量资料如下表:甲组乙组日产量(件)

x日产量(件)x606570758025791235035试比较哪组日产量较均衡些?解:(x-70)210025025100250(X-7)2254042558所以,甲组日产量较均衡些。2023/10/24练习:有甲、乙两个不同的水稻品种都分别在5个地块上试种,有关产量资料如下:甲品种乙品种试种面积(亩)总产量(斤)试种面积(亩)总产量(斤)1.21.11.00.90.81200104511008108401.51.31.31.00.916801300117012086305.049956.05988试计算有关指标确定哪一个品种的产量具有较大的稳定性从而具有较大的推广价值。fxf亩产量

x100095011009001050-解:

1.22641.1102018820.92080.823745亩产量x112010009001208700233265.212485.24410079923.6-158840因为6.9%<16.3%,所以,甲品种具有较大的稳定性和推广价值。fxf2023/10/24复习1、众数2、标志变异指标,常用的有哪些?3、在对2008年河南省城镇居民家庭年人均消费性支出的调查中,洛阳市居民的年平均支出为9957.35元,标准差为4148.66元;信阳市居民的年平均支出为7751.53元,标准差为3366.26元.这说明信阳市居民的贫富差距较小。2023/10/24(五)是非标志的标准差1.什么是“是非标志”?在社会经济统计分析时,有时把研究对象中的全部单位划分为具有某种标志表现的单位和不具有某种标志表现的单位两组,即“是”与“非”两组。

像这样,将总体划分为“是”与“非”两类的标志,称为是非标志。2023/10/242.是非标志的成数是非标志只有两个标志表现,用成数来表示其内部结构。

设:总体中包含的单位数为N,其中具有某种标志表现的单位数为N1,不具有某种标志表现的单位数为N0。则:N=N1+N0又设:总体中具有某种标志表现的单位数占总体单位数的比重为P(成数),不具有某种标志表现的单位数占总体单位数的比重为Q。则:P+Q=1or.Q=1-P

且有:2023/10/243.是非标志的平均数和标准差为了计算的方便,将是非标志的标志值量化为“1”和“0”。次数分布为:按是否具有某种标志表现分组次数f(每组中包含单位数)1(具有某种标志表现)N10(不具有某种标志表现)N0那么,是非标志的平均数为:是非标志的标准差为:2023/10/24例1:某机械厂铸造车间生产600吨铸

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论