统计学第四章统计指标描述与分析_第1页
统计学第四章统计指标描述与分析_第2页
统计学第四章统计指标描述与分析_第3页
统计学第四章统计指标描述与分析_第4页
统计学第四章统计指标描述与分析_第5页
已阅读5页,还剩120页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 (重点章)统计指标描述与分析,重点节:第二、三节 第一节总量指标 第二节相对指标 第三节集中趋势的统计描述 第四节 离散程度的统计描述 第五节 EXCEL的应用,绘制统计图表”任务书 (三) 一、任务题目:自选某一社会经济现象,将相关数据信息用统计图表反映出来。 二、主要内容: 学习统计分组方法和次数分布的特征; 学习统计表的制作要求和方法; 学习统计图的绘制方法和技巧; 自选某一社会经济现象,将相关数据信息用统计图表反映出来。 三、基本要求: 1.所选社会经济现象可以是工商企业的生产经营数据资料;学校 的人财物结构分布等。 2.收集资料的方法可以是实地调查、网络调查等; 3.每人用E

2、XCEL制作一张复合分组表;同时将相关数据信息绘制成圆饼图、 折线图或直方图。 4.将所作的统计图表存入一个文件夹,拷贝到自己的U盘备查。 四、成绩评定: 1评分标准。基础分:统计图表设计正确、数据真实可信。4分; 加分: 按时提交作业,独立完成。加1分。 2. 成绩占学期总成绩5%。 任务下达日期: 2012年 月 日 任务完成日期: 2012年 月 日 指导教师签字,任务书,学习内容及要求,理解变量分布三大特征及 平均指标、离散指标的意义; 熟练掌握各种平均指标的计算方法及其 相互之间的关系; 熟练掌握各种离散指标的计算方法; 掌握偏度和峰度系数的计算方法,第一节总量指标,重点:时期指标与

3、时点指标在含义和计算上的区别 带着问题学:1、总量指标有哪些种类? 2、时期指标与时点指标在含义和计算 上的区别? 一、总量指标的概念及作用 总量指标(绝对数) 反映社会经济现象总体在 一定时间、地点条件下的总规模、 或绝对水平的指标. 是认识社会经济现象的起点; 是实现宏观经济调控和企业经营管理基本指标; 是计算相对指标、平均指标及统计分析的基础 用绝对数形式表示(必须带计量单位,二、总量指标的种类,一)按反映总体的内容(标志)分为: 总体总量即总体单位总量。常用N、f 表示 (如:总人数,产品数, 企业数) 标志总量即总体各单位标志值总和。 常用X 、Xf 表示。 (如:工资总额、总成本、

4、利润总额 ) (分组或不分组,其符号和算法不同.该组指标在计算平均数时要用。如: 劳动生产率、单位产品成本等。,2)按反映的时间状况分为:(难点) 时期指标反映某社会经济现象在一段时期 发展变化的总量。 指标数值可以相加汇总 数值大小与计算期时间的长短有直接关系, 指标数值是通过连续登记取得的. (如:工业总产值、产品总成本、播种面积) 时点指标反映某社会经济现象在某一时刻(瞬间)的 状态总量 指标数值不能直接相加, 数值大小与时间间隔的长短没有直接关系, 指标数值是通过定期的一次性登记取得的. (如:期末商品库存量、在校生人数、土地面积) (该组指标在计算平均发展水平时要用。因为时期、时点指

5、标 计算平均发展水平的方法和公式不同,所以,要严格区分和 正确判断。 如:年均销售额、甲产品库存量占比重、月平均劳动生产率,时期、 时点指标的区别 (图示,富乐公司一季度甲商品销售量统计图 吨 300 200 100 0 1 2 3 月 一个月(1月份) 销售量 二个月(1_2月份) 销售量 三个月(1_3月份 )销售量,富乐公司一季度甲商品库存量统计图 吨 300 200 100 0 1 2 3 一月末(31/1这天) 库存量 二月末 (28/2这天) 库存量 三月末(31/3这天) 库存量,时间越短(长),销售量越小(大). 可见,时期指标数值大小与时期的长短密切相关(正相关关系,1月末是

6、100吨,3月末还是100吨;若3月份将库存全部提完,则3月末的库存量为0. 时间向后推移,库存量并没有随之一定增大.这说明,指标数值大小与间隔时间长短无直接关系,三)按计量单位分为: 1、实物单位(实物量指标) 自然单位: 如: 人、只、台、件。 用于离散型变量。 度量衡单位:如: kg、cm、m。 用于连续型变量 。 双重(复合)单位:如: 吨公里、千瓦/小时、 标准实物单位:同类产品,因为品种、规格、 能力、或化学成分不同,所以按某一标准 (含量、规格等)折算后的实物单位。 如: 能源(标煤); 粮食(标准吨); 电机(马力);化肥(含氮量); 皮革(面积/张)等,价值量指标(货币单位)

7、 用货币为价值尺度来衡量社会财富和劳动成果。 (具有最广泛的综合性能和概括能力。) (如:GDP、销售额、工资额等) 劳动量指标(劳动单位) 用劳动时间单位来计量。 (如 :工时、工日、人年等。) 可作为确定劳动定额、评价劳动时间利用程度、计算劳动生产率的依据。 (机械加工工业企业常用,第二节 相对指标 (重点节,重点:各种相对指标的计算方法、联系与区别 带着问题学: 1、计划指标是绝对数或相对数时,其计算方法 及区别是什么? 2、比较相对数与动态相对数的计算方法及区别 是什么? 3、强度相对数与算术平均数的区别是什么,一、相对指数的概念和作用 概念:相对指标(相对数)两个有联系的统计数据对比

8、 的比率, 用以表明各种经济现象间的发展程度、结构、强度、比例关系。 二、相对指标计量形式(两种): 无名数百分比、千分比、倍数、系数、成数等。 (如:计划完成程度、合格率) 有名数强度相对数是复名数。 (如:人口密度 人/平方公里) 作用:反映现象间的联系及各种数量对比关系; 可为某些不能直接对比的数量找到对比基础。 (例:当两规模大小不同的企业的总产值对比时,由于基数 不同,不能直接比较,可以用相对指标产值计划完成 程度作比较。,返回,相对指标的种类和计算原则 (一)计划完成程度相对指标,因为计划完成数有绝对数(平均数) ; 相对数两种形式, 所以,计算方法也分两大类. a. 计划完成数以

9、绝对数(或平均数) 的形式出现, 可直接用基本公式计算计划完成相对指标 . 例 如: 某厂本月销售额计划完成100万元, 实际完成 120万元, 则 = 120/100 = 120 % (注意: 计划是.万元, 是绝对数额.,计划完成程度相对指标,实际完成数 计划完成数,b. 计划完成数以相对数形式出现,设定上期的实际数为基数1(或100%),本期的计划数或实际数都是与这个(同一)基础进行比较的. 二月份实际增加3% 二月份计划增加2% 一月份实际数 1 二月份计划减少2% 二月份实际减少3,计划完成程度相对指标,注意: 计划增减.%, 是相对比率.,例如: 四川省旅游业2009年计划主营业务

10、收入 收入比上年增加3%, 实际增加2,计划完成程度指标,1 + 2 % 1 + 3 ,99.03,这里的1,就是上年实际完成了的主营业务 收入,2007年就是在这个基础上制定计划的,若写成,也可以表示为 2% - 3% = - 1,2% 3,就错了!,注意: 计划 增加 .% , 是相对程度.,例如: 倘若四川省旅游业2009年计划主营业务收入比上年减少3%,实际仅减少2,即比计划少降了1.03% *也可以表示为: 2% - 3% = - 1,注意: 计划 减少 .% , 也是相对程度.,补充: 计划执行进度检查,例:销售额计划全年4000万元,每季度完成1000万元. 万元 实际1季度完成

11、1050万元,(累计 1050 ) 4000 2季度完成 950万元, (累计 2000 ) 3000 3季度完成1080万元, (累计 3080 ) 2000 4季度完成1100万元. (累计 4180 ) 1000 0 1 2 3 4 季度 (计划执行进度如左图) 利用这个公式,可以检查合同的执行情况: 合同完成程度=实际完成合同数/合同数,计划完成程度,累计至本期止实际完成数 全 期 计 划 数,补充:中长期计划完成情况检查,累计法凡计划指标是按计划期内各年的总和,或是按计划全期(如5年)提出累计完成工作量时,则用此法计算。 (如:基建投资额、新增生产能力、造林面积等指标的计划完成 情况

12、检查。) 计算时,只要各年的累计和达到规定数就算完成任务了。 比如,某市“十一五期”基建投资额计划70亿元,第五年第一季度(累计)已达到了70亿元,提前三个季度完成任务,1 2 3 4 5,70,水平法计划指标是以计划期末应达到的水平下达的,检查计划完成 情况时,需用此法计算。 以固定的时距(连续12个月或4个季度),逐项(月、季)移动,其所在时段上的数值和达到了计划规定的水平,则为完成计划任务。 比如,某市“十一五”期粮食产量计划达到70万吨,结果,在第四年第二季度至第五年第一季度这一时段(连续4个季度)的产量已达70万吨,提前3个季度完成计划,1 2 3 4 5,70,x70,x70,x7

13、0,x70,x70,x70,x70,二) 结构相对指标,反映总体内部组成及内部结构的综合指标,结构相对指标,总体中各组(或部分)总量 总体总量,这里的“总体总量”可以是总体单位总量,也 可以是标志总量。如: 产品合格率、某种商品销售收入占总销售收 入的比重,2009年中国男(女)性人口占总人口的比重,51.53,48.47,某市国内生产总值构成及从业人员构成(国内生产总值、从业人员总数=100,国民经济结构统计 国民经济结构是指一国国民经济中各个领域、各个部门、各个地区和各种经济成份之间的对比关系和结合状况。它包括部门结构、产业结构、地区结构和所有制结构等,三)比例相对指标,比例相对指标,总体

14、中某一 总体中另一 部分数值 部分数值,反映总体内部的比例关系,可以是多个构成部分连比。 如:2009年中国男女性别比例 106.3100 某地区农轻重比例 20 :50 :30,分子分母可以换位. 例: 男/女 or 女/男 106.3:100 100:106.3,2009年中国人口性别比例,106.3,100,四) 比较相对指标,同类现象同时不同空间横向对比、可以用作竞赛、评比、找差距等. 可以是绝对数、相对数、平均数的对比,但计算口径方法应一致。 甲地区(单位)数值 乙地区(单位)数值,比较相对指标,分子分母可以换位. 例: 甲厂产量/乙厂产量 or 乙厂产量/甲厂产量 480 / 38

15、0 380 / 480,五)动态相对指标 (发展速度,同类现象同空间不同时间纵向对比,可说明 现象发展变化的速度,程度和趋势,动态相对指标,报告期指标数值 基 期 指 标 数 值,基期:可以是前一期,(称为环比); 可以是最初期,(称为定基对比,动态相对指标可以利用 总量指标或平均指标去计算,基期:是前一期,(称为环比); _绿线 是最初期,(称为定基对比)._蓝线,六)强度相对指标 两个性质不同但有联系的总量指标之间对比.用以反映 强度,密度,普遍程度,某种现象总量指标数值 另一不同性质的相关现象总量指标数值,强度相对指标,分子分母可以换位; 计量单位是复名数,如:人口密度、商业网点密度;

16、人均GDP、 人均钢产量;资金利润率;人口出生率,非劳,非物,非工,非冶,钢铁职工,钢铁产量,总人口与钢产量相比,是强度相对数,钢铁职工与钢产量相比,是算术平均数,强度相对数与算术平均数的区别 (以人均钢产量、钢铁工人劳动生产率为例,第三节 集中趋势的统计描述,重点:组距式数列计算平均指标的方法 带着问题学: 1、单项式数列与组距式数列计算加权平均数的方法 及区别是什么? 2、算术平均数与调和平均数的区别是什么? 3、位置平均数有哪两种?组距式数列计算众数和中位数的方 法是什么? 4、算术平均数、众数、中位数之间的数量关系有哪几种,集中趋势亦称为趋中性,是指变量分布以某一数值 为中心的倾向。作

17、为中心的数值就称为中心值,它反映 变量分布中心点的位置所在。 变量分布的集中趋势要用平均指标来反映。平均指标 是将变量的各变量值差异抽象化、以反映变量值一般水平 或平均水平的指标,也就是反映变量分布中心值或代表值 的指标。 平均指标的具体表现称为平均数,平均数因计算方法 不同可分为数值平均数和位置平均数两类,第三节 集中趋势的统计描述(重点节) 重点:数值平均数,是同质总体某标志值的一般水平 . (与强度相对数有别_两总体,性质不同,总量比总量) 反映总体各单位变量分布的集中趋势. (与变异指标有别 _ 反映离中趋势) (与序时平均数有别_用时间数列计算) 对某类现象作综合分析和评价时,若两者

18、的总量 差异过大,则可用平均数去对比。如: 甲企业总产值(工资总额)800000元,职工1000人; 乙企业总产值(工资总额)8000元,职工8人。 总产值(工资总额)比较,差异太大,(800000 8000), 甲乙 但劳动生产率(平均工资)比较, 反超。 (800 1000). 甲乙 (新就业观:宁做鸡头,不做凤尾,返回,作用,1、反映总体各单位变量分布的一般水平。 (比如:“农民家庭收入”高低) 2、比较同类现象在不同单位、地区、及总体各部分的差别。 (比如:用“劳动生产率”或“亩产量”来比较评价不同工业 企业或乡村的生产情况。) 3、分析现象之间的相互依存关系。 (比如:商品销售量与商

19、品价格之间的关系; 施肥量与亩产量之间的关系找到“拐点”。),平均指标按其计算方法不同可分为: 数值平均数和位置平均数两类。 数值平均数:算术平均数、几何平均数。 位置平均数:中位数、众数。 数值平均数 (重点) 一、 算术平均数(亦称均值)(重点掌握) 算术平均数是变量的所有取值的总和 除以变量个数的结果,例:平均人数=总人数 / 企业数 劳动生产率=产品产量 / 职工人数 平均工资=工资总额 / 职工人数 单位产品成本=总成本 / 总产量 单耗=原材料消耗总量 / 产品产量,返回,一)简单算术平均数_标志未分组时,例 : 某企业5名工人的产量,计算平均产量,2、加权算术平均数_标志已分组,

20、数量标志已分组 , 就形成了,单项式 组距式,单项式变量数列(表3-1) 组距式变量数列(表3-3,各组单位数(权数)所占比重的大小,直接影响平均数的大小。 将各组人数排列顺序互换,则分布频率变化,平均数也发生相应变化,10 8 6 4 2,300 310 320 330 340 350 出口额,人数,权数(次数 . 一般多指总体单位数) 权衡轻重(影响平均数的大小)权数的两种形式绝对数(次数)常用 f 表示; 相对数(比重)常用 表示.计算公式如下,这种写法在平均指标指数分析时有独特的意义作用,两种算法结果相同,都是76.4分,组距式分组 各组标志是一个数值区间 表4-2 某班学生“统计学原

21、理”成绩表,*各组标志值X以该组的组中值为代表值,根据组距数列计算加权算术平均数的方法的说明,假定条件:组内均匀分布或对称分布,组间分布可以不等。 X用各组的组中值(代表组平均水平) 开口组的组距以邻组组距为依据,从而计算确定出本 组组中值。所以,计算的结果是一个近似值,补充: 算术平均数的影响因素,算术平均数除受标志值出现次数(比重)的影响外(如前例图示), 还受极端值的影响. 图示: x,300 250 200 150 100 50 0,1 2 3 4 5 6 7 8 9 10 f,即俗话所说的“一颗老鼠屎打坏一锅汤,出现一个最大值,平均数会上移,一般正常分布下的平均数,出现一个最小值,平

22、均数会下移,补充: 先 进 平 均 数 (计算各种定额时选用,本章作业第9题要用,先进平均数 (劳动定额,一般平均数,先进平均数 (消耗定额,最大数,最小数,3.算术平均数的数学性质 1) 各变量值与算术平均数的离差之和等于零,即: (对于简单算术平均数) (对于加权算术平均数) 2) 各变量值与算术平均数的离差平方之和为最小 值,即: 只有当 时,等号成立,4.算术平均数的优缺点 算术平均数具有以下几个优点:一是可以利用算术平均 数来推算总体标志总量,因为算术平均数与变量值个数之乘积 等于总体标志总量;二是由算术平均数的两个数学性质可知, 算术平均数在数理上具有无偏性与有效性(方差最小性)的

23、特 点,这使得算术平均数在统计推断中得到了极为广泛的应用。 三是算术平均数具有良好的代数运算功能,即分组算术平均数 的算术平均数等于总体算术平均数。 算术平均数也有其局限性,主要表现在以下两个方面: 一是算术平均数易受特殊值(特大或特小值)的影响,当变量 存在少数几个甚至一个特别大或特别小的变量值时,就会导致 算术平均数迅速增大或迅速变小,从而影响对变量值一般水平 的代表性;二是根据组距数列计算算术平均数时,由于组中值 具有假定性而使得计算结果只是一个近似值,尤其是当组距数 列存在开口组时,算术平均数的准确性会更差,二)调和平均数 调和平均数_标志值倒数的算术 平均数的倒数。故亦称倒数平均数。

24、 根据资料是否分组,而分为简单 或加权调和平均数.加权调和平均数 使用特定形式的权数( m = xf,二)调和平均数 1.简单调和平均数 当各组的标志总量相等时,所计算的调和平均数称为简单调和平均数。设总体分为k个组,每个组的标志总量都为m,则总体标志总量为km。现仍以x表示各组变量值,以H表示调和平均数,则简单调和平均数的计算公式为,例4.17题:某农贸市场某种蔬菜早市、午市、晚市价格不同,计算该种蔬菜的平均价格,2.加权调和平均数,当各组的标志总量不相等时,所计算的调 和平均数要以各组的标志总量为权数,其结果 即为加权调和平均数。若以 表示各组标志总 量( m=xf ) ,则加权调和平均数

25、的计算公式为,P95 例4.18表4-3: 不知道各商品的销售量f的值,但是,可以间接求出,补充:用相对数或平均数计算平均数(用加权算术平均数求解)例: 某零售公司20家分店销售计划完成情况,补充:用相对数或平均数计算平均数(用加权调和平均数求解)例: 某零售公司20家分店销售计划完成情况,经验(关键要领): 若要求平均工资、平均单位成本、平均计划完 成程度等指标时,所给资料与计算方法的关系为: 当已知权数f(分母)的直接数据资料,而无 标志总量时,采用算术平均数. (比如:已知人数, 产品数, 企业数、计划数) 当缺乏权数f(分母)的直接数据资料,而有 标志总量时,采用调和平均数。 (比如:

26、已知工资总额,成本总额,利润额、实际数,算术(调和)平均数一览表,三) 几何平均数 几何平均数通常用在总量等于各分 量乘积的情形。比如,求某些平均比率, 平均速度等,例: 某流水生产线前后衔接的五个车间(工序)产品的合格率分别为96%、94%、95%、95% 、 96%,求整个流水线生产产品平均合格率(全厂平均合格率),五个车间(工序)的产品平均合格品率为95.2%. 思考:为什么要用几何平均数计算,例: 某企业10年销售收入的平均发展速度,又例:某金融机够以复利方式计息。近12年来的 年利率有4年为3%、 2年为5% 、 2年为8%、 3年为10%、1年为15%,则12年的平均年利率,位置平

27、均数 四、 中位数(Median) _是根据变量值的位置来确定的平均数。将变量值按大小顺序排序,处于中间位置的变量值(或数据)即中位数,用 表示。由于中位数是位置代表值,所以不会受极端值的影响,具有较高的稳健性。 (下图中,斜线表示总体单位(组)的累计数; 横线表示某现象按标志值的大小排序。,50 ,返回,sm,50,me,me,标志值,累计次数,中位数位置的确定,1)根据未分组的原始数据确定中位数 数据是基数项,原始数据: 33 28 38 35 50 排 序: 28 33 35 38 50 位 置: 1 2 3 4 5,数据是偶数项,原始数据: 79 72 66 87 95 100 排 序

28、: 66 72 79 87 95 100 位 置: 1 2 3 4 5 6,其中: L: 为中位数组的下限; U: 为中位数组的下限 f :为总次数; Sm -1: 为中位数组前一组的向上累计次数; Sm+1: 为中位数组前一组的向下累计次数; fm: 为中位数组的次数; i: 为中位数组的组距,该公式假定中位数组的频数在该组内均匀分布,根据变量分布数列确定中位数 (组距数列确定中位数,涉及“定组”和“定值”两个步骤.即首先确定出中位数的位置在哪一组;再确定(用公式计算)中位数的值具体是多少。 “定组”所使用的次数是累计次数. 方法: 计算向上(下)累计次数; 确定中位数的位置: 总体单位数刚

29、好包含f /2 的所在组即是中位数组 ; 确定中位数(用公式,累计次数,在单项式数列中确定中位数: 例4.21,确定中位数的位置: 累计总体单位数刚好包含f /2 的所在组 (即中位数组) 30/2=15 确定中位数: 对应的那个(唯一的)标志值就是中位数。 me =800,组距式数列计算中位数 例表4.6 企业数和职工人数表 (累计数,确定中位数的位置: 总体单位数刚好包 含f /2 的所在组 (即中位数组) 550/2=275 计算中位数: 中位数组对应的是 一个数据区间,中 位数需要通过公式 计算才能确定,中位数具有不受极端变量值的影响的特点, 比算术平均数稳健,3、 众数(Mode,众

30、数是指分组后,总体中出现次数最多或频率最大的变量值(数据),用mo表示。 众数也是一种位置平均数,且也不受极端值的影响。 变量数列求众数,也涉及“定组”和“定值”两个步骤。 单项式数列计算众数时,众数组对应的(唯一的) 标志值就是众数。 组距数列计算众数时,则需要通过公式才能确定。 即首先确定出众数的位置在哪一组,再确定众数的值具 体是多少。 (用公式计算) “定组”所使用的次数是本组次数,众数的特点: 集中趋势的参考值之一 出现次数最多(或频率最大)的变量值 不受极端值的影响 可能没有众数或有几个众数,众数(众数可能不存在或不唯一,无众数原始数据: 10 5 9 12 6 8,一个众数原始数

31、据: 6 8 11 12 8 8,多个众数原始数据: 6 28 28 32 46 46 46 50,等距数列计算众数先确定众数所在组,众数的值与相邻两组频数的分布有关,假定 众数组的次数在众数组内是均匀分布的。 相邻两组的次数相等时,众数组的组中值即为众数。 相邻两组的次数不相等时,众数计算公式为,其中: L: 是众数所在组的下限; 1: 是众数所在组次数与前一组的次数差; 2: 是众数所在组后一组的次数; i: 是众数组的组距,根据变量分布数列确定众数 (组距数列确定众数,涉及“定组”和“定值”两个步骤.即首先确定出众数的位置在哪一组;再确定(用公式计算)众数的值具体是多少。 “定组”所使用

32、的次数是本组次数,本组次数,在单项式数列中确定众数: 例表4.5,确定众数组的位置: 总体单位数(次数、 频数)最多(即值 最大)的组即为 众数组。 “8”所在组 确定众数: 对应的那个(唯一的)标志值就是众数。 m0 =800,组距式数列计算众数 例表4.6 某企业数和职工人数表,确定众数组的位置: 本组总体单位数(次数、 频数)最多(即值 最大)的组即为 众数组 “140”所在组 计算众数: 众数组对应的是一个数据区间,众数需要通过公式计算才能确定,位置平均数概念与计算方法小结,返回,三)算术平均数与中位数、众数的关系: 对称钟形分布情形下: 非对称左偏分布情形下: 非对称右偏分布情形下,

33、众数、中位数和平均数的关系图 (人像投影) 总体分布:请一名女生做正、侧位头像的投影。飘逸的长发飘向左,即为左偏态;长发飘向右,即为右偏态。平均数( )形若蝴蝶结,附着于发稍。 中位数始终位于中间,平均数、众数位于两端。 (数轴上的数,位置越靠右,值越大。,x,x,x,左偏态分布,右偏态分布,正态分布,x,补充:分位数 分位数是将变量的数值按大小顺序排列并等分为若干部分后,处于等分点位置的数值。常用的分位数有四分位数、十分位数和百分位数,他们分别是将数值序列4等分、10等分和100等分的3个点、9个点和99个点上的数值。其中四分位数第2点的数值、十分位数第5个点的数值和百分位数第50个点的数值

34、,就是中位数。所以,中位数就是一个特殊的分位数。 以四分位数为例,设 , 和 分别表示第一个、 第二个和第三个四分位数,则他们的位置分别为: , 和 ,根据位置即可确定各个四分位数,四分位数 (位置的确定,原始数据,分组数据,数值型数据的四分位数 (9个数据的算例,例】:9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9,数值型数据的四分位数 (10个数据的算例,例】:10个家庭的人均月收入

35、数据 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 10,第四节 离散程度的描述 (重点节,重点:标准差和离散系数的计算方法与适用范围 带着问题学: 1、离散程度指标的意义是什么?它与平均指标的作用有何 区别? 2、当两个总体平均水平相同时,要反映其离散程度差异, 应该选用什么离散指标指标进行对比? 3、当两个总体平均水平不同时,要反映其离散程度差异, 应该选用什么离散指标指标进行对比,第四节 离散程度的描述 重点:标准差和离散系数 离中趋势和离散指标,离中趋势即变量分布中各变量值背离中心值(平

36、均数) 的倾向。 离散指标有:全距、平均差、标准差、离散系数等。 离散指标作用: 1. 变异指标是衡量平均指标代表性的尺度。 2. 变异指标说明现象变动的均衡性、稳定性程度。 变异指标数值越大,平均数代表性越小,稳定性越差; 变异指标数值越小,平均数代表性越大,稳定性越好,返回,离中趋势(离散程度)离散指标,例如:某地的两个轴承厂生产直径为172毫米的轴承,各抽取5件产品 检验,其结果如下: 甲:171,172,172,172,173(毫米) 乙:220,190,170,150,130(毫米) 计算结果, 两厂产品的平均数相等(172毫米), 但平均数(172)的代表性甲组比乙组好。 (图示如

37、下:,Why ,Why ,换 (多)个角度观察、分析,两个轴承厂的产品平均直径一样,产品质量都符合要求, 但产品直径大小的差异确存在区别,说明两者生产的稳定性 差别很大。如果只从平均数观察,是不能全面反映其真实情 况的。所以,通常需要将平均水平与变异程度结合起来分析,172,直径差距,乙厂,甲厂,一、 极差,又名全距,是指所研究数据中的最大值与最小值之差。极差表示数据的变动范围,用R表示,未分组数据: 组距分布数列,补充: 平均差(Average Deviation) (变量值与平均数的离差绝对值的平均数,例:某企业工人日产量分组表 平均差计算表,二、方差(Variance)和标准差(S.D)

38、 测度标志变异最重要,最常用的指标。 标准差方差的平方根 即:变量值与平均数的离差平方平均数的平方根,例: 某企业工人日产量分组表 标准差计算表,例:平均水平相同的两个数列对比,只需用标准差即可判断。 图例 (形如蓄水池,A建筑队用人工挖土方, 平均劳动生产率为20M/人, 标准差为1M.,B建筑公司亦用人工挖土方, 平均劳动生产率为20M/人, 标准差为2M. 20,返回,三、离散系数 (变异系数)(重点,例:一群牛的平均体重是180公斤,标准差是6公斤;一群兔 的平均体重是3公斤,标准差是0.5公斤,能不能说兔的平均 体重的代表性高些(通俗地说,个头均匀些)?为什么,不同的对比,不同的结论

39、,6 0.5; 16.67% 3.33,结论: 全距、平均差、方差和标准差有(相同的)计量单位,是标志变异的绝对指标。 变异指标的大小不仅取决于统计数据的差异程度,还取决于这些统计数据一般水平的高低。因而,对于平均水平不同的数列,或计量单位不同的数列,都不能直接用全距、平均差、方差和标准差来比较平均数代表性的大小。只能用相对形式离散系数进行比较。 (图示如下:,例:平均水平不同的两个数列对比,需用离散系数。 图例 (形如蓄水池,甲建筑队用人工挖土方, 平均劳动生产率为10M/人, 标准差为1M. 10,乙建筑公司用机械挖土方, 平均劳动生产率为100M/人, 标准差为2M. 100,V甲=1/

40、10=0.1 V甲v乙 平均数代表性弱, 稳定性,均衡性差,V乙=2/100=0.02 v乙 V甲 平均数代表性强, 稳定性,均衡性高,返回,两类不同性质的产品进行对比分析,长虹公司3月份生产的彩电 双马集团3月份生产的的水泥 标准差 4(台) 标准差 4 (袋,两类不同性质的产品,无直接可比性。故,需用离散系数进行对比。 (消除质的差异,变异系数包括,偏度的概念首先由统计学家皮尔逊(Pearson)于1895年提出,是对变量分布对称性的测度,是指变量分布偏斜的方向及其程度。 偏度的测定是通过计算偏度系数来实现的,通常用 来表示,补充一: 偏度系数,总体单位分布形状示意图(偏度,峰度的概念首先

41、由统计学家皮尔逊于1905年提出,是对变量分布扁平性或尖陡性的测度,通常是指钟型分布的顶峰与标准正态分布相比偏扁平或偏尖陡的程度。它通常分为三种情况:标准正态峰度、尖顶峰度和平顶峰度。 如果变量分布的频数比较集中于众数附近,分布曲线比较尖陡,使分布曲线的顶部较标准正态曲线更为突起,则变量分布的峰度属于尖顶峰度;如果变量分布各组的频数比较接近,分布曲线比较扁平,使分布曲线的顶部低于标准正态曲线,则变量分布的峰度属于平顶峰度。 峰度的测定是通过计算峰度系来实现的,通常用K来表示。峰度系数的计算主要采用动差法,是4阶中心动差与标准差4次方 相比的结果,即: 峰度系数的标准值为3。当3时,变量分布的峰度为标准正态峰度;当3时,变量分布的峰度为尖顶峰度,补充二: 峰度系数,总体单位分布形状示意图(峰度,计算和应用平均指标应注意的问题,1、应用平均指标的基本原则 总体同质性 2、平均指标与统计分组相结合 组平均与总平均相结合 3、平均指标与变异指标结合 集中与离中趋势结合,返回,第五节 EXCEL的应用,1.描述集中趋势: 算术平均数: AVERAGE 调和平均数: HARMEAN 中位数: MEDIAN 众数: MODE 几何平均数: GEOMEAN 2.描述变异特征:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论