第4章 数据分布特征的测定_第1页
第4章 数据分布特征的测定_第2页
第4章 数据分布特征的测定_第3页
第4章 数据分布特征的测定_第4页
第4章 数据分布特征的测定_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第 4 4 章章 数据分布特征的测度数据分布特征的测度 统计 学 4.1 集中趋势的测度 4.2 离散程度的测度 4.3 偏态与峰态的测度 4.1 4.1 集中趋势的测度集中趋势的测度 一一. . 众数众数 二二. . 中位数和分位数中位数和分位数 三三. . 均值均值 四四. .众数、中位数和均值的比较众数、中位数和均值的比较 集中趋势集中趋势 (central tendency)(central tendency) 众数 (mode) 出现次数最多的变量值出现次数最多的变量值 不受极端值的影响不受极端值的影响 可能没有众数或有几个众数可能没有众数或有几个众数 众数 (不唯一性) o无众数

2、无众数 原始数据: 10 5 9 12 6 8 1 1、由单项数列求众数、由单项数列求众数 某某 车车 间间 工工 人人 日日 产产 情情 日产量(件)日产量(件)人数(人)人数(人) 1150 1260 1390 1425 1515 合计合计240 2.2.由组距数列计算由组距数列计算 首先确定次数最多的组,即众数组,然首先确定次数最多的组,即众数组,然 后,用公式计算。后,用公式计算。 dL M 21 1 0 dU M 21 2 0 下限公式:下限公式: 上限公式:上限公式: 中位数中位数 (median)(median) 排序后处于中间位置上的值 1 1、由未分组资料计算中位数、由未分组

3、资料计算中位数 件)(5.12 2)1312( M e 设有六个工人的日产量设有六个工人的日产量(件件)依次排列为依次排列为10、11、 12,13、14、15、则:、则: 中位数位次(中位数位次(n+1)2 6+123.5 (1 1)由由单项数列单项数列求中位数求中位数 2 2、由分组资料计算中位数、由分组资料计算中位数: : 例例10:某生产车间:某生产车间120名工人生产某种零件的日产名工人生产某种零件的日产 量如下表所示,计算该车间工人日产量的中位数。量如下表所示,计算该车间工人日产量的中位数。 按日产量分组(件)按日产量分组(件)工人数(人)工人数(人)累计次数(向上)累计次数(向上

4、) 2020 2222 2424 2626 3030 3232 3333 1010 1212 2525 3030 1818 1515 1010 1010 2222 4747 7777 9595 110110 120120 合计合计120120 f m m f L M e s 1 2 2.2.由组距数列求中位数,由组距数列求中位数, 下限公式:下限公式: L为中位数所在组下限为中位数所在组下限 s m1为中位数所在组以前各组的累计次数(较小制)为中位数所在组以前各组的累计次数(较小制) f m 为中位数所在组的次数为中位数所在组的次数 上限公式: f m m f U Me s 1 2 U为中位数

5、所在组上限为中位数所在组上限 为为中位数所在组以后各组的累计次数(较大制)中位数所在组以后各组的累计次数(较大制) sm 1 从某单位抽查从某单位抽查800户,取得人均收入资料如下表,户,取得人均收入资料如下表, 计算该单位人均收入的中位数。计算该单位人均收入的中位数。 人均收入(元)人均收入(元)户数(户)户数(户)较小累计较小累计 (向上)(向上) 较大累计较大累计 400-500 500-600 600-700 700-800 800-900 900-1000 1000以上以上 5 45 100 430 168 42 10 5 50 150 580 748 790 800 800 795

6、 750 650 220 52 10 合计合计800 中位数位次中位数位次f28002400,中位数组,中位数组 在在700-800这一组中。由下限公式这一组中。由下限公式 元)(14.758 100 430 150400 700 1 2 d f m Sm f L M e 由上限公式由上限公式 (元)14.758 100 430 220400 800 1 2 d f m S m f U M e 四分位数 (quartile) 1.集中趋势的测度值之一 2.排序后处于25%和75%位置上的值 四分位数 4 )1(3 4 1 n Q n Q U L 位置 位置 均值均值 (mean)(mean)

7、1. 集中趋势的最常用的测度值 2.一组数据的均衡点所在 3.易受极端值的影响 简单算术平均数简单算术平均数(simple mean)(simple mean) n x n xxx x n i i n 121 加权算术平均数加权算术平均数 (weighted mean)(weighted mean) n i i k i ii k kk f fx fff fxfxfx x 1 1 21 2211 (例题分析) o (件)67.103 30 3110 1 1 k i i k i ii f fx x f f x f xf x (权数对均值的影响权数对均值的影响)P34 o甲组:甲组: 考试成绩(考试

8、成绩(x ): 0 20 100 o 人数分布(人数分布(f ):):1 1 8 o乙组:乙组: 考试成绩(考试成绩(x): 0 20 100 o 人数分布(人数分布(f ):):8 1 1 )(82 10 810012010 分 甲 f fx x )(12 10 110012080 分 乙 f xf x 算术平均数算术平均数 (数学性质数学性质) o1.1.各变量值与均值的离差之和等于零各变量值与均值的离差之和等于零 n i i xx 1 2 min)( n i i xx 1 0)( 调和平均数 (harmonic mean) 1.1. 均值的另一种表现形式均值的另一种表现形式 f xf x

9、 M M H 调和平均数 某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据 蔬菜蔬菜 名称名称 批发价格批发价格 ( (元元) ) X X 成交额成交额( (元元) ) X X f f 成交量成交量( (公公 斤斤) ) f f 甲甲 乙乙 丙丙 1.201.20 0.500.50 0.800.80 1800018000 1250012500 64006400 1500015000 2500025000 80008000 合计合计36900369004800048000 (元) 批发价格 成交额 成交额 769. 0 48000 36900 m H 几何平均数 (geometric mea

10、n) 1. n 个变量值乘积的 n 次方根 2. 适用于对比率数据的平均 3. 主要用于计算平均增长率 n n i i n nm xxxxG 1 21 【例】一位投资者持有一种股票,1996年、 1997年、1998年和1999年收益率分别为 4.5%、2.0%、3.5%、5.4%。计算该投资者 在这四年内的平均收益率。 %84.103 %4 .105%5 .103%0 .102%5 .104 4 21 n nm xxxG 众数、中位数和均值的比较众数、中位数和均值的比较 众数、中位数和均值的关系众数、中位数和均值的关系 众数、中位数和均值的特点和应用众数、中位数和均值的特点和应用 众数众数

11、n不受极端值影响不受极端值影响 n具有不唯一性具有不唯一性 n数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用 中位数中位数 n不受极端值影响不受极端值影响 n数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用 平均数平均数 n易受极端值影响易受极端值影响 n数学性质优良数学性质优良 n数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用 分布离散程度的测度分布离散程度的测度 一、极差一、极差 二、方差和标准差二、方差和标准差 三、离散系数三、离散系数 极差 (range) 一组数据的最大值与最小值之差 离散程度的最简单测度值 方差和标准差方差和标准差 方差和标准差 (Var

12、iance and Standard deviation) o离散程度最常用的测度值 反映了各变量值与均值的平均差 异 总体方差和标准差 (Population variance and Standard deviation) N x N i i 1 2 2 )( N fM K i ii 1 2 2 )( 样本方差和标准差样本方差和标准差 (simple variance and standard deviation)(simple variance and standard deviation) 1 )( 1 2 2 n xx s n i i 1 )( 1 2 2 n fxM s k i i

13、i 样本方差 自由度(degree of freedom) 一组数据中可以自由取值的数据的个数 离散系数 离散系数 (coefficient of variation) 1. 标准差与其相应的均值之比 2.对数据相对离散程度的测度 3.消除了数据水平高低和计量单位的影响 4. 用于对不同组别数据离散程度的比较 v x s v s 某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据 企业编号企业编号 产品销售额(万元)产品销售额(万元) x1 销售利润(万元)销售利润(万元) x2 1 2 3 4 5 6 7 8 170 220 390 430 480 650 950 1000

14、8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0 )(19.309 )(25.536 1 1 万元 万元 s x )(09.23 )(5215.32 2 2 万元 万元 s x 计算分析题 1.1.某厂某厂400400名职工工资如下名职工工资如下 按月工资分组(元)按月工资分组(元)职工人数(人)职工人数(人) 450-550 550-650 650-750 750-850 850-950 60 100 140 60 40 合计合计400 根据上述资料计算该厂职工平均工资和标准差。 解: 职工人数职工人数f组中值组中值xxf 60 100 140 60 40 500

15、 600 700 800 900 30000 60000 98000 48000 36000 1944000 64000 56000 864000 1936000 4002720005440000 fxx 2 )( (元) 标准差 平均工资 62.116 400 5440000 f fxx 680 400 272000 f xf x 2 2.某县去年年粮食产量资料如下: 按单位面积产量分组 (千克公顷) 播种面积比重 3000以下 3000-3750 3750-6000 6000以上 0.05 0.35 0.40 0.20 根据上表资料计算该县粮食作物平均单位面积产量。 解: x 2625 3

16、375 4875 7125 0.05 0.35 0.4 0.2 131.25 1181.25 1950.00 1425.00 1.004687.5 f f f f x 5 .4687 20. 0712540. 0487535. 0337505. 02625 f f xx 3.某地甲、乙两个农贸市场三种主要蔬菜价格及 销售资料如下: 品种价格(元 千克) 甲销售额(万 元) 乙销售额 (万元) A B C 0.30 0.32 0.36 75.0 40.0 45.0 37.5 80.0 45.0 比较该地区哪个农贸市场蔬菜平均价格高?并说明原因。 解: 325.0 500 5.163 x m m

17、32.0 500 160 x m m 乙 甲 H H 4. .某工厂生产一批零件共某工厂生产一批零件共1010万件,为了解这批产品的万件,为了解这批产品的 质量,采取不重复抽样的方法抽取质量,采取不重复抽样的方法抽取10001000件进行检查,件进行检查, 其结果如下,根据质量标准,使用寿命其结果如下,根据质量标准,使用寿命800800小时及以小时及以 上者为合格品。计算平均合格率、标准差及标准差系上者为合格品。计算平均合格率、标准差及标准差系 数。数。 使用寿命(小时)使用寿命(小时)零件数(件)零件数(件) 700以下以下 700-800 800-900 900-1000 1000-120

18、0 1200-1400 10 60 230 450 190 60 合计合计1000 ()( 平均合格率 43.27 93. 0 2551. 0 x 2551. 093. 0193. 0p1p 93. 0 1000 60190450230 p V 5 5、甲、乙两单位工人的生产资料如下:、甲、乙两单位工人的生产资料如下: 日日 产产 量量 ( 件件 人人 甲单甲单 位工位工 人数人数 (人)(人) 乙单乙单 位总位总 产量产量 (件)(件) 1 1 120120 3030 2 2 6060 120120 合合 计计 180180 150150 (1 1)哪个单位工人的生产水平高?)哪个单位工人的生产水平高? (2 2)哪个单位工人的生产水平整齐?)哪个单位工人的生产水平整齐? 6.6.甲、乙两班同时对甲、乙两班同时对统计学统计学课程进行测试,课程进行测试, 甲班平均成绩为甲班平均成绩为7070分,标准差为分,标准差为9.09.0分;分; 乙班的成绩分组资料如下:乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲、乙两计算乙班学生的平均成绩,并比较甲、乙两 班哪个班的平均成绩更有代表性?班哪个班的平均成绩更有代

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论