




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 分布数量特征的统计描述n主要内容:主要内容:l第一节第一节 分布的平均水平、集中趋势和位置的度量分布的平均水平、集中趋势和位置的度量l第二节第二节 分布离散程度的度量分布离散程度的度量l第三节第三节 分布的偏度和峰度分布的偏度和峰度念奴娇念奴娇 昆仑昆仑而今我谓昆仑:而今我谓昆仑:不要这高,不要这高,不要这多雪。不要这多雪。 安得倚天抽宝剑,安得倚天抽宝剑,把汝裁为三截?把汝裁为三截? 一截遗欧,一截遗欧,一截赠美,一截赠美,一截还东国。一截还东国。 太平世界,太平世界,环球同此凉热环球同此凉热! ! 2 第三章第一节 第三章第一节现象分布数量特征的统计描述 平均水平、平均水平、集中趋
2、势集中趋势 离散程度离散程度分布的形状分布的形状平均数平均数中位数中位数众数众数极差极差四分位差四分位差方差方差标准差标准差变异系数变异系数峰度峰度偏度偏度第一节 分布的平均水平、集中趋势和位置的度量n一、统计平均数的含义与作用n(一)统计平均数的含义l反映分布的平均水平的指标。l将总体各单位标志值的差异抽象化,反映总体在具体条件下各单位标志值达到的一般水平。n(二)统计平均数的作用l反映总体各单位变量分布的一般水平和集中趋势。 例如:居民人均可支配收入例如:居民人均可支配收入l比较同类现象在不同单位的发展水平。l比较同类现象在不同时期的发展变化趋势或规律。l例如:研究一个地区居民消费水平的变
3、动情况例如:研究一个地区居民消费水平的变动情况l分析现象之间的依存关系。 第三章第一节第一节 分布的平均水平、集中趋势和位置的度量n(三)统计平均指标的基本分类l数值平均数:u以统计数列的所有各项数据来计算平均数,用以反映统计数列的所有各项数值的平均水平。u这类平均数的特点是,统计数列中任何一项数据的变动,或大或小,都会在一定程度上影响到数值平均数的计算结果。u算术平均数、调和平均数、几何平均数、幂平均数l位置平均数:u是根据标志值的位置来确定的。u常用的位置平均数有众数和中位数两种。 第三章第一节第一节 分布的平均水平、集中趋势和位置的度量n二、数值平均数n(一)算术平均数l表明总体单位标志
4、值的平均水平。l算术平均数=总体标志总量/总体单位数u1.简单算术平均数:简单算术平均数主要用于未分组资料,用总体各单位标志值简单加总得到的标志总量除以单位总量而得。 (3.2) 第三章第一节_121NiNixxxxxNN第一节 分布的平均水平、集中趋势和位置的度量2.加权算术平均数:加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。 分组后的数据: 相应的频数为: 则加权算术平均数为: 第三章第一节_11221121NiiNNiNNiix fx fx fxfxffff12,Nxxx12,Nfff计算简单算术平均数和加权算术平均数。l【例3-1】 搜集2009年12月日60只股票个
5、股交易金额(百万元)数据,并对个股交易的变量值从小到大排序,形成如下数列: 28 31 32 34 35 37 39 50 51 53 55 56 57 59 60 61 64 69 70 71 74 80 81 84 85 87 88 89 90 92 94 94 100 101 102 103 106 107 108 110 112 113 115 127 150 151 154 156 166 170 182 206 214 221 235 253 256 277 300 302 第二章第三节960只股票个股交易金额分布表 (单位:百万元) 第二章第三节10按交易金额分组按交易金额分组(
6、x(xi i) ) 频数频数( (f fi i) )频率频率( (f fi i/ /f fi i) )5050以下以下 7 70.116 70.116 7501005010025250.416 60.416 610015010015012120.200 00.200 01502001502007 70.116 70.116 7200250 200250 4 40.066 70.066 7250300 250300 3 30.050 00.050 0300300以上以上 2 20.033 30.033 3合计合计60601.000 01.000 0【例3-1】根据第二章例2-1数据资料,计算简单
7、算术平均数和加权算术平均数。解:计算简单算术平均数x=28+31+32+30260=112.45(百万元) 计算加权算术平均数:依据表2-3的分组资料,用各组频数做权数计算:X=257+7525+12512+1757+2254+2753+32527+25+12+7+4+3+2 =7150/60 =119.17(百万元) 或者=2511.67%+7541.67%+12520%+17511.67%+2256.67%+2755%+3253.33%100% =119.17(百万元) 11第一节 分布的平均水平、集中趋势和位置的度量n计算加权算术平均数时需注意的问题:权数的意义和作用。 我们之所以把各组
8、的次数称为权数,因为各组次数的大小所对应的标志值对平均数的影响具有权衡轻重的作用。次数大的标志值对平均数的影响大。注意权数的选择。12第一节 分布的平均水平、集中趋势和位置的度量【例3-2】某公司所属15个企业资金利润率分组资料如表3-1,要求计算该公司15个企业的平均利润率。 表表3-13-1某公司所属某公司所属1515个企业资金利润率资料个企业资金利润率资料资金利润率xi 企业数 平均占用资金 fi 利润总额xifi 12 6 50 6 15 6 80 12 24 3 150 36 合计 15 280 54平均资金利润率=5012%+8015%+15024%/(50+80+150) =54
9、/280=19.3% 第三章第一节第一节 分布的平均水平、集中趋势和位置的度量u3.3.是非标志的平均数:是非标志的平均数:用p表示具有“是”的属性的单位数占总体单位数的比重,用q表示具有“非”的属性的单位数占总体单位数的比重。以1作为“是”的单位的标志值,以0作为“非”的单位的标志值,把用文字表示的品质标志转化为数量标志。按加权算术平均数公式,得到是非标志的平均数: (3.5) P也称为总体中具有某种属性的单位成数。 第三章第一节_1110NiiiNiix fpqxppqf第一节 分布的平均水平、集中趋势和位置的度量【例3-3】某市有126万人口,其中男性人口64.26万,女性人口61.74
10、万,求该城市人口的男性平均成数。 解:解: 第三章第一节_64.2651%126xp第一节 分布的平均水平、集中趋势和位置的度量u4.4.算术平均数的数学性质:算术平均数的数学性质:1 1)算术平均数与标志值个数的乘积等于各标志值的总和)算术平均数与标志值个数的乘积等于各标志值的总和 简单算术平均数:简单算术平均数: 加权算术平均数:加权算术平均数: 第三章第一节_1NiiN xx_11NNiiiiif xx f第一节 分布的平均水平、集中趋势和位置的度量2 2)各个标志值与算术平均数离差之和等于零。)各个标志值与算术平均数离差之和等于零。 简单算术平均数:简单算术平均数: 加权算术平均数:加
11、权算术平均数:0)(1iNiixxf01niixx 第三章第一节第一节 分布的平均水平、集中趋势和位置的度量3 3)各标志值与算术平均数离差的平方和为最小值)各标志值与算术平均数离差的平方和为最小值。 设设x x0 0为任意值,为任意值,x x0 0 x x时,时,201220_0_2_120_20_11202)(xxNxxxxxxxxxxxxxxxxxxxxniiiiNiiiNiniiniiniiniixxxxxxxxN121212020min0 第三章第一节第一节 分布的平均水平、集中趋势和位置的度量n(二)调和平均数n调和平均数也称倒数平均数。l简单调和平均数:各个标志值倒数的 算术平均
12、数的倒数。l简单调和平均数的应用场合是各标志值对应的标志总量为简单调和平均数的应用场合是各标志值对应的标志总量为1 1个单位或个单位或相等。当各标志值对应的标志总量不为相等。当各标志值对应的标志总量不为1 1个单位或不相等,则用加权个单位或不相等,则用加权调和平均数调和平均数。 第三章第一节12111111NNiiNHxxxxN第一节 分布的平均水平、集中趋势和位置的度量n(二)调和平均数n调和平均数也称倒数平均数。l加权调和平均数 第三章第一节12112121NiNiNNiNiimmmmHmmmmxxxx第一节 分布的平均水平、集中趋势和位置的度量n例3-4 某企业工人的月工资资料如下,试计
13、算其平均工资。21工资等级工资等级月工资(元)月工资(元)x xi i工资总额(元)工资总额(元)mmi i工人数工人数f fi i=m=mi i/x/xi i1600300005028004000050310005000050412004800040516003200020合计200000210第一节 分布的平均水平、集中趋势和位置的度量n例3-4 某企业工人的月工资资料如下,试计算其平均工资。22300004000032000952.38()3000040000320006008001600H元第一节 分布的平均水平、集中趋势和位置的度量n(三)几何平均数:是N项标志值的连乘积的N次方根,
14、主要用于当观察的现象之间存在连成积关系时,计算数据的平均变化率。l简单几何平均数:l加权几何平均数: 第三章第一节112NNNiGx xxx121112NNiiNiiiffffffNiGxxxx第一节 分布的平均水平、集中趋势和位置的度量l例3-5 某产品需经过三个车间加工,已知第一个车间加工合格率为95%,第二个车间加工合格率为90%,第三个车间加工合格率为98%,求三个车间平均加工合格率。 第三章第一节331230.95 0.9 0.9894.28%Gx xx第一节 分布的平均水平、集中趋势和位置的度量n(四)幂平均数l设变量x1,x2,x3,xn,求各变量k次方的和: (3.13) l
15、称为k阶幂平均数,它是以变量x的k次方的算术平均数的k次方根来计算的。kNikikkkNikikNkkNxxxNxxxx11121)()(. 第三章第一节_kx 1)当k=1时,幂平均数 为算术平均数。 2)当k=-1时,幂平均数 为调和平均数。 3)当k-0时, 为几何平均数。 4)26111_1kxxxxNN1111_11kxxxxNN1_1200limlimkkNkNkkxxxxxN1212111112()()NNkkkkiixxkkNN当时 ,第一节 分布的平均水平、集中趋势和位置的度量n三、众数、中位数和其他分位数 n(一)众数l从分布的角度看,众数是具有明显集中趋势的数值。在分配曲
16、线图上,众数就是曲线的最高峰所对应的标志值。l1.由单项式分配数列确定众数l【例3-6】根据例2-1数据确定众数。u解:例2-1的60个数据中,仅94这个数据出现了两次,其余各数据都只出现一次,所以众数为94。 第三章第一节第一节 分布的平均水平、集中趋势和位置的度量l2.由组距式分配数列确定众数:l应首先确定众数组,然后再通过一定的公式计算众数的近似值。 代表众数组下限; 代表众数组上限; 代表众数组次数; 代表众数组前一组次数; 代表众数组后一组次数; 代表众数组组距。0000000000000000)()()()(11101110MMMMMMMMMMMMMMMMdffffffUMdfff
17、fffLM上限公式:下限公式: 第三章第一节0ML0MU0Mf01Mf01Mf0Md第一节 分布的平均水平、集中趋势和位置的度量l2.由组距式分配数列确定众数: 在等距分组条件下,众数组就是次数最多的那一组; 在不等距分组的条件下,众数组则是频数密度或频率 密度最高的那一组。 第三章第一节第一节 分布的平均水平、集中趋势和位置的度量l2.由组距式分配数列确定众数u【例3-7】根据例2-1数据的分组资料,计算60只股票成交金额的众数。u解:首先确定众数组,由表2-3分组资料可知,众数组是50100。用下限/上限公式计算:M0= 79.03 0000000000000000)()()()(1110
18、1110MMMMMMMMMMMMMMMMdffffffUMdffffffLM上限公式:下限公式: 第三章第一节计算60只股票交易金额的众数60只股票个股交易金额分布表 (单位:百万元) 第二章第三节31按交易金额分组按交易金额分组(x(xi i) ) 频数频数( (f fi i) )频率频率( (f fi i/ /f fi i) )5050以下以下 7 70.116 70.116 7501005010025250.416 60.416 610015010015012120.200 00.200 01502001502007 70.116 70.116 7200250 200250 4 40.0
19、66 70.066 7250300 250300 3 30.050 00.050 0300300以上以上 2 20.033 30.033 3合计合计60601.000 01.000 0第一节 分布的平均水平、集中趋势和位置的度量u【例3-8】某村农户收入资料如表3-3所示,计算农户年收入众数。u解:表3-3资料是不等距分组,各组户数多少受到组距大小的影响,所以,应根据消除了组距影响的频数密度来确定众数组。表3-3中数据显示,频数密度最大的值是0.019,对应的组是年收入4 0005 000,所以这一组就是众数组。 表3-3农户年收入众数计算表 农户年均收入(元) 户数(f) 频数密度 4 00
20、0以下 17 0.017 4 0005 000 19 0.019 5 0007 000 35 0.017 5 7 00010 000 15 0.005 10 000以上 4 0.001 3 合计 90 用下限用下限/ /上限公式计算:上限公式计算:M M0 0=4571.43 =4571.43 元元 第三章第一节第一节 分布的平均水平、集中趋势和位置的度量n(二)中位数l中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点的那个单位的标志值。l1.由未分组资料确定中位数:u先将总体各单位的标志值按照大小顺序排列,然后确定中位数的位置,处于中位数位置的标志值就是中位数。u当总体单位数n为
21、奇数时:中位数位置=(N+1)/2,则处于中间位置的标志值就是中位数。u当总体单位数N为偶数时,中位数是处于中间位置的两个单位标志值的算术平均数。 第三章第一节第一节 分布的平均水平、集中趋势和位置的度量l2.由单项式分组资料确定中位数:u单项式分组已经将资料的标志值序列化,这时总体单位数N=f,确定中位数位置的方法要通过累计次数计算。l3.由组距式分组资料确定中位数:eeeeeeMMeMMeMMeMMdfSfUMdfSfLM11e22上限公式:下限公式: 第三章第一节计算60只股票交易金额的中位数60只股票个股交易金额分布表 (单位:百万元) 第二章第三节35按交易金额分组按交易金额分组(x
22、(xi i) ) 频数频数( (f fi i) )频率频率( (f fi i/ /f fi i) )5050以下以下 7 70.116 70.116 7501005010025250.416 60.416 610015010015012120.200 00.200 01502001502007 70.116 70.116 7200250 200250 4 40.066 70.066 7250300 250300 3 30.050 00.050 0300300以上以上 2 20.033 30.033 3合计合计60601.000 01.000 0第一节 分布的平均水平、集中趋势和位置的度量l2.由单项式分组资料确定中位数:【例3-10】某村居民户按子女数分组资料如表3-4所示,求家庭子女数的中位数。表3-4 某村居民户按子女数分组资料 第三章第一节子女数01234合计家庭户5012215530618651累计家庭户50172327633651第一节 分布的平均水平、集中趋势和位置的度量n(三)其他分位数l中位数: “1/2分位数”或“二分位数”l四分数位数:找出数列中的三个数值或三个点,将总体单位分为四个相等的部分,记为Q1,Q2,Q
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 协议书三 保护铁驭
- 校讯通协议书
- 互联网十大营销方案
- 圣诞节晚会策划活动方案
- 虎年活动方案策划幼儿园
- 混凝土太空城施工方案
- 员工疾病免责协议书范本
- 2025-2030互联网+背景下辣味休闲食品电商渠道发展策略研究报告
- 2025-2030乳品机械自动化升级与智能制造趋势研究报告
- 2025-2030中国钢铁行业发展趋势分析与未来投资战略咨询研究报告
- 培养孩子阅读习惯模板
- 金工深度研究-SAM:提升AI量化模型的泛化性能-华泰证券
- 玻璃纤维增强塑料在船舶制造中的应用
- 教科版小学三年级上册科学实验报告
- 星巴克运营管理手册
- 桨板运动行业分析
- 《水的组成》说课课件
- 人教版高中物理必修一全套课件【精品】
- 非婚生育证明模板
- KTV管理章程协议
- 《海洋学》第二章 地球及海洋概观
评论
0/150
提交评论