版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 在数理统计中,平均数是用来反映一组变数在数理统计中,平均数是用来反映一组变数 的集中趋势,即变数分布的中心位置。常用的度的集中趋势,即变数分布的中心位置。常用的度 量指标有:量指标有: 1. 1. 算术平均数算术平均数 2. 2. 中位数(中位数(M) 4. 4. 几何平均数(几何平均数(Mg) 3. 3. 众数(众数(Mo) 5. 5. 调和平均数(调和平均数(H) 第三章第三章 平均数、标准差平均数、标准差 与变异系数与变异系数 作为一个资料的代表,指资料中各变数集中作为一个资料的代表,指资料中各变数集中 较多的中心位置,用来与另一资料相比较。较多的中心位置,用来与另一资料相比较。 不同
2、的平均数适合于不同的数据资料。不同的平均数适合于不同的数据资料。 例如:例如:不同国家、地区、种族之间身高、体重等不同国家、地区、种族之间身高、体重等 的比较;不同品种的家畜、家禽之间生产的比较;不同品种的家畜、家禽之间生产 性能的比较性能的比较 集中趋势的度量集中趋势的度量 一、定义一、定义 一组资料中,所有观测值的总和除以其个数所一组资料中,所有观测值的总和除以其个数所 得到的商,称为算术平均数,简称平均数或均数。得到的商,称为算术平均数,简称平均数或均数。 是最常用的一种集中趋势度量指标。是最常用的一种集中趋势度量指标。 样本的平均数记为样本的平均数记为 总体平均数记为总体平均数记为 x
3、 集中趋势的度量集中趋势的度量 x n n n x x i xxx 21 1 :第:第i i个观察值或变数个观察值或变数 n n:观察值或变数的个数:观察值或变数的个数 :求和符号(:求和符号(sigma) xi 计算公式:计算公式: 集中趋势的度量集中趋势的度量 的性质 1. 1. 分类资料:每个类别在某个指标上取相同的值。分类资料:每个类别在某个指标上取相同的值。 2. 2. 计数资料和连续性资料:频率分布表计数资料和连续性资料:频率分布表 加权法,即计算时先将各个变数乘上它加权法,即计算时先将各个变数乘上它 的权数,再经过总和,然后除以权数的总的权数,再经过总和,然后除以权数的总 合,称
4、为加权平均数。合,称为加权平均数。 集中趋势的度量集中趋势的度量 二、加权法计算二、加权法计算 一、直接法计算一、直接法计算 f x f i i i x xi = 变数值变数值 fi =变数值变数值x xi i出现的频数出现的频数“权权” 计算公式:计算公式: 集中趋势的度量集中趋势的度量 二、加权法二、加权法 (一)离均差之和为零:(一)离均差之和为零: 一个样本观察值与平均数之差简称离均差。一个样本观察值与平均数之差简称离均差。 (xi- ) =(x1- )+(x2- )+(xn- ) = x1+x2+xn-n = xi- n xi/n = 0 xxx x x 三、算术平均数的性质三、算术
5、平均数的性质 集中趋势的度量集中趋势的度量 (二)离均差平方和最小:(二)离均差平方和最小: 一个样本的各个观察值与平均数之差的平方和一个样本的各个观察值与平均数之差的平方和 比各个观察值与任意其他数之差的平方和小。比各个观察值与任意其他数之差的平方和小。 Ax xx i i 2 2 所以:平均数是与各个观察值最接近的数值。所以:平均数是与各个观察值最接近的数值。 平均数代表这个样本的集中趋势。平均数代表这个样本的集中趋势。 集中趋势的度量集中趋势的度量 三、算术平均数的性质三、算术平均数的性质 样本平均数常作为检验对象的原因 1、离均差的平方和( - )2最小。 说明样本平均数与样本各个观测
6、值最接 近,平均数是资料的代表数。 2、样本平均数是总体平均数的无偏估计值, 即E( )=。 3、根据统计学中心极限定理,样本平均数 服从或逼近正态分布。 x x x 定义:将定义:将n n个观察值从小到大依次排队,位于中间个观察值从小到大依次排队,位于中间 的那个观察值称为中位数。的那个观察值称为中位数。 3.1.2 3.1.2 中位数(中位数(M Md d) :观察值个数 为偶数时,当 为奇数时,当 n XX Mn XMn nn d nd 2 1 22 2 1 集中趋势的度量集中趋势的度量 对于频数分布的资料,公式如下:对于频数分布的资料,公式如下: ) 2 (C n f i LM m m
7、dd Lmd:中位数所在组的组下限;:中位数所在组的组下限; fm:中位数所在组的频数;:中位数所在组的频数; C:从第一组到中位数所在组前一组的累计频数:从第一组到中位数所在组前一组的累计频数 n:样本含量;:样本含量; i:组距;:组距; 集中趋势的度量集中趋势的度量 3.1.2 3.1.2 中位数(中位数(M Md d) 定义:定义:n n个非负数的乘积开个非负数的乘积开n n次方的根称为几何平均次方的根称为几何平均 数,用数,用 G G 表示。表示。 n i n n XXXXG 21 集中趋势的度量集中趋势的度量 为了计算方便,各变数先取对数,再相加为了计算方便,各变数先取对数,再相加
8、 除以除以n n,即为,即为logGlogG,再求其反对数,即为,再求其反对数,即为G G值。值。 nn XXX GG lglglglg )(lglg 21 1 1 1 集中趋势的度量集中趋势的度量 几何平均数用于以百分率、比例表示的数据资几何平均数用于以百分率、比例表示的数据资 料,如:增长率、利率、药物效价、抗体滴度等。料,如:增长率、利率、药物效价、抗体滴度等。 能够消弱数据中个别过分偏大值的影响。能够消弱数据中个别过分偏大值的影响。 定义:在资料中某一个变数出现次数最多,就称定义:在资料中某一个变数出现次数最多,就称 之为众数。之为众数。 1. 1. 离散性资料:出现频数最多的数。离散
9、性资料:出现频数最多的数。 2. 2. 连续性资料:频数分布表中,频数出现最多的连续性资料:频数分布表中,频数出现最多的 一组的组中值。一组的组中值。 !有的资料可出现多个众数,即多个数具有相同有的资料可出现多个众数,即多个数具有相同 的最高频数;有的资料没有众数,即所有数出现的频的最高频数;有的资料没有众数,即所有数出现的频 数都相同。数都相同。 集中趋势的度量集中趋势的度量 3.1.4 3.1.4 众数众数 定义:各观察值倒数的算术平均数的倒数定义:各观察值倒数的算术平均数的倒数 i n X n xxxn H 1 1111 1 21 集中趋势的度量集中趋势的度量 适用于极端右偏态适用于极端
10、右偏态 集中趋势的度量集中趋势的度量 例:例:用某药物救治用某药物救治1212只中毒的小鼠,它们的存活天只中毒的小鼠,它们的存活天 数记录如下:数记录如下:8 8、8 8、8 8、1010、1010、7 7、1313、1010、9 9、 1414,另有两只一直未死亡,求平均存活天数。另有两只一直未死亡,求平均存活天数。 14.11 )/ 1/ 19/ 18/ 18/ 1 ( /12 H 由于数据极端右偏态,用调和平均由于数据极端右偏态,用调和平均 数较为合理。数较为合理。 118 2.2.3 百分位数(百分位点)百分位数(百分位点) 指将一组指将一组 n 个数据由小到大排列,如果个数据由小到大
11、排列,如果 小于小于 某数值的数据个数为全体数据个数的某数值的数据个数为全体数据个数的x%, 则称该数为则称该数为第第 x 百分位数或百分位数或 x% 分位数。分位数。 25%分位数或下四分位数分位数或下四分位数:0.25n个数的后一个数。个数的后一个数。 50%分位数或分位数或中位数中位数:0. 5n个数的后一个数。个数的后一个数。 75%分位数或上四分位数分位数或上四分位数:0.75n个数的后一个数。个数的后一个数。 一、各个集中趋势度量指标之间的关系一、各个集中趋势度量指标之间的关系 1.1.在完全对称分布情况下,算数平均数、中位数在完全对称分布情况下,算数平均数、中位数 和众数三者相等
12、。和众数三者相等。 集中趋势的度量集中趋势的度量 适用于正态分布资料。适用于正态分布资料。 家畜的大多数数量性状都是正态分布,因此算家畜的大多数数量性状都是正态分布,因此算 术平均数是最常用的,也是最重要的。术平均数是最常用的,也是最重要的。 集中趋势的度量集中趋势的度量 2 2、算术平均数、算术平均数 但是当分布不对称时,呈偏态时,用算术平均但是当分布不对称时,呈偏态时,用算术平均 数则难以表示资料的集中趋势。数则难以表示资料的集中趋势。 偏态偏态: :是指大部分的数值落在平均是指大部分的数值落在平均 数的哪一边,若分配较多的在低数的哪一边,若分配较多的在低 值的方面,视为正偏态,也称值的方
13、面,视为正偏态,也称右右 偏态偏态 适用于非参数检验,如卡方检验。适用于非参数检验,如卡方检验。 4 4、几何平均数和调和平均数、几何平均数和调和平均数 适用于右偏态分布。适用于右偏态分布。 集中趋势的度量集中趋势的度量 3 3、中位数、中位数 平均数的代表程度与样本的变异程度有关平均数的代表程度与样本的变异程度有关 一个样本内有很多的变数,用平均数作为样本一个样本内有很多的变数,用平均数作为样本 的代表,其代表程度决定于样本内各个变数的变异的代表,其代表程度决定于样本内各个变数的变异 程度。程度。 3.23.2标准差标准差 离散趋势的度量离散趋势的度量 即使两个样本的平均数相同,但是样本内变
14、即使两个样本的平均数相同,但是样本内变 数的变异程度不一定相同。数的变异程度不一定相同。 产仔数产仔数总和总和 甲甲 8 8,4 4,1616,1212,2222,1717,6 6,1414,6 6,5 5 1101101111 乙乙 1414,8 8,1111,9 9,1111,1212,1010,1414,1313,8 8 1101101111 离散趋势的度量离散趋势的度量 xi 3.23.2标准差标准差 1.1.如果各个变数相同或者变异程度比较小,则平如果各个变数相同或者变异程度比较小,则平 均数能够代表整个样本。均数能够代表整个样本。 2.2.如果各个变数的变异程度比较大,则平均数的代
15、如果各个变数的变异程度比较大,则平均数的代 表性就小。表性就小。 离散趋势的度量离散趋势的度量 因此,单靠平均数不能全面、正确地了解样因此,单靠平均数不能全面、正确地了解样 本。也不能了解平均数作为样本的变异程度。本。也不能了解平均数作为样本的变异程度。 3.23.2标准差标准差 定义:全部变数的最大值与最小值之差定义:全部变数的最大值与最小值之差 R= Max(x) -Min(x) 3.2 3.2 范围(全距)范围(全距) 范围或全距可以反映变异程度的一部分,但范围或全距可以反映变异程度的一部分,但 是不能代表样本内各变数之间的变异程度。是不能代表样本内各变数之间的变异程度。 目前,被广泛使
16、用的是以标准差来度量变异目前,被广泛使用的是以标准差来度量变异 程度。程度。 离散趋势的度量离散趋势的度量 如果一个样本有如果一个样本有n n个观察值个观察值 x x1 1, ,x x2 2 x xn n,设其 设其 算术平均数为算术平均数为 ,则该样本的标准差为:,则该样本的标准差为:x 1 2 n xx s i 标准差考虑了每个变数与平标准差考虑了每个变数与平 均数的离差。均数的离差。 每个变数与平均数相差愈小,每个变数与平均数相差愈小, 样本变异程度愈小,反之,样本变异程度愈小,反之, 愈大。愈大。 因此,标准差是离散程度的因此,标准差是离散程度的 度量度量 3.2.1 3.2.1 标准
17、差的定义标准差的定义 离散趋势的度量离散趋势的度量 1.1.离均差离均差= =(x- x- ) 2.2.离均差之和离均差之和= = (x- x- )=0=0 3.3.离均差平方和离均差平方和 SS= (x- )SS= (x- )2 2 x x 为了合理地计算平均差异,用平方和的办法来消除离均差的为了合理地计算平均差异,用平方和的办法来消除离均差的 正负号,离均差平方相加,得到平方和(正负号,离均差平方相加,得到平方和(SSSS),但是由于不),但是由于不 同样本的观察值个数不同,所以离均差平方和也不是理想指同样本的观察值个数不同,所以离均差平方和也不是理想指 标标 离散趋势的度量离散趋势的度量
18、 x 虽然离均差可以衡量变虽然离均差可以衡量变 异程度,但是离均差之异程度,但是离均差之 和为和为0 0,所以不是理想的,所以不是理想的 指标指标 3.2.2 3.2.2 标准差公式的来源标准差公式的来源 3.2.3 3.2.3 样本方差和样本标准差样本方差和样本标准差 1 2 2 n xx s 将离均差平方和求平均数,称为样将离均差平方和求平均数,称为样 本方差,目的是消除观察值个数的本方差,目的是消除观察值个数的 影响影响 1 2 n xx s 样本方差开方,目的是使变异还原,样本方差开方,目的是使变异还原, 即标准差。即标准差。 离散趋势的度量离散趋势的度量 n x 2 2 n x 2
19、总体是未知的,用样本标准 差估计和推断总体标准差 离散趋势的度量离散趋势的度量 3.2.4 3.2.4 总体方差和样本标准差总体方差和样本标准差 如果一个样本含有如果一个样本含有n n个变数,从理论上讲,个变数,从理论上讲,n n个个 变数都同样用以计算标准差,变数都同样用以计算标准差,n n个变数与平均数相个变数与平均数相 减有减有n n个离均差。个离均差。 表面上虽有表面上虽有n n个比较,但实质上仅有个比较,但实质上仅有n-1n-1个可以个可以 自由变动,最后一个离均差受到离均差之和这个条自由变动,最后一个离均差受到离均差之和这个条 件的限制,所以不能自由。件的限制,所以不能自由。 3.
20、2.5 3.2.5 自由度:自由度: df,n-1 1 2 2 n xx s 例如:有例如:有3 3个变数个变数, ,平均数等于平均数等于5 5。 问着三个变数可能是多少?问着三个变数可能是多少? 离散趋势的度量离散趋势的度量 3.2.5 3.2.5 自由度:自由度: (4 4、5 5、6 6)()(2 2、4 4、9 9)()(3 3、5 5、7 7) 他们的共同特点:前两个数可以自由选择,为了使他们的共同特点:前两个数可以自由选择,为了使 平均数等于平均数等于5 5,第三个数不用选就确定了。这时(,第三个数不用选就确定了。这时(3 3 1 1)2 2就是所谓自由度。就是所谓自由度。 自由度:自由度: 消除限制性因数后,所剩余的独立变数的消除限制性因数后,所剩余的独立变数的 个数,用个数,用dfdf表示表示。 三、方差和标准差的计算公式三、方差和标准差的计算公式 11 2 2 2 n X n xx s n X i i 离散趋势的度量离散趋势的度量 1 /)( 1 )( 222 f ffxfx f xxf S 1. 1. 直接法直接法 2. 2.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多模态数据融合与生物样本库的智能管理-1
- 2026年智能变色水下灯项目评估报告
- 2025年高职茶叶生产与应用(茶叶深加工技术)试题及答案
- 2025年中职电气控制(电气控制电路)试题及答案
- 2025年高职车辆维修(轮胎检测工具应用)试题及答案
- 2025年大学动物医学(动物解剖生理)试题及答案
- 2025年本科测绘工程技术(工程测量规范)试题及答案
- 2025年大学一年级(汉语言文学)文学鉴赏阶段测试题及答案
- 2025年高职护理(脉搏监测护理进阶)试题及答案
- 2025年高职(物流成本管理)费用控制设计试题及答案
- 2025-2026学年高三上学期《挑战极限青春无悔》主题班会课件
- 2025年科创板开通考试试题及答案
- 律师事务所绩效考核评分细则
- 变电站变压器吊装施工方案
- 民事检察案例汇报
- 断骨增高手术护理教程
- 2025秋季学期国开电大法学本科《国际私法》期末纸质考试简述题题库珍藏版
- 2025年道教传度考试题及答案
- 微机电系统(MEMS)技术 柔性微机电器件循环弯曲变形后电气特性测试方法 编制说明
- 小区充电桩转让合同范本
- (2025年标准)国债使用协议书
评论
0/150
提交评论