




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有:,1.算术平均数2.中位数(M)4.几何平均数(Mg)3.众数(Mo)5.调和平均数(H),3.1平均数:,第三章平均数、标准差与变异系数,作为一个资料的代表,指资料中各变数集中较多的中心位置,用来与另一资料相比较。不同的平均数适合于不同的数据资料。,例如:不同国家、地区、种族之间身高、体重等的比较;不同品种的家畜、家禽之间生产性能的比较,集中趋势的度量,平均数的意义,3.1.1算术平均数,一、定义一组资料中,所有观测值的总和除以其个数所得到的商,称为算术平均数,简称平均数或均数。是最常用的一种集中趋势度量指标。样本的平均数记为总体平均数记为,集中趋势的度量,:第i个观察值或变数n:观察值或变数的个数:求和符号(sigma),计算公式:,集中趋势的度量,3.5.1算术平均数,的性质,1.分类资料:每个类别在某个指标上取相同的值。2.计数资料和连续性资料:频率分布表,加权法,即计算时先将各个变数乘上它的权数,再经过总和,然后除以权数的总合,称为加权平均数。,集中趋势的度量,二、加权法计算,一、直接法计算,xi=变数值fi=变数值xi出现的频数“权”,计算公式:,集中趋势的度量,二、加权法,(一)离均差之和为零:一个样本观察值与平均数之差简称离均差。,(xi-)=(x1-)+(x2-)+(xn-)=x1+x2+xn-n=xi-nxi/n=0,三、算术平均数的性质,集中趋势的度量,(二)离均差平方和最小:一个样本的各个观察值与平均数之差的平方和比各个观察值与任意其他数之差的平方和小。,所以:平均数是与各个观察值最接近的数值。平均数代表这个样本的集中趋势。,集中趋势的度量,三、算术平均数的性质,样本平均数常作为检验对象的原因,1、离均差的平方和(-)2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。2、样本平均数是总体平均数的无偏估计值,即E()=。3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。,定义:将n个观察值从小到大依次排队,位于中间的那个观察值称为中位数。,3.1.2中位数(Md),集中趋势的度量,对于频数分布的资料,公式如下:,Lmd:中位数所在组的组下限;fm:中位数所在组的频数;C:从第一组到中位数所在组前一组的累计频数n:样本含量;i:组距;,集中趋势的度量,3.1.2中位数(Md),定义:n个非负数的乘积开n次方的根称为几何平均数,用G表示。,3.1.3几何平均数,集中趋势的度量,为了计算方便,各变数先取对数,再相加除以n,即为logG,再求其反对数,即为G值。,集中趋势的度量,3.1.3几何平均数,几何平均数用于以百分率、比例表示的数据资料,如:增长率、利率、药物效价、抗体滴度等。能够消弱数据中个别过分偏大值的影响。,定义:在资料中某一个变数出现次数最多,就称之为众数。1.离散性资料:出现频数最多的数。2.连续性资料:频数分布表中,频数出现最多的一组的组中值。,!有的资料可出现多个众数,即多个数具有相同的最高频数;有的资料没有众数,即所有数出现的频数都相同。,集中趋势的度量,3.1.4众数,定义:各观察值倒数的算术平均数的倒数,3.1.5调和平均数,集中趋势的度量,适用于极端右偏态,3.1.5调和平均数,集中趋势的度量,例:用某药物救治12只中毒的小鼠,它们的存活天数记录如下:8、8、8、10、10、7、13、10、9、14,另有两只一直未死亡,求平均存活天数。,由于数据极端右偏态,用调和平均数较为合理。,1,18,2.2.3百分位数(百分位点),指将一组n个数据由小到大排列,如果小于某数值的数据个数为全体数据个数的x%,则称该数为第x百分位数或x%分位数。25%分位数或下四分位数:0.25n个数的后一个数。50%分位数或中位数:0.5n个数的后一个数。75%分位数或上四分位数:0.75n个数的后一个数。,一、各个集中趋势度量指标之间的关系,1.在完全对称分布情况下,算数平均数、中位数和众数三者相等。,集中趋势的度量,适用于正态分布资料。家畜的大多数数量性状都是正态分布,因此算术平均数是最常用的,也是最重要的。,集中趋势的度量,2、算术平均数,但是当分布不对称时,呈偏态时,用算术平均数则难以表示资料的集中趋势。,偏态:是指大部分的数值落在平均数的哪一边,若分配较多的在低值的方面,视为正偏态,也称右偏态,适用于非参数检验,如卡方检验。,4、几何平均数和调和平均数适用于右偏态分布。,集中趋势的度量,3、中位数,平均数的代表程度与样本的变异程度有关一个样本内有很多的变数,用平均数作为样本的代表,其代表程度决定于样本内各个变数的变异程度。,3.2标准差,离散趋势的度量,即使两个样本的平均数相同,但是样本内变数的变异程度不一定相同。,离散趋势的度量,3.2标准差,1.如果各个变数相同或者变异程度比较小,则平均数能够代表整个样本。2.如果各个变数的变异程度比较大,则平均数的代表性就小。,离散趋势的度量,3.2标准差,定义:全部变数的最大值与最小值之差R=Max(x)-Min(x),3.2范围(全距),范围或全距可以反映变异程度的一部分,但是不能代表样本内各变数之间的变异程度。目前,被广泛使用的是以标准差来度量变异程度。,离散趋势的度量,如果一个样本有n个观察值x1,x2xn,设其算术平均数为,则该样本的标准差为:,标准差考虑了每个变数与平均数的离差。每个变数与平均数相差愈小,样本变异程度愈小,反之,愈大。因此,标准差是离散程度的度量,3.2.1标准差的定义,离散趋势的度量,1.离均差=(x-)2.离均差之和=(x-)=03.离均差平方和SS=(x-)2,离散趋势的度量,3.2.2标准差公式的来源,3.2.3样本方差和样本标准差,离散趋势的度量,总体是未知的,用样本标准差估计和推断总体标准差,离散趋势的度量,3.2.4总体方差和样本标准差,如果一个样本含有n个变数,从理论上讲,n个变数都同样用以计算标准差,n个变数与平均数相减有n个离均差。表面上虽有n个比较,但实质上仅有n-1个可以自由变动,最后一个离均差受到离均差之和这个条件的限制,所以不能自由。,3.2.5自由度:df,n-1,例如:有3个变数,平均数等于5。问着三个变数可能是多少?,离散趋势的度量,3.2.5自由度:,(4、5、6)(2、4、9)(3、5、7)他们的共同特点:前两个数可以自由选择,为了使平均数等于5,第三个数不用选就确定了。这时(31)2就是所谓自由度。,自由度:消除限制性因数后,所剩余的独立变数的个数,用df表示。,三、方差和标准差的计算公式,离散趋势的度量,1.直接法,2.加权法,3.2.6标准差的性质,标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。在计算标准差时,在各观测值加上或减去一个常数,其数值不变。当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。,3.2.6标准差的性质,在资料服从正态分布的条件下:平均数左右一倍标准差(S)范围:约有68.26%的观测值;平均数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年南通师范高等专科学校单招职业倾向性测试必刷测试卷必考题
- 2026年太原旅游职业学院单招职业技能考试必刷测试卷及答案1套
- 2026年周口理工职业学院单招职业适应性测试题库含答案
- 氟树脂生产线项目商业计划书
- 2025《食品供货合同》
- 120MWh独立储能项目建议书
- 2026年吉林交通职业技术学院单招职业倾向性考试必刷测试卷及答案1套
- 2026年南昌应用技术师范学院单招职业技能考试必刷测试卷新版
- 2026年云南交通运输职业学院单招职业倾向性考试题库完美版
- 2026年云南工贸职业技术学院单招职业倾向性测试题库含答案
- 护理事业十五五发展规划(2026-2030)
- T/CTRA 01-2020废轮胎/橡胶再生油
- 2019抽水蓄能电站工程施工工艺标准手册:土建分册
- 大健康项目商业计划书
- 西安教师入编协议书
- 《高龄卧床高危静脉血栓栓塞症防治中国专家共识》解读
- 比亚迪汽车出口合同协议
- 2025至2030年中国LNG加气站行业深度调研及投资前景预测报告(上下卷)
- 招投标程序审计报告范文
- 《劳动教育》 课件 专题二 夯实劳动技能 第三节 提高社会技能
- 课题开题报告:生成式人工智能在教育的应用现状与优化策略研究
评论
0/150
提交评论