版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 下一张 主 页 退 出 上一张 第三章 资料的统计描画 1.正确了解各种平均数、方差、规范差、变异系数等统计量的概念和性质; 2.掌握上述各统计量的计算方法。教学目的:.第一节 平均数 平均数是统计学中最常用的统计量,用来阐明资料中各观测值相对集中较多的中心位置。平均数主要包括有:算术平均数arithmetic mean中位数 median众数 mode几何平均数geometric mean调和平均数harmonic mean1.资料的代表数2.表示各种技术措施的效果3.表示畜禽的消费性能4.进展变量间的相互比较其作用主要表达在:.下一张 主 页 退 出 上一张 一、算术平均数 算术平均数是
2、指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,记为 、 等 。 算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。(一)直接法主要用于样本含量n30、未经分组资料平均数的计算。.下一张 主 页 退 出 上一张 设某一资料包含n个观测值: x1、x2、xn,那么样本平均数可经过下式计算:3-1 其中,为总和符号; 表示从第一个观测值x1累加到第n个观测值xn。当其在意义上已明确时,可简写为 ,3-1式可改写为:.下一张 主 页 退 出 上一张 【例3.1】 某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、
3、490kg,求其平均数。由于 x=500+520+535+560+58 +600+480+510+505+49 =5285, n=10得:即10头种公牛平均体重为528.5 kg。. 下一张 主 页 退 出 上一张 二加权法 对于样本含量 n30 以上且已分组的资料,可以在次数分布表的根底上采用加权法计算平均数,计算公式为: 3-2.下一张 主 页 退 出 上一张 式中: 第i组的组中值; 第i组的次数; 分组数。 第i组的次数fi是权衡第i组组中值xi在资料中所占比艰苦小的数量,因此将fi 称为是xi的“权,加权法也由此而得名。 【例3.2】 将100头长白母猪的仔猪一月窝重单位:kg资料整
4、理成次数分布表如下,求其加权数平均数。.组别组中值(x)次数(f)f x101534520256150303526910404530135050552413206065852070753225合计1004520表3-1 100头长白母猪仔猪一月窝重次数分布表. 利用3-2式得: 即这100头长白母猪仔猪一月龄平均窝重为45.2kg。 计算假设干个来自同一总体的样本平均数的平均数时,假设样本含量不等,也应采用加权法计算(以各样本的含量为权)。 下一张 主 页 退 出 上一张 . 【例3.3】 某牛群有黑白花奶牛 1500头,其平均体重为750 kg ,而另一牛群有黑白花奶牛1200头,平均体重为
5、725 kg,假设将这两个牛群混合在一同,其混合后平均体重为多少? 此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛群牛的头数为权,求两个牛群平均体重的加权平均数,即 下一张 主 页 退 出 上一张 即两个牛群混合后平均体重为738.89 kg。.下一张 主 页 退 出 上一张 三平均数的根本性质 1、样本各观测值与平均数之差的和为零,即离均差之和等于零。 可简写成:或. 2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。 对于总体而言,通常用表示总体平均数,有限总体的平均数为:3-3式中,N表示总体所包含的个体数。. 当一个统计量的数学期望等于所估
6、计的总体参数时,那么称此统计量为该总体参数的无偏估计量。 统计学中常用样本平均数 作为总体平均数的估计量,并已证明样本平均数是总体平均数的无偏估计量。 下一张 主 页 退 出 上一张 当一个统计量的数学期望等于所估计的总体参数时,那么称此统计量为该总体参数的无偏估计量。 统计学中常用样本平均数 作为总体平均数的估计量,并已证明样本平均数是总体平均数的无偏估计量。 .下一张 主 页 退 出 上一张 二、中位数 将资料内一切观测值从小到大依次陈列,位于中间的那个观测值称为中位数median,记为Md。 当观测值的个数是偶数时,那么以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时,
7、中位数的代表性优于算术平均数。中位数的计算方法因资料能否分组而有所不同。. 1、当观测值个数n为奇数时,(n+1)/2位置的观测值,即x(n+1)/2为中位数: 下一张 主 页 退 出 上一张 一未分组资料中位数的计算方法 对于未分组资料,先将各观测值由小到大依次陈列。 2、当观测值个数为 偶 数 时 , n/2和n/2+1位置的两个观测值之和的1/2为中位数,即: 3-4. 【例3.4】 察看得9只西农莎能奶山羊的妊娠天数为: 144 、 145、 147、 149、150、151、153、156、157,求其中位数。此例 n=9,为奇数,那么:即西农莎能奶山羊妊娠天数的中位数为150天。
8、(d).下一张 主 页 退 出 上一张 【例3.5】 某犬场发生犬瘟热,察看得10只仔犬发现病症到死亡分别为7、8、8、9、11、12、12、13、14、14天,求其中位数。此例n=10,为偶数,那么:d即10只仔犬从发现病症到死亡天数的中位数为11.5天。.下一张 主 页 退 出 上一张 二已分组资料中位数的计算方法 假设资料已分组,编制成次数分布表,那么可利用次数分布表来计算中位数,其计算公式为:3-5式中:L 中位数所在组的下限; i 组距; f 中位数所在组的次数; n 总次数; c 小于中数所在组的累加次数。.下一张 主 页 退 出 上一张 【例3.6】某奶牛场68头安康母牛从分娩到
9、第一次发情间隔时间 整理成次数分布表如表 32 所示,求中位数。 表3-2 68头母牛从分娩到第一次发情间隔时间次数分布表间隔时间(d)头数(f)累加头数122611274123425613165771203672861652871011264102116266117268.下一张 主 页 退 出 上一张 由表3-2可见:i=15,n=68,因此中位数只能在累加头数为36所对应的“5771这一组,于是可确定L=57,f =20,c =16,代入公式3-5得: d即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。.又如,由表3-1可算得其中位数为:.下一张 主 页 退 出 上一张 三、几何
10、平均数 n 个观测值相乘之积开 n 次方所得的方根,称为几何平均数(geometric mean),记为G。 它主要运用于畜牧业、水产业的消费动态分析,畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的 增长率,抗体的滴度,药物的效价,畜禽疾病的埋伏期等,用几何平均数比用算术平均数更能代表其平均程度。其计算公式如下:(3-6)n. 为了计算方便,可将各观测值取对数后相加除以n,得lgG,再求lgG的反对数,即得G值,即(3-7) 【例3.7】 某波尔山羊群19972000年各年度的存栏数见表3-3,试求其年平均增长率。年度存栏数(只)增长率(x)Lgx199714019982000.429-0.
11、36819992800.400-0.39820003500.250-0.602lgx=-1.368表33 某波尔山羊群各年度存栏数与增长率. 利用3-7式求年平均增长率 =lg-1-0.368-0.3980.602)/3 =lg-1 -1.368/3 =lg-1-0.456=0.3501 即年平均增长率为0.3501或35.01%。下一张 主 页 退 出 上一张 当一组数据资料中的各观测值呈倍数关系等比关系,几何级数变化趋势时,用几何平均数表示其普通程度是较为适宜的。.下一张 主 页 退 出 上一张 四、众 数 资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数mode,记为Mo。
12、 延续性资料由于样本中的各观测值容易集中于某一个数值,所以众数易于确定。 延续性资料由于在两个相邻的观测值之间,可有各种数值存在,样本中的观测值不易集中于某一个数值,众数不易确定。 在延续性资料的次数分布表中,分布次数最多一组的组中值即为该样本的概约众数。但在实践统计分析过程中,由于分组不同,概约众数亦不同。可用补差法计算众数,其准确性高于众数。公式如下:.3-8为次数最多组的下限,为组距,L为次数最多组上一组的累计次数,为次数最多组下一组的累计次数。. 如表2-3 所列 的 50枚受精种蛋出雏天数次数分布中,以22出现的次数最多,那么该资料的众数为22天。 又如【例3.6】所列出的次数分布表
13、中,5771这一组次数最多,其组中值为64天,那么该资料的众数为64天。再如,由表3-1可算得其概约众数为:.五、调和平均数 资料中各观测值倒数的算术平均数的倒数,称为调和平均数harmonic mean,记为H。即3-9 调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。. 下一张 主 页 退 出 上一张 【例3.8】 某保种牛群不同世代牛群保种的规模分别为:0世代200头,1世代220头,2世代210头; 3世代190头,4世代210头,试求其平均规模。利用3-9式求平均规模:(头)即保种群平均规模为208.33头。. 普通,对于同一资料: 算术平均数几何平均数调和平
14、均数。 上述五种平均数,最常用的是算术平均数。5 5 5 5 53 4 5 6 71 3 5 7 9 三组数据平均数均为5,但代表性强弱不同。.第二节 规范差下一张 主 页 退 出 上一张 一、规范差的意义 用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描画是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。 全距极差是表示资料中各观测值变异程度大小最简便的统计量。 全距只利用了资料中的最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判别时,可以利用全距这个统计量。
15、. 为了准确地表示样本内各个观测值的变异程度 ,人们首先会思索到以平均数为规范,求出各个观测值与平均数的离差, ,称为离均差。 虽然离均差能表示一个观测值偏离平均数的性质和程度,但由于离均差有正、有负 ,离均差之和为零,因此不能用离均差之和 来表示资料中一切观测值的总偏离程度。 为理处理离均差有正、有负,离均差之和为零的问题,可先求离均差的绝对值并将各离均差绝对值之和除以观测值 个数n求得平均绝对离差,即 。. 虽然平均绝对离差可以表示资料中各观测值的变异度,但由于平均绝对离差包含绝对值符号,运用很不方便,在统计学中未被采用。 我们还可以采用将离均差平方的方法来处理离均差有正、有负,离均差之和
16、为零的问题。 先将各个离均差平方,即 ,再求离均差平方和,即 ,简称平方和,记为SS;由于离差平方和常随样本大小而改动,为了消除样本大小的影 响,用平方和除以样本大小,即 ,求出离均差平方和的平均数。. 为了使所得的统计量是相应总体参数的无偏估计unbiased estimate量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自在度 n-1, 于是,我们采用统计量 表示资料的变异程度。 统计量 称为均方mean square, 缩写为MS,又称样本方差(variance of sample),记为 ,即(3-10).自在度例如:有一个有4个数据n=4的样本,其平均值m=5,
17、即遭到m=5的条件限制,在自在确定4、2、5三个数据收,第四个数据只能是9,否那么m不等于5,因此这里的自在度u=n-1=4-1=3. 相应的总体参数叫总体方差,记为 。对于有限总体而言,的计算公式为:(3-11) 由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需求与平均数配合运用,这时应将平方单位复原,即应求出样本方差的平方根。统计学上把样本方差 的平方根叫做样本规范(standard deviation of sample),记为 ,即: (3-12). (3-13)由于所以3-12式可改为:.下一张 主 页 退 出 上一张 (3-14) 相
18、应的总体参数叫总体规范差,记为。对于有限总体而言,的计算公式为: 在统计学中,常用样本规范差S估计总体规范差,但这并非无偏估计。 .二、规范差的计算方法一直接法 对于未分组或小样本资料,可直接利用313或3-14式来计算规范差。 【例3.9】 计算10只辽宁绒山羊产绒量: 450, 450, 500, 500, 500,550, 550, 550, 600, 600,650g的规范差。此例n=10,经计算得:x=5400,x2=2955000,代入3-13式得:.下一张 主 页 退 出 上一张 (g)即10只辽宁绒山羊产绒量的 规范差 为65.828g。二加权法 对于已制成次数分布表的大样本资
19、料,可利用次数分布表,采用加权法计算规范差。计算公式为: 3-15 式中,f为各组次数;x为各组的组中值;f = n为总次数。. 【例3.10】 利用某纯系蛋鸡200枚蛋重资料的次数分布表见表3-4计算规范差。组别组中值(x)次数(f)fxfx244.1545.03135.06075.045.8546.76280.213085.3447.5548.416774.437480.9649.2550.1221102.255220.2250.9551.8301554.080497.2052.6553.5442354.0125939.0054.3555.2281545.085317.1256.0556.
20、9301707.097128.3057.7558.612703.241207.5259.4560.35301.518180.4561.1562.04248.015376.00合计 f=200 fx=10705.1 fx2=575507.11表3-4 某纯系蛋鸡200枚蛋重资料次数分布及规范差计算表.下一张 主 页 退 出 上一张 将表3-4中的f、fx、代入3-15式得:(g )即某纯系蛋鸡200枚蛋重的规范差为3.5524g。.下一张 主 页 退 出 上一张 三、规范差的特性 一规范差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的规范差也大,反之那么小。 二在计算规范差时,在各观测值加上或减去一个常数,其数值不变。 三当每个观测值乘以或除以一个常数a,那么所得的规范差是原来规范差的a倍或1/a倍。.全距极差全距 极差 = 最大值 - 最小值 只利用了资料中最大值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 返利网合同范本
- 工作装合同范本
- pci术前双抗治疗指南
- 2026年石狮市龟湖中心小学招聘合同教师备考题库及答案详解(新)
- 2026年阳宗海风景名胜区“社会救助服务人员”公开招聘备考题库及参考答案详解
- 2026年杭州师范大学公开招聘65名教学科研人员备考题库及完整答案详解1套
- 2026年南京大学招聘南京赫尔辛基大气与地球系统科学学院助理备考题库及参考答案详解
- 儿童用药安全指南
- 山西省霍州市实验中学2025-2026学年八年级数学上学期期中测试调研卷【含答案】
- 2025年医学综合试卷选择题及答案
- 喷绘安装合同范本
- 2025年区块链技术化妆品溯源发展报告
- 全反力、摩擦角、自锁现象、辅助角-习题答案
- 2026年湖南食品药品职业学院单招职业适应性测试题库带答案详解
- 《AQ 4272-2025铝镁制品机械加工粉尘防爆安全规范》专题研究报告
- 2025年度威海文旅发展集团有限公司招聘工作人员25人笔试参考题库附带答案详解(3卷)
- T-CNHC 4-2025 昌宁县低质低效茶园改造技术规程
- 2025年手术室护理实践指南试题(含答案)
- 黑龙江省哈尔滨市南岗区2024-2025学年(五四制)六年级上学期期末语文试题
- 2025年山东省政府采购专家入库考试真题(附答案)
- 2025兵团连队职工试题及答案
评论
0/150
提交评论