《试验资料的整理》PPT课件.ppt_第1页
《试验资料的整理》PPT课件.ppt_第2页
《试验资料的整理》PPT课件.ppt_第3页
《试验资料的整理》PPT课件.ppt_第4页
《试验资料的整理》PPT课件.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 试验资料的整理,从次数分布表或次数分布图中,可以看出一个资 料变数的分布特点,即集中性和离散性。 集中性是指资料中的各观察值总是以某数值为 中心分布; 离散性是指资料中各观察值的离散、变异程度。 但是从次数分布表和次数分布图中只能看出一个 大致趋势,且不能以此做统计处理。,3.4 资料的描述,因此,为了使资料得到完整的描述,还需要 从中概括出一些能够反映资料特征的数量指标, 这些数量指标称为试验资料的特征数。,表示集中性的特征数有算术平均数、几何平 均数、众数、中数。,表示离散性的特征数有极差、方差、标准差 和变异系数。,一、平均数 (mean),平均数是统计学中最常用的统计数,表示资料 中观测值的中心位置,作为资料的代表与另一资 料相比较。 主要有算术平均数、中位数、众数、几何平均 数等。, 加权法,一、算术平均数 (arithmetic mean, ), 直接法,2、算术平均数的基本性质,性质1 样本各个观察值与平均数之差的和为零,即离均差之和为零;,*,证明:,性质2 样本各观察值与平均数之差的平方和为最 小,即离均差的平方和最小。,证明:,将资料中所有观测值从小到大依次排 列,位于中间位置的观测值,称为中位 数,简称中数,记作Md。,(二) 中位数,对于未分组资料,先将观测值由小到大依次排列。,(1)当观测值个数为奇数时,(n+1)/2位置的观测 值为中位数 ,即:,(2)当观测值个数为偶数时,n/2和n/2 + 1位置 的两个观测值之和的1/2为中位数,即:,资料中出现次数最多的那个数或次数最多一组的 组中值称为众数,记为Mo。 表3.5所列的100株大豆单株节数的次数分布表中,17出现的次数最多,则该资料的众数为17。 表3.3所列的100株小麦株高的的次数分布表中,88.5-91.5这一组的次数最多,其组中值为90cm,则该资料的众数为90cm。,(三) 众数,(四)几何平均数,n个观测值相乘之积开n次方所得数值, 称为几何平均数,记作G。,或,几何平均数常用于表示某现象的平均发展 速度,如计算若干天内,某种植物株高、根 长、生长重或某种昆虫繁殖,每天各为上天 的平均倍数等,用几何平均数能比算术平均 数更准确地反映实际情况。,调查某麦田百 株上蚜虫发生情 况如表3.8。,例3.6,试求百株蚜虫 平均每天繁殖量 各为上天的多少 倍?,3.09,2.38,1.54,1.27,每天繁殖量为 上天的倍数,即百株麦蚜在4天中,平均每天繁殖量各为上天 的1.95倍。 我们可以验证:6月27日百株麦蚜为110头,4天 后为1101.954=1590(头),与7月1日实际虫数相 符。如若用算术平均数计算就不会符合了。 这说明此类问题用几何平均数计算更为确。,平均数作为数量资料的代表值,其代表性的强 弱,取决于资料内各观察值变异程度的大小。 例如有A、B两组数据:,3.5 变异数,B组 10、110、50、90、40,A组 60、58、60、61、61,虽然两组的平均数都是60,但两组数据的变异 程度有很大不同。所以只用平均数表示资料特征 是不够的,为了更全面地描述一个数量资料,还 必须有一个度量其变异程度的特征数。,60,60,度量一个数量资料的变异程度的特征数叫变异数。,最常用的变异数有:,极差;,方差;,标准差;,变异系数,1.极差,极差(R)是表示资料中各观测值变异程度大小 最简便的统计数。 但计算极差时,只用资料中的最大值和最小值, 因而极差不能准确表达资料中全部观测值的变异程度。 当资料很多而又要迅速对资料的变异程度作出判 断时,可利用极差。,设一样本有n个观测值: 。为了准确描 述样本内各观测值的变异程度,人们首先想到以平 均数为标准,求各个观测值与平均数的差, , 即离均差。,2、方差,但由于离均差之和为零,不可能把离均差之和作为描述样本内所有观测值总变异程度的统计数。,离均差大,变异就大,反之变异就小。,将每个离均差平方,进而求得离均差的平方和,简称平方和,记作 SS ,用来反映资料所有观测 值的总变异程度。,由于平方和常随样本容量n而改变,为了消除样 本容量的影响,用平方和除以样本容量n,即,求出离均差平方和的平均数; 为了使所得的统计数是相应总体参数的无偏估计量, 统计学证明, 在求离均差平方和的平均数时, 分母不用样本容量n,而用自由度n-1。,用统计数 表示资料所有 观测值的总变异程度。,统计数 称为均方(缩写为 MS),又称样本方差,记为s2,即,2.方差,相应的总体参数叫总体方差,记为2。 对于含有N个个体的有限总体而言,2的计算 公式为:,样本方差s2是总体方差2的无偏估计值。,无偏估计值:在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数的相应参数的无偏估计值。,例:有一个有限总体,3,4,5,从中抽样,n=2,所有可能样本为几个?,共9个样本,某一统计数?,平均数,样本方差的平均数:,可求得4,为20.6667,0.8165。 现以n2作独立的放回抽样,总共得N2= 9个样本:,有一个N=3的近似正态总体,具有变量3,4,5,根据表的资料可得:,样本平均数 的平均数:,样本方差的平均数:,样本标准差的平均数:,无偏估计:在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为相应参数的无偏估计。,虽然方差全面的反映了其变异度,但是由于 采用了平方的形式,度量单位也随之平方,另 外平方使数值量也增大了,与实际变异度有相 当差距。 为此,把方差开平方还原,就得到一个新的 变异数-标准差。,3.标准差,简写为:,或:,统计学上把样本方差 S2 的平方根叫做样本标准差,记为S,即:,自由度,前式中,根号里面分母n-1 称为离均差平方和的 自由度,简称为自由度,记为d=n-1。 其统计意义是指在计算离均差平方和时,能够自 由变动的离均差的个数。在计算离均差平方和时, n 个离均差受到 这一条件的约束,能 自由变动的离均差的个数是n-1。,一般,在计算离均差平方和时,若约束条件 为k个,则其自由度 d=n-k。,当n-1个离均差确定了,第 n个离均差也就随之而定了,不能再任意变动。,如n=5, 前四个离均差2,1,0,-1,那么由于离均差受 ,第五个离均差肯定是 -2。,1、直接法 对小样本(n30)和未经分组的资料,直接利用下式计算标准差。,标准差的计算,有5株大麦单株粒重资料如下:3、7、6、4、5, N5 ,试计算标准差(单位g),例 3.7,对于大样本(n30) 且已分组的资料,可在次数分布表的基础上采用加权法计算标准差,计算公式为:,2、加权法,其中,f为第i组的次数; x为第i组的组中值; n为样本观测值的总个数。,例3.6,由表3.3 计算100株小麦株高的标准差。,即100株小麦的株高标准差为544(cm)。,标准差带有与样本资料相同的度量单位,不能用 来比较度量单位不同、或者度量单位相同但平均数 不同的两个或多个样本资料的变异程度的大小。 需引入另一个度量资料变异程度的统计数,使其 既能反映样本资料的变异性,又能解决度量单位及 平均数不同的问题。,4.变异系数,变异系数正是这样的统计数。,变异系数是一个不带单位的纯数,可用以比较两个或多个样本资料变异程度的大小。,变异系数是样本标准差与样本平均数的比值,以 百分数形式表示,计算公式为:,例3.8,A品种小麦株高的整齐度好于B品种。,问两个小麦品种株高整齐度哪个比较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论