田间试验和统计方法第三章次数分布、平均数和变异数_第1页
田间试验和统计方法第三章次数分布、平均数和变异数_第2页
田间试验和统计方法第三章次数分布、平均数和变异数_第3页
田间试验和统计方法第三章次数分布、平均数和变异数_第4页
田间试验和统计方法第三章次数分布、平均数和变异数_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 次数分布、平均数和变异数次数分布、平均数和变异数 第一节第一节 总体和样本总体和样本 第二节第二节 次数分布次数分布 第三节第三节 平均数平均数 第四节第四节 变异数变异数 田间试验和统计方法第三章次数分布 、平均数和变异数 第一节第一节 总体和样本总体和样本 一、一、 总体与样本总体与样本 总体总体: :是指研究对象的全部个体是指研究对象的全部个体. . 样本样本: :从总体中抽出的一部分个体叫样本从总体中抽出的一部分个体叫样本. . 二二 参数和统计数参数和统计数 参数参数 :描述总体的特征数叫参数。一般用希腊字母:描述总体的特征数叫参数。一般用希腊字母 表示。表示。 统计数

2、:反映样本的特征数叫统计数。一般用拉丁字统计数:反映样本的特征数叫统计数。一般用拉丁字 母表示。如样本平均数。母表示。如样本平均数。 田间试验和统计方法第三章次数分布 、平均数和变异数 在农业试验中,往往很难得到总体参数,大多是在农业试验中,往往很难得到总体参数,大多是 通过样本的观察来研究总体的。样本是总体的缩影,通过样本的观察来研究总体的。样本是总体的缩影, 能反映总体的一定情况,因此常用统计数作为总体能反映总体的一定情况,因此常用统计数作为总体 相应参数的估计值。但样本毕竟是总体的一部分个相应参数的估计值。但样本毕竟是总体的一部分个 体,随着个体的数目不同而不同,因此和总体的真体,随着个

3、体的数目不同而不同,因此和总体的真 实情况不同。统计分析为我们提供了解决这一问题实情况不同。统计分析为我们提供了解决这一问题 的科学方法。因此获得样本只是一种手段,推断总的科学方法。因此获得样本只是一种手段,推断总 体才是真正目的。体才是真正目的。 田间试验和统计方法第三章次数分布 、平均数和变异数 三、变数和观测值三、变数和观测值 变数:在统计上将具有变异的某一性状或特征的一变数:在统计上将具有变异的某一性状或特征的一 群数据叫做变数或随机变数。群数据叫做变数或随机变数。 观测值:变数中每一个体的测定数值叫做观测值。观测值:变数中每一个体的测定数值叫做观测值。 田间试验和统计方法第三章次数分

4、布 、平均数和变异数 、随机样本和样本容量、随机样本和样本容量 随机样本:从总体中随机抽出的样本随机样本:从总体中随机抽出的样本 样本容量:样本中包含的个体数,容量样本容量:样本中包含的个体数,容量 越大越能代表总体。越大越能代表总体。 田间试验和统计方法第三章次数分布 、平均数和变异数 第二节第二节 次数分布次数分布 一一 试验资料性质与分类试验资料性质与分类 (一)数量性状资料(一)数量性状资料 度量有计数和量测两种方式度量有计数和量测两种方式 连续性变数:连续性变数: 指称量、度量或测量方法得到的数据称指称量、度量或测量方法得到的数据称 为连续性变数。在连续性变数中,各个观察值由整数和为

5、连续性变数。在连续性变数中,各个观察值由整数和 小数构成。如测定玉米叶面积系数,在小数构成。如测定玉米叶面积系数,在3.143.14和和3.153.15之间,之间, 可以有可以有3.14053.1405、3.14683.1468等数值。等数值。 间断性变数:指用计数方法获得的数据称为间断性变数。间断性变数:指用计数方法获得的数据称为间断性变数。 间断性变数必须由整数表示。在两个相邻的整数间不允间断性变数必须由整数表示。在两个相邻的整数间不允 许带有小数的数值存在。如计数玉米每穗穗粒数时,只许带有小数的数值存在。如计数玉米每穗穗粒数时,只 能得到整数,不可能出现小数。能得到整数,不可能出现小数。

6、 田间试验和统计方法第三章次数分布 、平均数和变异数 数量性状资料(数量性状资料(quantitative traitquantitative trait) 采用计数和量测两种方式所得到的数据。采用计数和量测两种方式所得到的数据。 间断性变数间断性变数 Discontinuous or Discontinuous or discrete variablediscrete variable 连续性变数连续性变数 continuous variablecontinuous variable 小麦基本苗数、菌落数、小麦基本苗数、菌落数、 穗数、分孽数等等穗数、分孽数等等 病斑长度、作物产量、病斑长度

7、、作物产量、 株高、土壤水分含量等等株高、土壤水分含量等等 田间试验和统计方法第三章次数分布 、平均数和变异数 ( (二)二) 质量性状资料(质量性状资料(qualitative traitqualitative trait) 观察而观察而 不能量测性状,如菌落的颜色、麦穗有无芒等等。不能量测性状,如菌落的颜色、麦穗有无芒等等。 统计次数法统计次数法 给分法给分法 统计具有某个性状的个统计具有某个性状的个 体数目及具有不同性状的体数目及具有不同性状的 个体数目,按类别计其个体数目,按类别计其 次数或相对次数次数或相对次数 给予每类性状以相对数给予每类性状以相对数 量的方法,如小麦籽粒有量的方法

8、,如小麦籽粒有 红白两种颜色,可用红白两种颜色,可用0 0 表示白色,用表示白色,用1 1表示红色表示红色 田间试验和统计方法第三章次数分布 、平均数和变异数 按数量大小,将样本分成若干个组,统按数量大小,将样本分成若干个组,统 计每个组内包含的观察值的个数,即出现的计每个组内包含的观察值的个数,即出现的 次数。这种由不同组别内出现的次数所组成次数。这种由不同组别内出现的次数所组成 的分布称为变数的次数分布,简称次数分布的分布称为变数的次数分布,简称次数分布 。把次数分布做成表格的形式,叫做次数分。把次数分布做成表格的形式,叫做次数分 布表。布表。 二、次数分布表 田间试验和统计方法第三章次数

9、分布 、平均数和变异数 (一)间断性变数资料的整理(一)间断性变数资料的整理 试验或调查研究所得资料,包含很多观察值,未加整试验或调查研究所得资料,包含很多观察值,未加整 理很难得到明确概念。如把观察值按数值大小或数据理很难得到明确概念。如把观察值按数值大小或数据 类别进行分组,制成关于观察值的不同组别或不同分类别进行分组,制成关于观察值的不同组别或不同分 类单位的次数分布表,就可以看出资料中不同表现的类单位的次数分布表,就可以看出资料中不同表现的 观察值与其频率间的规律性,既可以看出资料的频率观察值与其频率间的规律性,既可以看出资料的频率 分布情况,从而对资料得到一个初步概念。分布情况,从而

10、对资料得到一个初步概念。 田间试验和统计方法第三章次数分布 、平均数和变异数 采取分组的方法采取分组的方法 18 15 17 19 16 15 20 18 19 17 17 18 17 16 18 20 19 17 16 18 17 16 17 19 18 18 17 17 17 18 18 15 16 18 18 18 17 20 19 18 17 19 15 17 17 17 16 17 18 18 17 19 19 17 19 17 18 16 18 17 17 19 16 16 17 17 17 15 17 16 18 19 18 18 19 19 20 17 16 19 18 17

11、18 20 19 16 18 19 17 16 15 16 18 17 18 17 17 16 19 17 100个麦穗每穗小穗数个麦穗每穗小穗数 田间试验和统计方法第三章次数分布 、平均数和变异数 100100个麦穗每穗小穗数的次数分布表个麦穗每穗小穗数的次数分布表 每穗小穗数(每穗小穗数(y) 次数次数(f) 15 6 16 15 17 32 18 25 19 17 20 5 总次数(n) 100 田间试验和统计方法第三章次数分布 、平均数和变异数 200200个稻穗每穗粒数的次数分布表个稻穗每穗粒数的次数分布表 每穗粒数(每穗粒数(y) 次数(次数(f) 26-30 1 31-35 3

12、36-40 10 41-45 21 46-50 32 51-55 41 56-60 38 61-65 25 66-70 16 71-75 8 76-80 3 81-85 2 合计合计 200 田间试验和统计方法第三章次数分布 、平均数和变异数 (二)属性变数资料的整理(二)属性变数资料的整理 属性分组(属性分组(y) y) 次数次数(f)(f) 红米非糯红米非糯 9696 红米糯稻红米糯稻 3737 白米非糯白米非糯 3131 白米糯稻白米糯稻 1515 合计(合计(n n) 179179 田间试验和统计方法第三章次数分布 、平均数和变异数 (三)连续性变数资料的整理(三)连续性变数资料的整理

13、 连续性变数资料的次数分布表的制作程序:连续性变数资料的次数分布表的制作程序: 数据排序数据排序 求极差求极差 确定组数和组距确定组数和组距 确定组限与组中值确定组限与组中值 确定各组次数确定各组次数 田间试验和统计方法第三章次数分布 、平均数和变异数 140 140行水稻产量行水稻产量 177 215 197 97 123 159 245 119 119 131 149 152 167 104 161 214 125 175 219 118 192 176 175 95 136 199 116 165 214 95 158 83 137 80 138 151 187 126 196 134

14、206 137 98 97 129 143 179 174 159 165 136 108 101 141 148 168 163 176 102 194 145 173 75 130 149 150 161 155 111 158 131 189 91 142 140 154 152 163 123 205 149 155 131 209 183 97 119 181 149 187 131 215 111 186 118 150 155 197 116 254 239 160 172 179 151 198 124 179 135 184 168 169 173 181 188 211 1

15、97 175 122 151 171 166 175 143 190 213 192 231 163 159 158 159 177 147 194 227 141 169 124 159 1、极差、极差 R=254-75=179 2、确定组数和组距、确定组数和组距 组距组距=极差极差/组数组数 假定分假定分12组组 田间试验和统计方法第三章次数分布 、平均数和变异数 则组距为则组距为179/12=14.9,179/12=14.9,方便起见,以方便起见,以15g15g作为组距。作为组距。 在确定组数和组距应考虑:在确定组数和组距应考虑: (1 1)、观察值个数的多少)、观察值个数的多少 (2

16、2)、极差的大小)、极差的大小 (3 3)、便于计算)、便于计算 (4 4)、能反映资料的真实面貌等方面)、能反映资料的真实面貌等方面 样本容量样本容量 分组时的组数分组时的组数 50 5-1050 5-10 100 8-16100 8-16 200 10-20200 10-20 300 12-24300 12-24 500 15-30500 15-30 1000 20-401000 20-40 田间试验和统计方法第三章次数分布 、平均数和变异数 3 3、选定组限和组中值(组值)、选定组限和组中值(组值) (1 1)组值最好是整数或与观察值位数相同)组值最好是整数或与观察值位数相同 (2 2)

17、组限要明确,最好比原始资料的数字多)组限要明确,最好比原始资料的数字多 一位小数一位小数 (3 3)组距确定后,先选定第一组的中点值,)组距确定后,先选定第一组的中点值, 第一组中点值以接近最小观察值为好第一组中点值以接近最小观察值为好 4 4、把原始资料的各个观察值按分组数列的各把原始资料的各个观察值按分组数列的各 组限归组组限归组 田间试验和统计方法第三章次数分布 、平均数和变异数 140140行水稻的次数分布表行水稻的次数分布表 组限组限 中点值中点值(Y) 次数(次数(f) 67.5-82.5 75 2 82.5-97.5 90 7 97.5-112.5 105 7 112.5-127

18、.5 120 13 127.5-142.5 135 17 142.5-157.5 150 20 157.5-172.5 165 25 172.5-187.5 180 21 187.5-202.5 195 13 202.5-217.5 210 9 217.5-232.5 225 3 232.5-247.5 240 2 247.5- 262.5 255 1 田间试验和统计方法第三章次数分布 、平均数和变异数 三三 、次数分布图、次数分布图 方柱形图方柱形图 适用连续性变数适用连续性变数 多边形图多边形图 适用连续性变数适用连续性变数 3. 3. 条形图条形图 适用间断性变数和属性变数适用间断性变数

19、和属性变数 4. 4. 饼图饼图 适用间断性变数和属性变数适用间断性变数和属性变数 田间试验和统计方法第三章次数分布 、平均数和变异数 方柱形图方柱形图 适合于连续性适合于连续性 变数资料变数资料 田间试验和统计方法第三章次数分布 、平均数和变异数 140140行水稻产量次数分布多边形图行水稻产量次数分布多边形图 适合于连续性 变数资料 田间试验和统计方法第三章次数分布 、平均数和变异数 饼图饼图 适合于间断性适合于间断性 变数和属性资料变数和属性资料 田间试验和统计方法第三章次数分布 、平均数和变异数 水稻水稻F F2 2代米粒性状分离条形图代米粒性状分离条形图 适合于间断性适合于间断性 变

20、数和属性资料变数和属性资料 田间试验和统计方法第三章次数分布 、平均数和变异数 第三节第三节 平均数平均数 平均数的意义平均数的意义 平均数的种类平均数的种类 算术平均数的计算方法算术平均数的计算方法 算术平均数的重要特性算术平均数的重要特性 田间试验和统计方法第三章次数分布 、平均数和变异数 一、平均数的意义:一、平均数的意义: 平均数是数据的代表值,表示资料中观察值的中心位置。平均数是数据的代表值,表示资料中观察值的中心位置。 是表示资料集中性的特征数。可作为资料代表与另一是表示资料集中性的特征数。可作为资料代表与另一 组资料相比较。组资料相比较。 二、平均数的种类二、平均数的种类 算术平

21、均数算术平均数 n y n y n yyy y n i i n 121 0 1 2 3 4 5 6 7 8 9 10 平均数平均数 = 5 平均数平均数 = 6 1 2 3 4 5 6 7 14 田间试验和统计方法第三章次数分布 、平均数和变异数 中数:又名中位数,是指将所得资料从大中数:又名中位数,是指将所得资料从大 到小排序,居中间位置的观察值称为中数,到小排序,居中间位置的观察值称为中数, 记作记作Md。 0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 中位数中位数= 5中位数中位数= 5 田间试验和统计方法第三章次数分布 、平均数和

22、变异数 几何平均数几何平均数 : n n n n yyyyyyG 1 2121 )( n 个观测值相乘之积开个观测值相乘之积开 n 次方所得次方所得 的方根,称为几何平均数,记为的方根,称为几何平均数,记为G 。其计算公式如下:。其计算公式如下: 田间试验和统计方法第三章次数分布 、平均数和变异数 众数:是指资料中最常见的一数或次数最多一众数:是指资料中最常见的一数或次数最多一 组的中点值。计作组的中点值。计作M0即出现频率最大即出现频率最大 众数可能不存在众数可能不存在 可能有多个众数可能有多个众数 多用于属性数据多用于属性数据 0 1 2 3 4 5 6 7 8 9 10 11 12 13

23、 14 众数众数 = 9 没有众数没有众数 田间试验和统计方法第三章次数分布 、平均数和变异数 三、算术平均数的计算方法三、算术平均数的计算方法 直接法直接法 加权法加权法 四、算术平均数的重要特性四、算术平均数的重要特性 离均差的总和等于离均差的总和等于0 0 离均差的平方和最小离均差的平方和最小 iii fyfy/ n y n y n yyy y n i i n 121 )()()()( 21 yyyyyyyy n 0)( )( 21 ynyyyyny ynyynyyy n 22 22 22 )()()(2)( )()( )(2)( )()()( aynyyayyy ayayyyyy ay

24、yyay 2 22 )()()( aynyyay田间试验和统计方法第三章次数分布 、平均数和变异数 第四节第四节 变异数变异数 变异数变异数:用来反映平均数代表性的优劣。常用用来反映平均数代表性的优劣。常用 的有极差、方差、标准差和变异系数。的有极差、方差、标准差和变异系数。 反映反映 资料中离散性的特征数。资料中离散性的特征数。 田间试验和统计方法第三章次数分布 、平均数和变异数 一、极差:极差又称全距。是资料中最大观察值与最小一、极差:极差又称全距。是资料中最大观察值与最小 观察值的差数。用观察值的差数。用“R R”来表示。我们举个例子来说明。来表示。我们举个例子来说明。 例如调查两个不同

25、品种的小麦每穗小穗数,每品种计例如调查两个不同品种的小麦每穗小穗数,每品种计 1010个数,经过整理其数字为个数,经过整理其数字为 品品 种种 名名 称称 每穗小穗数每穗小穗数 总总 和和 平平 均均 甲甲13131414151517171818181819192121222223231801801818 乙乙16161616171718181818181818181919202020201801801818 甲 甲 乙 乙 田间试验和统计方法第三章次数分布 、平均数和变异数 二、方差二、方差 1 )( 1 )( /)(2 1 )(/)(2 1 )(2 1 2 1 )( 2 2 2 22 22

26、2 2 2 2 22 2 n n y y n n y nyy n n y nnyy n n y n y yy n yyyy n yyi s 田间试验和统计方法第三章次数分布 、平均数和变异数 用观察值数目来除平方和用观察值数目来除平方和, ,得到平均平方和得到平均平方和, ,简称均方或方差简称均方或方差, , 样本均方用样本均方用s s2 2来表示,定义为来表示,定义为 df SS n SS n yy s n i 11 )( 1 2 2 田间试验和统计方法第三章次数分布 、平均数和变异数 标准差的定义标准差的定义 标准差(标准差(Standard DeviationStandard Devia

27、tion)是方差的正根值,可)是方差的正根值,可 以很好的表示资料的变异度,其单位与观察值的度量以很好的表示资料的变异度,其单位与观察值的度量 单位相同。单位相同。 样本标准差(样本标准差(S S) 总体标准差(总体标准差() 1 )( 2 n xy s i N yi 2 )( 1 )( 2 i ii f yyf s 田间试验和统计方法第三章次数分布 、平均数和变异数 自由度(自由度(degree of freedomdegree of freedom,所写为,所写为DFDF) 解释之一:解释之一: 对于一个具有对于一个具有n n个观察值的样本,每个个观察值的样本,每个y y与其平均数与其平均

28、数 比较时,虽然具有比较时,虽然具有n n个离均差,但因受到离均差之和等于个离均差,但因受到离均差之和等于0 0的的 限制,所以只能有限制,所以只能有n n1 1个是自由的。个是自由的。 例如:有例如:有5 5个观察值,其个观察值,其4 4个的离均差为个的离均差为3 3,2 2,3 3, 6 6,则第,则第5 5个离均差必定为个离均差必定为8 8,才能保证离均差之和等于,才能保证离均差之和等于0 0。 所以,在估计其他统计数时,如果该统计数受所以,在估计其他统计数时,如果该统计数受K K个条件限制,个条件限制, 则其自由度应该为则其自由度应该为n nK K。 在应用上,小样本一定要用自由度来估算标准差;若为大样在应用上,小样本一定要用自由度来估算标准差;若为大样 本,因本,因n n和和n n1 1相差较小,可直接用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论