生物统计与田间试验总复习_第1页
生物统计与田间试验总复习_第2页
生物统计与田间试验总复习_第3页
生物统计与田间试验总复习_第4页
生物统计与田间试验总复习_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物统计与田间试验第一章 绪论科学试验及其误差控制1.科学研究的基本方法:选题、文献、假说、假说的检验、试验的规划与设计。 2.唯一差异性原则:除需要比较的因素以外,其余的因素必须保持在同一水平。3.试验方案:指根据试验目的和要求所拟进行比较的一组试验处理(treatment)的总称。4.处理因素必须是:可控的;在数量上或质量上具有不同等级或水平。5.水平(level):因素内的不同状态或者数量等级称为水平。6.处理(treatment) :试验中的具体比较项目叫做处理。 在单因素试中,每一个水平就是一个处理;在多因素试验中,每一个水平组合是一个处理。7.试验因素、水平、处理是三个密切联系的概

2、念:凡一个因素就有若干个水平,因素与水平是联系在一起的。水平组合是针对多因素试验而言的;一个水平组合是每个因素各出一个水平构成,为一个处理。一个多因素试验的所有不同的水平组合数是各因素水平数之积。8.试验指标:衡量试验处理效果的标准,简称指标。包括试验单元、抽样单元、测量单元。9.试验效应(experimental effect) :试验因素对试验指标所起的增加或减少的作用。简单效应(simple effect): 在同一因素内两种水平间试验指标的相差。 主要效应(main effect);简称主效: 一个因素内各简单效应的平均数称平均效应;交互作用效应(interaction effect)

3、,简称互作:两个因素简单效应间的平均差异。 9.一级互作(first order interaction) : 两个因素间的互作, A×B、B×C 。易于理解,实际意义明确;二级互作(second order interaction) :三个因素间的互作。10.应有对照水平或处理,简称对照(check,CK)。11.观察值(observation):将每次所取样品测定的结果称为一个观察值,记为yi。12.误差(error):观察值与真值之间的差异。13.偶然性误差(spontaneous error)或随机误差(random error):这是由于许多无法控制的内在和外在的

4、偶然因素所造成。随机误差影响试验的精确性。14.系统误差(systematic error)也叫片面误差(lopsided error):是由于试验材料、管理指施相差较大,仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的差异所引起。系统误差影响试验的准确性。15.准确性(accuracy)也叫准确度:指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度,系统误差影响了数据的准确性。16.精确性(precision)也叫精确度:指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度,偶然误差影响了数据的精确性。17统计(statistics):指对某一现象的有关的数据的收集

5、、整理、计算和分析等。第二章 田间试验的设计与实施1.田间试验的基本要求:(1) 试验目的要明确;(2)试验条件要有代表性; (3)试验结果要可靠;(4)试验结果要能够重演;(5)体现唯一差异原则。2. 田间试验设计(field experiment design) :广义是指整个试验研究课题的设计,包括确定试验处理的方案,小区技术,以及相应的资料搜集、整理和统计分析的方法等;狭义专指小区技术,特别是重复区和试验小区的排列方法。3.田间试验设计的原则:重复(replication) :试验中同一处理种植的小区数即为重复次数。随机 (random):是指一个区组中每一处理都有同等的机会设置在任何

6、一个试验小区上,避免任何主观成见。局部控制(local control): 局部控制就是将整个试验环境分成若干个相对最为一致的小环境,再在小环境内设置成套处理,即在田间分范围分地段地控制土壤差异等非处理因素,使之对各试验处理小区的影响达到最大程度的一致。 重复的作用:估计试验误差、降低试验误差。4.小区(plot):在田间试验中,每安排一个处理的小块地段。5.生长竞争:当相邻小区种植不同品种或相邻小区施用不同肥料时,由于株高、分蘖力或生长期的不同,通常将有一行或更多行受到影响。 6.边际效应:小区两边或两端的植株,因占较大空间而表现的差异,小区面积应考虑边际效应大小,边际效应大的相应需增大小区

7、面积。7.区组( block ) :将全部处理小区分配于具有相对同质的一块 土地上,这称为一个区组(block) 。完全区组:一般试验须设置34次重复,分别安排在34个区组上,这时重复与区组相等,每一区组或重复包含有全套处理,称为完全区组。不完全区组:少数情况下,一个重复安排在几个区组上,每个区组只安排部分处理,称为不完全区组。 8.对比法设计(contrast design):这种设计的排列特点是每一供试品种均直接排列于对照区旁边,使每一小区可与其邻旁的对照区直接比较。9.间比法设计(interval contrast design):排列的第一个小区和末尾的小区一定是对照(CK)区,每二对

8、照区之间排列相同数目的处理小区。10.随机排列的试验设计:完全随机设计 (Completely random design):适用于单因素、多因素试验。随机区组设计 (Randomized blocks design):每一重复为一个区组,区组数=重复数;不同区组的随机排列是独立进行的。拉丁方设计 (Latin square design):每行(列)都含有全部不同元素,且行、列数都相等的方格图。标准(拉丁)方:第一行和第一列为顺序排列的拉丁方。裂区设计 (Split-plot design): 试验因素分级;先按主处理水平数划分小区;然后分别在每一主区中按副处理的水平数划分小区;每一区组内的

9、各主处理和每一主区中的各副处理的随机排列都是独立进行的。再裂区设计 (Split-split plot design):将第三个因素的各个处理(称为副副处理),随机排列于再裂区内的设计。条区设计 (Strip blocks design):适用于双因素试验的方法。11.总体:指根据研究目的确定的符合指定条件的全部研究对象。12.样本:指从总体中抽出的代表总体的部分个体。随机样本:用随机方法从总体中抽出的样本。样本容量:样本中包含的个体数,常用 n 表示。大样本:n30;小样本:n30 13.抽样方法:随机抽样:简单随机抽样、分层抽样、整群抽样顺序抽样第三章 次数分布、平均数、变异数试验数据的整

10、理1.总体( population):具有共同性质的个体所组成的集团。有限总体-总体所包含的个体数目有无穷多个;无限总体-由有限个个体构成的总体。2.观察值( observation):每一个体的某一性状、特性的测定数值。3.变数( variable):观察值集合起来,称为总体的变数。变数又称为随机变数(random variable)。 4.样本( sample):从总体中抽取若干个个体的集合称为样本(sample)。5.统计数( statistic):测定样本中的各个体而得的样本特征数,如平均数等,称为统计数(statistic)。6.随机样本( random sample):从总体中随机

11、抽取的样本称为随机样本(random sample) 7.样本容量 ( sample size):样本中包含的个体数称为样本容量或样本含量(sample size)。8. 数量性状(quantitative trait)的度量有计数和量测两种方式,其所得变数不同。不连续性或间断性变数( discontinuous or discrete variable ):指用计数方法获得的数据。 连续性变数( continuous variable ):指称量、度量或测量方法所得到的数据,其各个观察值并不限于整数,在两个数值之间可以有微量数值差异的第三个数值存在。 9.质量性状( qualitative

12、trait ):指能观察而不能量测的状即属性性状,如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。10.连续性变数资料的整理:数据排序(sort) 求极差(range)确定组数和组距( class interval )选定组限( class limit )和组中点值( 组值,class value ) 把原始资料的各个观察值按分组数列的各组组限归组。11. 五种类型平均数(average):算术平均数、中数、众数、几何平均数、调和平均数。算术平均数的重要性质:离均差之和为零、离均差平方和最小。几何平均数:12.13.自由度:指样本内独立而能自由变动的离均差个数。样本自由度DF等于观察值

13、的个数(n)减去约束条件的个数(k),即DF=n-k。14.矫正数公式:15.变异系数:16.理论总体(群体)的平均数和标准差:第四章 理论分布与抽样分布1. 小概率原理(小概率事件实际不可能性原理):如在假定条件下能准确算出事件A出现的概率很小,则在相同条件的无数次重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生。2所谓二项总体( binary population ):就是非此即彼的两类事件构成的总体。3.二项分布( binomial distribution ):如果从二项总体进行n次重复抽样,设出现“此”的次数为y,那么y的取值可能为0、1、2、n,共有n+1种可能

14、取值,这n+1种取值各有其概率,因而由变量y及其概率就构成了一个分布,这个分布叫做二项式概率分布。变量y也称为服从二项分布的随机变量,记作yB(n,p)。4. 二项式分布的参数总体平均数 np 总体方差 2npqnp(1p) 二项总体标准差 5.泊松分布:令np=m形状由m的大小决定(1)m 小,偏斜状(2)m增大,逐渐对称、趋于正态分布(3)在实际中,如m 10,则可用正态分布以求概率6.正态分布令 可将 标准化为: 上式称为标准化正态分布方程,它是参数0,21时的正态分布(图4.7)。记作N(0,1)。正态分布的一些常用区间及其对应的概率值如下:区间±1面积或概率=0.6827&

15、#177;2=0.9545±3=0.9973±1.960=0.9500±2.576=0.9900例题:已知:=30,=5 ,yN(30,52)求: P(y<26), P(y<40), P(26<y<40 ), P(y>40)=?解: P(y<26)= P(u<0.8)=0.2119P(y<40)= P(u<2)=0.977 P(26<y<40)= P(y<40)-P(y<26)=0.97730.2119=0.7654P(y>40)=1 P(y40)=10.9773=0.02277.

16、抽样分布( sampling distribution ):是统计推断的基础。研究总体和样本之间的关系的两个方向:第一个方向:总体样本,一般特殊;第二个方向:样本总体,特殊一般。8. 无限总体:可抽得无限多个随机样本。有限总体:总体容量为 N,样本容量为 n ,所有可能样本个数m=Nn 平均数9.正态总体的抽样分布规律:对于任何分布的原始总体,样本均数总体的平均数 ,方差 ,标准差 若yN(, 2),则 若y不服从N(, 2),只要n,仍有 中心极限定理于是, N(0,12)10.单个样本平均数的抽样分布规律从总体方差已知的正态总体的抽样 样本平均数为正态分布 从未知总体抽样,只要n >

17、30样本平均数服从正态分布 从正态总体的抽样,总体方差未知, n30 t分布 11.两个独立样本平均数差数的分布规律对于任何分布的原始总体,都有两个独立样本平均数差数总体的总体平均数 12,总体方差 总体标准差 若y1N( ), y2N( ), 则有 N(12 , ) 若y1、y2都不服从正态分布,只要n1、n2,仍有 N(12 , ,于是, N(0,12)12.二项总体的抽样分布二项总体的分布参数 平均数 方差二项百分数的分布参数平均数 方差二项次数分布的参数平均数 方差第五章 统计假设测验(显著性检验)1. 统计假设测验的步骤可总结如下:(1) 对样本所属的总体提出统计假设,包括无效假设H

18、0:=0(1=2)和备择假设HA: 0(1 2)。(2) 规定测验的显著水平值。通常=0.05,0.01。(3) 在H0为正确的假定下,根据平均数或其他统计数的抽样分布,如为正态分布的则计算正态离差u值。由u值查附表3即可知道因随机抽样而获得实际差数由误差造成的概率。(4) 将规定的值和算得的u值的概率相比较,或者将试验结果和否定区域相比较,根据“小概率事件实际上不可能发生”原理接受或否定假设,从而作出接受或否定无效假设的推断。2.两尾测验( two-tailed test ):如果统计假设为H0:=0, 则备择假设为HA: 0, 在假设测验时所考虑的概率为曲线左边一尾概率(小于0)和右边一尾

19、概率(大于0)的总和。3.一尾测验( one-tailed test ): 如果统计假设为H0:0, 则其对应的备择假设必为HA: 0。因而,这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域,即曲线的右边一尾。4.假设测验的两类错误:第一类错误的概率为显著水平值。(H0是正确的,却被否定);第二类错误的概率为值。(H0是错误的,却被肯定)5. t 分布:若YN(,2),当 抽样样本容量n30, 则 6. 平均数的假设测验从总体方差已知的正态总体的抽样 样本平均数为正态分布 u测验从未知总体抽样,只要n 30样本平均数服从正态分布 u测验从正态总体的抽样,总体方差未知, n<3

20、0 t分布 t测验7.单个样本平均数的假设测验某春小麦良种的千粒重m034g,现自外地引入一高产品种,在8个小区种植,得千粒重(g)35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千粒重是否显著高于当地良种?已知: 0=34g, n=8, þ 35.2g, s=1.64g假设H0:0(两品种千粒重无显著差异)HA:0 显著水准0.05、0.01(两尾)v=n1= 81=7t0.05(7)2.365, t0.01(7)3.499t2.069<t0.05(7)2.365 推断:接受H0,认为差异不显著,即新引入品种千粒重与当地良种千粒重

21、无显著差异。8.两个样本平均数差异的假设测验(一)成组数据的平均数比较:如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据。 12 、22已知或者12 、22未知,但为大样本,n130 , n230 用u测验 简化为: 12 、22未知,但可假定12=22=2, 两样本为小样本 n130 , n230 简化为: 12 、22未知,且12 22,n1230 , n230(二)成对数据的比较:若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。在实践上

22、,如将成对数据按成组数据的方法比较,容易使统计推断发生第二类错误,即不能鉴别应属显著的差异。故在应用时需严格区别。9.二项资料的百分数假设测验单个样本百分数(成数)的假设测验 两个样本百分数相比较的假设测验单个样本百分数假设测验的连续性矫正 两个样本百分数假设测验的连续性矫正10.总体平均数2的置信限(一)在总体方差2为已知时 (二)在总体方差2为未知时 11.两总体平均数差数( )的置信限(一)在两总体方差为已知或两总体方差虽未知但为大样本时 (二)在两总体方差为未知时, 有两种情况: 假设两总体方差相等 两总体方差不相等 (三)成对数据总体差数 的置信限 12.二项总体百分数p的置信限 1

23、3.两个二项总体百分数差数(p1p2)的置信限 14.区间估计用于假设测验:对参数所作假设若恰落在该范围内,则这个假设与参数就没有真实的不同,因而接受 H0;反之,如果对参数所作的假设落在置信区间之外,则说明假设与参数不同,所以应否定 H0,接受 HA。 第六章 方差分析1.方差分析:是关于k(k3)个样本平均数的假设测验方法,是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。2.自由度和平方和的分解3.F分布:就是在给定的 v1 和 v2 下按上述方法从正态总体中进行一系列抽样,就可得到一系列的F 值而作成一个分布。 在F 测验中,如果作分子

24、的均方小于作分母的均方,则F<1;此时不必查F表即可确定P>0.05,应接受H0。4.多重比较有三种:最小显著差数法、复极差法( q法) 、Duncan氏新复极差法最小显著差数法 复极差法( q法) Duncan氏新复极差法5.多重比较结果的表示方法:列梯形表法、划线法、标记字母法6.方差分析的线性数学模型: ,为总体平均数,为试验处理效应,为随机误差具有分布N(0,)。7.期望均方:固定模型: 随机模型:混合模型:乃既包括有固定模型的试验因素,又包括有随机模型的试验因素的模型。8.单向分组资料的方差分析组内观察值数目相等的单向分组资料的方差分析组内观察值数目不等的单向分组资料的方

25、差分析组内又分亚组的单向分组资料的方差分析(1) 总变异 (2) 组间(处理间)变异(3) 同一组内亚组间的变异 (4) 亚组内的变异 9.两向分组资料的方差分析组合内只有单个观察值的两向分组资料的方差分析组合内有重复观察值的两向分组资料的方差分析10.方差分析的基本假定:处理效应与环境效应等应该具有“可加性”试验误差 “正态性” 误差同质性11.数据转换的方法有:平方根转换、对数转换、反正弦转换、采用几个观察值的平均数作方差分析。 第七章 卡平方( )测验1. ,上式中O为观察次数,E为理论次数2.一个样本方差与给定总体方差比较的假设测验在作两尾测验时有 ,对 。其显著大于和小于C的值是&g

26、t; 和< ,此时,H0在显著水平上被否定若测验该样本总体方差是否小于某给定总体方差C,则作一尾测验,即H0: C对HA: C , 如果算得的 ,则否定H0,否则接受H0;这里应用分布的右边一尾。如果测验其是否大于C,则H0: C对HA: C,若算得的 ,则否定H0;这是应用分布的左边一尾。 3.同质性测验:假定有3个或3个以上样本,每一样本均可估得一方差, 则由 可测验各样本方差是否来自相同方差总体的假设,这称为方差的同质性测验4.适合性测验的方法(1)设立无效假设,即假设观察次数与理论次数的差异由抽样误差所引起,即H0:花粉粒碘反应比例为11与HA:花粉粒碘反应比例不成11。(2)确

27、定显著水平=0.05。(3)在无效假设为正确的假定下,计算超过观察卡方值的概率,这可由 计得卡方值后,按自由度查附表6得到。试验观察的卡方值愈大,观察次数与理论次数之间相差程度也愈大,两者相符的概率就愈小。(4)依所得概率值的大小,接受或否定无效假设。由间断性资料算得的卡方值有偏大的趋势(尤其在自由度为1时),需作连续性矫正。5.卡方测验的应用:同质性测验、适合性测验、独立性测验6,独立性测验方法的各种类型:2×2表的独立性测验(需要矫正)、2×C表的独立性测验、r×c表的独立性测验。H0:两个变数相互独立,对HA:两个变数彼此相关。 计算过程: (1)将所得次数

28、资料按两个变数作两向分组,排列成相依表;(2)根据两个变数相互独立的假设,算出每一组格的理论次数; (3)由 算得卡方值。 这个卡方的自由度随两个变数各自的分组数而不同,设横行分r组,纵行分c组,则 V=(r1)(c1)。当观察的 时,便接受H0,即两个变数相互独立;当观察的 时,便否定H0,接受HA,即两个变数相关。第九章 直线回归和相关1.函数关系:是一种确定性的关系,例如圆面积与半径的关系。其不包含误差的干扰。2.统计关系:是一种非确定性的关系。例如,作物的产量与施肥量的关系,两类变数受误差的干扰表现为统计关系。3.相关分析:计算相关系数为基础的统计分析方法。计算表示Y 和X 相关密切程度的统计数,并测验其显著性。这个统计数在两个变数为直线相关时称为相关系数,记为r;在多元相关时称为复相关系数,记作Ry·12m ;在两个变数曲线相关时称为相关指数,记作R。4.直线回归方程式 。回归截距:a是x=0时的值,即回归直线在y 轴上的截距。回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论