版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章 绪论科学试验及其误差控制第一节 科学研究与科学试验一、农业和生物学领域的科学研究自然科学中有二大类科学,一类是理论科学,一类是实验科学。理论科学研究主要运用推理,包括演绎和归纳的方法。实验科学研究主要通过周密设计的实验来探新。农业和生物学领域中与植物生产有关的专业包括农学、园艺、草业、植物保护、生物技术、农业资源与环境等,所涉及的学科大多数是实验科学。这些领域中科学实验的方法主要有二类,一类是抽样调查,另一类是科学试验。生物界千差万别,变化万端,要准确地描述自然,通常必须通过抽样的方法,使所做的描述具有代表性。同理,要准确地获得试验结果,必须严格控制试验条件,使所比较的对象间尽可能少受
2、干扰而能把差异突出地显示出来。二、科学研究的基本过程和方法 (一) 科学研究的基本过程 科学研究的目的在于探求新的知识、理论、方法、技术和产品。基础性或应用基础性研究在于揭示新的知识、理论和方法;应用性研究则在于获得某种新的技术或产品。在农业科学领域中不论是基础性研究还是应用性研究,基本过程均包括3个环节:(1)根据本人的观察(了解)或前人的观察(通过文献)对所研究的命题形成一种认识或假说;(2)根据假说所涉及的内容安排相斥性的试验或抽样调查;(3)根据试验或调查所获的资料进行推理,肯定或否定或修改假说,从而形成结论,或开始新一轮的试验以验证修改完善后的假说,如此循环发展,使所获得的认识或理论
3、逐步发展、深化。 (二) 科学研究的基本方法 1. 选题 科学研究的基本要求是探新、创新。研究课题的选择决定了该项研究创新的潜在可能性。科学研究不同于平常一般的工作,它需要进行独创性的思维。因此要求所选的课题使研究者具有强烈的兴趣,促进研究者心理状态保持十分敏感。反之若所选的课题并不激发研究者的兴趣,那么这项研究是难以获得新颖的见解和成果的。有些课题是资助者设定的,这时研究者必须认真体会它的确实意义并激发出对该项研究的热情和信心。2. 文献 科学的发展是累积性的,每一项研究都是在前人建筑的大厦顶层上添砖加瓦,这就首先要登上顶层,然后才能增建新的层次,文献便是把研究工作者推到顶层,掌握大厦总体结
4、构的通道。选题要有文献的依据,设计研究内容和方法更需文献的启示。查阅文献可以少走弯路,所花费的时间将远远能为因避免重复、避免弯路所节省的时间所补偿,绝对不要吝啬查阅文献的时间和功夫。3. 假说 在提出一项课题时,对所研究的对象总有一些初步的了解,有些来自以往观察的累积,有些来自文献的分析。因而围绕研究对象和预期结果之间的关系,研究者常已有某种见解或想法,即已构成了某种假说,而须通过进一步的研究来证实或修改已有的假说。一项研究的目的和预期结果总是和假说相关联的,没有形成假说的研究,常常是含糊的、目的性不甚明确的。即便最简单的研究,例如进行若干个外地品种与当地品种的比较试验,实际上有其假说,即“某
5、地引入种可能优于当地对照种”,只不过说这类研究的假说比较简单而已。4. 假说的检验 对假说进行检验,可以重新对研究对象进行观察,更多的情况是进行实验或试验,这是直接的检验。有时也可对假说的推理安排试验进行验证,这是一种间接的检验,验证了所有可能的推理的正确性,也就验证了所做的假说本身,当然这种间接的检验要十分小心,防止漏洞。5. 试验的规划与设计 围绕检验假说而开展的试验,需要全面、仔细地规划与设计。试验所涉及的范围要覆盖假说涉及的各个方面,以便对待检验的假说可以作出无遗漏的判断。农业和生物学的试验中十分重视试验结果的代表性和重演性,从而可以明确研究结果的适用范围和稳定程度。因而要求试验材料和
6、试验的环境条件有代表性。这是因为作为试验材料的生物体是存在遗传分化的,作为应用试验结果的地点是有地理、季节、土壤等环境差异的。设计一项试验时必须考虑到试验材料和试验环境的代表性和典型性。第二节 试验方案一、试验因素与水平如上节所述,试验方案是根据试验目的和要求所拟进行比较的一组试验处理(treatment)的总称。这里被固定的因子在全试验中保持一致,组成了相对一致的试验条件;被变动并设有待比较的一组处理的因子称为试验因素,简称因素或因子(factor),试验因素的量的不同级别或质的不同状态称为水平(level)。试验因素水平可以是定性的,如供试的不同品种,具有质的区别,称为质量水平;也可以是定
7、量的,如喷施生长素的不同浓度,具有量的差异,称为数量水平。试验方案按其供试因子数的多少可以区分为以下3类:(1) 单因素试验(single-factor experiment) 单因素试验是指整个试验中只变更、比较一个试验因素的不同水平,其他作为试验条件的因素均严格控制一致的试验。这是一种最基本的、最简单的试验方案。 (2) 多因素试验(multiple-factor or factorial experiment) 多因素试验是指在同一试验方案中包含2个或2个以上的试验因素,各个因素都分为不同水平,其他试验条件均应严格控制一致的试验。各因素不同水平的组合称为处理组合(treatment co
8、mbination)。处理组合数是各供试因素水平数的乘积。这种试验的目的一般在于明确各试验因素的相对重要性和相互作用,并从中评选出1个或几个最优处理组合。如进行甲、乙、丙3个品种与高、中、低3种施肥量的2因素试验,共有甲高、甲中、甲低、乙高、乙中、乙低、丙高、丙中、丙低等3×3=9个处理组合。这样的试验,除了可以明确2个试验因素分别的作用外,还可以检测出3个品种对各种施肥量是否有不同反应并从中选出最优处理组合。生物体生长受到许多因素的综合作用,采用多因素试验,有利于探究并明确对生物体生长有关的几个因素的效应及其相互作用,能够较全面地说明问题。多因素试验的效率常高于单因素试验。(3)
9、综合性试验(comprehensive experiment) 这也是一种多因素试验,但与上述多因素试验不同。综合性试验中各因素的各水平不构成平衡的处理组合,而是将若干因素的某些水平结合在一起形成少数几个处理组合。这种试验方案的目的在于探讨一系列供试因素某些处理组合的综合作用,而不在于检测因素的单独效应和相互作用。单因素试验和多因素试验常是分析性的试验;综合性试验则是在对于起主导作用的那些因素及其相互关系已基本清楚的基础上设置的试验。二、试验指标与效应 用于衡量试验效果的指示性状称试验指标(experimental indicator)。例如农作物品种比较试验中,衡量品种的优劣、适用或不适用,
10、围绕育种目标需要考察生育期(早熟性)、丰产性、抗病性、抗虫性、耐逆性等多种指标。在设计试验时要合理地选用试验指标,它决定了观测记载的工作量。过简则难以全面准确地评价试验结果,功亏一篑;过繁琐又增加许多不必要的浪费。试验指标较多时还要分清主次,以便抓住主要方面。试验因素对试验指标所起的增加或减少的作用称为试验效应(experimental effect)。例如,某水稻品种施肥量试验,每亩施氮10kg,亩产量为350kg,每亩施氮15kg,亩产量为450kg;则在每亩施氮10kg的基础上增施5kg的效应即为450-350=100(kg/亩)。这一试验属单因素试验,在同一因素内两种水平间试验指标的相
11、差属简单效应(simple effect)。在多因素试验中,不但可以了解各供试因素的简单效应,还可以了解各因素的平均效应和因素间的交互作用。表1.1为某豆科植物施用氮(N)、磷(P)的2×2=4种处理组合(N1P1,N1P2,N2P1,N2P2)试验结果的假定数据,用以说明各种效应。(1)一个因素的水平相同,另一因素不同水平间的产量差异仍属简单效应。如表1.1中18-10=8就是同一N1水平时P2与P1间的简单效应;28-16=12为在同一N2水平时P2与P1间的简单效应;16-10=6为同一P1水平时N2与N1间的简单效应;28-18=10为同一P2水平时N2与N1间的简单效应。(
12、2)一个因素内各简单效应的平均数称平均效应,亦称主要效应(main effect),简称主效。如表1.1中N的主效为(6+10)/2=8,这个值也是二个氮肥水平平均数的差数,即22-14=8;P的主效为(8+12)/2=10,也是二个磷肥水平平均数的差数,即23-13=10。(3)两个因素简单效应间的平均差异称为交互作用效应(interaction effect),简称互作。它反映一个因素的各水平在另一因素的不同水平中反应不一致的现象。将表1.1以图1.1表示,可以明确看到,中的二直线平行,反应一致,表现没有互作。交互作用的具体计算为(8-8)/2=0,或(6-6)/2=0。图1.1中P2-P
13、1在N2时比在N1时增产幅度大,直线上升快,表现有互作,交互作用为(12-8)/2=2,或为(10-6)/2=2,这种互作称为正互作。图1.1和中,P2-P1在N2时比在N1时增产幅度表现减少或大大减产,直线上升缓慢,甚至下落成交叉状,这是有负互作。中的交互作用为(4-8)/2=-2,中为(-2-8)/2=-5。表1.1 2×2试验数据(解释各种效应)试验因素NP水平N1N2平均N2-N1P1101613 6P2182421 6平均1420 6P2-P1 8 880,0/2=0P水平N1N2平均N2-N1P1101613 6P218282310平均1422 8P2-P1 812104
14、,4/2=2P水平N1N2平均N2-N1P1101613 6P2182019 2平均1418 4P2-P1 8 46-4,-4/2=-2P水平N1N2平均N2-N1P1101613 6P2181416-4平均1415 1P2-P1 8-23 -10,-10/2=-5因素间的交互作用只有在多因素试验中才能反映出来。互作显著与否关系到主效的实用性。若交互作用不显著,则各因素的效应可以累加,主效就代表了各个简单效应。在正互作时,从各因素的最佳水平推论最优组合,估计值要偏低些,但仍有应用价值。若为负互作,则根据互作的大小程度而有不同情况。中由单增施氮(N2P1)及单增施磷(N1P2)来估计氮、磷肥皆增
15、施(N2P2)的效果会估计过高,但N2P2还是最优组合,还有一定的应用价值。而中N2P2反而减产,如从各因素的最佳水平推论最优组合将得出错误的结论。图1.1 2×2试验的图示(解释交互作用)两个因素间的互作称为一级互作(first order interaction)。一级互作易于理解,实际意义明确。三个因素间的互作称二级互作(second order interaction),余类推。二级以上的高级互作较难理解,实际意义不大,一般不予考察。三、制订试验方案的要点拟订一个正确有效的试验方案,以下几方面供参考: 1. 拟订试验方案前应通过回顾以往研究的进展、调查交流、文献探索等明确试验
16、的目的,形成对所研究主题及其外延的设想,使待拟订的试验方案能针对主题确切而有效地解决问题。2. 根据试验目的确定供试因素及其水平。供试因素一般不宜过多,应该抓住12个或少数几个主要因素解决关键性问题。每因素的水平数目也不宜过多,且各水平间距要适当,使各水平能有明确区分,并把最佳水平范围包括在内。例如通过喷施矮壮素以控制某种植物生长,其浓度试验设置50、100、150、200、250ppm等5个水平,其间距为50ppm。若间距缩小至10ppm便须增加许多处理,若处理数不多,参试浓度的范围窄,会遗漏最佳水平范围,而且由于水平间差距过小,其效应因受误差干扰而不易有规律性地显示出来。3. 试验方案中应
17、包括有对照水平或处理,简称对照(check,符号CK)。品种比较试验中常统一规定同一生态区域内使用的标准(对照)种,以便作为各试验单位共同的比较标准。4. 试验方案中应注意比较间的唯一差异原则,以便正确地解析出试验因素的效应。5. 拟订试验方案时必须正确处理试验因素及试验条件间的关系。一个试验中只有供试因素的水平在变动,其他因素都保持一致,固定在某一个水平上。在拟订试验方案时必须做好试验条件的安排,绝对不要以为强调了试验条件的一致性就可以获得正确的试验结果。例如品种比较试验时要安排好密度、肥料水平等一系列试验条件,使之具有代表性和典型性。由于单因子试验时试验条件必然有局限性,可以考虑将某些与试
18、验因素可能有互作(特别负互作)的条件作为试验因素一起进行多因素试验,或者同一单因素试验在多种条件下分别进行试验。6. 多因素试验提供了比单因素试验更多的效应估计,具有单因素试验无可比拟的优越性。但当试验因素增多时,处理组合数迅速增加,要对全部处理组合进行全面试验(称全面实施)规模过大,往往难以实施,因而以往多因素试验的应用常受到限制。解决这一难题的方法就是利用本书后文将介绍的正交试验法,通过抽取部分处理组合(称部分实施)用以代表全部处理组合以缩小试验规模。这种方法牺牲了高级交互作用效应的估计,但仍能估计出因素的简单效应、主要效应和低级交互作用效应,因而促进了多因素试验的应用。第三节 试验误差及
19、其控制一、试验数据的误差和精确性通过试验的观察或测定,获得试验数据,这是推论试验结果的依据。然而研究工作者获得的试验数据往往是含有误差的。例如测定一个大豆品种南农88-48的蛋白质含量,取一个样品(specimen)测得结果为42.35%,再取一个样品测得结果为41.98%,两者是同一品种的豆粒,理论上应相等,但实际不等,如果再继续取样品测定,所获的数据均可能各不相等,这表明实验数据确有误差。通常将每次所取样品测定的结果称为一个观察值(observation),以y表示。理论上这批大豆种子的蛋白质含量有一个理论值或真值,以表示,则,即观察值=真值+误差,每一观察值都有一误差,可正,可负,。对同
20、一块田里同一品种种子蛋白质含量的测定,观察值间存在变异,这种变异可归结为两种情况,一种是完全偶然性的,找不出确切原因的,称为偶然性误差(spontaneous error)或随机误差(random error);另一种是有一定原因的称为偏差(bias)或系统误差(systematic error)。若以上例中冷库保存的大豆种子为比较的标准,其种子蛋白质含量的观察值可表示为: 在常温下保存的大豆种子蛋白质含量的观察值可表示为: 式中,代表南农88-48大豆品种蛋白质含量的真值(理论值),、分别为每一样品观察值的随机误差,则为室温保存下(可能由于呼吸作用)导致的偏差或系统误差。两种保存方法下蛋白质
21、含量的差数 包含了系统偏差和随机误差两个部分。 a b c d图1.2 由打靶图示试验的准确性与精确性试验数据的优劣是相对于试验误差而言的。系统误差使数据偏离了其理论真值;偶然误差使数据相互分散。因而系统误差(值)影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;而偶然误差(、值)影响了数据的精确性,精确性是指观测值间的符合程度。图1.2以打靶的情况来比喻准确性和精确性。以中心为理论真值,a表示5枪集中在中心,准而集中,具有最佳的准确性和精确性;b表示5枪偏离中心有系统偏差但很集中,准确性差,而精确性甚佳;c表示5枪既打不到中心,又很分散,准确性和精确性均很差;d表示5枪很分散,但
22、能围绕中心打,平均起来有一定准确性,但精确性很差。农业和生物学试验中,常常采用比较试验来衡量试验的效应。如果两个处理均受同一方向和大小的系统误差干扰,这往往对两个处理效应之间的比较影响不大。当然若两处理分受两种不同方向和大小系统误差的干扰,便严重影响两个处理效应间的真实比较了。但一般的试验,只要误差控制得好,后面一种情况出现较少。因而研究工作者在正确设计并实施试验计划的基础上,十分重视精确性或偶然误差的控制,因为这直接影响到后文所要介绍的统计推论的正确性。二、试验误差的来源系统误差是一种有原因的偏差,因而在试验过程中要防止这种偏差的出现。这有赖于经验的积累。请教同行专家是也十分重要的。导致系统
23、偏差的原因可能不止一个,方向也不一定相同,所以实际观察的系统偏差往往是多种偏差的复合。田间试验是农业和生物学研究中最常用的研究手段,它比之其他研究有很多特殊性,其中最主要的是将生物体的反应作为试验指标,而试验又是在开放的自然条件下进行的,生物体及自然界的气候、土壤本身都存在很多变异,因而田间试验的误差控制是尤其重要的。一般讲,随机误差是偶然性的。整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能性及波动程度便愈大。随机误差不可能避免,但可以减少,这主要依赖于控制试验过程,尤其那些随机波动性大的因素。理论上,系统误差是可以通过试验条件及试验过程的仔细操作而控制的。
24、实际上一些主要的系统性偏差较易控制,而有些细微偏差则较难控制。一般研究工作在分析数据时把误差中的一些主要偏差排除以后,剩下都归结为随机误差,因而估计出来的随机误差有可能比想像的要大,甚至大得多。三、随机误差的规律性图1.3 随机误差的分布模式随机误差,只要确实是随机波动所致,也有其变化规律的。仍以大豆品种蛋白质含量的测定为例,若从一批种子中抽取100份样品,分别进行蛋白质含量的测定,若无系统偏差的干扰,则所获100个数据,将其平均数当作理论真值(上加帽子表示这100个数据所属总体真值的估计值),根据可计算出100个误差值。这100个误差值有“+”有“-”,平均起来正负相抵消等于0。若将其画成坐
25、标图,接近于一个对称的钟形图(图1.3),在靠近0的+、-范围内出现的误差次数多,越远离0出现的次数越少。这种随机误差的分布在第四章中将介绍是一种正态分布。许多以数量表示的观察值的误差常常属于这种模式。了解随机误差的这种模式对以后判断试验结果的表面效应是误差所致,还是一种真实的处理效应所致是至关重要的。以上单个样品蛋白质含量测定的误差可用作表示,若测定了多个样品则可用多个样品平均数作代表,表示该品种的平均蛋白质含量。显然在平均过程中正负误差抵消了一部分,因而平均数与单个观察值相比,虽然存在随机误差,但平均后要小得多。这里要强调,多个观察值的平均数既然是由单个观察值平均得来的,必然也存在随机误差
26、。当然观察值个数越多,其平均数由于正负相互抵消的作用越大而且也加以平均,因而误差便越小。既然平均数的误差是随机误差,因而它也像观察值的误差一样,具有相同的规律性,只是向0集中得更明显。第四节 试验统计学的发展和本课程的主要内容一、试验统计学的发展对农业和生物学研究工作者来说,试验统计学作为一门系统的学科奠基于1925年R.A. Fisher出版的“Statistical Methods for Research Workers”,该书形成了试验统计学较为完整的体系。在这以前23个世纪内已经积累了有关概率、分布和统计方法的一些要素。在这以后由于农业和生物学研究的发展,生物统计、试验设计和抽样理论
27、得到了快速发展。以后工业研究和数理科学研究的发展推动了数理统计的发展,反过来又促进了试验统计学科的发展。统计(statistics)是一个古老的政治术语,原用之于国家管理需要的统计数字,后来则将统计学看作为实验数据搜集、分析及推论的理论、方法和科学。试验统计学是统计学的一个部分,它是统计学与试验设计相结合而发展起来的。试验统计学的发展也是与随机误差和误差控制的研究紧密相关联的。以下一些研究进展为试验统计学的建立与发展奠定了基础:17世纪Pascal 和Fermat的概率论;18世纪De Moivre、Laplace和Gauss的正态分布理论;19世纪达尔文应用统计方法研究生物界的连续性变异;孟
28、德尔应用统计方法发现显性、分离、独立分配等遗传定律;Karl Pearson用统计方法研究进化问题,并创建了Biometrika杂志;Galton研究了亲子身高的回归问题;20世纪以来Gosset用实验方法发现了t分布;Fisher提出了方差分析,建立了试验设计的三大原理,并提出了随机区组、拉丁方等试验设计,还将统计方法用之于研究数量性状的基因效应;在此基础上Yates、Yule等发展了一系列的试验设计包括后来的混杂设计和不完全区组设计等;英国Rothamsted试验场在生物统计和田间试验设计方面卓有贡献;Neyman和E.S. Pearson建立了统计推断的理论;Snedecor建立了统计实验室并出版了“Statistical Methods Applied to Experiment in Agriculture and Biology”;Wald建立序贯分析和统计决策函数的理论;Cochran和Cox系统地归纳了试验设计和抽样方法研究的进展,出版了“Experimental Design”和“Sampling Technique”二书;Kempthorne将统计方法应用于数量性状的遗传研究,出版了“An Introduct
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 某中学中考一模语文试题(含答案)
- 2026年镇江京口区社区工作者招聘考试核心押题卷(第3套)(附独家高分解析)
- 潜江仙桃中考试题及答案
- 汽车基本电路试题及答案
- 2026比较仓促的面试题目及答案
- 2026编外会计面试题目及答案
- 2026兵团两委面试题及答案
- 2026病人吃药面试题及答案
- 2026博罗事业编面试题及答案
- 2026博物馆夜游面试题及答案
- 山东医师定期考核《全科医学》考试题库发布1
- 2026年安徽省高校毕业生三支一扶计划招募试题及答案
- 2026学年浙江省绍兴市一年级语文期末自测专项攻坚题(附答案)详细答案和解析
- 机械通气临床护理
- 电磁污水流量计
- ICU护理中的人文沟通技巧
- 防爆设计施工方案(3篇)
- 运输公司安全生产监督检查制度
- 2026年左心耳封堵术知情同意书
- 警用装备培训制度
- 英语培训机构 试讲课件
评论
0/150
提交评论