版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章试验设计与分析的
数理统计基础
第一节试验设计原理第二节随机数据的属性及其简单处理第三节总体及其样本第四节抽样分布第一节试验设计原理
一、田间试验的任务与要求二、试验方案三、试验误差四、试验单元与试验空间五、试验设计六、田间试验的实施一、田间试验的任务与要求
(一)田间试验的任务:主要形式、不可替代、桥梁。(二)田间试验的特点
1.复杂性:原因:一是生物有机体;二是自然条件。
2.误差大
3.周期长,季节性强(三)田间试验的要求
1.试验目的要明确
2.试验条件要有代表性:包括自然条件和农业条件
3.试验结果要可靠:用准确度和精确度衡量
4.试验结果要具有重演性二、试验方案
(一)基本概念
1.试验指标2.因素
3.水平4.处理
5.试验单元6.试验方案
7.效应8.简单效应
9.平均效应(主要效应、主效)
10.交互作用互作的几种形式正互作负互作无互作负互作(二)试验种类及方案拟订
1.按试验因素分:单因素试验多因素试验综合试验(生产示范)
2.按内容分:栽培试验品种比较试验(品种区域试验)土肥试验病虫害防治试验等
3.按地点多少分:一点试验多点试验
4.按时间长短分:一年试验多年试验
5.按试验小区面积分:小区试验大区试验苜蓿杀菌游土A1B1C1游土C1苜蓿A1杀菌B1不杀菌B2苜蓿杀菌粘土A1B1C3苜蓿杀菌砂土A1B1C2砂土C2粘土C3苜蓿不杀菌粘土A1B2C3苜蓿不杀菌砂土A1B1C2游土C1砂土C2粘土C3苜蓿不杀菌游土A1B2C1红三叶杀菌游土A2B1C1游土C1红三叶A2杀菌B1不杀菌B2红三叶杀菌粘土A2B1C3红三叶杀菌砂土A2B1C2砂土C2粘土C3红三叶不杀菌粘土A2B2C3红三叶不杀菌砂土A2B2C2游土C1砂土C2粘土C3红三叶不杀菌游土A2B2C1白三叶杀菌游土A3B1C1游土C1白三叶A3杀菌B1不杀菌B2白三叶杀菌粘土A3B1C3白三叶杀菌砂土A3B1C1砂土C2粘土C3白三叶不杀菌粘土A3B2C3白三叶不杀菌砂土A3B2C2游土C1砂土C2粘土C3白三叶不杀菌游土A3B2C1(三)确定试验方案的要点1.根据要解决的问题的多少决定用简单的还是复杂的方案2.水平应力求简明,水平间的差异应适当,水平间有相等的间距3.试验方案中应包括对照4.在拟定试验方案时,在所比较的处理之间应用唯一差异的原则5.制订试验方案时,应在某种程度上对预期的试验结果有一些概念三、试验误差(一)试验误差的概念
1.系统误差(1)产生原因(2)特点
2.随机误差或偶然误差(1)产生原因(2)特点随机误差与系统误差的大小(二)试验误差的来源1.试验材料固有的差异
(1)供试材料的遗传基础不一致
①遗传基础尚未完全稳定
②混有其他种质
(2)供试材料生长发育不一致2.管理不一致所引起的差异试验误差的来源3.观察记载的不一致性所引起的差异4.进行试验的外界条件的差异
(1)土壤差异
(2)气候条件的差异
(3)生物的影响(三)控制误差的途径1.选择纯合一致的试验材料
(1)必须严格要求材料在遗传型上的纯合性
(2)生长发育上的一致性2.改进操作和管理技术,使之标准化
(1)操作要仔细,一丝不苟,把各种操作尽可能做到完全一样
(2)一切管理操作、观测和数据收集都应以区组为单位进行控制控制误差的途径
3.控制引起差异的外界主要因素
(1)正确选择试验地
(2)试验中采用适当的小区技术
(3)应用良好的试验验设计和相应的统计分析四、试验单元与试验空间
(试验地的选择与培养)(一)土壤差异
1.土壤差异的形成(1)土壤形成的基础不同,以致在土壤的理化性质方面有很大差异(2)土地利用的差异:重要方面
2.土壤差异的特点具有持久性
试验单元与试验空间
(试验地的选择与培养)3.土壤差异的表现形式(1)一种形式是梯度差异(2)另一种形式是斑块状差异4.估测试验地土壤差异程度的方法(1)目测法(2)空白试验或均一试验(二)试验地的选择和培养
应从以下几个方面考虑:1.试验地所在的自然条件和农业条件应该有代表性2.试验地的土壤肥力要比较均匀一致3.选择的田块要有土地利用的历史记录4.试验地最好选平地,在不得已的情况下,可采用同一方向倾斜的缓彼地,但都应该是平整的试验地的选择和培养5.试验地的位置要适当(1)应选择阳光充足四周有较大空旷地的田块(2)试验地周围最好种有相同于试验用的作物6.对似选作试验用的田块,特别是建立固定的试验地时,除掌握整个试验地的土壤一般情况及土地利用历史外,如可能,最好还要进行空白试验7.试验地采用轮换制,使每年的试验设置在较均匀的土地上五、田间试验的设计
内容:什么是田间试验设计?
广义的理解狭义的理解(一)田间试验设计的原则(二)控制土壤差异的小区技术(三)常用的田间试验设计(可放在第三章中讲)(一)田间试验设计的原则1.重复(1)概念(2)作用:①估计试验误差
②降低试验误差2.随机(1)概念(2)作用:获得无偏的误差估计3.局部控制(1)概念(2)作用:降低试验误差田间试验设计的原则
设置重复随机化排列局部控制消除系统误差,无偏的试验误差估计估计和降低随机误差与随机化相组合,分离系统误差,降低随机误差提高准确度和精确度,保证统计推断的可靠性田间试验设计三个基本原则的关系和作用(二)控制土壤差异的小区技术
1.试验小区的面积(1)试验小区的面积大小与误差大小的关系(见下页图)(2)小区面积的确定:确定一个具体试验的小区面积时,还要从以下各方面考虑
①试验的种类
②作物的类别
③试验地土壤差异的程度与型式
④育种工作的不同阶段
⑤试验地面积
⑥试验过程中的取样需要
⑦边际效应和生长竞争
变异系数与小区面积大小的关系(根据两个水稻空白试验的产量数据)控制土壤差异的小区技术
2.小区的形状
(1)方形或近方形:用于
①边际效应、生长竞争强烈的情况
②土壤差异型式不清
(2)长方形或狭长形
①优点
②长方形的长宽比
③长方形小区的排列控制土壤差异的小区技术A.长边方向与土壤肥力、坡向平行
肥力梯度ⅡⅠⅢ控制土壤差异的小区技术B.如果试验地有两种茬口,那么长边方向占有两个茬地
甲茬乙茬C.犁地时,犁向与长边方向垂直控制土壤差异的小区技术3.重复次数重复次数的确定:小区面积小重复3-6
次,小区大2-4次,具体还应考虑:
(1)试验对精确度的要求:预备试验2次,
精确度高的4次
(2)试验地土壤差异大小
(3)试验材料种子的数量
(4)试验地本身面积
(5)小区大小控制土壤差异的小区技术4.对照区的设置
(1)设置CK的目的
(2)选用CK(3)CK的种数
(4)CK设置的方式5.保护行的设置6.重复(或区组)和小区的排列
(1)重复的排列
(2)小区的排列(三)常用的田间试验设计
1.顺序排列的试验设计
(1)对比法设计(2)间比法设计
2.随机排列(1)完全随机排列(2)随机区组排列(3)拉丁方排列(4)裂区排列
常用的田间试验设计1.顺序排列的试验设计
(1)对比法设计
①特点
②优点
③缺点
④适用情况
Ⅰ
ⅡⅢ
1ck23ck45ck67ck85ck67ck81ck23ck43ck45ck67ck81ck28个品种3次重复对比排列(阶梯式)常用的田间试验设计常用的田间试验设计(2)间比法设计
①特点
②优点
③缺点
④适用情况ⅠCK1234CK5678CK9101112CK13141516CK17181920CK
ⅡCK20191817CK16151413CK1211109CK8765CK4321CK
ⅢCK1234CK5678CK9101112CK13141516CK17181920CK
20个品种3次重复的间比法排列,逆向式(Ⅰ、Ⅱ、Ⅲ代表重复;1、2、3…代表品种;CK代表对照)CK1234CK5678CK9101112CK13141516CK1234CK5678CKⅠ→Ⅱ→CK16151413CK1211109CK8765CK4321CK16151413CK1211109Ex.CK←Ⅲ←16个品种3次重复的间比排列,两行排3重复及Ex.CK的设置(Ⅰ、Ⅱ、Ⅲ代表重复;1、2、3…代表品种;CK代表对照;Ex.CK代表额外对照)常用的田间试验设计2.随机排列的试验设计
(1)完全随机排列
①特点
②方法
③适用情况常用的田间试验设计(2)
随机区组法排列
①特点
②方法
③优点
④缺点
⑤田间布置ⅠⅡⅢⅣ742113873615487321645248875665328个品种4个重复的随机区组排列
肥力梯度常用的田间试验设计ⅠⅡⅢ3811071514961341611212516个品种3个重复的随机区组,小区布置成两排常用的田间试验设计常用的田间试验设计(3)
拉丁方设计
①特点
②各词解释
③方法
④优点
⑤缺点1.选择标准方2.按随机数字14532调整直行3.按随机数字51243调整横行4.按随机数字2=A,5=B,4=C1=D,3=E,排列品种ABCDEADECBEBADC35214BAECDBCDEAADECB21345CDAEBCEBADBCDEA54132DEBACDACBEDACBE12453ECDBAEBADCCEBAD43521
(5×5)拉丁方的随机(4)裂区设计
①特点
②方法
③田间布置
④优点
⑤适用情况常用的田间试验设计ⅠⅡⅢ152541243653231163246532142634362651142465254135461653高低中低中高高中低
施肥量与品种二因素试验的裂区设计(施肥量为主区,品种为副区;Ⅰ、Ⅱ、Ⅲ代表重复)常用的田间试验设计ⅠⅡⅢB2C1B2C2B3C2B3C1B2C1B2C2A2B4C2B4C1A3B2C1B2C2A1B3C2B3C1B3C2B3C1B1C2B1C1B4B2B4C1B1C1B1C2B4C1B4C2B1C1B1C2B3C1B3C2B2C1B2C2B2C2B2C1A1B2C2B2C1A2B4C2B4C1A3B3C2B3C1B4C2B4C1B1C2B1C1B4C1B4C2B1C1B1C2B3C1B3C2B1C1B1C2B2C2B2C1B4C1B4C2B3C2B3C1A3B1C2B1C1A1B3C2B3C1A2B2C1B2C2B3C1B3C2B2C1B2C2B4C2B4C1B4C1B4C2B1C2B1C1B1C1B1C2
小麦肥料用量(A)、品种(B)和密度(C)的再裂区设计
A3A1A4A2A4A3A1A2A1A3A2A4B3B2B3B1B3B1B2B1B2ⅠⅡⅢA因素四个处理、B因素三个处理的条区设计常用的田间试验设计六、田间试验的实施
(一)编写试验计划(二)试验地的准备(整地、划行与分排)(三)准备试验材料(分装、编号)(四)播种(移栽)(五)栽培管理(标准化管理、操作的一致性)(六)常规观察记载(七)收获与脱粒修水渠起垄划行划行开沟开沟施基肥排种子袋耧地长方形小区方形小区多排式区组田间小区保护区小麦区试第二节随机数据的属性及其简单处理一、随机数据具有变异性二、次数分布三、平均数四、变异数二、次数分布
(一)试验资料的性质
1.数量性状的资料(1)不连续性或间断性变数(2)连续性变数
2.质量性状的资料(1)应用统计次数的方法(2)予每类性状以相当数量的方法次数分布(二)次数分布表
1.间断性变数资料的整理(1)一般情况下,按每一个观察值归一组的方法进行整理(2)如果观察值个数较多,变异幅度较大
2.连续性变数资料的整理(1)求极差(2)确定组数和组距(3)选定组限与组中点值(组值)(4)把原始资料的各个观察值按分组数列的各组组限归组
3.属性变数资料的整理次数分布(三)次数分布图
1.方柱形图
2.多边形图
3.条形图
间断性变数的次数分布例100个麦穗的每穗小穗数18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717161716181918181919201516191817182019171817171615161817181617191917间断性变数的次数分布100个麦穗每穗小穗数的频率分布表每穗小穗数划计次数频率15正—60.0616正正正150.1517正正正正正正正丅320.3218正正正正正250.2519正正正丅170.1720正50.05合计1001间断性变数的次数分布小穗数
100个麦穗每穗小穗数频率分布条形连续性变数的次数分布
例120个黄瓜叶片中叶绿素a含量的测定值(㎎/g鲜重)1.861.831.771.811.811.801.791.821.821.811.811.871.821.781.801.811.871.811.771.781.771.781.771.771.771.711.951.781.811.791.801.771.761.821.801.821.841.791.901.821.791.821.791.861.761.781.831.751.821.781.731.831.811.811.831.891.811.861.821.821.781.841.841.841.811.811.741.781.781.801.741.781.751.791.851.751.711.711.881.821.761.851.731.781.811.791.771.781.871.871.831.651.641.781.751.821.801.801.771.811.831.831.901.801.851.811.771.781.821.841.851.841.851.851.841.821.851.841.781.78
组限划计
次数
频率
累加频率1.635-1.655丅20.01670.01671.655-1.67500.00000.01671.675-1.69500.00000.01671.695-1.715丅20.01670.03341.715-1.735丅20.01670.05011.735-1.755正80.6670.11681.755-1.775正正130.10830.22511.775-1.795正正正正230.19170.41681.795-1.815正正正正240.20000.61681.815-1.835正正正正210.15700.79181.835-1.855正正140.11670.90851.855-1.875正60.05000.95851.875-1.895丅20.01670.97521.895-1.915丅20.01670.99191.915-1.93500.00000.99191.935-1.95510.00831.0002总计1201.0002
120个黄瓜叶片中叶绿素a含量(㎎/g鲜重)的频率分布表连续性变数的次数分布连续性变数的次数分布叶绿素含量频率120个黄瓜叶片中叶绿素a含量(㎎/g鲜重)的频率分布柱形图120个黄瓜叶片中叶绿素a含量(㎎/g鲜重)的频率分布多边形图质量性状数据的频率分布
属性分组
次数
频率稃尖有色非糯4910.6608稃尖有色糯性760.1023稃尖无色非糯900.1211稃尖无色糯性860.1158总计7431.000水稻杂种第二代植株稃尖及籽粒性状分离频率表三、平均数(一)平均数的意义(二)平均数的种类
1.算术平均数
2.中数
3.众数
4.几何平均数(三)算术平均数的重要特性
1.离均差之和等于零
2.离均差平方和最小四、变异数(一)极差
1.概念
2.表示方法
3.作用
4.优点
5.缺点(二)方差、标准差
1.自由度的意义
变异数2.标准差数计算方法(三)变异系数平均数、变异数的计算
三头母猪的仔猪断奶时体重()母猪号仔猪数观察值1812.0011.2512.0010.0011.0011.5011.0011.25279.509.7510.0011.509.5010.508.25398.008.007.7510.257.007.257.759.50
数据的中心位置与变异度计算结果母猪号RCV(%)111.252.002.8750.4110.6415.70029.863.505.9820.9970.99910.13038.253.259.0001.1251.06112.860第三节总体及其样本一、总体与样本
1.总体
2.无限总体
3.有限总体
4.观察值
5.变数
6.样本
7.参数
8.统计数二、总体的理论分布
(一)二项分布
1.二项总体及二项分布
2.概率函数及累积概率
3.二项分布的图形
4.二项分布的参数
5.泊松分布
6.多项式分布总体的理论分布(二)正态分布
1.正态分布方程
2.正态分布曲线的特征
3.正态分布的概率计算第四节抽样分布一、抽样分布及抽样分布试验二、正态总体的抽样分布三、二项总体的抽样分布一、抽样分布及抽样分布试验
(一)抽样分布
1.概念
2.意义(二)抽样分布试验
1.单个样本平均数的抽样分布试验
2.两个样本平均数差数的抽样分布试验n=1n=2n=4n=8yffff24611123456123212.02.53.03.54.04.55.05.56.0141016191610412.002.252.502.753.003.253.503.754.004.254.504.755.005.255.505.756.001836112266504784101611071016784504266112368139816561平均数4444方差8/34/32/31/3各种不同样本容量的样本平均数()的抽样分布
各种不同样本容量的
分布方柱形图n=4n=8n=1n=2从两个总体抽出的样本平均数的次数分布表ff213132434353526161总和9总和8
样本平均数差数的次数分布表2,2,2,23,3,3,34,4,4,45,5,5,56,6,6,6总和3,4,5,63,4,5,63,4,5,63,4,5,63,4,5,6-1,-2,-3,-40,-1,-2,-3,1,0,-1,-22,1,0,-13,2,1,0f1,3,3,12,6,6,23,9,9,32,6,6,21,3,3,172
样本平均数差数分布的平均数和方差计算表ff()()()2()2-4-3-2-10123151218181251-4-15-24-18012103-3.5-2.5-1.5-0.50.51.52.53.512.256.252.250.250.252.256.2512.2512.2531.2527.004.504.5027.0031.2512.25总72-36150.00二、正态总体的抽样分布(一)单个样本平均数的抽样分布N(,)~正态总体的抽样分布(三)两个样本平均数差数的抽样分布(二)单个样本总和的抽样分布~N(,)~N(,)三、二项总体的抽样分布(一)单个样本平均数(成数)的抽样分布
(二)样本总和数(次数)的抽样分布二项总体的抽样分布二项总体的抽样分布(三)两个样本平均数差数的抽样分布试验设计与分析
第二章简单试验的统计分析主讲教师张晓科讲授内容和学时讲授内容
学时第一节参数假设测验2第二节参数的区间估计2第三节非参数假设测验4引言
一个处理和两个处理的试验称为简单试验,它通常采用按设置重复和随机化两个原则进行的完全随机设计,两个处理试验的设计有时也采用更精细的配对设计。统计分析的目的,是从样本推断总体的分布,其过程称为推断统计。推断统计的内容大致分为两类,一是有关总体的假设检验问题,二是有关总体的参数估计问题。第一节参数假设测验一、统计假设测验的基本原理二、平均数的假设测验三、方差的假设测验四、假设测验的两类错误一、统计假设测验的基本原理(一)提出统计假设
1.统计假设的概念
2.假设的种类
3.提出无效假设的原因(二)统计假设测验
1.统计假设测验的概念
2.方法(三)作出推断
1.推断的原理
2.推断的方法(一)提出统计假设1.什么叫统计假设:对总体的某些参数所作的假设。实例:假设某地大面积种植玉米品种单产为每公顷7500㎏,标准差为1125㎏。即总体平均数μ0=7500㎏,σ=1125㎏。现从外地引入一新品种,通过25个小区试验,平均产量为每公顷7950㎏,即㎏。问新引入品种的产量与当地大面积种植品种有无显著差异?即新引入品种产量的总体平均数μ与大面积种植品种总体产量的平均数μ0是否不等。仅从抽样结果㎏,还不能得出的结论。这是因为我们研究的仅是从总体中抽出的一部分个体所组成的样本,而不是总体本身,因而不可避免地存在着试验的抽样误差。由于试验误差的随机性,若重复试验,的取值很可能不再是7950㎏。怎样由样本的试验结果给总体作一结论呢?这就是统计假设检验要解决的问题。
2.假设的种类无效假设
假设总体参数与某一指定值相等或假设两个总体参数相等。即在实例中,H0:μ=μ0
=7500kg。备择假设或对应假设
假设总体参数与某一指定值不相等或假设两个总体参数不相等。即在实例中,HA:μ≠μ0
=7500kg。两者关系备择假设的意思是说,如果否定了无效假设则当然接受备择假设;如果接受了无效假设,当然也就否定了备择假设。在无效假设和备择假设中,无效假设是被直接测验的假设。3.为什么要提出无效假设
提出无效假设的目的在于:可以从假设的总体里推断其某一统计数的随机抽样分布,从而可以计算出某一样本结果出现的概率,这样就可以研究样本和总体的关系,作为假设检验的理论依据。因此,提出的无效假设必须是有意义的,即在假设的前提下可以确定试验结果的概率。(二)统计假设测验1.什么叫统计假设测验试验样本平均值与总体平均值差异的构成有三种可能性:(1)既有真实差异又有试验误差;(2)全为真实差异;(3)全为试验误差。在农业及生物试验中,非处理因素对试验指标(如玉米产量)的干扰总是存在的,因而第二种可能性实际上不存在。第一种可能性既有真实差异又有试验误差,不便于讨论。这样统计推断只能由第三种可能性出发,先假设真实差异不存在,试验表面差异全为试验误差。然后,计算该假设(可视为一随机事件)出现的概率,根据概率的大小来判断假设是否正确,即真实差异是否存在。这一过程为对试验样本所属总体所作假设是否正确的统计证明,一般称统计假设检验或假设测验。因此,统计假设检验没有复杂的统计运算,更多的是逻辑推断。
2.方法假设测验方法是先按研究目的提出一个假设;然后通过试验或调查,取得样本资料;最后检查这些资料结果,看看是否和假设所提出的有关总体参数的结果相符合。如果两者之间甚为符合,则接受这个假设H0;如果不符合,则否定它,即推断这个假设是错误的,因而接受其对应假设HA。(三)作出推断1.推断的原理当一事件的概率很小时,可认为该事件在一次试验中几乎是不可能事件。这就是“小概率事件实际不可能性”原理。我们将用此原理决定接受或否定假设H0。当表面差异全由随机误差造成的概率小于0.05或0.01时,我们就可认为它不可能全属于抽样误差,从而否定无效假设H0
,接受备择假设HA
。用来判断是否属于小概率事件的概率值叫显著水平。一般以α表示。在农业试验中,常取0.05或0.01,记为α=0.05或α=0.01。
(三)作出推断2.推断的方法统计假设检验的基本步骤:(1)对样本所属总体提出统计假设,包括无效假设H0和备择假设HA;(2)确定显著水平α;(3)测验计算,即在无效假设H0正确的假定下,依据统计数的抽样分布,计算因随机抽样而获得实际差数的概率;(4)统计推断,即将确定的值与算得的概率相比较,依据“小概率事件实际不可能性”原理作出接受或否定无效假设的推断。二、平均数的假设测验(一)单个样本平均数的假设测验(二)两个样本平均数相比较的假设测验(三)百分数资料的假设测验(一)单个样本平均数的假设测验1.来自σ2已知总体的样本平均数的测验讲双尾测验例子;讲显著水平;讲查u表2.来自σ2未知总体的大样本平均数的测验讲单尾测验例子;比较单、双尾测验3.来自σ2未知总体的小样本平均数的测验(1)t分布①特点:4条②t分布的概率(2)t测验:比较t测验与u测验1.来自σ2已知总体的样本平均数的测验实例:某小麦良种的千粒重服从N(μ0,σ2),μ0=33.5g,σ2=1.6g。现从外地引入一高产品种,在8个小区种植,得千粒重(g):35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6。问新引入品种的千粒重与当地品种有无显著差异(α=0.05)?实例分析:
双尾测验、显著水平、查u表
假设:,显著水平:检验计算:=推断:查u的双尾分位数表得:。由于,P<0.01,故否定H0而接受HA。其意义为:在显著水平之下,有极显著的差异(用“**”表示)。u双尾测验图示(上述例题中α=0.01,μ=33.5g,σ2=1.6g,n=8,)2.来自σ2未知总体的大样本平均数的测验大样本:n≥30在这种情况下,单尾与双尾测验比较1.两尾尾测验:否定区域为正态分布或t分布左右两个尾部的测验称为两尾测验。2.一尾测验:否定区域仅为正态分布或t分布的一尾(左边一尾或右边一尾)的测验称为一尾测验。若否定区域在左边一尾称为左尾测验,在右边一尾称为右尾测验。3.两尾测验与一尾测验在测验中的异同:相同点:(1)两种测验的测验步骤相同。(2)在单个样本平均数、两个样本平均数相比较的假设测验中都可应用。(3)都可应用u测验或t测验。不同点:(1)假设的形式略有不同。两尾:H0:μ=μ0;HA:μ≠μ0H0:μ1=μ2;HA:μ1≠μ2
一尾:左尾:H0:μ≥μ0;HA:μ<μ0H0:μ1≥μ2;HA:μ1<μ2
右尾:H0:μ≤μ0;HA:μ>μ0H0:μ1≤μ2;HA:μ1>μ2
(2)查u表或t表时α值有差异:两尾测验可直接用显著水平α查两尾u值表示或t值表;一尾测验则需用2α查两尾u值表或t值表。
u双尾测验(上)与单尾测验(下)图示比较3.来自σ2未知总体的小样本平均数的测验
t分布
t分布的密度函数曲线关于对称,其形状与自由度n有关。密度曲线与t轴间的面积为1
。t值落入区间(-tα,tα)外的概率为α,即只要知道t分布的自由度n和就可查到,这样的表称为t分布的双侧分位数表,附在书后备用。(2)u测验与t测验比较应用条件u测验应用的条件(1)总体方差σ2已知;(2)总体方差σ2未知,但样本容量n≥30的测验。t测验应用总体方差未知且n<30的小样本测验。计算公式和查表u测验计算u值,查u表。t测验计算t值,查t表。(二)两个样本平均数相比较的假设测验概述1.成组数据的平均数比较(1)在两个样本的总体方差已知时,采用u测验(2)两个样本的总体方差未知,但可假设σ12=σ22,而两个样本又为小样本时,用t测验:讲求合并均方(3)两个样本的总体方差未知,且σ12≠σ22,而两个样本又为小样本时,用t测验;矫正。2.成对数据的比较(二)两个样本平均数相比较的假设测验含义:这是由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。分类:测验方法因试验设计的不同,而可分成组数据的平均数比较和成对数据的比较两种。成组数据的平均数的比较:如果两个处理为完全随机设计,而处理间(组间)的各供试单位彼此独立,则不论两处理的样本容量是否相同,所得数据皆称为成组数据,以组(处理)平均数作为相互比较的标准。成对数据的比较:若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对;然后每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。
1.成组数据的平均数比较
成组数据的比较又依两个样本所属的总体方差是否已知和样本大小而采用不同的测验方法。(1)在两个样本的总体方差已知时,采用u测验(2)两个样本的总体方差未知,但可假设σ12=σ22,而两个样本又为小样本时,用t测验。(3)两个样本的总体方差未知,且σ12≠σ22,而两个样本又为小样本时,用t测验。2.成对数据的比较
采用配对试验设计法,其实质是把两个处理同一重复内的两个试验单元的差异减少到最低限度,使两个处理间的效应差异不为试验单元间的差异所掩盖和混淆.如田间试验中将两个处理的每一次重复的两个试验小区排在一起,因为相邻小区的条件较为一致。2.成对数据的比较实例:为测定甲、乙两种病毒对烟草的致病力。取8株烟草,每一株皆半叶随机接种甲病毒,另半叶接种乙病毒,以叶面出现枯斑数多少作为致病力强弱的指标,结果见下表。试检验两种病毒致病力的差异显著性(α=0.05)。株号123456781(甲病毒)91731187820102(乙病毒)1011181467175-161341135不同病毒对烟草致病力的试验结果
实例分析假设:,显著水平:测验计算:。
推断:查t表得,故可直接推断甲病毒的致病力比乙病毒强(贯彻了双尾假设H0被否定后单尾假设二者必取其一的原则)。(三)百分数资料的假设测验引言1.单个样本百分数的假设测验2.两个样本百分数的假设测验3.二项样本假设测验时的连续性矫正(1)原因(2)矫正方法①单个样本百分数的连续性矫正②两个样本百分数的连续性矫正(三)百分数资料的假设测验单个处理的随机化试验结果有时用百分率表示,如结实率、发芽率、杀虫率、病株率,以及杂交后代分离成不同类型的百分率等。这些资料属间断性的计数资料,应按二项分布分析。由于当np或(q=1-p)均大于5时,二项分布趋近于正态分布,因此,当np或nq均大于30时,可直接按正态分布处理;否则需进行连续性校正后,再按正态分布对待。(三)百分数资料的假设测验1.单个样本百分数的假设测验含义:这是测验某一样本百分数与某一理论值或期望值的差异显著性。2.两个样本百分数的假设测验含义:这是测验两个样本百分数的差异显著性,一般假设两个样本的总体方差是相等的。3.二项样本假设测验时的连续性矫正(1)原因:
二项总体的百分数是由某一属性的个体数计算来的,在性质上属于间断性变异,其分布是间断性的二项分布。因而把它当作连续性的正态分布或t分布处理,结果会有出入。(2)方法:补救的方法是在测验时进行连续性矫正。单个样本百分数的假设测验两个样本百分数的假设测验三、方差的假设测验(一)单个方差的假设测验(二)两个方差相比较的假设测验(一)单个方差的假设测验1.卡平方分布(1)卡方值(2)卡平方分布(3)卡方分布曲线的特征(4)卡方值表2.卡平方的测验方法测验步骤1.卡平方分布卡方值次数资料的统计分析方法可用卡平方测验法。χ2值的计算方式为:χ2=∑(O-E)2/E
,式中的O为观察次数,E为理论次数。当χ2值的下限为零,表示观察次数与理论次数完全符合;上限为+∞,表示观察次数和理论次数的差异增大时,χ2值也增大。卡平方分布2.卡平方的测验方法(1)测验步骤设立无效假设确定显著水平α=0.05或0.01在无效假设为正确的假设下,计算超过观察χ2值的概率以所得概率的大小,接受或否定无效假设(二)两个方差相比较的假设测验1.F分布(1)F值(2)F分布(3)F分布的特征5条(4)F值表2.F测验(1)基本条件(2)测验步骤1.F分布2.F测验F分布基本条件变数x遵循正态分布两样本方差彼此独立测验步骤与t或u测验一样,有四个步骤四、假设测验的两类错误(-)为什么会发生错误?(二)错误的类型
1.第一类错误
2.第二类错误(三)犯错误的概率
1.犯第一类错误的概率
2.犯第二类错误的概率(四)减小犯错误的途径4条(-)为什么会发生错误?由试验的一个样本点决断H0的成立与否,这是由结果推断原因的做法,属归纳推理。归纳推理的结果使我们可能犯错误。
由于随机误差的作用,所得到的任何一次试验结果都不是一个必然事件,只根据一次试验结果所作的推断,可以看成是以一定的可靠程度而作出的结论,难免会带有一定的错误。(二/三)错误的类型和犯错误的概率第一类错误是:H0正确,而样本点碰巧落入H0的否定域而接受HA,这种错误称为弃真错误,弃真错误的概率为α。第二类错误是:H0不真,而样本点碰巧落入H0的接受域而接受了H0
,这种错误称为纳伪错误。纳伪错误的概率为β。β的大小与H0不真的程度及H0接受域的长短有关。H0不真的程度越大、1-α越大(H0接受域越长),则β越大。(四)减小犯错误的途径①在样本容量n固定的条件下,提高显著水平(取较小的α值),则将增大犯第二类错误的概率β值。②在n和显著水平α相同的条件下,真总体平均数μ和假设平均数μ0的相差(以标准误为单位)愈大,则犯第二类错误的概率β值愈小。③为了同时降低犯两类错误的概率,需采用一个较低的显著水平,如α=0.05;同时适当增加样本容量n,或适当减小总体方差σ2,或两者兼而有之。④若显著水平α已固定下来,则增加样本容量和改进试验技术可以有效地降低犯第二类错误的概率。第二节参数的区间估计-、基本概念二、区间估计的特点三、区间估计的方法四、区间估计与假设测验
-、基本概念参数的点估计:以样本的统计数直接估计总体的相应参数。参数的区间估计:在一定的概率保证之下,估计出参数可能在内的一个范围或区限。这个区间称置信区间或置信距,区间的上、下限称为置信限。保证参数在该区间内的概率以P=(1-α)表示,称为置信系数或置信度。二、区间估计的特点置信度1-α通常取接近1的值,在实际应用中常取95%和99%,体现了置信水平的中、高两个档次。为什么这样取,这是由于存在着估计精度与置信度的此长彼消的矛盾。区间的平均长度越短,精度越高,置信度越小;反之精度越低,置信度越大。统计学的原则是在可靠度优先的前提下,寻找尽可能短的区间估计。三、区间估计的方法(一)总体平均数μ的置信区间估计(二)总体方差的置信区间估计(一)总体平均数μ的置信区间估计1.总体平均数μ的置信限(详讲)2.两个总体平均数差数的置信限3.二项总体百分数的置信限4.两个二项总体百分数差数的置信限1.总体平均数μ的置信限当σ2已知时,μ的置信区间和置信上、下限当σ2未知且时,μ的置信区间和置信上、下限2.两个总体平均数差数的置信限当两个方差已知,其置信区间和置信上、下限当未知且不相等,样本容量大于30时,其置信区间和置信上、下限当未知相等且容量小于30时,其置信区间和置信上、下限3.二项总体百分数的置信限上限下限4.两个二项总体百分数差数的置信限上限下限(二)总体方差的置信区间估计1.单个方差的区间估计2.两个方差比的区间估计1.单个方差的区间估计总体方差的区间估计
当μ已知时,方差置信区间和置信上、下限当μ未知时,方差置信区间和置信上、下限2.两个方差比的区间估计四、区间估计与假设测验
若在1-α的置信度下,两个置信限同为正号或同为负号,在α水平上否定H0而接受HA。若在1-α的置信度下,两个置信限同为异号或一正一负,在α水平上接受H0。若两个置信限同为正号,则有μ1>μ2,p1>p2。若两个置信限同为负号,则有μ1<μ2,p1<p2。第三节非参数假设测验一、分布的适合性测验二、适合性测验(一)k=2的适合性测验(二)k≥3的适合性测验三、独立性测验(一)2×2相依表的独立性测验(二)2×c相依表的独立性测验(三)r×c相依表的独立性测验四、卡方的可加性和合并比较一、分布的适合性测验在分布的检验问题中,我们并不能预知变量X的分布,需要根据样本作出随机变量X的分布函数是否为已知函数F0(x)的判断,因此分布的检验问题是非参数检验问题。分布的检验假设为:用什么统计量来度量经验分布函数与假设分布函数的符合程度呢?一般采用皮尔逊X2统计量检验方法。实例分析实例:调查玉米受玉米螟为害情况,抽取100株,受害株22。试检验H0:每次抽一株得到受害株的概率。分析:按题意是要检验总体X是否服从的(0,1)分布。由抽样结果知,100株中有22株受害和78株未受害.在H0之下,100株中应有20株受害和80株未受害,则由自由度,查附表得,故应接受H0
。二、适合性测验
(一)k=2的适合性测验适合性测验含义:比较实验数据与理论假设是否符合的测验。说明:当自由度为1时,必须进行连续性矫正,矫正方法是用观察次数O与理论次数E的差数的绝对值减去0.5即可;当自由度大于或等于2时,不需要矫正。实例:大豆紫色与白花花色一对等位基因的遗传研究,在F2代获得紫花和白花分别208和81株。问这一资料的实际观察数据是否符合3:1的理论数值(α=0.05
)。分析:第一步,
H0:观察次数与理论次数相符合,HA:不符合;第二步,α=0.05第三步,计算χ2=∑(︱O-E︱-0.5)2/E=1.256<χ2α=3.84第四步,说明观察次数与理论次数符合。(二)k≥3的适合性测验对于划分为两组以上(k≥3)的资料,自由度大于或等于2时,计算χ2值不需要矫正。实例:孟德尔在其著名的豌豆杂交试验中,用结黄色圆形种子与结绿色皱形种子的纯种豌豆作为亲本进行杂交.将F1代进行自交,得到F2代共556株豌豆,发现其中有四种类型植株:结黄色圆形种子的315株,结黄色皱形种子的101株,结绿色圆形种子的108株,结绿色皱形种子的32株.试问这些植株是否符合孟德尔所提出的的理论比例(α=0.05)?实例解答第一步:H0:观察次数与理论次数相符合,HA:不符合第二步:α=0.05第三步计算χ2=∑(O-E)2/E第四步:查附表得,故在0.05水平上应接受H0,即试验结果是符合的理论比例的。三、独立性测验
皮尔逊检验是计数资料差异显著性检验的很有力的工具。上面讨论的符合性检验就是常对计数资料进行的。但有时科学假设的“理论值”并不预先确定,而需要从实际所取得的资料中去推算得到。在这种情况下进行的皮尔逊检验就实质而言,常常是为了判断两组或多组资料是否相互关联(成比例)的问题,因此称为独立性检验,亦称为列联表分析。(一)2×2相依表的独立性测验
实例:下表展示了5735个因结核病死亡的牛所组成的样本.试检验假设H0:造成病牛死亡的结核类型与性别无关(α=0.05)。结核类型公牛母牛总计呼吸系统353413194853(3434.6)(1418.4)其他270252522(369.4)(152.6)总计380415715375(一)2×2相依表的独立性测验假定H0成立,则意味着两类结核病的死亡牛数的比例不因牛的性别而异。由α=0.05
,查附表得χ2c0=74.166>
χ2α=3.84,故应否定H0,即死于各种类型结核的牛的公母比例是不同的。如列于因呼吸系统结核的公牛比例数,显著不同于母牛的比例数。(二)2×c相依表的独立性测验2×c表是指横行分为两组,而纵行分为c≥3组的相依表资料。在作独立性测验时,其自由度为(2-1)(c-1)
。由于c≥3,故计算χ2值不需要矫正。(三)r×c相依表的独立性测验含义:
r×c表是指横行分为r组,而纵行分为c组,且r≥3,c≥3,故计算χ2值不需要矫正。实例分析:下表为不同灌溉方式下水稻叶片衰老情况的调查资料,试检验稻叶衰老情况与灌溉方式无关(α=0.05
)。
水稻在不同灌溉方式下叶片的衰老情况
灌溉方式绿叶数黄叶数枯叶数总计深水146(140.69)7(8.78)7(10.53)160浅水183(180.27)9(11.24)13(13.49)205湿润152(160.04)14(9.98)16(11.98)182总计4813036547实例解答假设H0:稻叶衰老情况与灌溉方式无关,HA:稻叶衰老情况与灌溉方式有关。α=0.05。计算得由自由度,查附表得,故应接受H0,即不同的灌溉方法对稻叶衰老情况没显著的影响。作业教材P62
习题二习题编号:2,3,4,6,7,9,10,11,12,13,14,15试验设计与分析
第三章常用试验设计的方差分析
主讲教师谢惠民§3随机区组试验结果的分析优点:简单易行,体现三原则,能分离出区组间的变异,有效降低试验误差,精确性较高;加大处理组间的可比性.缺点:处理数目过多时,试验单元亦多,区组内试验材料的环境条件难以一致;仅实行单方面局部控制,精确度不如拉丁方设计.一般处理数<20为宜;随机区组试验:根据试验条件的差异将试验地划分为若干小区,每个小区内的试验单元接受不同的处理的试验称之。特点:是通过划分区组的方法,使区组内的条件尽可能一致,以而达到局部控制的目的。应用广泛,区组不限于田间。区组内的环境变异要尽可能小,区组间允许存在一定的环境变异.
3-1随机区组试验的设计方法排列:要达到区组间有最大的土壤差异,区组内的各个小区间变异最小的要求,必须:
狭长形小区
区组方向应与土壤肥力方向垂直
区组内小区多时可分为两排
四周应有保护行和观察道路
可用两向分组单个观察值资料的方差分析法处理A因素设:a个处理,a=1…i区组B因素
r个区组,r=1…j剩余试验误差DF和SS的分解式为:dfT=dfr+dft+dfe=(r-1)+(a-1)+(a-1)(r-1)SST=SSr+SSt+SSe
分析同组内有重复观察值的两向分组的分析3-2随机区组试验结果的方差分析3-2-1单因素随机区组试验的方差分析例3-3-21某品比试验:a=8;r=3;得25m2小区产量,试分析:处理A区组Ti.平均IIIIIIA(ck)10.99.112.232.210.7B10.812.314.037.112.4C11.112.510.534.111.4D9.110.710.129.910.0E11.813.916.842.514.2F10.110.611.832.510.8G10.011.514.135.611.9H9.310.414.434.111.4T.j83.191.0103.9T..=278.010.411.413.0=11.61-2:14.2-12.4=1.8<2.243-4=0.5:2-4=12-5:12.4-11.4=1.02-6:12.4-10.8=1.62-7:12.4-10.7=1.72-8:12.4-10.0=2.41-3:14.2-1.9=2.3<2.351-4:14.2-11.4=2.8>2.42位次代号品系平均亩产kg差异显著性5%1%110长武863472.9aA24西农129467.8aAB33西农797458.8abAB48长武521-7449.0bcBC55T105435.2cdCD612西农143-1425.8deD72陕168416.8efDE87秦丰216401.9fgEF96秦丰208396.0gEF1013西农36-2395.6gEF111晋麦47ck392.7gF129武农971328.9hG131131-1161248.9iH2004-2005陕西省旱地小麦区试乾县试点产量结果多重比较单因素随机区组的线型模型与期望均方两种模型的F测验均以误差均方作分母。固定模型:处理和区组均固定,仅局限本试验,不能外推。随机模型:处理和区组是从各自总体抽出,可以外延推断品比试验是混合模型,品种固定,区组随机(要有代表性)。3-2-2、二因素随机区组试验的方差分析:二因素随机区组试验单因素随机区组试验A有a,a=1…i;B有b,b=1…j
ab个处理组合,各重复r次r=1…k。共abr个观察值xijkA=1…a;B=1…r个区组总=区组+处理+误差其中:处理=A+B+AB总=区组+处理+误差(误差与互作交织,常用互作作误差)abr-1=(r-1)+(ab-1)+(r-1)(ab-1)(ab-1)=(a-1)+(b-1)+(a-1)(b-1)ar-1=(r-1)+(a-1)+(a-1)(r-1)SST=SSr+SSt+SSe其中:SSt=SSA+SSB+SSABSST=SSr+SSt+SSe先写全“abr”分子求啥分母取啥
固定:r、A、B、AB用MSe
作分母。随机:r、AB均以MSe
作分母;而A、B则以MSAB作分母混合:r、A、AB均以MSe
作分母;而B以MSAB
作分母固定:随机:混合:安上述类推应用:固定:F测验----多重比较;随机:F测验——参数估计abr-1=(r-1)+(ab-1)+(r-1)(ab-1)(ab-1)=(a-1)+(b-1)+(a-1)(b-1)abr-1=(r-1)+(ab-1)+(r-1)(ab-1)(ab-1)=(a-1)+(b-1)+(a-1)(b-1)固定模型:进行各种多重比较,对参试不育系、恢复系及其组合作评价。①不育系的多重比较②恢复系的多重比较不育系主效分析恢复系主效分析
如果交互作用不显著,则由多重比较结果直接可推断出最优杂交组合.如本例:A3B3为之。如果交互作用显著或极显著,仅从主效应推断最优组合不一定可靠.在交互作用显著时,选定办法有两种:一是固定Ai对Bj作多重比较,或固定Bj
对Ai作多重比较,这种作法的好处可以针对某个Ai定向选择Bj或者相反.二是对所有组合都进行比较,只要选出最优组合就行最优杂交组合的选定③对Ai中的Bj间作多重比较结果表明,B3与A3或A2相配的组合最好.这种组合与其他组合的差异随A的水平有一定的变化,这正是A×B存在的反映.④所有组合间的多重比较多重比较结果如下:可见:组合A3B3最好,且与其他组合有极显著差异
四、随机区组试验的缺区估计与分析试验中由于种种原因,有些小区数据会缺失,使处理和区组的正交性破坏。如果缺失的只是个别小区可用之。缺区估计采用最小二乘法新估参数得到的理论值与观察值间的离差平方和Q为最小,利用求Q对估计参数的偏导(P150),得到缺区估计公式:ye为缺区估计值;T`t、T`r、T`分别为不含缺区的缺区处理总和、区组总和、全试验总和。注意:ye=33.0是一个没有误差的理论值,不占自由度,所以误差项、总和项的自由度各少1个。33.0131.9603.7150.910yc+ya=191解之:yc=18.09(kg)填入上表Yc+10ya=191ya=10.09(kg)进行方差分析缺两区,不占自由度,故误差和总和项自由度各减去2。MSe为误差均方,n1、n2分别为两个比较处理的有效重复数。计算:在同一区组内,
两处理都不缺区:各记为1;两处理只缺一区:缺者为0,不缺者为(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年地产承运新能源建设合同
- 2026年家居代工培训服务协议
- 村委会治保会工作制度
- 村工会委员会工作制度
- 预检分诊流调工作制度
- 预防零打碎敲工作制度
- 领导干部家访工作制度
- 食品厂门卫室工作制度
- 麻精药品使用工作制度
- 唐山市路南区2025-2026学年第二学期五年级语文期末考试卷(部编版含答案)
- 2025年长沙市芙蓉区事业单位招聘笔试试题及答案解析
- 临床床头抬高30°-小角度大作用
- 2026陕西榆林市旅游投资集团有限公司招聘7人考试备考试题及答案解析
- 幼儿园后勤业务培训制度
- 2025年高考(海南卷)地理试题(学生版+解析版)
- 福建医卫系统事业单位招聘《护理学专业知识》近年考试真题题库资料及答案
- 食材肉类配送合同范本
- 老年跌倒风险评估与防范
- GB/T 39693.5-2025硫化橡胶或热塑性橡胶硬度的测定第5部分:用便携式橡胶国际硬度计法测定压入硬度
- 显卡知识培训课件
- 出境人员保密知识培训课件
评论
0/150
提交评论