




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三节 方差分析在一个因素不同水平下(三个水平以上)或是在多个因素不同水平组合下测量一个连续反应变量(因变量),这个反应变量的总变异可被解释为分类变量的效应(即主效应,如A,B分别表示由于分类变量A和B的不同水平引起的变异)或分类变量的组合产生的效应(即交互效应,如A*B表示A与B的交互作用),余下的变异为随机误差。方差分析的基本思想是将所有观察值的总变异分解成不同的变异来源,即对总变异的自由度和平方和进行分解,进而获得不同变异来源的总体方差的估值。通过构建适当的F值,进行F测验,完成多个样本平均数之间差异显著性测验。当处理效应为固定效应时,尚可对各个处理平均数进行多重比较。变异来源离均差平方
2、和(SS)自由度(df)均方(MS)F值P值ABA *BSSA=QA-CSSB=QB-CSSAXB=QAB-C- SSA SSBp-1q-1(p-1)(q-1)SSA/dfASSB/dfBSSAxB/ dfAxBMSA/MSEMSB/MSEMSAB/MSE*误差SSE=SST-SSA-SSB- SSABPq(r-1)SSe/dfe(MSE)总计SST=W-Cpqr-1一 、 方差分析(ANOVA)过程Ø 过程格式:Proc anova;Class分类变量名列表;Model依变量=自变量效应表/选项;Means自变量效应名列表/选项;Test H=效应变量名 E=误差项;Run;Pro
3、c anova;Class 分类变量名列表;通常对主效应变量进行分类,如果是区组试验,需要同时对区组变量进行分类;Model依变量=自变量效应表/选项;列出希望计算出的效应变量,一般为主效应、互作效应、区组效应;给出主效应和互作效应的方差分析结果。Y= a 单因素主效模型Y= a b a*b两因素带互作模型Y= a b c a*b a*c b*c a*b*c 三因素带互作模型;Means自变量效应名列表/选项;进行多重比较分析,主要分析同一因素不同水平间的效应差异;一般只对主效应分析;选项用于设定多重比较方法等,常用的选项有LSD或t(最小显著差数法)DUNCAN(新复极差测验)TUKEY(固
4、定极差测验法)。显著水平的设定ALPHA=,缺省值为0.05。Test H=效应变量名 E=误差项;TEST H=效应表 E=效应:用以指定某效应作为误差项。缺省时,以残差MSE作为误差项。其中:H=效应变量名,用以指定MODEL语句中作为假设检验的效应, E=误差项,用以指定作为误差项的效应,常用主效应*区组效应。RUN;二、方差分析的类型1、试验设计类型:u 随机试验设计u 随机区组试验设计1)单因素试验 单项分组资料的方差分析(单因素完全随机试验)变异来源离均差平方和(SS)自由度(df)均方(MS)F值P值处理组间SSA=QA-Cp-1SS组间/df组间MS组间/MS组内误差SSE=S
5、ST-SSAN-PSS组内/df组内总计SST=W-CN-1 Proc anova;Class A;Model Y= A ;NEANS A/LSD;Run; 单因素完全随机区组试验变异来源离均差平方和(SS)自由度(df)均方(MS)F值P值处理组间区组间SSA=QA-CSSB=QB-Ca-1b-1SSA/dfASSB/dfBMSA/MSEMSB/MSE误差SSE=SST-SSA-SSBN-a-b+1SSE/dfE总计SST=W-CN-1 Proc anova;Class A C;Model Y= A C;Means A/lsd;Run;例1: 有一个水稻施肥实验,设有5个处理(trt),分别
6、为A(施氨水1),B(施氨水2),C(施碳氨),D(施尿素)和E(不施肥)。每个处理均种植4盆,随机排列,试分析各处理对水稻平均产量的影响。A:24 30 28 26 B:27 24 21 26C:31 28 25 30D:32 33 33 28E:21 22 16 21Data two;Do trt = 1 to 5;Do rep = 1 to 4;Input y ; output;End; end;Cards;24 30 28 26 27 24 21 2631 28 25 3032 33 33 2821 22 16 21;proc anova;class trt;model y = trt
7、;means trt/t;run;2)二因素试验 随机试验设计和随机区组试验设计: 两项分组资料的方差分析(二因素完全随机试验) 变异来源离均差平方和(SS)自由度(df)均方(MS)F值P值ABA *BSSA=QA-CSSB=QB-CSSAXB=QAB-C- SSA SSBp-1q-1(p-1)(q-1)SSA/dfASSB/dfBSSAxB/ dfAxBMSA/MSEMSB/MSEMSAB/MSE误差SSE=SST-SSA-SSB-SSAxBPq(r-1)SSe/dfe总计SST=W-CPqr-1 Proc anova;Class A B;Model Y= A B A * B;Means
8、a b/lsd;Run; 二因素随机区组试验Y=+ A处理效应 + B处理效应 + A *B互作 + 区组效应 (C) + 随机误差Proc anova;Class A、B C;Model Y=A B A * B C; Means a b c/lsd;Run;例2:研究水分和肥料两个因素与番茄产量之间的关系,其中水分设三个水平(W1-100%、W2-75%、W3-50%)、肥料设两个水平(F1-20kg、F2-40kg),组成6个水分-肥料试验组合,观察其对番茄的增产效果,每个组合5次重复,各个组合的产量(kg/m2)结果如下表,试进行方差分析。(随机试验设计和随机区组试验设计):表1:水分和
9、肥料组合对番茄产量的影响水分(A)肥料水平(B)B 1B 2A 133.4 23.5 31.8 39.2 18.227.5 33.5 31.6 41.0 27.8A 220.2 24.6 22.3 18.5 24.528.2 15.2 23.4 20.9 19.5A 325.2 33.1 27.4 29.1 22.220.2 27.8 31.3 29.6 24.2Data one; do a = 1 to 3; do b = 1 to 2; do rep = 1 to 5; Input M ; output; end; end; end; cards;33.4 23.5 31.8 39.2 1
10、8.227.5 33.5 31.6 41.0 27.820.2 24.6 22.3 18.5 24.528.2 15.2 23.4 20.9 19.525.2 33.1 27.4 29.1 22.220.2 27.8 31.3 29.6 24.2;Proc anova; class a b rep;model m = a b a*b rep;means a b/t alpha = 0.05; run;三、特殊试验设计的线性模型1、 裂区试验设计:Y=+ 区组效应 + 主、副处理效应 +主、副处理互作效应+ 随机误差Proc anova;Class区组效应 主处理效应 副处理效应;Model Y
11、= 区组效应 主处理效应 副处理效应 主*副处理互作效应 主处理效应*区组互作效应;MEANS主、副处理效应/T;TEST H =主效应 E=主效应*区组效应;RUN;例:研究践踏强度(T1、T2、T3)与施氮水平(N1、N2、N3)对草坪质量的影响,试验采用裂区设计,主区为践踏强度,副区为施氮水平,3次重复,试分析践踏强度和施氮水平对草坪密度(株,cm2)的影响。轻度践踏(T1)中度践踏(T2)重度践踏(T3)N2N1N3N3N2N1N2N1N3707090706060204040908095807060354550607080905070203030DATA turf;Do T = 1 t
12、o 3;Do N= 1 to 3;Do rep = 1 to 3;Input y ;Output;End; end; end;Cards;70 80 70 70 90 60 90 95 8060 60 70 60 70 50 70 80 90 40 45 30 20 35 20 40 50 30;proc anova;class T N REP;model y = T N T*N REP T*rep;means T N/T;test H=T E=T*REP;RUN;3 正交试验设计3.1 无重复正交试验设计资料的方差分析例:研究5种蛋鸡育成期的配合饲料对鸡产蛋效果的影响。配合饲料中主要考察5种
13、成分组成,各成分均取3个水平,试找出最优的配方方案。A (玉米):a1(61.5) a2(66.0) a3 (70.6)B (麸皮): b1(6.5) b2(8.0) b3(14.0) C(豆饼) c1(6.0) c2(9.0) c3(15.0)D(鱼粉) d1(3.0) d2(5.0) d3(9.0)E(食盐) e1 (0.0) e2 (0.1) e3(0.25) 同时需要考虑a*b、 a*c 、a*e的互作。选用L27(313)正交表,表头设计为:a、b、c、e、d依次放在第1、2、5、8、11列上,a*b、 a*c 、a*e分别放在(3、4)、(6、7)、(9、10)列上。 Data z
14、jfx;Input a b c e d y;Cards;1 1 1 1 1 569 1 1 2 2 2 554 1 1 3 3 3 637 1 2 1 2 3 5661 2 2 3 1 565 1 2 3 1 2 648 1 3 1 3 2 581 1 3 2 1 3 5681 3 3 2 1 535 2 1 1 1 1 593 2 1 2 2 2 615 2 1 3 3 3 6202 2 1 2 3 586 2 2 2 3 1 597 2 2 3 1 2 617 2 3 1 3 2 5992 3 2 1 3 613 2 3 3 2 1 580 3 1 1 1 1 569 3 1 2 2 2
15、6153 1 3 3 3 591 3 2 1 2 3 586 3 2 2 3 1 616 3 2 3 1 2 6303 3 1 3 2 566 3 3 2 1 3 638 3 3 3 2 1 573;Proc anova;Class a b c d e;Model y= a b c d e a*b a*c a*e;Means a b c d e a*b a*c a*e/t;Run; Means with the same letter are not significantly different. t Grouping Mean N a A 602.222 9 2 A 598.222 9 3
16、 B 580.333 9 1 t Grouping Mean N b A 601.222 9 2 B A 595.889 9 1 B 583.667 9 3 t Grouping Mean N c A 603.444 9 3 A 597.889 9 2 B 579.444 9 1 t Grouping Mean N d A 602.778 9 2 A 600.556 9 3 B 577.444 9 1 t Grouping Mean N e A 605.000 9 1 A 596.889 9 3 B 578.889 9 2 Level of Level of -y- a c N Mean St
17、d Dev 1 1 3 572.000000 7.9372539 1 2 3 562.333333 7.3711148 1 3 3 606.666667 62.3083729 2 1 3 592.666667 6.5064071 2 2 3 608.333333 9.8657657 2 3 3 605.666667 22.2785397 3 1 3 573.666667 10.7857931 3 2 3 623.000000 13.0000000 3 3 3 598.000000 29.1376046最优组合为:a3、b2、c2、d2、e33.2有重复正交试验设计资料的方差分析例:有四种药物,
18、每种药物有三水平:A药(A1=2%,A2=5%, A3=8%),B药(B1=0%,B2=1%,B3=2%),C药(C1=0%,C2=1%,C3=3%)及D药(D1=0%,D2=1%,D3=3%)。问四种药物对蚊子的50%击到时间有无差别?采用正交表L9(34)。相同试验条件下均做4次重复。试验号ABCD50%击到时间/S 111119.417.1910.733.732122211.9111.8511.0011.723133310.6710.7010.9110.18421233.873.183.804.85522314.205.724.853.71623124.293.893.884.71731
19、327.627.016.837.41832137.797.387.566.28933218.098.178.147.49Data two;Input a b c d ;Do I= 1 to 4;Input y ; output;End;Cards;1 1 1 1 9.41 7.19 10.73 3.731 2 2 2 11.91 11.85 11.00 11.721 3 3 3 10.67 10.70 10.91 10.182 1 2 3 3.87 3.18 3.80 4.852 2 3 1 4.20 5.72 4.58 3.712 3 1 2 4.29 3.89 3.88 4.713 1 3
20、 2 7.62 7.01 6.38 7.413 2 1 3 7.79 7.38 7.56 6.283 3 2 1 8.09 8.17 8.14 7.49;proc anova;class a b c d;model y = a b c d a*b;means a b c d a*b/t;run;第六章 相关分析第一节 相关分析(CORR)CORR过程的格式:PROC CORR 选项;(HOEFFDING;KENDALL;SPEARMAN,缺省为PEARSON); PEARSON计算直线相关系数;SPEARMAN计算等级相关系数(%);VAR 变量表; 指明分析的变量WITH 变量表; 指明配对
21、的变量名。与VAR语句配合使用,VAR语句列出相关矩阵上部出现的变量,WITH语句列出左侧出现的变量。PARTIAL 变量表; 指明偏相关变量即指定相对固定的那些变量,PARTIAL语句指定的变量名不能出现在VAR或WITH语句中。BY 变量表;RUN;例1:测定黑麦草种群特征,密度X1(株/m2)、植株高度X2(cm)、单株丛径X3(cm)及生物量Y(g/m2)数据如下:密度 x1植株高度 x2单株丛径 x3生物量 y35404042374543374442607464717268786670650.72.52.03.01.11.54.32.03.23.0160026002100265024
22、0022002750160027502500Data one;Input x1-x3 y ;Cards;35 60 0.7 160040 74 2.5 260040 64 2.0 210042 71 3.0 265037 72 1.1 240045 68 1.5 220043 78 4.3 275037 66 2.0 160044 70 3.2 275042 65 3.0 2500;Proc corr;Proc corr;Partial x1;Var x2 x3 y;Rnu; Simple StatisticsVariable N Mean Std Dev Sum Minimum Maximu
23、m x1 10 40.50000 3.30824 405.00000 35.00000 45.00000 x2 10 68.80000 5.28730 688.00000 60.00000 78.00000 x3 10 2.33000 1.08735 23.30000 0.70000 4.30000 y 10 2315 434.00589 23150 1600 2750 Pearson Correlation Coefficients, N = 10 Prob > |r| under H0: Rho=0 x1 x2 x3 y x1 1.00000 0.43195 0.64093 0.69
24、454 0.2125 0.0458 0.0258 x2 0.43195 1.00000 0.62927 0.76165 0.2125 0.0513 0.0105 x3 0.64093 0.62927 1.00000 0.72882 0.0458 0.0513 0.0168 y 0.69454 0.76165 0.72882 1.00000 0.0258 0.0105 0.0168 1 Partial Variables: x1 3 Variables: x2 x3 y Pearson Partial Correlation Coefficients, N = 10 Prob > |r|
25、under H0: Partial Rho=0 x2 x3 y x2 1.00000 0.50906 0.71146 0.1616 0.0316 x3 0.50906 1.00000 0.51366 0.1616 0.1572 y 0.71146 0.51366 1.00000 0.0316 0.1572第二节 回归分析一、线性回归分析回归方程在农业领域中的应用: 1、描述某种现象与其影响因素的数量依存关系, 如作物产量与施肥、浇水量的关系;2、预测。把预报因子(自变量)代入回归方程对预报量(因变量)及其波动范围进行估计;3、控制。根据回归方程进行逆运算,即要求因变量在一定范围内波动,可以通过
26、控制自变量的取值来实现。1、REG过程(线性模型)PROC REG;MODEL 依变量=自变量/选项;(指定回归模型中因变量和自变量、回归计算方法、估计值、预测值和残差等)RUN;Ø 语句说明:MODEL语句中的“选项”内容:u 模型选择方法(对多元(三个因素以上)线性回归而言),包括:l STEPWISE(逐步回归) MODEL 依变量=自变量/selection=stepwise sls=0.05 sle=0.05;n SLSTAY(SLS)=剔除时概率水平;n SLENTRY(SLE)=选入时概率水平;l FORWARD(逐个选入) MODEL 依变量=自变量/selectio
27、n=forward sle=0.05;l BACKWARD(逐个剔除) MODEL 依变量=自变量/selection=backward sls=0.05;u STB:通径系数(计算标准回归系数);u CLM:条件总体平均数的置信区间。即当x=m时,若实测100次,则其平均数落在该置信区间的次数为95次(95%的概率);u CLI:观察值的预测区间。即当x=m时,若实测100次,则测定值落在该置信区间的次数为95次(95%的概率)。例1、取某水稻土(pH=5.5),加入HCl或Na2CO2改变pH值(x),在30下放置28天,然后中和之,测定每100g烘干土中NH4+-N的毫克数(y),试确定
28、变量Y依x的回归方程。X Y2 133 9.2 4 6.6 5 4.7 6 47 7.1 8 13.2 9 20Data two;Input x y ;X2=x*x;Cards;2 13 3 9.2 4 6.6 5 4.7 6 47 7.1 8 13.2 9 20;Proc reg;Model y= x/clm cli;Model y = x x2/clm cli;Run; The REG Procedure Model: MODEL1 Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Square
29、 F Value Pr > F Model 1 29.00024 29.00024 1.00 0.3563 Error 6 174.33476 29.05579 Corrected Total 7 203.33500 Root MSE 5.39034 R-Square 0.1426 Dependent Mean 9.72500 Adj R-Sq -0.0003 Coeff Var 55.42769 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept
30、1 5.15476 4.95571 1.04 0.3384 x 1 0.83095 0.83175 1.00 0.3563The REG Procedure Model: MODEL2 Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 2 198.60405 99.30202 104.95 <.0001 Error 5 4.73095 0.94619 Corrected Total 7 203.33500 Root MSE 0.97
31、272 R-Square 0.9767 Dependent Mean 9.72500 Adj R-Sq 0.9674 Coeff Var 10.00230 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept 1 30.27381 2.07842 14.57 <.0001 x 1 -10.22143 0.83905 -12.18 <.0001 x1 1 1.00476 0.07505 13.39 <.0001 Output Statisti
32、cs Dep Var Predicted Std Error Obs y Value Mean Predict 95% CL Mean 95% CL Predict Residual1 13.0000 13.8500 0.8187 11.7455 15.9545 10.5818 17.1182 -0.85002 9.2000 8.6524 0.5145 7.3298 9.9749 5.8237 11.4811 0.54763 6.6000 5.4643 0.4687 4.2595 6.6690 2.6887 8.2398 1.13574 4.7000 4.2857 0.5145 2.9632
33、5.6083 1.4570 7.1144 0.41435 4.0000 5.1167 0.5145 3.7941 6.4392 2.2880 7.9454 -1.11676 7.1000 7.9571 0.4687 6.7524 9.1619 5.1816 10.7327 -0.85717 13.2000 12.8071 0.5145 11.4846 14.1297 9.9785 15.6358 0.39298 20.0000 19.6667 0.8187 17.5622 21.7711 16.3985 22.9349 0.3333例2:测定某植物种群的密度(X1),每丛植株小穗数(X2),百
34、粒重(X3,g),高度(X4,cm)和每m2生物量(y,g)的关系,得结果如下,试确定变量y依x的最优线性回归方程。10 23 3.6 113 15.79 20 3.6 106 14.510 22 3.7 111 17.513 21 3.7 109 22.510 22 3.6 110 15.510 23 3.5 103 16.98 23 3.3 100 8.610 24 3.4 114 17.010 20 3.4 104 13.710 21 3.4 110 13.410 23 3.9 104 20.38 21 3.5 109 10.26 23 3.2 114 7.48 21 3.7 113 1
35、1.69 22 3.6 105 12.3 Data new;Input x1-x4 y ;Cards;10 23 3.6 113 15.79 20 3.6 106 14.510 22 3.7 111 17.513 21 3.7 109 22.510 22 3.6 110 15.510 23 3.5 103 16.98 23 3.3 100 8.610 24 3.4 114 17.010 20 3.4 104 13.710 21 3.4 110 13.410 23 3.9 104 20.38 21 3.5 109 10.26 23 3.2 114 7.48 21 3.7 113 11.69 22 3.6 105 12.3;proc reg;model y = x1-x4/selection = stepwise sls=0.05 sle=0.05 stb;run; Stepwise Selection: Step 2 Variable x3 Entered: R-Square = 0.8818 and C(p) = 6.3911 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 2 211.54256 105.77128 44.78 <.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025班组安全培训考试试题附完整答案(夺冠系列)
- 2025年企业负责人安全培训考试试题含答案【培优】
- 2025年企业级安全培训考试试题附答案(突破训练)
- 2025民间房产抵押借款合同范本下载
- 2025授权采购石油居间合同
- 2025《酒店业劳动合同》
- 2025年新型静电消除器项目合作计划书
- 2025年建筑防水卷材及制品项目合作计划书
- 2025装饰设计工程承包合同范本模板
- 2025因合同期满离职信
- 婴童服饰行业分析
- 2020-2021学年小学道德与法治名师工作室工作计划
- 【试卷】-《新能源汽车整车控制系统检修》课程考试试卷(闭卷)A卷
- 机电技术应用专业群教学模式改革典型案例
- 大型会展中心管理及运营模式研究-以大虹桥国家会展中心为例
- 《中国药典》中药质量标准研究制定技术要求
- 江苏开放大学2023年秋《组织行为学 060044》第二次作业参考答案
- 试卷印制服务投标方案
- 室外健身器材施工方案
- GB/T 462-2023纸、纸板和纸浆分析试样水分的测定
- 加油站防雷设施巡查记录
评论
0/150
提交评论