




已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三节 方差分析在一个因素不同水平下(三个水平以上)或是在多个因素不同水平组合下测量一个连续反应变量(因变量),这个反应变量的总变异可被解释为分类变量的效应(即主效应,如A,B分别表示由于分类变量A和B的不同水平引起的变异)或分类变量的组合产生的效应(即交互效应,如A*B表示A与B的交互作用),余下的变异为随机误差。方差分析的基本思想是将所有观察值的总变异分解成不同的变异来源,即对总变异的自由度和平方和进行分解,进而获得不同变异来源的总体方差的估值。通过构建适当的F值,进行F测验,完成多个样本平均数之间差异显著性测验。当处理效应为固定效应时,尚可对各个处理平均数进行多重比较。变异来源离均差平方和(SS)自由度(df)均方(MS)F值P值ABA *BSSA=QA-CSSB=QB-CSSAXB=QAB-C- SSA SSBp-1q-1(p-1)(q-1)SSA/dfASSB/dfBSSAxB/ dfAxBMSA/MSEMSB/MSEMSAB/MSE*误差SSE=SST-SSA-SSB- SSABPq(r-1)SSe/dfe(MSE)总计SST=W-Cpqr-1一 、 方差分析(ANOVA)过程 过程格式:Proc anova;Class分类变量名列表;Model依变量=自变量效应表/选项;Means自变量效应名列表/选项;Test H=效应变量名 E=误差项;Run;Proc anova;Class 分类变量名列表;通常对主效应变量进行分类,如果是区组试验,需要同时对区组变量进行分类;Model依变量=自变量效应表/选项;列出希望计算出的效应变量,一般为主效应、互作效应、区组效应;给出主效应和互作效应的方差分析结果。Y= a 单因素主效模型Y= a b a*b两因素带互作模型Y= a b c a*b a*c b*c a*b*c 三因素带互作模型;Means自变量效应名列表/选项;进行多重比较分析,主要分析同一因素不同水平间的效应差异;一般只对主效应分析;选项用于设定多重比较方法等,常用的选项有LSD或t(最小显著差数法)DUNCAN(新复极差测验)TUKEY(固定极差测验法)。显著水平的设定ALPHA=,缺省值为0.05。Test H=效应变量名 E=误差项;TEST H=效应表 E=效应:用以指定某效应作为误差项。缺省时,以残差MSE作为误差项。其中:H=效应变量名,用以指定MODEL语句中作为假设检验的效应, E=误差项,用以指定作为误差项的效应,常用主效应*区组效应。RUN;二、方差分析的类型1、试验设计类型:u 随机试验设计u 随机区组试验设计1)单因素试验 单项分组资料的方差分析(单因素完全随机试验)变异来源离均差平方和(SS)自由度(df)均方(MS)F值P值处理组间SSA=QA-Cp-1SS组间/df组间MS组间/MS组内误差SSE=SST-SSAN-PSS组内/df组内总计SST=W-CN-1 Proc anova;Class A;Model Y= A ;NEANS A/LSD;Run; 单因素完全随机区组试验变异来源离均差平方和(SS)自由度(df)均方(MS)F值P值处理组间区组间SSA=QA-CSSB=QB-Ca-1b-1SSA/dfASSB/dfBMSA/MSEMSB/MSE误差SSE=SST-SSA-SSBN-a-b+1SSE/dfE总计SST=W-CN-1 Proc anova;Class A C;Model Y= A C;Means A/lsd;Run;例1: 有一个水稻施肥实验,设有5个处理(trt),分别为A(施氨水1),B(施氨水2),C(施碳氨),D(施尿素)和E(不施肥)。每个处理均种植4盆,随机排列,试分析各处理对水稻平均产量的影响。A:24 30 28 26 B:27 24 21 26C:31 28 25 30D:32 33 33 28E:21 22 16 21Data two;Do trt = 1 to 5;Do rep = 1 to 4;Input y ; output;End; end;Cards;24 30 28 26 27 24 21 2631 28 25 3032 33 33 2821 22 16 21;proc anova;class trt;model y = trt;means trt/t;run;2)二因素试验 随机试验设计和随机区组试验设计: 两项分组资料的方差分析(二因素完全随机试验) 变异来源离均差平方和(SS)自由度(df)均方(MS)F值P值ABA *BSSA=QA-CSSB=QB-CSSAXB=QAB-C- SSA SSBp-1q-1(p-1)(q-1)SSA/dfASSB/dfBSSAxB/ dfAxBMSA/MSEMSB/MSEMSAB/MSE误差SSE=SST-SSA-SSB-SSAxBPq(r-1)SSe/dfe总计SST=W-CPqr-1 Proc anova;Class A B;Model Y= A B A * B;Means a b/lsd;Run; 二因素随机区组试验Y=+ A处理效应 + B处理效应 + A *B互作 + 区组效应 (C) + 随机误差Proc anova;Class A、B C;Model Y=A B A * B C; Means a b c/lsd; Run;例2:研究水分和肥料两个因素与番茄产量之间的关系,其中水分设三个水平(W1-100%、W2-75%、W3-50%)、肥料设两个水平(F1-20kg、F2-40kg),组成6个水分-肥料试验组合,观察其对番茄的增产效果,每个组合5次重复,各个组合的产量(kg/m2)结果如下表,试进行方差分析。(随机试验设计和随机区组试验设计):表1:水分和肥料组合对番茄产量的影响水分(A)肥料水平(B)B 1B 2A 133.4 23.5 31.8 39.2 18.227.5 33.5 31.6 41.0 27.8A 220.2 24.6 22.3 18.5 24.528.2 15.2 23.4 20.9 19.5A 325.2 33.1 27.4 29.1 22.220.2 27.8 31.3 29.6 24.2Data one; do a = 1 to 3; do b = 1 to 2; do rep = 1 to 5; Input M ; output;end; end; end; cards;33.4 23.5 31.8 39.2 18.227.5 33.5 31.6 41.0 27.820.2 24.6 22.3 18.5 24.528.2 15.2 23.4 20.9 19.525.2 33.1 27.4 29.1 22.220.2 27.8 31.3 29.6 24.2;Proc anova; class a b rep;model m = a b a*b rep;means a b/t alpha = 0.05; run;三、特殊试验设计的线性模型1、 裂区试验设计:Y=+ 区组效应 + 主、副处理效应 +主、副处理互作效应+ 随机误差Proc anova;Class区组效应 主处理效应 副处理效应;Model Y= 区组效应 主处理效应 副处理效应 主*副处理互作效应 主处理效应*区组互作效应;MEANS主、副处理效应/T;TEST H =主效应 E=主效应*区组效应;RUN;例:研究践踏强度(T1、T2、T3)与施氮水平(N1、N2、N3)对草坪质量的影响,试验采用裂区设计,主区为践踏强度,副区为施氮水平,3次重复,试分析践踏强度和施氮水平对草坪密度(株,cm2)的影响。轻度践踏(T1)中度践踏(T2)重度践踏(T3)N2N1N3N3N2N1N2N1N3707090706060204040908095807060354550607080905070203030DATA turf;Do T = 1 to 3;Do N= 1 to 3;Do rep = 1 to 3;Input y ;Output;End; end; end;Cards;70 80 70 70 90 60 90 95 8060 60 70 60 70 50 70 80 90 40 45 30 20 35 20 40 50 30;proc anova;class T N REP;model y = T N T*N REP T*rep;means T N/T;test H=T E=T*REP;RUN;3 正交试验设计3.1 无重复正交试验设计资料的方差分析例:研究5种蛋鸡育成期的配合饲料对鸡产蛋效果的影响。配合饲料中主要考察5种成分组成,各成分均取3个水平,试找出最优的配方方案。A (玉米):a1(61.5) a2(66.0) a3 (70.6)B (麸皮): b1(6.5) b2(8.0) b3(14.0) C(豆饼) c1(6.0) c2(9.0) c3(15.0)D(鱼粉) d1(3.0) d2(5.0) d3(9.0)E(食盐) e1 (0.0) e2 (0.1) e3(0.25) 同时需要考虑a*b、 a*c 、a*e的互作。选用L27(313)正交表,表头设计为:a、b、c、e、d依次放在第1、2、5、8、11列上,a*b、 a*c 、a*e分别放在(3、4)、(6、7)、(9、10)列上。 Data zjfx;Input a b c e d y;Cards;1 1 1 1 1 569 1 1 2 2 2 554 1 1 3 3 3 637 1 2 1 2 3 5661 2 2 3 1 565 1 2 3 1 2 648 1 3 1 3 2 581 1 3 2 1 3 5681 3 3 2 1 535 2 1 1 1 1 593 2 1 2 2 2 615 2 1 3 3 3 6202 2 1 2 3 586 2 2 2 3 1 597 2 2 3 1 2 617 2 3 1 3 2 5992 3 2 1 3 613 2 3 3 2 1 580 3 1 1 1 1 569 3 1 2 2 2 6153 1 3 3 3 591 3 2 1 2 3 586 3 2 2 3 1 616 3 2 3 1 2 6303 3 1 3 2 566 3 3 2 1 3 638 3 3 3 2 1 573;Proc anova;Class a b c d e;Model y= a b c d e a*b a*c a*e;Means a b c d e a*b a*c a*e/t;Run; Means with the same letter are not significantly different. t Grouping Mean N a A 602.222 9 2 A 598.222 9 3 B 580.333 9 1 t Grouping Mean N b A 601.222 9 2 B A 595.889 9 1 B 583.667 9 3 t Grouping Mean N c A 603.444 9 3 A 597.889 9 2 B 579.444 9 1 t Grouping Mean N d A 602.778 9 2 A 600.556 9 3 B 577.444 9 1 t Grouping Mean N e A 605.000 9 1 A 596.889 9 3 B 578.889 9 2 Level of Level of -y- a c N Mean Std Dev 1 1 3 572.000000 7.9372539 1 2 3 562.333333 7.3711148 1 3 3 606.666667 62.3083729 2 1 3 592.666667 6.5064071 2 2 3 608.333333 9.8657657 2 3 3 605.666667 22.2785397 3 1 3 573.666667 10.7857931 3 2 3 623.000000 13.0000000 3 3 3 598.000000 29.1376046最优组合为:a3、b2、c2、d2、e33.2有重复正交试验设计资料的方差分析例:有四种药物,每种药物有三水平:A药(A1=2%,A2=5%, A3=8%),B药(B1=0%,B2=1%,B3=2%),C药(C1=0%,C2=1%,C3=3%)及D药(D1=0%,D2=1%,D3=3%)。问四种药物对蚊子的50%击到时间有无差别?采用正交表L9(34)。相同试验条件下均做4次重复。试验号ABCD50%击到时间/S 111119.417.1910.733.732122211.9111.8511.0011.723133310.6710.7010.9110.18421233.873.183.804.85522314.205.724.853.71623124.293.893.884.71731327.627.016.837.41832137.797.387.566.28933218.098.178.147.49Data two;Input a b c d ;Do I= 1 to 4;Input y ; output;End;Cards;1 1 1 1 9.41 7.19 10.73 3.731 2 2 2 11.91 11.85 11.00 11.721 3 3 3 10.67 10.70 10.91 10.182 1 2 3 3.87 3.18 3.80 4.852 2 3 1 4.20 5.72 4.58 3.712 3 1 2 4.29 3.89 3.88 4.713 1 3 2 7.62 7.01 6.38 7.413 2 1 3 7.79 7.38 7.56 6.283 3 2 1 8.09 8.17 8.14 7.49;proc anova;class a b c d;model y = a b c d a*b;means a b c d a*b/t;run;第六章 相关分析第一节 相关分析(CORR)CORR过程的格式:PROC CORR 选项;(HOEFFDING;KENDALL;SPEARMAN,缺省为PEARSON); PEARSON计算直线相关系数;SPEARMAN计算等级相关系数(%);VAR 变量表; 指明分析的变量WITH 变量表; 指明配对的变量名。与VAR语句配合使用,VAR语句列出相关矩阵上部出现的变量,WITH语句列出左侧出现的变量。PARTIAL 变量表; 指明偏相关变量即指定相对固定的那些变量,PARTIAL语句指定的变量名不能出现在VAR或WITH语句中。BY 变量表;RUN;例1:测定黑麦草种群特征,密度X1(株/m2)、植株高度X2(cm)、单株丛径X3(cm)及生物量Y(g/m2)数据如下:密度 x1植株高度 x2单株丛径 x3生物量 y35404042374543374442607464717268786670650.72.52.03.01.11.54.32.03.23.01600260021002650240022002750160027502500Data one;Input x1-x3 y ;Cards;35 60 0.7 160040 74 2.5 260040 64 2.0 210042 71 3.0 265037 72 1.1 240045 68 1.5 220043 78 4.3 275037 66 2.0 160044 70 3.2 275042 65 3.0 2500;Proc corr;Proc corr;Partial x1;Var x2 x3 y;Run; Simple StatisticsVariable N Mean Std Dev Sum Minimum Maximum x1 10 40.50000 3.30824 405.00000 35.00000 45.00000 x2 10 68.80000 5.28730 688.00000 60.00000 78.00000 x3 10 2.33000 1.08735 23.30000 0.70000 4.30000 y 10 2315 434.00589 23150 1600 2750 Pearson Correlation Coefficients, N = 10 Prob |r| under H0: Rho=0 x1 x2 x3 y x1 1.00000 0.43195 0.64093 0.69454 相关系数 0.2125 0.0458 0.0258 P值 x2 0.43195 1.00000 0.62927 0.76165 0.2125 0.0513 0.0105 x3 0.64093 0.62927 1.00000 0.72882 0.0458 0.0513 0.0168 y 0.69454 0.76165 0.72882 1.00000 0.0258 0.0105 0.0168 1 Partial Variables: x1 3 Variables: x2 x3 y Pearson Partial Correlation Coefficients, N = 10 Prob |r| under H0: Partial Rho=0 x2 x3 y x2 1.00000 0.50906 0.71146 0.1616 0.0316 x3 0.50906 1.00000 0.51366 0.1616 0.1572 y 0.71146 0.51366 1.00000 0.0316 0.1572第二节 回归分析一、线性回归分析回归方程在农业领域中的应用: 1、描述某种现象与其影响因素的数量依存关系, 如作物产量与施肥、浇水量的关系;2、预测。把预报因子(自变量)代入回归方程对预报量(因变量)及其波动范围进行估计;3、控制。根据回归方程进行逆运算,即要求因变量在一定范围内波动,可以通过控制自变量的取值来实现。1、REG过程(线性模型)PROC REG;MODEL 依变量=自变量/选项;(指定回归模型中因变量和自变量、回归计算方法、估计值、预测值和残差等)RUN; 语句说明:MODEL语句中的“选项”内容:u 模型选择方法(对多元(三个因素以上)线性回归而言),包括:l STEPWISE(逐步回归) MODEL 依变量=自变量/selection=stepwise sls=0.05 sle=0.05;n SLSTAY(SLS)=剔除时概率水平;n SLENTRY(SLE)=选入时概率水平;l FORWARD(逐个选入) MODEL 依变量=自变量/selection=forward sle=0.05;l BACKWARD(逐个剔除) MODEL 依变量=自变量/selection=backward sls=0.05;u STB:通径系数(计算标准回归系数);u CLM:条件总体平均数的置信区间。即当x=m时,若实测100次,则其平均数落在该置信区间的次数为95次(95%的概率);u CLI:观察值的预测区间。即当x=m时,若实测100次,则测定值落在该置信区间的次数为95次(95%的概率)。例1、取某水稻土(pH=5.5),加入HCl或Na2CO2改变pH值(x),在30下放置28天,然后中和之,测定每100g烘干土中NH4+-N的毫克数(y),试确定变量Y依x的回归方程。X Y2 133 9.2 4 6.6 5 4.7 6 47 7.1 8 13.2 9 20Data two;Input x y ;X2=x*x;Cards;2 13 3 9.2 4 6.6 5 4.7 6 47 7.1 8 13.2 9 20;Proc reg;Model y= x/clm cli;Model y = x x2/clm cli;Run; The REG Procedure Model: MODEL1 Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Squ
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 合同内延期交房免责协议
- 中老年服装定制合同范本
- 公司向股东还款合同范本
- 吊车司机合同协议书模板
- 公司入伙协议书范本合同
- 共享充电宝代理合同协议
- 厂房使用委托协议书范本
- 化合物材料销售合同范本
- 低价电动车购买合同范本
- 劳动合同暂时中止协议书
- 矿山生态环境保护与恢复治理技术规范(试行)(HJ 651-2013)
- 2024年度炎症性肠病(IBD)课件
- 新译林版高一必修三单词表全套
- 现代智力七巧板课件
- 孕妇孕期保健的重要性与方法
- 摄影技术新闻摄影培训
- 2024年2024年2024年全国初中数学联合竞赛试题及参考答案
- 《红楼梦》中的家族兴衰与社会变革
- 济公(粤语版)全剧本
- 山东省汽车维修工时定额(T-SDAMTIA 0001-2023)
- 建筑节能评估报告书-三亚-(深圳市建筑设计研究总院)
评论
0/150
提交评论