数学建模-统计.ppt_第1页
数学建模-统计.ppt_第2页
数学建模-统计.ppt_第3页
数学建模-统计.ppt_第4页
数学建模-统计.ppt_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学建模,概率统计专题,华中农业大学数学建模基地,专题板块系列,华中农业大学数学建模基地,概率统计专题,概率统计,华中农业大学数学建模基地,part1:方差分析与协方差分析,单因素协方差分析,四,双因素协方差分析,华中农业大学数学建模基地,在试验中,有可能影响试验指标并且有可能加以控制的试验条件称为因素。通过试验的设计,在试验中只安排一个因素有所变化、取不同的状态或水平,而其余的因素都在设计的状态或水平下保持不变的试验称为单因素试验。,单因素方差分析理论,华中农业大学数学建模基地,因素A的水平 观测值,(n1+n2+nr= n),单因素方差分析理论,华中农业大学数学建模基地,在单因素试验中,假

2、设有r 个编号为i =1至 r的正态总体,它们分别服从N(i,2)分布,,单因素方差分析理论,华中农业大学数学建模基地,当i及2未知时,要根据取自这r个正态总 体的r个相互独立且方差相同的样本检验原假设 H0:各i(i=1至r)相等,所作的检验以及对未知 参数的估计称为方差分析。,称为总平均值.,单因素方差分析理论,华中农业大学数学建模基地,总离均差平方和的分解,单因素方差分析理论,华中农业大学数学建模基地,结论1)SST=SSE+SSA;,单因素方差分析理论,华中农业大学数学建模基地,单因素方差分析理论,华中农业大学数学建模基地,结论2),结论3)当H0为真时,,结论4)当H0为真时,SSE

3、、SSA相互独立;,单因素方差分析理论,华中农业大学数学建模基地,结论5)当H0为真时,,单因素方差分析理论,华中农业大学数学建模基地,单因素方差分析-计算,data ex;do a=1 to 3;input n ; do i=1 to n; input x ; Output;end;end; Cards; 8 21 29 24 22 25 30 27 26 10 20 25 25 23 29 31 24 26 20 21 6 24 22 28 25 21 26 ; proc anova; class a;model x=a; means a/duncan cldiff;run;,华中农业大学

4、数学建模基地,例1.1切胚乳试验用小麦种子进行切胚 乳试验,设计分3种处理,同期播种在条件较为 一致的花盆内,出苗后每盆选留2株,成熟后测 量每株粒重(单位:g),得到数据如下:,单因素方差分析-计算,华中农业大学数学建模基地,单因素方差分析-计算,华中农业大学数学建模基地,单因素方差分析-计算,华中农业大学数学建模基地,例1.2药剂处理用4种不同的药剂处理 水稻种子,发芽后观测到苗高(单位:cm)如下:,单因素方差分析-计算,华中农业大学数学建模基地,data ex;do a=1 to 3;do i=1 to 5 ; input x ; output;end;end; cards; 19 2

5、3 21 13 21 24 27 20 20 18 19 15 22 25 27 22 ; proc anova; class a;model x=a; means a/duncan cldiff;run;,单因素方差分析-计算,华中农业大学数学建模基地,单因素方差分析-计算,华中农业大学数学建模基地,单因素方差分析-计算,华中农业大学数学建模基地,通过试验的设计,在试验中只安排两个因素有所变化、取不同的状态或水平,而其他的因素都在设计的状态或水平下保持不变的试验称为双因素试验。,双因素方差分析-不考虑交互作用-理论,华中农业大学数学建模基地,可设双因素试验的一个因素为A,共有A、A、A等r个

6、水平,另一个因素为B,共有B、B、B等s个水平。 这两个因素的水平互相搭配各安排一次试验,其中A因素的A水平与B因素的B水平搭配安排试验所得到的样本为X,相应的观测值为x 。,双因素方差分析-不考虑交互作用-理论,华中农业大学数学建模基地,双因素方差分析-不考虑交互作用-理论,华中农业大学数学建模基地,服从 F(s-1,(r-1)(s-1)分布。,服从F(r-1,(r-1)(s-1)分布。,双因素方差分析-不考虑交互作用-理论,华中农业大学数学建模基地,双因素方差分析-不考虑交互作用-计算,华中农业大学数学建模基地,data ex;do a=1 to 4;do b=1 to 5; input

7、x ;output;end;end; cards; 53 56 45 52 49 47 50 47 47 53 57 63 54 57 58 45 52 42 41 48 ; proc anova;class a b;model x=a b; means a b/duncan cldiff;run;,双因素方差分析-不考虑交互作用-计算,华中农业大学数学建模基地,双因素方差分析-不考虑交互作用-计算,华中农业大学数学建模基地,双因素方差分析-不考虑交互作用-计算,华中农业大学数学建模基地,双因素方差分析-考虑交互作用-理论,可设双因素试验的一个因素为A,共有A1、A2、Ar等r个水平,另一个因

8、素为B,共有B1、B2、Bs等s个水平。这两个因素的水平互相搭配各安排m次试验,其中A因素的A水平与B因素的B水平搭配安排试验所得到的样本为X,相应的观测值为x。,华中农业大学数学建模基地,双因素方差分析-考虑交互作用-理论,华中农业大学数学建模基地,服从F(r-1,rs(m-1)分布,服从 F(s-1,rs(m-1) )分布,服从 F(r-1)(s-1),rs(m-1)分布,双因素方差分析-考虑交互作用-理论,华中农业大学数学建模基地,双因素方差分析-考虑交互作用-理论,华中农业大学数学建模基地,双因素方差分析-考虑交互作用-计算,华中农业大学数学建模基地,data ex;do a=1 to

9、 4;do b=1 to 3;do i=1 to 2; input x ;output;end;end;end; cards; 58.2 52.6 56.2 41.2 65.3 60.8 49.1 42.8 54.1 50.5 51.6 48.4 60.1 58.3 70.9 73.2 39.2 40.7 75.8 71.5 58.2 51 48.7 41.4 ; proc anova;class a b;model x=a b a*b;means a b/duncan cldiff;run;,双因素方差分析-考虑交互作用-计算,华中农业大学数学建模基地,双因素方差分析-考虑交互作用-计算,华

10、中农业大学数学建模基地,双因素方差分析-考虑交互作用-计算,华中农业大学数学建模基地,如果在单因素、双因素或多因素试验中有无法控制的因素x影响试验的结果Y,且x可以测量、x与Y之间又有显著的线性回归时,常常利用线性回归来矫正Y的观测值、消去x的差异对Y的影响。 例如,研究施肥对苹果树产量的影响,由于苹果树的长势不齐,必须消去长势对产量的影响。又如,研究饲料对动物增重的影响,由于动物的初重不同,必须消去初重对增重的影响。,协方差分析,华中农业大学数学建模基地,这种不是在试验中控制某个因素,而是在试验后对该因素的影响进行估计,并对试验指标的值作出调整的方法称为统计控制,可以作为试验控制的辅助手段。

11、以统计控制为目的,综合线性回归分析与方差分析所得到的统计分析方法,称为协方差分析,所需要统计控制的一个或多个因素,例如苹果树的长势,又如动物的初重等等称为协变量。,协方差分析,华中农业大学数学建模基地,单因素协方差分析-理论,华中农业大学数学建模基地,单因素协方差分析-理论,华中农业大学数学建模基地,单因素协方差分析-理论,华中农业大学数学建模基地,单因素协方差分析-理论,华中农业大学数学建模基地,单因素协方差分析-计算,华中农业大学数学建模基地,施用三种肥料的产量矫正后有极显著的差异,单因素协方差分析-计算,华中农业大学数学建模基地,data ex; do a=1 to 3;do i=1 t

12、o 8; input x y ;output ;end;end; cards; 47 54 58 66 53 63 46 51 49 56 56 66 54 61 44 50 52 54 53 53 64 67 58 62 59 62 61 63 63 64 66 69 44 52 48 58 46 54 50 61 59 70 57 64 58 69 53 66 ; proc glm;class a;model y=x a/solution; lsmeans a/stderr pdiff;run;,单因素协方差分析-计算,华中农业大学数学建模基地,单因素协方差分析-计算,华中农业大学数学建模

13、基地,双因素协方差分析-不考虑交互作用,华中农业大学数学建模基地,双因素协方差分析-不考虑交互作用,华中农业大学数学建模基地,data ex;do a=1 to 3 ;do b=1 to 5 ; input x y ;output; end; end; cards; 8 2.85 10 4.24 12 3.00 11 4.94 10 2.88 10 3.14 12 4.50 7 2.75 12 5.84 10 4.06 12 3.88 10 3.86 9 2.82 10 4.94 9 2.89 ; proc glm;class a b ;model y=x a b/solution; lsme

14、ans a b/stderr pdiff;run;,双因素协方差分析-不考虑交互作用,华中农业大学数学建模基地,双因素协方差分析-不考虑交互作用,华中农业大学数学建模基地,各小区的产量矫正后没有显著的差异,各品种的产量矫正后有极显著的差异。,双因素协方差分析-不考虑交互作用,华中农业大学数学建模基地,双因素协方差分析-考虑交互作用,华中农业大学数学建模基地,双因素协方差分析-考虑交互作用,华中农业大学数学建模基地,A与B的交互作用矫正后不显著,促生长剂之间的差异极显著,试验批次间的差异不显著,双因素协方差分析-考虑交互作用,华中农业大学数学建模基地,data ex; do a=1 to 4;

15、do b=1 to 2; do i=1 to 2;input x y ;output;end;end;end; cards; 14.6 97.8 12.1 94.2 19.5 113.2 18.8 110.1 13.6 100.3 12.9 98.5 18.5 119.4 18.2 114.7 12.8 99.2 10.7 89.618.2 122.2 16.9 105.3 12.0 102.1 12.4 103.8 16.4 117.2 17.2 117.9 proc glm; class a b;model y=x a b a*b/solution; lsmeans a b/stderr

16、pdiff;run;,双因素协方差分析-考虑交互作用,华中农业大学数学建模基地,双因素协方差分析-考虑交互作用,华中农业大学数学建模基地,part2 回归方程,多元线性回归,华中农业大学数学建模基地,1. 一元线性回归的基本概念,一元线性回归可用来分析自变量x取值与因 变量Y 取值的内在联系,不过这里的自变量x是 确定性的变量,因变量Y是随机性的变量。,进行n次独立试验,测得数据如下:,一元线性回归,华中农业大学数学建模基地,由回归方程可以推出,根据样本及其观测值可以得到、及 2的估计量及估计值,得到回归方程的估计式或经验回归方程,一元线性回归,华中农业大学数学建模基地,有多种确定回归方程也就

17、是确定未知参数,的方法,其中最常用的是最小二乘 法,即求出,一元线性回归,华中农业大学数学建模基地,的值最小,所求出的a称为经验截距,简称 为截距,b称为经验回归系数,简称为回归 系数,而,一元线性回归,华中农业大学数学建模基地,2. 总体中未知参数的估计,根据最小二乘法的要求由,一元线性回归,华中农业大学数学建模基地, F检验法:,当H0为真时,,且SSR与SSE相互独立;因此,当H0为真时,,当FF1-(1,n-2)时应该放弃原假设H0。,3 一元回归方程检验,一元线性回归,华中农业大学数学建模基地,(2) t检验法:,当H0为真时,,当|t|t1-0.5(n-2)时应该放弃原假设H0。,

18、一元线性回归,华中农业大学数学建模基地,(3) r检验法:,根据x与Y的观测值的相关系数,可以推出,当H0为真时,,一元线性回归,华中农业大学数学建模基地,当FF1-(1,n-2)或|r|r(n-2)时应该放 弃原假设H0,式中的,可由r检验用表中查出。,因此,r常常用来表示x与Y的线性关系在x与Y的全部关系中所占的百分比,又称为x与Y的观测值的决定系数。,一元线性回归,华中农业大学数学建模基地,4. 利用回归方程进行点预测和区间预测,若线性回归作显著性检验的结果是放弃H0, 也就是放弃回归系数0的假设,便可以 利用回归方程进行点预测和区间预测,这是 人们关注线性回归的主要原因之一。, 当xx

19、0时,,Y0的观测值y0的点预测是无偏的。,一元线性回归,华中农业大学数学建模基地, 当xx0时,用适合不等式PY0(G,H) 1-的统计量G和H所确定的随机区间(G,H) 预测Y0的取值范围称为区间预测,而(G,H)称 为Y0的1-预测区间。,若Y与样本中的各Y相互独立,则根据 ZY0-(a+bx0)服从正态分布,E(Z)0,,Z与SSE相互独立,,一元线性回归,华中农业大学数学建模基地,可以导出,因此,Y0的1-预测区间为 a+bx0(x0),,一元线性回归,华中农业大学数学建模基地,例1.1吸附方程某种物质在不同温度下 可以吸附另一种物质,如果温度x(单位:)与 吸附重量Y(单位:mg)

20、的观测值如下表所示:,温度x 1.5 1.8 2.4 3.0 3.5 3.9 4.4 4.8 5.0,重量y 4.8 5.7 7.0 8.3 10.9 12.4 13.1 13.6 15.3,试求线性回归方程并用三种方法作显著性检验,若x02,求Y0的0.95预测区间。,解:根据上述观测值得到n9,,一元线性回归,华中农业大学数学建模基地,data ex;input x y ; cards; 1.5 4.8 1.8 5.7 2.4 7 3 8.3 3.5 10.9 3.9 12.4 4.4 13.1 4.8 13.6 5 15.3 2 . ; proc gplot;plot y*x;symbo

21、l i=rl v=dot;proc reg;model y=x/cli; run;,一元线性回归,华中农业大学数学建模基地,一元线性回归,华中农业大学数学建模基地,一元线性回归,华中农业大学数学建模基地,一元线性回归,华中农业大学数学建模基地,一元非线性回归,华中农业大学数学建模基地,data ex;input x y ; x1=1/x;lx=log(x);ly=log(y); cards; 1 1.85 2 1.37 3 1.02 4 0.75 4 0.56 6 0.41 6 0.31 8 0.23 8 0.17 ; proc gplot; plot y*x; symbol i=spline

22、 v=star; proc reg;model y=x1; proc reg;model ly=lx; proc reg;model ly=x;run;,一元非线性回归,华中农业大学数学建模基地,一元非线性回归,华中农业大学数学建模基地,一元非线性回归,华中农业大学数学建模基地,一元非线性回归,华中农业大学数学建模基地,一元非线性回归,华中农业大学数学建模基地,一元非线性回归,华中农业大学数学建模基地,计算剩余平方和Q,data ex;input x y ; x1=1/x;lx=log(x);ly=log(y); y1=0.1159+1.9291*x1;q1+(y-y1)*2; y2=exp(

23、0.9638-1.1292*lx);q2+(y-y2)*2; y3=exp(0.9230-0.3221*x);q3+(y-y3)*2; cards; 1 1.85 2 1.37 3 1.02 4 0.75 4 0.56 6 0.41 6 0.31 8 0.23 8 0.17 ; proc print;var q1-q3;run;,华中农业大学数学建模基地,计算剩余平方和Q,华中农业大学数学建模基地,多元线性回归,人的体重与身高、胸围 血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史 糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂 射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁

24、损半径与辐射的温度、与照射的时间,华中农业大学数学建模基地,多元线性回归模型的一般形式,华中农业大学数学建模基地,多元回归分析数据格式,华中农业大学数学建模基地,多元线性回归分析的一般步骤,华中农业大学数学建模基地,拟合优度公式,回归参数的检验公式,参数估计公式,多元回归分析的几个公式,华中农业大学数学建模基地,多元回归的假设检验,华中农业大学数学建模基地,实例:湖北省油菜投入与产出的统计分析,1投入指标 (1)土地(S)。土地用播种面积来表示。农作物播种面积是指当年从事农业 (2)劳动(L)。劳动用劳动用工数(成年劳动力一人劳动一天为一个工)来表示。劳动用工中包含着直接和间接生产用工。 (3

25、)资本(K)。资本用物质费用来表示。物质费用包含直接费用和间接费用。主要有种子秧苗费、农家肥费、化肥费、农药费、畜力、固定资产折旧费和管理及其他费用等。,华中农业大学数学建模基地,2 产出指标 产出指标用湖北省历年油菜生产的总产量(Y)来表示。 Y.S的资料均来自湖北农村统计年鉴(历年)的取值是依据湖北农村统计年鉴(历年)中的湖北省油菜每亩平均投入量乘以播种面积得到。,华中农业大学数学建模基地,华中农业大学数学建模基地,华中农业大学数学建模基地,data ex;input y k s l t ; x1=log(k);x2=log(s);x3=log(l);y1=log(y); cards; 7

26、0.897240076.5884825.130515347.42731 83.750648008.7690915.150015832.09502 70.862744593.8425801.615013306.80903 78.345143460.3229783.210013314.57004 98.074972657.2633923.805014596.11905 134.8767146108.34211282.890020911.10707 147.5315162433.35001244.700018670.50008 154.7607166979.63251330.515018627.21

27、009 159.9743190395.52621505.460020775.348010 198.4942205914.66451738.410022599.330011 194.7943189762.73351677.090020963.625012 187.1013193461.56101761.945021936.215314 235.1184183768.40351779.150019606.233015 ; proc reg;model y1=x1 x2 x3 t ; run;,华中农业大学数学建模基地,Sum of Mean Source DF Squares Square F V

28、alue Pr F Model 4 2.15231 0.53808 148.95 |t| Intercept 1 0.93016 1.91920 0.48 0.6409 x1 1 0.24781 0.09610 2.58 0.0327 x2 1 1.28223 0.57122 2.24 0.0550 x3 1 -0.82102 0.55591 -1.48 0.1780 t 1 -0.00168 0.02437 -0.07 0.9466,华中农业大学数学建模基地,Sum of Mean Source DF Squares Square F Value Pr F Model 3 2.15229 0.71743 223.29 |t| Intercept 1 0.87950 1.67253 0.53 0.6117 x1 1 0.24554 0.08518 2.88 0.0181 x2 1 1.24568 0.20239 6.15 0.0002 x3 1 -0.78798 0.26689 -2.95 0.0162,华中农业大学数学建模基地,DW=2.537 F=404.25 R2=0.988 K,S。L的t值分别为(3.366) (6.647) (-10.316),华中农业大学数学建模基地,1990-1999年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论