




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学建模统计第一页,共一百零五页,2022年,8月28日专题板块系列概率统计专题1优化专题2模糊方法及微分方程专题3图论专题4第二页,共一百零五页,2022年,8月28日概率统计专题Part1:方差分析与协方差分析概率统计Part2:回归方程第三页,共一百零五页,2022年,8月28日part1:方差分析与协方差分析一单因素方差分析二双因素方差分析三单因素协方差分析四双因素协方差分析第四页,共一百零五页,2022年,8月28日在试验中,有可能影响试验指标并且有可能加以控制的试验条件称为因素。通过试验的设计,在试验中只安排一个因素有所变化、取不同的状态或水平,而其余的因素都在设计的状态或水平下保持不变的试验称为单因素试验。
单因素方差分析—理论第五页,共一百零五页,2022年,8月28日因素A的水平观测值(n1+n2+…+nr=n)单因素方差分析—理论第六页,共一百零五页,2022年,8月28日在单因素试验中,假设有r个编号为i=1至r的正态总体,它们分别服从N(μi,σ2)分布,
单因素方差分析—理论第七页,共一百零五页,2022年,8月28日当μi及σ2未知时,要根据取自这r个正态总体的r个相互独立且方差相同的样本检验原假设H0:各μi(i=1至r)相等,所作的检验以及对未知参数的估计称为方差分析。
μ称为总平均值.单因素方差分析—理论第八页,共一百零五页,2022年,8月28日总离均差平方和的分解单因素方差分析—理论第九页,共一百零五页,2022年,8月28日结论1)SST=SSE+SSA;
单因素方差分析—理论第十页,共一百零五页,2022年,8月28日单因素方差分析—理论第十一页,共一百零五页,2022年,8月28日结论2)
结论3)当H0为真时,
结论4)当H0为真时,SSE、SSA相互独立;
单因素方差分析—理论第十二页,共一百零五页,2022年,8月28日结论5)当H0为真时,单因素方差分析—理论第十三页,共一百零五页,2022年,8月28日单因素方差分析--计算dataex;doa=1to3;inputn@@;doi=1ton;inputx@@;Output;end;end;Cards;8212924222530272610202525232931242620216242228252126;procanova;classa;modelx=a;meansa/duncancldiff;run;第十四页,共一百零五页,2022年,8月28日例1.1《切胚乳试验》用小麦种子进行切胚乳试验,设计分3种处理,同期播种在条件较为一致的花盆内,出苗后每盆选留2株,成熟后测量每株粒重(单位:g),得到数据如下:
处理未切去胚乳切去一半胚乳切去全部胚乳
每株粒重
21,29,24,22,25,30,27,2620,25,25,23,29,31,24,26,20,2124,22,28,25,21,26单因素方差分析--计算第十五页,共一百零五页,2022年,8月28日单因素方差分析--计算第十六页,共一百零五页,2022年,8月28日方差来源
A
误差总和平方和
6.77223.73230.50自由度
22123均方和
3.3910.65
F值
0.32显著性
N单因素方差分析--计算第十七页,共一百零五页,2022年,8月28日例1.2《药剂处理》用4种不同的药剂处理水稻种子,发芽后观测到苗高(单位:cm)如下:
处理
1234
苗高
19,23,21,1321,24,27,2020,18,19,1522,25,27,22单因素方差分析--计算第十八页,共一百零五页,2022年,8月28日dataex;doa=1to3;doi=1to5;inputx@@;output;end;end;cards;19232113212427202018191522252722;proc
anova;classa;modelx=a;meansa/duncancldiff;run;单因素方差分析--计算第十九页,共一百零五页,2022年,8月28日单因素方差分析--计算第二十页,共一百零五页,2022年,8月28日方差来源
A
误差总和平方和
104118222自由度
31215均方和
34.679.83
F值
3.53显著性*单因素方差分析--计算第二十一页,共一百零五页,2022年,8月28日通过试验的设计,在试验中只安排两个因素有所变化、取不同的状态或水平,而其他的因素都在设计的状态或水平下保持不变的试验称为双因素试验。
双因素方差分析-不考虑交互作用-理论第二十二页,共一百零五页,2022年,8月28日可设双因素试验的一个因素为A,共有A、A、…、A等r个水平,另一个因素为B,共有B、B、…、B等s个水平。这两个因素的水平互相搭配各安排一次试验,其中A因素的A水平与B因素的B水平搭配安排试验所得到的样本为X,相应的观测值为x
。双因素方差分析-不考虑交互作用-理论第二十三页,共一百零五页,2022年,8月28日双因素方差分析-不考虑交互作用-理论第二十四页,共一百零五页,2022年,8月28日服从F(s-1,(r-1)(s-1))分布。方差来源平方和自由度均方和F值显著性AB误差总和SSASSBSSESSTr-1s-1(r-1)(s-1)rs-1MSAMSBMSEFAFB服从F(r-1,(r-1)(s-1))分布。双因素方差分析-不考虑交互作用-理论第二十五页,共一百零五页,2022年,8月28日双因素方差分析-不考虑交互作用-计算第二十六页,共一百零五页,2022年,8月28日dataex;doa=1to4;dob=1to5;inputx@@;output;end;end;cards;5356455249475047475357635457584552424148;proc
anova;classab;modelx=ab;meansab/duncancldiff;run;双因素方差分析-不考虑交互作用-计算第二十七页,共一百零五页,2022年,8月28日双因素方差分析-不考虑交互作用-计算第二十八页,共一百零五页,2022年,8月28日双因素方差分析-不考虑交互作用-计算第二十九页,共一百零五页,2022年,8月28日双因素方差分析-考虑交互作用-理论可设双因素试验的一个因素为A,共有A1、A2、…、Ar等r个水平,另一个因素为B,共有B1、B2、…、Bs等s个水平。这两个因素的水平互相搭配各安排m次试验,其中A因素的A水平与B因素的B水平搭配安排试验所得到的样本为X,相应的观测值为x。第三十页,共一百零五页,2022年,8月28日双因素方差分析-考虑交互作用-理论第三十一页,共一百零五页,2022年,8月28日服从F(r-1,rs(m-1))分布服从F(s-1,rs(m-1))分布
服从F((r-1)(s-1),rs(m-1))分布
双因素方差分析-考虑交互作用-理论第三十二页,共一百零五页,2022年,8月28日方差来源平方和自由度均方和F值显著性ABAB误差总和
SSASSBSSABSSESSTr-1s-1(r-1)(s-1)rs(m-1)rsm-1MSAMSBMSABMSEFAFBFAB双因素方差分析-考虑交互作用-理论第三十三页,共一百零五页,2022年,8月28日双因素方差分析-考虑交互作用-计算第三十四页,共一百零五页,2022年,8月28日dataex;doa=1to4;dob=1to3;doi=1to2;inputx@@;output;end;end;end;cards;58.252.656.241.265.360.849.142.854.150.551.648.460.158.370.973.239.240.775.871.558.25148.741.4;proc
anova;classab;modelx=aba*b;meansab/duncancldiff;run;双因素方差分析-考虑交互作用-计算第三十五页,共一百零五页,2022年,8月28日双因素方差分析-考虑交互作用-计算第三十六页,共一百零五页,2022年,8月28日双因素方差分析-考虑交互作用-计算第三十七页,共一百零五页,2022年,8月28日如果在单因素、双因素或多因素试验中有无法控制的因素x影响试验的结果Y,且x可以测量、x与Y之间又有显著的线性回归时,常常利用线性回归来矫正Y的观测值、消去x的差异对Y的影响。例如,研究施肥对苹果树产量的影响,由于苹果树的长势不齐,必须消去长势对产量的影响。又如,研究饲料对动物增重的影响,由于动物的初重不同,必须消去初重对增重的影响。协方差分析第三十八页,共一百零五页,2022年,8月28日这种不是在试验中控制某个因素,而是在试验后对该因素的影响进行估计,并对试验指标的值作出调整的方法称为统计控制,可以作为试验控制的辅助手段。以统计控制为目的,综合线性回归分析与方差分析所得到的统计分析方法,称为协方差分析,所需要统计控制的一个或多个因素,例如苹果树的长势,又如动物的初重等等称为协变量。协方差分析第三十九页,共一百零五页,2022年,8月28日单因素协方差分析-理论第四十页,共一百零五页,2022年,8月28日单因素协方差分析-理论第四十一页,共一百零五页,2022年,8月28日单因素协方差分析-理论第四十二页,共一百零五页,2022年,8月28日单因素协方差分析-理论第四十三页,共一百零五页,2022年,8月28日单因素协方差分析-计算第四十四页,共一百零五页,2022年,8月28日施用三种肥料的产量矫正后有极显著的差异
单因素协方差分析-计算第四十五页,共一百零五页,2022年,8月28日dataex;doa=1to3;doi=1to8;inputxy@@;output;end;end;cards;475458665363465149565666546144505254535364675862596261636364666944524858465450615970576458695366;
proc
glm;classa;modely=xa/solution;lsmeansa/stderrpdiff;run;单因素协方差分析-计算第四十六页,共一百零五页,2022年,8月28日单因素协方差分析-计算第四十七页,共一百零五页,2022年,8月28日双因素协方差分析-不考虑交互作用方差来源平方和自由度均方和F值显著性AQAr-1MQAFABQBs-1MQBFB误差QErs-r-sMQE总和QTrs-2第四十八页,共一百零五页,2022年,8月28日双因素协方差分析-不考虑交互作用第四十九页,共一百零五页,2022年,8月28日
dataex;doa=1to3;dob=1to5;inputxy@@;output;end;end;cards;82.85104.24123.00114.94102.88103.14124.5072.75125.84104.06123.88103.8692.82104.9492.89;proc
glm;classab;modely=xab/solution;lsmeansab/stderrpdiff;run;双因素协方差分析-不考虑交互作用第五十页,共一百零五页,2022年,8月28日双因素协方差分析-不考虑交互作用第五十一页,共一百零五页,2022年,8月28日方差来源平方和自由度均方和F值显著性A0.604620.30232.49NB7.124541.781114.66**误差0.850270.1215总和8.579313各小区的产量矫正后没有显著的差异,各品种的产量矫正后有极显著的差异。双因素协方差分析-不考虑交互作用第五十二页,共一百零五页,2022年,8月28日双因素协方差分析-考虑交互作用方差来源平方和自由度均方和F值显著性AQAr-1MQAFABQBs-1MQBFBABQAB(r-1)(s-1)MQABFAB误差QErs(m-1)-1MQE总和QTrsm-2第五十三页,共一百零五页,2022年,8月28日双因素协方差分析-考虑交互作用第五十四页,共一百零五页,2022年,8月28日方差来源平方和自由度均方和F值显著性A277.434853
92.4782866.51**B
2.8452593
2.8452590.20NAB
12.8481001
4.2827000.30N误差
99.4411717
14.205882
A与B的交互作用矫正后不显著,促生长剂之间的差异极显著,试验批次间的差异不显著双因素协方差分析-考虑交互作用第五十五页,共一百零五页,2022年,8月28日dataex;doa=1to4;dob=1to2;doi=1to2;inputxy@@;output;end;end;end;cards;14.697.812.194.219.5113.218.8110.113.6100.312.998.518.5119.418.2114.712.899.210.789.6 18.2122.216.9105.312.0102.112.4103.816.4117.217.2117.9proc
glm;classab;modely=xaba*b/solution;lsmeansab/stderrpdiff;run;双因素协方差分析-考虑交互作用第五十六页,共一百零五页,2022年,8月28日双因素协方差分析-考虑交互作用第五十七页,共一百零五页,2022年,8月28日part2回归方程一一元线性回归二一元非线性回归三多元线性回归第五十八页,共一百零五页,2022年,8月28日
1.一元线性回归的基本概念一元线性回归可用来分析自变量x取值与因变量Y取值的内在联系,不过这里的自变量x是确定性的变量,因变量Y是随机性的变量。进行n次独立试验,测得数据如下:一元线性回归第五十九页,共一百零五页,2022年,8月28日由回归方程可以推出
根据样本及其观测值可以得到α、β及σ2的估计量及估计值
得到回归方程的估计式或经验回归方程
一元线性回归第六十页,共一百零五页,2022年,8月28日有多种确定回归方程也就是确定未知参数
的方法,其中最常用的是最小二乘法,即求出
一元线性回归第六十一页,共一百零五页,2022年,8月28日的值最小,所求出的a称为经验截距,简称为截距,b称为经验回归系数,简称为回归系数,而
一元线性回归第六十二页,共一百零五页,2022年,8月28日2.总体中未知参数的估计根据最小二乘法的要求由
一元线性回归第六十三页,共一百零五页,2022年,8月28日⑴F检验法:
当H0为真时,
且SSR与SSE相互独立;因此,当H0为真时,
当F≥F1-α(1,n-2)时应该放弃原假设H0。3一元回归方程检验一元线性回归第六十四页,共一百零五页,2022年,8月28日(2)t检验法:
当H0为真时,
当|t|≥t1-0.5α(n-2)时应该放弃原假设H0。
一元线性回归第六十五页,共一百零五页,2022年,8月28日(3)r检验法:根据x与Y的观测值的相关系数
可以推出当H0为真时,一元线性回归第六十六页,共一百零五页,2022年,8月28日当F≥F1-α(1,n-2)或|r|≥rα(n-2)时应该放弃原假设H0,式中的
可由r检验用表中查出。
因此,r常常用来表示x与Y的线性关系在x与Y的全部关系中所占的百分比,又称为x与Y的观测值的决定系数。一元线性回归第六十七页,共一百零五页,2022年,8月28日
4.利用回归方程进行点预测和区间预测若线性回归作显著性检验的结果是放弃H0,也就是放弃回归系数β=0的假设,便可以利用回归方程进行点预测和区间预测,这是人们关注线性回归的主要原因之一。⑴当x=x0时,
Y0的观测值y0的点预测是无偏的。
一元线性回归第六十八页,共一百零五页,2022年,8月28日⑵当x=x0时,用适合不等式P{Y0∈(G,H)}≥1-α的统计量G和H所确定的随机区间(G,H)预测Y0的取值范围称为区间预测,而(G,H)称为Y0的1-α预测区间。
若Y与样本中的各Y相互独立,则根据Z=Y0-(a+bx0)服从正态分布,E(Z)=0,
Z与SSE相互独立,一元线性回归第六十九页,共一百零五页,2022年,8月28日可以导出
因此,Y0的1-α预测区间为a+bx0±Δ(x0),一元线性回归第七十页,共一百零五页,2022年,8月28日例1.1《吸附方程》某种物质在不同温度下可以吸附另一种物质,如果温度x(单位:℃)与吸附重量Y(单位:mg)的观测值如下表所示:
温度x1.51.82.43.03.53.94.44.85.0重量y4.85.77.08.310.912.413.113.615.3试求线性回归方程并用三种方法作显著性检验,若x0=2,求Y0的0.95预测区间。解:根据上述观测值得到n=9,
一元线性回归第七十一页,共一百零五页,2022年,8月28日dataex;inputxy@@;cards;1.54.81.85.72.4738.33.510.93.912.44.413.14.813.6515.32.;procgplot;ploty*x;symboli=rlv=dot;procreg;modely=x/cli;run;一元线性回归第七十二页,共一百零五页,2022年,8月28日一元线性回归第七十三页,共一百零五页,2022年,8月28日一元线性回归第七十四页,共一百零五页,2022年,8月28日一元线性回归第七十五页,共一百零五页,2022年,8月28日一元非线性回归第七十六页,共一百零五页,2022年,8月28日dataex;inputxy@@;x1=1/x;lx=log(x);ly=log(y);cards;11.8521.3731.0240.7540.5660.4160.3180.2380.17;proc
gplot;ploty*x;symboli=splinev=star;proc
reg;modely=x1;proc
reg;modelly=lx;proc
reg;modelly=x;run;一元非线性回归第七十七页,共一百零五页,2022年,8月28日一元非线性回归第七十八页,共一百零五页,2022年,8月28日一元非线性回归第七十九页,共一百零五页,2022年,8月28日一元非线性回归第八十页,共一百零五页,2022年,8月28日一元非线性回归第八十一页,共一百零五页,2022年,8月28日一元非线性回归第八十二页,共一百零五页,2022年,8月28日计算剩余平方和Qdataex;inputxy@@;x1=1/x;lx=log(x);ly=log(y);y1=0.1159+1.9291*x1;q1+(y-y1)**2;y2=exp(0.9638-1.1292*lx);q2+(y-y2)**2;y3=exp(0.9230-0.3221*x);q3+(y-y3)**2;cards;11.8521.3731.0240.7540.5660.4160.3180.2380.17;proc
print;varq1-q3;run;第八十三页,共一百零五页,2022年,8月28日计算剩余平方和Q第八十四页,共一百零五页,2022年,8月28日多元线性回归人的体重与身高、胸围血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁损半径与辐射的温度、与照射的时间第八十五页,共一百零五页,2022年,8月28日多元线性回归模型的一般形式
第八十六页,共一百零五页,2022年,8月28日多元回归分析数据格式第八十七页,共一百零五页,2022年,8月28日多元线性回归分析的一般步骤
第八十八页,共一百零五页,2022年,8月28日拟合优度公式回归参数的检验公式参数估计公式多元回归分析的几个公式第八十九页,共一百零五页,2022年,8月28日多元回归的假设检验第九十页,共一百零五页,2022年,8月28日实例:湖北省油菜投入与产出的统计分析1投入指标(1)土地(S)。土地用播种面积来表示。农作物播种面积是指当年从事农业(2)劳动(L)。劳动用劳动用工数(成年劳动力一人劳动一天为一个工)来表示。劳动用工中包含着直接和间接生产用工。(3)资本(K)。资本用物质费用来表示。物质费用包含直接费用和间接费用。主要有种子秧苗费、农家肥费、化肥费、农药费、畜力、固定资产折旧费和管理及其他费用等。第九十一页,共一百零五页,2022年,8月28日2产出指标产出指标用湖北省历年油菜生产的总产量(Y)来表示。Y.S的资料均来自《湖北农村统计年鉴》(历年)的取值是依据《湖北农村统计年鉴》(历年)中的湖北省油菜每亩平均投入量乘以播种面积得到。
第九十二页,共一百零五页,2022年,8月28日年份产量(万吨)Y物质费用(万元)K播种面积(万亩)S劳动用工(万个)L年份序号t199070.897240076.5884825.130515347.42731199183.750648008.7690915.150015832.09502第九十三页,共一百零五页,2022年,8月28日第九十四页,共一百零五页,2022年,8月28日dataex;inputykslt@@;x1=log(k);x2=log(s);x3=log(l);y1=log(y);cards;70.8972 40076.5884 825.1305 15347.4273 183.7506 48008.7690 915.1500 15832.0950 270.8627 44593.8425 801.6150 13306.8090 378.3451 43460.3229 783.2100 13314.5700 498.0749 72657.2633 923.8050 14596.1190 5134.8767 146108.3421 1282.8900 20911.1070 7147.5315 162433.3500 1244.7000 18670.5000 8154.7607 166979.6325 1330.5150 18627.2100 9159.9743 190395.5262 1505.4600 20775.3480 10198.4942 205914.6645 1738.4100 22599.3300 11194.7943 189762.7335 1677.0900 20963.6250 12187.1013 193461.5610 1761.9450 21936.2153 14235.1184 183768.4035 1779.1500 19606.2330 15;procreg;modely1=x1x2x3t;run;第九十五页,共一百零五页,2022年,8月28日
SumofMeanSourceDFSquaresSquareFValuePr>FModel42.152310.53808148.95<.0001Error80.028900.00361CorrectedTotal122.18121RootMSE0.06010R-Square0.9868DependentMean4.85895AdjR-Sq0.9801CoeffVar1.23697ParameterEstimatesParameterStandardVariableDFEstimateErrortValuePr>|t|Intercept10.930161.919200.480.6409x110.247810.096102.580.0327x211.282230.571222.240.0550x31-0.821020.55591-1.480.1780t1-0.001680.02437-0.070.9466第九十六页,共一百零五页,2022年,8月28日
SumofMeanSourceDFSquaresSquareFValuePr>FModel32.152290.71743223.29<.0001Error90.028920.00321CorrectedTotal122.18121RootMSE0.05668R-Square0.9867DependentMean4.85895AdjR-Sq0.9823CoeffVar1.16657ParameterEstimatesParameterStandardVariableDFEstimateErrortValuePr>|t|Intercept10.879501.672530.530.6117x110.245540.085182.880.0181x211.245680.202396.150.0002x31-0.787980.26689-2.950.0162第九十七页,共一百零五页,2022年,8月28日
DW=2.537F=404.25R2=0.988K,S。L的t值分别为(3.366)(6.647)(-10.316)第九十八页,共一百零五页,2022年,8月28日年数柑总产量
(万吨)总面积
(千公顷)总劳动力
(十万标准日/千公顷)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东广州启安众智建设管理有限责任公司第二批项目制用工内蒙古岗位招聘8人考试参考题库附答案解析
- 2025晋中祁县司法协理员招聘考试参考题库附答案解析
- 17 -18世纪欧洲绘画+课件-2025-2026学年高一上学期美术粤教版必修
- 合作学习:电大英语远程开放教学的创新引擎
- 2025年泌尿外科泌尿系统常见病症诊疗模拟考试卷答案及解析
- 2025年教师招聘之《幼儿教师招聘》通关练习题库包附参考答案详解【轻巧夺冠】
- 2025呼伦贝尔农垦集团有限公司校园招聘44人笔试备考及答案详解一套
- 教师招聘之《小学教师招聘》强化训练高能及答案详解(新)
- 完整社区建设案例集(第三批)
- 教师招聘之《小学教师招聘》考前冲刺训练试卷附答案详解【完整版】
- 龙虎山正一日诵早晚课
- 米粉及杂粮类制品课件
- 楔形平板产生的等厚干涉
- 骨髓腔穿刺在急诊急救中的应用课件
- 机械动力学PPT完整全套教学课件
- 年产2.03万吨高端精细化学品及5G新材料项目环评报告书
- 群众文化副高答辩问题及答案
- GB/T 41972-2022铸铁件铸造缺陷分类及命名
- 主编-孙晓岭组织行为学-课件
- 中医刮痧法诊疗操作评分标准
- 《师范生教师职业能力证书》样式及说明
评论
0/150
提交评论