北京工业大学数学建模选修第七次作业_第1页
北京工业大学数学建模选修第七次作业_第2页
北京工业大学数学建模选修第七次作业_第3页
北京工业大学数学建模选修第七次作业_第4页
北京工业大学数学建模选修第七次作业_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学建模第七次作业一、 回归分析第一问:R程序> x<-c(27,21,22,24,25,23,20,20,29,24,25,28,26,38,32,33,31,34,+ 37,38,33,35,30,31,37,39,46,49,40,42,43,46,43,44,46,47,+ 45,49,48,40,42,55,54,57,52,53,56,52,50,59,50,52,58,57)> y<-c(73,66,63,75,71,70,65,70,79,72,68,67,79,91,76,69,66,73,+ 78,87,76,79,73,80,68,75,89,10

2、1,70,72,80,83,75,71,80,96,+ 92,80,70,90,85,76,71,99,86,79,92,85,71,90,91,100,80,109)> lm.sol<-lm(y1+x)> summary(lm.sol, correlation = T, symbolic.cor = F)运行结果:一元回归模型:y=56.16+0.58x相关系数检验结果为三颗星,p值均极小。第二问:R程序> new<-data.frame(x=40)> pp<-predict(lm.sol, new, interval="predictio

3、n")> pp fit lwr upr1 79.35816 62.86166 95.85466如果年龄为40岁,血压预测值为79.36,血压范围为:(62.86,95.85)第三问:R程序pc<-predict(lm.sol, new, interval="confidence")pcmatplot(new$x, cbind(pp, pc,-1), type="l", xlab="X", ylab="Y", lty=c(1,5,5,2,2), col=c("blue", &

4、quot;red", "red", "brown", "brown"), lwd=2)points(x,y, cex=1.4, pch=21, col="red", bg="orange")legend(0.1, 63, c("Points", "Fitted", "Prediction", "Confidence"), pch=c(19, NA, NA, NA), lty=c(NA, 1,5,2), co

5、l=c("orange", "blue", "red", "brown")savePlot("predict", type="eps")二、 回归分析和逐步回归 第一问:将数据写入.txt文件中,命名“data.txt”> health<-read.table("data.txt",header=T)> lm.sol<-lm(yx1+x2+x3+x4+x5+x6,data=health)> summary(lm.sol)运行结

6、果:Call:lm(formula = y x1 + x2 + x3 + x4 + x5 + x6, data = health)Residuals: Min 1Q Median 3Q Max -5.3906 -0.9856 0.0749 1.0215 5.4075 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 104.86493 12.12725 8.647 7.75e-09 *x1 -0.24074 0.09459 -2.545 0.01778 * x2 -0.07456 0.05328 -1.399 0

7、.17448 x3 -2.62442 0.37249 -7.046 2.77e-07 *x4 -0.02532 0.06467 -0.391 0.69891 x5 -0.35992 0.11757 -3.061 0.00536 * x6 0.28766 0.13437 2.141 0.04266 * -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1Residual standard error: 2.267 on 24 degrees of freedomMultiple R-squared: 0.8552, Adjusted R-squared:

8、 0.819 F-statistic: 23.62 on 6 and 24 DF, p-value: 5.818e-09多元线性回归方程:y=104.86-0.24x1-0.07x2-2.62x3-0.03x4-0.36x5-0.29x6第二问:由运行结果知:方程F检验P值小于0.05,否定原假设,即通过检验。相关系数R2=0.8552,调整后R2=0.819,即因变量与自变量是相关的。系数中,常数项、x1、x3、x5、x6的P值小于0.05相关度较高,而x2,x4的相关度较低。第三问:R程序:> lm.step<-step(lm.sol,k=4)运行结果:Start: AIC=7

9、0.8y x1 + x2 + x3 + x4 + x5 + x6 Df Sum of Sq RSS AIC- x4 1 0.787 124.09 66.999- x2 1 10.062 133.37 69.233<none> 123.31 70.801- x6 1 23.546 146.85 72.219- x1 1 33.277 156.58 74.208- x5 1 48.153 171.46 77.021- x3 1 255.042 378.35 101.557Step: AIC=67y x1 + x2 + x3 + x5 + x6 Df Sum of Sq RSS AIC-

10、 x2 1 9.59 133.69 65.307<none> 124.09 66.999- x6 1 23.97 148.07 68.474- x1 1 32.69 156.78 70.247- x5 1 49.94 174.03 73.483- x3 1 327.46 451.56 103.040Step: AIC=65.31y x1 + x3 + x5 + x6 Df Sum of Sq RSS AIC<none> 133.69 65.307- x6 1 19.28 152.96 65.482- x1 1 28.09 161.77 67.218- x5 1 44.4

11、0 178.09 70.197- x3 1 358.81 492.50 101.730从程序的运行结果可见,当用全部变量作回归方程时,AIC值为70.8,接下来的数据表显示,如果去掉X2,X4,则相应的ACI值为65.31,此时ACI值达到最小。对得到的回归方程进行显著性分析,编写R程序:> summary(lm.step)运行结果:Call:lm(formula = y x1 + x3 + x5 + x6, data = health)Residuals: Min 1Q Median 3Q Max -4.9590 -1.2603 -0.1512 1.1796 4.8132 Coeffi

12、cients: Estimate Std. Error t value Pr(>|t|) (Intercept) 100.07910 11.57739 8.644 4.02e-09 *x1 -0.21266 0.09099 -2.337 0.02740 * x3 -2.76824 0.33138 -8.354 7.79e-09 *x5 -0.33957 0.11555 -2.939 0.00683 * x6 0.25535 0.13188 1.936 0.06378 . -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1Residual sta

13、ndard error: 2.268 on 26 degrees of freedomMultiple R-squared: 0.843, Adjusted R-squared: 0.8188 F-statistic: 34.9 on 4 and 26 DF, p-value: 4.219e-10由运行结果知:方程F检验P值小于0.05,否定原假设,即通过检验。相关系数R2=0.843,调整后R2=0.8188,即因变量与自变量是相关的。系数中,常数项、x1、x3、x5的P值小于0.05相关度较高,而x6稍微大于0.05,相关度大致认为较高。软件得到的回归方程为:y=+100.07910-0.

14、21266 x1-2.76824x3-0.33957x5+0.25535x6三、 方差分析第一问:R程序:> coating<-data.frame(x<-c(148,76,393,520,236,134,55,166,415,153,+ 513,264,433,94,535,327,214,135,280,304,+ 335,643,216,536,128,723,258,380,594,465),+ A=factor(rep(1:3,c(10,10,10)+ )> coating.lm<-lm(xA,data=coating)> anova(coatin

15、g.lm)运行结果:由运行结果知,P值小于0.05,拒绝原假设,即不同涂料间存在显著差异。第二问:R程序> attach(coating)> tapply(x,A,mean) 1 2 3 229.6 309.9 427.8由运行结果知,第一组与二、三组有明显差异,二三组间无明显差异。四、 方差分析第一问R程序:> nd<-data.frame(+ y=c(14,10,11,11,13,9,10,12,9,7,10,8,7,11,6,10,5,11,13,14,12,13,14,10),+ B=gl(3,8,24,labels=paste("B",1:

16、3,sep=""),+ A=gl(3,2,24,labels=paste("A",1:3,sep="")+ )> nd.aov<-aov(yB+A+B:A,data=nd)> summary(nd.aov)结果:由运行结果知,显著性水平=0.05下,提高因素B对结果的影响是显著的,提高因素A和AB交互作用对结果的影响不显著。第二问:R程序> nd.lm<-lm(yB+A+B:A,data=nd> anova(nd.lm)Analysis of Variance TableResponse: y Df

17、 Sum Sq Mean Sq F value Pr(>F) B 2 44.333 22.1667 4.0549 0.0391 *A 2 8.867 4.4333 0.8110 0.4630 B:A 4 12.633 3.1583 0.5777 0.6832 Residuals 15 82.000 5.4667 -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1> attach(nd)The following object is masked from coating: A> tapply(y,A,mean) A1 A2 A3 11.375 9.875 10.000 > tapply(y,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论