北京工业大学薛毅老师工程数据建模实验6多元分析.doc_第1页
北京工业大学薛毅老师工程数据建模实验6多元分析.doc_第2页
北京工业大学薛毅老师工程数据建模实验6多元分析.doc_第3页
北京工业大学薛毅老师工程数据建模实验6多元分析.doc_第4页
北京工业大学薛毅老师工程数据建模实验6多元分析.doc_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

6多元分析实验学号:G201212xxx 姓名:xxx email: 6.1 回归分析法国经济数据分析,考虑进口总额Y与三个自变量:国内总产值X1,存储量X2,总消费量X3(单位为10亿法郎)之间的关系。现收集了1949年至1959年共11年的数据,如表6.1所示,试对此数据进行分析。 表6.1法国经济分析数据1149.34.2108.115.92161.24.1114.816.43171.53.1123.219.04175.53.1126.919.15180.81.1132.118.86190.72.2137.720.47202.12.1146.022.78212.45.6154.126.59226.15.0162.328.110231.95.1164.327.611239.00.7167.626.3(1)求出Y关于X1, X2和X3的线性回归方程,并对方程作显著性检验;(2)分析所得到的回归方程是否合理,对变量作逐步回归; (3)假设某年的国内总产值(X1)、存储量(X2)和总消费量(X3)分别为240、4.5和170(单位为10亿法郎),给出该年进口总额(Y)的预测值、相应的置信区间和预测区间(=0.05)。解:(1)输入程序:X1-c(149.3, 161.2, 171.5, 175.5, 180.8, 190.7, 202.1, 212.4, 226.1, 231.9, 239)X2-c(4.2, 4.1, 3.1, 3.1, 1.1, 2.2, 2.1, 5.6, 5.0, 5.1, 0.7)X3-c(108.1, 114.8, 123.2, 126.9, 132.1, 137.7, 146.0, 154.1, 162.3, 164.3, 167.6)Y-c(15.9, 16.4, 19, 19.1, 18.8, 20.4, 22.7, 26.5,28.1, 27.6, 26.3)lm.sol|t|) (Intercept) -10.12799 1.21216 -8.355 6.9e-05 *X1 -0.05140 0.07028 -0.731 0.488344 X2 0.58695 0.09462 6.203 0.000444 *X3 0.28685 0.10221 2.807 0.026277 * -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 0.4889 on 7 degrees of freedomMultiple R-squared: 0.9919, Adjusted R-squared: 0.9884 F-statistic: 285.6 on 3 and 7 DF, p-value: 1.112e-07结果分析:可知Y关于的线性回归方程:y=-10.12799-0.05140x1+0.58695x2+0.28685x3其中:x1无标记说明不显著,x2标记“*”说明极为显著,x3标记“*”显著。(2)由(1)中的数据可以得知新的分析函数anova(lm.sol)R程序输入程序:X1-c(149.3, 161.2, 171.5, 175.5, 180.8, 190.7, 202.1, 212.4, 226.1, 231.9, 239)X2-c(4.2, 4.1, 3.1, 3.1, 1.1, 2.2, 2.1, 5.6, 5.0, 5.1, 0.7)X3-c(108.1, 114.8, 123.2, 126.9, 132.1, 137.7, 146.0, 154.1, 162.3, 164.3, 167.6)Y-c(15.9, 16.4, 19, 19.1, 18.8, 20.4, 22.7, 26.5,28.1, 27.6, 26.3)lm.sol|t|) (Intercept) -10.12799 1.21216 -8.355 6.9e-05 *X1 -0.05140 0.07028 -0.731 0.488344 X2 0.58695 0.09462 6.203 0.000444 *X3 0.28685 0.10221 2.807 0.026277 * -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 0.4889 on 7 degrees of freedomMultiple R-squared: 0.9919, Adjusted R-squared: 0.9884 F-statistic: 285.6 on 3 and 7 DF, p-value: 1.112e-07 anova(lm.sol)Analysis of Variance TableResponse: Y Df Sum Sq Mean Sq F value Pr(F) X1 1 192.361 192.361 804.8833 1.738e-08 *X2 1 10.532 10.532 44.0700 0.0002936 *X3 1 1.882 1.882 7.8765 0.0262771 * Residuals 7 1.673 0.239 -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1结果分析:可以看出均能通过显著性检验,因此可得到更为恰当与精确的Y与,,的线性关系:Y=-9.742740+0.596052x2+0.212305x3(3)由(1)与(2)中的线性方程可分别得出对应的Y值为28.94179和29.03138输入程序:new - data.frame(X1=240,X2=4.5,X3=170)predict(lm.sol,new,interval=confidence,level=0.95)predict(lm.sol,new,interval=prediction,level=0.95)运行结果: fit lwr upr1 28.94248 28.19924 29.68572 fit lwr upr1 28.94248 27.56817 30.31678结果分析:Y的预测值为28.94248,置信区间为28.19924,29.68572,预测区间为27.56817,30.316782.方差分析I(单因素方差分析) 三个工厂生产同一种零件.现从各厂产品中分别抽取4件产品作检测,其检测强度如表6.2所示。表6.2产品检测数据甲1151169883乙103107118116丙73898597 (1)对数据作方差分析,判断三个厂生产的产品的零件强度是否有显著差异; (2)求每个工厂生产产品零件强度的均值,作出相应的区间估计(=0.05); (3)对数据作多重检验。解:(1)作出如下假设命令;H0:三个厂产品的零件强度无差异,即二者方差相同;H1:三个厂产品的零件强度无有异,即二者方差不相同;由题可以得出关于三个工厂产品检测数据差异的方差分析输入程序:products-c(115,116,98,83,103,107,118,116,73,89,85,97)A-factor(rep(1:3,c(4,4,4)products.aovF) A 2 1304.00 652.00 4.9228 0.03595 *Residuals 9 1192.00 132.44 -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1结果分析:Pr=0.03590.05,所以假设H1成立,即三个厂的零件强度有显著差异。(2)由题可得:输入程序:X1 - c(115,116,98,83)mean(X1)source(interval_estimate.R); interval_estimate(X1)X2 - c(103,107,118,116)mean(X2)source(interval_estimate.R); interval_estimate(X2)X3 - c(73,89,85,97)mean(X3)source(interval_estimate.R); interval_estimate(X3)运行结果:X1 mean(X1)1 103 source(interval_estimate.R); interval_estimate(X1) mean df a b1 103 3 78.04264 127.9574 X2 mean(X2)1 111 source(interval_estimate.R); interval_estimate(X2) mean df a b1 111 3 99.59932 122.4007 X3 mean(X3)1 86 source(interval_estimate.R); interval_estimate(X3) mean df a b1 86 3 70.08777 101.9122结果分析:甲厂的的产品的零件强度均值为103,区间估计为78.04264, 127.9574;乙厂的的产品的零件强度均值为111,区间估计为99.59932, 122.4007;丙厂的的产品的零件强度均值为86,区间估计为70.08777, 101.9122。(3)根据题目要求得出多重分析第一:输入程序:mouse-data.frame( X=c( 115,116,98,83,103,107,118,116,73,89,85,97), A=factor(rep(1:3, c(4, 4, 4)mouse.lm-lm(X A, data=mouse)anova(mouse.lm)attach(mouse)tapply(X, A, mean)pairwise.t.test(X, A)pairwise.t.test(X, A, p.adjust.method = none)plot(XA, col=5:7, main=Box-and-Whisker Plot of Mouse Data)detach(mouse)savePlot(box_plot2, type=eps)productsmousemouse.lmanova(mouse.lm)Analysis of Variance TableResponse: XDf SumSq Mean Sq F value Pr(F) A 2 1304.00 652.00 4.9228 0.03595 *Residuals 9 1192.00 132.44 -Signif.codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 attach(mouse) The following object(s) are masked _by_ .GlobalEnv : A tapply(X, A, mean) 1 2 3 103 111 86pairwise.t.test(X, A) Pairwise comparisons using t tests with pooled SD data: X and A 1 2 2 0.35 - 3 0.13 0.04P value adjustment method: holm pairwise.t.test(X, A, p.adjust.method = none) Pairwise comparisons using t tests with pooled SD data: X and A 1 2 2 0.351 - 3 0.066 0.013P value adjustment method: none plot(XA, col=5:7, + main=Box-and-Whisker Plot of Mouse Data)detach(mouse)savePlot(box_plot2, type=eps) products-c(115,116,98,83,103,107,118,116,73,89,85,97)结果分析:从以上结果可以看出三者之间存在着显著差异性。第二:输入程序:mouse-data.frame( X=c(115,116,98,83,103,107,118,116,73,89,85,97), A=factor(rep(1:3, c(4, 4, 4)mouse.lm-lm(X A, data=mouse)anova(mouse.lm)mouse.aovmousemouse.lmanova(mouse.lm)Analysis of Variance TableResponse: XDf SumSq Mean Sq F value Pr(F) A 2 1304.00 652.00 4.9228 0.03595 *Residuals 9 1192.00 132.44 -Signif.codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 mouse.aovanova(mouse.lm)Analysis of Variance TableResponse: XDf SumSq Mean Sq F value Pr(F) A 2 1304.00 652.00 4.9228 0.03595 *Residuals 9 1192.00 132.44 -Signif.codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 oneway.test(X A, data=mouse) One-way analysis of means (not assuming equal variances)data: X and A F = 7.376, numdf = 2.000, denomdf = 5.553, p-value = 0.02733oneway.test(X A, data=mouse, var.equal=T) One-way analysis of meansdata: X and A F = 4.9228, numdf = 2, denomdf = 9, p-value = 0.03595结果分析:可看出p-value = 0.02733,p-value = 0.03595,均小于0.05,表明三个厂产品之间存在显著差异。3.方差分析II(双因素方差分析) 为了提高化工厂的产品质量,需要寻求最优反应温度与反应压力的配合,为此选择如下水平: A:反应温度( ) 60 70 80 B:反应压力(公斤) 2 2.5 3在每个AiBj条件下做两次试验,其产量如表6.3所示.表6.3试验数据BB3.84.03.8B (1)对数据作方差分析(考虑有交互作用的情况): (2)计算各种反应温度下产量均值的估计,各种反应压力下产量均值的估计,以及同时考虑温度和压力下产量均值的估计; (3)通过(1)与(2)计算结果来说明,在今后的生产中,我们将如何选择生产的反应温度和反应压力,使得这些条件对生产最有利(注意,一定要说明你的理由)。 解:(1)从数据分析,可得:输入程序:tree-data.frame( Y=c(4.6, 4.3, 6.1, 6.5, 6.8, 6.4, 6.3, 6.7, 3.4, 3.8, 4.0,3.8,4.7, 4.3, 3.9, 3.5, 6.5, 7.0), A=gl(3,6,18, labels= paste(A, 1:3, sep=), B=gl(3,2,18, labels= paste(B, 1:3, sep=)tree.aov - aov(Y A+B+A:B, data=tree)summary(tree.aov)运行结果:tree tree.aov summary(tree.aov) Df Sum

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论