用R软件做线性回归分析问题_第1页
用R软件做线性回归分析问题_第2页
用R软件做线性回归分析问题_第3页
用R软件做线性回归分析问题_第4页
用R软件做线性回归分析问题_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验一元线性回归分析一、问题考察温度对产量的影响,测得下列10组数据:温度X(C)250556065r#y(kg)13.215.116.417.117.918.719.621.222.524.3二、要求(1)试画出这10对观测值的散点图。(2)求Y和X的相关系数,并判断X、Y是否存在线性相关性。(3)用最小二乘法求出Y对x的线性回归方程。2(4)求出回归的标准误差与回归拟合系数R.(5)对回归方程做显著性检验。(6)画出回归残差图并做相应分析。(7)若温度为62C,则产量为多少,并给出置信水平为95%的预测区问。三、目的和意义学会使用R软件来做回归分析问题。四、实验步骤1.绘制x与y的散点图,

2、初步确定回归方程,输入下列程序:>X<-matrix(c(20,13.2,25,15.1,30,16.4,35,17.1,40,17.9,45,18.7,50,19.6,55,21.2,60,22.5,65,24.3),ncol=2,byrow=T,dimnames=list(1:10,c("x","y")>forbes<-as.data.frame(X)>plot(forbes$x,forbes$y)图表1forbesSx从窗口中可以观察到,x与y大致成线性关系,假设其为¥=2.做回归分析,输入下列程序:>

3、 lm.sol<-lm(yx,data=forbes)> summary(lm.sol)得到Call:lm(formula=yx,data=forbes)Residuals:Min1QMedian3QMax> 0.67273-0.33333-0.072730.345450.68182Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)9.121210.4770819.125.8e-08*0.223030.0106320.972.8e-08*Signif.codes:0*'0.001*'0.01*&

4、#39;'0.05:0.1”1Residualstandarderror:0.483on8degreesoffreedomMultipleR-squared:0.9821,AdjustedR-squared:0.9799F-statistic:439.8on1and8DF,p-value:2.805e-08有以上计算结果得:p0=942121,A=022303Fsd(i0)=0.47708.=(M063,对应两个系数的P-值均小于5.8x1°一”.是非常显著的,关于方程的检验,残差的标准差仃=0,483,相关系数的平方M=0.9821,关于f分布的P-值为2.805x10&#

5、39;,也是非常显著的。该模型能够通过t检验和f检验,因此回归方程为y=9.12121+0.223.3*我们将得到直线方程放在散点图上,得到图表2:图表2fnrbcsSs下面分析残差,输入>abline(lm.sol)>y.res<-residuals(lm.sol);plot(y.res)得到残差图图表3图表3由上图知大部分点的绝对值都在0.6以内,第7个点有点反常,可能存在一点问题,现在做一些简单的处理:text(7,y.res7,labels=7,adj=1.2)>i<-1:10;forbes7<-as.data.frame(Xi!=7,)> l

6、m7<-lm(yx,data=forbes7)> summary(lm7)得到Call:lm(formula=yx,data=forbes7)Residuals:Min1QMedian3QMax-0.5417-0.3000-0.12920.37500.5458Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)9.0791670.43415420.911.44e-07*x0.2258330.00981123.027.40e-08*Signif.codes:0'*'0.001'*'0.01

7、'*'0.05'.0.1''1Residualstandarderror:0.4387on7degreesoffreedomMultipleR-squared:0.987,AdjustedR-squared:0.9851F-statistic:529.9on1and7DF,p-value:7.403e-08可以对比发现,回归系数没有发生什么变化,陵系数有所提高,但是p值增大很多,说明样本点7不能去掉。所以回归方程还是y=9.12121+0.223.3X3.预测若温度为62C,给出置信水平为95%的预测区间,输入以下代码> new<-data.frame(x=62)>lm.pred<-predict(lm.sol,new,interval="predicti

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论