实验报告5-SAS编程基础_第1页
实验报告5-SAS编程基础_第2页
实验报告5-SAS编程基础_第3页
实验报告5-SAS编程基础_第4页
实验报告5-SAS编程基础_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验报告实验项目名称SAS编程基础所属课程名称现代统计软件实验类型验证性实验实验日期2014-10-11班级学号姓名成绩实验概述:【实验目的及要求】掌握使用SAS进行简单相关分析和多元线性回归分析及非线性回归分析的方法。【实验原理】SAS软件的操作方法及原理【实验环境】(使用的软件)SAS9.1实验内容:【实验方案设计】一、用INSIGHT模块作简单相关分析与一元线性回归分析二、用“分析家”作多元线性回归分析三、使用REG过程作回归分析四、一元非线性回归分析【实验过程】(实验步骤、记录、数据、分析)【练习5-1】某年度12个地区的财政收入和国民生产总值量如表5-5Qx5_1xls)所示。试对财

2、政收入和国民生产总值进行简单相关分析和回归分析。表5-512个地区财政收入和国民生产总值(单位:万元)地区年财政收入国民生产总值地区年财政收入国民生产总值1212.21020.17348.32665.22219.91195.58434.93465.13235.71492.29521.8465334266.51691.810624.25727.75293.71859.811650.86235.46315.02166.212720.469252(1)散点图年财政收入为自变量,国民生产总值为因变量的散点图:(2)相关系数计算问区-事元VDRI.IT1上:诃;上J亘湮旦斷lI毕3256.1250r_2

3、iO4BWi11)20-1000I6925.2DDD12403.6167162.2660:12-2000:720.4DDD上:相?讪弦10.9989结果显示国民生产总值y与年财政收入x的样本相关系数很大,为0.9989。相夫丟数的pfaVAR2YAF:3F1148630136.9i48630136.9!4683.31iFVAR2148630136.948630136.94683.31|t|!Intercept1=-1397.8972|74.1229|-18.8E;=.0001=VAR211.53580.168668.43.1500).0837).08304种检验方法的p值均大于0.05,不能拒

4、绝原假设,表明可以接受残差正态性的假定。【练习5-2】某学校20名一年级女大学生体重(公斤)、胸围(厘米)、肩宽(厘米)及肺活量(升)实测值如表5-6(lx5_2xls)所示。试对影响女大学生肺活量的有关因素作多元回归分析。表5-620名一年级女大学生肺活量及有关变量测量结果编号体重X1/公斤胸围X2/厘米肩宽X3/厘米肺活量Y/升151.373.636.42.9248.983.934.03.11342.878331.01.91455.077.131.02.63545.381.730.02.86645.374.832.01.91751.473.736.52.98853.879.437.03.2

5、8949.0A2.630.12.521053.979.537.13.271148.883.833.93.101252.688.438.03.281342.778.230.91.921452.588338.13.271555.177231.12.641645.281.630.22.851751.478336.53.161848.772.530.02.511951.378236.43.152045.274.732.11.92(1)全回归分析汁14年11月2!旧星期五上午10时3E:分昶紗1TheREGProcedureNodeI:MODEL1DependentvariabIe:yNumberafD

6、baer/ationsRead?flNumberofObsarvationUsed20SourceDFModel3Error16CorrectedTotal19RootUSEDependentMeanCceffVeirSumofileanSquaresSquareFValuePrF3.425801J4133n.23t|-4.7B69Bi.Eees?3.I0.00190.0B13B0.D20323.020.00810.037430-D1EI7?.J70.02530.046870.D28401.630.1220ParamBterEstinalesaJ分析结果包括方差分析表、拟合的汇总信息以及回归系

7、数估计值与显著性检验。方差分析表中显示模型的作用是显著的(F统计量的值为14.29,p值0.00010.05=)参数显著性检验表明,进入回归的3个自变量,其作用在其它变量进入回归的前提下并不都是显著的。例如x3的作用就不显著。因此有必要适当选择变量建立一个“最优”的回归方程。逐步回归分析TheF;EGProcedureModel:MODEL1D已pend已itVaniabIe:yNumberofLibservationsF:已迅匚I20NumberofUbservationsUsed20St已pwi已8已丨已匚ti口1:St已p1Variable::FMode112.357262.357261

8、8.070.0005Error182.347600.13042CorrecTotl194.70485Yariab丨已Faraniet已厂EstimateStandardErrorT沖eIISSFValueFYFIntereept-1.112410.914080.193161.480.2393x30.115150.027092.3572618.070.0005Boundsonconditionnumber:1,1StepwiseSelection:Step2VariablexlEntered:R-Square=0.6247andC(p)=3.0888AnalysisofYarianeeSourc

9、eDFSumofSquaresMeanSquareFValuePrFModel22.939301.4696514.150.0002Error171.765550.10386CorrectdTotal194.70485ParameterStandardVariableEstimateErrorTypeIISSFValuePrFIritercept-2.436120.988940.630216.070.0247xl0.054270.022920.582055.600.0300 x30.074610.029620.658706.340.0221201样11月2汨星期五上午10时时分29秒2TheRE

10、GProcedureModel:MODEL1DependentVariable:yStepwiseSelection:Step2Boundsonconditionnumber:1-5021?6-0086StepwiseSelection:Step3Variablex2Entered:R-Square=0,7282andC(p)=4.0000AnalysisofVarianceSourceDFSumofSquaresMeanSquareFValuePrFModel33.425981.1419914.29FIntercept-4.788391.288971.1030713.800.0019xl0.

11、061380.020320.729729.130.0081x20.037430.015170.486686.090.0253x30.046370.023400.213112.670.1220Boundsonconditionnumber:1-7934,13-617StepwiseSelection:Step4Variable:cSRemoved:R-Square=0.B929andC(p)二AnalysisofVo.rimi匚七SourceCFSliiftofSquaresHeanSquareFValuePrFModelE3.212671.006441ti.3DFIntercept-4-970

12、411.S45S01.1974819.64D-D018:dO.OflOGB0.01?331.901922LG70-D(Ji:i20.047410.014550.3322GnxezC-D046BDundscnconditionnumber:1.014.D622在显示结果中,第1步记录了只有x3进入回归方程的回归分析结果,其中回归方程和系数的检验均为显著,此时R2=0.5010,C(p)=13.3708;接着第2步是自变量x1和x3进入回归方程后的回归分析结果,回归方程及x1和x2的系数检验均为显著,但常数项检验不显著。接着第3步是自变量x1、x2和x3进入回归方程后的回归分析结果。最后第4步是自

13、变量x3移除回归方程后的回归分析结果。其中回归方程及所有系数检验均为显著,常数项检验也显著。且R2=0.6829增加了,C(p)=4.6663减少了。AlIvariab丨已w:丨已ftinth已mud已丨迅已significant辻tth已i0500丨已卡已丨.No匚止hervariablemetth已l0500significanc已丨已veIfor已ityintothrnode丨SuriirnaryofStepwiseS已丨已匚:ti口1VariableVariableNumberPartialModelStepEnteredF:已mtj”已dVarsInR-SquareR-SquareC

14、(p)FValuePrF1x310.50100.501013.370318.070.00052xl20.12370.62478.08835.600.0300330.10340.72824.00006.090.02534x320.04530.68294.66632.670.1220在上图右下中指出在0.05的检验水平下,不能再有其它变量进入模型。比较R2和C(p)的值,应取包含变量、x2的第四个模型作为较优的模型,对应的回归方程是:y=4.97041+0.08066x+0.04741x12回归诊断标准化后的残差图:y-0704十00007z-十(X4池-.iz1,:-O.iz-0.:-O.t-.

15、C-?j.Oj.2残差的QQ图:y=一497阳+0.0807%1+0.0474x2Enp-seH432101000-0口口-0.4-0.5-3-2-10123NormalQuantile从标准化后的残差图看出,数据点随机地散布在零线附近,表明模型中误差等方差、独立性的假设没有问题。残差的QQ图近似一条直线,可以初步判定残差来自正态分布总体,所建回归模型是有效的。残差数据:2026.102520.283019.963514.994014.304514.705013.90run;title数据集zy3;procprint;run;数据集芋3201Obsxy1234567890594.401054.

16、901530.802026.102520.283019.963514.994014.304514.705013.90(2)对x和y作相关分析/*画x和y的散点图*/goptionsftext=宋体;procgplotdata=zy3;ploty*x;titlex和y的散点图;symbolv=doti=nonecv=orange;run;/*求x和y的相关系数*/proccorrdata=zy3;varxy;run;heREGProcedureEl2茁21119.57415Model:MODEL1DependentVariabIb:yCbsDependentVftriablePredictedV

17、aluetdErrorMeanF1redict减CLPredictResidual13400095.6767Z.297357.7912103.5622-1.2T67i54.900049.54221.018443.246055.8384SQ.SQflO34.1B4AO.BWA2S.D315in.?FR-3.3E40*26.100026.47600.811820.341682.608820.280021.6B15O.B49!i15.70)30,01.5615E19.960018.78590.S884I2.59E124.97561.1T41i14.990016.56300.922110.373122

18、.809-1.5990F14.300014.9413fl-950321.1797-0.G41914.70(1013.8599Q.B73G7.402319.91731.04021C13.900012.69460.3933C.JO71G.9K51.2654OutputStatistIcsSumiifResidualsSumofSqi_aredRe:E:iiduaIsPredictedResidjil83(PRESS)倒幕函数回归结果:方差分析表中显示模型的作用是显著的(F统计量的值为918.14,p值0.00010.05=)参数显著性检验表明,自变量的作用是显著的。回归方程为:v=3.40769+

19、461.34517u即:1y=78.56560+156.53887-x残差对预测值的散点图表明,残差基本符合模型的假定,上面回归方程有效。残差图10Rsq0.9914AdiRsq0.9903FJiTSE2.5329-4ITO405060708090100Predict已dValu已(4)幕函数y=axb回归datanew2;setzy3;u=log(x);v=log(y);run;/*画u和v的散点图*/titleu和v的散点图;procgplotdata=new2;plotv*u;残差对预测值的散点图表明,残差基本符合模型的假定,上面回归方程有效。=5.9-0.8675uN10F:Sq0.9

20、790AdjRsq0.9764RMSE0.08880.150.100.050.00-0.05-0.10-0.15-2.502.753.003.253.503.754.004.254.504.75FredictedValue(5)指数函数yaebx回归datanew3;setzy3;u=x;v=log(y);run;/*画u和v的散点图*/titleu和v的散点图;procgplotdata=new3;plotv*u;symbolv=doti=nonecv=red;run;title残差图;procregdata=new3;varvu;modelv=u;plotresidual.*predict

21、ed.;run;TheREGProcedurehfodpl:ODELIDeperidcnlYciriDibIe;?ItodelErrorCorrectedTotal1035292.闿门5卜h.hFRootMSEDependentMe/nCaeffVery.OOBSi1H-SqjareILtsdOti30.43001MiR-Sq0.871129.69410得回归方程:v=133.6475833.08288u即:y=133.6475833.082881nx从残差对预测值的散点图可以看出,残差有微弱趋势,不符合模型的假定,上面回归方程不佳。=133.65-33.083u15-10-5-N10Raq0.8908AdjF:$q0.8771RMSE9.0064-15-102030405060708090PredictedValue(7)结论比较上述4个回归方程,倒幕函数回归的RootMSE(均方残差平方根)倒数第二小(2.53289)、R-Square(判定系数R2)最大(0.9914),效果最好。模型y=3.40769+461.34517/x的拟合图形成绩:rii书召曲TUITORE.GSM

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论