江西财经大学SAS软件学生实验报告6.doc_第1页
江西财经大学SAS软件学生实验报告6.doc_第2页
江西财经大学SAS软件学生实验报告6.doc_第3页
江西财经大学SAS软件学生实验报告6.doc_第4页
江西财经大学SAS软件学生实验报告6.doc_第5页
免费预览已结束,剩余11页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学 生 实 验 报 告 学 院: 统计学院 课程名称: SAS软件 专业班级: 09统计1班 姓 名: 叶玮羚 学 号: 0092276 学生实验报告(经管类专业用)学生姓名叶玮羚学号0092276同组人实验项目相关与回归分析必修 操作性实验 实验地点0505实验仪器台号指导教师董成武实验日期及节次20111125,234节一、实验目的及要求:1、目的2、内容及要求二、仪器用具:仪器名称规格/型号数量备注计算机1SAS软件1三、实验方法与步骤:四、实验结果与数据处理:(一)两变量直线相关于回归分析1、在SAS编辑窗口输入命令:data prg1; input x y ;datalines;42 2.55 42 2.2 46 2.75 46 2.4 46 2.8 50 2.81 50 3.41 50 3.1 52 3.46 52 2.85 58 3.5 58 3;proc corr; var x y;run;结果如图所示: 结果说明:本题Pearson相关系数为r=0.74948,所对应的P=0.00500.05,说明两个变量之间存在正相关关系,即体重增大时,肺活量也相应增大。用Insight制作散点图,结果如图所示:2、(1)由第1小题知: 体重和肺活量之间存在正相关关系(2)在SAS编辑窗口输入命令:proc reg data=work.prg1; model y=x;run;结果如图所示:结果说明:第一部分是回归模型的方差分析的结果,本题中F=12.82,P=0.00500.05,说明模型是有意义的。第二部分是一些描述性统计量,本题中剩余标准差为0.28775,应变量y的均数为2.90250,应变量y的变异系数为3.91388,相关指数(即相关系数的平方)为0.5617,校正系数为0.5179.第三部分为参数估计的结果,常数项Intercept的估计值为0.00041304,标准误为0.81488,与参数为0的总体进行比较,t检验的结果为:t=0,P=0.99960.05,表示常数项与0的差别无统计意义。变量x的回归系数为0.05883,标准误为0.01643,与参数为0的总体进行比较,t检验的结果为:t=3.58,P=0.00500.05,表示回归系数与0的差别有统计意义,两变量之间确实存在回归关系。回归方程为:=0.00041304+0.05883x(3)用Insight制作残差图,结果如图所示:3、在SAS编辑窗口输入命令:data new; input x ;cards;57;proc sort data=work.prg1 out = sorted; by x;data new; set sorted new;run;proc reg data = new; model y = x/p; id x;run;结果如图所示:由图可知:体重为57kg的女生的肺活量是估计值是3.3535L。4、在SAS编辑窗口输入命令:proc reg data=work.prg1; model y=x/clm;run;结果如图所示:结果说明:第5、6列为clm选项的结果,为预测值均数的95%可信区间(95%CL Mean)。(2) 多元线性回归分析1、在SAS编辑窗口输入命令: proc reg data=dst.fitness; model oxygen=age weight rstpulse maxpulse runpulse runtime; run;结果如图所示:结果说明:第一部分是对回归模型的方差分析的结果,本题中F=22.32,P=0.0010.05,说明模型是有意义的。第二部分为描述性统计量。第三部分为回归方程的参数估计值及其与总体参数为0比较的t检验。因为模型有意义,可列出回归方程为:OXYGEN0.21992AGE0.07238WEIGHT0.00084421RSTPULSE0.30473MAXPULSE0.37316RUNPULSE-2.68052RUNTIME+102.233342、 (1)由于nR=310.8480=26.288 11.07=,所以方程存在异方差;在SAS编辑窗口输入命令:proc reg data=dst.fitness; model oxygen=age weight rstpulse maxpulse runpulse runtime /collin vif; run;结果如图所示: 结果说明:在参数估计表中,可看到没有方差膨胀因子超过10,这表明可能不存在共线性问题。最大条件指数超过197,这表明预测变量中有高度相依性。在用共线性诊断发现变量WEIGHT和 RSTPULSE有共线性。 综合得:方程存在共线性和异方差。(2)在SAS编辑窗口输入命令:proc reg data=dst.fitness; model oxygen=age weight rstpulse maxpulse runpulse runtime /selection=stepwise; run;结果如图所示:结果说明:第一部分输出了逐步回归的计算过程。本题共进行了四步,剔除了变量WEIGHT和 RSTPULSE,说明最终留在方程内的为RUNTINE、AGE、RUNPULSE和MAXPULSE四个变量,即RUNTINE、AGE、RUNPULSE和MAXPULSE对OXYGEN有影响。第二部分对以上四步作了总结。本题入选标准和剔除标准均为0.15,第六列为偏相关系数,第七列为复相关系数,第八列为Cp值,从中可以看出,从第1步到第4步,复相关系数逐渐增大,Cp值逐渐向理想值逼近,说明回归模型越来越理想。而Cp更为接近变量数假1的理想结果,说明此时模型最理想。第九列为选择变量后的方差分析的统计量F值,第十列为F值所对应的P值。可根据step4的结果写出回归方程为: OXYGEN=98.14789-0.19773AGE+0.27051MAXPULSE-0.34811RUNPULSE-2.76758RUNTIME3、 在SAS编辑窗口输入命令:proc reg data=dst.fitness; model oxygen=age weight rstpulse maxpulse runpulse runtime /influence; run;结果如图所示:结果说明:DFFITS2时,该观测应作为对回归有较大影响的观测加以观测。本题中20.8799,由图中可知强影响点为Obs16、Obs21、Obs25、Obs31这四个观测。故样本存在强影响点。 五、讨论与结论此次作业,使我进一步掌握了相关与回归分析的语句,并在此基础上可以根据不同的要求进行变换。但是操作sas过程出现了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论