SAS课程设计报告_第1页
SAS课程设计报告_第2页
SAS课程设计报告_第3页
SAS课程设计报告_第4页
SAS课程设计报告_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课程设计报告( 2011 - 2012 年度第 1学期)名 称: SAS 课 程 设 计 题 目:中国粗钢产量与GDP的关系院 系: 理 学 院班 级: 09 统 计 学学 号: 0 9 1 1 1 1 2 1 2 0学生姓名: 付 义指导教师: 胡 二 琴 老 师设计周数: 一 周成 绩: 日期: 2011 年 12 月 31 日(一):确定课程设计题目21世纪中国经济快速发展而同时去年从财经频道了解到2008年金融危机后,中国的钢材市场由之前的过热导致钢材产量过剩。在快速发展的中国金融危机之前钢材没有出现过剩而金融危机到来伴随着钢材的产能过剩。让人产生想法钢材的产量与GDP之间是否存在一定的关系,因此确定了SAS课程设计研究题目。并从国家统计局近几年的统计年鉴中找出钢材相关的产量数据,编制成一张excel表得到近年来中国钢产量以及中国GDP数据如下表所示:年份粗钢产量(万吨)钢材进口(万吨)钢材出口(万吨)GDP(万亿)19783178.00 3645.0 19793448.00 4062.6 19803712.00 500.64 46.85 4545.6 19813560.00 331.86 61.72 4891.6 19823716.00 393.78 110.10 5323.4 19834002.00 978.00 49.20 5962.7 19844347.00 1331.40 20.30 7208.1 19854679.00 1963.49 18.12 9016.0 19865220.00 1742.23 19.74 10275.2 19875628.00 1174.94 27.33 12058.6 19885943.00 851.05 65.83 15042.8 19896159.00 819.72 78.07 16992.3 19906635.00 368.26 208.98 18667.8 19917100.00 332.59 329.33 21781.5 19928094.00 617.81 326.70 26923.5 19938956.00 3026.00 112.00 35333.9 19949261.00 2282.84 174.35 48197.9 19959536.00 1397.23 592.82 60793.7 199610124.00 1598.38 421.53 71176.6 199710891.00 1322.45 461.89 78973.0 199811459.00 1241.55 356.60 84402.3 199912395.00 1486.27 368.44 89677.1 200012850.00 1596.14 620.60 99214.6 200115163.00 1721.73 474.14 .2 200218155.00 2448.81 545.50 .7 200322116.00 3716.85 695.57 .8 200427246.00 2926.00 1422.00 .3 200534936.00 2586.00 2053.00 .4 200641878.00 1851.00 4303.00 .4 200748927.00 1687.10 6271.00 .3200850045.00 1543.00 5923.00 .4200956780.00 1763.20 2459.65 .9201062665.00 1643.01 4255.60 .0 (二):关于课程题目的摘要21世纪中国经济快速发展,同时也看到中国的粗钢产量也以非常快的速度增加。两者之间是否存在关系,如果存在有关系那么找出其中的关系。满足自身的好奇也同时从全国从1978年到2010年的数据中得到模型,并希望从回归模型中预测和指导中国下一阶段的钢材生产有自己的预测和看法。(三):关于课程设计的引言近三十年来,我国粗钢产量在全球的占比持续上升,大致可划分为三个阶段:1980年1989年的平稳增长期,我国粗钢产量在全球的占比增长不明显,十年间仅从5%左右略升至7%左右;1990年1999年的低速增长期,我国粗钢产量在全球占比的增速有所扩大,由8%左右升至15%左右的水平;2000年2009年的高速增长期,这十年间我国粗钢产量快速增长,其在全球占比的增速也明显加大,2009年我国粗钢产量在全球的占比达到近47%,较2000年的15%增长了近两倍以上。(三):关于课程设计的研究目的通过对钢材的产量与GDP的关系可以从GDP数据预测中国市场上的钢材数量才是合理,同时通过在正常的产量水品也可以估测GDP大小,建立钢材产量与GDP的对应关系相互预测。(四):此次课程设计的理论支持钢材是国家重工业的基础,同时钢材的产量涉及到各个生产厂商。因此可以通过对GDP的大小来预测中国市场上钢材的合适产量,建立钢材合适产量与国家GDP增幅的关系。并通过改变以上数据得到以下的表格的内容,使得SAS可以处理以上数据: N表示年份 CL表示粗钢产量 JK表示钢材进口 CK表示钢材出口 GDP则是国民生产总值则将收集到的信息整理表示为SAS中的可以操作的内容,修改之前的excel表得到数据如下。通过import data 导入到SAS中在SASUSER下建立一个名为GDP的数据集。NCLJKCKGDP19783178.00 3645.0 19793448.00 4062.6 19803712.00 500.64 46.85 4545.6 19813560.00 331.86 61.72 4891.6 19823716.00 393.78 110.10 5323.4 19834002.00 978.00 49.20 5962.7 19844347.00 1331.40 20.30 7208.1 19854679.00 1963.49 18.12 9016.0 19865220.00 1742.23 19.74 10275.2 19875628.00 1174.94 27.33 12058.6 19885943.00 851.05 65.83 15042.8 19896159.00 819.72 78.07 16992.3 19906635.00 368.26 208.98 18667.8 19917100.00 332.59 329.33 21781.5 19928094.00 617.81 326.70 26923.5 19938956.00 3026.00 112.00 35333.9 19949261.00 2282.84 174.35 48197.9 19959536.00 1397.23 592.82 60793.7 199610124.00 1598.38 421.53 71176.6 199710891.00 1322.45 461.89 78973.0 199811459.00 1241.55 356.60 84402.3 199912395.00 1486.27 368.44 89677.1 200012850.00 1596.14 620.60 99214.6 200115163.00 1721.73 474.14 .2 200218155.00 2448.81 545.50 .7 200322116.00 3716.85 695.57 .8 200427246.00 2926.00 1422.00 .3 200534936.00 2586.00 2053.00 .4 200641878.00 1851.00 4303.00 .4 200748927.00 1687.10 6271.00 .3200850045.00 1543.00 5923.00 .4200956780.00 1763.20 2459.65 .9201062665.00 1643.01 4255.60 .0 (五):对模型的初步理论分析粗钢产量变化与GDP的关系(从网上查阅到如下信息)2000年以来,随着中国城市化建设的不断加快,国内房地产投资及基础设施建设力度的加大,我国钢材消费也持续扩大,由此带来钢铁产业的迅猛发展,国内钢铁产量也呈高速增长态势。作为工业基础性行业,钢铁业的发展给上下游多个行业带来联动效应,进而也促进了国内GDP的大幅增长。事实上,一国的粗钢产量与该国GDP存在较大的相关性。我们从近三十年来中国的粗钢产量与GDP的对比图可见,与经济结构体系相对合理完善的发达国家相比,作为发展中国家的中国。经济体的增长模式明显更为粗放,其经济增长在很大程度上依赖于第二产业制造业的发展,尤其是固定资产投资建设的拉动。对数据的SAS分析(六):模型的初步建立显示各个数据随时间的变化看GDP随年份的变化散点图程序如下:proc gplot data=sasuser.gdp;plot GDP*N;run;散点图如下:看粗钢产量随年份的变化散点图程序如下:proc gplot data=sasuser.gdp;plot CL*N;run;得到的散点图如下:看钢材的进口岁年份的变化散点图程序如下:proc gplot data=sasuser.gdp;plot JK*N;run;得到的散点图如下:钢材出口岁年份的变化散点图程序如下:proc gplot data=sasuser.gdp;plot CK*N;run;得到的散点图如下:由于看到GDP随着年份的变化散点图与粗钢的产量,净进口量散点图比较一致。因此大致可以认为他们之间有关系。但是还不能得出相应的结论。(七):对分析的数据建立回归模型由上面的散点图判断GDP与CL,JK, CK的回归分析模型回归的程序如下:proc reg data=sasuser.gdp;model gdp=cl jk ck;run;得到output窗口的结果如下: The SAS System 02:47 Sunday, January 1, 2012 1 The REG Procedure Model: MODEL1 Dependent Variable: GDP GDP Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr F Model 3 3.E11 1.E11 416.91 |t| Intercept Intercept 1 -16089 6432.48068 -2.50 0.0187 CL CL 1 6.76696 0.43563 15.53 .0001 JK JK 1 1.68621 4.09650 0.41 0.6839 CK CK 1 -6.39980 4.11876 -1.55 0.1319分析:模型的整体F检验看出模型显著,但是从单个变量看JK以及CK都不显著。得到方程的回归模型为:GDP= -16089+ 6.76696 CL +1.68621 JK+-6.39980 CK(八):该模型的多重共线性检测1.经济意义的检测由于粗钢产量的增加可以从经济意义上看到与GDP成正相关性。钢材的出口与GDP从经济意义上的正相关。钢材的进口与GDP呈现经济意义上的负相关。由于从上面的散点图可以看出相关关系不是很明显则可以考虑GDP与钢材进口,钢材出口,以及粗钢产量之间,可能存在有多重共线性所导致。2 .统计检验从回归的模型的F检验可以看出P0.05同样的CK的P=0.13190.05则可以认为在95%的置信水平下JK与CK的系数不显著。3. SAS中统计检验是否存在多重共线性的办法:(1):得到相关系数矩阵程序如下:proc corr data=sasuser.gdp;var N cl jk gdp;run;得到分析量之间的协相关系数矩阵output窗口的结果: The SAS System 23:47 Saturday, December 31, 2011 1 The CORR Procedure 4 Variables: N CL JK GDP Simple StatisticsVariable N Mean Std Dev Sum Minimum Maximum LabelN 33 1994 9.66954 65802 1978 2010 NCL 33 16327 17099 3178 62665 CLJK 31 1524 835.68515 47243 331.86000 3717 JKGDP 33 90286 3645 GDP Pearson Correlation Coefficients Prob |r| under H0: Rho=0 Number of Observations N CL JK GDP N 1.00000 0.84152 0.56454 0.87582 N .0001 0.0009 .0001 33 33 31 33 CL 0.84152 1.00000 0.36044 0.98852 CL .0001 0.0464 .0001 33 33 31 33 JK 0.56454 0.36044 1.00000 0.38001 JK 0.0009 0.0464 0.0350 31 31 31 31 GDP 0.87582 0.98852 0.38001 1.00000 GDP .0001 F Model 3 3.E11 1.E11 416.91 |t| Inflation Intercept Intercept 1 -16089 6432.48068 -2.50 0.0187 0 CL CL 1 6.76696 0.43563 15.53 |t| Inflation0.0187 00.05方差扩大因子最大所以剔除JK再做共线性检测。得到相应的程序如下:proc reg data=sasuser.gdp;model gdp=cl ck/vif collin;run;在SAS的output窗口中有如下: The SAS System 23:47 Saturday, December 31, 2011 3 The REG Procedure Model: MODEL1 Dependent Variable: GDP GDP Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr F Model 2 3.E11 1.E11 644.39 |t| Inflation Intercept Intercept 1 -14269 4600.74831 -3.10 0.0044 0 CL CL 1 6.84170 0.39006 17.54 |t| Inflation0.0044 00.05即表示系数不显著。剔除CK再次建立回归。相应的程序如下:proc reg data=sasuser.gdp;model gdp=cl/vif collin;run;在output窗口中得到的结果如下: The SAS System 23:47 Saturday, December 31, 2011 4 The REG Procedure Model: MODEL1 Dependent Variable: GDP GDP Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr F Model 1 3.E11 3.E11 1326.74 |t| I

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论