




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、海南大学数理统计课程设计题目一元线性回归班级:数学与应用数学学号:031:王丽指导教师:韩汉鹏日期:2015/6/25一元线性回归分析摘要:本文利用回归分析中的一元线性回归分析对近十年来的国生产总值与第三产 业增加值的关系进行研究(由于国家统计数据中暂时还没有 2014-2015年的数据,故 只能往后推几年),通过F检验以及R检验,肯定了模型的可靠性。关键词:一元线性回归分析国生产总值第三产业增加值F检验MATLAB试验设计方法建立一元线性回归模型:2 y 0 ixn(o,)其中0,假设对于x的n个值xi,准则,要使1是待定系数,对于不同的得到x, y是相互独立的随机变量。 y的n个相应的值y
2、i,确定0,1的方法是根据最小二乘Q(0,1)yi (i1Xi)2取最小值。利用极值必要条件令0,10,求0,1的估计值?0,?,从而得到回归直线y兔?x。?仍然是随机变量,因此要对?0,?取值的区间进行估计,如(1 )参数的区间估计 由于我们所计算出的果区间估计值是一个较短的区间表示模型精度较高。(2)对误差方差的估计设?为回归函数的值,yi为测量值,残差平方和nQ (yi ?)2i 1剩余方差s2n 2(3)线性相关性的检验由于我们采用的是一元线性回归,因此,如果模型可用的话,应该具有较好的线性关系。 反映模型是否具有良好线性关系可通过相关系数R的值及F值观察。试验数据(来源于国家统计.s
3、./ )经整理为(单位均为:千万):国生产总值第三产业增加值2004160713.466282.82005185895.876964.92006217656.691180.12007268019.4115090.92008316751.7135906.92009345629.2153625.12010408903180743.42011484123.5214579.920125341232430302013588018.8275887建立回归模型:一元线性回归分析设计,其国生产总值与第三产业增加值关系的回归模型建立可借助计算 机完成,本文采用MATLAB件来建立其数学模型,程序
4、如下:首先利用命令plot(x,y,r*)画出散点图,可编制程序如下:y=160713.4,185895.8,217656.6,268019.4,316751.7,.345629.2,408903,484123.5,534123,588018.8;x=66282.8,76964.9,91180.1,115090.9,135906.9,.153625.1,180743.4,214579.9,243030,275887;plot(x,y, *)xlabel(第三产业增加值);ylabel(国生产总值);运行后得到5x 105.54.5值总产生内国0.51.52第三产业增加值2.5
5、35x 10 从图形可以看出,这些点大致分布在一条直线的左右,因此,可以考虑一元线性回归。1根据计算得到的计算表为:Xi = 1553291 n= 10i 1X = 1.5533e+005n2Xi2 = 2.4127e+011i 1nX2= 2.8784e+011lxx= 4.6567e+nXiYi = 6.4162e+011i 1n? X ?Y = 5.4518e+011lxy = 9.6444e+lyy =Y = 3.5098e+006i 1Y = 3.5098e+005n2Yi2 = 1.4320e+012i 1nY2 = 1.2319e+0122.0012e+0111 = lxy /
6、lxx = 2.0711o = Y X 1 = 2.9284e+004所以,他们之间的一元线性关系为y=2.9282e+004+2.0711*x而St =lyy= 2.0012e+011Sr= 1 lxx=1.9974e+011Se=ST - Sr =3.8051e+008把各平方和与自由度移入方差分析表,继续进行计算得到下表:国生产总值与第三产业增加值回归方程的方差分析表来源平方和自由度均方F比p值回归Sr =1.9974e+011fR =1MSr =1.9974e+0114.1995e+0030.0000残差9=3.8051e+008fe=8MSe = 4.7564e+007总计St =
7、2.0012e+011fT =9利用MATLAB件来做F与R检验以及置信区间有:输入y (因变量,列向量)、x( 1与自变量组成的矩阵),alpha是显著性水平(缺省时默 认 0.05)。输出b(?),?),其中b中元素顺序与拟合命令polyfit的输出不同,bi nt是,1的置信区间,r是残差(列向量),rint是残差的置信区间,s包含4个统计量:决定系数 R2 (相 关系数为R); F值;F(1,n-2)分布大于F值的概率p;剩余方差s2的值。其意义:R2的值越接近1,变量的线性相关性越强,说明模型有效;如果满足F1 (1,n 2) F,则认为变量y与x显著地有线性关系,其中F1 (1,n
8、 2)的值可查F分布表;如果p 表示线性模型可用。这三个值可以相互印证。s2的值主要用来比较模型是否有改进,其值越小说明模型精度越高。clear;clc;format long ;y=160713.4,185895.8,217656.6,268019.4 316751.7,345629.2,408903,484123.5,534123,588018.8; x=66282.8,76964.9,91180.1,115090.9,135906.9,153625.1,180743.4,214579.9,243030,275887; n=10;X=o nes( n,1),x;b,b in t,r,ri
9、nt,s=regress(y,X,0.05);b,b in t,s, rcoplot(r,ri nt)运行后得到b =1.0e+004 *2.81450.9571 bint =1.0e+004 *1.9109 4.71820.0349 0.8793 s =1.0e+007 *0.9862 0.3500 0.0000 4.5453则其中 R2 = 1.0e+007 *0.9862=0.99809862, 由 finv(0.95,1,8)=5.32,即 R (1,n 2)=5.31F= 1.0e+007 * 0.3500=, p0.,置信区间为 bint 的值为16780. 41787. 和1.
10、2.说明模型有效且能改进,即:Residual Case Order Plot-212345678910Case Number可以通过残差图发现,第十个数据为奇异数据,去掉该数据后运行后得到b =1.0e+004 *2.99460.7129 bint =1.0e+004 *1.8639 3.12540.0433 0.38261.0e+007 *0.1340 0.5291 0.0000 1.88222则其中 R = 1.0e+007 * 0.1340=0.99921340,由 finv(0.95,1,7)=5.59 ,即 F1(1, n 2)=5.59F= 1.0e+007 * 0.5291,
11、p0.000000001 ,置信区间为14602. 30962. 和2. 2. 说明模型有效且有改进Residual Case Order PlotFaxseR-1Case Number但通过残差图发现,第九个数据仍为奇异数据,去掉该数据后运行后得到1.0e+004 *1.75550.0143 bint =1.0e+004 *1.2248 2.28620.8470 0.18161.0e+006 *0.0814 0.1287 0.0000 8.05422则其中 R = 1.0e+006 * 0.0814=0.999400814,5.99F= 1.0e+006 *0.1287 , p0.00000
12、0001由 finv(0.95,1,6)=5.99,置信区间为11874. 26471.,即 F1(1,n2)=以及2. 2. 说明模型有效且有改进s =1Case Order Plot4x 10Residual0.80.64-2o0 02 4 6 a a a-0.8-112345678Case Number可是通过残差图发现,第六个数据仍为奇异数据,去掉该数据后运行后得到b =1.0e+004 *1.11070.9481bint =1.0e+004 *1.8213 2.40020.0044 0.89191.0e+006 *0.3395 0.8954 0.0000 3.54862则其中 R =
13、 1.0e+006 * 0.3395=0.9994783395, 由 finv(0.95,1,5)=6.616.61F= 1.0e+006 *0.8954, p0.000000001,置信区间为13928. 23891.即 F1 (1,n和2. 2.2)=说6000ooo4o o o2RrauseR-2000-4000Residual Case Order Plot123456Case Number7明模型有效且有改进可以通过残差图发现,第五个数据仍为奇异数据,去掉该数据后运行后得到b =1.0e+004 *1.92290.3588bint =1.0e+004 *1.4539 2.39200.
14、0128 0.70491.0e+006 *0.9407 0.1926 0.0002 1.85682则其中 R = 1.0e+006*0.9407=0.999919406, 由 finv(0.95,1,4)=7.71,即 Fi7.71F= 1.0e+006 *0.1926, p0.000000001,置信区间为14972. 22303. 和2.(1,n2.2)=4000-1000O OO3OOO2OOOOResidual Case Order Plot-2000-3000-4000Case Number说明模型有效且有改进,因此我们得到国生产总值与第三产业增加值的关系为y= 18638.+2.X结论:国生产总值与第三产业呈现一元线性关系,得到国生产总值与第三产业增加值的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 六一捐助活动方案
- 六一教研活动方案
- 六一校区活动方案
- 六一活动冬日活动方案
- 六一活动大集体活动方案
- 六一活动教师活动方案
- 六一活动禁毒活动方案
- 六一漂流礼物活动方案
- 六一联欢会活动方案
- 六一蛋糕活动方案
- 2024北京朝阳区四年级(下)期末数学试题及答案
- 《全断面岩石掘进机法水工隧洞工程技术规范》
- 河南省郑州市2023-2024高一下学期期末考试数学试卷及答案
- 2023年工会财务知识竞赛题库及答案(完整版)
- 新高考志愿填报指导报考表
- 幼儿园小班社会:《红绿灯》 课件
- isa-381g站用变接地保护测控装置技术使用说明书南网版v3
- 六年级劳动教育7.青椒炒肉丝(课件)
- 油气藏类型、典型的相图特征和识别实例
- 《议程设置理论》
- 取力器的设计设计说明书
评论
0/150
提交评论