《应用数理统计》吴翊李永乐第四章-回归分析课后作业参考答案_第1页
《应用数理统计》吴翊李永乐第四章-回归分析课后作业参考答案_第2页
《应用数理统计》吴翊李永乐第四章-回归分析课后作业参考答案_第3页
《应用数理统计》吴翊李永乐第四章-回归分析课后作业参考答案_第4页
《应用数理统计》吴翊李永乐第四章-回归分析课后作业参考答案_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《应用数理统计》吴翊李永乐第四章-回归分析课后作业参考答案学生残差46.7960.685下限86.0390.221上限301.8623.3811常数项x193.9511.8014.1452.6290.0030.0300.681由线性回归分析系数表得回归方程为:,说明x每增加一个单位,y相应提高1.801。(2)1、计算结果回归方程的显著性检验(F检验)线性回归效果不显著线性回归效果显著在给定显著性水平时,,所以拒绝,认为方程的线性回归效果显著回归系数的显著性检验(t检验)在给定显著性水平时,,所以拒绝,认为回归系数显著,说明铝的硬度对抗张强度有显著的影响。回归方程的线性显著性检验(r检验)x与y线性无关x与y线性相关在给定显著性水平间具有线性关系。时,,所以拒绝,认为x与y之2、软件运行结果模型摘要模型R修正的估计的学生误差10.681(a)0.4630.39622.685由上表得r=0.681,说明y和x的之间具有线性关系。方差分析表模型平方和自由度平均平方值F值P值1回归平方和残差平方和总平方和3555.5414116.9597672.5001893555.541514.6206.9090.030(a)由方差分析表知,p值小于给定的α,说明回归方程通过F检验,回归方程显著。线性回归分析的系数95%系数的置信区间上限0.0030.030模型非标准化系数标准化系数学生残差46.796T值P值下限4.1452.6291常数项x193.9511.80186.0390.221301.8623.3810.6850.681由线性回归分析系数表知,p值小于给定的α,认为回归系数显著,说明铝的硬度对抗张强度有显著的影响。综上所述,建立的回归方程通过以上的r检验、F检验、t检验,证明回归方程效果显著。(3)当=65时,代入上述回归方程得=310.996在1-α的置信度下,的置信区间为95%置信度下的预测区间为[255.988366.004]。4.2在硝酸钠(如下:)溶解度试验中,对不同温度测得溶解于100ml的水中的硝酸钠重量y的观测值041015212936516866.771.076.380.685.792.999.9113.6125.1(1)求回归方程(2)检验回归方程的显著性(3)求y在时的预测区间(置信度为0.95)解:(1)1、计算结果一元线性回归模型只有一个解释变量其中:t为解释变量,y为被解释变量,为待估参数,位随机干扰项。使用普通最小二乘法估计参数上述参数估计可写为所求得的回归方程为:实际意义为:在温度为0时,硝酸钠的溶解度为67.5313,温度每升高一度,溶解度增加0.8719。2、软件运行结果根据所给数据画散点图由散点图可以看出y与t之间存在线性关系,因此建立线性回归模型如下线性回归分析的系数95%系数的置信区间模型非标准化系数标准化系数T值P值学生残差0.5350.016下限126.30954.747上限0.0000.0001常数项t67.5310.87266.2670.83468.7960.9100.999由线性回归分析系数表得回归方程为:,说明温度每增加一度,溶解度相应提高0.872。(2)1、计算结果回归方程的显著性检验(F检验)线性回归效果不显著线性回归效果显著在给定显著性水平时,,所以拒绝,认为方程的线性回归效果显著回归系数的显著性检验(t检验)在给定显著性水平时,,所以拒绝,认为回归系数显著,说明温度对硝酸钠的溶解度有显著的影响。回归方程的线性显著性检验(r检验)t与y线性无关t与y线性相关在给定显著性水平性相关。时,,所以拒绝,认为t与y线2、软件运行结果模型摘要模型R估计的学生误差修正的10.999(a)0.9980.9971.0147由上表得r=0.999,说明y和t之间线性关系显著。方差分析表模型1平方和3086.2527.208自由度平均平方值F值2997.287P值0.000(a)回归平方和残差平方和总平方和1783086.2521.0303093.460由方差分析表知,F值很大,p值很小,回归方程通过F检验,说明回归方程显著。线性回归分析的系数95%系数的置信区间上限0.0000.000模型非标准化系数标准化系数学生残差0.535T值P值下限126.30954.7471常数项t67.5310.87266.2670.83468.7960.9100.0160.999由线性回归分析系数表知,p值很小,通过t检验,认为回归系数显著,说明温度对硝酸钠的溶解度有显著的影响。综上所述,建立的回归方程通过以上的r检验、F检验、t检验,证明回归方程效果显著。(3)当=25时,代入上述回归方程得=89.328在1-α的置信度下,的置信区间为95%置信度下的预测区间为[86.811391.8450]。4.3对同一个问题,两人分别在做线性回归。甲:取样本值乙:取样本值,得回归方程,得回归方程(1)如何判断这两个回归方程是否相等(给定显著性水平)?(2)若相等,如何求一个共同的回归方程?解:检验若,则拒绝其中检验若,则拒绝其中检验若,则拒绝这三步当中只有一个是拒绝原假设,则两回归方程不同。(2)共同的回归方程为:其中,4.6某化工厂研究硝化得率y与硝化温度、硝化液中硝酸浓度之间的统计相关关系。进行10次试验,得实验数据如下表:16.593.419.790.815.586.721.483.520.892.116.694.923.189.614.588.121.387.316.483.490.9291.1387.9588.5790.4489.8791.0388.0389.9385.58试求y对的回归方程。解:用所给的数据建立多元回归方程并进行检验模型摘要模型R修正的估计的学生误差10.927(a)0.8590.8190.76066由上表得r=0.927,说明y和x的之间线性关系显著。方差分析表模型1平方和回归平方和24.724残差平方和4.050自由度平均平方值12.3620.579F值21.365P值0.001(a)279总平方和28.774由方差分析表知,F值很大,p值很小,回归方程通过F检验,说明回归方程显著。线性回归分析的系数95%系数的置信区间上限r0.0000.0000.000模型非标准化系数标准化系数学生残差6.0790.0850.065T值P值下限8.5213.9725.4231常数项x1x251.7980.3360.35237.4240.1360.19866.1720.5360.5050.5640.770由线性回归分析系数表知,和的p值都很小,通过了t检验,认为回归系数显著,说明硝化温度和硝化液中硝酸浓度对硝化得率均有显著的影响。通过以上的r检验、F检验、t检验,证明回归方程效果显著。最后得到的回归方程为:说明硝化温度每增加一度,硝化得率增加0.336%;硝化液中硝酸浓度每增加1%,硝化得率增加0.352%。4.4某建材实验室再作陶粒混凝土强度试验中,考察每立方米混凝土的水泥用量x(kg)对28天后的混凝土抗压强度y()的影响,测得如下数据15016017018019020021022023024025026056.958.361.664.668.171.374.177.480.282.686.489.7(1)求y对x的线性回归方程,并问:每立方米混凝土中增加1公斤水泥时,可提高的抗压强度是多少?(2)检验线性回归方程效果的显著性();(3)求回归系数的区间估计();(4)求时,的预测值及预测区间。解:1.计算结果(1)一元线性回归模型:只有一个解释变量Y为被解释变量,X为解释变量,与为待估参数,为随机干扰项。用普通最小二乘法(Ordinaryleastsquares,OLS)估计和记上述参数估计量可以写成:带入数字得:所以求得的回归方程为:y=10.283+0.304x,即x每增加一个单位,y相应提高0.304(2)回归方程的显著性检验:总体平方和,简记为S总或Lyy回归平方和,记为S回或U残差平方和,记为S残或QeSST=SSE(Qe)+SSR(U)对总体参数H0:β1=0,F检验:提出假设H1:β1≠0因为所以,拒绝原假设。T检验:因为|t|>2.2281,所以拒绝原假设,即对方程有显著影响。线性关系的显著性检验:代入数据得:r=0.999拒绝原假设,即X与Y有显著的线性相关关系对总体参数提出假设H0:β0=0,H1:β0≠0因为|t|>2.2281,所以拒绝原假设,即(3)回归系数的区间估计,构造统计量对方程有显著影响(1-α)的置信度下,的置信区间是得出:β1的95%的置信区间为[-0.295,-0.313]。(4)求预测值代入数据计算得:当x=22.5时,y=17.123求预测区间构造统计量其中:从而在1-α的置信度下,Y0的置信区间为代入数据计算得:95%置信度的预测区间为[15.4318.815](2)SPSS软件运行结果:根据数据的散点图为:由上图可知,x与y基本成线性关系。建立线性模型,进行相关检验:模型摘要修正后的估计的学生残差模型R1.999(a).998.998.489162由上表可以看出相关系数R接近于1,y和x的线性关系显著。方差分析表自由度模型平方和均方F值P值1回归平方和1321.42711321.4275522.521.000(a)残差平方2.393和总平1323..2391011由方差分析表可见,F值很大,伴随概率p很小,说明回归方程通过F检验,及回归方程非常显著=2.393/(12-2)=0.239线性回归分析的系数非标准标准化化系数系数T值学生残95%系数的置信区间模型P值差下限上限r1常数10.283.304.850.00412.092.000.0008.38812.178项x.99974.314.295.313(1)y对x的线性回归方程,由上图可得回归方程:y=10.28+0.304x。p很小,通过T检验。说明x对y有显著影响。X增加一个单位y相应提高0.304。(2)回归方程效果的显著性,以上的R检验、F检验和t检验,已证明。(3)β1的95%的置信区间为[-0.295,-0.313]。(4)计算后的预测值表:预测值均预测值误差xy预测值数的标准预测下限预测上限误差15016017018019020021022023024025026022.5.56.958.361.664.668.171.374.177.480.282.686.489.755.88158.92161.966568.0471.0874.1277.1680.283.2486.27989.31917.123.1.0190.2660.2320.2010.1740.1540.1430.1430.1540.1740.2010.2320.2660.7655.28958.40461.51264.61267.69770.76273.80276.81779.81182.79185.76288.72715.4356.47359.43862.40965.38968.38371.39874.43877.50380.58883.68886.79689.91118.815-0.621-0.36-0.40.060.22-0.020.240-0.640.1210.381从上表查得,当x=22.5时,y=17.12395%置信度的预测区间为[15.4318.815]4.5假设x是一可控变量,y是一随机变量,服从正态分布,现在不同的x值下分别对y进行观测,得如下数据,x0.250.370.440.550.600.620.680.700.73yxy2.570.751.412.310.821.332.120.841.311.920.871.251.750.881.201.710.901.191.600.951.151.511.001.001.50(1)假设x与y之间有线性关系,求y对x的经验回归方程,并求的无偏估计;(2)求回归系数;(3)检验x和y之间的线性回归方程是否显著((4)求y的0.95预测区间;);(5)为了把观测值y限制在区间(1.08,1.68),需要把x的值限制在和范围之内?(解:1.计算过程及结果)(1)一元线性回归模型:只有一个解释变量Y为被解释变量,X为解释变量,与为待估参数,为随机干扰项。用普通最小二乘法(Ordinaryleastsquares,OLS)估计和记上述参数估计量可以写成:带入数据得:所以求得的回归方程为:y=3.033-2.070x可以证明,的最小二乘估计量为它是关于的无偏估计量,也称为剩余方差(残差的方差)。代入数据得:(2)由于是得到:(1-α)的置信度下的置信区间是再由,还可得的置信水平为的置信区间这里,代入数据得到,β0的95%的置信区间为[2.951,3.116];β1的95%的置信区间为[-2.183,-1.957];的95%的置信区间为[Qe/X21-α/2(n-2),Qe/X2α/2(n-2)]=[0.03/27.488,0.03/6.262]=[0.0011,0.0048](3)回归方程的显著性检验:总体平方和,简记为S总或Lyy回归平方和,记为S回或U残差平方和,记为S残或QeSST=SSE(Qe)+SSR(U)对总体参数H0:β1=0,F检验:提出假设H1:β1≠0因为所以,拒绝原假设。T检验:因为|t|>2.1315,所以拒绝原假设,即对方程有显著影响。线性关系的显著性检验:代入数据得:r=0.995拒绝原假设,即X与Y有显著的线性相关关系对总体参数提出假设H0:β0=0,H1:β0≠0因为|t|>2.1315,所以拒绝原假设,即(4)对方程有显著影响其中(5)因代入数据得2.SPSS软件运行结果根据数据得到散点图:由上图可知,x与y基本成线性关系。建立线性模型,进行相关检验:模型摘要模型R修正的估计的学生误差1.995(a).990.990.04454由上表可以看出相关系数R接近于1,y和x的线性关系显著。线性回归分析的系数95%系数的置信区间模型非标准化系数标准化系数学生残差0.039T值P值下限上限r1常数项x3.03378.354-39.139.000.0002.9513.116-2.0700.053-0.995-2.183-1.957由上图可得回归方程:y=3.033+(-2.070)x。p很小,通过T检验。说明x对y有显著影响。方差分析表模型平方和自由度平均平方值F值P值1回归平方和3.03913.0391531.867.000(a)残差平方和总平方和0.03015160.0023.069由方差分析表可见,F值很大,伴随概率sig.p很小,说明回归方程通过F检验,及回归方程非常显著(2)线性回归分析的系数95%系数的置信区间模型非标准化系数标准化系数学生残差0.039T值P值下限上限r1常数项x3.03378.354-39.139.000.0002.9513.116-2.0700.053-0.995-2.183-1.957由上表可以看出β0的95%的置信区间为[2.951,3.116];β1的95%的置信区间为[-2.183,-1.957];σ2的置信区间为[Qe/X21-α/2(n-2),Qe/X2α/2(n-2)]=[0.030/27.488,0.030/6.262]=[0.0011,0.0048](3)回归方程的显著性已在(1)中证明。(4)可以得到=nσx2=17*(0.21056)2=0.7103,的置信度为95%预测区间为[]4.7某种商品的需求量y,消费者的平均收入以及商品的价格的统计数据如下表10006001200500300400130011001300300576687543910075807050659010011060求y对、的回归方程。解:线性回归分析的系数标准模型非标准化系化系数数学生95%系数的置信区间T值P值残差下限上限r1常数项消费者平均收入x1商品价格111.69223.5314.7471.2840.002.24056.050167.3330.0140.011-7.1882.5550.306-0.0120.041-0.670-2.8130.026-13.231-1.146x2由上图可知。,得到回归方程:从表中得出,x1的T检验未通过,x1和x2有较强的共线性。则由后退法,删除第一个变量,得到线性回归分析的系数表如下:线性回归分析的系数95%系数的置信区间模型非标准化系数标准化系数学生残差8.551T值P值下限上限r1常数项商品价格x2140.0016.372-7.3030.0000.000120.281159.719-10.0001.369-0.933-13.158-6.842a.因变量:商品的需求y得到回归方程:4.8铝合金化学铣切工艺中,为了便于生产操作,需要对腐蚀速度进行控制,因此要考查腐蚀液温度、碱浓度、腐蚀液含铝量对腐蚀速度的影响,一共做了44次试验,所得数据如下表:试验号试验号123456789101112131415161718197373757575757979797979798383838383838712213042364812213042364812213042364812200200200200200200200200200200200200200200200200200200.02400.02350.02400.01900.02450.01850.03200.03000.02900.2750.02500.02250.03700.03600.03550.03250.03050.02700.04402324252627282930313233343536373839404187877777777777818181818185858585858989364819191919192727272727353535353543432002001501752002252501501752002252501501752002252501501750.03600.03250.02300.02500.02650.02850.02900.02850.02950.03100.03150.03200.03450.03550.03700.03900.04050.03750.03802002021228787872130422002002000.04250.04200.03904243448989894343432002252500.04000.04300.0450(1)求y对(2)对所得到的回归方程进行显著性检验;(3)对自变量的线性回归方程;的显著性进行检验;(4)求时,腐蚀速度的点预测与99%的预测区间。解:因为y值相对于x来说数量级非常的小,所以先将y扩大10000倍,然后使用SPSS对y与之间的关系做回归由上表得r=0.097,说明y和之间线性关系极不显著。由方差分析表知,F值很小,p值很大,回归方程通不过F检验,说明回归方程不显著。由线性回归分析系数表知,p值很大,通不过t检验,认为回归系数高度不显著,说明对y没有显著的影响。综上所述,建立的回归方程不能通过以上的r检验、F检验、t检验,所以无法建立y与之间的回归方程。4.9有一架天平,称重时有随机误差。现对实重分别为的4个物体,按下述办法称重4次:第一次,都放在天平的右盘上,砝码放在左盘中,使其平衡,记砝码读数为。第k次放在天平的右盘上,其余两个放在左盘中。为使天平达到平衡要放上读数为的砝码,若砝码放在右盘内,则;若放在左盘内,则。试求的最小二乘估计,并求出的方差。如果对分别进行称量,需要称多少次才能得到同样精度的无偏估计。解:由题意得到方程为:令解得:同理可知如果对分别进行称量,每个需要称4次才能得到的精度,则共需称重16次。4.10将16~30岁的男女运动员按年龄分成7组,把年龄组中值作为x,考察年量大小对“旋转定向”能力的影响,已知的7组数据如下:x(年龄)17192123252729y(旋转定力)22.4826.6324.230.726.5123.0020.30从散点图可以看出,用抛物线回归比较好,试求其回归多项式,并求。解:题目要求使用抛物线回归,所以先计算出线性回归分析的系数,然后再使用SPSS软件对y与x、的关系做回归模型非标准化系数标准化系数学生残差32.653T值P值1常数项年龄xxx-63.6298.150-1.9492.810-2.8890.1230.0480.0452.90010.287-0.1820.063-10.575得到的抛物线方程为:求的计算过程见下表:17192123252722.4826.6324.2030.7026.5123.0022.3225.5227.2627.5426.3723.740.161.11-3.063.160.14-0.740.021.239.369.970.020.554.11某矿脉中13个相邻样本点处,某种金属的含量y与样本点对远点的距离有如下实测值:xyxy2106.42113108.20144109.58155109.50167110.00188109.931910110.49110.59110.60110.90110.76111.00111.20分别按:(1)(2)(3)建立y对x的回归方程,并用复相关函数指出其中哪一种相关最大。解:(1)使用方程的形式进行回归拟合,先计算出的值,然后对y与进行线性拟合。模型摘要模型R修正的估计的学生误差1.886(a)0.7850.7660.64366a自变量:sqrtx由上表得r=0.886,说明y与之间线性关系显著。方差分析表模型1平方和回归平方和16.653残差平方和4.557自由度11112平均平方值16.6530.414F值40.197P值0.000(a)总平方和21.211由方差分析表知,F值很大,p值几乎为0,,回归方程通过F检验,说明回归方程显著。线性回归分析的系数模型非标准化系数标准化系数学生残差0.600T值P值1常数项sqrtx106.3011.195177.0316.3400.0000.0000.1880.886由线性回归分析系数表知,回归方程系数的p值几乎为0,通过了t检验,认为回归系数显著。通过以上的r检验、F检验、t检验,证明回归方程效果显著。最后得到的回归方程为:(2)使用方程的形式进行回归拟合,先计算出lnx的值,然后对y与lnx进行线性拟合模型摘要模型R修正的估计的学生误差1.937(a)0.8770.8660.48638由上表得r=0.937,说明y和lnx的之间线性关系显著。方差分析表模型1平方和回归平方和18.608残差平方和2.602自由度11112平均平方值18.6080.237F值78.661P值0.000(a)总平方和21.211由方差分析表知,F值很大,p值几乎为0,回归方程通过F检验,说明回归方程显著。线性回归分析的系数模型非标准化系数标准化系数学生残差0.430T值P值1常数项lnx106.3151.714247.2258.8690.0000.0000.1930.937由线性回归分析系数表知,回归方程系数的p值几乎为0,通过了t检验,认为回归系数显著。通过以上的r检验、F检验、t检验,证明回归方程效果显著。最后得到的回归方程为:(3)使用方程的形式进行回归拟合,先计算出1/x的值,然后对y与1/x进行线性拟合模型摘要模型R修正的估计的学生误差10.987(a)0.9740.9720.22352由上表得r=0.987,说明y和1/x的之间线性关系显著。方差分析表模型1平方和回归平方和20.661残差平方和0.550自由度11112平均平方值20.6610.050F值413.529P值0.000(a)总平方和21.211由方差分析表知,F值很大,p值机会为0,回归方程通过F检验,说明回归方程显著。线性回归分析的系数模型非标准化系数标准化系数学生残差0.098T值P值1常数项1/x1116.487-9.8331134.157-20.3350.0000.0000.484-0.987由线性回归分析系数表知,回归方程系数的p值几乎为0,通过了t检验,认为回归系数显著。通过以上的r检验、F检验、t检验,证明回归方程效果显著。最后得到的回归方程为:计算复相关系数的计算过程见下表:23457106.42108.20109.58109.50110.00109.93110.49110.59110.60110.90107.991108.371108.691108.973109.463109.681110.080110.264110.772110.929107.503108.198108.691109.074109.650109.879110.262110.425110.838110.957106.571108.209109.029109.520110.082110.258110.504110.593110.785110.8312.4680.0290.7900.2780.2890.0620.1680.1060.0300.0011.17300.02300.30400.0070.108000.0340.0050.7900.1820.1220.0030.0520.0270.0570.003810111415161819110.76111.00111.20111.081111.371111.5102.601111.067111.269111.3620.551110.872110.941110.9690.10

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论