




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
重 庆 交 通 大 学学 生 实 验 报 告实验课程名称 应用回归分析 开课实验室 理学院实验室 学 院 09 年级 信息与计算科学 专业班 1 学 生 姓 名 林艳 学 号 09180117 开 课 时 间 2011 至 2012 学年第 1 学期总 成 绩教师签名2.15 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过10周时间,收集了每周加班工作时间的数据和签发的心保单数目,x为每周签发的新保单数目,y为每周加班工作时间(小时)。见表2.7.表2.7周序号12345678910X825215107055048092013503256701215Y3.51.04.02.01.03.04.51.53.05.0(1) 画散点图; 答:(2) X与y之间是否大致呈线性关系;答:由(1)的散点图可以看出x与y之间大致呈线性关系。(3) 用最小二乘估计求出回归方程;答:由SPSS得:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量).118.355.333.748x.004.000.9498.509.000a. 因变量: y由该系数表得出最小二乘估计的回归方程为:(4) 求回归标准误差;答:模型汇总模型RR 方调整 R 方标准 估计的误差1.949a.900.888.48002a. 预测变量: (常量), x。由上表得回归标准误差为:=0.48002(5) 给出与的置信度为95%的区间估计;答: 系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量).118.355.333.748-.701.937x.004.000.9498.509.000.003.005a. 因变量: y由上表得:得置信区间为:(-0.701,0.0937);得置信区间为:(0.003,0.005);(6) 计算x与y的决定系数;答:由(4)得模型汇总表得:=0.900,从相对水平上来看,回归方程能够减少因变量y得99.0%得方差波动。(7) 对回归方程做方差分析;答:由SPSS得方差表:Anovab模型平方和df均方FSig.1回归16.682116.68272.396.000a残差1.8438.230总计18.5259a. 预测变量: (常量), x。b. 因变量: y由方差分析表中看到,F=72.396,Sig=0.000,说明y对x得线性回归高度显著。(8) 做回归系数1显著性的检验;答:从(5)中得系数表中可得:回归系数1检验的t值=8.509,显著性Sig=0.000,与F检验的检验结果一致。(9) 做相关系数的显著性检验;答:从(4)的模型汇总表可得:r=0.949,说明y与x有显著的线性关系,与F检验和回归系数检验的结果一致。也说明对于一元线性回归三种检验的结果是完全一致的;(10) 对回归方程作残差图并作相应的分析;答:残差图:从残差图上看出,残差是围绕e=0随机扰动,从而模型的基本假定是满足的。(11) 该公司预计下一周签发新保单=1000张,需要的加班时间是多少?答:由SPSS得下表:xyPRELICIUICILMCIUMCI8253.53.075861.913294.238442.720513.4312221510.88893-0.387912.165770.252531.52534107043.954222.755315.153143.493694.4147555022.089950.910863.269051.68382.4961148011.838990.646133.031851.394462.2835392033.416452.245384.587523.034223.7986813504.54.958063.664136.251994.288025.628093251.51.28330.047122.519470.7331.8335967032.520171.355773.684572.158892.88145121554.474063.232465.715673.911695.0364410003.703262.519494.887033.283734.12279从表中得出加班时间:(12) 给出的置信水平为95%的精确预测区间和近似预测区间。答:从(10)表可以得出置信水平为95%的精确预测区间为(3.28373,4.12279),近似预测区间为即(2.74332,3.70326)。(13) 给出E()置信水平为95%的区间估计。答:从(11)表中得E()置信水平为95%的区间估计为:(2.51949,4.88703)。2.16 表2.8是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和学生的人均经费投入x(美元)。(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?(2)建立y对x的线性回归;(3)用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。(4)通过p-p图或q-q,若有异常点剔出后再分析。表2.8序号yx序号yx序号yx119583334618208163059351953826422202633114191809529673620460312432032535542020939328537214192752426800454221226443914382510634295294704669222462445173922482394762661048882327186434940209692509730678571024339905020412722454408271705536252338235944225892404292585341682620627282143226443402102450035472722795336644246402829112427431592821570292045223412297122714036212922080298046256102932133016837823022250373147260153705142652542473120940285348257884123152736039823221800253349291323608162169035683322934272950414808349172197431553418443230551258453766解:(1)由图看出x与y大致呈直线关系;(2):由SPSS得:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)12109.8791196.94810.117.000x3.314.312.83510.630.000a. 因变量: y回归方程为:(3)由标准残差的直方图和正态概率图可以看出,误差项通过了正态性假设。(4)yxDREZRESRE195833346-3696.68-1.55754-1.5748202633114-2224.35-0.93347-0.9457203253554-3636.03-1.53486-1.55042268004542-375.051-0.15628-0.158892947046691958.1840.812460.8278266104888-1780.17-0.73204-0.7492306785710-392.213-0.15325-0.1609271705536-3575.91-1.41585-1.47673258534168-72.0447-0.0303-0.03066245003547647.71380.273410.276182427431591737.7220.729930.739152714036213090.4091.304891.317943016837825635.1982.379292.40314265254247348.59290.146380.148252736039822097.3420.884320.8938216903568-2290.41-0.96691-0.97667219743155-607.181-0.25503-0.25826208163059-1471.5-0.61677-0.62523180952967-3963.59-1.65744-1.68214209393285-2105.59-0.8864-0.89661226443914-2488.5-1.04991-1.06083246244517-2536.66-1.05785-1.07509271864349681.41740.285480.289473399050205526.4252.258292.31852233823594-651.909-0.27524-0.278206272821-860.884-0.35843-0.36456227953366-480.739-0.2026-0.20482215702920-224.075-0.09358-0.0950322080298096.679740.040440.04104222503731-2269.6-0.95838-0.96793209402853-646.131-0.26929-0.273762180025331354.8680.557930.570612293427291847.0290.766580.78094184432305-1381.23-0.56254-0.57851195382642-1382.66-0.57197-0.58364204603124-2055.73-0.86289-0.8741214192752195.49050.08120.082692510634291666.6310.702870.71033224823947-2766.33-1.1668-1.1791209692509569.4720.234260.23971272245440-3149.78-1.25555-1.30514258924042394.84580.166370.16821226443402-756.692-0.31903-0.322462464028293262.3921.358651.381732234122972770.3961.127841.16012561029323900.3661.629421.654512601537051658.6460.700410.7073825788412314.120310.005940.006012913236085166.62.181452.203314148083492883.0480.732280.95362584537661279.1540.540110.54551由标准化残差可以看出无异常点。3.11 研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。数据见表3.9.表3.9货运总量y(万吨)工业总产值x1亿元农业总产值x1亿元居民非商品之处x3(亿元)16070351.0 26075402.421065402.0 26574423.0 24072381.222068451.527578424.0 16066362.0 27570443.2 25065423.0 (1) 计算出y,x1,x2,x3的相关系数矩阵;解:由SPSS软件得:相关性yx1x2x3yPearson 相关性1.556.731*.724*显著性(双侧).095.016.018N10101010x1Pearson 相关性.5561.113.398显著性(双侧).095.756.254N10101010x2Pearson 相关性.731*.1131.547显著性(双侧).016.756.101N10101010x3Pearson 相关性.724*.398.5471显著性(双侧).018.254.101N10101010*. 在 0.05 水平(双侧)上显著相关。所以y,x1,x2,x3的相关系数矩阵为:(2) 求y关于x1,x2,x3的三元线性回归方程;解:由SPSS得:系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485x27.1012.880.5352.465.049.05314.149x312.44710.569.2771.178.284-13.41538.310a. 因变量: y由上表可得: =3.754x1+7.101x2+12.447x3-348.280 对所求得的方程作拟合优度检验;模型汇总b模型RR 方调整 R 方标准 估计的误差1.898a.806.70823.442a. 预测变量: (常量), x3, x1, x2。b. 因变量: y复相关系数R=0.806,决定系数R方=0.898,由决定系数看回归方程显著相关。(4)对回归方程作显著性检验;Anovab模型平方和df均方FSig.1回归13655.37034551.7908.283.015a残差3297.1306549.522总计16952.5009a. 预测变量: (常量), x3, x1, x2。b. 因变量: y方差分析表,F=8.283,P=0.015,表明回归方程显著相关,说明x1,x2,x3整体上对y有显著的线性影响。(5)对每一个回归系数作显著性检验;系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485x27.1012.880.5352.465.049.05314.149x312.44710.569.2771.178.284-13.41538.310a. 因变量: y由上表数据可知:自变量x1,x2,x3对应P值为P1=0.100,P2=0.049,P3=0.284,从定性分析看,x2通过了显著性检验,x3的P值最大,明显未通过显著性检验,说明x3居民非商品支出对货运总量的影响是最小的。(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验。解:将x3剔除后,用y与x1,x2作回归,计算结果如图:模型汇总b模型RR 方调整 R 方标准 估计的误差1.872a.761.69224.081a. 预测变量: (常量), x2, x1。b. 因变量: yAnovab模型平方和df均方FSig.1回归12893.19926446.60011.117.007a残差4059.3017579.900总计16952.5009a. 预测变量: (常量), x2, x1。b. 因变量: y系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)-459.624153.058-3.003.020-821.547-97.700x14.6761.816.4792.575.037.3818.970x28.9712.468.6763.634.0083.13414.808a. 因变量: y剔除x3后的回归方程为: =4.676x1+8.971x2-459.624回归方程的显著性检验:此时的F=11.117,P=0.007,表明回归方程高度显著,说明x1,x2整体上对y有高度的线性影响。回归系数的显著性检验:剔除x3后,其余自变量的显著性都发生了不同程度的变化,这是由于自变量之间的相关性造成的,此时P1=0.037,P2=0.008,说明自变量都已显著,都通过了显著性检验。求出每一个回归系数的置信水平为95%的置信区间;1置信区间为(0.381,8.970)2的置信区间为(3.134,14.808)求标准化回归方程;解:求当=75,=42,=3.1时的,给定置信水平为95%,用spss软件计算精确置信区间,用手工计算近似预测区间。货运总量y(万吨)工业总产值x1亿元农业总产值x1亿元居民非商品支出x3(亿元)PRELICIUICI16070351.0 181.6541114.1804249.127926075402.4249.8871186.7191313.055121065402.0 203.1308139.2701266.991526574423.0 263.1534200.9208325.385924072381.2217.9183155.9556279.880922068451.5262.0125195.3407328.684227578424.0 281.8559213.4631350.248716066362.0 171.9226105.138238.707127570443.2 262.3928199.0204325.765125065423.0 221.0727156.1113286.034175423.1267.829204.4355331.2225从上面的数据可知: ,精确置信区间为(204.4355,331.2225),由前面问题6的表得 ;手工计算进似预测区间为 即 (219.667,315.991)结合回归方程对问题做一些基本分析。解:回归方程:从这个回归方程我可以看出当工业总产值每增加一个单位时货运就增加4.676个单位,而当农业增加一个单位时货运量就增加8.971个单位,可以看出该地区是一农业发展为主,工业还没有农业发展快。我们可以通过该模型来预测将来。3.12用表3.10的数据,建立GDP对和的回归。对得到的二元回归方程,你能够合理地解释两个回归系数吗?如果现在不能给出合理的解释,不妨在学过第6章多重共线性后再来解释这个问题, 学过第7章领回归后再来改进这个问题。数据如下:年份GDP第一产业增加值x1第二产业增加值x2第三产业增加值x3199018547.95017.0 7714.45813.5199121617.85288.69102.27227.0 199226638.15800.0 11699.59138.6199334634.46882.116428.511323.8199446759.49457.222372.214930.0 199558478.111993.0 28537.917947.2199667884.613844.233612.920427.5199774462.614211.237222.723028.7199878345.214552.438619.325173.5199982067.514472.0 40557.827037.7200089468.114628.244935.329904.6200197314.815411.848750.0 33153.0 2002105172.316117.352980.236047.82003117390.216928.161247.139188.0 2004136875.920768.172387.243720.6(1)计算出y,的相关系数矩阵;解:由SPSS得:相关性yx1x2x3yPearson 相关性1.978*.999*.997*显著性(双侧).000.000.000N15151515x1Pearson 相关性.978*1.975*.962*显著性(双侧).000.000.000N15151515x2Pearson 相关性.999*.975*1.995*显著性(双侧).000.000.000N15151515x3Pearson 相关性.997*.962*.995*1显著性(双侧).000.000.000N15151515*. 在 .01 水平(双侧)上显著相关。(2)求y关于,的三元线性回归方程;解: 系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)6.06010.500.577.575x1.997.002.133469.870.000x21.000.001.538690.105.000x31.002.002.333521.475.000a. 因变量: y回归方程为:(3)对所求得的方程作拟合优度检验;解:模型汇总b模型RR 方调整 R 方标准 估计的误差1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师招聘之《小学教师招聘》复习试题【培优】附答案详解
- 2025年教师招聘之《幼儿教师招聘》押题练习试卷附参考答案详解(达标题)
- 2025呼伦贝尔莫力达瓦达斡尔族自治旗尼尔基第一中学校园引才笔试备考及完整答案详解
- 2025广东广州银行人才招聘考试备考题库及答案解析
- 2025年汽车轻量化材料在汽车轻量化车身制造中的产业布局与市场前景研究报告
- 棚户区改造项目房屋产权分割及购房合同模板-@-3
- 2025年乳腺病学乳房超声影像解读练习答案及解析
- 南阳党建面试题库及答案
- 教师招聘之《小学教师招聘》综合提升试卷及参考答案详解【模拟题】
- 2025年教师招聘之《小学教师招聘》试卷含完整答案详解【夺冠系列】
- 九一八《勿忘国耻吾辈当自强》班会课件
- 关于卫生院“十五五”发展规划(完整本)
- JG/T 127-2007建筑门窗五金件滑撑
- 国防预算优化路径-洞察阐释
- 2025福建厦门水务集团限公司招聘易考易错模拟试题(共500题)试卷后附参考答案
- 污水排污协议书
- 饲料采购工作总结
- 能源管理培训课件
- 江苏省苏州市2024-2025学年高一上学期期末调研英语试题(解析版)
- 体育赛事直播技术服务合同
- 护理礼仪(第3版) 课件 第四章 护士仪态礼仪
评论
0/150
提交评论