版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、中国国内旅游总花费影响因素分析一、问题提出1、研究问题旅游可以促进人力、物力、资源的优化利用,促进当地的相关产业的发展,解决就业问题,提高经济收益等都是大有裨益的。更重要是随着旅游业的发展,当地人的观念将会发生根本改变,即按照市场需求,组织生产,搞活流通,以信息化取代封闭的传统的生产模式。旅游可以使单一资源产生规模效应,扩大单一资源的产品转化和升级,将市场建在家门口,对外提高当地的影响力。旅游业是现代服务业的重要组成部分,带动作用大。加快旅游业改革发展,是适应人民群众消费升级和产业结构调整的必然要求,对于扩就业、增收入,推动中西部发展和贫困地区脱贫致富,促进经济平稳增长和生态环境改善意义重大,
2、对于提高人民生活质量、培育和践行社会主义核心价值观也具有重要作用。中国旅游业的发展是与改革开放同步进行的。改革开放之前,由于受传统计划体制观念的影响,注重生产轻视消费,旅游被当做一种奢侈品而遭到排斥,同时,国内生活水平普遍较低,对外又采取闭关锁国政策,因此,旅游产业的发展缺乏必要的物质基础和政治条件。改革开放以后,随着中国经济的发展,一方面,国民经济建设需要大量的资金;另一方面,由于对外开放的大门打开,境外游客和资本急于进入中国,从而为中国的旅游业形成创造了良好的内外条件和环境。本文通过对国内旅游总花费的影响因素展开研究,运用建立多元线性回归模型的方法,探讨影响国内旅游总花费的主要因素,并对这
3、些因素进行分析。2、数据来源(1994-2013,国家统计局)y国内旅游总花费(亿元) x1国内生产总值(亿元) x2平均工资(元) x3客运量(万人)x4国内游客(百万人次) x5居民消费价格指数(上年=100)年 份国内旅游总花费(亿元)国内生产总值(亿元)平均工资(元)客运量(万人)国内游客(百万人次)居民消费价格指数(1987年=100)19941023.548197.951201092882524270.419951375.760793.753481172596629396.919961638.471176.659801245357640429.919972112.778973.06
4、4441326094644441.919982391.284402.374461378717695438.419992831.989677.183191394413719432.220003175.599214.693331478573744434.020013522.4109655.2108341534122784437.020023878.4120332.7123731608150878433.520033442.3135822.8139691587497870438.720044710.7159878.31592017674531102455.820055285.9184937.4182
5、0018470181212464.020066229.7216314.42085620241581394471.020077770.6265810.32472122277611610493.620088749.3314045.42889828678921712522.7200910183.7340902.83224429768981902519.0201012579.8401512.83653932695082103536.1201119305.4473104.04179935263192641565.0201222706.2519470.14676938040352957579.720132
6、6276.1568845.25148321229923262594.83、定性分析为了研究国内旅游总花费的影响因素,把国内旅游总花费(亿元)作为被解释变量y,将国内生产总值(亿元)、平均工资(元)、客运量(万人)、国内游客(百万人次)、居民消费价格指数(上年=100)作为解释变量,分别设为x1,x2、x3、x4、x5,假定其多元线性回归模型表示为:y = 0 +1x1 + 2x2 + 3x3 +4x4 +5x5二、相关分析1、 数据基本描述descriptive statisticsmeanstd. deviationn国内旅游总花费(亿元)7.4595e37351.5831520国内生产总值
7、(亿元)2.1715e51.64588e520平均工资(元)2.01e414745.14720客运量(万人)2.0126e68.31668e520国内游客(百万人次) 1.3511e3834.4650320居民消费价格指数(上年=100)4.6773e273.11847202、 相关分析利用散点图、简单相关系数检验被解释变量y和解释变量x1, x2, x3, x4, x5之间的关系。根据散点图可以看出,国内旅游总花费y与国内生产总值x1、平均工资x2、客运量x3、国内游客x4、居民消费价格指数x5成正相关。correlations国内旅游总花费(亿元)国内生产总值(亿元)平均工资(元)客运量(
8、万人)国内游客(百万人次) 居民消费价格指数(上年=100)pearson correlation国内旅游总花费y1.000.974.968.785.986.855国内生产总值x1.9741.000.999.875.996.895平均工资x2.968.9991.000.875.994.891客运量x3.785.875.8751.000.847.814国内游客x4.986.996.994.8471.000.886居民消费价格指数(上年=100)x5.855.895.891.814.8861.000sig. (1-tailed)国内旅游总花费y.000.000.000.000.000国内生产总值x
9、1.000.000.000.000.000平均工资x2.000.000.000.000.000客运量x3.000.000.000.000.000国内游客x4.000.000.000.000.000居民消费价格指数(上年=100)x5.000.000.000.000.000.n国内旅游总花费y202020202020国内生产总值x1202020202020平均工资x2202020202020客运量x3202020202020国内游客x4202020202020居民消费价格指数(上年=100)x5202020202020从相关系数表中可以看出国内旅游总花费y与国内生产总值x1、平均工资x2、国内游
10、客x4的相关系数都在0.9以上,高度相关;国内旅游总花费y与居民消费价格指数x5的相关系数在0.8以上,相关性也很强,国内旅游总花费y与客运量x3的相关系数在0.7以上,具有一定的相关性。所以,国内旅游总花费y与这五个自变量做回归分析是合适的。三、模型建立根据之前建立的模型y = 0 +1x1 + 2x2 + 3x3 +4x4 +5x5 ,利用spss,采用强行进入的方法进行多元线性回归,得到结果如下:1、拟合优度检验model summarybmodelrr squareadjusted r squarestd. error of the estimatechange statisticsd
11、urbin-watsonr square changef changedf1df2sig. f change1.993a.987.982987.66685.987207.735514.000.584a. predictors: (constant), 居民消费价格指数(上年=100), 客运量(万人), 国内游客(百万人次) , 平均工资(元), 国内生产总值(亿元)b. dependent variable: 国内旅游总花费(亿元)从上表可以看出,方程的复相关系数r=0.993,样本决定系数r2=0.987,调整后的样本决定系数为0.982,说明方程拟合优度很好。anovabmodelsum
12、 of squaresdfmean squarefsig.1regression1.013e952.026e8207.735.000aresidual1.366e714975485.806total1.027e919a. predictors: (constant), 居民消费价格指数(上年=100), 客运量(万人), 国内游客(百万人次) , 平均工资(元), 国内生产总值(亿元)b. dependent variable: 国内旅游总花费(亿元)由anova表可知,在0.05的显著性水平下,f值=207.735,p值为0.000,说明回归方程高度显著,x1, x2, x3, x4, x5
13、整体上对y有高度显著的线性影响。回归系数的检验coefficientsamodelunstandardized coefficientsstandardized coefficientstsig.correlationscollinearity statisticsbstd. errorbetazero-orderpartialparttolerancevif1(constant)-2265.0533283.235-.690.502国内生产总值x1.042.038.9341.088.295.974.279.034.001776.155平均工资x2-.653.293-1.310-2.226.04
14、3.968-.511-.069.003364.442客运量x3-.001.001-.117-1.426.176.785-.356-.044.1427.038国内游客x413.1374.1691.4913.151.007.986.644.097.004235.720居民消费价格指数(上年=100)x5-3.9887.094-.040-.562.583.855-.149-.017.1915.241a. dependent variable: 国内旅游总花费(亿元)通过表格,我们看到平均工资x2、国内游客x4的回归检验系数p值小于0.05,通过检验。而常数项、国内生产总值x1、客运量x3、居民消费价
15、格指数x5系数检验p值均大于0.05,未通过检验。4、 残差分析正态性检验根据直方图和正态概率分布图可以看到,残差基本上符合正态性假设。5、残差分析异方差检验correlationsabse国内生产总值(亿元)平均工资(元)客运量(万人)国内游客(百万人次) 居民消费价格指数(上年=100)spearmans rhoabsecorrelation coefficient1.000.158.158.229.156-.008sig. (2-tailed).506.506.332.510.975n202020202020国内生产总值x1correlation coefficient.1581.000
16、1.000*.967*.998*.947*sig. (2-tailed).506.000.000.000n202020202020平均工资x2correlation coefficient.1581.000*1.000.967*.998*.947*sig. (2-tailed).506.000.000.000n202020202020客运量x3correlation coefficient.229.967*.967*1.000.968*.910*sig. (2-tailed).332.000.000.000.000n202020202020国内游客x4correlation coefficie
17、nt.156.998*.998*.968*1.000.941*sig. (2-tailed).510.000.000.000.000n202020202020居民消费价格指数(上年=100)x5correlation coefficient-.008.947*.947*.910*.941*1.000sig. (2-tailed).975.000.000.000.000.n202020202020*. correlation is significant at the 0.01 level (2-tailed).由残差图可知,残差图上的点的散布是随机的,不太有规律;由correlations表可
18、知,残差绝对值与x1, x2, x3, x4,x5的相关系数分别为0.158,0.158,0.229,0.156,-0.08,相应的p值均大于0.05,说明残差绝对值与自变量x1, x2, x3, x4,x5之间显著不相关。故综上所述,不存在异方差。6、自相关性检验model summarybmodelrr squareadjusted r squarestd. error of the estimatechange statisticsdurbin-watsonr square changef changedf1df2sig. f change1.993a.987.982987.66685.
19、987207.735514.000.584a. predictors: (constant), 居民消费价格指数(上年=100), 客运量(万人), 国内游客(百万人次) , 平均工资(元), 国内生产总值(亿元)b. dependent variable: 国内旅游总花费(亿元)从模型汇总表中可知,d.w值为0.584,查d.w表,当n=20,k=5时,dl=0.90,du= 1.83, d.w=0.584dl,且滞后残差图呈正相关关系,所以模型存在正自相关性。7、共线性诊断coefficientsamodelunstandardized coefficientsstandardized c
20、oefficientstsig.correlationscollinearity statisticsbstd. errorbetazero-orderpartialparttolerancevif1(constant)-2265.0533283.235-.690.502国内生产总值x1.042.038.9341.088.295.974.279.034.001776.155平均工资x2-.653.293-1.310-2.226.043.968-.511-.069.003364.442客运量x3-.001.001-.117-1.426.176.785-.356-.044.1427.038国内游客
21、x413.1374.1691.4913.151.007.986.644.097.004235.720居民消费价格指数(上年=100)x5-3.9887.094-.040-.562.583.855-.149-.017.1915.241a. dependent variable: 国内旅游总花费(亿元)collinearity diagnosticsamodeldimensioneigenvaluecondition indexvariance proportions(constant)国内生产总值(亿元)平均工资(元)客运量(万人)国内游客(百万人次) 居民消费价格指数(上年=100)115.6
22、221.000.00.00.00.00.00.002.3454.037.01.00.00.00.00.003.02814.064.01.00.00.56.00.014.00344.309.52.00.00.02.02.935.00168.413.14.00.35.22.46.016.000139.200.331.00.64.20.52.05a. dependent variable: 国内旅游总花费(亿元)由coefficients表可以看出x1,x2,x4的vif值都大于10,所以存在严重的多重共线性。由collinearity diagnostics表可知,自变量x2,x3, x4, x5
23、的条件数均大于10,进一步说明自变量之间存在严重的多重共线性。8、异常值检验年 份sdr_1coo_1lev_11994-0.257820.232881530.9015021995-0.983940.038112580.1407191996-0.636240.018695950.1596921997-0.046431.51e-040.23063419980.0386275.15e-050.11137819990.5248240.005772360.05653220000.9271930.014850420.04305820011.4512980.034677440.04632320021.17
24、93060.042015660.10705920031.3402280.091617820.1943942004-0.147719.20e-040.1405732005-0.480880.007753470.1097542006-1.453380.066534090.1194382007-2.101490.042878970.0175742008-0.766430.032932860.1961192009-0.638430.020775640.1765392010-0.230330.009780430.45771320110.3989540.01716090.32813220122.15846
25、80.860188780.53286520130.9679957.687625980.930002从上表可知,所有数据的删除学生化残差绝对值都小于3,除2013年库克距离都小于0.5,该模型存在异常值。四、模型修改1.全模型存在的问题(1)常数项、国内生产总值x1、旅客运输平均距离x3、居民消费价格指数x5系数检验p值均大于0.05,未通过检验;(2)存在自相关性;(3)自变量之间存在严重的多重共线性;(4)2013年存在异常值。2. 修改利用spss软件采用逐步回归的方式,得到以下结果并加以分析。(1)拟合优度检验variables entered/removedamodelvariable
26、s enteredvariables removedmethod1国内游客(百万人次)x4 .stepwise (criteria: probability-of-f-to-enter = .100).2平均工资(元)x2.stepwise (criteria: probability-of-f-to-enter = .100).a. dependent variable: 国内旅游总花费(亿元)model summarycmodelrr squareadjusted r squarestd. error of the estimatechange statisticsdurbin-watso
27、nr square changef changedf1df2sig. f change1.986a.972.9701269.59516.972619.067118.0002.992b.984.982974.59357.01313.546117.002.711a. predictors: (constant), 国内游客(百万人次) b. predictors: (constant), 国内游客(百万人次) , 平均工资(元)c. dependent variable: 国内旅游总花费(亿元)由model summary表可知,方程的复相关系数r=0.986,样本决定系数为r2为0.972,调整
28、后的样本决定系数为0.970,说明方程拟合程度很好。(2)回归方程显著性检验anovacmodelsum of squaresdfmean squarefsig.1regression9.979e819.979e8619.067.000aresidual2.901e7181611871.858total1.027e9192regression1.011e925.054e8532.053.000bresidual1.615e717949832.628total1.027e919a. predictors: (constant), 国内游客 x4b. predictors: (constant),
29、 国内游客 x4, 平均工资 x2c. dependent variable: 国内旅游总花费 y由anova表可知,在0.05的显著性水平下,f值为532.053,p值为0.000,远小于0.005,所以回归方程高度显著,说明x2、x4整体上对y有高度显著的线性影响。(3)回归系数检验coefficientsamodelunstandardized coefficientsstandardized coefficientstsig.correlationscollinearity statisticsbstd. errorbetazero-orderpartialparttolerancev
30、if1(constant)-4274.271550.449-7.765.000国内游客 x48.685.349.98624.881.000.986.986.9861.0001.0002(constant)-6150.148662.057-9.289.000国内游客 x417.8222.4972.0237.137.000.986.866.217.01286.857平均工资 x2-.520.141-1.043-3.681.002.968-.666-.112.01286.857a. dependent variable: 国内旅游总花费 y由coefficients表可知,常数项、平均工资x2和国内
31、游客x4的回归系数检验的p值均小于0.05,所以通过检验。故综上述,该问题的最小二乘回归模型为:y = -6150.148-0.52x2+17.822x4(4)残差分析正态性检验根据直方图和正态概率分布可以看出,残差基本上符合正态性假设。(5)残差分析异方差性检验correlationsabse平均工资 x2国内游客 x4spearmans rhoabsecorrelation coefficient1.000.195.191sig. (2-tailed).409.420n202020平均工资 x2correlation coefficient.1951.000.998*sig. (2-tai
32、led).409.000n202020国内游客 x4correlation coefficient.191.998*1.000sig. (2-tailed).420.000.n202020*. correlation is significant at the 0.01 level (2-tailed).由残差图可知,残差图上的点的散布是随机的,无任何规律;由correlations表可知,残差绝对值与x2, x4的相关系数分别为0.195,0.191,相应的p值均大于0.05,说明残差绝对值与各自变量之间显著不相关。故综上所述,认为不存在异方差。(6)残差分析自相关性检验model summ
33、arycmodelrr squareadjusted r squarestd. error of the estimatedurbin-watson1.986a.972.9701269.59522.992b.984.982974.5936.711a. predictors: (constant), 国内游客 x4b. predictors: (constant), 国内游客 x4, 平均工资 x2c. dependent variable: 国内旅游总花费 yd.w值为0.711,查d.w表,n=20,k=2,dl=1.20,du=1.41,d.w=0.711dl,模型存在正自相关性,用迭代法
34、解决。通过进一步考察自相关系数,1-1/2d.w=1-0.5*0.711=0.6445。求出相关系数后,做变量变换:yi,= yi-yi-1 ;xi,= xi-xi-1如果方程通过d.w 检验 , 迭代 结 束 , 否 则 , 继续 重 复 上 述 过 程,直到 通过d.w 检验 。(7)多重线性检验coefficientsamodelunstandardized coefficientsstandardized coefficientstsig.correlationscollinearity statisticsbstd. errorbetazero-orderpartialparttol
35、erancevif1(constant)-4274.271550.449-7.765.000国内游客 x48.685.349.98624.881.000.986.986.9861.0001.0002(constant)-6150.148662.057-9.289.000国内游客 x417.8222.4972.0237.137.000.986.866.217.01286.857平均工资 x2-.520.141-1.043-3.681.002.968-.666-.112.01286.857a. dependent variable: 国内旅游总花费 ycollinearity diagnostic
36、samodeldimensioneigenvaluecondition indexvariance proportions(constant)国内游客(百万人次) 平均工资(元)111.8571.000.07.072.1433.600.93.93212.7801.000.01.00.002.2193.564.34.00.003.00240.430.651.001.00a. dependent variable: 国内旅游总花费(亿元)由coefficients表可知,各个自变量的vif均大于10;由collinearity diagnostics表可知,共线性诊断中条件数有一个在40附近。综上
37、述,说明自变量间存在多重共线性。为了消除共线性,接下来我们剔除解释变量x2。(8)异常值检验年 份sdr_2coo_2lev_219940.5288490.0116080.0565331995-1.02550.0776360.1317631996-0.551630.0180730.09595119970.1456120.0010360.07134719980.0293023.78e-050.06069619990.5208680.0094220.04067720000.9824750.0273590.0282220011.4802070.0623180.03366720020.8634140.
38、019980.02338820031.5994350.1690120.127882004-0.515110.0054080.0052732005-0.727470.010970.0070172006-1.812810.0509850.0001552007-2.250040.0794330.0051052008-0.649230.0327510.1337852009-0.903620.06780203056160.0146380.25800120110.1419640.00174305778890.0489420.2469820131.5031
39、60.5277170.379412由上表可知,所有数据的删除学生化残差的绝对值均小于3,库克距离也均小于0.5,故数据不存在异常值。五、模型修改1.模型存在的问题(1)自变量之间仍存在多重共线性;2. 修改剔除解释变量x2,利用spss软件采用逐步回归的方式,得到以下结果并加以分析。(1) 拟合优度检验variables entered/removedamodelvariables enteredvariables removedmethod1国内游客(百万人次)x4.stepwise (criteria: probability-of-f-to-enter = .100).2客运量(万人)x
40、3.stepwise (criteria: probability-of-f-to-enter = .100).a. dependent variable: 国内旅游总花费(亿元)ymodel summarycmodelrr squareadjusted r squarestd. error of the estimatechange statisticsdurbin-watsonr square changef changedf1df2sig. f change1.986a.972.9701269.59516.972619.067118.0002.990b.981.9781084.58337
41、.0097.665117.013.601a. predictors: (constant), 国内游客(百万人次)x4b. predictors: (constant), 国内游客(百万人次)x4, 客运量(万人)x3c. dependent variable: 国内旅游总花费(亿元)y由model summary表可知,方程的复相关系数r=0.986,样本决定系数为r2为0.972,调整后的样本决定系数为0.970,说明方程拟合程度很好。(2)回归方程显著性检验anovacmodelsum of squaresdfmean squarefsig.1regression9.979e819.97
42、9e8619.067.000aresidual2.901e7181611871.858total1.027e9192regression1.007e925.034e8427.975.000bresidual2.000e7171176321.086total1.027e919a. predictors: (constant), 国内游客(百万人次)x4b. predictors: (constant), 国内游客(百万人次)x4, 客运量(万人)x3c. dependent variable: 国内旅游总花费(亿元)y由anova表可知,在0.05的显著性水平下,f值为619.067,p值为0.
43、000,远小于0.005,所以回归方程高度显著,说明x2、x4整体上对y有高度显著的线性影响。(3)回归系数检验coefficientsamodelunstandardized coefficientsstandardized coefficientstsig.correlationscollinearity statisticsbstd. errorbetazero-orderpartialparttolerancevif1(constant)-4274.271550.449-7.765.000国内游客(百万人次)x48.685.349.98624.881.000.986.986.9861.
44、0001.0002(constant)-2916.426679.462-4.292.000国内游客(百万人次)x49.997.5601.13517.849.000.986.974.604.2833.528客运量(万人)x3-.002.001-.176-2.769.013.785-.557-.094.2833.528a. dependent variable: 国内旅游总花费(亿元)y由coefficients表可知,常数项、平均工资x2和国内游客x4的回归系数检验的p值均小于0.05,所以通过检验。故综上述,该问题的最小二乘回归模型为:y = -2916.426-0.002 x3+9.997x
45、4(4)残差分析正态性检验根据直方图和正态概率分布可以看出,残差基本上符合正态性假设。(5)残差分析异方差性检验correlationse客运量(万人)x3国内游客(百万人次)x4spearmans rhoecorrelation coefficient1.000.589*.471*sig. (2-tailed).006.036n202020客运量(万人)x3correlation coefficient.589*1.000.968*sig. (2-tailed).006.000n202020国内游客(百万人次)x4correlation coefficient.471*.968*1.000s
46、ig. (2-tailed).036.000.n202020*. correlation is significant at the 0.01 level (2-tailed).*. correlation is significant at the 0.05 level (2-tailed).由残差图可知,残差图上的点的散布是随机的,无任何规律;由correlations表可知,残差绝对值与x3, x4的相关系数分别为0.589,0.471,相应的p值均大于0.05,说明残差绝对值与各自变量之间显著不相关。故综上所述,认为不存在异方差。(6)残差分析自相关性检验model summarycmodelrr squareadjusted r squarestd. error of the estimatechange statistic
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年可穿戴设备健康监测报告及未来五至十年健康产业报告
- 2026河南郑州市第一〇七高级中学招聘23人备考题库含答案详解【b卷】
- 2026广东河源市消防救援支队第一批政府专职消防员招聘127人备考题库附答案详解【培优】
- 2026年零售业自助结算系统报告
- 哈药集团股份有限公司2026届春季校园招聘备考题库附参考答案详解【考试直接用】
- 2026中国能建中电工程中南院春季校园招聘8人备考题库含完整答案详解【必刷】
- 2026云南昭通鲁甸县卯家湾第二幼儿园招聘6人备考题库及答案详解参考
- 2026北京理工大学事业编制相关岗位招聘备考题库及完整答案详解(考点梳理)
- 2026北京北化化学科技有限公司招聘2人备考题库附参考答案详解(预热题)
- 2026年泰山职业技术学院单招职业适应性测试题库含答案详细解析
- 武汉启瑞药业有限公司及产品介绍
- 2026广东深圳市龙岗区宝龙街道招考聘员14人(2603批次)笔试备考试题及答案解析
- 2026年安徽城市管理职业学院单招职业适应性考试题库附参考答案详解(a卷)
- 2026四川成都传媒集团人力资源服务中心售前工程师、内控法务专员等岗位招聘4人笔试备考试题及答案解析
- 2026北京水务投资集团有限公司招聘9人笔试备考试题及答案解析
- 2026高三二轮复习策略
- 2025年度执法资格模拟试题含答案详解
- 2026届高三历史复习策略与核心考点精讲
- GB/T 46821-2025嵌入式基板测试方法
- 华为合规新管控机制
- 超星尔雅学习通《大学生国家安全教育(中国人民警察大学)》章节测试含答案
评论
0/150
提交评论