【《基于多元线性回归模型的旅游收入影响因素实证分析案例》6300字】_第1页
【《基于多元线性回归模型的旅游收入影响因素实证分析案例》6300字】_第2页
【《基于多元线性回归模型的旅游收入影响因素实证分析案例》6300字】_第3页
【《基于多元线性回归模型的旅游收入影响因素实证分析案例》6300字】_第4页
【《基于多元线性回归模型的旅游收入影响因素实证分析案例》6300字】_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于多元线性回归模型的旅游收入影响因素实证分析案例目录TOC\o"1-3"\h\u12518基于多元线性回归模型的旅游收入影响因素实证分析案例 1105311.1实研究设计 263191.1.1数据来源 2187421.1.2变量定义与描述 2251641.2宁夏回族自治区省数据分析 3241851.2.1数据异常值检测 3320861.2.2相关系数矩阵求解 5270121.2.3强制回归法进行分析 54761.2.4运用逐步回归法分析 8155141.3陕西省数据分析 9291221.1.1数据异常值检测 941131.1.2相关系数矩阵求解 11291811.1.3强制回归法进行分析 11294711.1.4运用逐步回归法分析 1388881.4新疆维吾尔自治区数据分析 15173791.4.1数据异常值检测 15137401.4.2相关系数矩阵求解 17289001.4.3强制回归法进行分析 1872171.4.4运用逐步回归法分析 2059821.5甘肃省数据分析 21130051.5.1数据异常值检测 21279191.5.2相关系数矩阵求解 23159521.5.3强制回归法进行分析 2465041.5.4运用逐步回归法分析 26283501.6青海省数据分析 283331.6.1数据异常值检测 28324061.6.2相关系数矩阵求解 29250341.6.3强制回归法进行分析 30310261.6.4运用逐步回归法分析 32本章将从陕西、甘肃、青海、宁夏、新疆五个省区近十三年的数据入手进行实证分析,从统计层面来求证这些省区旅游经济收入与其他因素的关系及是如何影响旅游收入的。1.1实研究设计1.1.1数据来源考虑到经济活动中数据资料收集的完整性、权威性,本文选取的主要变量数据:旅行社数量、星级宾馆、A级景区数量、人均可支配收入、公路里程、旅客总人数和旅游业从业人数均来自2007~2019年国家统计局的《中国统计年鉴》、各省《国民经济和社会发展公报》、知网中国经济社会大数据研究平台并据此进行各省旅游产业收入综合分析。1.1.2变量定义与描述被解释变量旅游收入:根据旅游经济学的定义,旅游产业收入是国家或地区在一定时期内使用销售旅游服务或商品的方式而获得的所有货币收入。解释变量①旅游机构数量。旅游机构数量是指地区内向民众提供关于旅行、居住和其他相关服务的信息的零售代理机构的数量。②A级景区数量。这里A级景区指全省所做统计A级及A级以上的所有的全部景区。③星级饭店。指设备、设施、服务符合《旅游饭店星级的划分与评定》(GB/T14308-2010)标准,经过有关旅游管理权威部门评定(验收)后授予“星级”称号的饭店。④人均可支配收入。居民可支配收入是居民可用于最终消费支出和储蓄的总和。⑤公路里程。省区境内铁路运营里程与公路运营里程的总和。⑥旅游总人数。在省区内观光游览、度假、探亲访友、就医疗养、购物、参加会议或从事经济、文化、体育、宗教活动的中国(大陆)居民人数,其出游的目的不是通过所从事的活动谋取报酬。⑦旅游业从业人数。国家统计局所统计旅游业从业人数。模型选择在考虑国内旅客数量、城市居民平均旅游支出、乡村居民平均旅游支出、旅客周转量和旅游机构数量这5个因素的基础上,建立多元线性回归模型[21]为Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7式中:Y为旅游经济收入;X1为旅行社数量;X2为星级宾馆数量;X3为A级景区数量;X4为人均可支配收入;X5为公路里程;X6为旅游总人数;X7为旅游业从业人数;β0~β7为各因素的系数。1.2宁夏回族自治区省数据分析1.2.1数据异常值检测图3-1数据异常值检验箱型图由上图可知,旅行社这组数据中12号,13号数据显著高于旅行社的均值,且数据点位于误差线上之上,旅游接待人数同理,13号数据显著高于旅游接待人数均值并位于误差线之上,所以对这三个数据进行丢弃,用spss软件对其进行缺省值处理。图32回归标准化残差的正态P-P图由图3-2可以看出:残差效果较好,所有的点大致都在一条直线上,可认为残差符合正态分布的要求。图3-3各变量间散点图上图所示为自变量与因变量之间的散点图,由图可知:自变量中,旅行社、A级景区、人均可支配收入、公里里程、旅游接待人数等与因变量旅游收入呈线性关系,所以这些数据符合线性相关关系。1.2.2相关系数矩阵求解做出旅游经济总收入即y与其他自变量(x1、x2、x3、x4、x5、x6)之间的相关系数矩阵。表3-1因变量与各自变量的相关系数矩阵由表3-1可知,各自变量与因变量相关因素都较高,其相关性都超过了0.9。于是进行下列强制回归法进行分析。1.2.3强制回归法进行分析拟合优度检验表3-2回归模型摘要由表3-2中可知,复相关系数为1,复决定系数为0.999,调整的复决定系数为0.998,可以认为该模型数据拟合程度很高,被解释变量基本全部可以被模型解释。回归方程的显著性检验表3-3回归模型ANOVA由表3-3可知,F的值为1076.873,p值近似为0,显著水平α为0.05,根据F值计算而来,P<0.05则表明提示因变量和自变量之间存在线性相关最小二乘估计表3-4模型系数由表3-4可以得出回归方程为:y=262.694−1.565∗x1−1.894∗x2−1.476∗x3+0.029∗x4−0.006∗x5−0.057∗x6+0.006∗x7但表中各自变量的显著性不一,当P>0.05时,该自变量在本模型中没有统计学意义,应当在回归模型中删除相应变量;当P<0.05时该变量在模型中具有统计学意义,应当保留。多重共线性诊断表3-5共线性诊断VIF用于共线性诊断(变量之间的关联度);当0<VIF<10时,不存在多重共线性;当10<VIF<100时,说明变量之间存在较强的多重共线性;当VIF>100时,说明变量之间存在严重的多重共线性,在表中,旅行社数量、饭店、就业人数的VIF值都超过了10且小于100,说明这些变量之间存在较强的多重的共线性,景区、人均可支配收入、公路里程、旅游人数VIF值都超过了100,甚至人均可支配收入VIF值为441.672,说明这些变量之间存在很严重的多重共线性。1.2.4运用逐步回归法分析拟合优度检验表3-6模型摘要由表3-6中可以看出,调整后的R方0.986,即总体自变量对因变量的解释程度达到98.9%,拟合效果很好,说明模型趋于稳定,所以可以认为本此拟合效果很好,各观测值具有相互独立性。显著性检验表3-7逐步回归ANOVOA由表3-7得到,F=625.941,p<0.001,因此应该拒绝原假设,认为回归模型通过了置信水平为0.05的F校验,即该拟合方程具有统计学意义。最小二乘估计表3-8逐步回归分析结果表由表3-8可以得出宁夏回族自治区的旅游收入的回归方程为:y=−28.937+0.097∗x61.3陕西省数据分析1.1.1数据异常值检测图3-4数据异常值检验箱型图由图3-4箱型图可知,所有数据都处于正常范围内,无异常值。图3-5回归标准化残差的正态P-P图由图3-5可以看出:所有数据分布大致都在一条直线上,可认为残差符合正态分布的要求图3-6各变量间散点图上图所示为自变量与因变量之间的散点图,由图可知:自变量中,旅行社、A级景区、人均可支配收入、旅游接待人数等与因变量旅游收入呈线性关系,所以这些数据符合线性相关关系。1.1.2相关系数矩阵求解做出旅游经济总收入即y与其他自变量(x1、x2、x3、x4、x5、x6)之间的相关系数矩阵。表23-9因变量与各自变量的相关系数矩阵由表3-9可知,各自变量与因变量相关因素都较高,其相关性都超过了0.9,只有变量x6较低为0.628,因此可以进行强制回归分析。1.1.3强制回归法进行分析拟合优度检验表3-10模型摘要由表3-10中可知,复相关系数为1,复决定系数为0.999,调整的复决定系数为0.998,可以认为该模型数据拟合程度很高,被解释变量基本全部可以被模型解释。回归方程的显著性检验表3-11回归ANVOA由表3-11中可知,F的值为787.902,p值近似为0,显著水平α为0.05,由于p小于α,所以可以认为被解释变量与解释变量全体的线性是显著的。最小二乘估计表3-12回归系数表由表3-12中可以得出回归方程为:y=52.748−1.201∗x1−0.668∗x2−0.344∗x3+0.072∗x4−0.019∗x5−0.007∗x6+0.580∗x7但表中各自变量的显著性不一,只有旅游总人数通过检验,显著性为0.05,所以该回归效果不好。多重共线性诊断表3-13自变量共线性诊断在表3-13中,旅行社数量、饭店、就业人数的VIF值都超过了10且小于100,说明这些变量之间存在较强的多重的共线性,景区、人均可支配收入、公路里程、旅游人数VIF值都超过了100,甚至人均可支配收入VIF值为316.638,说明这些变量之间存在很严重的多重共线性。1.1.4运用逐步回归法分析拟合优度检验表3-14逐步回归模型摘要由表3-14中可以看出,R原为0.993,调整后的R方0.985,即总体自变量对因变量的解释程度达到98.5%,拟合效果很好,说明模型趋于稳定,所以可以认为本此拟合效果很好,各观测值具有相互独立性。显著性检验表3-15逐步回归ANOVA由表3-15得到,F=782.237,p<0.001,因此应该拒绝原假设,认为回归模型通过了置信水平为0.05的F校验,即该拟合方程具有统计学意义。最小二乘估计表3-16逐步回归分析结果表由表3-16中可以得出陕西省旅游收入的回归方程[13]为:y=−591.009+0.103∗x61.4新疆维吾尔自治区数据分析1.4.1数据异常值检测图3-7数据异常值检验箱型图由箱型图可知,旅游收入中的12号数据显著高于旅游收入的均值,在误差线之外,旅行社这组数据中13号数据显著高于旅行社的均值,且数据点位于误差线上之上,旅游总人数同理,13号数据显著高于旅游接待人数均值并位于误差线之上,所以对这四三个数据进行丢弃,用spss软件对其进行缺省值处理。图3-8回归标准化的正态P-P图由图3-8可以看出:所有数据分布大致都在一条直线上,可认为残差符合正态分布的要求。图3-9变量散点图上图所示为自变量与因变量之间的散点图,由图可知:自变量中,A级景区、人均可支配收入、公里里程、旅游接待人数等与因变量旅游收入呈线性关系,所以这些数据符合线性相关关系。1.4.2相关系数矩阵求解做出旅游经济总收入即y与其他自变量(x1、x2、x3、x4、x5、x6)之间的相关系数矩阵。表3-17因变量与各自变量的相关系数矩阵由表3-17可知,自变量中旅行社、A级景区、人均可支配收入、公路里程以及旅游总人数与旅游收入的相关性0.6以上,星级宾馆与旅游收入的相关性只有0.180,而旅游业从业人数与旅游收入的相关系数为-0.763,呈负相关关系。剔除相关性低的自变量进行强制回归分析。1.4.3强制回归法进行分析拟合优度检验表3-18回归模型摘要由表3-18中可知,复相关系数为1,复决定系数为0.999,调整的复决定系数为0.998,可以认为该模型数据拟合程度很高,被解释变量基本全部可以被模型解释。回归方程的显著性检验表3-19回归ANVOA由表3-19可知,F的值为1071.959,p值近似为0,显著水平α为0.05,由于p小于α,所以可以认为被解释变量与解释变量全体的线性是显著的。最小二乘估计表3-20强制回归方程分析结果由表3-20可以得出回归方程为y=−832.549+0.173∗x2−0.954∗x3+0.049∗x4−0.024∗x5+33.86∗x6+0.16∗x7但表中各自变量的显著性不一,显著性表示自变量对因变量的影响程度,小于0.05表示自变量对因变量有显著影响,越小则影响越大。表中只有x2、x4、x5、x6通过了回归系数的显著校验,其显著性都小于0.05,所以该回归效果不好。多重共线性诊断表3-21自变量共线性诊断表3-21中,旅行社数量、饭店、就业人数的VIF值都超过了10且小于100,说明这些变量之间存在较强的多重的共线性,景区、人均可支配收入、公路里程、旅游人数VIF值都超过了100,甚至人均可支配收入VIF值为1840.198,说明这些变量之间存在很严重的多重共线性。1.4.4运用逐步回归法分析拟合优度检验表3-22逐步回归模型摘要由表3-22中可以看出,调整后的R方0.995,即总体自变量对因变量的解释程度达到99.5%,拟合效果很好,说明模型趋于稳定。所以可以认为本此拟合效果很好,各观测值具有相互独立性。显著性检验表3-23逐步回归ANOVA由表3-23得到,F的值为1737.563,p值近似为0,显著水平α为0.05,根据F值计算而来,P<0.05则表明提示因变量和自变量之间存在线性相关最小二乘估计表3-24逐步回归分析结果表由表3-24可以得出新疆维吾尔自治区的旅游收入的回归方程为:y=271.676+0.186∗x6−1.164∗x41.5甘肃省数据分析1.5.1数据异常值检测图3-10数据异常值检验箱型图由箱型图可知,该组所有数据不存在异常值。图3-11回归标准化残差的正态P-P图由图3-11可以看出:残差效果较好,所有数据分布大致都在一条直线上,可认为残差符合正态分布的要求。图3-12各变量散点图上图所示为自变量与因变量之间的散点图,由图可知:自变量中,旅行社、A级景区、人均可支配收入、旅游接待人数等与因变量旅游收入呈线性关系,所以这些数据符合线性相关关系。1.5.2相关系数矩阵求解做出旅游经济总收入即y与其他自变量(x1、x2、x3、x4、x5、x6)之间的相关系数矩阵。表3-25因变量与各自变量的相关系数矩阵由表3-25可知,各自变量与因变量相关因素都较高,其相关性都超过了0.9,只有与变量x6较低为0.6281.5.3强制回归法进行分析拟合优度检验表3-26回归模型摘要由表3-26中可知,复相关系数为1,复决定系数为0.999,调整的复决定系数为0.998,可以认为该模型数据拟合程度很高,被解释变量基本全部可以被模型解释。回归方程的显著性检验表3-27强制回归ANOVA由表3-27可知,F的值为787.902,p值近似为0,显著水平α为0.05,由于p小于α,可以认为被解释变量与解释变量全体的线性是显著的。最小二乘估计表3-28强制回归方程分析结果由表3-28可以得出回归方程为y=52.748-1.201*x1-0.668*x2-0.344*x3+0.072*x4-0.019*x5-0.007*x6+0.580*x7但表中各自变量的显著性不一,显著性表示自变量对因变量的影响程度,小于0.05表示自变量对因变量有显著影响,越小则影响越大。表中只有x2、x4、x5、x6通过了回归系数的显著校验,其显著性都小于0.05,所以该回归效果不好。多重共线性诊断表3-29自变量共线性诊断表3-29中,旅行社数量、饭店、就业人数的VIF值都超过了10且小于100,说明这些变量之间存在较强的多重的共线性,景区、人均可支配收入、公路里程、旅游人数VIF值都超过了10,甚至人均可支配收入VIF值为257.795,说明这些变量之间存在很严重的多重共线性。1.5.4运用逐步回归法分析拟合优度检验表3-30逐步回归模型摘要由表3-30中可以看出,调整后的R方0.996,即总体自变量对因变量的解释程度达到99.6%,拟合效果很好,说明模型趋于稳定,所以可以认为本此拟合效果很好,各观测值具有相互独立性。显著性检验表3-31逐步回归ANOVA由表3-31得到,p<0.001,F的值为1076.873,p值近似为0,显著水平α为0.05,根据F值计算而来,P<0.05则表明提示因变量和自变量之间存在线性相关最小二乘估计表3-32逐步回归分析结果表由表3-32可以得出甘肃省的旅游收入的回归方程为:y=294.820+0.074∗x6−1.197∗x31.6青海省数据分析1.6.1数据异常值检测图3-13数据异常值检验箱型图由图3-13箱型图可知,旅游社中的12号,13号数据在误差线之外,旅游总人数同理,1号数据显著高于旅游接待人数均值并位于误差线之上,所以对这四三个数据进行丢弃,用spss软件对其进行缺省值处理。图3-14回归标准化残差的正态P-P图由图3-14可以看出:残差效果较好,所有数据分布的点大致都在一条直线上,可认为残差符合正态分布的要求。图3-15变量间散点图上图所示为自变量与因变量之间的散点图,由图可知:自变量中,旅行社、A级景区、人均可支配收入、旅游总人数,公路里程等与因变量旅游收入呈线性关系,所以这些数据符合线性相关关系。1.6.2相关系数矩阵求解做出旅游经济总收入即y与其他自变量(x1、x2、x3、x4、x5、x6)之间的相关系数矩阵。表3-33因变量与各自变量的相关系数矩阵由表3-33可知,各自变量与因变量相关因素都较高,其相关性都超过了0.9。1.6.3强制回归法进行分析拟合优度检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论