【毕业学位论文】(Word原稿)中国快速公交系统(BRT)运营能力的实证研究——基于主成分回归模型的实证分析-统计教育学_第1页
【毕业学位论文】(Word原稿)中国快速公交系统(BRT)运营能力的实证研究——基于主成分回归模型的实证分析-统计教育学_第2页
【毕业学位论文】(Word原稿)中国快速公交系统(BRT)运营能力的实证研究——基于主成分回归模型的实证分析-统计教育学_第3页
【毕业学位论文】(Word原稿)中国快速公交系统(BRT)运营能力的实证研究——基于主成分回归模型的实证分析-统计教育学_第4页
【毕业学位论文】(Word原稿)中国快速公交系统(BRT)运营能力的实证研究——基于主成分回归模型的实证分析-统计教育学_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国快速公交系统( 营能力的实证研究 基于主成分回归模型的实证分析 广东外语外贸大学 目录 摘要 . 1 一、研究背景 . 2 二、研究现状 . 3 外研究现状: . 3 内研究现状: . 3 究 目的及意义 . 4 三、创新之处及指标选择 . 5 新之处 . 5 标的选择 . 5 四、 营能力模型探究 . 7 元线性回归模型 . 7 立模型 . 7 计意义检验 . 8 济意义检验 . 8 重共线性检验 . 9 服多重共线性的方法 . 10 型的不足 . 11 步回归模型 . 11 出最 简单的回归形式 . 11 步回归 . 12 型的结论 . 13 型的不足 . 13 五、基于主成分回归的计量模型 . 14 成分回归方法论 . 14 成分回归概念 . 14 本原理与计算方法 . 14 立模型 . 16 1 计意义检验 . 20 原一般回归方程 . 20 型总结 . 21 峰时期平均运营车速的计量模型分析 . 22 型总结 . 23 六、结论及建议 . 24 参考文献 . 26 摘要 快速公交系统( 其快速、高效、高容等特点受到诸多城市的青睐,因而将其作为解决城市公共交通问题的革新 性方案。同时能够对一个系统的质量好坏进行评价也是必要的环节。 统的运营速度和载客量对 统运营功能的发挥起着关键性作用。同时,由于 统处于高峰时段的运行状态是评价 统质量好坏的重要条件,于是我们通过对全国已建设好 统的城市高峰载客量和高峰平均运营车速进行实证性研究,运用主成分回归模型深入分析与这两方面相关的影响因素。最后利用得到的主成分线性回归方程不仅可以了解各个因素所起的作用,还可以了解各个 统的高峰载客量和平均车速,从而为已建设好的 统的改进和优化提出意见和建议, 也可以为即将建设统的城市提供参考。 关键词: 快速公交 营车速 载客量 实证性研究 回归方程 2 一 、研究背景 快速公交系统 (称巴士快速交通,它结合轨道交通的运营模式及常规交通的自身特点,采用先进的公交车辆和优良的服务设施,通过专用道路空间并配合智能交通技术为广大乘客提供舒适、便捷、高效、优质的服务,是一种高品质、高规格、高效率、低能耗、低污染、低成本的公共交通形式。它既具备了轨道交通高容、快速的固有特点 ,又保持了常规公交灵活、经济的传统优势 , 是提高交通运输效率、解决交通拥挤、减少交通污染、降低建设投资、缩短建设周期的有效途径。 自 1974年巴西库里蒂巴 (成世界上第一条快速公交线以来 , 各种类型的快速公交系统在国际间得到广泛的应用 , 快速公交系统正在开创城市公共交通大容量、低成本、环保型的新时代 , 并逐渐成为全球城市公共交通业的发展方向。国外实践证明,快速公交系统能够满足公共交通可持续发展的要求,是提高公共交通服务质量和服务水平的优选方式之一。国际能源机构 (联合国人居署 (世界银行 (及国际公共交通联合会 (国际组织,都将其作为解决城市公共交通问题的革新性方案并积极向世界各大城市推荐。 我国城市交通现状并不乐观,随着社会经济的迅猛发展、城市化进程的不断加快以及城市人口的持续增长,巨大的交通需求与有限的交通供给之间的矛盾更加突出。我国城市公共交通目前存在诸多问题,突出表现在两个方面:一是常规公交系统普遍存在行驶速度慢、延误时间长、不能保证准时性、乘坐与换乘不便、舒适度较差等问题,导致其服务质量和服务水平很低,难以满足人民群众出行的需要;二是轨道交通系统以其快速、高 效、高容等特点受到诸多城市的青睐,然而其高昂的建设投资和运营成本又是政府决策者们必须认真考虑的问题。 2005 年 9 月 23 日国务院办公厅转发建设部等部门 关于优先发展城市公共交通意见的通知(国办发 200546 号 ) 中提出“适度发展大运量快速公共汽车系统 ” ,由此揭开了快速公交系统 (我国发展的序幕 ;2007 年 6 月 3 日国务院关于印发节能减排综合性工作方案的通知(国办发 200715号中又提出“优先发展城市公共交通加快城市快速公交和轨道交通建设” , 把优先发展公共交通 3 尤其是发展快速公交和轨道交通作 为全国节能减排的一项重要工作和措施。 当前,我国快速公交系统建设还处于起步阶段,研究符合我国城市特色的快速公交系统理论迫在眉睫。 二、 研究现状 外研究现状: 美国于 20 世纪 30 年代首先提出了快速公交系统的有关概念。国外对快速公交系统的研究与应用是在城市化的实践过程中不断完善的,并与土地使用的发展模式紧密相关,其研究过程大致可分为以下几个阶段。 1. 1930 年 1975 年 对快速公交系统的设想与早期研究阶段 这一阶段的设想与探索以美国为代表,美国快速公交系统的研究基于对高速公路功能 的深刻认识与结合利用,其服务的对象在相当长的时间内主要针对城市外围中低人口密度的地区,并更多关注于快速公交系统设施方面的问题。 1990 年 快速公交系统实践及其与土地使用相衔接的理论研究阶段 20 世纪 70 年代中后期,美国等发达国家将研究精力由基于高速公路的快速公交系统和立体式的轨道交通系统转向高承载车辆 (道和轻轨交通上,普遍认为快速公交系统无法达到轨道交通系统在客流吸引和外在形象方面的优势。而拉美的许多发展中国家城市则结 合自身的特点,开始建立以 骨架的公共交通系统。 至今 与 式相结合的快速公交系统全面发展和推广阶段 自 20 世纪 90 年代初开始,随着拉美快速公交系统的成功应用,在世界范围内掀起了建设、研究快速公交系统并将其纳入城市公共交通体系的热潮。这个阶段主要体现了三个方面的特点: (1)与公共交通引导城市发展 ( 式的进一步结合。 (2)充分体现了快速公交系统的灵活性和多样性。 (3)通过高新技术的应用进一步提高快速公交系统运载能 力。 内研究现状: 国内对快速公交系统的研究大体上可分为两个相互交错的阶段。 2002 年 快速公交系统的概念引入和理论研究的萌芽阶段 在这一时期,随着快速公交系统在世界范围内的发展和推广,引起了国内交 4 通界的关注和重视,也有很多介绍国外快速公交系统发展历史与实践经验的文章公开发表。在理论探索方面,国内首先开展的是对公交专用道的引入和研究。 至今 快速公交系统的深入研究和技术推广与实践阶段 在这一时期 , 国内对快速公交系统的理论研究可分为三个层面:( 1)在交通 战略层面有关城市公共交通模式和快速公交发展对策的研究;( 2)在交通规划层面有关快速公交系统具体规划问题的研究;( 3)在技术实施层面有关快速公交系统实施和建设的研究。目前 , 国内对快速公交的认识逐步得到统一并将其视为提供高效服务的“绿色交通”系统和缓解城市交通供需矛盾的有效手段有关快速公交系统的理论研究正在深入展开。 目前,国内对快速公交的认识逐步得到统一,并将其视为提供高效服务的“ 绿色交通 ” 系统和缓解城市交通供需矛盾的有效手段,有关快速公交系统的理论研究正在深入展开。现在已经在北京、广州、杭州、常州、厦门、 济南、昆明等十多个城市践行了快速公交系统,一定程度上改善了交通状况,促进经济发展。 究目的及意义 在过去的 10 年中,中国的公交优先战略首先体现在大力发展轨道交通上,并经历了从地铁到轻轨的逐步转变,在世界诸多城市建设快速公交系统的大力影响和我国相关政策的有力推动下,国内交通界和各大城市开始把快速公交系统推到了缓解城市交通压力的前台,但如何在中国特定的城市交通环境中,实施 “公交优先 ”战略并取得良好的效果,是具有重大现实意义的课题。快速公交是落实“公交优先 ”政策的最高形式,它的核心理念是将城市有限的道路 资源,优先分配给人均道路使用效率更高的公共交通,以确保公共交通的服务水平,吸引更多的出行者采用公共交通方式出行。 尽管国外在快速公交系统领域已经取得了大量的研究成果和丰富的运营经验,但由于国内外环境条件和交通特点存在诸多差异,当前 , 我国快速公交系统建设还处在起步阶段 , 研究符合我国城市特色的快速公交系统理论迫在眉睫。加上传统的有关 研究仍旧停留在理论研究阶段,缺乏一定的数据支持,我们的研究正是希望找出影响 营效果的一些重要变量,例如:车站数量、车站平均间距、车速、高峰载客量等进行分析,构建出模 型,最终可以对 统进行量化的分析,评价出该系统的好坏与否,并且据此提出相应的改进方案,提高 5 运营能力。 快速公交系统在我国的发展前景极为广阔,实施和推动符合我国城市特色的快速公交体系提高公交服务水平 , 提高居民出行质量对缓解当前城市交通问题 ,促进城市交通的可持续发展具有重要意义。积极开展快速公交系统的相关理论研究 , 是保证其充分发挥效益的关键节 ,也是实现城市快速公交体系过程中最重要的一项基础性工作。本文是通过实证性研究,通过对数据的分析可视化得给出一个系统的评价标准, 指出现存 统存在的不足,为完善 各城市的 统提出建议,由点到面,也为以后建设 三 、创新之处 及指标选择 新之处 研究角度的创新: 通过对在中国全文期刊数据库中搜索到的有关 统文章的分析,我们发现前人的文章大多是停留在对整个 统好坏的评价的层次上,而且大多是论述性的文章,缺乏必要的数据支撑。而我们是从影响 助具体数据,运用主成分分析法等统计方法来研究各个因素对整个统的影响,同时,综合评价各个城市 统,研究得出实施情况较好的城市, 给未建设 统的城市提供借鉴的方向。 研究类型的创新: 现阶段的关于 统的研究论文大多是集中在理论探讨上的论述性文章,用数据加以分析的较少,我们主要是用具体的数据来深入研究各个因素对 究的可信度较高。 研究方法的创新 : 采用主成分分析分析、综合运用描述统计与推断统计手段进行深入分析。 研究结果的创新: 我们此次的研究论文可以给还未建造 统的城市提供借鉴的经验,使各城市在建造 统时可以更加全面考虑影响 统的各大因素,具有实用性。 标的选 择 6 高峰载客量( Y ) 高峰载客量指的是 统处于高峰时段,单向运营每小时能够缓解客流人数。它既是 统的车辆在高峰时段缓解客流量的影响指标,也是高峰时段运营能力的体现。在黄金假期里,我们常常听到 诸如此类的报告 :“ 载客量是普通列车 2 倍 ” 、“ 今年春运期间的载客量可能比去年增长 客流吞吐量可能突破 40 万 ”等 ,同时,在交通报告中也频繁出现“客流量”等词语,这无疑可以看出 人们往往从载客量来评价地铁、公交、火车等交通工具的运行能力,尤其在 高峰时间段,乘客相对比较多,此时如果公交系统载客量大则表明舒缓乘客积聚的效果越好。因此,我们提取了高峰载客量作为评价一个 统好坏的一个决定性指标,而且也是其他因素的因变量。 市中心高峰时段平均运营车速 (Z) 高峰平均运营车速指的是 统处于高峰时段时,其车辆的平均运营速度。随着社会的发展,现代的交通工具都是把车速放在一个极为重要的位置。提高车速,是如今交通工具一项重要技术。在符合规定内,车速越快,单位时间内缓解客流量的能力也就越强。对于 统来说,高峰时段平均运营车速不仅是其缓解客流量能力的指 标,也是其运营效率的体现。因此,我们提取高峰时段的车速作为评价一个 统好坏的决定性指标。 市中心高峰时段的车辆数(1X) 市中心高峰时段车辆数是一条 道容纳能力的体现。 道容纳能力越强,能够同时运行的车辆数越多,缓解客流量的能力也就越强。 专业车道长度(2X) 专用车道越长,则 速将会越快,载客量越多;专用车道越短,则 客量越少。 走廊包括与社会交通混 行部分的总长度 (3X) 一般来说,走廊包括与社会交通混行部分的总长度越长,车速越快;走廊包括与社会交通混行部分的总长度越短,车速越慢。 车站数量 (4X) 车站数量越多,则部分市民步行到车站的距离会越短,步行时间变短,因而 7 可以增加乘客的吸引量;反之,车站越少,部分大众由于车站距离太远而放弃乘坐 辆,乘客量会因此而减少。 车站平均间距 (5X) 车站的间距越小,则车站数量会越多,轨道交通的造价就越高;车站间距增大,车站数量就可以减少,车站数量就可以减少,车站造价就可以节省。然而,车站距离缩短会降低运营速度,进而增加线路上运营的车辆数,还会因频繁地停车而增加电能消耗、轮轨磨损等,增加运营费用。 公交走廊内、外运营的公交路线总数量(6X) 公交走廊内、外运营的公交路线总数量越大,其载客量越大,运营车速越小 只在封闭公交走廊内运营的公交线路数量(7X) 一般来说,只在封闭公交走廊内运营的公交线路数越多,载客量和运营车速都较大。 据来源 本文所有的数据都来源于 中国快速公交 息和地图信息网站,并选取了北京,重庆,大连,广州,杭州,合肥,济南,昆明,厦门,郑州、常州等11 个城市关于 统的数据资料。 网址 : 、 营能力模型探究 元线性回归模型 立模型 样本数据表 城市 名称 Y (人 /小时 /单向) 1X(小时 /单向) 2X(千米) 3X(千米) 4X(个) 5X(米 ) 6X(个 ) 7X (个 ) 北京 3800 50 4 59 940 0 4 8 重庆 600 16 6 1440 0 1 大连 5800 75 9 3 1140 3 1 广州 27400 350 6 880 40 1 杭州 6800 67 0 1100 9 2 合肥 2900 60 5 14 980 3 0 济南 3300 40 6 760 5 1 昆明 3500 120 3 500 4 3 厦门 7900 90 1 40 1300 0 3 郑州 5600 52 8 800 11 1 常州 7400 77 41 1 900 5 3 (数据来源: ) 利用被解释变量 Y 和其他 5 个解释变量,用最小二乘法建立多元回归模型: Y =1X +2X +3X 4X 5X +6X +X+整为: 2R = F = P 值 = 统计意义检验 F 检验的 P 值明显小于 见解释变量和被解释变量的整体线性关系显著, 2R =明 7 解释 变量共解释了 94.被解释变量的方差,模型拟合效果较好。方程中各变量1X、2X、3X、4X、5X、6X、7t 值分别为 了6X=于临界值 中显著性水平为 由度为 10),其他均小 明解释变量间有可能存在多重共线性。 为 其中 k=7, n=10),即 2 故随机干扰项不存在序列相关。 济意义检验 市中心高峰时段的车辆数 越多,即 某一时段高峰时段的车辆数越多,能够容 9 纳的乘客理所当然的就越多,高峰载客量越大。 故高峰载客量与 市中心高峰时段的车辆数成正相关,方程中的系数为正,符合现实意义。 同理, 若专用车道总长度越长,将会承载的乘客数也会越多,即载客量越大,相应的走廊包括与社会交通混行部分的总长度对与载客量的影响也是相同的道理;公交路线总数量越多,意味着同一时间内运行的公车数就越多,那么能够搭乘的乘客数也就越多,故公交走廊内、外运营的 公交路线总数量和只在封闭公交走廊内运营的公交线路数量与载客量之间亦呈正相关。从以上角度分析说明这个方程就具有现实意义的。 而对于 车站的数量,如果数量越多,意味着相同的时间内在不考虑速度的前提下,停靠的站点对多,那么可以搭载的乘客数量就越多,故载客量增加;车站平均间距是保证车速的前提,如果站点之间的间距较小,意味着车的速度要经常改变,处在不稳定的状态,在一定的时间内所能承载的乘客数就会减少,因此车站平均间距与载客量之间也是正相关的关系;然而,方程中在这两方面的系数都为负,不符合现实意义。 造成方程中变量的系数 与现实经济意义不符有两种可能: 第一, 数据收集的偏误。本文只收集到了全国 11个城市的数据,数据量不大,不符合大样本的特征,故模型很容易受到其他因素的影响,造成模型的偏误。 第二, 解释变量间存在多重共线性。如果模型中两个解释变量具有线性相关,那么这两个解释变量前的参数并不反映各自与被解释变量之间的结构关系,而是反映他们对被解释变量的共同影响,所以各自的参数已经失去了应有的经济含义,于是经常出现反常的现象。经验告诉我们,在多元线性回归模型的估计中,如果出现参数估计值的经济意义明显不合理的情况,应该首先怀疑是否存在多重共线性 。 重共线性检验 从表 2的相关矩阵可以看出, 公交走廊内、外运营的公交路线总数量 和 市中心高峰时段的车辆数 的相关系数为 走廊包括与社 ,会交通混行部分的总长度和 车站数量 的相关系数为 只在封闭公交走廊内运营的公交线路数 量 和 走廊包括与社会交通混行部分的总长度 的相关系数为 可见变量间存在较高的相关性。这是造成模型失效的主要原因, 故有必要采用新的模型估计方法。 10 表 2: 相关系数矩阵 1X 2X 3X 4X 5X 6X 7X 1 服多重共线性的方法 克服多重共线性的方法主要有以下三种方法: 第一、直接排除引起共线性的变量。找出引起多重共线性的被解释变量,将它排除出去,是最为有效地克服多重共线性问题的方法。但是,需要特别注意的是,当排除了某个或某些变量后,保留在模型中的变量的系数的经济意义将发生变化,其估计也将发生变化。 第二、差分法。采用各个变量的差分值作为模型的变量,将原模型变换为差分模型,可有有效地消除存在于模型中的多重共线性。因为在时间序列中 ,增量之间的线性关系远比总量之间的线性关系弱一些。 第三、减小参数估计量的方差。多重共线性的主要后果是参数估计量具有较大的方差。若采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,却能消除多重共线性造成的后果。 本文如果采用差分法,各变量包含的信息将不再是原始变量的信息,做出来的模型也不能很好地解释高峰载客量;另外,虽然减小参数估计量的方差的方法能够使得参数估计量有效,使得变量的显著性检验不再失效,但是不能改变参数的估计值,而本模型中,各变量的参数估计值已经违背高峰载客量的客观情况,所以也不 适宜采用。 同理, 该模型 对运营车速 影响因素也同样不适合。 11 型的不足 由相关系数相关矩阵可知,变量间存在较高的相关性,导致模型失效;同时,即使采用差分法克服多重共线性,各变量包含的信息将不再是原始变量的信息,做出来的模型也不能很好地解释高峰载客量。 本文将尝试采用逐步回归的方法,根据模型拟合优度的变化,来提出造成模型多重共线性的变量。 步回归模型 出最简单的回归形式 分别作 Y 与1X、2X、3X、4X、5X、6X、7 ( 1)16 6 . 7 8 1 7 5 . 9 8 5 ( ( 2R = 2)26 4 4 0 . 7 2 0 1 3 . 7 9 0( ( 2R = 3)37 7 5 0 . 7 7 7 2 7 . 0 2 5( ( 2R = 4)47 9 6 8 . 1 6 9 3 0 . 9 2 9( ( 2R = 5)59 7 8 7 . 4 5 2 3 . 0 4 1( ( 2R = 6)62 5 4 1 . 3 3 6 5 8 8 . 0 6 6( ( 2R = 12 ( 7)77 8 0 2 . 3 2 6 5 4 1 . 2 7 9( ( 2R = 见,市中心高峰时段的车辆数对高峰载客量的影响最大,因此,选( 1)作为初始的回归模型。 步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程,如表 3表3: 解释变量导入表 C 1X 2X 3X 4X 5X 6X 7X _2R 1()Y f X 值 16( , )Y f X X 值 51( , )Y f X X 值 14( , )Y f X X 值 12( , )Y f X X 值 17( , )Y f X X 值 13( , )Y f X X 值 分析: 第一步,在初始模型中引入6X,模型拟合优度提高,但6t 13 检验。 第二步,去掉6X,引入1X,模型拟合优度提高,但1t 检验 第三步,去掉1X,引入4X,模型拟合优度有所提高,但4验 第四步,去掉4X,引入2X,模型拟合优度有所提高,但2验 第五步,去掉2X,引入7X,模型拟合优度有所提高,但7验 第四步,去掉7X,引入3X,模型拟合优度有所提高,但3验 经过上面的逐步回归可知,2X7X、都是多余的。因此最终的出口函数应以1()Y f X为最优,拟合结果如下: 16 6 . 7 8 1 7 5 . 9 8 5 ( ( 2R = 型的各解释变量的参数均符合现实意义,且都通过 t 检验,而且拟合优度为 明解释变量解释了 被解释变量的方差,拟合效果较好。 说明随机干扰项不存在 1 阶自相关。 型的结论 模型显示,影响影响高峰载客量因素仅有“市中心高峰时段的车辆数”,而且高峰时段的车辆数每增加 100 辆,高峰时段载客量增加 整数为7665 人 /小时 /单向。 型的不足 本模型仅仅包含了一个影响因素,显然不符合现实的实际情况,这种偏误很有可能是由于数据量过小造成的。所以虽然模型的拟合效果很好,且参数都通过 14 t 检验,但依然不能很好的拟合现实情况,所以有必要在消除多重共线性的基础上,对由于数据量过小造成的偏误进行修正,从而保 留更多的有效变量。 为此,本文引入主成分回归法,对模型的多重共线性进行修正,并且尽量保留变量。 五 、基于主成分回归的计量模型 成分回归方法论 成分回归 概念 主成分分析法是一种数学变换的方法 , 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,n 个变量就有 n 个主成分。 其目的是希望用较少的变量去 解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。每个主成分都是所有变量的线性组合,其表达式为: 1 1 1 2 2 a X a X a X 2 1 1 2 2 X X 1 1 2 2n n X X 其中为n 个主成分, 为各个变量前的系数。 由于主成分之间具有较好的独立性,并且每个主成分都是所有变量的线性组合,故如果将主成分分析和多元线性回归结合,不仅能够很好地解决多重共线性的问题,而且能够很好地保留变量的信息。 本原理与计算方法 第一步:将解释变量和别解释变量标准化 1)和式 (2) 。 15 _ ( ) / X S( 1) _ ( ) / Y S( 2) 第二步:用 n 个标准化后的自变量进行主成分分析 及各主成分的累计方差百分比。并根据累计方差百分比选择主成分的个数。 第三步:用得到的主成分矩阵中值和主成分的特征值计算,各个主成分下,各变量的系数,计算公式如下: / ( )i i rc b s q r f ( 3) 其中r 个主成分下,第 i 个变量前的系数,r 个主成分下,第 i 个变量的的因子载荷, 第 r 个主成分的特征值。 第四步:用得到的各主成分下,各个变量的系数,计算出各个主成分的值,计算 公式如下: 1 1 2 2r n nF c X c X c X ( 4) 第五步:从累计方差百分比 85%所包括的主成分开始建立标化主成分回归方程,再向后逐步增加主成分个数 ,得到 m 个标化主成分回归方程: ,(j=1, ,m p;i=1, ,k p), (4)式中, 第 j 个标化主成分回归方程估计值 , i 个标化偏回归系数。 第六步:计算 m 个标化主成分回归方程的残差见式 (5), 对残差取绝对值见式 (6),参考较小残差绝对值均数和较大累计方差百分比 ,在式 (4)中挑选最佳标化主成分回归方程。 Y j (j=1,m) (5) i| E |j=1,m) (6) 式中j 个标化主成分回归方程的残差 , 第七步:把式 (4)代入最佳标化主成分回归方程 ,整理后得标化线性回归方程 16 d i iY b X (i=1,p) (7) 式中 : 它与相应的标化主成分回归方程估计值等价 ; i 个标化偏回归系数。 第八步:把标化线性回归方程转换成一般线性回归方程。 标化偏回归系数转换为偏回归系数以及常数的计算公式为 / i Y Y X Xb b L L (i=1,p) ( 8) 0 b X(9) 式中:i 个偏回归系数 ; 的离均差平方和 ; 立模型 第一步:将各解释变量和解释变量进行标准化处理,得到的数据如表 4所示: 表 4: 数据标准化表 Y 1X 2X 3X 4X 5X 6X 7X 北 京 庆 连 州 州 肥 南 明 门 州 州 二步:各标准化后的解释变量进行主成分分析,提取三个主成分,得到的累积百分比如表 5 所示: 17 表 5: 方差累计表 特征值 方差百分比 累计百分比 主成分 1 成分 2 成分 3 见前三个主成分已经解释了被解释变量 方差,故提取的前三个主成分很好地包含的原来的信息量。 三个主成分的成分矩阵如表 6 所示: 表 6: 成分矩阵 成份 1 2 3 市中心高峰时段的车辆数 937 专 用车道总长度 128 走廊包括与社会交通混行部分的总长度 210 车站数量 094 车站平均间距 695 公交走廊内、外运营的公交路线总数量 940 只在封闭公交走廊内运营的公交线路数量 356 提取方法 :主成分分析法。 a. 已提取了 3 个成份。 18 第三步: 利用成分矩阵计算系数矩阵,得到结果如表 7 所示: 表 7: 系数矩阵 主成分 1 主成分 2 主成分 3 Y 四步:利用得到的系数矩阵,计算各个主成分的值,结果如表 8 所示: 表 8: 主成分数据表 五步:以三个主成分为自变量,被解释变量为因变量,进行多元线性逐步回归,结果如表 9 所示: 19 表 9 : 解释变量导入表 C 1F 2F 3F _2R 0 值 0 值 0 值 讨论: 首先引入1F,得到方程为1Y=F,系数均通过 t 检验,并且模型拟合优度为 且 明随机干扰项不存在一阶自相关。 接着引入2F,得到方程为2Y=F+F,系数均通过 t 检验,模型的拟合优度为 验值为 明随机干扰项不存在一阶自相关。 再引入3F,得到方程为3Y=F+F+F,系数均通过 型的拟合优度为 且 明随机干扰项不存在一阶自相关。 第六步:对个方程的残差取绝对值,如表 10 所示 表 10: 残差绝对值表 20 表 10 可得,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论