




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、重庆科技学院毕业设计(论文) 题 目 公交线路客流猜测 院 (系) 数理学院 专业班级 应数普2012-02 同学姓名 罗小芳 学号 2012444028 指导老师 严羿鹏 职称 讲 师 评阅老师 职称 2016年 6 月 7 日 同学毕业设计(论文)原创性声明 本人以信誉声明:所呈交的毕业设计(论文)是在导师的指导下进行的设计(争辩)工作及取得的成果,设计(论文)中引用他(她)人的文献、数据、图件、资料均已明确标注出,论文中的结论和结果为本人独立完成,不包含他人成果及为获得重庆科技学院或其它教育机构的学位或证书而使用其材料。与我一同工作的同志对本设计(争辩)所做的任何贡献均已在论文中作了明确
2、的说明并表示了谢意。 毕业设计(论文)作者(签字): 年 月 日欢迎下载 摘 要 公共交通是城市客运交通中必不行少的一个版块,是处理城市交通拥堵问题的重要方式,其运营好坏会直接影响到我国经济的运转状况和市民的生活质量。因此,为了便于管理和完善公交运营调度,于是产生了智能公交管理系统。公交运行管理系统向公交公司供应各种重要的交通状态数据,为管理者供应各种决策支持;公交信息服务系统为市民供应出行前、中和到达前的各种信息,提高乘客出行的便利9。管理者依靠公交运行管理系统供应的数据,争辩和实现对客流量分布规律的分析和变化状况的猜测,以客流分布的结果,提前为人们选择合适的公交线路、避开线路客流高峰。本文
3、亦是依据智能IC卡所供应的历史刷卡数据来分析客流分布规律,并对将来某一时段的客流量进行猜测。本文以公交线路客流量为争辩对象,时间及天气状况为影响因素,使用MATLAB和Excel进行了数据筛选和处理,接受了一元线性回归模型和多元线性回归模型进行求解,同时最终猜测出公交客流量的将来值,并检验其可行性。关键词:客流猜测 一元线性回归 多元线性回归 数据分析 欢迎下载ABSTRACT Public transport is an essential part of urban passenger transport, and an important way of dealing with the
4、problem of urban traffic congestion and its operations will directly affect the operational status of our economy and quality of life. Therefore, in order to facilitate the management and improve the operation of public transport, so the intelligent public transport management system. Bus operation
5、and management system provides a variety of important transportation status data to the bus company, and provides a variety of decision support; public information service system to the public before the trip, in a variety of information before arrival and to improve passenger travel convenience9. M
6、anagers rely on the data provided by the Public Transport Management System to research and implement on the distribution of passenger flow prediction analysis and variation of the rules, to the passenger flow distribution results, ahead of people choice suitable bus lines, to avoid the peak passeng
7、er flow line. In this paper, based on the historical credit card data provided by the intelligent IC card, this paper analyses the distribution law of the passenger flow, and forecasts the traffic flow of a certain period of time.The bus routes traffic as the research object, considering the bus rou
8、tes traffic audience not deterministic factors jointly influence, so the change is uncertainty. Therefore, we cant take general curve fitting method to predict the next week the traffic. In this paper, the two models are solved, respectively is a polynomial regression model and multiple linear regre
9、ssion model, and use MATLAB and Excel data filtering and data processing, and ultimately predict the future value of bus traffic.Keywords: patronage prediction;a polynomial regression;multi-factor linear regression;data analysis目 录摘 要I1 绪论11.1 争辩背景及意义11.2 国内外争辩现状22 问题分析33 基本概念和理论33.1 一元线性回归模型1643.1.
10、1 一元线性回归的定义43.1.2 一元线性回归系数估量53.1.3 模型猜测53.2 多元线性回归模型1663.2.1 多元线性回归的定义63.2.2 多元线性回归的系数估量83.2.3 显著性检验83.2.4 模型猜测94 公交线路客流猜测104.1 解释变量选取及数据说明104.1.1 数据的初步处理与分析124.2 一元线性回归模型164.3 多元非线性回归模型174.3.1 模型一174.3.2 模型二205 总结21参考文献20致谢21欢迎下载1 绪论1.1 争辩背景及意义随着我国经济的迅猛进展,城市化建设的加快,城市规模不断扩大,城市人口也不断增加,使得城市居民对交通的需求量日益
11、增多。如今几乎每家每户都有一辆乃至多辆私家车,致使交通拥堵日益严峻,城市交通问题也日益凸显。将来学家朱立安曾指出,“作为不发达国家经济进展的条件,交通运输有着多方面的重要作用,假如经济进展的关键因素只有一个,那么它既不是文化,也不是制度和心理,而是交通运输和通讯系统4。”明确表明白交通运输在城市中的重要地位,更说明白进行公交规划及进展的必要性。城市公共交通是指为住在城市和近郊范围内的市民解决出行问题,运用大量的交通运输工具的旅客运输系统,是城市客运交通系统的核心,是城市扩大建设和进展的重要基础设施之一,是市民进行生产和活动不行缺少的社会公共设施,也是城市重要规划和社会化生产的首要物质条件。同时
12、,城市公共交通也是随着客流量、路面状况以及天气状况等发生变化的市民乘车系统。为了制定科学有效并合理的发车方案,实现对现有车辆的高效管理及合理安排,解决乘客对公交公司有限车辆资源的需求在时间上的冲突,提高城市公共交同的管理水平和服务水平,首先是要利用现有的IC卡系统对乘坐公交车的人数进行自动监测。一个高效运行的城市公交系统会解决一系列难题:城市交通拥堵,市民日常出行问题,环境的污染。城市公交系统能否高效运行不仅仅取决于路面和车辆等设施基础条件,更依靠于先进的运营管理和技术手段。对公交客流信息全面、精确的把握是公交管理工作的基础,它不仅为日常调度供应依据,也为线网优化供应了重要参考3。公交客流是由
13、肯定数量的乘客在公交线路上和肯定时间内用公交实现位移的乘车人数总称。在城市公共交通规划、建设及运营的每个环节中,公共交通进展规模的基本依据由公交客流量所打算。客流猜测作为评判公共交通建设运营社会效益和经济效益的量化依据,对公共交通的线网布局方案、建设规模、运营管理及线路可行性争辩等多方面起到尤为重要的作用。因此,单单从IC卡系统中把握了客流信息并不能起到任何作用,更重要的是能够对客流数据以及天气等其他因素加以分析并争辩人们日常出行的重要规律。依据客流分布的结果,提前为人们选择合适的交通线路、避开线路客流高峰。综上所述,争辩和实现对客流分布规律的分析和变化状况的猜测,对公交管理水平和公交运营效率
14、均具有格外重要的作用。欢迎下载1.2 国内外争辩现状 国外发达国家尤为重视城市公共交通的进展,所以智能公交IC卡系统使用较早,主要作为一种新的收费方式和公交公司之间的收益安排,对于IC卡所采集的信息在城市公共交通规划方面的应用还未见有关报道5。其中,法国是世界上最早使用IC卡的国家,主要用于公共汽车、地铁、火车等。在公交数据采集方面,国外发达国家已经形成了较为完整的体系,从数据采集、传输、存储以及挖掘分析这一系列过程已经格外成熟。随着数据挖掘技术的快速进展及广泛应用,近几年数据挖掘技术越来越多地被用于公交数据地挖掘分析之中。发达国家很早就开头对公交客流猜测进行了争辩,但其争辩的重心放在了猜测的
15、技术及设备上,而很少争辩猜测方法,猜测的对象也基本是车辆的流淌状况,而特殊针对短时公交客流猜测的争辩也较少,在实际中的应用更是少之又少。当前我国的智能公交系统落后于国外发达国家,国内很多大中城市正面临着交通拥堵、能源紧缺以及环境污染等一系列严峻的交通进展瓶颈问题,因此公共交通的进展也引起了各相关部门的高度重视。尽管我国智能公交起步晚,但是进展较快,国内从1994年开头使用公交IC卡收费系统。目前国内很多大中城市都在推广公交IC卡的使用,并且有些地方已经实现了IC卡的一卡多用功能。近年来,我国在公交客流猜测方面对国外借鉴了不少猜测模型,尽管猜测结果都不够抱负,但考虑到公共交通进展的严峻形势,反而
16、越来越多的学者加入此领域的重要争辩中。近年来,一些学者接受小波分析、支持向量机、灰色猜测模型以及BP神经网络等方法对短时客流进行了初步争辩。如董海洋10接受传统BP神经网络模型、改进的BP神经网络模型和RBF神经网络模型分别对短时公交客流进行猜测并做出评价,并在猜测结果中表明改进的BP模型和RBF模型的猜测精度要比传统的BP模型有所提高;殷礼胜2争辩了基于混沌算法的小波神经网络交通流量混沌时间序列猜测的问题;杨志伟等人利用回归分析的方法建立各峰值区间内IC卡乘客量与总体客流量的回归方程,实现通过公交IC卡数据库猎取的IC卡时段客流对该峰值区间内的总体客流;何宝民1在对空中交通流量短期猜测模型争
17、辩中,分析和比较了多元线性回归猜测模型和SVM猜测模型,建立了基于多元线性回归确定组合猜测权重系数的空中交通短期流量组合猜测模型。杨新苗13等人提出了一种基于模糊神经网络的公交线路客流猜测模型,并在试验中比较发觉此模型具有较强的自适应性,猜测结果优于常规时间序列模型AR、ARMA所猜测的结果。欢迎下载2 问题分析依据广州市内及广佛同城公交线路的历史公交刷卡数据,挖掘固定人群在公共交通中的行为模式,建立公交线路乘车人次猜测模型,并用模型猜测猜测线路10和线路15在将来一周每日6-21点间每小时的乘车人次,然后依据模型给出每个时间段的客流量在6-21点间总人数的比例。给出了20140801至201
18、41220这五个月广东省公交线路10和15的岭南通用户刷卡数据,共涉及300多万用户7个线路3000多万条数据记录。同时供应20140801至20150131期间广州市的天气状况信息。本文将对如下几个方面进行考虑:1、由于乘客选择出行方式往往与天气有着很大的关系,天气较差时可能不倾向于选择公交方式出行,甚至有可能会选择不出门而影响当天出行的人数,因此,考虑结合所给出的广州市的天气状况信息进行客流量的分布的规律分析,再进行客流量的猜测。2、还有一个周期性的因素的是休息日或者工作日,一般来说,每一个工作日的公交乘客数量应当大体是平稳。另外由于将来一周包含节假日(节假日出行的人相对较多),则需要分别
19、对节假日和工作日建立模型。3、由于一天内不同时间段出行人数会有所不同,按常理来说,工作日早上7-8点和17-18点是人们出行的高峰期,其他时间段相对稳定,因此我们可以推断得到的客流量分布状况是否符合这一常理。4、用Excel或MATLAB对任意一天内每个时段的数据进行统计,然后以一周或者一个月为周期,对每天每个时段的乘车人数求平均数,最终针对统计的数据建立猜测模型进行求解。最终依据各模型的猜测值及其相对误差,对模型进行比较,并给出相应的建议。3 基本概念和理论目前对于客流量猜测常用的主要方法基于传统的统计学方法和人工智能方法。基于统计学的方法有移动平均法、多元回归分析法、趋势外推法、时间序列分
20、析法等,基于人工智能的方法有支持向量机、神经网络和数据挖掘等算法1。常用于公交线路客流猜测的方法一般包括两种:一种是基于时间序列的猜测方法,通过对大量的历史时间序列统计数据进行分析、争辩,运用相关猜测方法,找出数据中内在的进展、变化规律,然后利用其规律进行猜测;另一种是基于解释性的猜测方法,依据猜测对象和上下文相关环境,从中查找出和猜测目标相关联的影响因素,然后建立相应的猜测回归模型,依据猜测模型进行猜测1。本文将参考现有学者的争辩内容,建立一元多项式回归猜测模型或多元非线性回归模型进行数据处理并进行客流量猜测。3.1 一元线性回归模型16 3.1.1 一元线性回归的定义设两个变量和之间存在着
21、相互关系。这里是能够把握或者精确观看的变量,即一般的变量;是随机变量。由于是随机变量,对于的每一个确定值,有它的分布,假如的数学期望值存在,则其期望值随的取值而定,即的期望值是的函数,记为,并称是关于的回归或回归函数。明显,在肯定程度上反映在处随机变量观看值的大小。这提示我们通过随机变量的一组样本而探求的途径。对于,取定一组不完全相同的值,做独立试验得到对观看值结果,是处对随机变量观看的结果。对观看结果构成了一个容量为的样本。我们要解决的问题是利用样原来估量关于的回归。这种利用样原来估量的问题称为关于的回归问题。为此,首先需要推想的形式。假如为线性函数,即,此时估量的问题称为一元线性回归问题。
22、假设对的每个值有 (3.1)其中:、及均是不依靠于的未知参数。对于随机变量作式(3.1)正态假设,相当于假设为: (3.2)其中:、及均是未知量,及的常量,式(3.2)称为一元线性回归模型。假如由样本得到式(3.2)中参数、的估量、,对于给定的,定义作为的估量,即称方程 (3.3)为关于的线性回归方程或回归方程,其图像称为回归直线,、称为回归系数。 3.1.2 一元线性回归系数估量 求回归方程(3.3)及要求出与的估量和,使其对一切、观测值与回归值的偏离达到最小。为此,我们接受最小二乘法来求与的的估量。令 (3.4) 即通常接受最小二乘法来求参数和的估量,即使得 (3.5)达到最小。 所谓,的
23、最小二乘估量是使下式成立的和 (3.6) 由和所确定的直线称为对对的线性回归方程。它表述了变量同给定的变量的诸值间的平均变动关系。对的回归系数表示每变动一单位所引起的平均变动。 3.1.3 模型猜测建立回归方程的目的不仅是描述变量之间的关系,更重要的是回归方程的应用。利用所建回归方程对因变量进行猜测是其应用的基本内容。在一元线性回归分析中,当回归方程具有统计显著性时,利用回归方程简洁事先对因变量的点估量和区间估量。可证明:且与独立。这个结论表明,阅历回归方程是线性函数的无偏估量。因此,当时,因变量的猜测值即为,它是的无偏估量值。在显著水平下,的估量边际误差(区间估量)可由准则式确定,由和的分布
24、可以推出明显,猜测的精度取决于的大小,而影响大小的因素主要有样本容量,与的距离以及自变量的偏差平方和。当样本容量较大,与的距离较近,自变量的偏差平方和较大(采样较为分散)时,的取值就较小,此时猜测的精度较高。另外,当时,猜测精度可能会变得更差,在这种状况下做外推,需要特殊当心。由于上面计算边际误差的公式略显冗余繁杂,故在实际应用中,当取在四周,很大时,利用计算近似的边际误差,此时的0.95猜测置信区间近似为,0.99猜测置信区间近似为。3.2 多元线性回归模型16 3.2.1 多元线性回归的定义一元线性回归将影响因变量的自变量限制为一个,这在现实的社会经济现象中并不易做到,因而应用回归分析时,
25、经常要有更一般的模型,把两个或更多个解释变量的影响分别估量在内,这就是多元回归,亦称多重回归或复回归。把影响因素与因变量之间的关系时,所进行的回归分析就是多元线性回归。多元线性回归是多元统计分析中的一个重要方法,被广泛应用于众多自然科学领域的争辩中。在客观世界中普遍存在着变量之间的关系。变量之间的关系一般来说可分为确定性与非确定性的两种。确定性关系是指变量之间的关系可用函数关系来表达的。另一种非确定性地记所谓的相关关系,此时可用到回归分析。在争辩问题时,我们考虑一个变量受其它变量的影响时把此变量称为因变量,记为,其它变量称为自变量,这时相关系数可记为,其中为当时,因变量的均值,即,称为对的回归
26、函数,(随机变量)为与的偏差,假定。回归函数可以是一元函数,也可以是多元函数,即,其中为元函数,统称为多元回归函数。设因变量为y,m个自变量分别为,多元回归方程的一般形式可表示为: (3.7)式中,都是未知参数,为回归变量,为回归系数。要建立多元线性回归模型,首先要估量未知参数,为此我们进行次独立观测,得到n组数据(称为样本): 它们应满足式(3.8),既有 (3.8)其中:相互独立,且听从分布。令 (3.9)则式(3.9)可简写如下形式: (3.10)其中:为观测向量,为设计矩阵,它们是由观测数据得到的,是已知的,并假设为列满秩的,即;是待估量的未知参数向量;是不行观测的随机误差向量。式(3
27、.10)称为多元线性回归模型的矩阵形式,亦称为高斯-马尔科夫线性模型,并简记为。对线性模型所要考虑的问题主要是: (1)估量与,从而建立与之间的关系式。 (2)对线性模型假设与的某种假设进行检验。 (3)对进行猜测与对自变量进行把握。 建立多元线性回归模型时,为了保证回归模型具有优良的解释力量和猜测效果,应首先留意自变量的选择,其准则是: (1)自变量对因变量必需有显著的影响,并呈亲密的线性相关; (2)自变量与因变量之间的线性相关必需是真实的,而不是形式上的; (3)自变量之间应具有肯定的互斥性,即自变量之间的相关程度不应高于自 变量与因变量之因的相关程度; (4)自变量应具有完整的统计数据
28、,其猜测值简洁确定。 3.2.2 多元线性回归的系数估量同简洁的回归模型的状况相同,模型式(4.1)中的线性系数的常用估量法仍旧是最小二乘法,记: 求它的最小值点,即则就是的最小二乘估量。由微分法求极值的必要条件得的线性方程组为:的解。解此方程并用矩阵表示: (3.11)其中:,且要求可逆。这样,得到阅历回归(平面)方程为: (3.12)同简洁回归模型的情形一样,可对方差做估量,记则的无偏估量为: 3.2.3 显著性检验与一元的状况相同,所求的阅历方程式(3.12)是否有显著意义,还需要对y与诸间是否存在线性关系做显著性假设检验。与一元类似,可提出原假设。1. F检验法 当成立时,统计量 (3
29、.13)其中:为回归平方和:为残差平方和。对给定的水平,查分布表可得满足的临界值,由样本观测值带入式(3.13)算出统计量的观测值,若,则不能接受,认为所建的回归方程有显著意义。2.r检验法衡量阅历回归方程与观测值之间拟合好坏的常用统计量有复相关系数及拟合优度系数,其中且与的关系为因此与相互唯一确定,且互为单调函数,在这个意义上,两个统计量在度量模型的有效性方面是等价的。 3.2.4 模型猜测在多元线性回归分析中,当回归方差具有统计显著性时,利用回归方差简洁实现对因变量的猜测,其方法同一元的情形。设猜测点为,则 (3.14)是对 (3.15)的点估量,亦是对 (3.16)的点猜测。并且,可以证
30、明统计量 (3.17)其中 (3.18) (3.19)于是,点猜测的边际误差为,即在处的区间猜测为: (3.20)即 (3.21) 当较大,时,可取来简化计算。4 公交线路客流猜测4.1 解释变量选取及数据说明影响公交线路客流量的因素有很多:气候,道路状况,工作日与非工作日等等。在此,我们选取公交线路客流量为因变量,卡的类别(乘车人群)、工作日与休息日、天气、温度作为自变量。由于时间、经费等多方面的约束,我们选取的变量可能不是很全面,导致建立的回归模型较小。但是依据统计猜测与决策11,大型模型的猜测精度并不比小型模型的猜测精度高,而且没有哪一种猜测方法或模型适合于各种状况或在各种状况下都比其它
31、方式或模型效果好。本论文中所用数据均由题目给出,下面将进行部分数据说明:表4.1 乘车刷卡交易数据表(gd_train_data)列名类型说明示例Use_cityString使用地广州Line_nameString线路名称线路1Terminal_idString刷卡终端ID4589bb610f9be53a43a7bc26bb40e44dCard_idString卡片ID8ce79e0b647053f191d20c5552eb49f0Create_cityString发卡地佛山Deal_timeString交易时间(yyyymmddhh)2014091008Card_typeString卡类型同
32、学卡表4.2 公交IC卡数据样本Use_cityLine_nameTerminal_idCard_idCreate_cityDeal_timeCard_type广州线路109810dbdd5ff4365c186a90广州2014082109老人卡广州线路157c017542919eeb4738025f广州2014082115一般卡广州线路1046be366b59ba333e777ca4广州2014082120一般卡广州线路157c0175429191e6e8595275广州2014082108一般卡广州线路10ef721c1099576bddc10dd3广州2014082316老人卡广州线路1
33、029bdcd53bb44ac88824f4c广州2014082317一般卡广州线路10fd93c6056da7b5d29a08e1广州2014082110同学卡广州线路1090ec2979617b4243dff179广州2014082110老人卡表4.3 广州市天气状况信息(gd_weather_report)列名类型说明示例Date_timeString日期2014/8/1WeatherString天气状况(白天/夜间)小雨TemperatureString气温(最高/最低)36/26Wind_direction_forceString风向风力(白天/夜间)无持续风向3级/无持续风向3级
34、4.1.1 数据的初步处理与分析1、 我们分别统计出线路10和线路15在20140801-20141220每一天的总客流量(详见附录),从数据中明显可以看出某些天数的客流量反常,如:线路10在8月11日客流量只有143人,则返回到原始数据中查看发觉数据统计不全,则可用与其天气状况相像的某一天的客流数据或用平均值加随机误差的方式来进行补全。本文中选用的是与其天气状况相像的某一天的客流数据来补全,将统计的数据导入MATLAB并作图如下:图4.1 线路10在20140801-20141220期间每天的客流状况图4.2 线路15在20140801-20141220期间每天的客流状况 2、从图4.1和图
35、4.2中很难看出市民的出行规律,由于是要猜测每天06-21时每小时的乘车人次,所以我们将20140801-20141220这5个月中每天同一时刻进行了加总求平均得出一天每个时刻的客流量,作图如下:图4.3 线路10平均每天每时刻客流量图4.4 线路15平均每天每时刻客流量3、由图4.3和图4.4可以看出线路10和线路15平均每天每时刻的客流量分布状况呈M型,即有早晚凹凸峰期,此时的客流分布状况趋近于每天的客流状况,然而我们发觉工作日和非工作日(即周一至周五和周末)的客流分布状况应当会有所不同,一般来讲,每一个工作日的客流量应当大体是平稳的。因此,我们再次细化到一周的每一天,原理同上,我们分别对
36、线路10和线路15在20140801-20141220这5个月中每周同一天同一时刻进行了加总求平均得出一周每个时刻的客流量,如:对每周一06点的乘车人次进行统计并用AVERAGE函数求出平均数,最终统计出数据见附录,作图如下:图4.5 线路10平均一周每天乘车人次分布状况图4.6 线路15平均一周每天乘车人次分布状况在图4.5和图4.6中,我们可看出同图4.3和图4.4客流分布仍呈M型,唯一不同的是,同我们的常识一样,工作日周一至周五分布图形趋于重合,也就是说周一至周五的分布状况基本相同,而休息日的出行人数少于工作日。图4.7 线路10平均一周每天6-10点的客流量从图4.7可以看出线路10在
37、工作日的早高峰时段基本确定为7-8点,出行人次达4000以上;周末的早高峰不明显,趋于平稳,其客流量与工作日的客流量差距很大,平均出行人次低于2500。随着早高峰的结束(9点以后),工作日的客流量相对削减,周末的出行人数便接近于工作日。图4.8线路10平均一周每天11-16点的客流量 11点至16点整周的的出行人数居趋于平稳,由图4.8可知这一时段周末的出行人数均高于工作日的出行人数,这一点符合常识(工作日处于上班时段),也就是说用加总求平均这一方法是可行的。图4.9线路10平均一周每天17-21点的客流量 17-18点处晚高峰时期,出行规律类似于早高峰时期,唯一不同的是工作日的晚高峰相对平缓
38、,出行人次在3500左右。图4.10 线路15平均一周每天6-10点的客流量图4.11 线路15平均一周每天11-16点的客流量图4.12 线路15平均一周每天17-21点的客流量图4.9-4.12为线路15的客流分布直方图,出行规律同线路10类似,便不单独说明。4.2 一元线性回归模型通过以上内容的分析,我们以客流量为函数值(因变量),时间为自变量,建立以下一元线性回归方程: 下面将对线路10作回归分析,由于题干要求对20141221-20141227这一周每天6-21点的客流量进行猜测,则以周一为例,先选择所需数据添加散点图如下 :留意:以下相关图中x轴代表时间,y代表客流量。图4.13
39、线路10周一的客流分布回归拟合得出线性回归结果如下:表4.4 回归统计回归统计Multiple R0.363760183R Square0.13232147表 4.5 回归分析回归分析Coefficients标准误差t StatP-valueIntercept3368.872059687.11287764.9029383210.000233015X Variable 1-70.3794117648.16658779-1.4611666510.166049066 依据表4.4和表4.5可读出截距:=3368.872;斜率:=-70.3794;相关系数=0.364;测定系数=0.132;检验显著性
40、水平: =0.166;得回归模型为:,然而由于过小,值过大,模型的精度不高,回归一次项不显著,所以使用一元一次回归模型进行猜测不合理。 4.3 多元非线性回归模型 4.3.1 模型一我们考虑用多元非线性回归模型,依据画出的散点图,再添加多项式趋势线。从中发觉拟合的次数越高,测定系数越大,由于越接近于1,回归方程就越显著,所以拟合多项式次数越高,猜测的结果更抱负。此处在探究多项式后,最终确定5次项拟合是较为合理的。因此我们以客流量为函数值(因变量),以时间分别为5个自变量,建立以下多元非线性回归方程:依据上一节数据处理所得直方图知周末与工作日的客流量差异很大,因此必需针对每一天建立模型,分成7个
41、模型。这里建立的是非线性回归模型,但用的是多元线性回归进行拟合,以线路10周一为例,拟合得线性回归结果如下:表4.6 回归统计回归统计Multiple R0.95587601R Square0.913698947表4.7 回归分析回归分析Coefficients标准误差t StatP-valueIntercept-171333.692922586.05-7.585820.0000186995X Variable 173945.740129841.2817.5138330.0000203031X Variable 2-11840.141781636.576-7.23470.0000280868X
42、 Variable 3898.7302929130.3316.8957540.0000421615X Variable 4-32.569339434.990937-6.52570.0000667467X Variable 50.4535018260.0738226.143199 0.000109294依据表4.6和表4.7可读出截距:=-17134;=73946;=-11840;= 898.73;=-32.569;=0.4535;相关系数=0.956;测定系数=0.914;此时>0.9,<0.05,明显用多元非线性回归模型进行猜测是合理的。 周一的多元非线性回归模型:由作出的散点图
43、添加趋势线进行5次多项式拟合如下:图4.14 线路10周一6-21点的客流量5次项拟合同理得出线路10周二至周日的模型如下:周二:周三:周四:周五:周六:周日:线路15的猜测模型将不一一列出,直接将自变量分别带入7个模型中即可得出客流量猜测结果,具体结果由表4.8和表4.9给出。由于客流猜测结果由拟合所得的公式算出,所以存在小数点,但出行人数肯定为整数,所以在此有小数部分的一律进一位,得出猜测客流量如下表:表4.8 线路10客流猜测值时刻/日期1221122212231224122512261227661015451523141314621418763720603817420941364065
44、390824548257340824560449744124261295692598340838043735368635972854102441251627742689268726742545112289183619691865189919502273122230155816161489153916302153132278169217321581162617342200142397211821862008203721422364151516264127612552256326602553161559304832172970297730682666172465315933483059308431
45、86262018220828843049271427872917238019182222762375199621472318198920142115861604118914371644159521122613191300869120814151485表4.9 线路15客流猜测值时刻/日期122112221223122412251226122762135445495415264982797112316591853184218401737139581435184220682063206119521714914181565174617491738165716091012641157126612751
46、253121113471111038248688778458381099121006668668671632648955139997086926806416689441410759078978628318551048151201118711931129111611281215161331145614751378139013871381171413162516421513155515371480181404163116241472154115111462191279146014061247133512921311201034116710569151003941105721710900748663
47、718615795 4.3.1.1 结果检验 为了检验猜测结果与实际值之间的误差,我们用相对误差来推断。相对误差=(每天的猜测总人数-每天的实际总人数)/每天的实际总人数计算得下表:表4.10 线路10猜测值与实际值的相对误差日期相对误差值20141221(周日)-0.10720141222(周一)-0.0320141223(周二)0.02920141224(周三)-0.06320141225(周四)-0.02420141226(周五)-0.03320141227(周六)0.105明显除了20141221与20141227这两天的相对误差较大,总体的猜测效果与预想吻合。表4.11 线路15猜测
48、值与实际值的相对误差日期相对误差值20141221(周日)-0.06120141222(周一)-0.0420141223(周二)0.05920141224(周三)-0.02520141225(周四)0.04320141226(周五)-0.0820141227(周六)0.145 4.3.2 模型二由于周六周日的猜测值与工作日相比偏差较大,我们认为可能与天气因素关系亲密,如不工作的话下雨天会选择不出门,下面针对天气对出行人次的影响进行建模,又由节假日大多选择外出游玩,乘坐公交人次较不稳定,以下建模便剔除周末的节假日。以下以客流量为函数值(因变量),以时间、温度及天气状况为自变量,建立以下多元非线性
49、回归方程:其中,代表时间,代表温度,代表天气状况。 由于20140802-20141220期间周末数据本身较少,假如将周六和周日的数据分开做回归分析,那么结果必定误差更大,因此做出如下统计:周末每天6-21点的客流总量;时间用指代;温度直接使用原温度指代;天气状况指代状况如下几种:晴-1,多云-2,雷阵雨-3,阴-4,小雨-5;小到中雨-6。回归结果如下:表 4.12 回归统计回归统计Multiple R0.609936233R Square0.372022209表 4.13 回归分析回归分析Coefficients标准误差t StatP-valueIntercept30532.302095324.1671925.7346625290.000001727X Variable 1160.173162864.575361632.4804067480.018079573X Variable 297.75008413131.71453870.7421358730.462956627X Variable 3-527.5190274287.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年十堰市市直行政事业单位资产房屋租赁合同书
- 2025建筑工程材料供应合同
- 2025企业单位的无薪休假合同模板
- 2025绿化工程劳务承包合同合同范本
- 高校护理专业介绍
- 野生动物传染病检疫学
- 2025年导管室试题及答案
- 【FastData】2023年中国旅游业复苏趋势报告6410mb
- 一年级班主任个人工作总结模版
- 幼儿园清明节活动总结模版
- 2024-2030年中国航空发动机短舱行业市场现状分析及竞争格局与投资发展研究报告
- 物流仓储设施升级及效率优化研究
- 合作取得更大的成功辩论稿范文六篇
- 2022-2023学年八年级数学下学期期末考试卷(含答案)
- 2023年黔西南州中考数学试题(word版-含答案)
- 工程交付述职报告
- 医疗器械注册质量管理体系核查指南
- 冷水鱼养殖可行性报告
- 外科常见急腹症
- 四川省雅安市汉源县第二中学2023-2024学年九年级上学期第二次教学质量检测物理试卷
- 全套ISO45001职业健康安全管理体系文件(手册及程序文件)
评论
0/150
提交评论