数学建模 课程设计_第1页
数学建模 课程设计_第2页
数学建模 课程设计_第3页
数学建模 课程设计_第4页
数学建模 课程设计_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 东 北 石 油 大 学课 程 设 计 2017 年 7 月 14 日课 程 数学模型课程设计 题 目 应用统计分析模型解决实际问题 学 院 数学与统计学院 专业班级 信计 14-2 班 学生姓名 沈小伟 学生学号 141001140228 指导教师 刘今子 东北石油大学课程设计任务书课程 数学模型课程设计题目 应用统计分析模型解决实际问题 专业 信息与计算科学 姓名 沈小伟 学号 141001140228主要内容、基本要求、主要参考资料等主要内容主要内容简单介绍统计分析模型的基础理论及本文所用的统计分析方法,进一步通过实例来掌握如何应用常用的统计分析方法建立数学模型及求解。并利用本文所介绍的

2、统计分析方法来求解 2015 年数学建模的“互联网+”时代的出租车资源配置问题。课程设计的要求:课程设计的要求:1.独立完成建模,并提交一篇建模论文。2.论文的主要内容包括:摘要,问题的提出,问题的分析,模型假设,模型设计, 模型解法与结果,模型结果的分析和检验,包括误差分析、稳定性分析等。模型的优缺点及改进方向。必要的计算机程序。3.文档格式:参照东北石油大学课程设计撰写规范和数学模型课程设计教学大纲 。4.课程设计结束时参加答辩。主要参考资料:主要参考资料: 1邹志云,蒋忠海,梅亚楠,宋程.大中城市居民出行强度的聚类分析.交通运输工程与信息学报,5(2):8-13,2007,62衡量出租车

3、供求的三大指标里程利用率、车辆满载率、万人拥有量.运输经理世界 ,2007, (5)3王榃.成都市客运出租车需求分析.西南交通大学工程硕士学位论文,2009,124大连,北京,广州,杭州,深圳,武汉、南京 2013 年年鉴5韩中庚.数学建模方法及其应用.北京:高等教育出版社,2005.6完成期限 2017 年 7 月 3 日-7 月 14 日 指导教师 刘今子 专业负责人 仲光苹 2017 年 7 月 3 日东北石油大学本科课程设计论文I摘 要统计,顾名思义即将信息统括起来进行计算的意思,它是对数据进行定量处理的理论与技术。统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。统计

4、分析是统计工作中统计设计、资料收集、整理汇总、统计分析、信息反馈五个阶段最关键的一步。如果缺少这一步或这一步做得不好,均将降低统计工作的作用。可以确切地说,没有统计分析,统计工作就没有活力、没有发展,也没有统计工作的地位。所以统计工作者必须学会写统计分析,积极地为领导决策服务,这既是统计工作者的职责,也是统计工作的最终目的。本文简要地介绍了统计分析中的聚类分析和回归分析的概念和应用,以及常用的求解聚类分析和回归分析的方法,初步了解了统计分析问题的基本思想。此外,本文还简要介绍了有关 MATLAB 和 SPSS 软件的功能和特点,以便于用其去处理实际的统计分析问题。在对聚类分析和回归分析的相关内

5、容做了简介之后,本文还列举了聚类分析和回归分析的相关实例,并用 MATLAB 和 SPSS 软件对所举实例进行了编程求解,得出了模型的最优化配置方案和选择方案。最后,本文着重的探讨了关于典型统计分析模型“互联网+”时代的出租车资源配置的不同时空供求匹配程度的计算。随着信息科学的进步,统计应用的范围越来越广,数据处理及数据采集挖掘的方法呈现出多样化,统计分析方法也相对复杂化,专业化。面对如今的大数据时代,统计分析的作用显得越来越重要,因此我们需要掌握一些常见的统计分析方法,以便于在以后的工作和学习中能够独立而有效的处理相关问题。关键字:统计分析;聚类分析;回归分析;MATLAB;SPSS 东北石

6、油大学本科课程设计论文II目 录第第 1 1 章章 统计分析问题基础理论统计分析问题基础理论 .1 11.1 统计分析相关介绍.11.2 MATLAB 和 SPASS 软件介绍.21.3 本章小结.3第第 2 2 章章 统计分析常用方法简介统计分析常用方法简介 .4 42.1 方法 1聚类分析.42.2 方法 2回归分析.52.3 本章小结 .5第第 3 3 章章 典型实例典型实例 .6 63.1 实例 1聚类分析.63.2 实例 2回归分析.73.3 本章小结 .11第第 4 4 章章 数学模型案例数学模型案例 .12124.1 问题重述 .124.2 问题分析 .134.3 模型假设 .1

7、34.4 符号说明 .144.5 模型建立与求解 .144.6 模型评价 .214.7 本章小结 .22结结 论论 .2323参考文献参考文献 .2424附附 录录 .2525东北石油大学本科课程设计论文1第 1 章 统计分析问题基础理论统计分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。它是继统计设计、统计调查、统计整理之后的一项十分重要的工作,是在前几个阶段工作的基础上通过分析从而达到对研究对象更为深刻的认识。它又是在一定的选题下,集分析方案的设计、资料的搜集和整理而展开的研究活动。本文主要介绍了有关聚类分析和回归分析的有关知识,以及 MATLAB 和 SP

8、SS 软件的功能。1.1 统计分析相关介绍1.1.1聚类分析1.1.1.1聚类分析的概念聚类分析指将物理或抽象对象的集合分组成由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。1.1.1.2聚类分析的应用(1)商业:聚类分析被用来发现不同的客户群,并且通过购买模式刻画不同的客户群的特征;聚类分析是细分市场的有效工具,同时也可用于研究消费者行为,寻找新的潜在市场、选择实验的市场,并作为多元分析的预处理。(2)生物:聚类分析被用来动植物分类和对基因进行分类,获取对种群固有结构的认识。(3)地理:聚类能够帮助在地球中被观察的数据库商趋于的相似

9、性。(4)保险行业:聚类分析通过一个高的平均消费来鉴定汽车保险单持有者的分组,同时根据住宅类型,价值,地理位置来鉴定一个城市的房产分组。(5)因特网:聚类分析被用来在网上进行文档归类来修复信息。(6)电子商务:聚类分析在电子商务中网站建设数据挖掘中也是很重要的一个方面,通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征,可以更好的帮助电子商务的用户了解自己的客户,向客户提供更合适的服务。1.1.2回归分析1.1.2.1回归分析的概念东北石油大学本科课程设计论文2回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛

10、,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一 个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。1.2.2.2回归分析的内容从一组数据出发确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法。对这些关系式的可信程度进行检验。在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变量的影响是

11、显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法。利用所求的关系式对某一生产过程进行预测或控制。回归分析的应用是非常广泛的,统计软件包使各种回归方法计算十分方便。1.1.2.2回归分析的应用回归分析是重要统计推断方法。在实际应用中,回归分析是数理统计学与实际问题联系最为紧密,应用最为广泛,也是收效最为显著的统计分析方法;是分析数据,寻求变量之间关系有利的工具。随着科学技术的发展,生物、医学、农业、林业、经济、管理、金融、社会等领域的许多事迹新问题提出,有力的推动了回归分析的发展。1.2 MATLAB 和 SPAS

12、S 软件介绍1.2.1 MATLAB 相关介绍MATLAB 是美国 MathWorks 公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括 MATLAB和 Simulink 两大部分。MATLAB 是 matrix&laboratory 两个词的组合,意为矩阵工厂(矩阵实验室)。是由美国 mathworks 公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数

13、值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如 C、Fortran)的编辑模式,代东北石油大学本科课程设计论文3表了当今国际科学计算软件的先进水平。MATLAB 和 Mathematica、Maple 并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB 可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。1.2.2 SPSS 软件相关介绍1984 年 SPSS 总部首先推出了世界上第一个统计分析

14、软件微机版本 SPSS/PC+,开创了 SPSS 微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就 SPSS 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Pr

15、obit 回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。SPSS 针对初学者、熟练者及精通者都比较适用。并且很多群体只需要掌握简单的操作分析,大多青睐于 SPSS,像薛薇的基于 SPSS 的数据分析一书也较适用于初学者。而那些熟练或精通者也较喜欢 SPSS,因为他们可以通过编程来实现更强大的功能。1.3 本章小结本章主要介绍了聚类分析和回归分析的概念以及他们在实际生活中的广泛应用。并且介绍了将要用到的 MATLAB 和 SPSS 软件的功能和特点,以及他们在实际生活中的用处。东北

16、石油大学本科课程设计论文4第 2 章 统计分析常用方法简介2.1 方法 1聚类分析2.1.1 聚类分析的原理聚类分析是将样品或变量按照它们在性质上的亲疏程度进行分类的多元统计分析方法。聚类分析时,用来描述样品或变量的亲疏程度通常有来两个途径,一是把每个样品或变量看成是多维空间上的一个点,在多维坐标中,定一点与点,类和类之间的距离,用点与点间距离来描述样品或变量之间的亲疏程度:另一个是计算样品或变量的相似系数,用相似系数来描述样品或变量之间的亲属程度。聚类分析是实用多元统计分析的一个新的分支,聚类分析的功能是建立一种分类方法,他将一批样品或变量,按照它们在性质上的亲疏、相似程度进行分类。2.1.

17、2 聚类分析的方法(1)系统聚类法:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其他类的距离或相近性测度。这一过程可用一张谱系聚类图描述。(2)调优法(动态聚类法):首先对 n 个对象初步分类,然后根据分类的损失函数尽可能小的原则对其进行调整,直到分类合理为止。(3)最优分割法(有序样品聚类法):开始将所有样品看做一类,然后根据某种最优准则将它们分割为二类、三类,一直分割到所需的 K 类为止。这种方法适用于有序样品的分类问题,也称为有序样品的聚类法。(4)模糊聚类法:利用模糊集理论来处理分类问题,它对经济领域中具有模糊特征两态数据或多态数据具有明显的分类效果。(5)图

18、论聚类法:利用图论中最小支撑树的理论来处理分类问题,创造了独具风格的方法。(6)聚类预报法:利用聚类方法处理预报问题,在多元统计分析中,可以用来做预报的方法很多,如回归分析和判别分析。但对一些异常数据,如气象中的灾害性天气的预报,使用回归分析或判别分析处理的效果都不好,而聚类预报弥补了这一不足,只是一个值得重视的方法。东北石油大学本科课程设计论文52.2 方法 2多元线性回归分析2.2.1 多元线性回归模型的原理多元回归分析是研究因变量 Y 与 m 个自变量下 x1,x2,.,xm 的相关关系 ,而且总是假设因变量 Y 为随机变量,而 x1,x2,.,xm 为一般变量。2.2.2 多元线性回归

19、模型的建立 假定因变量 Y 与 x1,x2,.,xm 线性相关。收集到的 n 组数据(yt1,xt1,xt2, .,xtm) (t=1,2,n)满足以下回归模型: 11022+(1,2, )() 0,(),(,) 0()(0,),ttm tmtttijtyxxtnEVarCovijN 或相互独立(t =1, 2,n).记C=,11111(1)1mnnnmxxXxx011212,nmnyyyY则所建回归模型的矩阵形式为或2( )( ),0 ,nnY CEDI 2,(0,),nnY CNI 并称它们为经典多元回归模型,其中 Y 是可观测的随机向量,是不可观测的随机向量,C 是已知矩阵,2是未知参数

20、,并设 nm,且 rank(C)=m+1。在经典回归分析中,我们讨论模型中参数 =(0,1,.,m)和 2的估计和检验问题。近代回归分析中讨论变量筛选、估计的改进,以及对模型中的一些假设进行诊断等问题。2.3 本章小结本章主要介绍了统计分析问题的聚类分析和回归分析的概念及其常用的求解方法,了解了他们的基础思想。并将这两种分析方法运用到第三章和第四章中去解决实际的数学问题。 东北石油大学本科课程设计论文6第 3 章 典型实例3.1 实例 1聚类分析下面是聚类分析的一个简单例子。有五个样品,每个只测量了一个指标,分别为 1,2,6,8,11,我们用最短距离法将它们分类。(1)计算五个样品两两间的距

21、离,得初始类间的距离矩阵 D(0),表 3-1 初始距离阵 D(0)1G2G3G4G5G1G02G103G5404G76205G109530 (2)由 D(0)知类间最小距离为 1,于是将 G1和 G2合并成 G6,并计算 G6和其他类之间的距离,的新的距离阵 D(1),表 3-2 初始距离阵 D(1)6G3G4G5G6G03G404G6205G9530 东北石油大学本科课程设计论文7(3)由 D(1)知,类间最小距离为 2,合并 G3和 G4为 G7,计算 G7与其他类间的距离得矩阵 D(2),表 3-3 初始距离阵 D(2)6G7G5G6G07G405G930(4)由知,类间的最小距离为

22、3,将和合并为,得新的距离矩阵(2)D5G7G8G,(3)D表 3-4 初始距离阵 D(3)6G8G6G08G40(5)最后将和合并为,这时五个样品聚为一类。6G8G9G3.2 实例 2回归分析3.2.1 数据的准备中国统计年鉴把财政支出划分为 31 个组成部分。本文只选取 2005 年我国31 个省、市、自治区的地区生产总值和 13 个重要支出项,分别是:x1 为基本建设支出,x2 为企业挖潜改造资金,x3 为科技三项费用,x4 为农业支出,x5 为农林水利气象等部门事业费,x6 为工业交通部门事业费,x7 为流动部门事业费,x8 为教育事业费,x9 为科学事业费,x10 为卫生经费,x11

23、 为行政管理费,x12 为公检法司支出,x13 为城市维护费。y 为地区生产总值。 (数据单位为:万元)3.2.2 模型的建立及求解东北石油大学本科课程设计论文83.2.2.1 模型的建立将 13 个重要支出项设为自变量,用 x1,x2,.,xp(p=1,2,.,13)表示;将地区生产总值 y 设为因变量。采用最小二乘法拟合一个多元线性回归模型,采用数学软件 SPSS 计算出回归系数,运行结果如下表:表 3-5 回归系数表非标准化系数标准系数模型标准误差试用版tSig.(常量)-4182809.8925604506.176-0.7460.4661x-25.77010.031-0.330-2.5

24、690.0202x26.68117.3270.2081.5400.1423x-6.03261.820-0.012-0.0980.9234x-95.59853.292-0.281-1.7940.0915x-43.76787.974-0.077-0.4980.6256x11.59074.3190.0140.1560.8787x-188.668272.581-0.044-0.6920.4988x50.63914.0420.6823.6060.0029x-62.117187.183-0.050-0.3320.74410 x-81.36043.526-0.300-1.8690.07911x46.1112

25、3.1950.4171.9880.06312x55.69639.1620.4561.4220.173113x40.95314.6480.2722.7960.012因而对 13 个自变量的线性回归方程为:y(3-1)13121110987654321953.40696.55111.46360.81117.62639.50668.188590.11767.43598.95032. 6681.26770.25892.4182809xxxxxxxxxxxxxy3.2.2.2 模型的检验首先,对模型(3-1)进行拟合优度的检验,采用数学软件 SPSS 计算样本可决系数 R3和调整后的样本,运行结果如下表

26、表 3-6 模型汇总模型R2R2R标准估计的误差东北石油大学本科课程设计论文910.992a0.9850.9738933132.933由表 3-6 可知,模型(3-1)拟合效果很好。然后,对模型(3-1)进行显著性 F 检验,采用数学软件 SRSS 计算出的方差分析表如下表表 3-7 方差分析表模型平方和df均方FSig.回归8.780E16136.754E1584.6340.000a残差1.357E15177.980E131总计8.916E1630表 3-7 中的 Sig.即为显著性 P 值,由 P 值=0.000(近似值) ,=0.05,P 值小于 =0.05,所以,拒绝原假设 H0,认为

27、在显著性水平 =0.05 的条件下,因变量对自变量 x1,x2,.,xp(p=1,2,.,13)有显著的线性关系,即回归方程(3-1)Y是显著的。最后,对模型(3-1)进行回归系数的显著性检验,提出原假设 H0j:j=0 其中j=1,.,13。利用 SPSS 计算出关于 j 的 t 统计量 tj(j=1,.13)及相应的 P 值,我们可以发现并不是所有的 xj 单独对因变量都有显著影响。这说明尽管回归方程Y通过了显著性检验,但也会出现某些单个变量 xj 对并不显著的情况。Y由于某些变量不显著,因此本文采取后退法简单的剔除多余变量,由于变量间的交互作用,不能一次性剔除所有不显著的变量,所以进行依

28、次剔除,首先剔除 P值最大的一个变量,然后再进回归系数的显著性检验,如果有不显著的变量,那么再进行剔除,依次下去,知道保留的变量都对 y 有显著性影响为止。根据表 3-5,我们首先剔除 x3,用剩余变量与 y 进行回归系数的显著性检验,SPSS 运行结果如下表表 3-8 回归系数表非标准化系数标准系数模型标准误差试用版tSig.(常量)-4215343.1795438475.606-0.7750.4481x-25.5609.524-0.327-2.6840.0152x26.83616.7730.2091.6000.1274x-95.36351.752-0.280-1.8430.0825x-46

29、.25681.846-0.081-0.5650.57916x7.89362.1520.0090.1270.900东北石油大学本科课程设计论文107x-179.965250.384-0.042-0.7190.4828x50.83313.5120.6853.7620.0019x-64.500180.403-0.052-0.3580.72510 x-79.83539.491-0.295-2.0220.05811x46.34722.4240.4192.0670.05312x54.07134.4520.4431.5690.13413x40.44113.2940.2693.0420.007由结果看,剔除

30、x3 后,剩余变量的显著性都发生了变化,仍然有部分变量不显著,所以继续进行剔除(由于剔除过程比较繁琐,在此不一一列出,只列出最终保留的变量) 。最终保留的变量为 x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13。将剩余变量与 y 做回归分析,SPSS 运行结果如下表表 3-9 回归系数表非标准化系数标准系数模型标准误差试用版tSig.(常量)-3731367.9704548805.753-0.8200.4211x-26.8977.500-0.344-3.5860.0022x28.26611.7940.2202.3970.0254x-101.28634.597

31、-0.297-2.9280.0088x49.46511.9240.6664.1480.00010 x-73.62522.272-0.272-3.3060.00311x49.57517.0390.4482.9090.00812x32.63715.6760.2672.0820.049113x45.4999.1320.3024.9820.000由表 3-9 建立新的多元线性回归模型 (3-2)131211108421499.45637.32575.49625.73465.49286.101266.28897.26970.3731367xxxxxxxxy应用 SPSS 软件计算样本可决系数和调整后的样

32、本可决系数,如下表2R2R表 3-10 模型汇总模型R2R2R标准估计的误差10.992a0.9840.9788033883.479东北石油大学本科课程设计论文11由表 3-10 可知,模型(3-2)拟合效果很好。然后,对模型(3-2)进行显著性 F 检验,采用数学软件 SPSS 计算出的方差分析表如下表表 3-11 方差分析表模型平方和df均方FSig.回归8.774E1681.097E16169.9190.000a残差1.420E15226.454E131总计8.916E1630由P值=0.000(近似值),P值小于,所以,在显著性水平05. 005. 0的条件下,回归方程(3-2)是显著

33、的。05. 0经过以上算法步骤,新建立的模型(3.2)通过了显著性检验,因此。模型(3-2)为最终确定的模型。3.3 本章小结本章主要根据典型例题更加详细的说明了聚类分析和回归分析的思想,并且利用 SPSS 软件对它们的经典案例进行了编程求解,同时感受到了 SPSS 在解决数学规划问题中的强大功能。东北石油大学本科课程设计论文12第 4 章 数学模型案例2015年3月,李克强总理在政府工作报告中指出,要制定“互联网+”行动计划,推动移动互联网、云计算、大数据、物联网等与现代制造业结合。2015年7月4日,国务院印发了关于积极推进“互联网+”行动的指导意见 ,提出着力创新政府服务模式,夯实网络发

34、展基础,营造安全网路环境,提升公共服务水平,并将“互联网+”高效物流和“互联网+”便捷交通作为其中两项重点行动。上世纪90年代末开始,我国互联网蓬勃发展,形成具有国际先进水平的用户规模和普及率,并且培育形成了丰富的互联网应用产品和技术力量,为我国各行业融合互联网,推动技术进步、效率提升和组织变革,提升实体经济创新力和生产力,打造大众创业、万众创新,四项经济提质增效升级奠定了技术、资源条件。事实上,从2014年以来,淘宝、微信、滴滴打车等基于互联网(移动互联网)的新业态已经在改变着社会经济的运行。基于互联网平台的交通运输服务已延展到客运、货运、铁路、停车、维修、公交、出租汽车、航空等交通行业,热

35、门手机APP达60余个,累计下载量超过50亿人次。交通运输作为人类社交活动、商品交易的支撑,不仅对城市建设和社会发展具有重要影响力,而且存在与科学技术同步发展的紧密互动关系。纵观交通发展史,每次科学技术的进步都带来交通运输方式的改变,交通运输方式的进步又支撑起社会经济发展、科技进步。同时,也注意在交通行业的发展变革过程中,每一次新的交通运输方式出现,都会伴随传统模式与新型模式之间的冲突、转变,运输的需求和供给双方都需有一个逐渐的转变和相互适应过程。本文就出租车供求关系、资源配置问题利用统计分析相关知识进行了初步的探讨。4.1 问题重述随着经济的发展,近年来,人们对出行的要求不断提高,城市出租车

36、以其方便、快捷、舒适和私密性的特点成为越来越多人的出行选择。但是,国内各大城市交通问题日趋严重, “打车难”也是人们关注的一个社会热点问题。数据显示,包括上海、杭州等众多大城市,出租车非高峰期的空驶率始终在 30%上下徘徊,而高峰期却打不到车。这与众多市民反映的打车难背后所隐藏的强烈需求看似形成了一个矛盾。究其原因,最主要的莫过于司机与乘客需求信息不对称,缺乏及时沟通交流的平台。随着“互联网+”时代的到来,有多家公司依托移动互联网建立了打车软件服务东北石油大学本科课程设计论文13平台,实现了乘客与出租车司机之间的信息互通,同时推出了多种出租车的补贴方案,吸引了越来越多的司机和乘客使用打车软件。

37、然而,打车软件同时也导致出租车行业乱象丛生,存在马路扬招成功率降低、乘客怕司机接到大单拒载、司机分心忙于抢单影响行车安全等问题。请你们搜集相关数据,建立数学模型研究如下问题:问题:请你建立合理的指标,并分析不同时空出租车资源的“供求匹配”程度。4.2 问题分析“打车难”是人们关注的一个社会热点问题。但是,在北京也不是无论何时何地都难打到车。打车难往往出现在特殊时间和地点:上班高峰的住宅区,下班高峰的商务区,凌晨和深夜的郊区或偏僻地点,遇到雨雪天气“互联网+”时代的出租车资源配置是一个十分复杂的社会问题。要想准确得出合理的资源配置方案难以实现,同时也难以准确收集大量出租车的各项数据如出租车的每天

38、跑单数,收费,拒载情况等,以及不同城市不同城区不同时间居民的出行行为特征数据。为了建立合理的指标,分析不同时空出租车资源的供求匹配程度,首先从城市居民出行对出租车的需求量入手,分析与需求量有关的主要指标,如城市居民出行量。为分析城市居民出行量与城市经济指标的相关性,先将这些指标进行聚类分析,继而得出每类最具代表性的经济指标,再将最具代表性的经济指标与居民出行总量进行回归分析,得到多元线性回归模型,从而预测居民的出行总量。通过查阅文献可以确定居民出行选择出租车作为出行方式的比例从而,计算得出城市的出租车运输量的需求量。然后根据供需平衡法预测出城市出租车需求量。将城市实际出租车数量与城市出租车需求

39、数量作比,得到衡量出租车资源的供求匹配程度的指标即供求匹配率。对未来城市的出租需求量进行灰色关联预测,得到未来城市的出租需求量,通过计算不同城市的出租车需求量,进行不同时空的出租车资源供求匹配的分析。4.3 模型假设1假设城市中的黑车现象对居民出行没有造成影响;2假设所研究的城市没有发生严重的自然灾害和社会动荡;3假设所研究的城市政府对出租车行业的政策基本不变;4假设司机和乘客都是为自身利益考虑,即经济人假设;5假设参考文献中的数据来源可靠,真实可信。东北石油大学本科课程设计论文144.4 符号说明P出租车供求匹配率M市民出行需要的出租车辆数,辆N城市实际运行的出租车辆数,辆Y市民日均出行次数

40、,次/日W城市总人口数量,人 市民选择打车出行的比例s出租车单车日均载客次数,次/车日 出租车单车日均每次载客人数,人/车次 出租车满载率vi 城市的第 i 个经济指标RPearson 相关系数w打车软件每单对司机的补贴钱数,元x每辆出租车每天接单的数量,单y 出租车每天的满载率4.5 模型建立与求解4.5.1 建模前的准备由参考文献可得到现有指标体系见表 4-1。表 4-1 衡量出租车供求的三大指标指标里程利用率意义指营业里程与行驶里程之比,一般以一辆车为单位,公式为:里程利用率=营业里程(公里)/行驶里程(公里)100%评价这一指标反映车辆载客效率,如果比例高,说明车辆行驶中载客比例高,空

41、驶比较低,对与要车的乘客来说可供租用的车辆不多,乘客等待时间增加,说明供求关系比例紧张。如果比例低,则车辆空驶比例高,乘客租用比较方便,但经营者的经济效益下降。国外一些城市把这一指标作为出租汽车发展规划的主要数据。如日本的东京、横滨等城市,把出租汽车里程利用率控制在 52%左右,以方便乘客租车,如果里程利用率高于 52%,则发展出租汽车,使之降到52%左右。指标车辆满载率东北石油大学本科课程设计论文15意义通过在客流集散较为集中的地点选取几个长期观测点,对单位时间通过道路的载有乘客的出租汽车数量占总通过出租汽车数量的比,公式为:车辆满载率=载客车数(辆)/总通过车辆(辆)100%评价经验认为,

42、车辆满载率应达 70%。在实际操作过程中,通过控制出租车的满载率实现运力与运量的适当平衡。在中心城市,当出租车汽车载客率低于 70%时,限制出租汽车运力增加;高于 70%,增加出租汽车运力,这样对于提高服务质量,满足高峰时运力需求具有重要作用。指标万人拥有量意义是人均设备普指标,用来描述一定城市规模内车辆的占有量。公式为:万人拥有量=车辆(辆)/人口规模(万人)评价目前对城市出租车拥有量的控制标准中并没有上限规定,现行的城市道路交通规划设计规范(GB50220-95) 仅给出了出租车拥有量的下限,即大城市不少于每万人 20 辆,小城市不少于每千人 5 辆,中等城市可在其间取值。4.5.2 问题

43、一:建立评价出租车资源供求匹配程度的指标为评价出租车资源的“供求匹配”程度,引入出租车资源的供求匹配率这一指标,指标的定义为城市中实际运行的出租车辆数与市民出行需要的出租车辆数之比,即NPM (4-1)其中,引入P表示出租车资源的供求匹配率,M表示市民出行需要的出租车辆数,N表示城市中实际运行的出租车辆数。市民出行需要的出租车辆M的意义是指这些出租车辆能够恰好满足市民打车出行的需求,即城市出租车资源供求平衡时的车辆数。供求匹配率P反映了城市中实际运行的出租车辆数与市民出行需要的出租车辆数之间的差异。供求匹配率P1 为出租车资源供求平衡状态,供求匹配率P越接近1,则说明城市出租车资源供求匹配程度

44、越高,出租车数量配置越合理;当供求匹配率P大于 1 时,表明城市中现有的出租车数量超过市民出行需要的数量,会增加出租车的空驶率,造成出租车司机的收益降低;当供求匹配率P小于 1 时,表明城市中现有的出租车数量少于市民出行需要的数量,需要增加出租车的数量来缓解打车难的情况。4.5.2.1 建立市民出行需要的出租车辆数M的预测模型市民出行需要的出租车辆数M与市民人均日出行次数、城市总人口数量、市民出行选择乘坐出租车的比例有关,也与每辆出租车日均载客次数、每单载客人数和东北石油大学本科课程设计论文16车辆满载率有关,具体关系式为:Y WMs (4-2)其中,M表示市民出行需要的出租车辆数(辆) ,Y

45、表示市民人均日出行次数(单位:次/人日) ,W为城市总人口数量(人) ,表示市民选择打车出行的比例,s表示出租车单车日均载客次数(单位:次/车日) ,表示出租车单车日均每次载客人数(人/车次) ,为出租车满载率。根据参考文献,选取出租车单车日均载客次数s=35(次/车日) ,出租车单车日均每次载客人数=2.0(人/车次) ,出租车满载率=65%,居民选择打车出行的比例为 6%。接下来建立市民人均日出行次数与城市经济指标关联的量化模型市民人均日出行次数是居民出行强度的最直接反映,其与城市人口总数量的乘积即为市民的出行总量,而市民人均日出行次数与城市经济指标有着极大联系。通常情况下,市民人均日出行

46、次数的多少与出行目的、城市布局、交通设施、城市环境质量等因素有关。对于某一城市来说,影响居民人均出行次数的因素又间接地反映在该城市的相关经济指标上。因此,多种因素与市民人均日出行次数的内在关联可以转化为多种经济指标与市民人均日出行次数的内在关联。STEP1STEP1:各经济指标的聚类分析;STEP2STEP2:典型指标的选取;STEP3STEP3:回归模型的建立;STEP4STEP4:模型的检验。聚类分析是根据事物本身的特性来定量研究分类问题的一种多元统计分析。其基本思想是按照距离的远近将数据分为若干个类别,以使类别内数据的“差异”尽可能小,类别间“差异”尽可能大。所用的变量可以被大致分成两类

47、:对样本个体进行聚类通常称为 Q 型聚类,对研究变量进行聚类称为 R 型聚类。选用欧几里得距离(欧式距离)来度量指标之间接近的程度。欧式距离就是空间中两点之间的直线距离,其中各特征参数是等权的,记dij表示指标vi和vj之间的距离,则有计算公式如下:1221(2)(| )pijikjkkdvv ,1,2,i jp聚类分析具体过程如下:(1)首先将各聚类单位各自作为一类(这时有p类) ,按照所选取的距离计算各数据点之间的距离,形成一个距离阵。(2)将距离最近的两个单位并为一个类别,形成n-1 个类别,计算新产生的类别与其他各类别之间的距离,形成新的距离阵。东北石油大学本科课程设计论文17(3)按

48、照和第二步相同的原则,再将距离最接近的两个类别合并,这时如果类别个数仍然大于 1,则继续重复这一步骤,直到所有的数据都被合并为成为一个类别为止。STEP1STEP1:选取北京、上海、天津、广州、深圳、成都、南京、杭州、武汉、长春、珠海、大连、福州、苏州、常州十五个大中城市为研究对象,分析各城市人均日出行次数和十二个经济指标之间的关联。以 12 个经济指标为聚类单位,指标与指标间的距离选用欧式距离,采用组间平均联接法,进行聚类分析。利用 SPSS19.0 软件进行聚类分析,得到各经济指标间的相关系数矩阵如表 4-2,聚类过程中的运算结果参数见表 4-3 所示,聚类分析的谱系图如图 1。表 4-2

49、 相关系数矩阵Rv1v2v3v4v5v6v7v8v9v10v11v12v11.00.711.281-.186.262.307.027.112.137-.173-.326-.281v2.7111.00.830-.014.743.850.651.693.345.208-.144-.064v3.281.8301.00.305.900.972.899.924.207.591.254.342v4-.186-.014.3051.00.420.198.291.279-.537.766.861.734v5.262.743.900.4201.00.815.729.753.062.624.356.502v6.30

50、7.850.972.198.8151.00.935.959.329.519.164.247v7.027.651.899.291.729.9351.00.973.343.625.329.370v8.112.693.924.279.753.959.9731.00.346.611.281.365v9.137.345.207-.537.062.329.343.3461.00-.332-.527-.469v10-.173.208.591.766.624.519.625.611-.3321.00.866.864v11-.326-.144.254.861.356.164.329.281-.527.8661.

51、00.918v12-.281-.064.342.734.502.247.370.365-.469.864.9181.00表 4-3 聚类分析参数聚类表群集组合首次出现阶群集阶群集 1群集 2系数群集 1群集 2下一阶136831.753004279945.2510033271490.7300244232535.5703155284117.3344066257813.49050771212482.022068811216855.22370109101122008.9920010东北石油大学本科课程设计论文18图 4-1 聚类分析的谱系图根据聚类分析的谱系图可以看出,这十二个经济指标可分为三大类:

52、第一大类包括人均 GDP(v4) ;第二大类包括在岗职工平均工资(v10)和市区居民人均可支配收入(v11) ;第三大类包括市区面积(v1) 、市区总人口数(v2) 、第三产业值(v3) 、工业产品销售收入(v5) 、社会消费品零售总额(v6) 、房地产开发投资(v7) 、城乡居民储蓄存款(v8) 、居民消费价格总指数(v9) 、农民人均纯收入(v12) 。聚类分析的结果见表 4-4表 4-4 聚类分析结果指标代码v v1 1v v2 2v v3 3v v4 4v v5 5v v6 6v v7 7v v8 8v v9 9v v1 10 0v v1 11 1v v1 12 2分类类别333133

53、333223STEP2STEP2:将十二个指标进行聚类分析得到三类指标后,出来第一类指标外,其他两类都包含多个指标,为了选取各类指标中的典型指标,分别计算类中每一变量与其余变量的 Pearson 相关系数,继而求得类中每一变量与其余变量的 Pearson 相关系数的平方和的平均值,最后把该值最大的变量作为典型指标。Pearson 相关系数的定义为11cov( ,)()()niiiyxyxyyxxY XRnsss s (4-3)相关系数R的数值范围是介于-1 与+1 之间:如果| |R|0,表明两个变量没有线性相关关系。东北石油大学本科课程设计论文19如果| |R| |1,则表示两个变量完全直线

54、相关。线性相关的方向通过相关系数的符号来表示, “+”号表示正相关, “-”表示负相关。2121ijimv vjvRRm 1,2,jm ji (4-4)将表 4-2 中的值代入公式(3)、(4),计算得到第二类和第三类指标中的各变量的相应的平均相关系数的值,具体见表 4-5 所示。表 4-5 同一类中每一变量与其余变量的相关系数平方和的均值第二类指标第三类指标指标v10v11v1v2v3v5v6v7v8v9v122ivR0.4580.3760.1850.4150.5320.4670.5200.4930.5060.2210.376从表 4-5 中可以看出,第二类指标中v10对应的值最大,第三类指

55、标v3中对应的值最大。所以,选择v10、v3为典型数据。而第一类指标只有一个指标,故可选取v4、v10、 v3分别作为第一、二、三类指标的典型指标。STEP3STEP3:根据聚类分析得到的典型变量,利用表 2 中的数据,建立 2001 年人均日出行次数Y与第三产业值(v3) 、人均 GDP(v4) 、在岗+职工平均工资(v10)的多元线性回归方程。多元线性回归模型为011iiiipiyyebb xbe (4-5)给定各自变量取值时因变量y的估计值,代表的是能与自变量决定的部分;ei为残差,是因变量实测值 yi 与估计值之差,表示不由自变量决定的部分。应用多个个回归模型对每一条记录求其因变量预测

56、值与实测值之差的平方和,并将其累加,那么每个回归模型都会得到一个累加值,而该数值的最小的那个回归模型就是需要的模型,这就是最小二乘法。201 12211()()nniiiiippiiiQyyybb xb xb x (4-6)利用 SPSS19.0 软件计算得5341023.464( 2.2751.6509.169) 100.678YvvvR (4-7)R2=0.678 表明因变量Y(人均出行次数)的 67.8%可由回归方程确定,回归方程视为可用的。STEP4STEP4:模型检验:将表 2 中的第三产业值、人均 GDP、在岗+职工平均工资代入得到的多元线性回东北石油大学本科课程设计论文20归方程

57、(7)中,得到人均日出行次数的模型模拟值,作出模型值与调查值的折线图如图 4-2 所示。图 4-2 大中城市居民平均出行次数调查值与模型值比较由图 4-2 可以看出所得到的 2001 年人均日出行次数的回归方程具有较好的回归效果。由于市民每天出行次数的多少与出行目的、城市布局、生活方式、工作方式、家庭经济状况、交通设施、通讯设施、城市环境质量等因素有关,随着社会经济的迅猛发展,人民生活水平也日渐提高,私家车数量大幅增加,城市的交通更加发达,人们之间的联系加强,越来越多的人选择逛街、旅游等休闲方式,综合考虑社会经济的发展带来的影响,修正 2001 年人均日出行次数的回归方程,得到 2013 年人

58、均日出行次数的回归方程:534102.526( 5.4522.3954.616) 10Yvvv (4-8)根据从参考文献各城市 2013 年年鉴上收集到的数据,利用 2013 年人均日出行次数的回归方程(8) ,计算得到相应城市的人均日出行次数,结果如表 4-7 所示。表 4-7 国内主要城市相关的经济指标城市第三产业值(亿元)人均 GDP(元)在岗+职工平均工资(元)主城区人口(万人)出租车数量(辆)大连3281.201112685906136012929北京14986.509321369521197266646广州9964.3012010568594625.3320300武汉4319.70

59、890005374566015637南京4356.5612503064811451.4910732成都4574.237171547644533.9614898杭州3661.989478146831455.4268923深圳8198.10137477626261052.7611433利用表 4-7 中的数据计算八座城市的出租车资源的供求匹配率,结果如表 4-8东北石油大学本科课程设计论文21所示。表 4-8 国内主要城市出行相关信息城市大连北京广州武汉南京成都杭州深圳人均日出行次数2.412.682.272.642.292.762.221.68打车出行比例,%6.2656.95.86.76.66

60、.15.6供求匹配率P1.0936 0.8827 0.9430 0.7040 0.7049 0.7666 0.6583 0.5252 从表 4-8 可以看出,在所研究的八个国内主要城市中,只有大连这一座城市的供求匹配率略大于 1,而其余主要城市的供求匹配率均小于,并且深圳和杭州两地的供求匹配率与 1 相距最远。因此,城市出租车资源供求达到近似平衡的城市为大连,而城市出租车资源供小于求的城市为北京、广州、武汉、南京、成都,严重供小于求的城市为杭州和深圳。4.5.2.2 不同时间的出租车资源的供求匹配由参考文献得到的在不同时刻蚌埠市居民出行的平均比例,将此比例作为成都市居民不同时刻的出行比例,计算得到各时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论