线性回归在运量预测中的运用_第1页
线性回归在运量预测中的运用_第2页
线性回归在运量预测中的运用_第3页
线性回归在运量预测中的运用_第4页
线性回归在运量预测中的运用_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、建设与管理工程学院课程设计说明书课 程 名 称: 物流管理专业综合设计实验 课 程 代 码: 101204309 题 目: 线性回归在运量预测中的应用 年级/专业/班: 2012级物流管理2班 学 生 姓 名: 杨超 学 号: 312012110210219 开 始 时 间: 2016 年 07 月 04 日完 成 时 间: 2016 年 07 月 08 日课程设计成绩:学习态度及平时成绩(30)技术水平与实际能力(20)创新(5)说明书(计算书、图纸、分析报告)撰写质量(45)总 分(100)指导教师签名: 年 月 日物流管理专业综合设计实验任 务 书学院名称: 建设与管理工程学院 课程代码

2、: 101204309 专业: 物流管理 年级: 2012、2013级一、题目 题目自拟选题参考:1、 设计一个物流产品;2、 设计一个产品及其物流系统;3、 针对物流的某项功能要素(如采购、运输、仓储、配送、供应链管理、电子商务等)设计一项综合实验方案;4、 针对某个行业(如汽车行业、零售连锁行业、医药行业、食品行业、电子行业、冷链行业、危险品行业等)物流特征,设计一项该行业物流的综合实验方案。本小组题目: 线性回归在运量预测中的应用 二、主要内容及要求针对物流或流通领域的作业流程,设计一项综合实验方案。形式上可以是(但不限于)以下之一:1. 45人一组,自由组合。题目以小组为单位,提交一份

3、设计方案,要求在报告末尾注明小组成员分工,及各自得分比例(百分比)。2. 格式要求(附后,含目录、摘要、引言、正文、致谢、参考文献)3. 工作量要求:正文部分字数3000以上4. 阶段性要求:每周必须与导师见面,寻求指导;选题须经导师同意后才可进入下一阶段;5. 本课程特别强调实验方案的创新性。设计过程中可参考参考资料中的相关内容,但不能抄袭,抄袭小组将不予成绩且无重新提交报告的资格。6. 提交材料:、最终成果:(装订顺序为:封面、任务书、课程论文,小组成员分工,及各自得分比例(百分比)。)、参考的资料(可以是原始文稿电子文档或纸质件、书、手写的读书笔记、摘抄等反应),共指导教师检查、不存档。

4、三、主要技术路线提示需包括以下内容:1、 设计目的2、 设计任务3、 设计内容(含角色(或岗位)设计)4、 相关流程设计5、 相关数据设计四、进度安排7月4日开始,7月8日结束;分四阶段:1)选题及资料收集;2)方案设计;3)撰写设计说明书;4)提交报告,具体完成时间以及指导时间由指导教师确定。五、参考文献1、深圳市中诺思资讯科技有限公司,1204229西华大学交通运输学院Nos3PL实验指导书V5.02、深圳市中诺思资讯科技有限公司,供应链管理与优化软件实训指导书(学生)3、深圳市中诺思资讯科技有限公司,运输优化与管理系统实训指导书(学生)4、陈立云,金国华,跟我们做流程管理,北京大学出版社

5、5、水藏玺,流程优化与再造:实践实务实例,中国经济出版社 指导老师 签名日期 2016 年7月 1日 系 主 任 审核日期2016 年7 月1 日目 录摘 要- 3 -1.综合设计的设想- 4 -2.实验原理- 4 -2.1实验模型的假设- 5 -2.2实验模型介绍- 5 -3实验目的- 7 -4实验软件- 7 -5实验内容- 7 -5.1手工求解- 7 -5.1.1统计过去的运量- 7 -5.1.2求解运量预测值- 8 -5.1.3预测误差分析的必要性- 9 -5.1.4预测误差分析- 9 -5.2利用软件分析- 10 -5.2.1输入数据- 10 -5.2.2单变量分析- 11 -5.2.

6、3线性回归分析- 12 -实验结论- 14 -致谢- 15 -参考文献- 16 -附件- 17 - 16 -摘 要预测是一项重要的统计工作,信息化走到今天,在各行各业的数据量正在呈指数倍数增长,对数据的处理和分析的重要性也在提高,预测的方法和模型也越来越多,越来越完善。本文是以实际案例通过对流通领域具有代表性的环节运输的预测,分析和说明了预测的基本环节。本文预测的工作线路是:统计和整理实际数据,绘制散点图,确定采用的预测模型,提出模型的假设条件,进行预测并得出未来的预测值,预测检验等步骤。本文在预测的工作中采用了一定量分析为主,定性分析为辅的分析方法,为了提高预测的质量进行了大量的手工计算和S

7、PSS仿真求解。关键词:线性,预测,运量,回归1.综合设计的设想经济生活中的许多现象都不是互相独立的,而是相互作用、相互影响的。一种结果的出现往往是多个因素、多个环节共同作用的导致的结果。当我们需要把握其中的规律时,可以抛开次要因素,抓住具有决定影响的因素,这样我们就可以对未来仿真。在离散、变化的数据背后,它们往往蕴含一定的规律,并且这种规律具有一定的稳定性,如对销售量的分析预测可以发现,销售量在不同季节、不同地区、不同人群中的变化,尽管这种变化是根据过去数据得出的,但根据统计学大数定理,未来的销售量会在过去销售量的中值附近波动,并且越靠近现在,预测值与实际值越接近,比如今天的销售量是100,

8、没有特殊情况,明天的销售量不可能一下子跌成10,如果真出现这样大的反差,是需要考虑其他因素的。本文中,某公司是一家生鲜产品运输公司,该公司需面对现在的业务量,在考虑要不要增加投资、扩大运力,这样的战略决定需要对未来的市场量做预测,如果未来的运输量增加明显,那么公司就需要扩大运力,才能接受更多的业务量。该公司过去一定时期的运量是已知的,公司的主营业务也没发生改变,公司一直经营生鲜农产品运输,主要是果蔬、肉类的运输。对公司运量的影响来自各个客户销售量的变化,公司虽然不能统计到客户的具体销售量、销售变化规律,但是公司的运量是客户销售量的上游变量,它们具有很大的一致性,只是它们充当了流通领域不同的角色

9、而已,所以从公司内部的数据出发来做统计预测是具有合理性的。公司需要来了解未来运量的变化趋势,才能在接受新业务时合理平衡自己的运力,同时可以提高议价能力,所以运量预测是一件基础性的、具有重要经济意义的工作。2.实验原理线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。具体采用哪种回归分析需要根据数据的变化趋势,判断数据的变化趋势,采用散点图来分析,散点图具有直观,容易判断等特点。线性回归分析一般采用直线回归分析,非线性回归分析一般采用曲线回归分析,也可以采用化

10、曲线为直线的方式,但这种方式只适用于曲线波动不大的情况。本文采用的是线性回归,所以重点介绍线性回归,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。在线性回归中,数据使用线性预测

11、函数来建模,并且未知的模型参数也是通过数据来估计。这些模型被叫做线性模型。最常用的线性回归建模是给定X值的y的条件均值是X的仿射函数。不太一般的情况,线性回归模型可以是一个中位数或一些其他的给定X的条件下y的条件分布的分位数作为X的线性函数表示。线性回归是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。这是因为线性依赖于其未知参数的模型比非线性依赖于其位置参数的模型更容易拟合,而且产生的估计的统计特性也更容易确定。2.1实验模型的假设 在运用线性回归分析时需要满足一些条件,满足这样的条件可以大大提高预测的科学性。一般来说这些条件是必须的。 (1)自变量与因变量之间存在线性关系,这可以

12、通过绘制散点图矩阵来考察,如果因变量yi与某个自变量xi之间呈现出曲线,可以尝试通过变量变换予以修正,常用的变量变换方法有对数变换、倒数变换、平方根变换、平方根反正弦变换等。 (2)各观察值间是独立的,即它们的观测残差的协方差是0。 (3)残差服从正太分布。其方差反映了回归模型的精度,越小,所得的回归模型预测值的精度越高。 (4)残差的大小不随所有变量取值水平的变化而变化,即方差齐性。 此外,为了保证参数估计值的稳定,还需要注意模型的样本量要求。有学者认为样本量应当在希望纳入模型的自变量数20倍以上为宜1。比如模型中希望纳入5各自变量,则样本量应当在100以上,少于此数则可能会出现检验效能不足

13、的问题。当然,如果检验结果为有统计学意义,该结论并不可信,但在解释时要更加细化。2.2实验模型介绍 在绘制散点图的基础上可以判断,数据的走势,如果已经确定了为线性回归的走势,就可以采用线性回归预测,线性回归预测的模型一般是直线的回归,可以在此基础上在做调整,直线可以是上升趋势,或者下降趋势,甚至可以使平行的趋势,但是各数据点到直线的的距离必须是最小的,即平方和最小。直线回归法是处理函数y(预测值)与变量x(影响因素)之间线性关系的一种应用比较广泛的公式。基本的模型如下。y=a+bx式中:y预测值; x统计期的影响因素; a回归系数,指直线在y轴上的截距; b回归系数,即直线的斜率。 要用直线回

14、归法预测运量y,关键是求得回归方程,已即确定回归系数a与b,一旦回归系数a与b确定,回归直线也就确定了。 假设:为统计期的运量,为对应第i统计期的变量,i=1,2,3,n,为预测期的运量,s为偏平方和,a为直线的截距,b为直线的斜率,n为统计期数,则此回归直线方程为:2将直线回归方程带入偏差平方和方程可以得到下式:2回归系数的值由下式确定: 计算出系数a,b之后,回归方程就能确定下来,由此回归方程,就可以预测出运量。当自变量为时间ti时,我们可以通过恰当地移动坐标,使,此时可使计算a,b的公式简化如下: 确定的方法如下:(1)若n为奇数,则取ti的时间间隔为1,将t=0置于资料统计期的中间一期

15、,其上为负值,其下为正值。(2)若n为偶数,则取t的时间间隔为2,t=-1与t=+1置于资料中央的上、下两期。2 将回归系数a、b求出之后,便可用直线方程y=a+bt,求出以后各期的预测值。3实验目的 对公司以往数据的分析挖掘有用的经济信息,通过预测,达到估测未来业务增长情况目的,提升公司现在的管理水平,科学做出决策方案,以应对未来的挑战。4实验软件 实验软件是SPSS。SPSS的全称是:Statistical Program for Social Sciences(社会科学统计程序),是统计产品与服务解决方案软件。该软件是公认的最优秀的统计分析软件包之一,也是当今世界上应用最为广泛的统计分析

16、软件。作为统计分析工具,它理论严谨、内容丰富,包括了数据管理、统计分析、趋势研究、制表绘图、文字处理等功能。目前SPSS已运用到经济学、数学、统计学、物流管理、生物学、心理学、地理学、医疗卫生、体育、农业、林业、商业等各个领域。5实验内容5.1手工求解 该公司以往的运量以月为单位,预测期的单位也以月为单位,通过对该公司过去3年,即36个月的实际运量值,预测未来一年的运量。预测求解的技术线路是:统计过去的数据、将过去的数据绘制散点图、判断散点图的走势、选定自变量、预测未来个12的运量、作预测误差分析。5.1.1统计过去的运量过去的运量值的单位为吨,统计期是36个月,各期的数据见附件1,通过过去的

17、数据绘制散点图,散点图如下图所示。图1 运量散点图从散点图中可以看出,过去36个月的运量具有良好的线性回归趋势,所以采用线性回归预测是合理的。5.1.2求解运量预测值求解运输量的预测值需要求解回归直线,计算回归直线就需要知道a,b,求解a,b的值由下式决定: 式中,的求解需要根据过去36个月的各期实际运量来确定,根据附加1的值,可以将它们求解出来,求解的结果见附件1。根据附件1的结果可以计算出a,b的值。根据a,b的值就可以确定直线回归方程,y=21685.19+185.9064ti,预测的时间是从2016年4月到2017年3月,一共12个月,ti表示时间值,但它不是具体的时间,由于过去的数据

18、一共有36个月,是个偶数,所以在过去的月份里,最中间的ti值分别取得是-1、1,在过去整个统计期,ti的值的取值是从-35到+35,每相邻两个数值的间隔是2。 在未来的12个月,ti的间隔值应该保持与过去统计期的间隔值一致,都取为2,所以未来12个月,ti的值是从37到59,并且没相邻两个ti的间隔是2。将各个月份对应的ti带入y=21685.19+185.9064ti就可以求出未来12个月的运量预测值了,预测值的计算结果见附件2。5.1.3预测误差分析的必要性统计预测是一种估算,既然是估算,那么其结果与实际情况就存在着一定的偏差,也即是预测结果不可能完全准确,这个差距就是预测误差。预测误差是

19、个变量,在统计预测中是不可避免的,但我们可以深入研究产生误差的原因,计算并分析误差的大小,将预测误差适当地加以控制,提高预测结果的准确性。统计预测方法分为定性预测方法和定量预测方法,且由于统计学的数量性特征使得统计预测的主体无疑是定量预测,但无论是哪一种,统计预测都要求我们得到一个被量化的结果,这无疑是对我们的预测的准确性有一个很大的要求。从预测中的任何一个环节或者是被要求的一个量化结果来看,其实都是会导致误差存在的一种体现,甚至于说没有一个模型是完全正确的、没有一个结果是与实际分毫不差的。我们将来自信息与方法两方面的误差统称为“规范错误”,既是规范性的错误,那么则是可以允许且可以减小的,而针

20、对由于未来不确定性导致的预测失误则是难以避免的,一旦出现没有预知到的意外,那么统计预测基本原则中的类推性原则会被破坏,这种结构性的改变会使数据和模型完全不适用,因此我们在这里着重分析来自前两个方面的误差。统计预测中方法的选择实际上就是对模型的确定,因此是很重要的一部分。首先我们要知道没有一个模型是完全符合的,我们只需要找到最优的那一个,所以要针对数据和预测目的确定。来自方法的预测误差往往是由偏离数据和目的造成的,例如在回归预测中的最小二乘法其实要求的就是对数据的拟合使残差平方和最小,但是如果一味地增加变量以使数据拟合达到最好反而会使变量的增加毫无意义,因此难以达到预测目的。模型的建立是依据理论

21、将信息科学规范化,这种科学性不仅体现在要对症下药,还体现在考虑预测的大环境,比如虚拟变量的影响,周期性的影响等。5.1.4预测误差分析为了鉴别回归直线方程对预测值的可靠程度及其可能的波动范围,需要计算直线数值与实际数值之间的标准差。其计算公式如下:计算的结果 再依据方程式y=21685.19+185.9064ti,计算y,就可以得出考虑误差的y值。按照正太分布的条件,则预测值y的范围,当预测精度为95%时,y在y2的范围内,也就是在2016年4月,预测值是28560.730162624.886,即在2731129810.5范围内,从2016年4月到2017年3月,这12个月的预测精度都按照95

22、%计算,可以计算出它们的波动区间。 5.2利用软件求解 SPSS的全称是:Statistical Program for Social Sciences(社会科学统计程序),是统计产品与服务解决方案软件。该软件是公认的最优秀的统计分析软件包之一,也是当今世界上应用最为广泛的统计分析软件。作为统计分析工具,它理论严谨、内容丰富,包括了数据管理、统计分析、趋势研究、制表绘图、文字处理等功能。目前SPSS已运用到经济学、数学、统计学、物流管理、生物学、心理学、地理学、医疗卫生、体育、农业、林业、商业等各个领域。5.2.1输入数据利用SPSS做数据统计分析,必须争取输入数据,定义数据的类型,这样才能使

23、各类数据得到合理的运算。数据的定义如下:图2 定义数据 完成数据后,就可以直接在SPSS表格里面输入数据,这跟EXCEL几乎一样,由于篇幅所限,输入的部分数据如下图所示:图3 输入的前10组数据5.2.2单变量分析 单变量分析就观察一个变量的变化,从而发现该变量的内在趋势。以运量为单变量,操作如下:图4 输入因变量表1 描述性检验该表输入的标准偏差是3968.224,它是在36组过去的运量的基础上得出的,平均数是21682.19,相对于平均数来说,该标准偏差较大。表2 效果检验 从显著性可以看出显著性小于0.0001,所以表格里面无法显示,所以该模型可以接受,该模型的参数值表示在了“第类平方和

24、”列,截距为1.692E+10,显然拒绝了原假设,平均运量为0,在这里截距没有多大意义。5.2.3线性回归分析图5 选定变量表3 模型概要表4 变量数分析表5 系数对以上几个表的内容可以解释为:运量回归的显著性很强,完全符合线性回归,所以他的显著性小于0.001,表变量数分析表示了模型的回归系数a,b是由很高可行性的。系数处理了月份之一自变量,T的值与前面第二部分非常接近,从-35到+35,这里是SPSS处理为-35.723到+36.129,二者具有极大的相似性。实验结论 通过对某公司运量的预测,我加深了对预测模型的理解和运用,同时加强了利用SPSS仿真的能力。虽然预测是一种假设,但是预测具有

25、一定潜在的价值,尤其是在信息爆炸的今天,市场经济的关系已经越来越复杂,挖掘有用的经济信息,可以极大提高市场竞争力。本次的运量预测通过手工求解与软件分析相结合,二者是相辅相成的,手工求解是要加强基础工作,软件求解是从更高层面来检验,调试模型,本次的模型通过SPSS可以看出,具有极大的实用价值,该公司可以作为参考数据,对公司战略决策有一定的统计意义。在建模和软件仿真中,我还有很多问题,以后还要提高运用模型的能力。致谢在实验设计中,指导老师给出了重要的参考意见,在这里我向老师表示感谢。在实验设计中,我运用了SPSS软件,我很感谢牟峰老师在SPSS课堂上给我们的深刻讲解,虽然我对软件还有很多不懂的地方

26、,但实际的学习和工作中我对SPSS强大的数据分析效用的认识在加强。在这里我向在实验设计中为我提供实验数据的运输公司也表示感谢,感谢你们的支持。参考文献1 张文彤,董伟.SPSS统计分析高级教程M.北京:高等教育出版社.2013.98.2 李维斌.公路运输组织学M.北京:人民交通出版社.1998.59.附件附件1月份运量yi(吨)tiyititi22013年4月14760-35-51660012252013年5月15472-33-51057610892013年6月16423-31-5091139612013年7月16110-29-4671908412013年8月17230-27-4652107292013年9月15478-25-3869506252013年10月17367-23-3994415292013年1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论