(企业管理专业论文)组合预测模型在集装箱生成量预测中的应用研究.pdf_第1页
(企业管理专业论文)组合预测模型在集装箱生成量预测中的应用研究.pdf_第2页
(企业管理专业论文)组合预测模型在集装箱生成量预测中的应用研究.pdf_第3页
(企业管理专业论文)组合预测模型在集装箱生成量预测中的应用研究.pdf_第4页
(企业管理专业论文)组合预测模型在集装箱生成量预测中的应用研究.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

(企业管理专业论文)组合预测模型在集装箱生成量预测中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

组合预测模型在集装箱生成量预测中的应用研究 摘要 伴随着预测科学的发展,各种非线性预测方法成为经济领域预测研究的重 点。但是,由于有些预测对象的复杂性、预测所需信息的不完备性以及对模型 设定形式的敏感性,导致采用单个预测模型对其进行预测风险较大。为了分散 预测的风险,根据事物发展规律选择合适的组合预测模型提高预测准确性,具 有非常重要的作用和意义。本文旨在构建合适的组合预测模型对我国快速发展 的区域集装箱生成量进行预测,为集装箱运输规划提供理论依据。 本文首先对预测理论和方法进行了综述;其次分析了影响集装箱生成量的 国民经济发展状况、对外贸易发展水平、产业结构等宏观经济因素和外贸进出 口额、集装箱适箱货率等微观影响因素,并在此基础上构建了集装箱生成量组 合预测模型;最后以合肥地区集装箱生成量预测为实例,应用多元线性回归、 灰色理论、b p 神经网络、可拓聚类四个单项预测模型和组合预测模型分别对其 进行预测,检验并分析各单项预测模型和组合预测模型的预测准确性。 关键词:集装箱生成量;影响因素;预测模型 r e s e a r c ho nt h ea p p l i c a t i o no fc o m b i n e df o r e c a s t i n gm o d e l i nt h ef o r e c a s t i n go fc o n t a i n e ra c c u m u l a t i o n a b s t r a c t a l o n gw i t ht h ed e v e l o p m e n to ff o r e c a s t i n gt h e o r y , i t sp o p u l a rt ou s en o n l i n e a r f o r e c a s t i n gm e t h o d s b u ta sar e s u l to ft h ec o m p l e x i t yo fs o m ef o r e c a s t i n go b j e c t ,l i m i t e d i n f o r m a t i o nr e s o u r c e sa n ds e n s i t i v i t yt o h y p o t h e s i s ,t r a d i t i o n a li n d i v i d u a lf o r e c a s t i n g m o d e l sh a v es o m es h o r t c o m i n g s i no r d e rt os p r e a dr i s k ,i t sv e r yi m p o r t a n tr o l ea n d s i g n i f i c a n c et oa n a l y s e sd i f f e r e n tc o m b i n e df o r e c a s t i n gm o d e l s ,c h o o s es u i t a b l ec o m b i n e d f o r e c a s t i n gm o d e l sa c c o r d i n gt ot h ed e v e l o p m e n to ft h i n g st oi m p r o v ep r e d i c t i o na c c u r a c y t h i sp a p e rs e e k st om a k eas u i t a b l ec o m b i n e df o r e c a s t i n gm o d e lf o rt h ef a s tg r o w i n g r e g i o n a lc o n t a i n e ra c c u m u l a t i o n ,a n dp r o v i d ec o n s t r u c t i v ef o u n d a t i o nf o rt h ed e v e l o p m e n t o fc o n t a i n e rt r a n s p o r t a t i o n t h i sp a p e rf i r s tc a r r i e so nt h es u m m a r yo ft h ep r e d i c t i o nt h e o r i e sa n dt h em e t h o d s ; t h e na n a l y z e st h ei n f l u e n c i n gf a c t o r sf o r mm a c r oe c o n o m yf a c t o r ss u c ha st h ec o n d i t i o n s o fn a t i o n a le c o n o m yd e v e l o p m e n t ,t h el e v e lo fi n t e m a t i o n a lt r a d i n g ,t h ei n d u s t r i a ls t r u c t u r e , a n dt h em i c r oi n f l u e n c i n gf a c t o r ss u c ha st h ef o r e i g n e ru a d ei m p o r ta n de x p o r tv o l u m e ,t h e r a t eo fs u i t a b l eb o xg o o d so fc o n t m n e r a n db a s e do nt h ew o r k i n ga b o v e ,t h i sp a p e r c o n s t r u c t sc o m b i n e df o r e c a s t i n gm o d e lo fc o n t a i n e ra c c u m u l a t i o n ;f i n a l l yt a k e st h e p r e d i c t i o no fc o n t a i n e ra c c u m u l a t i o no fh e f e ia sa ne x a m p l e ,t h i sp a p e rc a r r i e so n p r e d i c t i o n s e p a r a t e l yb ym u l t i p l el i n e a rr e g r e s s i o nm o d e l ,g m ( 1 ,1 ) m o d e l ,b pn e u r a l n e t w o r km o d e l ,e x p a n s i o nc o l l e c t i o nf o r e c a s t i n gm o d e lf o u ri n d i v i d u a lm o d e l sa n d c o m b i n e df o r e c a s t i n gm o d e l ,e x a m i n e sa n da n a l y z e st h ea c c u r a c yo fe a c h f o r e c a s t i n g m o d e l k e y w o r d s : c o n t a i n e ra c c u m u l a t i o n ;i n f l u e n c i n gf a c t o r s ;f o r e c a s t i n gm o d e l s l v 插图清单 图2 - 1 因果关系模型图6 图2 - 2b p 神经网络拓扑结构图l3 图2 - 3b p 算法框架图1 5 图3 - 1 集装箱生成量微观影响因素图2 3 图5 - i 合肥地区历年集装箱生成量统计图3 0 图5 - 2 二元线性回归返回值3 1 图5 - 3g m ( 1 ,1 ) 模型程序代码3 3 图5 - 4g m ( 1 ,1 ) 模型返回值一3 4 图5 - 5b p 神经网络模型程序代码3 5 图5 - 6b p 神经网络训练精度图3 6 表格清单 g m ( 1 ,1 ) 模型精度判定表1 2 合肥地区历年g d p 、t i e 、集装箱生成量统计数据表3 1 二元线性回归模型预测值及误差表3 2 g m ( 1 ,1 ) 模型残差检验表3 4 b p 神经网络预测值和误差表3 6 合肥地区历年g d p 、t i e 、外贸集装箱生成量统计数据表3 7 合肥地区g d p 、t i e 、外贸集装箱生成量年增长率表3 7 模型预测值和误差汇总表3 7 模型预测值和误差汇总表3 9 2 0 0 8 年合肥地区集装箱生成量预测表3 9 组合预测权系表3 9 组合预测模型预测值和误差表4 0 2 0 0 8 年合肥地区组合预测模型预测值表4 0 i x ) l l 1 2 3 4 5 6 6 7 8 9 1 l 一 一 一 一 一 一 一 一 一 一 一 一 一 2 5 5 5 5 5 5 5 5 5 5 5 5 表表表表表表表表表表表表表 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知,除了文中特别加以标志和致谢的地方外,论文中不包含其他人已 经发表或撰写过的研究成果,也不包含为获得 金壁王些太堂 或其他教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已 在论文中作了明确的说明并表示谢意。 学位论文作者签字:1 产立签字日期:7 呷年午月少日 学位论文版权使用授权书 本学位论文作者完全了解 盒胆王些态堂 有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅或借 阅。本人授权 金壁王些太堂 可以将学位论文的全部或部分论文内容编入有关数 据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文者签名:蚤j 建立 签字日期: 如产年月少日 学位论文作者毕业后去向: 工作单位: 通讯地址: 翮躲办同 签字日期:夕。叩年华月加日 电话: 邮编: 特别声明 本学位论文是在我的导师指导下独立完成的。在研究生学习期间,我的导 师要求我坚决抵制学术不端行为。在此,我郑重声明,本论文无任何学术不端 行为,如果被查出有任何学术不端行为,一切责任完全由本人承担。 致谢 时光飞逝,两年半的硕士生活即将结束。在即将完成我的硕士学位论文的 时刻,一股掺杂着离别、憧憬的复杂情绪涌入我的心头,许多人的身影也随之 浮现在脑海中。在攻读硕士学位期间,他们的无私帮助和关怀,使我受益匪浅。 首先,我要向辛勤培养我的恩师李兴国教授表达崇高的敬意和由衷的感谢。 本论文是在李老师的精心指导下完成的。从论文的选题、资料的收集、章节的 安排、内容的调整以及最后论文的定稿、送审,李老师都给予了悉心指导。李 老师广博的学识、严谨的治学态度、诲人不倦的育人精神、积极开拓的科研精 神、平易近人的作风都给我留下了深刻的印象,对我产生了深远影响,使我在 学习以及生活中不断审视和修正自己的行为和思想。 回顾这几年的经历,李老师对我的学习、生活给予了全方位的关怀,并且 一直在竭尽全力为我创造各种平台。师从李老师是我一生最宝贵的财富,也是 我人生的重要转折点。说不尽的谢谢也难以表达我内心对李老师的感激之情, 惟有铭记李老师所教导的做人、做事、做学问的态度,在以后的人生路上不断 进取,以实际行动感谢李老师的浩大师恩。 感谢信息管理所的钟金宏老师、卢光松老师以及我在合肥工业大学求学期 间教授过我的所有老师们,他们治学严谨、诲人不倦、关爱学生的品德是我终 生学习的榜样。 感谢芜湖港航管理局李稀茂、徐辉、张洪庆等领导在搜集文献资料方面给 予的巨大帮助。 感谢同窗田冲、谢伟、李晓凤、席玮、刘柱、向寒坤、李文涛、丁洪涛、 曹凯峰、马艳、黄书慧等在学习生活中对我的帮助。感谢0 6 级2 4 班的所有同 学,与他们的真挚友谊是我一生的荣耀。 我特别要感谢我的家人,感谢他们给予我人世间最伟大和最无私的爱。他 们的鼓励与督促是我前进的动力。 深深感谢所有关心、支持、鼓励和帮助过我的老师、同学、亲人和朋友们。 难忘我的母校一一合肥工业大学! 最后,感谢对本文进行评审和提出宝贵意见的各位老师和专家。 v 作者:王超 2 0 0 9 年4 月 第一章绪论 1 1 研究背景 1 1 1 集装箱运输的发展要求 集装箱运输是人类运输史上一次重大的革命。l8 0 1 年,英国人安德森 ( j a m e sa n d e r s o n ) 博士首先提出了集装箱运输的设想。18 5 3 年,美国铁路也 采用了容器装运法。这是世界上最早出现的集装箱运输的雏形。19 3 3 年,国际 集装箱协会在法国巴黎成立,负责制定统一的集装箱标准。1 9 5 5 年,美国人麦 克林( m a l c o mm c l e a n ) 首先提出了集装箱运输必须实现海陆联运的观点,为 了便于海陆联运,他主张陆运和海运由同一个公司控制和管理。此后,集装箱 逐渐普及于国际运输。目前,集装箱运输已遍及全球,发达国家件杂货运输的 集装箱化程度己达8 0 以上u 1 。 中国集装箱运输是从2 0 世纪5 0 年代开始起步的。2 0 世纪7 0 年代,中日 两国开展海上集装箱试运,标志着我国海上集装箱运输正式启动。1 9 7 9 年,我 国开展集装箱运输的主要港口共完成吞吐箱量3 3 万标箱。1 9 9 7 年中国大陆集 装箱吞吐量突破1 0 0 0 万标箱大关,2 0 0 7 年,这个数字已超过1 1 4 亿标箱。2 0 年间,中国在世乔港口集装箱运输史上创造了惊人的发展奇迹n 1 。 1 1 2 预测技术的发展与应用 预测是适应社会经济的发展和管理的需要而产生、发展起来的。预测作为 一种社会实践活动,己有几千年的历史,它是社会经济活动中的重要环节,在 制定经济、科学技术和生产发展规划时,预测是一项重要的内容。目前,发达 国家广泛采用预测理论和科学的预测方法,用来探索有关人口、粮食、资源、 能源、城市规划、交通运输、科学技术、情报信息、自动化、外层空间、教育、 人才、环境、医药卫生等重大问题的未来发展趋势,并能动的控制其发展。由 此看来,预测科学与各个学科、各个部门和各个领域都有密切的联系。 用于经济领域的预测方法种类繁多,目前常用的有几十种之多。每种预测 方法都有自己的特点、用途以及适用范围。在具体的应用过程中,选择合适的 模型、确定适用有效的方法是成功的关键。有时也可以同时采取几种方法进行 预测,以便相互检验和补充u 。 经济预测的方法基本可以分为两大类,一类是定性预测,一类是定量预测。 定性预测方法又被称为经验判断法。它是根据己掌握的历史资料和现实材 料,凭借个人的经验、知识和分析判断能力,对预测对象未来发展趋势作出性 质和程度判断。由于定性预测方法主要是凭借个人的知识、经验和分析能力来 进行,因此对于一些缺乏历史资料,或影响因素复杂且难以分清主次,或对主 要影响因素难以进行定量分析的情况时,使用这种预测方法最为有效的。常用 的定性预测方法有德尔非法、形态分析法、消费意见调查预测等方法。 定量预测方法又称数学分析法,是在占有各项有关资料的基础上,根据经 济预测的目标,选择合适的数学模型进行预测,然后根据经济环境变化情况加 以分析,以取得所需要的预测值的方法。定量预测方法又可分为时间序列预测 法和因果关系预测法哺。 由于有些预测对象的复杂性、预测所需信息的不完备性以及对模型设定形 式的敏感性,导致采用单个预测模型对其进行预测风险较大。因此采用单个预 测模型进行预测往往难以达到较为理想的预测效果。为了分散预测的风险,组 合预测方法应运而生并愈发引起重视和加以推广瞪1 。 1 2 研究目的和意义 随时经济全球化进程的加快,我国经济的不断发展以及加入w t o 以来带 来的巨大商机,可以预见未来我国的国内外贸易量将会不断提高。活跃的贸易, 推动了集装箱生成量的增长,原有落后的集装箱运输体系已经不能满足日益增 长的集装箱运输要求。在集装箱运输系统的研究和规划中,一个基础工作就是 要对集装箱生成量进行预测。其在确定港口的发展方向、基础设施投资规模、 泊位选址和港口经营策略等方面都起着重要的作用。 预测效果的准确与否不仅影响区域集装箱运输的投资决策,同时也直接关 系到未来区域内集装箱运输的发展。本文试图通过研究现有集装箱生成量预测 方法,结合组合预测相关理论对区域集装箱生成量进行预测,为集装箱运输的 发展提供理论依据。 1 3 论文结构 本文在综述常用经济预测模型和分析集装箱生成量影响因素的基础上,建 立多元线性回归模型、灰色模型、b p 神经网络和可拓聚类模型四个独立的经济 预测模型,再根据前三个独立的模型选用合适的标准建立相关的组合预测模型, 并结合历年合肥地区集装箱生成量的统计数据验证模型的准确性。 第一章绪论。简介国内外集装箱运输发展和预测技术发展的现状,介绍 本文的研究目的、意义和论文结构。 第二章预测方法综述。介绍常用的经济预测模型。 第三章集装箱生成量影响因素分析。从宏观和微观两方面分别阐述集装 箱生成量的影响因素。 第四章集装箱组合预测模型。分析集装箱生成量预测模型的适用性,研 究组合预测模型在集装箱生成量预测中的应用。 第五章应用实例。结合前章介绍的预测方法和统计数据对合肥地区集装 箱生成量进行预测,检验组合预测模型在实际预测中的准确度。 第六章总结与展望。总结全文研究工作,对今后的工作作出展望。 第二章预测方法综述 经济预测的质量取决于对客观经济现象深入了解的程度和所采用的预测方 法的科学性,其中也包含着对经验判断的重视和吸取。目前,国内外常用的用 于集装箱生成量预测的方法可以分为定性预测法、因果关系预测法、时间序列 预测法三类7 1 。 2 。1 定性预测法 2 1 1 定性预测法的概念和特点 定性预测是指预测者依靠熟悉业务知识、具有丰富经验和综合分析能力的 人员与专家,根据已掌握的历史资料和直观材料,运用个人的经验和分析判断 能力,对事物的未来发展作出性质和程度上的判断。然后,再通过一定形式综 合各方面的的意见,对事物未来发展状况与趋势进行的推测和判断。 定性预测的优点在于:注重于事物发展在性质方面的预测,具有较大的灵 活性,易于充分发挥人的主观能动作用,且简单的迅速,省时省费用。其缺点 是:易受主观因素的影响,比较注重于人的经验和主观判断能力,从而易受人 的知识、经验和能力的多少、大小的束缚和限制,尤其是难以对事物发展做数 量上的精确描述哺1 。 2 1 2 常用定性预测方法 定性预测法一般用于缺乏历史统计资料或者影响因素在可预见的未来会发 生重大变化时更多地需要专家经验的情况进行预测,如新技术发展趋势的预测 等。常用的定性预测方法有:德尔菲法,专家会议法,领先指示法等。 ( 1 ) 德尔菲法 德尔菲法是根据有专门知识的人的直接经验,对研究的问题进行判断、预 测的一种方法,也称专家调查法。他是美国蓝德公司于19 6 4 年首先用于预测领 域的。 它根据有专业知识的人的直接经验,采用系统的程序,互不见面和反复进 行的方式,对某一未来问题进行判断。首先,草拟调查提纲,提供背景资料, 轮番征询不同专家的预测意见,最后再汇总调查结果。对于调查结果。要整理 出书面意见和报表。这种方法,具有匿名性,费用不高,节省时间。采用德尔 菲法要比一个专家的判断预测或一组专家丌会讨论得出的预测方案准确一些, 一般用于中长期的预测。 ( 2 ) 专家会议法 专家会议法又称之为集合意见法,专家会议法是指根据规定的原则选定一 定数量的专家,按照一定的方式组织专家会议,发挥专家集体的智能结构效应, 对预测对象未来的发展趋势及状况,作出判断的方法。“头脑风暴法”就是专家 会议预测法的具体运用。 ( 3 ) 领先指标法 + 领先指标法就是通过将经济指标分为领先指标,同步指标和滞后指标,并 根据这三类指标之间的关系进行分析预测。领先指标法不仅可以预测经济的发 展趋势,而且可以预测其转折点饽1 。 2 2 因果关系法 2 2 1 因果关系法概念和特点 因果关系预测法是把客观事物之间内在的因果关系,转换成一种数学语言, 找出自变量和因变量,用一种近似的函数关系表示出来,并依靠历史统计数据, 建立相应的数学模型( 因果模型) ,然后根据自变量的数量变化预测因变量变化 的预测方法。因果关系预测比较适用于事物之间的因果关系清晰,而且又具备 比较全面的横向统计数据资料的情况。根据反映因果关系的方程多少不同,因 果关系预测主要有单方程的因果回归模型,联立方程的经济计量模型等。 该模型的主要特点是有清晰的模型结构,且能很好的解释各种影响因素与 预测对象之间的相互关系。因果关系模型在2 0 世界6 0 年代的预测领域处于主 导地位,至今仍在经济建模和分析控制领域处于重要地位。但是,因为在实际 的应用过程中中,任何事物的变化都是未知的,很难将影响因素以及它们的变 化趋势进行准确量化,使得预测结果受到影响叫。 2 2 2 因果关系法在集装箱生成量预测中的应用 目前,国内外学者对因果关系法在集装箱生成量预测中的应用都有一定的 研究。笔者通过阅读大量文献,把因果关系模型建模机制概括为如图2 1 所示, 并认为应重点分析以下因素并加以量化: ( 1 ) 根据区域内经济发展状况和发展趋势,以及外向型经济发展趋势,预测 未来对外贸易发展趋势。 ( 2 ) 根据外贸的主要货种结构,分析可用于集装箱运输的货物比率,即适箱 货率。随着我国产业结构的调整和产品结构的升级,外贸结构也得到不断的优 化和升级,集装箱运输水平不断提高,适箱货率有逐渐提高的趋势。 ( 3 ) 根据对区域内外贸货物结构及货物价值的分析,确定单位外贸额货物集 装箱生成量转化系数,即单位外贸额货物的集装箱生成量。其受f 反两方面因 素的影响,一方面随着高附加值外贸产品的增加,生成量无疑将会逐渐减少: 另一方面,由于集装箱运输水平的提高,一些低价值产品也可以利用集装箱进 行运输。因此,要作具体分析。 ( 4 ) 由于受运输价格以及集装箱运输水平等诸多因素的制约,并非所有适合 集装箱运输的货物都可以充分利用集装箱进行运输。集装箱装箱率反映了在所 有适合装箱的货物中,实际进行集装箱运输的比率。其与集装箱运输水平关系 密切。在我国长江三角洲、珠江三角洲以及沿海省份等经济较发达的地区,顺 应国际贸易运输的发展趋势,集装箱发展水平较高,装箱率比长江中上游地区 以及其他内陆省份要高。 ( 5 ) 同时由于区域经济发展和集装箱运输发展的不平衡,为了满足一个区域 的集装箱运输的需求,往往需要对该区域调运空箱。在进行建模时,需要考虑 调运的空箱占该区域集装箱运输总量的比率,即空箱率1 。 区域内国民经济及外向型经济发展趋势分析 区域外贸进出【 值 区域外贸适箱货物金额 区域夕 贸适箱货物重量 区域集装箱重箱生成量 适箱货金额比重 适箱货重量系数 适箱货装箱化率 平均箱重 空箱率 区域集装箱生成量 图2 1 因果关系模型图 根据以上分析,可建立多因素因果关系模型: q = v k 1 k 2 k 3 k 4 k 5 其中:q一一集装箱生成量( t e u ) ; y 一一外贸进出口额( 亿美元) ; k 一一外贸适箱货金额比重( ) : k ,一一外贸适箱货生成系数( 吨亿美元) ; k 一一适箱货箱化率( ) ; 疋一一平均箱重( 吨) ; k 。一一空箱率( ) 。 2 3 时间序列法 时间序列法是2 0 世纪7 0 年代以来预测科学领域的主流趋势。该类预测方 法的主要思想是根据事物过去和现在的变化规律来观测数据,把客观事物发展 的自身的内在动力或惯性趋势,转换成一种数学语言,用不同时期或时点上的 变量间变化关系表示出来,考察变量随时间的发展变化规律,用变量以往的纵 向统计资料建立数学模型( 时序模型) 进行外推预测的方法。时间序列预测法 一般在客观事物发展内在趋势明确,又具有纵向统计资料的情况下使用。常用 的时间序列预测模型主要有多元线性回归、灰色模型、人工神经网络、可拓聚 类、指数平滑等模型引。 2 3 1 线性回归模型 ( 1 ) 一元线性回归模型 设x 是可控变量,】,是依赖于x 的随机变量,他们的关系是y = 口+ 触+ g , 其中口、是常数,占服从正态分布n ( 0 ,仃2 ) 。x 是一个解释变量,又称为自变 量,这个量是确定的,因而是可控制的变量;y 称为解释变量,又称为因变量, 由于受随即干扰的影响,所以是一个随机变量。x 与y 的这种关系称为一元线 性回归模型。 在实际预测中,根据统计数据( ,m ) f - 1 ,2 ,以,估计出线形模型的参数 口、并记作口、。通常求估一元线性回归模型的回归系数由两种方法:一 类是直观的简单方法,例如平均值法、目估作图法,其预测精度较低,适用于 只获取描述性预测的用户。另一类是相对复杂但较精确的方法,例如最小二乘 法、最大似然法等方法,适用于较严密的定量预测。最小二乘法是实际预测中 最常用的方法。 ( 2 、) 多元线性回归模型 通常经济领域中的许多问题,一个经济变量往往受多个因素的影响。为了 描述多个影响因素与经济变量之间的关系,需要建立多元回归模型进行预测。 并且当每个影响因素与经济变量之间的关系可以近似的线性表示,这时可以建 立多元线性回归模型进行分析和预测。 假设在某个问题中,有p 个影响因素x i ,x 7 ,嘣,影响因变量y ,并这些变量 之间有统计的线性关系,其多元线性回归模型可以表示为: 少2 + b l x t + b 2 x 2 + 一+ b p x 口+ s 其中,占是随机干扰项,服从正态分布n ( o ,仃2 ) ,既是待估参数。为求出待估参 数b o ,b l ,6 2 一b 。及仃2 的值,需要对y 以及做刀次观察,于是有: 只= b o + b l x l f + b 2 x 2 f + + b p x 讲+ 乞 f = 1 ,2 ,一,力 其中n ( o ,万) f = 】,2 ,一,? ,是相互独立的随机变量。 这种模型的回归方程为:e ( y ) = b o + b j x l + 包恐+ + b p x 口 根据样本数据,求出参数的估计值,并进行统计检验,是建立回归模型的 基本任务。 记参数的估计值为盯,b o ,b l ,6 ,则相应的回归模型为: y = b o + b , 而+ 6 2 而+ + 6 px p 通过最小二乘法求b o ,2 j l ,如的值,作离差平方和: 月 。 一 q = ( 只一m ) 2 善( m b o b l x i l - 6 2 z 。) ,并使q:mini r - i,l l 。”一 署一2 喜( 儿奇一。 鬻一2 喜( 乃电w 轳。 考卅善n ( 肭吨一w 一 这个方程组称为正规方程组,解即可得到b o ,2 j 1 ,6 2 的值。 上述参数求解的过程,也可以用矩阵表示,令: x = 1 而i 而1 l 五2 嘞 1 葺疗x 2 。 b = b o 6 l 6 2 b , y = m y 2 y n 可表示为:x 7 x b = x 7y 。 如果x r x 的逆矩阵存在,其解可以写成:b = ( x 7 x ) 。1 x 7 y 。 ( 3 ) 多元线性回归模型的显著性检验 拟合优度检验: 采用最小二乘估计法已经保证了模型最好的拟合了样本观测值,选择合适 的估计方法所保证的最好拟合,是同一个问题内部的比较;拟合优度检验结果 所表示的优劣是不同问题之间的比较,反映的是构造的模型与观测值之间总体 的拟合程度。 构造复相关系数:r = 主( 多,一多) z ,= 1 yf1 一1 ,、2 r 衡量了全部自变量与而,砭,x p 与因变量j ,之间的线性关系密切程度,其 数值的大小不仅与样本的观测值有关,还与样本容量的大小有关。因此,在计 算出r 后,还必须通过统计检验才能肯定所建模型对观测值得拟合程度。 复相关系数的平方称为复可决系数: 窆( 只一五) z窆( 五一多) :- j 、t o1o 0 loj r 2 = 1 一生一= j 蔓 nh ( 咒- y ) 2 ( m - y ) 2- _ j 同时,我们记: 总体平方和t s s = ( 咒- y ) 2 回归平方和 剩余平方和 1 1 一 e s s = ( 多,一y ) 2 i - - l r j r s s = ( m i , 玢r 一、。i l i = l 所以复可决系数可以表示为:r :】一竺竖= 鱼墅 tsst s s 复可决系数r 2 是检验多元线性回归模型拟合优度的度量指标,r 2 的变化范 围是在0 到l 之间,r 2 越接近1 ,表示拟合的越好,反之则拟合得不好。拟合 效果不好的原因是模型中引入的某些解释变量并不是有效的,必须进行调整, 重新进行拟合。 回归方程的显著性检验: 对于多元线性方程,必须检验其是否显著成立,即因变量y 与自变量 五,x 2 ,z 。之间的总体线性关系是否显著成立,通过构造统计量f 进行检验。 提出原假设: 风:6 1 = 6 2 = = b 。= 0 对立假设:h :线性回归方程显著成立。 丢y t 一衍蠊 e s s 唔 计算统计量:f 2 芝1 7 五莓aj i 而2 画西不i i 面 百 给定的口,查f 分布表,得临界值t ( 尼,以一k 一1 ) 。 判断:当f 时,拒绝凰,认为原假设不成立,回归方程显著; 当f e 时,接受风,认为原假设成立,回归方程不显著。 回归系数的显著性检验: 若回归方程显著成立,回归系数不全为零。但是,并不能意味着每一个自 变量对因变量都是重要的,如果某个自变量对因变量的影响不显著,就需要把 它从回归模型中剔除掉,重新建立更为简单的回归方程,以利于对y 进行更精 9 确的预测。 为此,需要对每一个回归系数进行检验,步骤为: 提出原假设:h o :匆= 0 ,f = 1 ,2 ,p 对立架设:h i :包0 计算统计量: t = 服从t ( n - p - 1 ) 分布 其中c = ( x x ) ,c ,f 为c 的主对角线上的第f 个元素。 对于给定的显著性水平口,查f 分布表得, 镜( 行一p 一1 ) 。 判断:当 钦 时,拒- 绝h o ,毛与y 线性关系显著。 2 3 2 灰色预测模型 ( 1 ) 灰色理论简介 在灰色理论中,把信息完全明确的系统称为白色系统。相反,如果对一个 系统的内部结构、参数、特征等一无所知,只能从系统外部表象来研究的系统 称为黑色系统。介于二者之间,部分信息已知、部分信息未知的系统称为灰色 系统。 灰色系统理论以信息不完全系统的行为表现、行为内涵、行为关系、行为 环境的层次性、动态性、信息性、量化性等为研究对象,为系统研究开辟了一 个新的领域n 幻。灰色系统理论主要用于灰预测、灰决策、灰识别等方面m 1 。 ( 2 ) g m 0 ,1 ) 建模 数据生成处理: 将收集到的数掘进行某种数学处理,称为数据生成。在灰色系统建模理论 中,用的最多的是累加生成a g o 。 设原始数列为x o = ( x o ( 1 ) ,x o ( 2 ) ,_ ) c o ( 阳) ) , 记累加生成数列为x n ,0 1 = ( x ( 1 ) ,x m ( 2 ) ,x m ( ,2 ) ) ,x 1 ( 尼) = 。( 肌) m = 1 只要原始数列x f o 是非负数列,则累加数列x f ) 一定是递增数列,这被称为 a g o 的递增特性。 级比平滑检验: 令仃( 七) :墨笔墨,若o - o ( 七) ( o 1 3 5 3 ,7 3 8 9 ) 说明数列是平滑的,可用作灰预 测。 、7 l o 级比界区检验: 级比可容区盯o ( j i ) ( 0 1 3 5 3 ,7 3 8 9 ) 是g m ( 1 ,1 ) 建模型的基本条件,然而不是实 用条件,需要通过级比界区来进一步判定原始数列是否可用于g m ( 1 ,1 ) 预测。 如果盯。( 七) 的界区 1 7 o ( 尼) ( e 丙,g 磊) ,说明适用于g m ( 1 ,1 ) 预测。 g m ( 1 ,1 ) 建模: 设原始数列o = ( x o ( 1 ) ,o ( 2 ) ,x o ( ) ) 为非负数列,对其进行变换,生成 一阶累加数列) :( x m ( 1 ) ,( 2 ) ,( 甩) ) ,其中( 忌) 2 善( 聊) 。 称方程:墨+ 口z :”= 6 为灰色方程,也称为g m ( 1 ,1 ) 模型。 其中口和b 为待估参数,序列z a = ( z :1 ) ,z 囊j 一,z 。( i ) 为数列x u 相邻两个元素的 均值生成序列:z :1 = 垒盟丝。 ” 2 采用最小二乘法可以可以求出灰色微分方程+ 口z l ”= b 的参数a 和b 的 估计值a 和b 。 记 】,= f 一掣 l 一7 【l b :i q | - 。 i _ z 0 一n ,参数彳:。 l 6 其中矗+ 叫1 = 6 y = b a 采用最小二乘法,求得参数a 的估计值: j = 量 = c b 一y 由序列x 1 生成微分方程: 誓中邶研谚y 的解为: 坐+ 觚( 1 ) = 6 一十觚= d 出 是。= ( x 一言) p 一破+ 鲁 该函数也被称为时间响应函数。而序列x 1 是序列x ( o 的累加序列,通过累 减计算可以得到x ( o 的值。 ( 3 ) g m ( 1 ,1 ) 模型检验 残差检验: 参差检验是一种直观的逐点进行比较的算术检验方法,它是把预测数据与 o o 毋芦蜉 ,。l 实际数据相比较,观测其相对误差是否满足要求。 设参差序列为:e = ( 8 ( 1 ) ,p ( 2 ) ,8 ( ,z ) ) ,其中p ( 七) = z o ( 七) 一x o ( 七) 。 称: m ) = 器1 0 。 ;= 搏m ) i p = ( 1 8 ) x 1 0 0 为相对误差; 为平均误差: 为模型精度。 后验差检验: 设初始序列x 和参差序列g 的方差分别为和s ;,则: s ;:去喜c x c 。,c 尼,一x o ,2 , s ;= 吉喜c p c 后,一;,2 其中: x 。0 ) = 去喜x ( o ( 尼) , ;= 去喜( p ( 七) 一;) 2 计算后验差比值:c :蔓,若cs0 3 5 认为模型精度较好。 q 表2 - 1 g m ( 1 ,1 ) 模型精度判定表 模型精度等级 p c l 级( 好) o 9 5 p c 0 3 5 2 级( 合格) o 8 0 p o 9 5 o ,3 5 c 0 。5 3 级( 勉强) o 7 0 p 0 8 0 o 5 c 0 6 5 4 级( 不合格) p f o 。,( 2 ,6 ) = 5 1 4 , 回归方程有显著意义。 根据合肥市十一届人大一次会议政府工作报告指出:预计2 0 0 8 年合肥 地区g d p 增长17 左右;对外贸易总额增长维持在2 5 左右。故预计2 0 0 8 年 合肥地区的g d p 总额将达到1 5 6 1 0 1 亿元,外贸总额将达到7 8 1 0 亿美元d 引。 根据线性回归模型,预计2 0 0 8 年合肥地区集装箱生成量将达到3 8 5 7 万t e u 。 5 2 灰色理论预测 选择1 9 9 9 2 0 0 7 年的合肥集装箱生成量作为模型的原始数列。影响生成量 的因素很多,如:地区国民生产总值、外贸活跃程度、地区产业结构、区域集 装箱组织运输水平等等,这些因子具有灰信息覆盖,而集装箱生成量是具体的 明确的,具有白信息覆盖。因此从集装箱生成量的影响因子,到具体的集装箱 生成量,符合灰因白子律h 幅1 。 5 2 1 原始数列g m ( 1 ,1 ) 预测适用性判断 ( 1 ) 级比平滑检验: 原始数歹0 x o = ( 6 8 4 ,8 5 9 ,9 4 5 ,1 0 7 8 ,1 4 4 8 ,1 7 1 9 ,2 0 9 1 ,2 4 8 7 ,3 1 2 4 ) 级比平滑数列o - o = ( o 7 9 ,0 9 0 ,0 8 7 ,0 7 6 ,0 8 4 ,0 8 2 ,0 8 4 ,0 7 9 ) 仃o ( 七) ( o 13 5 3 ,7 3 8 9 ) 说明数列是平滑的,x o 可作非畸形的g m ( i ,1 ) 建模。 3 2 ( 2 ) 级比界区检验: 查表( p 暑,p 鬲2 ) :( o 75147 7 2 9 2 ,1 330 712198 ) 仃。( 忌) ( 万- 2 ,矛2 ) 表明级比区在界区以内,原始数列可用于g m ( 1 ,1 ) 预测。 5 2 2g m ( 1 ,1 ) 在m a t l a b 下建模 灰色模型由于数据处理量较大,在m a t l a b a 下编程能大大提供运算效率。 本文以1 9 9 9 年一2 0 0 7 年合肥外贸集装箱生成量为样本,以2 0 0 8 年外贸集装箱 生成量为预测对象,以g m ( 1 ,1 ) 模型为机理,编写程序。程序代码和输出结果分 别如图5 3 和图5 4 所示: f o m a a f t :1 0 n g : 算设置计算精度 n = l e n g t h ( x ) :姗t 输入数据的样本盈 z = 0 : f o ri = l :n蔓计算累加值。姜将值赋子矩蹿b e z = z + x ( l :b t ( i j :) = z : e n d f o ri = 2 :n 觏中原始数歹4 平行移动 y ( i _ i ,:) = x ( t :) ; e n d f o ri m l :r r l 聱计算数据矩阵b 盼第一列数据 c i j :) = 一0 5 木( b e ( i ,:) 。b e ( i + l ,:) ) : e n d f a rj = l :n - l誓计算数据矩阵b 的第二列数据 e ( j ,:) = l : e n d f o ri - - i :i r l 妫国造数话矩阵b b ( i ,1 ) = c ( i ,:) : b ( i ,2 ) = e ( i ,:) : e n d a l p h a = i n v 搴b ) l b 事y : 髯计算参数 f o ri = l :n 十l譬计算数据估计值的累加数列,如改n + l 为n h 河预测后护1 个僵 a g o ( i j :) = 纽( 1 j :) - a l p h a ( 2 j :) a l p h a ( 1 ,:) ) * e z p ( _ a l p h a ( 1 ,:) ( i 1 ) ) + a l p h a ( 2 , :) a l p h a ( 1 ,:) : e n d v a r ( 1 j :) = a g o ( 1 j :) f o ri :l :n v a r ( i + l ,:) = a g o ( i + l ,:) 一a g o ( i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论