




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1系统工程系统工程第四章 系统预测2第一节第一节 预测概述预测概述第二节第二节 德尔菲法德尔菲法第三节第三节 马尔可夫预测法马尔可夫预测法第四节第四节 回归预测法回归预测法第五节第五节 时间序列预测法时间序列预测法第六节第六节 灰色系统预测法灰色系统预测法31.1 1.1 预测的概念预测的概念第一节 预测概述 预测是对尚未发生或目前还不明确的事物进行预先的估计和推测,是在现时对事物将要发生的结果进行探讨和研究。预测的方法和手段总称为预测技术。4已知已知情况情况难以了解的难以了解的中间过程中间过程结果结果预测技术预测技术与方法与方法 预测过程预测过程从过去和现在已知的情况出发,利用一定的方法或技
2、术去探索或模拟不可知的、未出现的或复杂的中间过程,推断出未来的结果。5预测的目的和意义预测的目的和意义 预测研究的是事物的未来,而未来之所以使人们感兴趣,是因为与人们目前的行动有密切的联系。主要表现如下: (1)了解事物发展的未来状况,目前就为将来做好准备。若未来的发展状况是有利的,可以通过目前的决策去利用或扩大它。 (2)预测可以了解目前的决策所可能带来的后果,并通过对后果的分析来确定目前的决策,力争使目前的决策获得最佳的未来结果。 减少盲目性科学决策掌握发展规律6 1.2 1.2 预测的分类预测的分类根据预测对象所属的领域及所要说明的问题性质分类根据预测对象所属的领域及所要说明的问题性质分
3、类: 经济预测、社会预测、军事预测、科学预测、技术预测等经济预测、社会预测、军事预测、科学预测、技术预测等; 在每个领域,还可根据预测对象范围的大小分为:在每个领域,还可根据预测对象范围的大小分为: 宏观预测和微观预测等宏观预测和微观预测等。不论是哪个领域内的预测,它们在按以下几种方法分类时都是相似的。不论是哪个领域内的预测,它们在按以下几种方法分类时都是相似的。按预测结果分按预测期限分按限制条件分按目标限制分71 1定性预测:定性预测:研究和探讨预测对象在未来的性质,如事物发展的研究和探讨预测对象在未来的性质,如事物发展的总体趋势,事件总体趋势,事件发生和发展的各种可能性及其造成的影响发生和
4、发展的各种可能性及其造成的影响,目前的决策是否会达到制定决策的目的,目前的决策是否会达到制定决策的目的1、按预测结果分2 2定量预测:定量预测:对预测对象未来的数量加以确定。如总产值、销售量、利润额的预对预测对象未来的数量加以确定。如总产值、销售量、利润额的预测等。测等。 定量预测是在定量预测是在历史数据和统计资料历史数据和统计资料的基础上,运用的基础上,运用数学或其它分析技术数学或其它分析技术,建立,建立可以表现数量关系的可以表现数量关系的模型模型,并利用它来计算预测对象在未来可能再现的数量。主要,并利用它来计算预测对象在未来可能再现的数量。主要的方法有的方法有回归法、时间序列法以及经济计量
5、学回归法、时间序列法以及经济计量学的其它方法。的其它方法。3 3定时预测:定时预测:对预测对象未来的表现时间的确定。如,某新技术能够应用于生产对预测对象未来的表现时间的确定。如,某新技术能够应用于生产上的时间、产品更新换代的时机、决策达到预想效果的时间等。定时预测一般是依上的时间、产品更新换代的时机、决策达到预想效果的时间等。定时预测一般是依靠靠逻辑推理和判断逻辑推理和判断进行的,方法主要是各种进行的,方法主要是各种调查分析法和类推法调查分析法和类推法等。在对产品更新等。在对产品更新换代进行定时预测时,可采用换代进行定时预测时,可采用生长曲线法生长曲线法。81短期预测 是指对预测对象近期发展情
6、况所做的预测。因为短期预测直接影响到当前的行动安排,所以需要有较高的精确度或准确度。2中期预测 是指对预测对象长期的发展情况所做的预测,为中期计划和决策服务。对中期预测结果精确度或准确度的要求比短期预测要宽些。3长期预测 是为了制订长远规划和战略决策而做的预测,对预测结果精确度或准确度的要求比中期预测又宽些。2、按预测期限分9按照事物发展结果与决策的关系,预测可以分为两类。1条件预测 以决策方案做为主要限制条件所进行的预测,决策方案不同,得到的预测结果也不同。对多种决策方案进行比较选择时,所进行的预测大多数是条件预测。2无条件预测 是指不考虑决策条件或决策方案对预测对象发展的影响时所进行的预测
7、。3、按限制条件分104、按目标限制分预测是为决策服务的,按照决策目标是否做为预测的限制条件,预测可分为两类。1规范性预测 预先确定某一事物的发展目标,并以之为规范,预测能否达到目标,达到目标的时间,以及到达目标所需要的条件和过程等。2、探索性预测 是指根据事物发展的历史资料和目前对未来条件的了解,预测事物未来发展变化的情况。如对产品需求量的预测等等。 规范性预测和探索性预测的主要区别在于:前者是从需要出发去预测其实现的可能性,而后者是从客观实际出发去预测可能达到的前景。它们是从两个不同的侧面为决策提供依据,都是进行决策所需要的。111.3 1.3 预测的基本原理预测的基本原理 预测的原理:人
8、们为什么能够运用各种方法来对事物进行预测的道理。它是各种预测方法的基础。是科学预测的认识基础,有关预测的原理可以表述为以下几条原则。 惯性原则类推原则相关原则概率推断原则12二、类推原则 许多事物相互之间在发展变化上常有类似的地方。利用事物与它事物的发展变化在时间上前后不同,但表现形式上相似之处的特点,可把先发展事物的表现过程类推到后发展事物上去,从而对后发展事物的前景做出预测。一、惯性原则 没有一种事物的发展会与其过去的行为没有联系。过去的行为不仅影响到现时,还会影响到未来。这表明,任何事物的发展都带有一定的延续性。这个特点一般被称为“惯性。” 13三、相关原则 任何事物的发展变化都不是孤立
9、的,都是在与其它事物的发展变化相互联系,相互影响的过程中确定其轨迹的。 相关性有多种表现形式,其中最重要的、应用最广的是因果关系。因果关系是事物之间普遍联系和相互作用的形式之一。它的特点是,原因在前,结果在后,并且原因和结果之间常常具有类似函数关系的密切联系。这就为利用因果关系建立模型进行预测提供了方便。 14四、概率推断原则 由于各种因素的干扰,常常使变量的未来表现呈现随机的形式。随机变化的不确定性给预测工作带来了很大的困难。然而为了给决策工作提供依据,需要预测工作者对具有不确定性结果的预测对象提出较确定的结论,这就需要应用概率推断原则。 所谓概率原则,就是当推断预测结果能以概率出现时,就认
10、为这个结果是成立的,可用的。151确定预测目标 预测服务于决策,应根据决策的要求去确定预测的目标。 首先了解决策的要求,确定属于哪类预测,应满足哪些标准等等。如,是短期预测,还是中期或长期预测;是定性预测,还是定量或定时预测;预测的范围多大;对预测结果的精确度有什么要求;拿出预测结果的最后期限。2搜集、处理资料 根据预测目标的要求,搜集所需要用到的各种资料。 包括预测对象本身发展的历史资料,对预测对象发展变化起影响作用的各种因素的资料(预报因子)。1.5 1.5 预测的步骤预测的步骤163选择预测技术 根据决策计划和计划工作对预测结果的要求,结合开展预测工作的条件和环境,根据经济、方便、效果好
11、的原则,去合理地选择预测技术。4建立预测模型模型是对预测对象发展规律的近似模拟。数学模型法,需确定模型的形式并求出模型的参数;趋势外推法,要求反映出发展趋势的公式;概率分析法,确定预测对象发展的各种可能结果的概率分布;类推分析法,找出参照事物在历史上所呈现的发展规律。175评价模型 模型依据历史资料得出,反映的是事物发展的历史规律,故应根据搜集到的有关未来情况的资料,对得到的模型加以分析研究,评价其是否能够应用于对未来实际的预测。如,用回归方法得到的数学模型能否通过各种有关的检验,通过检验的模型是否能反映出事物发展的未来规律;6利用模型进行预测 根据搜集到的有关资料,利用经过评价所确定的预测模
12、型,计算或推测出预测对象发展的未来结果。181.5 1.5 预测方法的分类预测方法的分类 随着预测科学的不断发展,预测方法及其类别划分也越来越多,目前已达上百种,各种方法往往可以分属不同的类别,不同方法间的相互耦合还会生成新的方法。目前,根据预测方法的性质,一般可将系统预测方法分为如下几类:定性预测方法回归预测方法非线性预测方法时间序列分析方法概率分析方法19(1)定性预测方法 特点:凭借人的经验以及分析判断能力,对事物发展的趋势、方向和重要转折点进行预测,是一种十分适用的统计预测方法,特别是在预测对象历史统计资料掌握不多,或影响因素复杂,难分清主次,或对主要影响因素难以定量分析等情况下适用性
13、很强。它适用于国家经济形势的发展、经济政策的演变、科学技术的发展方向、企业经营环境分析和战略决策方向等等。 定性预测方法有很多,但从应用的广泛性、实用性和有效性角度来看,主要有:德尔菲(Delphi)法、主观概率法、领先指标法、相互影响分析法等。20(2)回归预测方法回归预测通过建立预测对象与其主要影响因素的回归模型而进行预测。目前常用的回归预测方法有一元与多元线性回归、非线性回归等。回归预测法是在系统变量因素之间存在相关关系且系统没有发生系统没有发生突变现象突变现象时,才能使用。一些系统结构复杂,系统的变化发展受到诸多因素的影响,此时,预测模型描述将会很困难。21(3)概率分析方法 在一个系
14、统内,某些因素由一种情况转移到另一种情况的过程中,具有转移概率,主要研究预测对象发展的各种可能结果的概率分布。 22(4)时间序列分析方法 时间序列(time series)是指某个指标在不同时间上的数值按照时间先后顺序排列而成的数列,这种数列由于受到各种偶然因素的影响往往表现出某种随机性,但彼此之间存在着统计上的依赖关系。 时间序列分析法(Time Series Analysis,简称TSA)就是根据预测对象自身自身的动态数据揭示系统动态结构和规律系统动态结构和规律的统计方法,其基本思想是根据系统有限长度的运行记录,建立能够比较精确地反映时间序列中所包含的动态依存关系的数学模型,并借以对系统
15、的未来行为进行预测。23(5)非线性预测方法 近年来,非线性科学得到了很大发展,一些非线性科学方法在预测领域也逐渐得到应如人工神经网络方法、灰色系统方法、分形与混沌方法等。ANN在研究生物神经网络的基础上建立的神经网络模型,能够实时地组织数据,作统计分析、辩别趋势、进行数据学习和更新,具有大规模并行处理和分布式信息储存的能力,有很强的自学习能力。灰色系统预测法1982年邓聚龙创立,方法认为系统内各因索间具有不确定关系,部分已知,部分末知,“预测末来”本质上是个灰色问题。灰色预测通过关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从
16、而预测未来的发展趋势。24模糊数学预测方法是上世纪80年代开始发展起来的一类新方法,该类方法以模糊数学理论为基础,在经典预测理论的基础上,模糊预测应用模糊数学的理论,对信息进行处理和计算。现有模糊回归预测、模糊时间序列预测、模糊推理预测、模糊聚类分析预测等。支持向量机方法1995年,Vapnik首先提出了基于结构风险最小化原理的理论,它是建立在结构风险最小化原理和VC维概念的基础上,根据有限的样本信息在模型的学习精度和学习能力之间寻求折中,从而获得较好的泛化能力,目前已经成为机器学习领域中新的研究热点,为小样本情况下的系统预测提供一种行之有效的可选方法。25第二节第二节 德尔菲法德尔菲法(定性
17、预测)(定性预测)26 德尔菲法(Delphi),是20世纪40年代美国兰德公司与道格拉斯公司协作,研究如何通过有控制的反馈通过有控制的反馈更为有效可靠地收集专家意见的方法时,以“德尔菲”为代号,德尔菲法由此而得名。 2.1 2.1 德尔菲法的基本原理德尔菲法的基本原理1. 选择专家2. 编制专家应答表3. 调查表的整理与反馈4. 反复交换意见5. 得到预测结论Delphi是专家会议调查法的一种发展。它以匿名方式征求专家意见。预测领导小组对每一轮的意见都进行汇总整理汇总整理,作为参考资料再发给每个专家再发给每个专家,供他们分析判断,提出新的论证新的论证。如此多次反复,专家意见日趋一致。 27解
18、决问题的基本步骤明确问题选择专家提出预测报告意见是否已经集中到满意的程度?否是拟定调查表发函征询(并附背景材料)整理、分析寄回的调查表 经过几轮调查,专家们不经过几轮调查,专家们不再改变自己的观点之后,为了再改变自己的观点之后,为了得到预测结果,需要对专家们得到预测结果,需要对专家们所填的表格进行分析和处理,所填的表格进行分析和处理,当专家们的当专家们的意见比较统一时,意见比较统一时,一般是将统一的意见作为预测一般是将统一的意见作为预测结果。结果。当专家们的意见不能趋于统一当专家们的意见不能趋于统一时,为了作出预测,时,为了作出预测,需要对专需要对专家们的意见进行综合处理。一家们的意见进行综合
19、处理。一般是用中位数作为预测值,用般是用中位数作为预测值,用上、下四分位数之间的间隔作上、下四分位数之间的间隔作为预测区间,其实现概率为为预测区间,其实现概率为50。28成败的关键1) 具有相关专业知识,在领域内有较宽的知识面。2) 包括边缘学科,交叉学科的专家。3)注重专家的结构,包括知识结构、年龄结构等4)预选人数多于规定人数(10-15人)1)调查表中提出的问题要清楚、准确,以免由于对问题的理解不同而造成差异。2)调查表应便于应答。3)调查表应逐轮深入,引导应答者思考问题。4)寄送调查表时应附必要的背景材料。 合理选择专家合理选择专家正确拟定调查表正确拟定调查表29 当有当有n n个专家
20、时,对某一指标的回答分别为个专家时,对某一指标的回答分别为 且有且有n n3 32 21 1xxxx, n n1 1n n3 32 21 1xxxxx x/ /2 2为为偶偶数数, ,/ /2 2/ /2 21 1为为奇奇数数, ,1 1k kk k1 1k knknxxnknxx2.2 2.2 德尔菲法的基本步骤德尔菲法的基本步骤则其则其中位数中位数21nxx30上四分位数为上四分位数为:为为偶偶数数为为偶偶数数, ,且且/ /2 2, ,2 2为为偶偶数数为为奇奇数数, ,且且/ /2 2, ,为为奇奇数数为为偶偶数数, ,且且1 1) )/ /2 2, ,( (2 2为为奇奇数数为为奇奇
21、数数, ,且且1 1) )/ /2 2, ,( (1 12 23 32 23 31 1) )2 23 32 22 23 31 12 23 32 2上上nknkxxnknkxnknkxxnknkxxkkkkkk()1(34)1(3nxx上31下四分位数为下四分位数为:为奇数,为偶数且22为偶数,为奇数且2为奇数,为偶数且1)/2(2为奇数,为奇数且21)(1222112221下nk,n/kxxnk,n/kxnk,nkxxnk,/nkxxkkkkkk41nxx下3221nxx全距全距=xn-x1 表示预测值的最大变动幅度,是专家预测值分散程度的一种度量.中位数专家组对时间预测的期望值x上上-x下下
22、预测区间,按照正态分布理论,50%以上专家的预测值落在预测区间内。33 实例:对某一工程建设费用问题,16位专家(n=16)最后预测的结果分别是(按从小到大的顺序排列, 单位:亿元)1.35,1.38,1.40,1.40,1.40,1.45,1.47,1.50,1.50,1.50,1.50,1.53,1.55,1.60,1.60,1.655 . 12985 . 82116xxxxx54. 12/ )(131275.124)1(3xxxxxn上40. 12/ )(5425. 441xxxxxn下预测的结果为预测的结果为1.51.5,有有50%50%的专家认为的专家认为在在1.401.401.54
23、1.54之间。之间。34 德尔菲法的优点是,由于专家之间不发生联系,他们各自仅知道某种意见,但不知是由谁提出的,便于排除有碍面子、随声附和等心理因素的影响。 匿名性匿名性 反馈性反馈性 趋同性趋同性: :当某一专家发现自已意见与大多数不同,却又不太肯定自已时,可能改变自已而使结果趋向一致2.3 2.3 对德尔菲法的评价对德尔菲法的评价 全面性全面性: :集中专家的群体智慧,对问题分析比较全面。 35 德尔菲法的缺点:主观性主观性:预测结果受主观认识制约,如学识经验心理和兴趣局限性局限性:专家思维的在某个专业领域的局限性会影响预测效果弱技术性弱技术性:“专家”无明确的衡量标准,意见征询表的设计也
24、难以标准化,技术上仍不够成熟。36第三节第三节 马尔可夫预测法马尔可夫预测法(概率分析方法)(概率分析方法)37 在一个随机变化的动态系统中,事物发展的一种可能位置称为一个状态,各状态之间的变迁称为状态转移,利用系统的状态转移利用系统的状态转移概率来描述系统动态过程概率来描述系统动态过程,并进而作出对未来预测的方法就称为马尔可夫预测。利用这种方法的关键是要找到系统各种可能状态的相互转移概率。 由于系统各种状态的相互转移概率并不是一成不变转移概率并不是一成不变的,所以,一般来说这种方法对短期预测比较合适短期预测比较合适;若用于长期预测时,则必须先对转移概率作时序修正。若对于某些具有比较稳定的转移
25、概率的系统比较稳定的转移概率的系统(如气象系统),这种方法也可以较好地用于中、长期预测。 383.1 3.1 马尔可夫过程的状态转移概率关系马尔可夫过程的状态转移概率关系若A、B同为事件时,条件概率P(B|A)称为A事件发生条件下B事件发生的条件概率。若A为某种状态,B为事件时,P(B|A)描述的是在A状态下B事件发生的概率;若A,B为两个不同的状态,且AB=(即A、B两个状态不能同时出现),则P(B|A)反映了由状态A转移到状态B的转移概率。转移概率是马尔可夫过程研究中的一个重要参数。 39 假定某一预测对象可能处在S1,S2,Si,Sn,n个状态,而且每次只能处在一个状态Si(i=1,2,
26、n)中,那么经过t时间后,Si状态有n种转移的可能性。40 对预测对象的对预测对象的n个可能状态、个可能状态、n个可能转移个可能转移,需要用,需要用nn个转移个转移概率来描述,如果把转移概率概率来描述,如果把转移概率Pij(Sj|Si)作为一个矩阵的第)作为一个矩阵的第i行第行第j列的列的元素,则构成一个元素,则构成一个nn阶的转移概率矩阵,记作阶的转移概率矩阵,记作PnnnnnnPPPPPPPPPP212222111211状态状态1向其它状态转移向其它状态转移411. 矩阵中的任一元素都是一个小于1的正数。 2. 矩阵中的任一行元素之和恒等于1。这是由于矩阵中的每一行表示过程由一种状态向其它
27、状态转移的所有可能性,所有的可能性加在一起就成为一个必然事件,而必然事件的概率恒为1。3. 由Si转向Sj的转移概率一般不等于Sj转向Si的转移概率。 对于状态转移矩阵对于状态转移矩阵P,有以下几个特点:,有以下几个特点:42 如果系统的状态不只经过一次转移,而是经过多次转移,则可以用k步转移矩阵来描述,记k步转移矩阵为P(k)则有 上式表明k步转移矩阵只不过是在以前转移的基础上再进行一次转移,因此k步转移矩阵就是一次转移矩阵的k次方。 kkkPPPP )()(143已知系统有n个互不相容的状态,系统的初始状态向量S(0)为)(,),(),()(000021nSSSS 式中 Si(0) 系统处
28、在状态i的初始概率。3.2 3.2 马尔可夫预测模型马尔可夫预测模型初始状态向量44 由于经过k步转移后系统处于状态i的概率为Si(k),则k步转移后的状态向量为式中 Si(k) 系统在k时刻处于状态i的概率。)(,),(),()(kSkSkSkSn21转移后的状态向量45 当初始状态向量S(0)和状态转移矩阵P已知时,便可以预测在K时刻系统所处的状态应用马尔可夫模型的关键是确定出转移概率矩阵P,并给定系统的初始状态向量S(0),则可预测出未来各期(短期)的状态向量S(k)。Si(0)与Si(k)的关系可表示为knnnnnnkPPPPPPPPPSPSkS21222211121100)()()(
29、转移后的状态预测46根据系统状态转移的历史记录历史记录,可以得到如下的统计表格nij表示本期为状态Si,下期为状态Sj的转移次数。47通常把这种估算一步转移概率矩阵的方法,称之为统计估算法。统计估算法由于简单易行,因而获得了较为广泛的应用。以 表示系统从状态Si转移到状态Sj的转移概率Pij的估计值,则 可按下式来计算 ijPijPnjnnPnjijijij , 2 , 1 1483.3 3.3 应用举例应用举例例1 某地区根据历史长期统计资料统计出其旱、涝的年际转移状态概率,其状态转移概率矩阵如下大涝涝正常旱大旱状态大涝状态涝状态正常状态旱状态大旱 54 32 125015025015020
30、02502002002001500801203002003000500601003904000400601603800.36.P492006年的气象趋势,也就是求S(1): 0 0 0 0 1 ) 0 ( ) 0 ( ) 0 ( ) 0 ( ) 0 ( ) 0 (54321SSSSSS.)()( 040 060 160 380 360 2501502501502002502002002001500801203002003000500601003904000400601603800.36 0 0 0 0 1 01PSS已知2005年为大旱年,要求预测2006年的气象情势和该地区的长气象趋势。20
31、05年初始状态50,即旱的可能性为,即旱的可能性为0.740.74。7403803600 021.)()( SS 因此,根据计算结果,在因此,根据计算结果,在20062006年应做好抗旱准备。年应做好抗旱准备。1000400600 0 54.)()( SS,即涝的可能性为,即涝的可能性为0.100.10。0400 0600 1600 3800 360054321.)(.)(.)(.)(.)(SSSSS51 极限状态转移概率与初始状态无关的马尔可夫过程称为完全各态经历的过程,它可表示为: )(limnSSini 若有若有N个状态,转移次数个状态,转移次数n很大时,很大时,)(lim,),(lim
32、),(lim)(limnSnSnSnSSNnnnn21极限状态的概率即极限状态的概率向量可写成),(NSSSS21若记若记52式中 S 极限状态的概率向量,或绝对状态的概率向量。 已知, ,两边取极限,则有PnSnS)()(1PnSnSnn)(lim)(lim1PSS记为上述关系表明,转移无穷多步时,极限状态概率必将处在状态S1,S2,SN中的某同一状态,用来分析长期趋势。532501502501502002502002002001500801203002003000500601003904000400601603800.36 5432154321.SSSSSSSSSS例2 某地区根据历史长期
33、统计资料统计出其旱、涝的年际转移状态概率,其状态转移概率矩阵同前,求长期趋势预测(极限转移概率)54所以有 0.20 0.15 0.30 0.40 36. 0543211SSSSSS 0.15 0.20 0.20 0.39 380543212SSSSSS . 0.25 0.20 0.30 0.10 160543213SSSSSS . 0.15 0.20 0.12 0.06 060543214SSSSSS . 0.25 0.25 0.08 0.05 040543215SSSSSS . 1 54321SSSSS55 根据上述计算结果,可以看出该地区长远的气候应是旱的情势。因此,应努力选育各种作物的
34、抗旱品种,在作物布局上应考虑种植耐旱作物,在水利和农田基本建设上应着重考虑各种灌溉设施。 0.0878 09120 17540 31930 3263054321SSSSS. 645603193032630 21. SS 17900087800912054. SS 即旱的可能性为64.56%。 即涝的可能性为17.9 %。56第四节第四节 回归预测法回归预测法57我们所研究的系统是复杂的,只靠经验对其进行定性预测是不够的,还必须从数量上研究系统变化,因此还需研究定量预测技术。回归预测是经常使用的一种定量预测方法,是研究变量之间相关关系的数理统计分析方法。工程运行管理中经常使用的经验公式,大多是用
35、某种回归分析方法得到的。回归分析模型: 一元回归分析预测、多元回归分析预测 线性回归分析预测、非线性回归分析预测 58客观世界中变量之间的两种关系确定关系相关关系变量之间的关系可以用函数关系表达。变量之间存在密切关系,因变量随自变量的变化而变化,这种关系存在统计规律性,但不存在精确的函数关系,有一定随机性。相关分析,是研究两个或两个以上随机变量之间相互依存关系的紧密程度。回归分析,是研究某一随机变量与其他一个或几个普通变量之间的数量变动关系。59回归分析预测若变量之间的相关关系显著,可将其统计规律性用函数表达式近似表达,称为回归方程。利用回归方程对因变量进行预测,称为回归分析预测法。往往知道一
36、组变量之间存在某种统计关系,如(R&P, ZV, ZQ),需弄清楚这些关系,以便据此进行相关设计,或进行相关预测。回归分析及回归分析预测可以帮助我们解决此类问题。604.1 4.1 一元线性回归模型一元线性回归模型基本思路(1)假定两个变量之间呈线性相关关系 (2)根据一定的计算公式计算线性回归方程中的各个系数,得线性回归预测模型 (3)检验线性假定是否合理,如合理,则可采用该线性回归预测模型进行实际预测61假定x、y呈线性关系,则x、y的一元线性回归方程为 iibxay 回归值(因变量)回归系数自变量设有一组试验数据:621、回归系数的计算 最小二乘原理:通过数学模型,配合一条较为理想的趋势
37、线。这条线必须满足下列两点要求:1、数列的原值与模型的估计值的误差平方和最小;2、数列的原值与模型估计值的误差总和为零。niiyy12) (Q0) (1niiyy631、回归系数的计算 xbyaniniiiniininiiiixnxyxnyxb121211111niiniiixnxyxnyxb1221或要使Q最小,驻点可由Q对参数a.b的偏导数来计算: )2(02) 1 (02xxyxyiiiiibabQbaaQ解方程可得:最小二乘估计量最小二乘估计量64(1)初步判断变量之间的关系 某研究区1996-2001的人口见下表,试预测2005年的人口。 1996199719981999200020
38、01年份181716人口151413121110年份例4-165(2)计算回归系数 41153691631353631121221.xnxyxnyxbniiniii78534116313.xbya(3)预测模型 x.y 41178(4)预测人万8 .221041. 17 . 841. 17 . 8xy662相关性检验回归方程能够直接使用吗? 变量之间具有线性关系的程度常用相关系数( r )法进行检验。线性相关程度越高,则线性相关关系越显著。实践中一般先进行相关分析,由相关系数决定是否进行回归分析。 1、方程以变量间呈线性关系的假定为基础2、即使变量间无线性关系,也可得出回归方程3、需要讨论变量
39、间究竟有无线性关系,即线性回归模型是否能反映出变量之间的真实函数关系67(1)相关分析niniiniiyyyyyyTSS121212)() ()(ESSRSS22iiiiiiiiyyxxyyxxR在给定样本中,TSS不变,如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此:拟合优度拟合优度= =TSSRSSTSSESSR12 拟合优度拟合优度的取值范围取值范围:0,1 R2 2越接近越接近1 1,说明实际观测点离样本线越近,拟合优度越高,说明实际观测点离样本线越近,拟合优度越高。68(2)相关系数的解释r=0只是x、y不具有线性相关关系,不表示没有其他相关关系 。对于变量之间
40、的其它相关关系,有的也可以通过数学变换转化为线性关系而采用线性回归分析。 69(3) 线性相关关系的显著性检验模型中样本值可以自由变动的个数,称为自由度模型中样本值可以自由变动的个数,称为自由度=样本个数样本个数-样本受约束条件的个数样本受约束条件的个数70计算相关系数:计算例4-1变量之间的相关系数,并检验变量线性相关关系的显著性。989. 068 .8186.1150621918 .8121613111222222nyynxxyxnyxriiiiiiii由相关系数检验表可以得出,自由度为n-2=6-2=4时,r0.01=0.917。由于rr0.01,所以变量线性相关关系高度显著。714.2
41、 4.2 多元线性回归模型多元线性回归模型许多实际问题中,影响因变量的自变量往往不止一个,例如,以水土流失过程中的流失量作为因变量,那么自变量可能为雨强、坡长、坡度、土壤质地、植被盖度、人类活动原理与一元回归类似,但要求变量之间彼此独立但要求变量之间彼此独立。72描述因变量y如何依赖于自变量 x1, x2 , xp 和误差项的方程,称为多元回归模型。 b0 ,b1,b2 ,bp是参数 是被称为误差项的随机变量,包括在y里面但不能被p个自变量的线性关系所解释的变异性ppxbxbxbxbby3322110731、回归参数估计1011121211201212222201122.mmmmnnnmnmn
42、ybb xb xb xybb xb xb xybb xb xb x进行n次试验,则可得n组数据:(yi, xi1 ,xi2 , , xim), i= 1,2,n212,.,N(0,)n 其中,相互独立且服从分布741112121222112120112111,mmnnmnmnYXBxxxxxxXxxxYyyyBbbb用矩阵表示,即为:用矩阵表示,即为:750112221201i12i21 y=EY=b +b x +b x +.()(b +b x +b x +.)mmniiinimimib xQyyyb x残差平方和残差平方和ESS76通过求极值得出使Q达到最小的bj01i11001i112bb
43、 x.02bb x.0,(0,1,2,)nimiminimimijijQyb xbQyb xxbjm ()X XBX Y系数矩阵系数矩阵B可以表示为:可以表示为: B= (XX)-1XY77例例4-2:研究人们对某种品牌食品的:研究人们对某种品牌食品的喜爱程度喜爱程度Y和该食品的和该食品的水水分含量分含量X1,甜度甜度X2的关系,小规模试验得到下列数据:的关系,小规模试验得到下列数据:i12345678910111213141516xi144446666888810101010 xi22424242424242424yi6473617672807183838986938895941002011
44、22N(0,)Ybb XbX ,选取如下模型进行拟合:选取如下模型进行拟合:例例4-27801426 41447 31426 11447 61627 21648 01627 11648 3,1828 31848 91828 61849 311 028 811 049 511 029 411 041 0 0bXYBb12b79经计算:经计算:-1-11611248XX= 112864336 483361601.2375-0.0875-0.1875(XX) = -0.08750.01253.4694e-18 -0.18752.4286e-0170.06251308XY= 9510 (XX) X39
45、94B1237.65Y4.4254.37537.654.4254.375YXX多元回归方程为:802、线性相关分析niniiniiyyyyyyTSS121212)() ()(ESSRSSTSSESSR/222iiiiiiiiyyxxyyxxR81构造统计量构造统计量F:F(m,n-m-1)给定显著性水平, 通过查F分布分位数表,求出临界值F, 便可判断回归方程是否有意义。3、显著性检验:F检验) 1/(/mnESSmRSSF1,mnmFFF X与Y间存在显著的线性统计关系变量数实验次数82如例如例4-21967)(12niiyyTSS7 .1872)(12niyyRSS3 .94) (12niiyyESS083.12913/3 .942/7 .1872) 1/(/mnESSmRSSF置信水平=0.05下查F分布表:F0.05(2,13)=3.8115时,初始值对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论