(计算机应用技术专业论文)灰多元线性回归分析及其应用研究.pdf_第1页
(计算机应用技术专业论文)灰多元线性回归分析及其应用研究.pdf_第2页
(计算机应用技术专业论文)灰多元线性回归分析及其应用研究.pdf_第3页
(计算机应用技术专业论文)灰多元线性回归分析及其应用研究.pdf_第4页
(计算机应用技术专业论文)灰多元线性回归分析及其应用研究.pdf_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要随着科学技术和社会经济的迅速发展,信息资源不断膨胀,管理者需要决策的事物逐渐增多。如果能对事物未来的发展做出准确预测,就能为管理者做出合理的决策提供依据。多元线性回归分析模型是众多预测方法中的一种,它是通过一组自变量来预测一个或多个因变量的统计方法。目前,在工农业生产及科学研究中有着非常广泛的应用。多元线性回归分析模型也存在不足之处。首先,它不能实时地跟踪因变量的动态变化,模型的反映延迟比较大,系统响应时间长;其次,多元线性回归分析模型对大量样本中的病态数据( 异常数据) 比较敏感,在运算的过程中,如果出现病态的数据,就会影响拟合的效果,使预测的结果不准确。然而,在实际中不仅需要实时跟踪因变量的动态变化,同时也需要避免少量的病态数据对拟合效果的影响。灰色系统理论是基于时间序列的,它能够突出最新数据在预测结果中所起到的重要作用,尽量弱化时间久远的数据对预测的影响,因此灰色系统能够实时地跟踪因变量的动态变化,准确地预测出因变量及其变化趋势。另外,灰色系统理论基于时间序列累加的特性,避免了少量病态数据对拟合效果的影响。本文在总结了灰模型g m ( 1 ,n ) 的不足基础之上,并综合了灰色系统的两个特性,提出把灰色系统理论与多元线性回归分析模型相结合的思想,并建立了一种新的模型灰多元线性回归分析模型。基于提出的新模型,建立了灰多元统计分析平台,在平台上实现了多元线性回归分析模型、灰模型g m ( 1 舯和新模型,并进行了大量的实验。实验结果表明,新模型有效地解决了多元线性回归分析模型和灰模型g m ( 1 ,n ) 的不足,不仅能够减少病态数据对拟合效果的影响,而且能够实现对因变量的动态跟踪,使预测的结果更准确、更真实。为了验证新模型的有效性,本文将新模型应用到几个实际应用中。通过新模型对因变量进行预测,并对预测结果进行分析,最后得出一个重要结论:新模型在实际应用中是非常有效的,预测结果可以为上层管理者提供决策支持的理论依据。关键词:灰色系统;多元线性回归;时间序列;多元统计分析;决策支持a b s t r a c tw 油t l l ed e v e l o p m e n to ft l l es c i e n t i 6 ct e c h n o l o g ) r 锄dm es o c i e t a le c o n o m 弘t l l ei i l f o m a t i o ni si n f l s ot h ed e c i s i o n sm a tn l em 锄a g e rl l e o d st 0m a l 【ea r ei 1 1 c r e 勰i n g i fw ec 觚e x a c t l yf o r e c 嬲tt :h e 允t i l r e sd e v e l o p m e n to fm et l l i n 笋,t l l e nt l l ep r e d i c t o dr e s u l t sc o u l dp r 0 、,i d et l l et l l e o r e t i cb 嬲i so fm ed e c i s i o n 鲫p p o r t i i 坞s y s t e mf o rm em 锄a g e 倦m u l t i v a r i a t el i i l e 盯托 g r e s s i o n 锄a l y s i sm o d e li so n es t a t i s t i cm e m o d 锄o n gn 啪e m u sf o r 嬲t i n gm 以1 0 d s ,w i l i c hc a i lf o r e c a s to m0 rm a n yd 印朗d e n tv 撕a b l 豁1 1 o u 曲as e to fi i l d 印e n d e n t 州a :b l c s a tp r e s e n t ,i tl l a sa 【n l e l n e l y 、) i r i d e s p r e a da p p l i c a t i o ni nm ep r o d u m i o no f m ei i l d u s 仃y 肌dt l l e 删c u l t u r e 孤dt l l e 麟e a r c ho f 廿l es c i 饥c e h o w e v e r t h em u l t i v a r i a t e1 i n e a rr e 莎懿s i o na n a l y s i sh 嬲d i s 敷l v 锄曲萨s :( 1 ) i tc 锄n o tn m船t h ed 哪嘲触v a r i a b l e ,t h er e f l e c t i o no ft l l em o d e ld e l a y sm o r e 锄dm e 硝p o i l s e 缸eo fm es y 8 t e mi sl o r i g c r ;( 2 ) i ti ss e i l s i t i v et 0n l ea :b n o n i l a l o fp l e n t ) ro fs 锄p l 豁t h ea :b n o n n a ld a t aa 行e c t st h es i m u l a t i o n 锄di n a c c i l l a t e l ei e s u i t sw h e nw eu s et l l em o d e lt 0p r e d i c tn l ed 印e n d e n tv 碰a b l e h 0 w 时盯,i np r 枷c e ,w e1 1 e e d1 1 0 t0 1 1 1 yn m 蛆e rn l ed y n 锄i cc h 觚g eo f m ed 印e n d e n t 嘶a b l e ,b u ta l s 0a v o i d l ei i i f l u c eo f t l l ea :b n 0 肌a 1d a 慨t 0n l es i i i m l a 矗o n t h eg r c ys ) ,s t 锄1 e 0 d ,i sb 嬲e d t l l et i l i l es e q u 锄nl a y ss 缸璐so nt l l e 证i p 0 触o f也e1 a t e s t 也i t ai nm ep d i c t i o n 觚dw 翩衄m e 证f h 坞n c eo fm e0 1 d 抵觚也e 蓼e ys 骖;t e mc a i ln m 加d e p a l d e n t 谢a :b l 髂,e x a c n yp r e d i c t st l l ed 印a l d e n tv a r ia :b l 髓觚dm ec h 锄百n gt 锄d e i l c yo ft l l ed 印d e n t 谢a b l 锱i l la d d i 廿。玛m e 伊c ys y s t e mi sb 嬲e d0 n 也ea c l 咖u l a t i n gc h 躐i c t 耐s t i co fm i et i i s c q u a n ,锄da v o i d st h ei i l f l 嘲c eo fm ea b n o m a ld a _ :t at 0m es i i i l m 撕0 n b 嬲i n g0 ns 硼城a 血i i l g 廿1 es h o 渤g eo f 孕e ym o d e lg m ( 1 ,n ) 锄da c c o r d i i l gt 0m et 、0c h 黜l d 砸s t i c so fm e 孕a ys y s t a 呜w ep r e s e i l t c dan e wm o d e l ,i e ,伊a ym u l t i 嘶a t cl i i l e 龃托翟乒髓s i o n 砌y s i sm o d c l ,w h i c hc c i n l b i n 懿m eg 阳l ys y s t e i i l 觚dm u l t i v a r i a t cl i l l e a rr c 伊e s s i o na 舳l y s i sm o d e lt o g e t l l 既o nn l eb 嬲i so ft h e 珊1 wm o d e l ,、阳呻l 锄e n tm eg s a s ( g r e ys 伽s t i c sa n a l y s i ss y s t 锄) w ei i l l p l e i i l e n tt l l ei n u l t i v 撕a t el 妣a rr e g r 鼹s i 觚a l y s i sm o d e l ,黟e ym o d e lg m ( 1 ,m 趾dn e wm o d e l0 n l cp l a t f o m a tt l l es 锄e 妇,w em a k el o t so f t 髑t s t h er e s u l t st u mo u tt l l a tt i l i sn e wi n i d d e lc a nc o p ew i mm es h o r t a g 懿o ft l l em u l 石v a r i a t cl i n 韶rr e 伊e s s i o n 觚a l y s i sm o d e la n dm e 孕e ym o d e lg m ( 1 ,n ) nn o to i l l yc a l l 缸1 t e ro l i tm ea :b n o 衄a l 妣a 、) l ,:i l i c h 疵c tt l l es i i l l _ i l l a t i o l l ,b u ta l s oc a nn ma f t e rm ed 印e i l d e n t 谢a b l 髓,1 e r e f o r em a k em ep r c d i c t i o nm o r ee x a c t l yh lo r d e rt oc h e c ku pm ea v 撕1 a b i l i t ) ro f t l l en c l wm o d e l ,t l l i sp 印e rl l s e sm e 撒1 wm o d e li ns o m ea p p l i c a t i o 溉w | ec 肌旬r c c a s t l ed 印e i l d 饥tv 耐a b l e sw i mm en e wm o d e l n 们u 曲觚a l y z i i l gt l l er e s u l to ft l l ef o r e c 嬲t ,矗n a l l y ,w eg e tas i g n i f i c a n tc o n c l u s i o nn l a tt l l en e wi n o d e li ii sv e 叫e f f 缸i v ei na p p l i c a t i o i l s 锄dt l l er e s u ho ft h ef o r e c a s tc 觚p r o 、,i d ew i t l lt l l et l l e o r e t i cb 嬲i so f n l ed e c i s i o ns u p p o n i n gs y s t e mf o rt h em 锄a g e r s 1 ( e yw o r d s :g 1 e ys y s t e m ;m u l t i v 撕a t el i n e a rr e 莎e s s i o n ;t i m es e q u 饥c e ;m u l t i r ia _ t es t a t i s t i c sa n a l y s i s ;d e c i s i o ns u p p o r t i r 培s y s t e mi 独创性声明本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所取得的成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。对本人的研究做出重要贡献的个人和集体,均已在文中作了明确的说明。本声明的法律结果由本人承担。学位论文作者签名:;诠孟! 三l日期:学位论文使用授权书本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权东北师范大学可以采用影印、缩印或其它复制手段保存、汇编本学位论文。同意将本学位论文收录到中国优秀博硕士学位论文全文数据库( 中国学术期刊( 光盘版) 电子杂志社) 、中国学位论文全文数据库( 中国科学技术信息研究所) 等数据库中,并以电子出版物形式出版发行和提供信息服务。( 保密的学位论文在解密后适用本授权书)学位论文作者签名:幺丞l 丑日期:塑墨:6 :l ,学位论文作者毕业后去向:工作单位:通讯地址:指导教师签名:日期:盘生迎8 :电话:邮编:东北师范大学硕士学位论文1 1 研究的背景和意义第一章绪论1 1 1 研究的背景预测是一种对未来的预计与推测。所谓推测,就是根据过去和现在的已知事实去推测未知事件。人们对事物的认知仅限于过去和现在,因此,实践、实验、统计数据等等都是过去和现在的已知事件。预测就是通过科学分析已知事实来研究未知未来。人们之所以对未来感兴趣,是因为与人们目前的行动有密切的关系,主要表现在两个方面:一是了解了事物发展的未来状况以后,就可以提前做好准备。如果事物未来的发展状况对人们是有利的,则可以修改目前的决策去利用和发展这个有利的未来。如果事物未来的发展对人们是不利的,则可以改变目前的决策来减少损失。二是通过预测可以了解当前决策可能带来的后果,并通过对后果的分析来确定目前的决策,力争使目前的决策获得最佳的结果。总之,预测可以提供未来的信息,为当前人们做出有利的决策提供依据。根据各种预测方法h 叫的特点和属性,可将预测方法分为定性预测、定量预测和模型预测三大类。定性预测是指依靠人的直观判断能力对预测事件的未来状况进行直观判断的方法,因此称为直观判断预测法。定量预测是指在一个系统大量随机现象中求得一定的约束条件即规律,据此规律推断未来状况的方法。模型预测是指根据“同态性原理建立起预测事件的同态模型,并将模型进一步数学形式化,然后再根据“边界性原理确定预测事件的边值条件,从而确定未来状态与现时状态之间的数量关系,如回归分析与相关分析、最小二乘法、联立方程法、弹性系数法等。随着社会和经济的飞速发展,各行各业都需要对未来趋势进行合理预测,为管理者提供决策支持的理论依据,来对自身未来发展做长远计划,因此各种预测算法应用到许多领域中。在众多预测算法中,模型预测中的多元线性回归分析模型陌寸3 应用得非常广泛。但是,多元线性回归分析模型也存在它自身的不足之处。首先,它未考虑时间因素对预测效果的影响,因此对因变量的感知速度比较慢;其次,它对样本中的病态数据比较敏感。灰色系统理论9 3 是邓聚龙在七十年代末、八十年代初提出的。通过查阅大量文献,总结出灰色系统理论的两个特性:基于时间序列n 羽的特性和基于时间序列累加的特性。灰色预测模型是在序列的基础上,建立的类似微分方程的模型,对灰色预测模型进行深入研究后,得出灰模型g m ( 1 ,n ) 的不足。多元线性回归分析和灰模型g m ( 1 ,n ) 是多变量预测的两种主要的方法,但是本身都存在不足。在实际应用中,多变量预测的应用非常广泛,因此对原有模型进行改进的想1东北9 币范大学硕士学位论文法随之产生。1 1 2 研究的意义1 为搜索引擎n 5 1 的查询结果集排序提供科学的理论依据,实时响应用户关注的变化。基于灰色系统理论的多元线性回归分析模型的研究目的在于实时地监控用户关注问题变化,并为搜索引擎提供准确查询结果集,将用户关注问题的变化实时反馈给用户,为用户提供更好的服务。2 为网站管理者提供决策支持的理论依据。以科学的方法为指导,对某一个网站进行监测,基于灰色系统理论的多元线性回归分析模型能实时地跟踪网站的访问流量的变化情况。网站管理者可以依据预测的结果对网站自身的内容进行调整,已满足用户实时改变的需求,增加网站的访问流量。3 对中国人口总数科学的分析和预测,以保证物质资源充足。通过对中国人口总数科学的预测和分析,为政府职能部门提供科学的理论依据,对能源进行合理的调配,以满足人口增加的需求。1 2 国内外研究现状自从1 9 7 0 年b o x 和j 锄虹1 s 的著作时间序列分析、预测和控制问世以来,逐渐形成了一套时间序列模拟、估计、建模、预测和控制的理论和方法,在动态数据的处理分析、复杂信息的加工提取、预测未来和在线控制等方面显示出传统的数理统计静态处理手段无可比拟的优越性。这本著作奠定了时间序列分析方法在科研、经济、社会等各领域中的地位。灰色系统理论是基于时间序列分析的,它对原始数据进行累加,生成近似指数增长的曲线,而指数的增长正符合微分方程解的形式。二十多年来,国内外2 0 0 多种学术期刊发表灰色系统论文,还有许多国际会议把灰色系统理论列为讨论的专题,灰色系统理论成为研究的热点。目前,灰色系统理论中的灰预测模型在社会、经济、工业控制等方面得到了非常广泛的应用。在实际使用灰色预测模型的过程中,我们发现由于数据的累加和累减,使微分方程组呈现出很强的病态性,很难估计出合理的参数。对于高阶模型来说,参数的估计还影响到时间响应式结构的确定,所以在病态条件下,方程结构也很难确定,且呈现出很强的不稳定性。多元线性回归分析是一种通过一组预测变量( 自变量) 来预测一个或多个响应变量( 因变量) 的多元统计分析方法。虽然多元线性回归分析在实际中应用很广泛,然而通过阅读大量文献总结出多元线性回归分析存在两处不足:一是它不能实时地跟踪因变量的动态变化,系统响应时间长,模型反映延迟比较大,从而导致预测结果不准确;二是它对病态数据比较敏感,在原始已知数据中如果存在少量病态数据,会影响拟合的效果。2东北师范大学硕士学位论文1 3 本文研究工作和组织结构1 3 1 研究工作本文研究工作主要集中于三个方面:首先,通过查阅大量的文献资料,总结出多元统计分析中的多元线性回归分析存在不足之处,同时对灰色系统理论的深入研究,得出灰色系统理论的两大特性一时间序列和累加特性,并指出灰模型g m ( 1 娜的不足。在仔细分析灰模型g m ( 1 ,的不足的基础上,结合灰色系统理论的两大特性,提出将灰色系统理论引入到多元线性回归分析模型中的思想,从而建立一种新的数学模型- 灰线性回归分析模型。其次,分析并设计实现了灰多元统计分析平台,在平台上分别实现了灰多元线性回归分析模型、多元线性回归分析模型、灰模型g m ( 1 ,n ) 三个模型的算法,并使用大量的实验数据进行测试,通过对实验结果的对比分析得出结论:灰多元线性回归分析模型是三个模型中最有效的。最后,将新模型实际应用到搜索引擎的查询结果预测和中国人口总数预测中,实验结果表明新模型优于经典多元线性回归分析模型和灰模型g m ( 1 ,聊。通过使用灰线性回归分析模型,根据用户搜索关键字的权值及网站的访问流量预测下一阶段网站访问流量的变化,为搜索引擎查询结果集排序提供依据,网站管理者也可以根据预测结果对网站下一阶段的建设做出合理的调整。同理,通过对中国入口总数的预测,为政府部门提供决策支持的理论依据。1 3 2 组织结构本文共分5 章,各章安排如下:第l 章绪论:介绍本课题的研究背景、意义、国内外研究现状,概括说明本文的主要研究内容和组织情况。第2 章多元线性回归分析:详细给出多元线性回归分析的描述,数学模型,整个模型的求解过程、误差计算及模型存在的不足。第3 章灰多元线性回归分析:通过研究灰色系统理论,在总结出灰模型g m ( 1 娜的不足的基础上,综合灰色系统理论的基于时间序列和累加的两大特性,提出将灰色系统理论应用到经典多元线性回归分析模型中,建立一种新的模型一灰线性回归分析模型。本章给出灰统计的数字特征,详细地给出灰多元线性回归分析模型的定义、求解过程及使用模型进行预测的算法描述,最后对实现的灰多元统计分析平台进行描述。第4 章对比实验及方法应用:使用灰多元统计分析平台中实现的多元线性回归分析模型、灰预测模型g m ( 1 ,n ) 和灰多元线性回归分析模型进行对比实验,给出实验结果,并对实验结果进行分析,最后将灰多元线性回归分析模型应用到搜索引擎查询结果预测和中国人口总数预测中。第5 章结论与展望:对本文所做的工作进行总结,指出方法在未来的发展和应用。东北师范大学硕士学位论文第二章多元线性回归分析多元统计分析n 6 3 是统计学中内容十分丰富、应用范围极为广泛的一个分支,它在自然科学、社会科学及经济学等领域中都得到了非常广泛的应用,是一种非常重要和实用的多元数据处理方法。它通过收集大量的数据,对这些数据进行分析之后,根据分析的结果对某种社会或自然现象相关的问题提出一个改进的解释。六种经典的多元统计分析方法为:多元线性回归分析、主成分分析n 刀、因子分析n 引、典型相关分析n 钔、聚类分析啪1 、判别分析控,本章主要针对多元线性回归分析方法进行介绍。多元线性回归分析是通过一组预测变量( 自变量) 来预测一个或多个响应变量( 因变量) 的多元统计分析方法,使用多元线性回归分析方法预测后,因变量的预测值及变化趋势能够为管理者提供决策支持的理论依据。2 1 模型的一般形式设z l ,z :,z ,为,个自变量,设它们与一个因变量y 有关系。多元线性回归分析模型假定y 由一个均值和一个随机误差s 合成,其中均值为诸z ,的连续函数,而占则考虑测量误差和其余没有被明确考虑在内的变量所产生的结果。在实验中,记录下来的或由研究者设定的自变量的值被视为固定值。误差被看成是随机变量( 因而因变量也是随机变量) ,其行为由一组关于分布的假设来表征。一个因变量的线性回归模型取如下形式:y = 属+ 屈刁+ + 屏乙+ s( 2 1 )式( 2 1 ) 可描述为响应变量等于均值与误差之和。线性是指均值关于未知参数风,l ,”,屏的线性函数,因为自变量在模型中不一定是一阶项。将模型用】,的刀个观测值和与之相联系的诸乙值来表示,则整个模型变为:。y l = 风+ 屈z l l + 厥z 1 2 + + 屏z l ,+ sy 22 风+ 届z 2 l + 履z 2 2 + + 屏z 2 r + s( 2 2 )y 。= p o + p l z n + p 2 2 1 2 + + p r z 盯+ s其中,误差项假定具有以下性质:e ( 占,) = o ;( 2 3 )玩,( 0 ) = 仃2 ( 常数) ;4东北师范大学硕士学位论文c d ,( 占,吼) = 0 ,j | 。将式( 2 2 ) 使用矩阵形式表示如下:y 1y 2:y 。+占0毛:f 或( 二) 2 ( 。乙) ) “,篡1 ) + ( 二)( 2 4 )( 月x 1 )( x ( r + 1 ) ) “,;1 ) 1 )( n x l )、7而式( 2 3 ) 中的假定可表为:e ( 曲= o ;( 2 5 )国,p ) = e ( 箔妙2 j ( 常数) 。设计矩阵z 的第一列为常数项风的系数。习惯上引入一个人工变量z ,0 ,使得p o + p l z n + p 2 z 往+ + p r zi r = p o z j o + p l z f t + p 2 z j 2 + + p r z i rq qz 的第一列由相应预测变量的刀个值组成,而z 的第歹行则包含第歹次试验中所有预测变量的值,因此多元线性回归分析模型如式( 2 7 ) 所示:y=z+ s ;( 露1 )( 一x ( r “) ) “,;1 ) 1 )( 以1 )( 2 7 )e ( g ) 2 ( 2 ) ,仍,( 占) = 仃2 j 。其中,和仃2 为未知参数,设矩阵z 的第j 行为【z 扣,z 月,z 少】。2 2 最小二乘估计多元线性回归分析的目标之一是得出一个方程,可根据给定的自变量来预测因变量的值。数据y ,与在= 6 时的期望值6 0 + 6 1 孙+ 如z ,:+ + 6 ,之差y ,一6 0 一6 l z ,。一6 2 z ,:一钆。一般这个差值不会是零,因为因变量在其期望值周围波动。最小二乘法选择这样的6 ,使上述差值的平方和达到极小值:矗s ( 6 ) = ,一6 0 一6 l z ,。一z ,2 一以z 户) 27 - 1( 2 8 )= ( 少一z 6 ) ( y z 6 )由最小二乘准则选定的参数6 称为的最小二乘估计。记最小二乘估计为,以强调它是的估计值。式( 2 8 ) 根据多元函数极值原理,6 0 ,6 l ,以应满足:掣- 0 ( ,2 3 ,) 。( 2 9 )0 0 :、。即:风屈;屏v i o i i i o o o o 且打;胛zzz也妲;以气乞;乙n孔;村zzz东北师范大学硕士学位论文整理得:即为:2 ( y ,一一6 l z 且一6 2 z ,2 一一6 ,z 少) ( 一1 ) = o善2 ( 儿一6 b 一6 l z ,t 一6 z z ,:一一6 r z 弘) ( 一z ,) = o( 2 1 0 )2 ( y f 一6 0 一6 1 z n 一如z ,2 一一以z 少) ( z 少) = o两边同时乘以z 的转置得:如果( z z ) 。1 存在,则有:,f = l,zj l z r扛l弓2j = lz 日= 】,z z b = 刁yry ;f ;l:i 少,z f = ly i z i rj = i( 2 1 1 )( 2 1 2 )b = ( z z ) - 1 z y将参数曰带入多元线性回归分析方程式( 2 1 3 ) ,求得预测值五。在式( 2 1 3 ) 中,6 0 ,2 j i ,吃,6 ,为上述使用最小二乘估计求得的参数曰,z n ,z 加z 舯,( i = 1 ,2 ,刀) 为多个自变量的原始值。y f = 6 0 + 6 l z l l + 6 2 z i 2 + + 以z 妒,( i = 1 ,2 ,甩+ 1 )( 2 1 3 )将使用式( 2 1 3 ) 计算后的结果代入误差计算式( 2 1 4 ) ,求得方差,将方差开方后即得标准方差。在式( 2 1 4 ) 中,e ( x ) 为均值,y ( x ) 为方差。y ( z ) :e 【( x e ( 石) ) :】:薹! 兰二竺! 兰兰:( 2 1 4 )在使用多元线性回归分析方法进行预测时,需要对下一个时刻的自变量的值进行预测,然后将预测的值代入公式( 2 1 3 ) 中,求出下一个时刻因变量的预测值。通过上述对多元线性回归分析模型的详细叙述,并查阅了大量的参考文献,同时使用大量数据对模型进行测试,得出多元线性回归分析模型的两个不足:首先,在使用多元线性回归分析模型进行预测时,预测结果及变化趋势都比较稳定,但是由于它未考虑6挖咖尼z zz 且一弦,鲥,d鲥,d瑚易弘弘n矿r易鲥厶阔东北师范大学硕士学位论文时间序列因素的影响,因此无法突出新近信息对预测结果的影响,导致它不能实时地跟踪因变量的动态变化,反映延迟比较大,系统响应时间长,从而导致预测结果偏离预测值;其次,多元线性回归分析对大量样本中的病态数据( 异常数据) 比较敏感,在运算的过程中,如果出现病态的数据,就会影响拟合的效果,预测的结果不准确。在实际应用中,我们不仅需要实时跟踪因变量的动态变化,对因变量做出准确预测,而且在获取大量的样本数据时,应当尽量减少病态的数据,但是少量的病态数据又是不可避免的。在这种情况下,迫切需要对多元线性回归分析模型进行改进,来对因变量实时跟踪,预测因变量的变化趋势及因变量的下一个时刻的预测值。7东北师范大学硕士学位论文第三章灰多元线性回归分析为了弥补多元线性回归分析模型的不足,本文对灰色系统理论进行了深入研究,并使用大量数据对多变量灰模型g m ( 1 ,n ) 进行测试,发现了灰模型g m ( 1 j d 的不足,然而灰色系统理论基于时间序列和累加的特性,启发我们将灰色系统理论引入到多元线性回归分析模型中,从而建立一种新的模型一灰多元线性回归分析模型。本章在分析了灰色系统理论的基本概念,总结了灰模型g m ( 1 舯的不足基础之上,定义了灰统计的数字特征,提出了灰多元线性回归分析的数学模型,给出了模型求解过程及算法描述,并对实现的灰多元统计分析平台进行了描述。3 1 灰色系统理论简介随着信息化社会的飞速发展,出现了信息大膨胀,也突显了信息不完全、不确定性。当面对信息不完备、不确定,数据较少的现实,正确地描述对待周围不断增多的信息成为重要的研究内容。灰色系统理论正是应运而生的一门新兴学科,为解决信息不完全、不确定性提供了科学的理论依据。在控制论中,人们常用颜色来描述对信息的认知程度。黑色表示对信息一无所知,白色对信息完全认知,灰色系统是指对信息部分认知。灰色系统理论的研究对象是“部分信息己知,部分信息未知 的少信息的不确定系统,它通过对已知部分信息进行处理、挖掘和分析,来预测未来世界的发展。灰色系统理论的主要内容有:灰生成、灰分析、灰建模、灰预测2 榭】、灰决策、灰控制等。灰生成是指对数据进行转化和处理。灰分析是指灰关联分析,是杂乱不清的灰关系进行序列化、模型化,从而使灰关系量化、序列化、显示化。灰建模是少数据的建模,是在少量数据的条件下,模仿微分方程建立具有部分微分方程性质的模型,为预测提供理论模型。灰预测是建立时间轴上过去现在与未来的关系,通过此关系预测事物的未来发展。灰决策是根据灰预测的分析结果,以找出事件的最佳决策方法。灰控制目前主要是灰预测控制哺册1 ,它主要是建立灰预测模型,对未来进行预测,根据预测的结果进行系统控制。目前,灰色系统理论在工业、农业、教育啪3 、经济、环境交通嘲棚1 等许多方面都得到了广泛的应用,通过使用灰分析来找出系统中灰关联变量之间的关系,使用灰预测来来对事物的未来发展做出预测,从而为灰决策和灰控制提供理论依据。3 1 1 基本概念1 灰度在灰色系统理论中,灰度的定义是相对集合来说的,是属于弱统计的。在现实生活中,人们对事物的认知存在一个渐进的过程,即对事物的认知有一个由黑到白的过程。8东北师范大学硕士学位论文我们设= 若io = 1 ,2 ,以) 为灰度,其中刀为集合中已经被认知的元素的个数。从公m u j式中可以看出,假设人们对事物完全认知时为1 ,然而在实际中人们对事物不能完全认知,一定会存在一部分无法认知,随着时间的推移,慢慢地认知,认知将逐渐增多,但永远不能是完全认知,永远不能达到1 。2 灰序列生成灰色系统理论是根据各种系统提供的特征数据,来研究系统中各个因素之间及因素本身的相互关系及变化规律。我们获得的数据一般都是过去的或现在的白化数据,如何利用这些数据来研究系统内部各个因素之间的关系及系统的变化规律,采用不同的研究方法,研究的思路也完全不一样。随机过程是以先验概率为基础,来研究数据的统计规律,这种方法是建立在大量数据的基础上的。但有时候,即使有大量数据进行统计也未必一定能找到统计规律。因为我们研究的典型分布是十分有限的,对于非典型的分布过程( 如平稳过程、高斯过程、马尔可夫过程或白噪声过程等以外的分布过程) ,很难处理。灰色系统是通过对原始数据的处理来寻求其变化规律的,这种通过数据寻找现实规律的途径,称为灰色序列生成。灰色系统理论认为,虽然客观系统表象复杂,数据杂乱,但是从整体功能上看,它必然蕴含某种内在客观规律。一切灰色序列都能通过灰生成弱化它的随机性,显现它的客观规律性。3 累加生成灰指数律累加生成是灰色系统理论的重要特性之一,它是使灰色过程由灰变白的一种方式。通过累加可以看出变量积累过程的发展变化趋势,使杂乱的原始数据中蕴含的客观规律充分显示出来。一般的非负光滑序列经过累加生成后,都会减少随机性,呈现出近似的指数增长规律,能减少病态数据对拟合效果的影响。原始序列越光滑,生成后指数规律也就越明显。3 1 2 灰模型在序列的基础上,建立近似微分方程模型,称为灰建模口心1 。建立的近似微分方程模型称灰模型。通过对已有数据进行灰建模,利用灰模型对序列的未来发展趋势进行预测,根据预测的结果及变化趋势为管理者提供决策支持的理论依据。这里主要介绍灰色预测模型g m ( 1 ,1 ) 和g m ( 1 ,n ) ,在实际使用过程中,它们都使用累加的方式对数据进行处理。1 灰模型g m ( 1 ,1 )灰模型g m ( 1 ,1 ) 是单变量时间序列的一种预测方法,它通过对单变量数据进行灰变换处理,建立近似微分方程模型,将微分方程模型转化为矩阵形式,通过矩阵求解来对变量下一个时刻值进行预测。定义3 1 令p 为差异信息命题,工( o 为原序列,x ( 1 ) = 彳g 孤( ,x ( 1 ) 为x ( 1 的等间隔子9东北师范大学硕士学位论文序列集。在x ( 1 ) 上,模仿白微分方程矗。兰+ 甜= 6( 3 1 )讲。并满足下述条件的方程,称为灰微分方程。1 ) 结构条件:具有x ( 1 ) 上信息浓度最大的灰导数。2 ) 材料条件:灰导数x ( o ( 七) 的白化背景值与灰导数成分满足平射。3 ) 品质条件:灰导数白化背景值位于单调增的背景集中。上述三条件称为建模三条件。定理3 1 令尸为差异信息命题,x ( o 为原始序列,x ( 1 ) = 么g m ( ,x ( 1 ) 为x ( 1 ) 的等间隔子序列集,么g d 为累加符号。则x ( 1 ( 或x ( 1 ) 上的灰微分方程为石o + 韶1 ( 七) = 6( 3 2 )z 1 ( 七) = o 5 x ( 1 ( 七) + o 5 x 1 ( 七一1 )七x o ( 后) = x o ( 所)埘= l对灰微分方程( 3 2 ) 解释如下:1 ) g m ( 1 ,1 ) 的含义为l 阶( o r d 哪,1 个变量撕a b l e ) 的灰模型( g r e ym o d e l ) ;g m ( 1 ,1 )g( 3 3 )( 3 4 )2 ) 称口为发展系数。因为口的大小及符号,反映x ( o ( 及x 1 ) 的发展态势;3 ) 称6 为从作用量。因为6 不是可以直接观测的,是通过计算得到的,是等效的作用量,是具有灰的信息覆盖的作用量,故称灰作用量;4 ) z ( 1 ( 七) 的序列z 1 = ( z 1 ( 1 ) ,z 1 ( 2 ) ,z 1 ( 刀) ) ,z 1 ( 七) = 0 。5 x 1 ( 七) + o 5 x 1 ( 七一1 )称为白化背景值序列。基于每个白化背景值z ( 1 ( 七) 都是x ( 1 ( 七) 与x ( 1 ( 后一1 ) 的平均值。由上述灰色系统的建模思想知,g m ( 1 ,1 ) 模型满足下列矩阵形式:y n = b p 其中,b =一z ( 1 ( 2 )1一z 1 ( 3 )lz ( 1 ( ,1 )ly n 2l ox o ( 2 )x ( o ( 3 )x o ( 力)尸= 嘲。5 东北师范大学硕士学位论文_ _ 一参数列户的最小二乘估计满足:男r y = 口r b p( 3 6 )由高斯主元消去法解方程组得出p ,将p 代入灰微分方程式( 3 1 0 ) ,解得:以川) - ( 巩0 ) - 争p 埘+ 知= 1 ,2 ,m ,其中,x f l ) ( o ) = 崭o ( 1 )代入累减还原式得: ( o ) ( 1 ) ( 1 )毛( 七+ 1 ) = x l( 后+ 1 ) 一x l( 七)( 3 7 )( 3 8 )即解出y 的预测值。2 灰模型g m ( 1 加灰模型g m ( 1 ,是多变量时间序列预测模型,当对多变量的系统做整体的、全局的、动态的分析时,就需要使用g m ( 1 ,如模型。g m ( 1 娜中包括1 个因变量黾及n 一1 个自变量毛,( i = 2 ,3 ,) ,其符号内涵为:g m ( 1 ,n )定理3 2g m ( 1 ,n ) 模型为x o + 韶1 ( 七) = 包x 乳七)f = 2( 3 9 )其中,z ( 1 ( 七) = o 5 x ( 1 ( 七) + o 5 x 1 ( 七一1 ) ,薯1 ( 七) = 毛( 所) ,七k = 1 ,2 ,m 卜。( 3 1 0 )定理3 3g m ( 1 ,n ) 模型的白化模型为掣划1 ) ( 驴羔包f 诹)办留( 3 1 1 )由上述灰色系统的建模思想知,g m ( 1 娜模型满足下列矩阵形式蜘= ( 3 1 2 )东北师范大学硕士学位论文其中,曰=一z 1 ( 2 ) ( 2 ) 碍( 2 )一z 1 ( 3 ) 霹( 3 ) 碟( 3 )一z o ( 以) 霹( 疗) x 妒( 以)y n 2z o ( 2 )石o ( 3 )x o ( ,1 )p =口6 2b n参数列p 的最小二乘估计满足:b ly n = b lb p n由高斯主元消去法解方程组得出p ,将尸代入灰微分方程( 3 1 1 ) 解得:三。c 七+ ,= c 。1 c 。,一 姜岛1 c 七+ l ,p 一破+ 姜岛。1 c 忌+ 1 ,。3 。3 ,其中,墨d ( o ) = 并( 1 )代入累减还原式得:五( | j + 1 ) = 而( 七+ 1 ) 一而( 七)即解出y 的预测值。模型误差计算公式如下:e o ( 七) = ( ( x o ( f ) 一而o ) ) ( x o ( f ) 一毛( 功) 万( 3 1 4 )】 = l灰模型g m ( 1 j d 是针对少数据信息提出的预测模型,邓聚龙先生曾经指出g m ( 1 j d在时间序列超过一定数量以后,在使用过程中出现模型失效。通过对模型进行大量的数据测试,发现模型在原始数据波动比较大的情况下进行预测时,也会出现模型失效现象。同时,灰模型g m ( 1 ,n ) 采用累加的方式进行数据处理,因此对新数据非常敏感,新数据在预测中起主要作用,预测趋势变化幅度非常迅速,导致预测的结果偏离了真实值。3 2 灰多元线性回归分析在深入研究经典多元线性回归分析模型和灰模型g m ( 1 ,后,发现两个模型本身存在不足。针对两种模型的不足,本文提出将灰色系统理论引入到多元线性回归分析模型中的思想,从而建立一种新的模型灰多元线性回归分析模型m 1 。本节主要描述灰统计的数字特征、灰多元线性回归分析模型定义、求解过程、误差计算及使用模型进行预测算法描述,最后对实现的灰多元统计分析平台进行描述。3 2 1 数字特征统计学研究的目的,就是要获取随机变量或实测数据的某些统计特征,根据统计特1 2东北师范大学硕士学位论文征,寻求统计规律。因此,需要从统计特征着手,研究各种统计方法。参照经典统计学的数字特征,下面给出灰序列定义及灰统计的数字特征。在这些数字特征中,最为常用的是数学期望、方差、协方差和相关系数,这里主要给出数学期望和方差的计算公式。1 灰序列设序列h 妇s = 冬,s :,s 。 ,灰度g = 詹,g :,巩) ,则称:g s = g ,s ) = , , = 台l j l ,9 2 s 2 ,g 。s 。)( 3 1 5 )为灰序列。其中,& = 面当万o = 1 ,2 ,以) ,称为序列s 中第f 个元素s ,的灰度。灰度是强统计的,对集合中每个元素都给出灰度的明确定义,而邓聚龙给出的灰度定义是弱统计的,只是对集合中的认知部分给出灰度定义。为了便于计算,引入白度的概念,称:m :上:1 。g :( f ) 为序列s 中第f 个元素既的白度,则灰序列对应的白化序列为:g i孵= 杪,s = , , ,s 。 = “s l ,w 2 s 2 ,占。2 数学期望设序列s = 冬,j :,s 。 ,白度形= “,w 2 ,) ,则称:w f _岱) = ( 3 1 6 )( 3 1 7 )为序列s 的灰数学期望,简称数学期望,或称序列s 的灰均值,简称均值,数学期望是序列s 的一个重要数字特征。3 方差设序列s = 。,j 2 ,s 。) ,白度矿= “,w 2 ,) ,数学期望易( x ) ,则称:m ( 既一e g ( s ) ) 2( s ) = e g 【( s e g ( s ) ) 2 】= 圭l 1 一w if l l( 3 1 8 )为序列s 的灰方差,碗称方差,另记为g z ,称g 吒= 丽为序列s 的灰均方差或灰标准差,简称均方差或标准差,序列s 的方差表示了s 的取值相对于它的均值( 石) 的分散程度,它是序列s 的另一重要数字特征。东北师范大学硕士学位论文3 2 2 数学模型灰多元线性回归分析模型是以经典多元线性回归分析模型为基础的,因此经典多元线性回归分析的模型定义及求解过程也是适合灰多元线性回归分析的。在灰多元线性回归分析模型中,通过多个自变量来预测因变量的预测值及变化趋势,模型中的多个变量是互不相关的。假设在实际问题中,存在个变量,其中存在一1 个自变量,1 个因变量,存在,1 个时间序列,灰多元线性回归分析模型通过一1 个自变量及一个因变量来预测因变量在下一个时刻的预测值及因变量的变化趋势。l - 模型定义设墨o = ( 膏( 1 ) ,j c f o ( 2 ) ,石o ( n ) ) 为因变量序列,自变量序列如下:墨= ( 掣( 1 ) ,篁( 2 ) ,( n ) ) ,墨= ( 毫( 1 ) ,毫( 2 ) ,蠢( n ) ) ,霹= ( 嚣( 1 ) ,嚣( 2 ) ,嚣( n ) )由上述灰度定义,将自变量序列和因变量序列在不同的时间序列点上,各个变量乘以自身的白度,进行灰处理变换。由多元线性回归分析的建模思想知,灰多元线性回归模型满足下述矩阵方程组:蜘= 珥( 3 1 9 )其中,曰:l 0 9 2 ( 1 ) 掣( 1 ) 1 0 9 2 ( 1 ) 毫o ( 1 ) l 0 9 2 ( 1 ) 工磐( 1 )l 0 9 2 ( 2 ) x ( 2 ) l 0 9 2 ( 2 ) 砖( 2 ) l 0 9 2 ( 2 ) 工器( 2 )l 0 9 2 ( 以) x ( 以) 1 0 9 2 ( 靠) x p ( ,1 ) l 0 9 2 ( 疗) 石器( 刀)y n2l 0 9 2 ( 1 ) x f ( 1 )1 0 9 2 ( 2 ) x f o ( 2 )1 0 9 2 伽) x f o j 0 )昂=2 求解过程灰多元线性回归分析模型的求解与经典多元线性回归分析模型一样,是以最小二乘估计为基础的,通过求解矩阵的系数,求得回归系数。由上述模型定义可知:y n = b p n参数列r 的最小二乘估计满足:1 4口岛钆k东北师范大学硕士学位论文b tb p n = b ty n如果( 曰r 召) - 1 存在,则昂= ( b r 召) - 1 b r y 公式( 3 1 9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论