数学建模关于马尔科夫链模型_第1页
数学建模关于马尔科夫链模型_第2页
数学建模关于马尔科夫链模型_第3页
数学建模关于马尔科夫链模型_第4页
数学建模关于马尔科夫链模型_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于马尔科夫链与灰色GM(1,1) 的图书借阅量的预测模型的研究摘 要 通过分析图书借阅量的特点,建立了基于马尔科夫链的图书借阅量的预测模型和灰色GM(1,1)模型预测,并对两种模型预测结果相对比分析,得出马尔柯夫链理论适用于预测随机波动大的动态过程,在这一点上恰恰可以弥补灰色预测的局限.马氏链预测对象要求具有马氏链和平稳过程等均值的特点,而客观世界中的预测问题大量是随时间变化或呈某种变化趋势的非平稳过程. 如果采用灰色GM(l,l)模型对预测问题的时序数据进行拟合,找出其变化趋势,则可以弥补马氏链预测的局限,而在灰色预测的基础上进行马尔柯夫预测,又可以弥补灰色预测对随机波动大的数据序列预测准

2、确度低的缺陷。从而两种模型相互结合可以较准确地图书馆借阅量情况进行预测。关键词:图书借阅量 马尔科夫链 预测 灰色系统模型GM(1,1) 1模型假设52模型的建立与求解62.1 马尔可夫预测法基本原理及方法62.1.1 马尔可夫预测法概述62.1.2 马尔科夫链的特点262.1.3 马尔科夫预测法基本概念3-562.1.31状态62.1.3.2状态转移过程72.1.3.3马尔科夫过程72.1.3.4马尔科夫链72.1.3.5状态转移概率72.1.3.6概率矩阵72.1.3.7状态转移概率矩阵82.1.4马尔科夫链预测算法步骤821.5 利用马尔科夫预测法分析实际案例92.2灰色系统GM(1,1

3、)模型预测借阅量122.2.1 灰色系统GM ( 1, 1) 模型122.2.2后验差检验142.2.3 实例分析153马氏链模型与灰色系统GM(1,1)模型的比较与评价及改进184结论19参考文献21附录22引言:一般来说,管理的关键是决策,而预测是决策的前提。借阅量是图书馆业务统计中的重要指标,可以衡量图书馆情报部门的工作质量与效益。有关借阅量的调查、统计、分析、预测等研究和探讨,一直是图书情报学界的研究热点。本文利用建立马氏链模型,预测了未来连续若干个周次的借阅量,从而为制定图书馆管理提供了一定的理论依据。其次本文运用灰色系统GM(1,1)模型,与马氏链模型的预测结果进行了比较和评价,对

4、于图书馆管理的改进,有了更进一步的指导作用1模型假设 由某资料室近11周图书借阅量知道第8周只有周四、五的借阅量,我们假设第8周的周一、二、三放假,图书借阅量为零。在预测未来第12、13、14、15周的借阅量时,我们假设该单位没有放假,图书馆正常开放,并且该单位没有举行一些与该图书馆有关的活动,例如:读书周或读书日,考试,比赛等。在预测图书借阅量时,我们是利用一周总的借阅量,并且预测一周总的借阅量。马尔科夫链预测只与前一周的借阅量有关,由于第8周的借阅量不足一周,对预测的误差较大,故在利用马尔科夫链预测时,我们假设第8周,放假一周。在利用GM(1,1)预测时,我们假设只用前七周的借阅量,来预测

5、未来8周的借阅量,并且利用实际的第9、10、11周的借阅量,和模拟值的第9、10、11周的借阅量对比,来检验GM(1,1)的精确度。2模型的建立与求解2.1 马尔可夫预测法基本原理及方法2.1.1 马尔可夫预测法概述马尔可夫是俄国的一位著名数学家(18561922),他提出的预测方法具有较高的科学性、准确性和适应性,在现代预测方法中占有重要地位。马尔可夫预测法以系统状态转移图为分析对象,对服从给定状态转移率、系统的离散稳定状态或连续时间变化状态进行分析。在该模型中,系统的连续时间变化被划分成多个状态以代表不同时刻的工作模式。马尔可夫预测技术是应用马尔可夫链的基本原理和方法研究分析时间序列的变化

6、规律,并预测其未来变化趋势的一种技术1。2.1.2 马尔科夫链的特点2过程的离散性。该系统的发展,在时间上可离散化为有限或可列个状态。过程的随机性。该系统内部从一个状态转移到另一个状态是随机的,转变的可能性由系统内部的历史的概率值表示。过程的无后效性。系统内部的转移概率值与当前状况有关,而与以前的状态无关。 凡是满足以上3个特点的系统,均可用马尔科夫链研究其过程,并可预测未来。2.1.3 马尔科夫预测法基本概念3-5 2.1.31状态某种现象在某时刻(或时期)出现的某种结果,称系统处在“状态” 。如图书馆借阅量状态:低谷期、正常期、高峰期等等。2.1.3.2状态转移过程事件的发展,从一个状态转

7、移到另一个状态,称为状态转移。2.1.3.3马尔科夫过程在事件发展过程中,若每次状态的转移都仅与前一时刻的状态有关,而与过去状态无关,或说状态转移过程是无后效性的,则这样的状态转移过程就称为马尔科夫过程。2.1.3.4马尔科夫链如n个状态,每隔单位时间才可能发生,具有无后效性,则可看作一个马尔科夫链。本文只介绍齐次马氏链的应用,即状态转移概率与所在时刻无关。2.1.3.5状态转移概率条件概率反映状态向状态转移的概率,称为状态转移概率,简称为:2.1.3.6概率矩阵若矩阵满足条件: 则称为随机矩阵,或概率矩阵。2.1.3.7状态转移概率矩阵一步状态转移矩阵如预测对象有n个可能状态,从某种状态向这

8、n种状态转移的概率为,称矩阵为状态转移概率矩阵:k步状态转移矩阵 K步转移概率矩阵:事物由状态经过k步运行,转移到状态的概率,记为。对应的矩阵记为。K步状态转移矩阵等于k个一步状态转移之积,即=P的k阶乘。2.1.4马尔科夫链预测算法步骤划分预测对象所出现的状态计算初始概率 初始概率:指分析历史数据所得到的某一状态出现的频率。设有n个状态。观察了M个时期,其中状态,出现了次, 于是就是出现的频率即近似概率。计算状态转移概率矩阵:从个出发,计算转向状态的个数,进而计算= 得到一步状态转移矩阵P,并可由此得K不状态转移矩阵。根据转移概率进行预测 从最后一个状态出发,选择中最大者为k步预测结果。21

9、.5 利用马尔科夫预测法分析实际案例某单位资料室近11周图书馆借阅量如下表所示:周次借阅量星期1234567891011一942114282111669007311098807810862二978854716823735648904760931715三1039710683697719525821770265788四1077640419602550651564574560204482五12918915231081992303109410738874111063表1:近11周图书馆借阅量汇总周次123456791011借阅量5327423731624369389628584481378426213

10、910 由原始数据作出图书馆借阅量趋势图(如下图)马氏链模型根据资料室近11周的借阅量的有关数据,预测了1215周图书馆的借阅量。具体操作步骤如下:第一步:划分借阅量状态低谷期:借阅量<3000;正常期:3000借阅量4000高峰期:借阅量>4000第二步:计算初始概率低谷期状态点数=2;正常期状态点数=4;高峰期状态点数=4;第三步:计算状态转移概率表2 图书借阅量状态汇总当前所处状态 下期所处状态低谷期正常期高峰期合计低谷期0112正常期2013高峰期0314 由表2可知图书借阅高峰期4次,正常期3次,低谷期2次,其中:高峰期连续出现1次,高峰期转入正常期3次,高峰期转入低谷期

11、0次;正常期连续出现0次,正常期转入高峰期1次,正常期转入低谷期2次;低谷期连续出现0次,低谷期转入高峰期1次,低谷期转入正常期1次;最后一个点的转移状态无法确定,所以对应数值不参与计算。则状态转移概率矩阵为:第四步:预测计算与结果分析(见matlab附件(1) 由表1知第11周图书借阅量为3910册,可知它属于正常期状态,由1阶矩阵可知,2/3最大,故可预测第12周图书借阅量很可能是低谷期状态,低于3000册。同理分析可知,第13图书借阅量很可能是正常期,介于3000册和4000册;第14周图书借阅量很可能是低谷期,低于3000册;第15周图书借阅量很可能是正常期,介于3000册和4000册

12、。利用马氏链预测1215周图书馆借阅量,结果绘制成折线图,如下图所示:图1:马氏链预测1215周图书馆借阅量趋势图应用马尔科夫链模型建立图书馆借阅量的预测模型,是依据原始数据中的最后1周作为初始状态,运用模型来预测以后几周的借阅状态。为图书管理人员把握图书借阅量的整体趋势提供了可靠依据。2.2灰色系统GM(1,1)模型预测借阅量2.2.1 灰色系统GM ( 1, 1) 模型 GM ( 1, 1) 模型是最常用的一种灰色模型, 它是由一个只包含单变量的一阶微分方程构成的模型6。设有变量的原始数据序列:用累加生成算法生成一阶累加生成模块:其中=由一阶灰色模块 构成的微分方程: 按导数的定义,有:若

13、以离散形式表示,微分项可写成:其中x 值只能取时刻k 和k+ 1 的平均值, 即:微分方程可改写成:写成矩阵形式,有:上述方程组中, Y 和X 为已知量, B 为待定参数。由于变量只有a 和b 二个, 而方程个数却有N - 1 个, 而N - 1> 2, 故方程组无解。但可用最小二乘法得到最小二乘解。方程可改写为:Y= X + E式中E 为误差项。欲使利用矩阵求导公式,可得:回到原来的微分方程,有:解之得: 2.2.2后验差检验 预测模型得到的预测值,必须经过统计检验,才能确定预测精度等级。这里介绍后验差检验准则。1)后验差比值C 。所谓后验差比值C是残差方差与数据方差之比。显然,残差方

14、差越小,预测值精度越高,但其数值大小与原始数据大小有关,为了取得统一的衡量标准,故取两者之比,即有:式中: 2)小误差概率P。 按上述两个指标把预测等级划分为四等(见表1) 表1 模型精度综合评定预测精度等级 P C一、好 >0.95<0.35二、合格 >0.8 <0.45三、勉强 >0.7 <0.5四、不合格 0.7 0.652.2.3 实例分析某单位资料室近11周图书馆借阅量如下表所示: 表1:近11周图书馆借阅量汇总周次123456791011借阅量5327423731624369389628584481378426213910利用前七周的数据进行预测

15、,具体步骤如下所示:(周次借阅量15327242373316244369538966285874481应用灰色系统GM(1,1)模型,估计最小二乘参数:x=5327,9564,12726,17095,20991,23849,28330X= Y= = =于是,有故可得微分方程为+0.00128596965x(1)=3855.49195569993则响应函数为x(1)(t)= =(5327- 2998120.48884663)e-0.00128596965t+2998120.48884663= -2992793.488846630 e-0.00128596965t+2998120.48884663

16、根据t = 0 时, 的初始条件, 把响应函数写成离散的白化型响应式: (1)其中 。由(1)式算得数据为累加生成序列的拟合值,当k>7时算得的是预测值。然后再用累减生成还原得到数据序列的一次拟合值 (2)利用3.3中的一次拟合函数(2),可以得到前七周的一次拟合值及残差,如表2所示表2:前七周的一次拟合值及残差周次实际值一次拟合值残差1532753270295649173.2390.831272613014.4-288.441709516850.7244.352099120682.0309.062384924508.5-659.572833028330.00;832146.683817

17、(模拟值)灰色系统模型预测借阅量的后验差检验(过程见matlab附件(2)=118000.1253061225 = 598040.9795918368后验差比值:C=0.44419714426443小误差频率:P=1灰色系统模型预测借阅量精度综合评定合格 利用3.3中的响应函数(1),可以得到第916周的借阅量的预测结果(见表3)表3:916周图书馆借阅量的预测结果 周次 模拟值93812103807113802123797133792143787153782 由于知道9-11周的原始数据,故9-11周的相对误差分别为0.73%,45.2%,2.76%。GM(1,1)较为准确预测出9-11周的

18、值。3马氏链模型与灰色系统GM(1,1)模型的比较与评价及改进图书的借阅量具有很大的波动性与随机性,利用马尔科夫链构建的预测模型是一种应用于随机过程预测的科学有效地方法,它立足于通过统计等途径来获取资料,不需要收集大量的历史数据就能对图书借阅量进行预测。 灰色系统模型是控制论和系统论的重要研究内容。根据灰色系统模型的基本原理,利用7周的借阅量,运用累积法求解GM(1,1)模型中的发展系数a 和灰色作量b,得出预测借阅量的白化型响应式,不仅能够降低运算量,也能提高预测精度,成功预测了1215周的借阅量。检验其预测结果,从数理统计的区间估计来看马氏链模型预测的为一个区间相对于灰色系统GM(1,1)

19、其可靠度相对较高,灰色系统GM(1,1)预测的唯一准确值其精度相对较高,从预测要求若需要较可靠的值则首选马氏链模型预测结果。考虑预测精度则首选灰色系统GM(1,1)预测结果。马尔柯夫链理论适用于预测随机波动大的动态过程,在这一点上恰恰可以弥补灰色预测的局限.马氏链预测对象要求具有马氏链和平稳过程等均值的特点,而客观世界中的预测问题大量是随时间变化或呈某种变化趋势的非平稳过程. 如果采用灰色GM(l,l)模型对预测问题的时序数据进行拟合,找出其变化趋势,则可以弥补马氏链预测的局限,而在灰色预测的基础上进行马尔柯夫预测,又可以弥补灰色预测对随机波动大的数据序列预测准确度低的缺陷。上述实例表明,将马

20、尔科夫预测与灰色系统预测相结合比较,取长补短,克服了两种预测方法各自的缺陷,这在统计预测领域中具有重要的理论和实践意义。故灰色马尔科夫链预测有更好地推广价值。4结论本文首先建立马氏链模型,对图书馆借阅量预测问题进行了分析,在问题讨论当中充分利用了马尔柯夫链的特点,即考虑了从时间序列中挖掘数据的演变规律,通过状态转移概率矩阵反映数据的随机特征,得出了较为准确的预测结果。 其次又利用灰色系统GM(1,1)模型,得出预测借阅量的白化型响应式,不仅能够降低运算量,也能提高预测精度,成功预测了1215周的借阅量。实证结果表明,将 GM( 1,1) -Markov 模型应用于图书借阅行为流量的预测是切实可

21、行的,可以得到较高的预测精度,这也为图书借阅行为流量的定量分析提供了一种新途径。由马尔科夫链模型与灰色系统GM(1,1)模型的结合比较预测结果,我们可以发现图书馆借阅量在未来的第1215周较之前相比有所下降,这就为图书馆管理工作人员在以后的工作中提供了一定的依据。附录附件:(1)matlab矩阵计算过程a=0,1/2,1/2;2/3,0,1/3;0,3/4,1/4a = 0 0.50000000000000 0.50000000000000 0.66666666666667 0 0.33333333333333 0 0.75000000000000 0.25000000000000>&g

22、t; a2ans = 0.33333333333333 0.37500000000000 0.29166666666667 0 0.58333333333333 0.41666666666667 0.50000000000000 0.18750000000000 0.31250000000000>> a3ans = 0.25000000000000 0.38541666666667 0.36458333333333 0.38888888888889 0.31250000000000 0.29861111111111 0.12500000000000 0.48437500000000

23、 0.39062500000000>> a4ans = 0.25694444444444 0.39843750000000 0.34461805555556 0.20833333333333 0.41840277777778 0.37326388888889 0.32291666666667 0.35546875000000 0.32161458333333a=0,1/2,1/2;2/3,0,1/3;0,3/4,1/4a = 0 0.50000000000000 0.50000000000000 0.66666666666667 0 0.33333333333333 0 0.750

24、00000000000 0.25000000000000>> a2ans = 0.33333333333333 0.37500000000000 0.29166666666667 0 0.58333333333333 0.41666666666667 0.50000000000000 0.18750000000000 0.31250000000000>> a3ans = 0.25000000000000 0.38541666666667 0.36458333333333 0.38888888888889 0.31250000000000 0.29861111111111 0.12500000000000 0.48437500000000 0.39062500000000>> a4ans = 0.25694444444444 0.39843750000000 0.34461805555556 0.20833333333333 0.41840277777778 0.37326388888889 0.322

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论