版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数 学 建 模(论文)题 目 售后服务数据的运用 计算机科学与工程学院 信息安全专业摘要本文通过对“轿车某部件千车故障数的数据表”的考察与研究,对其中的数据特征作了详细分析,并利用数学工具剔除其中不合理的数据,最后根据数据特征建立了两种不同的预测模型,分别对3个批次的部件作了质量预测。本文所做研究的内容如下:1通过对“轿车某部件千车故障数的数据表”的分析,找出该表中数据的特点,并作了理论分析。2通过对数据的聚类分析修正的数据的有效性,利用线性回归分析对不合理数据进行了剔除。3建立时序平滑预测模型,根据现有数据找出合适的模型并作出可用性分析。4建立水平方向上的灰色预测模型GM(1,1),根据聚类
2、分析的结果进行预测。5对上述两种模型进行求解,针对数据表中所出现的三种情况充足数据、残缺数据、无数据,分别对其中三个批次的部件的质量使用不同的模型进行平滑预测。6对充足数据进行Holt-Winters模型进行预测,对残缺数据和无数据情况经过聚类分析处理后进行灰色模型gm(1,1)的预测。最后,得出结果如下:0205批次使用月数18 时的千车故障数:51.100306批次使用月数 9 时的千车故障数: 8.970310批次使用月数12 时的千车故障数: 7.22目 录1. 问题的提出与分析 41.1问题的提出. 41.2问题的分析. 52. 模型假设. 63. 数据分析. . 63.1销售量数据
3、分析. 63.2故障数数据分析. 73.3数据总体简单分析. 74. 模型建立. 74.1时间序列平滑预测模型. 74.1.1 移动平均预测法 74.1.2 指数平滑预测法 84.1.3 自适应过滤法 84.1.4 Holt-Winters预测法. 84.2灰色模型. 94.2.1 灰色理论及模型简介 94.2.2 水平方向的灰色预测模型. 114.2.3 聚类分析原理. 124.2.4 模型使用过程. 135. 模型求解 135.1充足数据. 135.2残缺数据 . 145.3无数据. 166. 结果分析 177. 优缺点分析 188. 参考文献 18附录. 191灰色模型Matlab源代码
4、2充足数据Holt-winters模型的原始数据与预测数据以及参数1.问题的提出与分析1.1问题的提出:产品质量是企业的生命线,售后服务是产品质量的观测点,如何用好售后服务的数据是现代企业管理的重要问题之一。现以某轿车生产厂家为例考虑这个问题。假设该厂的保修期是三年,即在售出后三年中对于非人为原因损坏的轿车免费维修。在全国各地的维修站通过网络将保修记录送到统一的数据库里面,原始数据主要包含哪个批次生产的轿车(即生产月份)、售出时间、维修时间、维修部位、损坏原因及程度、维修费用等等。通过这样的数据可以全面了解所有部件的质量情况,若从不同的需求角度出发科学整理数据库中的数据,可得到不同用途的信息,
5、从而实现不同的管理目的。整车或某个部件的“千车故障数”是一个很重要的指标,常用于描述轿车的质量。首先将轿车按生产批次划分成若干个不同的集合(下面表格的同一行数据就来自同一集合),再对每个集合中迄今已售出的全部轿车进行统计,由于每个集合中的轿车是陆续售出的,因此它们的统计时间的起点即售出时间是不同的。但在下面表格中,每一列数据的统计时间的长度却是相同的,在相同使用时间长度内的整车或某个部件的保修总次数乘以1000再除以迄今已售出的轿车数量,即为下面表格中的千车故障数。数据利用的时效性是很强的,厂方希望知道近期生产中的质量情况,但刚出厂的轿车还没有全售出去,已售出的轿车也没使用几个月,因此数据显得
6、滞后很多。当一个批次生产的轿车的三年保修期都到时,我们对这批轿车的质量情况有了最准确的信息,可惜时间是轿车出厂的四、五年后,这些信息已无法指导过去的生产,对现在的生产也没有什么作用。所以如何更科学地利用少量数据预测未来情况是售后服务数据利用的重要问题。现有2004年4月1日从数据库中整理出来的某个部件的千车故障数,见下页的表。其中的使用月数一栏是指售出轿车使用了的月份数,使用月数0的列中是已售出的全部轿车在用户没使用前统计的千车故障数,1的列中是某一批次已售出的每一辆轿车,在它被使用到第一个月结束时统计的,对于该批次售出的全部轿车累计的千车故障数(即没使用时和第一个月中千车故障数的和),12的
7、列中是每辆车使用到恰好一年结束时的累计千车故障数。生产月份是生产批次,如0201表示2002年1月份生产的。随着时间的推移,轿车不断地销售出去,已售出轿车使用一段时间后的千车故障数也能不断自动更新,再打印出的表中数据也将都有变化。轿车某部件千车故障数的数据表使用月数1211109876543210生产月份制表时销售量020124574.884.884.884.484.074.073.662.442.441.221.220.410.41020216705.995.995.395.395.395.394.194.193.592.992.41.80020315804.433.83.83.83.83.
8、83.162.532.531.270.63000204370413.7712.1511.619.729.187.836.755.674.322.431.350.5400205380636.7834.6831.5329.4327.0625.2223.1221.8118.1316.5513.48.933.940206291041.5839.1836.0832.9931.6228.8724.7423.0218.915.4613.49.284.470207161472.4969.3962.5854.5247.7143.9940.2734.730.3626.6422.313.013.7202081985
9、75.5771.5469.0264.4856.9352.945.3436.7828.2120.6513.67.561.5102092671112.32110.45108.57104.0895.8484.6174.8865.8952.0442.3127.3311.231.8702102107121.97119.6116.28115.33107.7496.3584.4869.2954.1139.3922.7811.392.850211139995.7895.7894.3592.2185.7882.272.1961.4747.1840.0325.7312.873.570212403101.74101
10、.7494.2991.8189.3384.3781.896752.1144.6732.267.447.4403016450122.79122.79122.48121.55119.84115.5108.0698.2982.6466.9844.9622.023.7203022522143.93143.93143.93143.93141.95139.57135.21125.69106.6684.4662.2525.381.590303290060.3460.3460.3460.346058.2855.8651.7246.2133.116.551.030304112718.6318.6318.6318
11、.6318.6316.8615.9713.317.992.660030581814.6714.6714.6714.6713.4513.4513.45118.561.22030611995.845.845.845.845.845.8451.6700307183113.6513.6513.6513.6513.1110.387.10.55030817545.75.75.75.74.561.710030921630.920.920.920.920.460.460310238900000031124340000031211710001.2 问题的分析:本题要求我们对三批部件未来的故障情况做出预测,这三批
12、部件分别代表了三种典型情况:充分数据预测、残缺数据预测和无数据预测。所谓充分数据下预测,是指已知某一批次部件在多个(大于10个)使用月数中的千车故障数,对其未来进行预测,预测0205批次使用月数18时的故障数就属此类;所谓残缺数据下预测,是指已知某一批次部件在少量(1-10个之间)使用月数中和千车故障数,对其未来进行预测,预测0306批次使用月数9时的故障数就属此类;所谓无数据预测,是指在没有任何有效的千车故障数据的情况下对某一批次部件进行预测,预测0310批次使用月数12时的故障数就属此类。2.模型假设H1、假设该部件只要发生故障,用户都会去厂家指定的维修站维修。H2、假设在统计的过程中没有
13、因为新市场的开拓而对产品的销售量有较大的影响。H3、假设在0201-0312这些批次中,没有特别大的技术变革对汽车性能的影响,也就是每一批次的相同使用月数具有可比性。H4、假设不存在某些汽车由于维修站的技术原因而造成的屡次返修。3. 数据分析3.1销售量数据分析对各批次销售量数据作线性回归,以时间作为自变量。上图对数据残差进行分析,定义学生化残差 (studentized residual),其中为标准差,为观测矩阵的投影阵的主对角线元素。这里所谓的“学生化”主要是针对普通残差不具方差齐性而进行的一种标准化处理,使之期望为0,方差为1,从而便于比较。一般学生化残差大于2就可以认为与之对应的数据
14、异常。从上面的图中可以看出,只有0301批次的销量其学生化残差值大于2,故该批次数据为异常数据,不能作为以后分析的依据。从实际情况来看,销售量的波动大致应该在一定的范围之内,而在0301批次的销售量数据附近,403(0212批次)6450(0301批次)和 6450(0301批次)2522(0302批次)变化过于剧烈,出现这种情况的可能性很低,所以我们将其排除在外。3.2故障数数据分析千车故障数的数据表1211109876543210021195.7895.7894.3592.2185.7882.272.1961.4747.1840.0325.7312.873.570212101.74101.
15、7494.2991.8189.3384.3781.896752.1144.6732.267.447.440301122.79122.79122.48121.55119.84115.5108.0698.2982.6466.9844.9622.023.720302143.93143.93143.93143.93141.95139.57135.21125.69106.6684.4662.2525.381.59030360.3460.3460.3460.346058.2855.8651.7246.2133.116.551.03030418.6318.6318.6318.6318.6316.8615.9
16、713.317.992.660030514.6714.6714.6714.6713.4513.4513.45118.561.2203065.845.845.845.845.845.8451.670030713.6513.6513.6513.6513.1110.387.10.5503085.75.75.75.74.561.71003090.920.920.920.920.460.46031000000031100000312000从对数据表的观察可以发现,阴影部分的单月千车故障数为零。由假设H3可以得知,没有突然的技术革命对汽车性能 的影响,所以这些数据存在这不可靠因素。另外我们经过推理可以得到
17、: 当统计量较小时,偶然因素的扰动就会对数据的趋势有较大的影响,而且难以体现其规律性。所以表格中的灰色数据就不能够体现变化的趋势,我们就把该数据作故障处理。3.3数据总体简单分析根据统计学相关知识,我们可以得到:只有在大量的数据统计下才能降低由于偶然性因素对数据趋势造成的影响。所以每一批次的数据由于统计量的大小导致从左到右的数据的有效性的降低,也就是右边的数据受偶然性因素相对影响较大。4. 模型建立4.1时间序列平滑预测模型4.1.1移动平均预测法移动平均法是根据时间序列资料,逐项推移,依次计算包含一定项数的序时平均数,以反映长期趋势的方法。它将原来时间序列的时间跨度扩大,采用逐项推移的方法计
18、算时间序列平均数,形成一个新的时间序列,以消除短期的、偶然因素引起的变动,从而使事物的发展趋势更加明显地表现出来。一次N元移动平均法的数学模型为:St+1 = ( Xt + Xt-1 + + Xt-N+1 ) / N式中,Stt时间上的预测值; Xit时间上的实际观测值; N取平均的数据的个数(观测点数)。4.1.2指数平滑预测法指数平滑法是移动平均法的改进(1). 一次指数平滑:其中:为一次指数平滑值,为权系数,yt为时间数列各期数据, 为预测值。该方法适用于时间数列无上升或下降趋势的情况。(2). 二次指数平滑:其中:权系数与一次平滑法中的相同。预测模型:当时间序列具有直线趋势,可使用此法
19、。(3). 三次指数平滑:预测公式:当时间序列具有二次曲线趋势时可用此法。4.1.3自适应过滤法自适应过滤法是根据一组给定的权数对时间数列的历史观察值进行加权平均计算一个预测值,然后根据预测误差调整权数以减少误差,这样反复进行直至找出一组“最佳”权数,使误差减少到最低限度,再利用最佳权数进行加权平均预测。预测公式:权数调整公式:4.1.4 Holt-Winters预测法Holt-Winters法也是指数平滑中的一种,它适用于对具有季节影响的线性增长趋势的序列进行预测。这种方法计算截距(常数项)、趋势系数(斜率)和季节影响的各个递推值。如果序列中不存在季节变动,可采用最简单的Holt-Winte
20、rs模型法。这时,只估计两个平滑常数,一个用于平滑常数项,一个用于平滑趋势系数。可以自行设定其中的一个或者两个都设定。等级:趋势:初始值:式中: 等級平滑常数; 趋势平滑常數;Lt t时间上的估計值;Tt t时间上的趋势估计值;yt t时间上的观察值;Ft 到时间t为止之预测值。4.2灰色模型4.2.1灰色理论及模型简介1982年邓聚龙提出灰色系统后,就开始被广泛的运用在生命科学、地质、农业、环保、电力、IT等数十个领域。而灰色系统理论主要能在系统(System)模型不明确或资讯不完整性的情况下,进行关于系统的关联分析(Relational analysis)、模型建构(Model const
21、ruction),并藉预测(Prediction)及决策(Decision)的方法来探讨及了解系统。传统的预测方法需要较大量的观察值,才能进行各种方法的预测,所以不太适合运用在短期的预测上。但灰色预测法的特色便是使用少数据,例如只要有四个已知的观察值,即可顺利进行灰色预测。下表列出了传统预测方法与灰色预测方法的特点。传统预测方法与灰色预测方法的比较方法所需最少数据数据形态数据间隔准备时间数学需求简单指数平滑法5-10等间距短间隔短基本Holts指数平滑法10-15同趋势短或中间隔短稍高Winters指数平滑法>=5同趋势且具规律性短或中间隔短中等回归分析法>=10或>=20同
22、趋势且具规律性短或中间隔短中等Causal回归法>=10可各种形态相互混合短、中及长间隔长高等时间序压缩法2个峰值以上同趋势、具规律性且可自我调整短或中间隔短(稍长)基本Box Jenkins法>=50等间距短、中及长间隔长高等灰色预测法4等间距及非等间距短、中及长间隔短基本灰色系统理论中,基于n个数据的序列:我们建立GM(1,1)模型,再利用此模型计算n点以后的值,称为灰色预测。称为预测步数。此过程可记为灰预测有下列几种:(1)数列灰预测(Sequence Grey prediction): 数列预测是灰预测的基本类型,它是根据给定的数据(数列),直接建立GM(1,1)模型进行预
23、测。由于在指定的时刻,这种预测只能得到一个预测值,因此亦称为单值预测。(2)灾变灰预测(Calamities Grey prediction):给定的数列中,若出现过大或过小的异常值,我们便称这些为灾变值,相应的点称为灾变点,原有数列称含灾变的数列。所谓灾变预测就是这些灰时间分布的预测,所建立的灰色预测模型,即灰数的时间分布预测模型。(3)季节灾变灰预测(Seasonal calamities Grey prediction): 若灾变发生在每年特写时区,人们对这些灾变事件的时间分布进行预测,称为季节灾变预测。(4)拓扑灰预测(Topological Grey prediction): 拓扑预
24、测是季节灾变预测的延伸,它与季节灾变预测的区别在于后者是通过给定的水平线与灾图的交点,获得时间分布序列。(5)系统灰预测(Systematic Grey prediction): 如果系统行为有多种表现,则其预测的难度必然大于一种表现的情况。当多种表现之间没有太多的关系,或者虽然有关系,但人们可以不注意或淡化,则可利用多个GM(1,1)模型对系统的行为进行预测。而本篇研究就是利用数列灰预测的技术,对于少数的短期预测提出适用性的探讨。因此我们针对数列灰预测做进一步说明,数列灰预测法进行的方式可以分为下列五个步骤:步骤1:首先列出观察数列,即原始数列:步骤2:进行累加生成AGO处理,定义为的一次A
25、GO序列步骤3:平均值计算:步骤4:再来求出发展系数a和灰作用b:令则步骤5:最后再进行预测值的运算:在生成及建模后,接着就可以对下一点做预测,但预测与实际值之间一定会有误差产生,灰色理论的误差分析及量化的方式利用下列基本公式来衡量:其中:残差大小,:原始数列之数据,:预测的数列数据。4.2.2水平方向的灰色预测模型对于问题的表中所给的千车故障数,其水平方向的演变趋势是故障数随着使用时间的变化而变化的规律。由于给定的原始数据本身就是一个累计量,因此直接利用这些数据,在水平方向上构造1AGO模型,其中每个生产批次的千车故障数对应于灰色模型的累加序列,千车故障数的增量对应于灰色模型的原始序列。模型
26、的公式如下:则第个批次工作到个月出故障的千车故障数为4.2.3 聚类分析原理聚类分析(Cluster analysis)是根据事物本身的特性研究个体分类的方法,其原则是同一类中的个体有较大的相似性,不同类的个体差别比较大。根据分类对象的不同分为样品聚类和变量聚类。聚类分析作为多元分析的方法之一,由于引进了模糊集合的基本法则,使得它处理问题的能力和范围都有了很大的进展。当进行对特定对象分类时,首先必须采用“相似系数”或者与其具有同等意义的“差异系数”。这种系数是反映被分类对象之间亲疏程度的数量指标。两个客体之间的相似系数越大,其对应的差异系数就越小,这两个客体的关系就越密切,合并成一类或划定为一
27、个区的可能性也就越大,至于亲密关系达到何种程度才可以归为一类,就要引入模糊集中的“隶属度”数值,再根据具体的要求、特定的对象、划分时的范围大小及粗略程度来确定。如此说来,建立相似系数并对其分析与选择,正是进行聚类分析的基础。当然,相似系数建立的本身,就是一个十分困难的过程,它既取决于人们对于分类现象本质认识的深度,又取决于人们的实际工作经验。在自然地理面中,能反映一个地域特征的指标,不下数十种,每一种指标都对构成这种特定的自然环境,有着自己的“贡献率”。除此而外,这些指标之间又有极为复杂的联系,共同对环境产生所谓的“整体效应”。在实际工作中,我们既不可能也无必要将这些指标全部囊括起来,有时甚至
28、还无法立即明白这些指标之间的复杂关系。因此首先就要求制定,这些指标按照对于自然地理区域特征的贡献率,分别是多少?哪几个指标对于造成特定自然地理区域的贡献率最大?这就需要应用通常所谓的“主成分分析”,以便从众多的指标中,择取既能反映客体本质、在数目上又尽可能少的主要指标来。其次,还要将这几个择取出来的主要指标,在所要进行聚类的诸单元中,给予数量化并且统一评定其数量大小,即进行所谓的“标准化”(此时尚须注意标准化的方向),这样各类指标才具有等效值特性和可比性。只有在它们顺利解决之后,才能从它们中间选用合宜的方法如要素分析或聚类分析等,去实行分类。最通常使用的相似系数是“欧几里德距离系数”,用dij
29、来表示。给定两个独立的对象i和j,它们之间的距离系数dij可以规定为:假设P变量是正交的。左图就表示了P=2时的状况。它表述了两个标作i和j的对象,分别位于点B及C。BC之间的距离即为从i到j的欧几里德距离(亦即直线距离),这可以由勾股定理求取。由于x1轴与x2轴是正交的,ABC为直角三角形,故而:倘若P2,很容易看出它的求取办法类似于BC,只不过在等号右边加上(xi3-xj3)2,(xixj)2,而已。dij的数值范围可以从0(完全相似)到无限大(完全不相似)。除了欧几里德距离系数dij外,当然也还有其它表达相似性的系数。4.2.4模型使用过程1、我们先对数据进行K-均值聚类,随机选取初始凝
30、聚点反复迭代,最终的聚类结果也完全相同,这表明该聚类解是稳定的。我们对聚类后的聚类中心点进行提取,作为下一步数据分析的基础。2、在聚类分析的基础上根据数据有效性的分析,剔除聚类分析结果中的某些不合理数据作为进一步数据处理的初始值。3、把2中得到的数据列当作灰度模型的初始数列,进行短期预测。(由于时间仓促,没能对结果与其他模型进行比对)。5.模型求解5.1充足数据我们分别用一次指数平滑模型、二次指数平滑模型及Holt-Winters无季节模型对同一批次的所有故障数进行数据分析,结果见附录:根据结果我们可以看出,拟和最好的模型为Holt-Winters无季节模型,故选用它作为0205批次的预测模型
31、。原始数据与预测数据表如下所示:使用月数原始数据预测数据使用月数原始数据预测数据03.940003.940001031.5300031.7124618.930007.136671134.6800033.75226213.4000012.718391236.7800037.20837316.5500017.413291339.16703418.1300020.278441441.55406521.8100021.149551543.94109623.1200025.047471646.32811725.2200025.721491748.71514827.0600027.656021851.10
32、217929.4300029.299361953.48920表6.1.1 0205批次千车故障数数据表原始数据与预测数据曲线如下所示:图6.1.1 0205批次千车故障数预测图图6.1.2 模型参数所以,0205批次产品18个月故障数之预测值为 51.102175.2残缺数据对下表进行聚类分析,然后利用与0306批次同类的聚类中心点作为灰度模型的初始数列进行预测。使用月数543210生产月份制表时销售量020124572.442.441.221.220.410.41020216704.193.592.992.41.80020315802.532.531.270.6300020437045.67
33、4.322.431.350.5400205380621.8118.1316.5513.48.933.940206291023.0218.915.4613.49.284.470207161434.730.3626.6422.313.013.720208198536.7828.2120.6513.67.561.510209267165.8952.0442.3127.3311.231.870210210769.2954.1139.3922.7811.392.850211139961.4747.1840.0325.7312.873.5702124036752.1144.6732.267.447.440
34、301645098.2982.6466.9844.9622.023.7203022522125.69106.6684.4662.2525.381.590303290055.8651.7246.2133.116.551.030304112716.8615.9713.317.992.660030581813.4513.4513.45118.561.22030611995.845.845.8451.670表6.2.1 聚类分析原始表聚类中心使用月数Cluster12345598.2963.904.13125.6924.44482.6451.433.74106.6620.84366.9842.522.
35、7584.4617.68244.9628.242.1262.2513.62122.0211.90.8825.388.3303.723.35.081.592.48表6.2.2 聚类中心表ClassIII的聚类中心点作为灰度模型的初始输入数列,来对0306批次的千车故障数进行预测,考虑到数据从左到右的有效性的依次降低,故只选用前四个值:4.13 3.74 2.75 2.12 0.88 0.08分类结果:批次ClusterDistance批次ClusterDistance132.8381028.737231.0041126.124333.0411228.210431.874131.000554.24
36、7144.000653.94815211.3597519.37116513.0438514.73417514.199922.7991835.076表6.2.3 分类结果表图6.2.1 灰度模型分析结果预测是从第二月开始的所以x_mcve的第八列即是我们所要预测的结果值Equation-11.7659+13.8859e0.18894*(t-1)5.3无数据由于制表的原因,0310批次的数据缺失,所以只能使用历史数据来进行预测, 所以我们对前12批次的数据进行聚类分析,并以第十二个月的千车故障数为参照点,然后以第三类的聚类分析的中心点作为灰色模型的原始数列进行预测,Cluster Membersh
37、ip批次12月ClusterDistance批次12月ClusterDistance14.8833.872772.49211.07425.9932.356875.57211.07434.4335.4799112.3248.617413.77310.07510121.97429.646536.7814.8481195.78421.559641.5814.84812101.74417.319表6.3.1 聚类成员Final Cluster Centers 使用月份Cluster12341136.9370.476.71106.891033.8165.806.42103.37931.2159.505.
38、85100.86829.3452.325.6194.67727.0548.455.2786.88623.9342.814.4478.36522.4235.743.7165.91418.5229.293.2251.36316.0123.651.9841.60213.4017.951.4027.0319.1110.29.6910.7304.212.62.103.93表6.3.2 聚类中心表鉴于数据的有效性的逐渐降低,我们选择11 ,10,9,8月的千车故障数据作为灰度模型的初始数列,然后预测12月的千车故障数。6.71 6.42 5.85 5.61图6.3.1 灰度模型分析结果由于初始数列是11,
39、10,9,8 月的千车故障数,故x_mcve的最后一列即是0310批次的第十二月的千车故障数 。Equation-78.9958+84.6058e0.067442*(t-1)6. 结果分析在使用Holt-Winters无季节模型作充足数据情况下的平滑预测时,我们发现,预测曲线与原始数据曲线的拟和程度相当好,而且具有非常强的线性特性灰色模型结果: 灰色模型建模过程中,我们对结果的误差进行了检测,Mcv 是预测矩阵:x_mcv0=diff(mcv); x_mcve=x_orig(1) x_mcv0 x_mcv=diff(mcv(1:end-predict); x_orig_n=x_orig(2:e
40、nd); x_c_error=x_orig_n-x_mcv; x_error=mean(abs(x_c_error./x_orig_n);%相对误差的均值如果相对误差率小于0.1则输出“model is perfect”,如果小于0.2大于0.1 则为”model is check out”,如果大于0.2则输出:“model disqualification”灰色模型的分析结果表明,残差数据和无数据的灰色预测模型的相对误差值都小于0.1,也即是很好的符合原数据的发展趋势。7. 优缺点分析1.对于充足数据的预测,我们采用的是Holt-Winters无季节模型预测,该模型适用于具有明显增长趋势的
41、序列。分别使用两个平滑常数计算常数项和增长趋势的递推值,从而影响与原始数据拟和的准确性及对未来数据预测的可靠性。所以,平滑常数的选择很大程度上影响了预测曲线的走势以及最终预测结果的准确性。2.残缺数据的求解,我们是先采用对十二批次充足数据的聚类分析,选取与残缺数据所在一类的聚类中心点作为我们进行进一步分析的原始数据,然后根据数据的有效性对其作进一步的剔除,利用处理过的数据当作灰度模型所需的初始数列进行预测。其优点是充分降低了残差数据所带来的影响,又因为0306批次有效数据有效性很低,所以上面的方法降低了统计数据的个别统计数据的误差对数据预测带来的影响。缺点是,没有充分考虑该批次的数据对将来预测
42、的结果只是对预测的结果进行了检测。3.无数据的求解,因为制表的疏忽导致了数据的空缺,我们采用的是先对充足数据进行聚类分析,并以12月份的千车故障作为参照,用聚类分析结果的紧凑性最好的那组值的聚类中心来填充无数据的行向量,然后利用有效性高的11,10,9,8月的千车故障数作为灰色模型的初始数列预测。8. 参考文献1鲍宁远,通信网业务预测软件技术探讨 邮电规划2003年第6期2张仪萍,俞亚南,张土乔,时变参数灰色沉降预测模型及其应用,浙江大学学报(工学版) Vol36.No.4 July 20023陈平雁,黄浙明,SPSS 10.0 统计软件应用教程,人民军医出版社, 2002 4钱炳全,李顺益,
43、王学亮,基于灰色理论之短期销售预测方法,20035王树勋,熊启才,刘锋,灰色模型GM(2)得建立及实际应用,20006 范金城,梅长林,数据分析,科学出版社,2004附录1灰色模型Matlab源代码灰色模型GM(1,1)的matlab描述: function y,p,e=gm_1_1(X,k) %灰色模型的malab程序%Example y,p=gm_1_1(200 250 300 350,2) %接口描述: X的预测的初始数列,|X|>4,K是指向后进行预测的个数%命令格式: 程序保存的文件名,eg:gm.m 则命令是 gm(200 250 300 350,2) if nargout&
44、gt;3; error('Too many output argument.');end if nargin=1,k=1;x_orig=X; elseif nargin=0|nargin>2 error('Wrong number of input arguments.'); end x_orig=X; predict=k; %AGO 处理,即是对初始数列进行一阶累加 x=cumsum(x_orig); %计算系数(a 和 u)- n=length(x_orig); %生成矩阵 B for i=1:(n-1); B(i)=-(x(i)+x(i+1)/2;
45、end B=B' ones(n-1,1); %生成矩阵 Y for i=1:(n-1); y(i)=x_orig(i+1); end Y=y' %计算系数 a=au(1) u=au(2) au=(inv(B'*B)*(B'*Y); %- %把gm模型公式转换成符号 coef1=au(2)/au(1); coef2=x_orig(1)-coef1; coef3=0-au(1); costr1=num2str(coef1); costr2=num2str(abs(coef2); costr3=num2str(coef3); eq=strcat(costr1,'+',costr2,'e',costr3,'*(t-1)'); %计算每一个值 for t=1:(n+predict) mcv(t)=coef1+coef2*exp(coef3*(t-1); end x_mcv0=diff(mcv); x_mcve=x_orig(1) x_mcv0%输出图形中的各点
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年湖南工程职业技术学院单招职业适应性测试题库附答案详细解析
- 重庆市彭水县2026届初三2月第一次调研英语试题理试题含解析
- 四川省广元市利州区2026届下学期初三联考试卷英语试题含解析
- 2026年天津市部分区五区县重点中学初三下学期期末质量监测语文试题含解析
- 浙江省湖州市吴兴区十校2026届初三年级第一次质量监测语文试题含解析
- 家庭智能家居布线规划与实施指导书
- 电力系统设备维护保养标准与操作手册
- 企业财务风险管理与预警系统模板
- 产品安全质量标准达标承诺书(7篇)
- SEO搜索优化入门指南
- 冲压工艺与冲模设计
- 生物药物分析所有课件便于打印
- 市场监督管理行政处罚程序规定解读
- 函数的零点与方程的解(说课课件)
- GB/T 29061-2012建筑玻璃用功能膜
- GB/T 10128-2007金属材料室温扭转试验方法
- FZ/T 94005-1991刚性剑杆织机
- 无机材料工艺学-陶瓷2-原料
- 安全阀培训-课件
- 海洋生态学课件一
- DBJ50-T-365-2020 海绵城市建设项目评价标准
评论
0/150
提交评论