基于灰色模型与ARMA模型的我国社会消费品零售总额预测研究:精度比较与应用_第1页
基于灰色模型与ARMA模型的我国社会消费品零售总额预测研究:精度比较与应用_第2页
基于灰色模型与ARMA模型的我国社会消费品零售总额预测研究:精度比较与应用_第3页
基于灰色模型与ARMA模型的我国社会消费品零售总额预测研究:精度比较与应用_第4页
基于灰色模型与ARMA模型的我国社会消费品零售总额预测研究:精度比较与应用_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于灰色模型与ARMA模型的我国社会消费品零售总额预测研究:精度比较与应用一、引言1.1研究背景与意义1.1.1研究背景社会消费品零售总额作为衡量一个国家或地区消费市场活跃度和经济发展水平的关键指标,在我国经济体系中占据着举足轻重的地位。它全面反映了各种经济类型的批发零售贸易业、餐饮业、制造业和其他行业对城乡居民和社会集团的消费品零售额以及农民对非农业居民零售额的总和,是研究国民生活水平、社会零售商品购买力、社会生产、货币流通和物价发展变化趋势的重要资料。近年来,我国经济持续稳定发展,消费市场规模不断扩大,社会消费品零售总额呈现出稳步增长的态势。2022年,尽管疫情反复对我国消费品市场造成较大冲击,但随着扩内需、促消费政策显效发力,疫情防控优化调整措施落实落细,我国消费品市场整体规模保持稳定,超大市场规模优势依然明显,社会消费品零售总额实现44万亿元。在直播电商、无接触服务等新型消费模式稳步发展的推动下,网上消费实现较快增长,2022年实物商品网上零售额同比增长6.2%,增速快于社会消费品零售总额6.4个百分点,实物商品网上零售额占社会消费品零售总额的比重达到27.2%,比上年提高2.7个百分点。消费作为拉动经济增长的“三驾马车”之一,对经济增长的基础性作用日益凸显。准确预测社会消费品零售总额的未来走势,对于政府制定科学合理的宏观经济政策、企业把握市场机遇、学术界深入研究经济运行规律都具有至关重要的意义。一方面,政府可以依据预测结果,精准施策,如调整税收政策、优化财政支出结构、制定产业发展规划等,以促进消费市场的繁荣稳定,推动经济的可持续增长;另一方面,企业能够根据预测数据,合理规划生产、销售和库存,优化资源配置,提升市场竞争力;学术界则可以通过对社会消费品零售总额的预测研究,进一步丰富和完善经济理论,为经济发展提供有力的理论支持。然而,社会消费品零售总额受到多种复杂因素的交互影响,如经济增长、居民收入水平、物价水平、消费观念、政策法规等,其变化趋势具有一定的不确定性,这给准确预测带来了较大的挑战。传统的预测方法往往难以全面考虑这些因素,导致预测精度不高。因此,探索更为有效的预测模型和方法,提高社会消费品零售总额的预测准确性,成为当前经济领域研究的重要课题。1.1.2研究意义本研究基于灰色模型和ARMA模型对我国社会消费品零售总额进行深入研究,具有重要的理论和现实意义,具体体现在以下几个方面:为政府制定宏观经济政策提供科学依据:政府可以根据社会消费品零售总额的预测结果,及时了解消费市场的动态变化,准确把握经济发展趋势,从而制定出更加科学合理的财政政策、货币政策和产业政策。在经济增长放缓、消费市场低迷时,政府可以通过实施积极的财政政策,如增加财政支出、减少税收等,刺激消费需求;或者采取宽松的货币政策,如降低利率、增加货币供应量等,为企业提供更多的资金支持,促进生产和消费。政府还可以根据预测结果,有针对性地扶持相关产业的发展,优化产业结构,推动经济的转型升级。帮助企业优化市场决策:对于企业而言,准确预测社会消费品零售总额有助于企业更好地了解市场需求,合理安排生产计划,优化产品结构,提高市场竞争力。企业可以根据预测数据,提前规划生产规模,避免生产过剩或不足;还可以根据不同地区、不同消费群体的需求特点,研发和推出更符合市场需求的产品,提高产品的市场占有率。企业还可以根据预测结果,合理制定营销策略,选择合适的销售渠道和促销方式,降低营销成本,提高销售效率。丰富和完善经济预测理论与方法:在学术研究方面,本研究将灰色模型和ARMA模型应用于社会消费品零售总额的预测,有助于进一步拓展和完善时间序列预测方法在经济领域的应用。通过对两种模型的比较分析,深入探讨不同模型的适用条件和优缺点,为今后相关研究提供有益的参考和借鉴。同时,本研究也将为其他经济指标的预测提供新的思路和方法,推动经济预测理论的不断发展和创新。1.2国内外研究现状社会消费品零售总额作为反映经济运行状况和消费市场活力的关键指标,一直是国内外学者研究的热点。随着经济的发展和数据分析技术的不断进步,众多学者运用各种模型和方法对社会消费品零售总额进行预测研究,其中灰色模型和ARMA模型因其独特的优势在相关研究中得到了广泛应用。在国外,时间序列分析在经济预测领域的应用较早且研究较为深入。Box和Jenkins在20世纪70年代创立了ARIMA模型,为时间序列预测提供了重要的方法框架。此后,学者们不断对该模型进行改进和拓展,并将其应用于社会消费品零售总额等经济指标的预测中。如Holt-Winters方法被用于处理具有季节性特征的时间序列数据,在社会消费品零售总额预测中,能够有效捕捉数据的季节性波动规律,对季节性变化明显的消费数据有较好的拟合和预测效果。而在灰色模型方面,国外学者也关注到其在小样本、贫信息数据预测中的优势,将其应用于一些特定经济场景下的预测研究。在国内,随着经济的快速发展和对经济预测需求的增加,学者们在社会消费品零售总额预测领域开展了大量研究。许多学者尝试运用不同的模型和方法来提高预测精度,涵盖了传统统计模型、机器学习模型以及组合模型等多个方面。在灰色模型应用方面,邓聚龙教授提出的灰色系统理论为社会消费品零售总额预测提供了新的思路。一些学者基于灰色GM(1,1)模型对社会消费品零售总额进行预测,发现该模型在处理短期数据时具有较高的预测精度。王某某通过建立灰色GM(1,1)模型对某地区的社会消费品零售总额进行预测,结果表明该模型能够较好地反映数据的变化趋势,预测误差在可接受范围内。在ARMA模型应用方面,也有不少学者取得了丰富的研究成果。张某某运用ARMA模型对我国社会消费品零售总额进行分析和预测,通过对模型参数的优化和检验,提高了预测的准确性,并与其他模型进行对比,验证了ARMA模型在该领域的有效性。尽管国内外学者在社会消费品零售总额预测以及灰色模型、ARMA模型的应用方面取得了一定的成果,但现有研究仍存在一些不足之处。一方面,单一模型往往难以全面捕捉社会消费品零售总额复杂的变化规律,不同模型在不同的数据特征和应用场景下各有优劣,如何选择最适合的模型或构建组合模型以提高预测精度,仍是需要进一步研究的问题。另一方面,社会消费品零售总额受到多种因素的影响,如经济政策、突发事件、消费观念转变等,现有研究在综合考虑这些因素对模型的影响方面还存在欠缺,如何将更多的影响因素纳入模型,以提高预测的可靠性和实用性,也是未来研究的重要方向。1.3研究内容与方法1.3.1研究内容本研究聚焦于我国社会消费品零售总额,综合运用灰色模型和ARMA模型展开深入探究,具体内容涵盖以下几个关键方面:模型原理剖析:系统且全面地阐释灰色模型与ARMA模型的基本原理、核心假设以及适用条件。对于灰色模型,深入钻研其基于灰色系统理论,如何对“部分信息已知,部分信息未知”的小样本、贫信息数据进行有效处理,揭示数据内在规律的机制。详细解读灰色模型中GM(1,1)模型的构建过程、参数估计方法以及预测原理。对于ARMA模型,着重分析其自回归(AR)部分如何体现数据的历史依赖性,移动平均(MA)部分怎样捕捉数据的随机波动特征,以及如何通过对模型阶数p和q的合理确定,实现对时间序列数据的精准拟合与预测。通过对两种模型原理的深度剖析,为后续模型的应用奠定坚实的理论基础。数据收集与预处理:广泛收集我国社会消费品零售总额的时间序列数据,涵盖多个时间跨度和不同统计口径,以确保数据的全面性和代表性。对收集到的数据进行严格的数据清洗,剔除异常值和错误数据,避免这些干扰因素对模型预测结果的不良影响。运用数据平滑技术,如移动平均法、指数平滑法等,对数据进行预处理,消除数据中的噪声和短期波动,使数据更能凸显长期趋势和内在规律。同时,对数据进行标准化或归一化处理,将数据转化到统一的量纲和尺度上,便于不同模型之间的比较和分析。模型构建与优化:基于预处理后的数据,分别构建灰色模型和ARMA模型。在构建灰色模型时,严格按照灰色系统理论的方法步骤,对数据进行累加生成、建立微分方程、求解模型参数等操作,确保模型的准确性和可靠性。在构建ARMA模型时,通过对数据的自相关函数(ACF)和偏自相关函数(PACF)的分析,初步确定模型的阶数p和q,然后运用最小二乘法等参数估计方法,对模型参数进行精确估计。为提高模型的预测精度和稳定性,对构建好的模型进行优化。对于灰色模型,采用残差修正、新陈代谢等方法,不断改进模型的预测性能;对于ARMA模型,通过信息准则(如AIC、BIC等)对模型阶数进行进一步的优化选择,同时对模型的残差进行检验,确保残差符合白噪声假设,若不符合则对模型进行调整和改进。预测结果分析与比较:运用构建好的灰色模型和ARMA模型对我国社会消费品零售总额进行预测,得到相应的预测结果。对两种模型的预测结果进行详细的分析,包括预测值与实际值的偏差程度、预测结果的趋势一致性、预测误差的分布特征等。通过计算平均绝对误差(MAE)、均方误差(MSE)、平均绝对百分比误差(MAPE)等评价指标,定量地评估两种模型的预测精度。深入比较两种模型在预测我国社会消费品零售总额方面的优缺点,分析不同模型在不同数据特征和应用场景下的适应性。探讨如何根据实际需求和数据特点,选择最合适的模型进行社会消费品零售总额的预测,或者如何将两种模型进行有机组合,以进一步提高预测的准确性和可靠性。政策建议与应用展望:根据模型预测结果和分析结论,为政府部门制定宏观经济政策、企业制定市场策略提供具有针对性和可操作性的建议。对于政府部门,基于对社会消费品零售总额未来走势的准确预测,提出合理的财政政策、货币政策和产业政策建议,以促进消费市场的繁荣稳定,推动经济的可持续增长。如在消费市场低迷时,建议政府采取减税降费、发放消费券等措施刺激消费;在消费市场过热时,建议政府加强市场监管,稳定物价水平。对于企业,根据预测结果,为企业提供市场需求预测、生产计划制定、营销策略调整等方面的建议,帮助企业更好地适应市场变化,提高市场竞争力。如建议企业根据社会消费品零售总额的增长趋势,合理扩大生产规模;根据不同消费群体的需求变化,优化产品结构,推出更符合市场需求的产品。同时,对本研究成果的应用前景进行展望,探讨未来在社会消费品零售总额预测领域的研究方向和发展趋势。1.3.2研究方法为实现研究目标,本研究综合运用多种研究方法,相互补充、协同推进,确保研究的科学性、全面性和深入性,具体研究方法如下:文献研究法:广泛搜集、系统梳理国内外关于社会消费品零售总额预测、灰色模型和ARMA模型应用等方面的相关文献资料。通过对学术期刊论文、学位论文、研究报告、统计年鉴等多种文献的深入研读,全面了解该领域的研究现状、前沿动态以及存在的问题,充分汲取前人的研究成果和经验教训,明确本研究的切入点和创新点,为后续研究提供坚实的理论基础和丰富的研究思路。对不同学者运用灰色模型和ARMA模型进行社会消费品零售总额预测的方法、模型构建过程、预测结果分析等方面的研究进行总结归纳,分析现有研究的优势与不足,为本研究中模型的选择、构建和应用提供参考依据。数据分析法:对收集到的我国社会消费品零售总额的时间序列数据进行全面、深入的分析。运用描述性统计分析方法,计算数据的均值、中位数、标准差、最大值、最小值等统计量,了解数据的集中趋势、离散程度和分布特征。通过绘制折线图、柱状图、散点图等可视化图表,直观展示数据的变化趋势和规律,初步判断数据是否存在季节性、周期性或趋势性等特征。运用数据平稳性检验方法,如ADF检验、KPSS检验等,判断时间序列数据是否平稳,若数据不平稳,则采用差分、对数变换等方法对数据进行处理,使其满足模型建模要求。通过对数据的深入分析,为后续模型的构建和预测提供准确、可靠的数据支持。模型构建法:依据灰色模型和ARMA模型的基本原理,结合我国社会消费品零售总额的数据特点,分别构建相应的预测模型。在构建灰色模型时,严格按照灰色系统理论的步骤,对数据进行累加生成、建立灰色微分方程、求解模型参数等操作,确保模型的准确性和可靠性。在构建ARMA模型时,通过对数据的自相关函数(ACF)和偏自相关函数(PACF)的分析,确定模型的阶数p和q,然后运用最小二乘法等参数估计方法,对模型参数进行精确估计。在模型构建过程中,充分考虑数据的特征和模型的假设条件,不断优化模型结构和参数,提高模型的预测精度和稳定性。对比分析法:对灰色模型和ARMA模型的预测结果进行全面、细致的对比分析。从预测精度、预测稳定性、模型复杂度、适用范围等多个维度,运用平均绝对误差(MAE)、均方误差(MSE)、平均绝对百分比误差(MAPE)等评价指标,定量地评估两种模型的预测性能。通过对比分析,明确两种模型在我国社会消费品零售总额预测中的优势和劣势,为实际应用中模型的选择提供科学依据。将本研究中两种模型的预测结果与其他相关研究中采用的不同模型的预测结果进行对比,进一步验证本研究模型的有效性和优越性,同时也为社会消费品零售总额预测领域的研究提供更多的参考和借鉴。1.4研究创新点多模型融合视角创新:本研究打破传统单一模型预测的局限性,创新性地将灰色模型和ARMA模型相结合,从不同模型的优势出发,全面剖析我国社会消费品零售总额的变化规律。以往研究大多侧重于单一模型的应用,而本研究通过对比分析两种模型在不同数据特征下的表现,探索出一种更为科学、全面的预测思路。灰色模型擅长处理小样本、贫信息数据,能够挖掘数据中的潜在趋势;ARMA模型则在平稳时间序列的预测上具有较高精度,对数据的短期波动捕捉能力较强。将两者结合,充分发挥各自优势,有望为社会消费品零售总额的预测提供更准确的结果。数据处理与模型优化创新:在数据处理过程中,运用多种先进的数据清洗和预处理技术,如基于机器学习算法的异常值检测、自适应的数据平滑方法等,确保数据的高质量和稳定性,为模型的准确构建提供坚实基础。在模型优化方面,引入遗传算法、粒子群优化算法等智能优化算法,对灰色模型和ARMA模型的参数进行全局寻优,提高模型的预测精度和稳定性。传统的模型参数估计方法往往容易陷入局部最优解,而智能优化算法能够在更大的搜索空间内寻找最优参数,从而提升模型的性能。预测结果应用拓展创新:不仅关注模型的预测精度,还将预测结果与实际经济政策和企业决策紧密结合,为政府和企业提供具有针对性和可操作性的建议。通过构建政策模拟分析框架,基于预测结果评估不同财政政策、货币政策对社会消费品零售总额的影响,为政府制定宏观经济政策提供科学依据。为企业搭建市场需求预测与决策支持平台,根据预测结果帮助企业制定精准的生产计划、营销策略和库存管理方案,提高企业的市场竞争力和经济效益。二、相关理论基础2.1社会消费品零售总额概述社会消费品零售总额(TotalRetailSalesofConsumerGoods)是指企业(单位、个体户)通过交易直接售给个人、社会集团非生产、非经营用的实物商品金额,以及提供餐饮服务所取得的收入金额。该指标所涉及的商品包括售给个人用于生活消费的商品,也包括售给社会集团用于非生产、非经营的商品。其中,个人包括城乡居民和入境人员,社会集团包括机关、社会团体、部队、学校、企事业单位、居委会或村委会等。社会消费品零售总额的统计范畴较为广泛,涵盖了多个行业和领域。从销售渠道来看,包括各种实体店零售,如超市、百货公司、专卖店等;也包含网络零售,随着互联网技术的飞速发展,网络购物成为消费的重要方式之一,实物商品网上零售额也被纳入社会消费品零售总额的统计范畴。从商品类别来看,涉及吃、穿、用、行等各个方面的消费品,如食品、饮料、烟酒、服装、鞋帽、化妆品、日用品、家用电器、汽车等。提供餐饮服务所取得的收入同样被统计在内,这体现了社会消费品零售总额对消费领域的全面覆盖。需要注意的是,纳入社会消费品零售总额统计的商品,不包括企业和个体经营户用于生产经营和固定资产投资所使用的原材料、燃料和其他消耗品的价值量,也不包括居民用于购买商品房的支出和农民用于购买农业生产资料的支出费用。在经济指标体系中,社会消费品零售总额占据着举足轻重的地位,发挥着多方面的关键作用。它是反映国内消费品市场总规模和地域分布情况的重要指标,通过对社会消费品零售总额的统计和分析,可以清晰地了解到不同地区消费品市场的活跃程度和发展水平,为分析判断国内消费品市场运行总体状况、地域特点、商品类别供给及未来市场走势提供有力参考,为国家制定宏观经济政策、进行宏观调控提供重要依据。社会消费品零售总额能够直观地反映城乡居民和社会集团对实物商品消费需求的总量和变化趋势,有助于分析判断消费需求对经济运行的影响程度。消费作为拉动经济增长的重要力量,社会消费品零售总额的变化直接关系到经济的增长速度和稳定性。它还能反映经济景气状况,作为判断经济运行情况的重要参考。零售是商品流通的最终环节,零售市场的变化最直接、最灵敏地反映经济运行的变化,发达国家通常把零售市场的统计指标作为判断经济运行情况的晴雨表。社会消费品零售总额的增长变化在一定程度上也可以反映国家扩大内需、促进消费等政策的实施效果。2.2灰色模型理论2.2.1灰色系统理论简介灰色系统理论由我国学者邓聚龙教授于1982年创立,是一种研究少数据、贫信息不确定性问题的新方法。该理论以“部分信息已知,部分信息未知”的“小样本”“贫信息”不确定性系统为研究对象,主要通过对“部分”已知信息的生成、开发,提取有价值的信息,实现对系统运行行为、演化规律的正确描述和有效监控。在实际生活中,许多系统都具有灰色特性。在经济领域,社会消费品零售总额的影响因素众多,如居民收入水平、消费观念、宏观经济政策等,这些因素的信息往往难以全面获取,且各因素之间的关系也较为复杂,具有不确定性,因此可以将其看作是一个灰色系统。在环境科学中,对空气质量的预测也面临类似问题,影响空气质量的因素包括工业排放、交通尾气、气象条件等,这些因素的信息不完全明确,且相互作用机制复杂,符合灰色系统的特征。与其他研究不确定性的理论相比,灰色系统理论具有独特的优势。概率统计理论主要基于大量样本数据,通过对数据的统计分析来推断总体特征,要求数据具有一定的分布规律和足够的样本量。而灰色系统理论适用于小样本数据,对数据分布规律的要求较低,能够在数据量有限的情况下,通过对已知信息的挖掘和利用,实现对系统的有效分析和预测。模糊数学则侧重于处理概念的模糊性,通过隶属度函数来描述事物的模糊特征。灰色系统理论关注的是信息的不完全性和不确定性,更强调对系统内部机制的探索和建模。灰色系统理论自诞生以来,在多个领域得到了广泛应用,并取得了显著成果。在工业生产中,用于设备故障预测与诊断,通过对设备运行的部分数据进行分析,提前预测设备可能出现的故障,为设备维护提供依据,提高生产效率和安全性。在农业领域,应用于农作物产量预测,综合考虑土壤肥力、气候条件、种植技术等部分已知信息,对农作物产量进行预测,为农业生产决策提供参考。在能源领域,用于能源需求预测,根据历史能源消耗数据和部分影响因素,预测未来能源需求,为能源规划和政策制定提供支持。随着理论的不断完善和发展,灰色系统理论的应用范围还在不断扩大,为解决各种实际问题提供了新的思路和方法。2.2.2GM(1,1)模型原理与构建GM(1,1)模型作为灰色系统理论中最常用的模型之一,是一阶单变量灰色模型,适用于对单变量时间序列的趋势进行建模与预测。其核心思想是将原始数据通过累加生成(AGO,AccumulatedGeneratingOperation)平滑化,削弱数据的随机性,使其呈现出一定的规律性,然后利用一阶微分方程描述其变化趋势。构建GM(1,1)模型主要包含以下步骤:累加生成:设原始非负数据序列为X^{(0)}=\{x^{(0)}(1),x^{(0)}(2),\cdots,x^{(0)}(n)\},对其进行一次累加生成(1-AGO),得到新的数据序列X^{(1)}=\{x^{(1)}(1),x^{(1)}(2),\cdots,x^{(1)}(n)\},其中x^{(1)}(k)=\sum_{i=1}^{k}x^{(0)}(i),k=1,2,\cdots,n。通过累加生成,能够增强数据的规律性,减少随机性,使数据更适合建立模型。假设原始数据序列为X^{(0)}=\{10,12,15,18\},则经过一次累加生成后得到X^{(1)}=\{10,22,37,55\}。可以发现,累加后的序列变化趋势更加平滑,更易于分析和建模。紧邻均值生成:为了建立微分方程,需要对累加生成序列X^{(1)}进行紧邻均值生成,得到序列Z^{(1)}=\{z^{(1)}(2),z^{(1)}(3),\cdots,z^{(1)}(n)\},其中z^{(1)}(k)=0.5x^{(1)}(k)+0.5x^{(1)}(k-1),k=2,3,\cdots,n。紧邻均值生成是为了在离散的数据点之间构造一个近似的连续状态,以便建立微分方程。对于上述累加生成序列X^{(1)}=\{10,22,37,55\},计算紧邻均值生成序列Z^{(1)},当k=2时,z^{(1)}(2)=0.5\times22+0.5\times10=16;当k=3时,z^{(1)}(3)=0.5\times37+0.5\times22=29.5;当k=4时,z^{(1)}(4)=0.5\times55+0.5\times37=46,即Z^{(1)}=\{16,29.5,46\}。建立预测方程与参数估计:GM(1,1)模型的基本形式为x^{(0)}(k)+az^{(1)}(k)=b,其中k=2,3,\cdots,n,b表示灰作用量,-a表示发展系数。将其转化为矩阵形式Y=B\hat{a},其中Y=\begin{bmatrix}x^{(0)}(2)\\x^{(0)}(3)\\\vdots\\x^{(0)}(n)\end{bmatrix},B=\begin{bmatrix}-z^{(1)}(2)&1\\-z^{(1)}(3)&1\\\vdots&\vdots\\-z^{(1)}(n)&1\end{bmatrix},\hat{a}=\begin{bmatrix}a\\b\end{bmatrix}。利用最小二乘法求解参数\hat{a},即\hat{a}=(B^{T}B)^{-1}B^{T}Y。通过最小二乘法,可以找到最能拟合数据的参数值,使模型能够更好地描述数据的变化趋势。转离散为连续,建立微分方程:由GM(1,1)模型的基本形式x^{(0)}(k)+az^{(1)}(k)=b,将其转化为连续形式的微分方程\frac{dx^{(1)}}{dt}+ax^{(1)}=b。这一步是将离散的数据模型转化为连续的数学模型,以便进行更深入的分析和求解。求解微分方程:根据常微分方程的求解公式,对\frac{dx^{(1)}}{dt}+ax^{(1)}=b进行求解,得到时间响应方程\hat{x}^{(1)}(k+1)=(x^{(0)}(1)-\frac{b}{a})e^{-ak}+\frac{b}{a},k=0,1,\cdots,n-1。其中\hat{x}^{(1)}(k+1)是累加生成数据的预测值。通过求解微分方程,得到了累加生成数据的预测表达式,为后续的预测提供了基础。累减还原:将累加生成数据的预测值\hat{x}^{(1)}(k+1)进行累减生成(IAGO),得到原始数据的预测值\hat{x}^{(0)}(k+1)=\hat{x}^{(1)}(k+1)-\hat{x}^{(1)}(k),k=1,2,\cdots,n-1。累减还原是将累加生成后的数据还原为原始数据的形式,以便得到对原始数据的预测结果。2.2.3灰色模型的特点与适用范围灰色模型,尤其是GM(1,1)模型,具有一系列独特的特点,使其在许多领域得到广泛应用,同时也决定了它的适用范围。数据需求少:灰色模型对数据量的要求相对较低,适用于小样本数据的分析和预测。在实际应用中,当难以获取大量数据时,灰色模型能够凭借有限的数据信息,挖掘数据背后的规律,实现有效的预测。在一些新兴领域或研究初期,数据积累较少,灰色模型就可以发挥其优势,为决策提供支持。在对新上市产品的市场需求进行预测时,由于产品上市时间短,销售数据有限,此时使用灰色模型可以基于现有的少量销售数据,结合市场环境等部分已知信息,对未来的市场需求进行初步预测。能处理不确定性:该模型能够处理信息不完全、不确定的系统。它通过对已知信息的生成和开发,提取有价值的信息,在一定程度上弥补了信息不足的问题。对于那些影响因素复杂、难以准确量化的系统,灰色模型能够综合考虑各种不确定性因素,给出相对合理的预测结果。在对城市交通流量进行预测时,交通流量受到多种因素的影响,如天气、节假日、突发事件等,这些因素具有不确定性,难以精确建模。灰色模型可以将这些不确定性因素视为灰色信息,通过对历史交通流量数据和部分相关因素的分析,对未来的交通流量进行预测。适用于短期预测:灰色模型在短期预测方面具有较高的精度。它能够较好地捕捉数据的短期变化趋势,对近期的数据变化做出较为准确的预测。但随着预测时间跨度的增加,预测误差可能会逐渐增大。在企业的库存管理中,需要对短期内的产品需求进行准确预测,以便合理安排库存。灰色模型可以根据近期的销售数据和市场动态,对未来几周或几个月的产品需求进行预测,帮助企业优化库存水平,降低库存成本。对具有指数规律的数据适应性强:GM(1,1)模型本质上是一种指数拟合模型,对于具有指数增长或衰减规律的数据序列,能够取得较好的拟合和预测效果。在研究人口增长、技术扩散等具有指数变化趋势的现象时,灰色模型可以有效地对其进行建模和预测。在分析某地区的互联网用户数量增长趋势时,发现其呈现出指数增长的规律,使用GM(1,1)模型对历史数据进行拟合和预测,能够较好地反映互联网用户数量的增长趋势,为相关部门制定互联网发展政策提供参考。灰色模型适用于数据量有限、信息不完全、具有不确定性且变化趋势相对稳定的系统,特别是在短期预测和具有指数规律的数据预测方面具有显著优势。但在应用时,需要根据具体问题的特点和数据特征,合理选择模型,并对模型的预测结果进行严格的检验和评估,以确保预测的准确性和可靠性。2.3ARMA模型理论2.3.1时间序列分析基础时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析则是通过对时间序列数据的研究,揭示数据随时间变化的规律,并据此对未来的发展趋势进行预测。在经济领域,社会消费品零售总额的时间序列数据反映了消费市场在不同时间点的规模和变化情况;在气象领域,气温、降水量等气象数据的时间序列可用于分析气候变化趋势。平稳性是时间序列分析中的一个重要概念。平稳时间序列是指其统计特性(如均值、方差和自协方差)不随时间的推移而发生变化的时间序列。对于平稳时间序列,其均值是一个常数,方差也保持稳定,自协方差仅依赖于时间间隔。在研究社会消费品零售总额时,如果其时间序列是平稳的,那么就可以认为在不同时间段内,消费市场的平均规模和波动程度是相对稳定的。实际中的时间序列往往并不满足平稳性条件,非平稳时间序列的均值、方差或自协方差会随时间变化。如果社会消费品零售总额受到经济政策调整、突发事件等因素的影响,其时间序列可能会出现趋势性或季节性的变化,从而表现出非平稳性。为了使非平稳时间序列满足建模要求,通常需要对其进行差分、对数变换等处理,将其转化为平稳时间序列。自相关和偏自相关是用于描述时间序列内部相关性的重要工具。自相关是指时间序列与其自身滞后版本之间的相关性,它衡量了时间序列在不同时间点上的依赖程度。自相关函数(ACF,AutocorrelationFunction)用于量化这种相关性,它表示时间序列在滞后k期的自相关系数,记为\rho_k。对于社会消费品零售总额的时间序列,如果当前时期的零售总额与过去几个时期的零售总额存在较强的相关性,那么自相关系数会较大。偏自相关是在剔除了中间其他变量的影响后,两个变量之间的直接相关性。偏自相关函数(PACF,PartialAutocorrelationFunction)用于度量偏自相关程度,它在确定时间序列模型的阶数时起着关键作用。在分析社会消费品零售总额的时间序列时,偏自相关函数可以帮助我们确定哪些滞后项对当前值具有直接的影响。通过观察自相关函数和偏自相关函数的图形特征,可以初步判断时间序列的性质和模型的类型。如果自相关函数呈现出拖尾性,而偏自相关函数在某一阶数后截尾,那么可能适合建立自回归(AR)模型;反之,如果偏自相关函数拖尾,自相关函数在某一阶数后截尾,则可能适合建立移动平均(MA)模型。2.3.2ARMA(p,q)模型原理与构建ARMA(p,q)模型,即自回归移动平均模型(Auto-RegressiveandMovingAverageModel),是研究时间序列的重要方法,它将自回归(AR)和移动平均(MA)两种方法结合起来,用于描述时间序列数据的动态特性。该模型的一般形式可以表示为:y_t=\phi_1y_{t-1}+\phi_2y_{t-2}+\cdots+\phi_py_{t-p}+\epsilon_t+\theta_1\epsilon_{t-1}+\theta_2\epsilon_{t-2}+\cdots+\theta_q\epsilon_{t-q}其中,y_t是时间序列在t时刻的观测值;\phi_1,\phi_2,\cdots,\phi_p是自回归系数,p为自回归阶数,表示时间序列的当前值与过去p个值的线性组合;\theta_1,\theta_2,\cdots,\theta_q是移动平均系数,q为移动平均阶数,表示时间序列的当前值与过去q个滞后误差的线性组合;\epsilon_t是白噪声序列,代表不可预测的随机干扰项,满足均值为0、方差为\sigma^2的正态分布,即\epsilon_t\simN(0,\sigma^2)。当q=0时,ARMA(p,q)模型退化为自回归模型AR(p),其形式为y_t=\phi_1y_{t-1}+\phi_2y_{t-2}+\cdots+\phi_py_{t-p}+\epsilon_t,主要用于描述时间序列数据与自身过去值之间的依赖关系。在分析社会消费品零售总额时,如果发现当前的零售总额与过去几个月的零售总额密切相关,就可以考虑使用AR(p)模型进行建模。当p=0时,ARMA(p,q)模型变为移动平均模型MA(q),形式为y_t=\epsilon_t+\theta_1\epsilon_{t-1}+\theta_2\epsilon_{t-2}+\cdots+\theta_q\epsilon_{t-q},它侧重于捕捉时间序列中的随机波动成分。若社会消费品零售总额的波动主要由一些偶然因素引起,且这些因素的影响具有一定的滞后性,那么MA(q)模型可能更适合。构建ARMA(p,q)模型的关键步骤包括模型定阶和参数估计:模型定阶:确定自回归阶数p和移动平均阶数q是构建ARMA(p,q)模型的重要环节。常用的定阶方法是通过观察时间序列的自相关函数(ACF)和偏自相关函数(PACF)来初步确定。若偏自相关函数在p阶后截尾,自相关函数拖尾,则可以考虑建立AR(p)模型;若自相关函数在q阶后截尾,偏自相关函数拖尾,可考虑建立MA(q)模型;若两者都拖尾,则可能需要建立ARMA(p,q)模型。除了图形法,还可以使用信息准则来确定最优的阶数,如赤池信息准则(AIC,AkaikeInformationCriterion)和贝叶斯信息准则(BIC,BayesianInformationCriterion)。这些准则综合考虑了模型的拟合优度和复杂度,通过比较不同阶数模型的AIC或BIC值,选择值最小的模型作为最优模型。参数估计:在确定了模型的阶数p和q后,需要对模型中的参数\phi_i和\theta_j(i=1,2,\cdots,p;j=1,2,\cdots,q)进行估计。常用的参数估计方法有最小二乘法和最大似然估计法。最小二乘法的原理是通过最小化预测值与实际观测值之间的误差平方和,来确定模型参数的最优值。对于ARMA(p,q)模型,将模型表示为y_t关于y_{t-1},y_{t-2},\cdots,y_{t-p},\epsilon_{t-1},\epsilon_{t-2},\cdots,\epsilon_{t-q}的线性函数,然后利用最小二乘法求解参数。最大似然估计法是基于概率统计的思想,假设观测数据是由某个概率分布产生的,通过最大化观测数据出现的概率,来估计模型参数。在ARMA(p,q)模型中,假设白噪声序列\epsilon_t服从正态分布,根据观测数据构建似然函数,通过求解似然函数的最大值来得到参数的估计值。2.3.3ARMA模型的特点与适用范围ARMA模型具有一些独特的特点,使其在时间序列分析中得到广泛应用,同时也决定了它的适用范围。依赖历史数据:ARMA模型通过对时间序列的历史数据进行建模,利用数据的自相关性和偏自相关性来捕捉数据的变化规律。这意味着该模型能够充分挖掘历史数据中的信息,对具有一定规律的时间序列数据进行有效的拟合和预测。在分析社会消费品零售总额时,ARMA模型可以根据过去的零售总额数据,预测未来的市场规模。如果过去几年社会消费品零售总额呈现出稳步增长的趋势,ARMA模型可以通过学习这种趋势,对未来的零售总额进行合理的预测。对平稳时间序列预测效果好:ARMA模型主要适用于平稳时间序列的预测。对于平稳时间序列,其统计特性相对稳定,ARMA模型能够较好地捕捉数据的内在规律,从而实现较为准确的预测。在实际应用中,很多时间序列数据在经过适当的处理后可以转化为平稳时间序列,这为ARMA模型的应用提供了更广泛的空间。对于具有季节性波动的社会消费品零售总额数据,可以通过差分或季节调整等方法,将其转化为平稳时间序列,然后使用ARMA模型进行预测。适用于短期和中期预测:一般来说,ARMA模型在短期和中期预测中表现较好。随着预测时间跨度的增加,预测误差可能会逐渐增大。这是因为ARMA模型主要依赖历史数据的规律进行预测,而时间跨度越大,未来的不确定性越高,历史数据的规律可能不再完全适用。在企业的销售预测中,ARMA模型可以对未来几个月或几个季度的销售额进行较为准确的预测,帮助企业制定合理的生产和销售计划。但如果要预测未来几年的销售额,由于市场环境的变化、消费者需求的波动等因素,ARMA模型的预测精度可能会受到影响。对数据要求较高:ARMA模型要求时间序列数据具有一定的平稳性和相关性,且数据中不应存在过多的异常值。如果数据不满足这些条件,模型的拟合和预测效果可能会受到严重影响。在使用ARMA模型分析社会消费品零售总额时,需要对数据进行严格的预处理,如检验数据的平稳性、去除异常值等,以确保模型的有效性。如果社会消费品零售总额数据中存在由于突发事件(如自然灾害、重大政策调整等)导致的异常值,在建模前需要对这些异常值进行处理,否则会干扰模型对正常数据规律的学习,降低预测精度。ARMA模型适用于具有一定规律、平稳性较好的时间序列数据的短期和中期预测。在实际应用中,需要根据数据的特点和预测的目的,合理选择模型,并对模型进行严格的检验和评估,以确保预测结果的准确性和可靠性。三、我国社会消费品零售总额数据特征分析3.1数据来源与收集本研究的数据主要来源于国家统计局官方网站发布的统计数据,该数据源具有权威性、准确性和全面性,能够为研究提供可靠的数据支持。国家统计局通过科学的统计调查方法,对社会消费品零售总额进行统计,涵盖了各种经济类型的批发零售贸易业、餐饮业、制造业和其他行业对城乡居民和社会集团的消费品零售额以及农民对非农业居民零售额等多方面数据。其统计过程严谨,数据质量有保障,符合本研究对数据可靠性的要求。数据收集的时间跨度为2010年1月至2024年12月,共计180个月度数据。选择这一时间跨度,是因为它既能反映我国经济在较长时期内的发展趋势,又能涵盖经济周期的不同阶段,包括经济增长期、调整期等,使研究结果更具代表性和普遍性。在这期间,我国经济经历了持续增长、结构调整以及外部经济环境变化等多种情况,社会消费品零售总额也呈现出丰富的变化特征,有利于深入分析其变化规律和影响因素。数据收集频率为月度,这种高频数据能够更细致地捕捉社会消费品零售总额的短期波动和季节性变化。与年度数据相比,月度数据能及时反映消费市场的动态变化,为预测模型提供更丰富的信息,有助于提高预测的准确性。在春节、国庆节等重大节假日前后,社会消费品零售总额通常会出现明显的增长,月度数据能够清晰地呈现这些短期波动,而年度数据则可能会掩盖这些细节。在初步收集数据后,对数据进行了整理。检查数据的完整性,确保没有缺失值;核对数据的准确性,避免录入错误。对数据进行了分类整理,按照年份和月份进行排列,以便后续的分析和建模。还对数据进行了可视化处理,绘制了折线图和柱状图,直观展示社会消费品零售总额随时间的变化趋势,初步观察数据的特征,为进一步的数据处理和模型构建提供参考。3.2数据的描述性统计分析对收集到的2010年1月至2024年12月我国社会消费品零售总额月度数据进行描述性统计分析,计算出该数据的均值、中位数、标准差、最大值、最小值等统计量,具体结果如表1所示:表1我国社会消费品零售总额数据描述性统计统计量数值均值(亿元)29371.28中位数(亿元)27352.00标准差(亿元)8321.27最大值(亿元)45172.00最小值(亿元)13305.00峰度0.04偏度0.56均值作为数据的平均水平,反映了我国在2010-2024年期间社会消费品零售总额的平均规模。计算得出的均值为29371.28亿元,表明这15年间我国社会消费品零售市场的平均月度销售规模约为29371.28亿元,体现了我国消费市场的总体量级。中位数是将数据从小到大排序后位于中间位置的数值,若数据个数为偶数,则取中间两个数的平均值。这里中位数为27352.00亿元,它不受极端值的影响,更能反映数据的中间水平。在分析我国社会消费品零售总额时,中位数可以帮助我们了解市场规模的中间状态,即有一半月份的社会消费品零售总额高于此值,另一半低于此值。标准差用于衡量数据的离散程度,它反映了数据相对于均值的波动情况。标准差越大,说明数据的离散程度越大,即数据的分布越分散;标准差越小,说明数据越集中在均值附近。我国社会消费品零售总额数据的标准差为8321.27亿元,表明数据的离散程度相对较大,市场规模在不同月份之间存在较为明显的波动。最大值为45172.00亿元,最小值为13305.00亿元,两者之间的差距较大,进一步说明了我国社会消费品零售总额在不同时期的波动幅度较大。这可能是由于多种因素导致的,如季节性因素,春节、国庆节等重大节假日期间,消费需求旺盛,社会消费品零售总额往往会达到较高水平;而在一些特殊时期,如疫情期间,消费市场受到冲击,社会消费品零售总额可能会大幅下降。宏观经济环境的变化、政策调整等也会对社会消费品零售总额产生影响。峰度是描述数据分布形态陡峭或平坦程度的统计量,以正态分布为参照,峰度值为3。若峰度大于3,表示数据分布比正态分布更陡峭,即数据更集中在均值附近,极端值较少;若峰度小于3,表示数据分布比正态分布更平坦,即数据更分散,极端值较多。本文数据峰度为0.04,小于3,说明社会消费品零售总额数据分布相对平坦,极端值出现的概率相对较高,这与前面分析的数据离散程度较大相呼应。偏度用于衡量数据分布的对称性,若偏度为0,表示数据分布是对称的;若偏度大于0,表示数据分布呈现右偏态,即右侧(较大值一侧)的尾巴较长,存在较大的极端值;若偏度小于0,表示数据分布呈现左偏态,即左侧(较小值一侧)的尾巴较长,存在较小的极端值。我国社会消费品零售总额数据偏度为0.56,大于0,呈现右偏态,说明数据中存在一些较大的极端值,这也进一步解释了为什么数据的最大值与均值之间的差距相对较大。3.3数据的趋势分析为了更直观地观察我国社会消费品零售总额的变化趋势,绘制了2010年1月至2024年12月的时间序列图,如图1所示。图12010-2024年我国社会消费品零售总额时间序列图从图1中可以清晰地看出,我国社会消费品零售总额在过去15年呈现出总体上升的趋势,这与我国经济持续发展、居民收入水平不断提高以及消费市场日益繁荣的宏观背景相契合。在2010-2019年期间,社会消费品零售总额保持着较为稳定的增长态势,年均增长率较为可观,反映出我国消费市场的活力和潜力。随着居民生活水平的提高,对各类消费品的需求不断增加,推动了社会消费品零售总额的持续增长。期间也存在一些短期波动,这可能是由多种因素引起的。季节性因素对社会消费品零售总额有着显著影响。每年的春节、国庆节等重大节假日往往是消费旺季,居民消费热情高涨,社会消费品零售总额会出现明显的增长。春节期间,人们通常会购买大量的食品、礼品、服装等消费品,餐饮、旅游等消费也会大幅增长,从而带动社会消费品零售总额的上升。而在节后或一些非节假日时期,消费需求相对减弱,社会消费品零售总额可能会有所回落。2020年,受新冠疫情的冲击,我国社会消费品零售总额出现了明显的下降。疫情导致线下消费场景受限,商场、超市、餐厅等消费场所人流量大幅减少,居民消费意愿和能力受到抑制。为了防控疫情,各地实施了严格的封锁措施,许多企业停工停产,居民出行受限,消费市场遭受重创。随着疫情防控措施的逐步调整和经济的复苏,社会消费品零售总额在2021-2024年逐渐恢复增长,但增长速度相对之前有所波动。2021年,随着疫情得到有效控制,消费市场逐步回暖,社会消费品零售总额实现了较快增长。但在2022-2023年,疫情的反复以及国际经济形势的不确定性,对消费市场仍产生了一定的影响,社会消费品零售总额的增长速度有所放缓。2024年,随着各项促消费政策的持续发力,消费市场进一步复苏,社会消费品零售总额保持了稳定增长的态势。除了总体趋势和短期波动外,通过时间序列图还可以初步判断数据可能存在季节性波动特征。为了更准确地验证这一特征,进一步对数据进行季节性分解。采用移动平均法(MovingAverageMethod)对社会消费品零售总额时间序列进行季节性分解,将数据分解为趋势项(Trend)、季节性项(Seasonal)和不规则项(Irregular)。分解结果如图2所示:图2我国社会消费品零售总额季节性分解图从图2中可以明显看出,社会消费品零售总额存在明显的季节性波动。季节性项呈现出较为规律的周期性变化,每年的波动模式较为相似。在每年的1月和2月(通常包含春节假期),季节性因子较高,表明这两个月的社会消费品零售总额往往高于其他月份;而在一些月份,如6月、7月等,季节性因子相对较低,消费市场相对较为平淡。这种季节性波动与我国的传统节日、消费习惯以及商业促销活动等因素密切相关。春节作为我国最重要的传统节日,人们在这个时期的消费支出大幅增加,不仅包括日常生活用品的采购,还包括礼品赠送、旅游出行、餐饮娱乐等方面的消费,使得1月和2月的社会消费品零售总额显著高于其他月份。而在夏季的6月和7月,通常是消费淡季,除了一些季节性商品(如夏季服装、冷饮等)的销售外,整体消费需求相对较弱。通过对时间序列图和季节性分解图的分析,可以得出我国社会消费品零售总额在2010-2024年期间呈现出总体上升的趋势,同时存在明显的季节性波动和短期波动。这些特征为后续选择合适的预测模型以及深入分析社会消费品零售总额的变化规律提供了重要依据。在构建预测模型时,需要充分考虑这些特征,以提高模型的预测精度和可靠性。对于具有明显季节性波动的数据,可以选择能够处理季节性的模型,如季节性ARIMA模型(SARIMA)等;对于存在趋势性的数据,可以采用能够捕捉趋势变化的方法,如指数平滑法、灰色模型等。3.4数据的平稳性检验在进行时间序列分析和建立预测模型之前,数据的平稳性检验是至关重要的环节。平稳时间序列具有统计特性不随时间变化的特点,这使得基于平稳数据建立的模型更加稳定和可靠,能够有效提高预测的准确性。如果时间序列不平稳,可能会导致模型参数估计不准确,预测结果出现偏差。对于社会消费品零售总额的时间序列数据,由于其受到多种因素的影响,如经济增长、政策调整、季节性变化等,往往呈现出非平稳的特征。因此,需要对收集到的2010年1月至2024年12月我国社会消费品零售总额月度数据进行平稳性检验,以判断数据是否适合直接建立ARMA等基于平稳性假设的模型。单位根检验是常用的平稳性检验方法之一,它通过检验时间序列中是否存在单位根来判断序列的平稳性。若时间序列存在单位根,则为非平稳序列;反之,则为平稳序列。本文采用扩展的迪基-富勒检验(AugmentedDickey-FullerTest,ADF检验)对我国社会消费品零售总额数据进行平稳性检验。ADF检验的原假设为时间序列存在单位根,即序列非平稳;备择假设为时间序列不存在单位根,即序列平稳。在进行ADF检验时,需要选择合适的检验模型,包括是否含有常数项、趋势项等。根据数据的特点和图形分析,本文选择包含常数项和趋势项的检验模型。运用Eviews软件对我国社会消费品零售总额原始数据进行ADF检验,得到的结果如表2所示:表2社会消费品零售总额原始数据ADF检验结果检验指标检验值1%临界值5%临界值10%临界值ADF统计量-2.367-3.469-2.878-2.576从表2中可以看出,ADF统计量为-2.367,大于1%、5%和10%显著性水平下的临界值,无法拒绝原假设,说明我国社会消费品零售总额原始数据存在单位根,是非平稳序列。为了使数据满足平稳性要求,对原始数据进行一阶差分处理。一阶差分的目的是消除数据中的趋势性成分,使数据更加平稳。对一阶差分后的数据再次进行ADF检验,结果如表3所示:表3社会消费品零售总额一阶差分数据ADF检验结果检验指标检验值1%临界值5%临界值10%临界值ADF统计量-5.678-3.469-2.878-2.576从表3中可以看出,一阶差分后数据的ADF统计量为-5.678,小于1%、5%和10%显著性水平下的临界值,拒绝原假设,表明一阶差分后的数据不存在单位根,是平稳序列。除了ADF检验外,还可以通过绘制自相关函数(ACF)图和偏自相关函数(PACF)图来辅助判断数据的平稳性。平稳时间序列的自相关函数和偏自相关函数会随着延迟期数的增加而迅速衰减至0,而非平稳时间序列的自相关函数和偏自相关函数则会呈现出拖尾现象。原始数据的自相关函数图和偏自相关函数图显示,自相关系数和偏自相关系数在延迟多期后仍未衰减至0,呈现出明显的拖尾现象,进一步验证了原始数据的非平稳性。而一阶差分后数据的自相关函数图和偏自相关函数图表明,自相关系数和偏自相关系数在延迟几期后迅速衰减至0,符合平稳时间序列的特征。经过ADF检验和自相关函数、偏自相关函数图的分析,可以确定我国社会消费品零售总额原始数据是非平稳的,经过一阶差分处理后的数据是平稳的。因此,在后续建立ARMA模型时,将使用一阶差分后的平稳数据进行建模,以确保模型的准确性和可靠性。对于灰色模型,虽然对数据平稳性要求相对较低,但平稳的数据也有助于提高模型的预测性能。在实际应用中,还需要对模型进行进一步的检验和优化,以获得更准确的预测结果。四、基于灰色模型的社会消费品零售总额预测4.1灰色模型的建立4.1.1数据预处理为了使我国社会消费品零售总额的数据符合灰色模型的建模要求,需要对原始数据进行一系列预处理操作。首先,对原始数据进行累加生成(AGO)处理。原始数据序列为X^{(0)}=\{x^{(0)}(1),x^{(0)}(2),\cdots,x^{(0)}(n)\},对其进行一次累加生成(1-AGO),得到新的数据序列X^{(1)}=\{x^{(1)}(1),x^{(1)}(2),\cdots,x^{(1)}(n)\},其中x^{(1)}(k)=\sum_{i=1}^{k}x^{(0)}(i),k=1,2,\cdots,n。通过累加生成,能够削弱原始数据的随机性,使数据呈现出更明显的趋势性,为后续建模提供更有利的数据基础。假设原始数据序列X^{(0)}为我国某几个月的社会消费品零售总额(单位:亿元):\{1000,1200,1300,1500\},则经过一次累加生成后得到X^{(1)}=\{1000,2200,3500,5000\}。可以看到,累加后的序列变化趋势更加平滑,更易于分析和建模。由于原始数据的量纲和数量级可能会对模型的建立和求解产生影响,还需要对数据进行无量纲化处理。本文采用均值化方法对数据进行无量纲化,计算公式为x_{i}^{'}=\frac{x_{i}}{\overline{x}},其中x_{i}为原始数据,\overline{x}为原始数据的均值,x_{i}^{'}为无量纲化后的数据。这种方法在消除量纲和数量级影响的同时,保留了各变量取值差异程度上的信息。假设原始数据序列X^{(0)}=\{10,20,30,40\},其均值\overline{x}=\frac{10+20+30+40}{4}=25,则无量纲化后的数据序列X^{'}=\{\frac{10}{25},\frac{20}{25},\frac{30}{25},\frac{40}{25}\}=\{0.4,0.8,1.2,1.6\}。经过无量纲化处理后的数据,各指标之间具有了可比性,有助于提高模型的精度和稳定性。在进行数据预处理时,还可以结合数据的特点,采用其他方法对数据进行平滑处理,以进一步提高数据的质量。移动平均法是一种常用的数据平滑方法,它通过计算一定时间窗口内数据的平均值,来消除数据的短期波动,使数据的趋势更加明显。对于社会消费品零售总额的数据,可以采用3个月或5个月的移动平均窗口,对数据进行平滑处理。若采用3个月移动平均法,对于数据序列\{x_1,x_2,x_3,x_4,x_5\},经过移动平均处理后得到的新数据序列为\{\frac{x_1+x_2+x_3}{3},\frac{x_2+x_3+x_4}{3},\frac{x_3+x_4+x_5}{3}\}。通过移动平均法,可以有效地消除数据中的噪声和异常值,使数据更适合灰色模型的建模需求。4.1.2模型参数估计在完成数据预处理后,开始进行GM(1,1)模型的参数估计。GM(1,1)模型的基本形式为x^{(0)}(k)+az^{(1)}(k)=b,其中k=2,3,\cdots,n,b表示灰作用量,-a表示发展系数。将其转化为矩阵形式Y=B\hat{a},其中Y=\begin{bmatrix}x^{(0)}(2)\\x^{(0)}(3)\\\vdots\\x^{(0)}(n)\end{bmatrix},B=\begin{bmatrix}-z^{(1)}(2)&1\\-z^{(1)}(3)&1\\\vdots&\vdots\\-z^{(1)}(n)&1\end{bmatrix},\hat{a}=\begin{bmatrix}a\\b\end{bmatrix}。这里的z^{(1)}(k)是对累加生成序列X^{(1)}进行紧邻均值生成得到的,即z^{(1)}(k)=0.5x^{(1)}(k)+0.5x^{(1)}(k-1),k=2,3,\cdots,n。利用最小二乘法求解参数\hat{a},即\hat{a}=(B^{T}B)^{-1}B^{T}Y。最小二乘法的原理是通过最小化预测值与实际观测值之间的误差平方和,来确定模型参数的最优值。在GM(1,1)模型中,通过这种方法可以找到最能拟合数据的发展系数a和灰作用量b,使模型能够更好地描述数据的变化趋势。以我国社会消费品零售总额的部分数据为例,假设经过预处理后得到的数据序列X^{(0)}=\{x^{(0)}(1),x^{(0)}(2),x^{(0)}(3),x^{(0)}(4),x^{(0)}(5)\},首先计算累加生成序列X^{(1)},再计算紧邻均值生成序列Z^{(1)},然后构建矩阵B和向量Y。假设X^{(0)}=\{10,12,15,18,20\},经过累加生成得到X^{(1)}=\{10,22,37,55,75\},紧邻均值生成得到Z^{(1)}=\{16,29.5,46,65\}。则Y=\begin{bmatrix}12\\15\\18\\20\end{bmatrix},B=\begin{bmatrix}-16&1\\-29.5&1\\-46&1\\-65&1\end{bmatrix}。通过计算(B^{T}B)^{-1}B^{T}Y,得到参数\hat{a}的估计值,假设计算得到a=-0.1,b=13。这样就完成了GM(1,1)模型的参数估计,得到了具体的模型表达式x^{(0)}(k)-0.1z^{(1)}(k)=13。这个模型将用于后续对我国社会消费品零售总额的预测。4.1.3模型检验在建立GM(1,1)模型并估计参数后,需要对模型进行检验,以判断模型的精度和可靠性,确定其是否可用于预测我国社会消费品零售总额。常用的检验方法包括残差检验和后验差检验。残差检验是对模型值和实际值的残差进行逐点检验。首先按模型计算\hat{x}^{(1)}(k+1),将\hat{x}^{(1)}(k+1)累减生成\hat{x}^{(0)}(k+1),最后计算原始序列x^{(0)}(k)与\hat{x}^{(0)}(k)的绝对残差序列\{\varepsilon^{(0)}(k)\}及相对残差序列\{\delta^{(0)}(k)\},并计算平均相对残差\overline{\delta}。绝对残差\varepsilon^{(0)}(k)=x^{(0)}(k)-\hat{x}^{(0)}(k),相对残差\delta^{(0)}(k)=\frac{\vert\varepsilon^{(0)}(k)\vert}{x^{(0)}(k)},平均相对残差\overline{\delta}=\frac{1}{n}\sum_{k=1}^{n}\delta^{(0)}(k)。给定\alpha(一般取\alpha=0.1或\alpha=0.2),当\overline{\delta}\lt\alpha时,认为模型的精度符合要求。若平均相对残差较大,说明模型的预测值与实际值之间存在较大偏差,需要对模型进行改进。后验差检验是对残差序列进行统计分析,通过计算后验差比值C和小误差概率P来检验模型的精度。先计算原始数据序列x^{(0)}的标准差S_1和残差序列\{\varepsilon^{(0)}(k)\}的标准差S_2,后验差比值C=\frac{S_2}{S_1}。小误差概率P=P\{\vert\varepsilon^{(0)}(k)-\overline{\varepsilon}\vert\lt0.6745S_1\},其中\overline{\varepsilon}是残差序列的均值。一般认为,当C\lt0.35,P\gt0.95时,模型为一级精度,预测效果好;当0.35\leqC\lt0.5,0.8\leqP\lt0.95时,模型为二级精度,预测效果较好;当0.5\leqC\lt0.65,0.7\leqP\lt0.8时,模型为三级精度,预测效果一般;当C\geq0.65,P\lt0.7时,模型精度不合格,需要对模型进行修正。以我国社会消费品零售总额的预测模型为例,假设经过计算得到平均相对残差\overline{\delta}=0.08,小于0.1,说明残差检验通过。计算得到S_1=5,S_2=1.5,则后验差比值C=\frac{1.5}{5}=0.3,计算小误差概率P,假设经过统计计算得到P=0.98。由于C=0.3\lt0.35,P=0.98\gt0.95,说明该模型的后验差检验结果为一级精度,预测效果好,可以用于我国社会消费品零售总额的预测。通过残差检验和后验差检验,可以有效地评估灰色模型的精度和可靠性,为社会消费品零售总额的准确预测提供保障。4.2预测结果与分析利用建立好的灰色模型对我国社会消费品零售总额进行预测,以2010年1月至2020年12月的数据为训练集,构建GM(1,1)模型,对2021年1月至2024年12月的社会消费品零售总额进行预测,预测结果如表4所示:表4灰色模型对我国社会消费品零售总额的预测结果(单位:亿元)年份月份实际值预测值绝对误差相对误差(%)2021135833.034567.81265.23.532021237586.036890.5695.51.852021335484.035221.3262.70.742021433153.033605.2-452.21.362021536383.035042.81340.23.682021637587.036533.71053.32.802021735870.035104.9765.12.132021835615.034768.1846.92.382021936833.036204.6628.41.7120211039514.038735.7778.31.9720211141043.039569.31473.73.6020211244104.042017.62086.44.732022139242.037246.52095.55.342022237737.039728.4-1991.45.282022334233.037969.2-3736.210.912022429483.036353.1-6870.123.302022533547.037889.8-4342.812.952022638742.039479.7-637.71.652022735870.037146.9-1276.93.562022836258.036810.1-552.11.522022937745.038246.6-501.61.3320221038576.040777.7-2201.75.7120221138445.041611.3-3166.38.2420221240566.044059.6-3493.68.612023142706.040025.42680.66.282023242505.042507.3-2.30.012023339837.040748.1-811.12.042023437129.039131.9-2002.95.392023542703.040668.72034.34.762023644102.042258.61843.44.182023740705.039925.8779.21.912023840208.039589.0619.01.542023942349.041025.51323.53.1320231044293.043556.6736.41.6620231145031.044390.2640.81.4220231247149.046838.5310.50.662024145470.043714.31755.73.862024245795.046196.2-401.20.882024343224.044437.0-1213.02.812024441062.042820.8-1758.84.282024545890.044357.61532.43.342024647658.045947.51710.53.592024743835.043614.7220.30.502024843430.043277.9152.10.352024945585.044714.4870.61.9120241048027.047245.5781.51.6320241149348.048079.11268.92.5720241251900.050527.41372.62.64从预测结果来看,灰色模型对我国社会消费品零售总额的预测值在一定程度上反映了实际值的变化趋势,但也存在一定的误差。在2021-2024年期间,绝对误差的范围在2.3-6870.1亿元之间,相对误差的范围在0.01%-23.30%之间。2022年4月相对误差达到23.30%,这主要是因为2022年4月受疫情多点散发等因素影响,消费市场受到较大冲击,社会消费品零售总额出现大幅下降,而灰色模型在捕捉这种突发的、异常的变化时存在一定的局限性。为了更直观地展示预测值与实际值的差异,绘制了实际值与预测值的对比折线图,如图3所示:图3灰色模型预测值与实际值对比折线图从图3中可以看出,大部分时间内预测值与实际值的走势较为接近,灰色模型能够较好地捕捉社会消费品零售总额的总体变化趋势。在一些特殊时期,如2022年部分月份,由于受到疫情等突发因素的影响,实际值与预测值之间出现了较大的偏差。这表明灰色模型对于平稳变化的数据具有较好的预测能力,但对于受突发事件影响较大的数据,预测精度有待提高。为了进一步评估灰色模型的预测效果,计算了平均绝对误差(MAE)、均方误差(MSE)和平均绝对百分比误差(MAPE),计算公式如下:MAE=\frac{1}{n}\sum_{i=1}^{n}\verty_i-\hat{y}_i\vertMSE=\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2MAPE=\frac{1}{n}\sum_{i=1}^{n}\frac{\verty_i-\hat{y}_i\vert}{y_i}\times100\%其中,n为预测样本数量,y_i为实际值,\hat{y}_i为预测值。经过计算,灰色模型预测结果的MAE为1244.74亿元,MSE为2784674.78亿元²,MAPE为3.94%。一般来说,MAE、MSE和MAPE的值越小,说明模型的预测精度越高。与其他研究中类似模型对社会消费品零售总额的预测结果相比,本文灰色模型的预测精度处于中等水平。这表明灰色模型在预测我国社会消费品零售总额时具有一定的可行性和有效性,但仍有提升的空间。五、基于ARMA模型的社会消费品零售总额预测5.1ARMA模型的建立5.1.1数据平稳化处理在建立ARMA模型之前,对我国社会消费品零售总额数据进行平稳化处理是至关重要的步骤。由于ARMA模型要求时间序列具有平稳性,而原始的社会消费品零售总额时间序列通常呈现出非平稳的特征,如存在明显的趋势性和季节性波动。从3.4节数据的平稳性检验结果可知,我国社会消费品零售总额原始数据的ADF统计量大于临界值,说明原始数据是非平稳的。为了使数据满足ARMA模型的建模要求,对原始数据进行一阶差分处理。一阶差分的原理是通过计算相邻两个时间点数据的差值,消除数据中的趋势性成分。对于时间序列y_t,一阶差分后的序列d_t定义为d_t=y_t-y_{t-1}。对我国社会消费品零售总额数据进行一阶差分后,再次进行ADF检验。结果显示,一阶差分后数据的ADF统计量小于临界值,拒绝原假设,表明一阶差分后的数据是平稳的。除了差分处理,还可以考虑其他数据平稳化方法,如对数变换。对数变换可以压缩数据的尺度,减少数据的异方差性,使数据更加平稳。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论