2025年自考统计预测题及答案_第1页
2025年自考统计预测题及答案_第2页
2025年自考统计预测题及答案_第3页
2025年自考统计预测题及答案_第4页
2025年自考统计预测题及答案_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年自考统计预测题及答案一、单项选择题(每小题1分,共20分。每题只有一个正确答案,请将正确选项的字母填在括号内)1.在时间序列的乘法模型中,若季节指数S_t=1.15,则表明该季度()。A.比趋势值低15%B.比趋势值高15%C.与趋势值相等D.无法判断与趋势值的关系【答案】B2.下列关于指数平滑法参数α的说法,正确的是()。A.α越大,模型对历史数据越敏感B.α越小,模型对近期变化反应越快C.α=0时,预测值等于上一期实际值D.α=1时,预测值等于上一期预测值【答案】A3.若某产品过去12个月的销售额呈现明显的“春节效应”,则在建模时应优先选择()。A.简单指数平滑B.Holt线性趋势模型C.Winter乘法季节模型D.ARIMA(0,1,1)【答案】C4.在BoxJenkins建模流程中,若ACF呈拖尾、PACF在滞后2阶后截尾,则初步判定为()。A.AR(1)B.AR(2)C.MA(2)D.ARMA(1,1)【答案】B5.对某时间序列取一阶差分后,ADF检验p值=0.032,则()。A.原序列平稳B.原序列非平稳C.差分序列非平稳D.无法判断【答案】A6.当预测误差呈现“方差随时间递增”现象时,首选的改进策略是()。A.增加模型阶数B.对数变换C.移动平均D.差分运算【答案】B7.在预测评价指标中,对异常值最敏感的是()。A.MAEB.MAPEC.RMSED.MdAE【答案】C8.若某预测模型在滚动原点评估中,MAPE随预测步长增加而迅速放大,说明()。A.模型过拟合B.模型欠拟合C.模型外推能力弱D.数据量不足【答案】C9.对月度数据建立SARIMA模型时,季节差分阶数D的确定主要依据()。A.原始序列的ADF检验B.季节滞后ACF是否缓慢衰减C.AIC最小原则D.LjungBox统计量【答案】B10.在预测区间构建中,若残差服从t分布且自由度=15,则95%区间应使用临界值()。A.1.96B.2.12C.2.131D.1.645【答案】C11.当使用Bagging集成预测时,对“不稳定”模型效果提升最明显,此处“不稳定”指()。A.参数显著但R²低B.参数不显著C.参数对样本微小变化敏感D.残差异方差【答案】C12.在Prophet模型中,若changepoint_prior_scale由0.05调至0.5,则()。A.趋势段更平滑B.趋势段更灵活C.季节项被抑制D.节假日效应消失【答案】B13.对高频金融数据预测,下列方法中最能捕捉“长记忆”特征的是()。A.GARCH(1,1)B.FIGARCHC.EWMAD.简单移动平均【答案】B14.若某预测系统采用“滑动窗口+重新估计”策略,窗口长度固定为60期,则其计算复杂度主要受限于()。A.窗口内样本量B.参数估计算法C.预测步长D.外生变量维度【答案】B15.在“预测实现”回归检验中,若斜率系数显著小于1,表明()。A.预测无偏B.预测过度反应C.预测反应不足D.预测方差最小【答案】C16.对零膨胀计数序列预测,Tweedie分布相较于Poisson分布的优势在于()。A.均值等于方差B.可处理过度离散与零膨胀并存C.参数估计更快D.无需暴露变量【答案】B17.在贝叶斯预测中,若采用MCMC采样,GelmanRubin统计量R̂=1.03,则()。A.链未收敛B.链收敛良好C.需增加迭代次数D.先验设定错误【答案】B18.对多变量时间序列,若欲预测变量Y且引入变量X,但X未来值亦未知,则最佳策略为()。A.仅用Y的滞后项B.先对X做预测再代入C.采用VAR系统建模D.放弃X【答案】C19.在“交叉验证”中,若时间序列长度T=120,预测步长h=12,滚动原点间隔k=6,则共产生()个评估点。A.10B.18C.19D.20【答案】B20.当预测目标为“区间”而非“点”时,若要求覆盖率达95%且平均宽度最小,应优化()。A.点预测值B.密度预测C.分位点组合D.残差分布尾部【答案】C二、多项选择题(每小题2分,共20分。每题有两个或两个以上正确答案,多选、少选、错选均不得分)21.下列哪些方法可直接用于非平稳序列的预测()。A.ARIMAB.VARindifferencesC.ProphetD.指数平滑E.静态回归【答案】A,B,C,D22.在构建预测区间时,以下哪些因素必须考虑()。A.参数估计误差B.残差方差C.未来观测不确定性D.模型设定误差E.样本量大小【答案】A,B,C,D23.关于HoltWinters加法模型,下列说法正确的是()。A.季节项之和近似0B.趋势项为线性C.平滑参数共三个D.适用于恒定季节振幅E.可直接输出预测区间【答案】A,B,C,D24.在机器学习方法中,哪些算法对“滞后特征工程”依赖度较低()。A.LSTMB.XGBoostC.RandomForestD.CNNseq2seqE.岭回归【答案】A,D25.若某预测系统采用“专家意见+模型”组合,则提高组合预测精度的关键包括()。A.专家权重动态更新B.模型残差独立C.专家偏差修正D.引入多样性惩罚E.采用简单平均【答案】A,B,C26.对高频数据实现“实时预测”时,以下哪些技术可降低延迟()。A.增量学习B.模型压缩C.GPU并行D.特征缓存E.滚动窗口重估计【答案】A,B,C,D27.在“预测竞赛”中,若评价函数为加权MAPE,权重与销量正相关,则容易导致()。A.大销量商品权重高B.长尾商品被忽视C.模型偏向保守D.零销量商品无法评价E.预测值普遍偏高【答案】A,B,D28.下列哪些诊断图可用于检验ARIMA残差的白噪声性()。A.ACF图B.PACF图C.LjungBox检验p值序列D.QQ图E.残差平方ACF图【答案】A,C,D,E29.在“概率预测”框架下,下列哪些指标可同时评估锐度与校准度()。A.CRPSB.LogscoreC.PITD.CoverageE.Width【答案】A,B,C30.若采用“多模型贝叶斯模型平均(BMA)”进行预测,则其权重取决于()。A.模型边际似然B.参数先验C.模型先验D.预测表现E.训练时长【答案】A,B,C三、计算分析题(共30分)31.(本题10分)某电商平台上,一款蓝牙耳机过去36个月的销售额(万元)如下(已按时间顺序排列):[52,55,58,61,64,67,70,73,76,79,82,85,88,91,94,97,100,103,106,109,112,115,118,121,124,127,130,133,136,139,142,145,148,151,154,157](1)建立Holt线性趋势模型,给出平滑参数α=0.3、β=0.2时,第37个月的点预测值(保留两位小数)。(2)若第37个月实际销售额为160万元,计算该步的绝对百分误差(APE)。(3)若采用α=0.1、β=0.1重新估计,预测值将如何变化(定性回答即可)。【答案】(1)初始化:l₀=52,b₀=(15752)/35=3递推:l_t=αy_t+(1α)(l_{t1}+b_{t1})b_t=β(l_tl_{t1})+(1β)b_{t1}经36期递推得l₃₆=157,b₃₆=3预测:ŷ₃₇=l₃₆+b₃₆=160.00(万元)(2)APE=|160160|/160=0.00%(3)平滑参数减小,模型对最新趋势反应更迟缓,预测值将略低于160,趋向前一期水平。32.(本题10分)某城市公交日客运量呈现明显周循环,现采集过去7周数据(单位:万人次)共49期,拟建立SARIMA模型。经检验,原始序列ADFp=0.12;取一阶季节差分∇₇后,ADFp=0.01;再取一阶普通差分∇后,ADFp<0.001。ACF与PACF显示:∇∇₇y_t的ACF在滞后7、14、21处显著负值,PACF在滞后7处截尾。(1)写出候选模型SARIMA的阶数符号。(2)给出该模型的季节MA多项式Θ(B⁷)的初步形式(含待估参数)。(3)若季节MA(1)系数估计为0.68,其t值=5.2,判断是否保留该项(α=0.05)。【答案】(1)SARIMA(0,1,1)×(0,1,1)₇(2)Θ(B⁷)=1+Θ₁B⁷,Θ₁待估(3)|t|>1.96,拒绝H₀:Θ₁=0,保留。33.(本题10分)某连锁便利店对1000种SKU进行日销量预测,采用LightGBM模型,特征包括:滞后1~7天销量、价格折扣、节假日标识、天气、邻近门店销量均值。现以滚动窗口验证(训练180天、预测30天),得到sMAPE=11.3%,但发现长尾SKU误差极大。(1)给出两种针对长尾SKU的改进策略,并说明原理。(2)若引入“分层时间交叉验证”,请写出具体步骤。(3)若采用“多任务学习”共享邻近门店信息,请画出网络结构简图(文字描述即可)。【答案】(1)策略A:对SKU按销量分层,低销量SKU单独建立Poisson或负二项模型,避免大样本SKU主导损失函数。策略B:目标变换,采用log(x+1)后再训练,缓解零膨胀与异方差,反向变换时采用校正的Duan’ssmearing估计。(2)步骤:①将全样本按时间切成连续5份,每份42天;②依次以第1~3份训练,第4份验证;1~4份训练,第5份验证;③每份内部再按SKU分层抽样,确保低销量SKU在训练/验证集均出现;④记录各层误差,加权平均得最终指标。(3)网络结构:输入层→共享Embedding(门店ID)→LSTM提取邻近序列→全连接层→SKU特定输出头(Poissonloss),共享层与SKU特定头通过硬共享机制联合训练。四、综合案例题(共30分)34.背景:某省电网公司需预测未来24小时全省电力负荷(MW),数据频率15分钟,即每日96点,历史三年共1095×96=105120条记录。外生变量包括:天气预报(温度、湿度、风速)、日历变量(节假日、星期、是否调休)、实时电价。公司要求:①预测精度MAPE≤1.5%;②预测区间覆盖率≥95%,平均宽度≤3%of点预测;③模型更新延迟<5分钟;④可解释性强,便于调度员理解。任务:(1)给出数据清洗与特征工程完整方案(6分)。(2)设计两套候选模型(统计+机器学习),并比较优劣(6分)。(3)阐述在线学习机制,确保要求③(6分)。(4)给出可解释性实施方案,满足要求④(6分)。(5)设计“模型性能监控”仪表盘关键指标(6分)。【答案】(1)数据清洗:①缺失值:单点缺失用线性插值;连续缺失>3点用同期上周同比值×季节因子填补;②异常值:IQR规则,超出Q3+3×IQR者标记,用同期中位数替换;③外生变量:温度采用观测站空间克里金插值到全省加权平均;特征工程:①滞后:负荷滞后96、192、288点(昨日、前日、上周同日);②滑动统计:过去24小时均值、标准差、趋势斜率;③交互:温度²、温度×湿度、节假日×小时;④傅里叶项:年内日序号sin/cos(2πk/365.25),k=1,2,3;⑤目标变换:BoxCoxλ=0.2,稳定方差。(2)候选模型:A:SARIMAX(2,0,2)×(1,1,1)₉₆,外生变量全部纳入,参数用MLE,区间用解析公式;B:LightGBM+QuantileRegression,损失函数=pinball(α=0.05,0.95),树数=2000,深度=8;优劣:A模型区间解析、可快速更新;B模型非线性强、精度高,但需校准分位点。(3)在线学习:①采用增量LightGBM,每96点到达后,用新数据微调叶子权重,学习率=0.01,单轮耗时<30秒;②对SARIMAX,采用递推MLE,用Kalman滤波更新状态,复杂度O(p+q+P+Q)³,单次<2分钟;③双模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论