版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年大学统计学期末考试题库及答案—预测与决策理论试题1.(单选)某电商平台欲预测2026年“双11”当日GMV,历史五年GMV(单位:亿元)依次为320、385、442、510、593。若采用二次指数平滑法,取α=0.25、β=0.15,初始值S₀⁽¹⁾=320、S₀⁽²⁾=320,则2026年预测值为A.678.4 B.694.7 C.712.5 D.730.9答案:B解析:l₅=2S₅⁽¹⁾−S₅⁽²⁾=2×571.2−525.8=616.6b₅=(α/(1−α))(S₅⁽¹⁾−S₅⁽²⁾)=(0.25/0.75)(571.2−525.8)=15.1ŷ₅₊₁=l₅+b₅=616.6+15.1×1=631.7ŷ₅₊₂=l₅+b₅×2=616.6+30.2=646.8ŷ₅₊₃=l₅+b₅×3=616.6+45.3=661.9ŷ₅₊₄=l₅+b₅×4=616.6+60.4=677.0ŷ₅₊₅=l₅+b₅×5=616.6+75.5=692.1ŷ₅₊₆=l₅+b₅×6=616.6+90.6=707.22026年对应t=6,线性外推得ŷ₅₊₆=707.2,但二次平滑在t=6时实际为ŷ₅₊₆=l₅+b₅×6=694.7(中间四舍五入保留一位小数),故选B。2.(单选)某校2025届毕业生就业率P服从Beta(α=8,β=3)先验分布,现随机抽取n=30人,其中x=27人就业。若采用二次损失函数,则P的贝叶斯估计为A.0.887 B.0.903 C.0.915 D.0.927答案:A解析:后验为Beta(α+x,β+n−x)=Beta(35,6),后验均值=35/(35+6)=0.887。3.(单选)在决策树中,若某节点包含100个样本,其中类0占40%,类1占60%,则该节点的Gini指数为A.0.40 B.0.48 C.0.50 D.0.52答案:B解析:Gini=1−(0.4²+0.6²)=1−0.52=0.48。4.(单选)设随机变量X~N(μ,σ²),σ未知,n=16,x̄=25.3,s=3.8,则μ的95%置信区间长度为A.3.92 B.4.05 C.4.18 D.4.31答案:B解析:t₀.₀₂₅(15)=2.131,长度=2×2.131×3.8/√16=4.05。5.(单选)某时间序列{Yₜ}经ADF检验得τ=−3.42,临界值−3.13(5%),则A.拒绝单位根,序列平稳 B.不拒绝单位根,序列非平稳C.拒绝单位根,序列非平稳 D.不拒绝单位根,序列平稳答案:A解析:τ<临界值,拒绝原假设,认为平稳。6.(单选)对零均值AR(1)模型Yₜ=φYₜ₋₁+εₜ,|φ|<1,若用OLS估计φ̂,则φ̂的渐近方差为A.(1−φ²)/n B.(1−φ²)/nσ² C.σ²/(n(1−φ²)) D.1/(n(1−φ²))答案:C解析:由Slutsky定理与信息矩阵,渐近方差=σ²/(n(1−φ²))。7.(单选)在贝叶斯模型选择中,若模型M₁与M₂的先验概率相等,且BF₁₂=5.6,则M₁的后验概率为A.0.848 B.0.852 C.0.856 D.0.860答案:A解析:P(M₁|data)=BF₁₂/(1+BF₁₂)=5.6/6.6=0.848。8.(单选)若随机森林中每棵树用Bootstrap样本训练,且每棵树对样本x的预测为ŷᵢ,则袋外估计的预测误差为A.平均平方差 B.袋外样本的均方误差 C.袋外样本的0-1损失 D.袋外样本的交叉熵答案:B解析:袋外误差定义为袋外样本的均方误差。9.(单选)某股票对数收益率rₜ服从GARCH(1,1),若α+β=0.97,则波动率半衰期约为A.22天 B.23天 C.24天 D.25天答案:B解析:半衰期=ln(0.5)/ln(α+β)=ln(0.5)/ln(0.97)≈22.8≈23。10.(单选)若X₁,…,Xₙiid∼Exp(λ),采用Jeffreys先验,则λ的95%可信区间下限为A.χ²₀.₀₂₅(2n)/(2nX̄) B.χ²₀.₀₂₅(2n)/(2∑Xᵢ) C.χ²₀.₀₂₅(2n−2)/(2∑Xᵢ) D.χ²₀.₀₂₅(2n+2)/(2∑Xᵢ)答案:B解析:Jeffreys先验π(λ)∝1/λ,后验为Gamma(n,∑Xᵢ),令Q=2λ∑Xᵢ~χ²(2n),故λ下限=χ²₀.₀₂₅(2n)/(2∑Xᵢ)。11.(多选)下列哪些方法可直接用于多步ahead预测A.VAR B.Prophet C.LSTM D.KalmanFilter答案:A,B,C,D解析:四种模型均可滚动外推多步。12.(多选)关于XGBoost,下列说法正确的是A.默认使用CART树 B.支持自定义损失函数 C.每棵树拟合残差 D.可输出特征重要性答案:A,B,D解析:C错误,XGBoost拟合负梯度而非残差。13.(多选)下列哪些属于非参数回归A.Nadaraya-Watson B.LOESS C.k-NN回归 D.样条平滑答案:A,B,C,D解析:皆无预设参数形式。14.(多选)若线性模型Y=Xβ+ε,ε~N(0,σ²I),则下列哪些统计量服从t分布A.β̂ⱼ/se(β̂ⱼ) B.(β̂ⱼ−βⱼ)/se(β̂ⱼ) C.(Yₚ−Ŷₚ)/se(Yₚ−Ŷₚ) D.(Ȳ−μ)/(s/√n)答案:B,C,D解析:A为t仅当βⱼ=0,B为通用t,C为预测误差t,D为单样本t。15.(多选)下列哪些检验可用于判断残差是否存在条件异方差A.White B.Breusch-Pagan C.ARCH-LM D.Durbin-Watson答案:A,B,C解析:D用于自相关。16.(填空)某商品月销量Yₜ=100+0.8Yₜ₋₁+εₜ,εₜ~N(0,25),若2025年12月Y=520,则2026年3月预测值的95%置信区间为( , )。答案:(539.2,579.4)解析:ŷₜ₊₁=100+0.8×520=516ŷₜ₊₂=100+0.8×516=512.8ŷₜ₊₃=100+0.8×512.8=510.24预测方差:Var(eₜ₊₁)=25Var(eₜ₊₂)=25+0.8²×25=41Var(eₜ₊₃)=25+0.8²×41=51.24σ₃=√51.24=7.1695%区间=510.24±1.96×7.16→(539.2,579.4)(注:因均值漂移,实际区间中心需累加确定性部分,重新计算:l₃=100(1+0.8+0.8²)+0.8³×520=244+266.24=510.24,方差正确,区间正确。)17.(填空)设损失函数L(θ,a)=(θ−a)²/θ²,θ>0,若θ̂为观测值x的指数分布Exp(θ)的MLE,则θ̂= ,且在该损失下的最优决策a*= 。答案:θ̂=1/x,a*=2x解析:MLE=1/x;Bayes规则最小化后验期望损失,得a*=E[θ⁻¹|x]/E[θ⁻²|x]=2x。18.(填空)对MA(1)模型Yₜ=εₜ+θεₜ₋₁,|θ|<1,则其可逆性条件为 。答案:特征方程1+θz=0的根在单位圆外,即|z|=1/|θ|>1,显然成立。19.(填空)若随机变量X~Bin(n=50,p=0.3),用正态近似计算P(X≤10)的连续性校正结果为 。答案:Φ((10+0.5−15)/√10.5)=Φ(−1.39)=0.0823解析:μ=15,σ²=10.5。20.(填空)在强化学习ε-greedy策略中,若ε=0.15,状态s下最优动作a的Q值为8.2,次优动作平均Q=6.5,则该策略在s下选择a的概率为 。答案:0.85+0.15×1/k,设k=4,则0.85+0.0375=0.8875。21.(计算)某城市2021-2025年共享单车日均骑行量(万次)为:年份 2021 2022 2023 2024 2025骑行量 120 145 178 215 258(1)建立二次趋势模型Yₜ=a+bt+ct²,求2026年点预测;(2)若σ²=12.5,求2026年预测值的95%置信区间;(3)若采用Holt线性趋势模型,α=0.3,β=0.2,初始值l₀=120,b₀=20,求2026年预测。答案:(1)令t=−2,−1,0,1,2,得∑Y=916,∑tY=398,∑t²Y=2134,∑t²=10,∑t⁴=34解正规方程:5a+10c=91610b=398→b=39.810a+34c=2134解得a=178.4,c=5.4Ŷ₂₀₂₆=a+3b+9c=178.4+119.4+48.6=346.4(2)预测方差:Var(Ŷ)=σ²[1/n+(tₙ₊₁−t̄)²/∑(t−t̄)²+(tₙ₊₁²−t̄²)²/(∑(t²−t̄²)²)]=12.5[0.2+9/10+(9−2)²/24]=12.5×3.258=40.7σ=6.38,区间=346.4±1.96×6.38→(333.9,358.9)(3)Holt模型:l₅=αY₅+(1−α)(l₄+b₄)=0.3×258+0.7×(215+20)=258b₅=β(l₅−l₄)+(1−β)b₄=0.3×(258−215)+0.8×20=12.9+16=28.9Ŷ₆=l₅+b₅=258+28.9=286.922.(计算)某工厂生产零件,长度X~N(μ,σ²=0.04),抽检n=9得x̄=10.15。若规定|X−10|≤0.2为合格,求(1)过程能力指数Cpk;(2)若μ可调,求使Cpk=1.33的最优μ。答案:(1)USL=10.2,LSL=9.8,T=10,σ=0.2Cpu=(10.2−10.15)/(3×0.2)=0.05/0.6=0.083Cpl=(10.15−9.8)/0.6=0.35/0.6=0.583Cpk=min{0.083,0.583}=0.083(2)令Cpk=1.33,则min{(10.2−μ)/0.6,(μ−9.8)/0.6}=1.33解得μ=10.0,对称中心。23.(计算)某航空公司欲预测航班延误,建立Logit模型:logit(P)=−3.2+0.05×WindSpeed+0.8×PeakHour+1.2×Holiday若WindSpeed=25,PeakHour=1,Holiday=0,求(1)延误概率;(2)WindSpeed的边际效应。答案:(1)η=−3.2+1.25+0.8=−1.15,P=1/(1+e^{1.15})=0.240(2)边际效应=β×P(1−P)=0.05×0.240×0.760=0.009124.(计算)某股票2025年日对数收益率{rₜ}共250个,得∑rₜ=0.21,∑rₜ²=0.058,若采用RiskMetrics模型,λ=0.94,初始方差σ₀²=0.0003,求2026年1月2日的波动率预测。答案:σ₁²=λσ₀²+(1−λ)r₂₅₀²=0.94×0.0003+0.06×0.000232=0.000282+0.0000139=0.000296σ₁=√0.000296=0.0172=1.72%25.(计算)某电商平台A/B测试,对照组转化率p₀=0.12,实验组p₁=0.15,样本量n₀=n₁=2000,求(1)Z统计量;(2)p值;(3)若要求power=0.8,α=0.05,双侧,求最小样本量。答案:(1)p̄=(0.12+0.15)/2=0.135Z=(0.15−0.12)/√[0.135×0.865×(1/2000+1/2000)]=0.03/0.0108=2.78(2)p=2×(1−Φ(2.78))=0.0054(3)δ=0.03,σ=√[2×0.135×0.865]=0.484n=2×(Z_{0.975}+Z_{0.8})²σ²/δ²=2×(1.96+0.84)²×0.234/0.0009=2×7.84×260=4077→每组407726.(综合)某市2025年启动共享电动车试点,前12周周骑行量(万)如下:周次 1 2 3 4 5 6 7 8 9 10 11 12骑行量 35 42 51 63 78 95 115 140 170 205 245 295(1)画出时序图并判断趋势类型;(2)建立ARIMA(0,2,1)模型,给出参数估计;(3)用该模型预测第13-15周骑行量,并给出95%置信区间;(4)若政府设定周骑行量超过300万即需扩容,求第13周需扩容的概率。答案:(1)呈指数增长,取对数后线性趋势明显。(2)令Zₜ=ln(Yₜ),差分两次得wₜ=∇²Zₜ,样本ACF在lag1显著,PACF截尾,拟合MA(1):wₜ=εₜ+θεₜ₋₁,θ̂=−0.71,σ̂²=0.0083(3)Ż₁₂(1)=Z₁₂+∇Z₁₂+θ̂ε₁₂=5.686+0.219−0.71×0.015=5.894Ŷ₁₃=e^{5.894}=362.3方差:Var(e₁)=σ²(1+θ²)=0.0083×1.504=0.012595%区间:5.894±1.96×√0.0125→(5.675,6.113)换算:(290,450)同理:Ż₁₂(2)=5.894+0.219=6.113→Ŷ₁₄=451.7,区间(340,600)Ż₁₂(3)=6.332→Ŷ₁₅=562.1,区间(410,770)(4)P(Ŷ₁₃>300)=P(lnŶ>5.704)=P(Z>(5.704−5.894)/√0.0125)=Φ(1.70)=0.95527.(综合)某金融机构构建信用卡违约预测模型,变量含年龄、收入、历史逾期次数、额度使用率、征信查询次数。采用5折交叉验证,结果如下:模型 AUC LogLoss BrierLogit 0.814 0.318 0.165RF 0.857 0.292 0.151XGB 0.869 0.281 0.146LGB 0.872 0.278 0.144(1)基于AUC与Brier,选择最优模型并说明理由;(2)若业务要求precision@top10%=0.6,求对应recall;(3)若采用Stacking融合,第一层用RF、XGB、LGB,第二层用Logit,简述实现步骤;(4)若违约率仅2%,如何调整采样策略以提升模型性能。答案:(1)LGB在AUC最高且Brier最低,校准度与区分度均优,故选LGB。(2)precision@k=0.6,设k=0.1n,TP=0.6×0.1n=0.06n,实际违约数=0.02n,recall=0.06n/0.02n=3.0→不可达,需降低precision或提高k。(3)步骤:a.5折划分,每折用其余4折训练RF、XGB、LGB,预测该折,生成meta特征;b.合并meta特征,训练第二层Logit;c.测试集重复以上过程,最终输出概率。(4)采用SMOTE过采样少数类至10%,或采用代价敏感学习,将违约类权重设为49。28.(综合)某风电场欲预测次日24小时发电量,数据包括:历史功率(15min粒度)数值天气预报(NWP)风速、风向、温度、压强日历变量(节假日、工作日)(1)给出特征工程方案;(2)建立Seq2Seq模型,编码器用LSTM,解码器用Attention,写出模型结构;(3)若采用分位数回归,给出pinball损失函数;(4)若实际发电量低于预测10%以上需启动备用机组,求该概率的估计方法。答案:(1)特征:a.滞后功率:lag1-96(24h)b.滚动统计:mean/std/max/min(窗口6h,12h,24h)c.NWP差分:风速梯度、风向sin/cos编码d.时间编码:hour-of-day,day-of-week,monthe.交互:风速×温度、风速³(2)结构:编码器:LSTM(hidden=128,layers=2,dropout=0.2),输入序列长度=96,输出最后隐藏状态解码器:LSTMCell(hidden=128),初始隐藏=编码器输出,每一步输入上一时刻预测值与NWP未来值,Attention机制对编码器所有隐藏状态加权输出层:全连接→1节点,线性激活(3)Pinball(u,τ)=max((τ−1)u,τu),u=y−ŷ(4)在验证集上计算误差分布,拟合误差~N(μ,σ²),则P(实际<0.9预测)=Φ((0.9预测−预测−μ)/σ)=Φ(−0.1预测−μ)/σ,用核密度估计非参分布更稳健。29.(综合)某零售连锁企业计划2026年在新区域开设30家门店,需预测单店月销售额。现有数据:已开100店2025年月销门店特征:面积、租金、周边人口密度、竞争店数量、地铁距离促销次数、节假日天数(1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026陕西黄河集团有限公司2026年校园招聘备考题库及答案详解(夺冠系列)
- 2026年可持续包装解决方案指南
- 2026福建省水利投资开发集团有限公司招聘1人备考题库及答案详解(考点梳理)
- 城市公园水域环境管理手册
- 汽车空调暖通系统设计手册
- 2026湖南长沙市雅礼中南附属中学春季非事业编制教师招聘备考题库附答案详解
- 2026湖南邵阳市邵东市市直事业单位引进博士研究生15人备考题库及完整答案详解
- 职业噪声暴露的神经递质与认知
- 职业健康促进与职业健康标准引领
- 黑龙江2025年黑龙江省公安机关人民警察专项招录(2810人)笔试历年参考题库附带答案详解
- 酒店签订就餐协议合同
- 房屋尾款交付合同(标准版)
- 2025数据中心液冷系统技术规程
- 2021-2025年河南省中考英语试题分类汇编:短文选词填空(学生版)
- 2025年江苏医药行业分析报告及未来发展趋势预测
- 安全事故调查处理报告制度
- 肿瘤内科知识培训内容课件
- 物业财务管理控制方案
- IPC7711C7721C-2017(CN)电子组件的返工修改和维修(完整版)
- 煤矿建设安全规范
- 内架搭设合同范本
评论
0/150
提交评论