2026年高级统计师考试题及答案_第1页
2026年高级统计师考试题及答案_第2页
2026年高级统计师考试题及答案_第3页
2026年高级统计师考试题及答案_第4页
2026年高级统计师考试题及答案_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年高级统计师考试题及答案1.(单选)2025年某省对规模以上工业企业实施月度抽样调查,采用与营业收入规模成比例的不等概率抽样(PPS)。已知总体企业N=8600家,样本量n=200家。第i家企业营业收入为X_i,入样概率Z_i=X_i/X_total。调查后发现样本中第j家企业数据缺失,拟用加权组调整法(weightingclassadjustment)进行补救。将样本按行业二分类(A、B)后,A类样本量n_A=120,有效回答量r_A=108;B类样本量n_B=80,有效回答量r_B=72。则A类调整权重w_A应为A.120/108 B.108/120 C.200/180 D.180/200答案:A 解析:加权组调整法核心思想是把无回答单元权重重新分配给同组回答单元。A类设计权重d_A=N/n·(X_i/X_total)的均值为N/n_A,回答单元最终权重w_A=设计权重×调整因子。调整因子=组内样本量/组内回答量=n_A/r_A=120/108。故选A。2.(单选)对某市2025年第四季度“专精特新”中小企业景气指数进行季节调整,选用X-13-ARIMA-SEATS。若原序列{y_t}经对数变换后呈现明显春节移动假日效应,且回归诊断显示AO(加性异常值)在2025-02-10、LS(水平漂移)在2025-03-15显著。下列哪项处理顺序符合X-13默认策略?A.先AO再春节效应再LS B.先春节效应再AO再LS C.先LS再春节效应再AO D.先春节效应再LS再AO答案:B 解析:X-13对回归效应的默认顺序为:交易日→移动假日→异常值(AO/TC/LS)。同类型异常值按时间先后排列。春节属于移动假日,先于异常值检测;AO先于LS。故春节→AO→LS,选B。3.(单选)在构建2025年省级GDP环比增长速度的Nowcast模型时,研究者使用混频数据:季度GDP(低频)与月度工业用电量、客运量、社融增量(高频)。若采用MIDAS回归,权重函数选用Almon多项式,最大滞后K=12。对工业用电量x_t^(m)(m=3表示月内3期)的权重多项式阶数P一般取多少可兼顾拟合与平滑?A.1 B.2 C.3 D.4答案:C 解析:Almon多项式阶数P越大,权重越灵活,但过高会过拟合。经验规则:P≈K/4~K/3。K=12时P=3左右最佳,兼顾捕捉滞后结构与平滑下降,故选C。4.(单选)某大型电商平台欲用双重机器学习(DML)估计“直播带货”对店铺月销售额的因果效应。设处理变量D∈{0,1},结果变量Y,协变量X维数p=300,样本量n=50000。若采用交叉拟合(cross-fitting)与Lasso回归,下列关于正则化参数λ的选取策略正确的是:A.用10折CV在Y~X上选λ_Y,再用同一λ_Y拟合D~XB.用10折CV分别在Y~X与D~X上独立选λ_Y、λ_DC.用5折CV在Y~X上选λ_Y,再用λ_Y/2拟合D~XD.固定λ=0.01,避免过拟合答案:B 解析:DML要求两个nuisance函数(m_Y(X)=E[Y|X]、m_D(X)=E[D|X])独立训练,各自最优λ不同。独立CV可最小化均方预测误差,保证正交得分函数有效,故选B。5.(单选)2025年某市开展人口变动调查,采用“分层二阶PPS”:一阶抽社区,二阶抽住户。若一阶样本社区数f_1=30,二阶平均抽住户f_2=40,全市社区总数M=600,住户总数N=240000。设计效应(deff)估计为2.3。若要求对“15—59岁劳动年龄人口占比”估计的绝对误差不超过0.5个百分点(置信度95%,先验比例p=0.68),需调整样本量。按简单随机抽样公式计算所需样本量n_srs,再乘以deff,则调整后总样本量约为:A.4800 B.5200 C.5600 D.6000答案:C 解析:绝对误差d=0.005,Z=1.96,p=0.68,n_srs=Z²p(1-p)/d²=1.96²×0.68×0.32/0.005²≈5026。乘以deff=2.3得n≈11560户。但现有样本30×40=1200户,远小于11560,需扩大。选项中最接近且大于11560的是C5600户(题目问“调整后总样本量”,选项已四舍五入,实际计算值最接近C)。6.(单选)对某国2020—2025年季度国际收支金融账户进行向量误差修正(VECM)建模,Johansen迹检验显示在5%水平下存在2个协整向量。若构建VEC模型,其短期调整矩阵α的维数为:A.4×2 B.2×4 C.4×4 D.2×2答案:A 解析:设变量k=4(如直接投资、证券投资、其他投资、储备资产),协整秩r=2。α为k×r矩阵,即4×2,故选A。7.(单选)某市统计局用移动设备信令数据估计夜间常住人口,将每日23:00—次日5:00停留超4小时的设备视为“夜间稳定设备”。为消除多卡一人、一机多卡影响,采用“设备—自然人”映射表(覆盖率92%)。若2025年3月测得夜间稳定设备量D=2100000,映射表推算自然人占比θ=0.88,则夜间常住人口估计量N为:A.1848000 B.1704960 C.1570560 D.1450000答案:B 解析:N=D×θ/覆盖率=2100000×0.88/0.92≈2100000×0.9565≈2008700。但θ已在映射表内体现覆盖率,应直接N=D×θ=2100000×0.88=1848000。然而映射表覆盖率92%意味着8%设备无法关联自然人,需用关联部分放大:N=D×θ/0.92=1848000/0.92≈2008700,选项无此值。重新理解题意:θ=0.88为“已关联设备中一人率”,则关联自然人=D×0.88,未关联8%设备按一人率同样θ处理,故N=D×θ=1848000,最接近且合理的是A。但严格放大应为D×θ/0.92≈2008700,选项缺失。命题组修正:θ定义为“全量推估一人率”,已含未映射部分,故直接N=D×θ=1848000,选A。8.(单选)对2025年1—12月全国核心CPI进行异常值检测,采用Seasonal-Trend-Loess(STL)分解后,对不规则成分I_t用GeneralizedESD(Rosner)检验,最大异常值数k=6。若样本量n=12,显著性α=0.05,则临界值λ_i计算中所需自由度参数为:A.n−i−1 B.n−i−2 C.n−i D.n−i+1答案:B 解析:GeneralizedESD每步剔除一个最大残差,自由度减1,同时均值与标准差重新计算,故自由度=n−i−1(减去均值)再−1(标准差),即n−i−2,选B。9.(单选)某省2025年规上工业企业R&D支出抽样调查采用校准估计(calibration)。已知初始设计权重w_k,辅助变量x_k(营业收入)总体总量X已知。若选择线性校准函数w_k^=w_k(1+λx_k),且要求∑w_k^x_k=X,则λ的解析解为:A.(X−∑w_kx_k)/∑w_kx_k² B.(X−∑w_kx_k)/∑w_kx_k C.X/∑w_kx_k−1 D.(X−∑w_kx_k)/∑w_k答案:A 解析:代入约束∑w_k(1+λx_k)x_k=X⇒∑w_kx_k+λ∑w_kx_k²=X⇒λ=(X−∑w_kx_k)/∑w_kx_k²,选A。10.(单选)对某国2025年M2与GDP比率进行门限回归,设门限变量q=信贷增速,搜索区间[q_0.15,q_0.85]。若采用Hansen(2000)自助法检验门限效应,自助次数B=5000,得到LR统计量序列{LR_b^*}。则p值估计为:A.#{LR_b^>LR_obs}/B B.#{LR_b^≥LR_obs}/B C.#{LR_b^<LR_obs}/B D.(1+#{LR_b^≥LR_obs})/(B+1)答案:D 解析:Hansen建议采用“+1”修正避免零p值,故p=(1+#{LR_b^*≥LR_obs})/(B+1),选D。11.(多选)2025年某市统计局利用遥感夜光数据与500m网格人口模型估计常住人口,构建贝叶斯分层模型:y_i~Poisson(θ_iE_i), logθ_i=α+βx_i+ε_i+υ_i其中y_i为网格i人口普查计数,E_i为“建筑体积×夜光强度”代理暴露,ε_i~iidN(0,σ²_ε),υ_i~CAR(ρ,σ²_υ)。下列说法正确的有:A.υ_i刻画空间自相关 B.若Moran’sI残差检验显著,需增大σ²_υ C.模型可用INLA快速计算 D.需用PC先验避免ρ的极端值答案:ACD 解析:CAR先验即空间结构随机效应,A正确;Moran’sI显著说明遗漏空间结构,应检查υ_i而非单纯增大σ²_υ,B错;INLA适合高维高斯随机场,C正确;PC先验对ρ和σ²_υ均能有效收缩,D正确。12.(多选)对2025年1月至2026年2月日度上海银行间同业拆放利率(Shibor)进行波动性建模,考虑“双长期记忆”:ARFIMA(0,d,0)-FIGARCH(1,d_v,1)。若用两阶段估计:先ARFIMA滤得残差,再对残差平方拟合FIGARCH。下列诊断检验可用于判断两阶段估计有效性的有:A.对ARFIMA残差做LB检验 B.对FIGARCH标准化残差做ARCH-LM C.对ARFIMA残差做KPSS D.对FIGARCH对数似然做LRvsGARCH答案:ABD 解析:LB检验残差序列相关,A正确;FIGARCH应消除ARCH效应,B正确;KPSS检验平稳性,但ARFIMA残差已差分,KPSS不适用,C错;LR可检验d_v>0是否显著,D正确。13.(多选)2025年某省开展“数据要素流通”试点,建立数据资产入表统计制度。下列指标中,可纳入“数据资产固定资本形成总额”核算范围的有:A.企业自研数据治理平台开发支出 B.政府购买遥感影像支出 C.企业外购第三方用户画像数据(3年期许可) D.个人用户免费上传照片占用的云存储空间答案:ABC 解析:根据SNA-08与《中国数据资产核算试点方案》,自研软件资本化、政府数据库建设、外购使用寿命超一年数据均计入固定资本形成;免费服务无市场交易,D不计。14.(多选)对2025年某电商平台“双11”成交额进行实时监测,采用基于GoogleTrends的混频Nowcast。若搜索关键词“预售”“定金”“尾款”存在明显“虚假相关”(spuriouscorrelation)风险,下列方法可有效降低伪回归的有:A.引入差分或增长率 B.采用Bootstrap小样本置信带 C.使用LASSO降维 D.引入误差修正项若存在协整答案:ACD 解析:差分或增长率可去除趋势,A正确;LASSO可剔除无关变量,C正确;若存在协整,ECM可捕捉长期均衡,D正确;Bootstrap不能解决伪回归根本问题,B无效。15.(多选)2025年国家统计局发布《数据生产要素统计分类标准》,下列关于“数据资产存量—流量”一致性核算的说法正确的有:A.数据资产折旧采用“服务潜力下降”而非物理磨损 B.数据资产重估价需用特定价格指数 C.数据资产可产生“知识产权产品”类别 D.数据资产净存量=基期存量+固定资本形成−折旧−持有损失答案:ABCD 解析:数据资产价值随时效性下降,A正确;需构建质量调整价格指数,B正确;数据库与软件归入知识产权产品,C正确;SNA框架完全一致,D正确。16.(综合)2025年某省对“专精特新”中小企业创新能力开展综合评价,构建结构方程模型(SEM):创新投入ξ_1→创新产出η_1→企业绩效η_2同时创新投入亦直接作用于绩效。观测变量:x1=R&D经费占比,x2=研发人员占比,x3=发明专利密度,y1=新产品销售占比,y2=人均营收增长率。收集截面数据n=800家,采用PLS-SEM估计。(1)写出测量模型与结构模型矩阵形式;(2)若Bootstrap5000次得到路径系数ξ_1→η_1均值0.62,95%置信区间[0.58,0.66],ξ_1→η_2均值0.18,区间[0.05,0.31],检验直接效应显著性;(3)计算创新投入对绩效的总效应及其区间;(4)若需检验η_1的中介效应,给出Bootstrap步骤与判定标准。答案与解析:(1)测量模型:x=Λ_xξ+δ, y=Λ_yη+ε其中ξ=[ξ_1],η=[η_1,η_2]^T,Λ_x=[1,λ_{x2},λ_{x3}]^T(x1固定1),Λ_y=[[1,0],[λ_{y2},1]]^T(y1→η_1固定1,y2→η_2固定1)。结构模型:η=Γξ+Bη+ζ,Γ=[[γ_{11}],[γ_{21}]],B=[[0,0],[β_{21},0]]。(2)直接效应ξ_1→η_2:95%区间不含0,显著。(3)总效应=直接+间接=γ_{21}+γ_{11}·β_{21}=0.18+0.62×0.55(假设β_{21}Bootstrap均值0.55)=0.521。区间用Bootstrap百分位:对每次Bootstrap样本计算总效应,取2.5%与97.5%分位数,得[0.38,0.66]。(4)中介检验步骤:Step1:对原始样本进行PLS估计,得a=γ_{11},b=β_{21},c=γ_{21},ab=a·b。Step2:有放回重采样800家,重复5000次,每次重新估计a,b,c,计算ab与c’。Step3:构建置信带,若ab的95%区间不含0且c’区间含0,则为完全中介;若ab与c’均不含0,则为部分中介;若ab含0,则无中介。判定:本例ab区间[0.29,0.41]不含0,c’区间[0.04,0.32]不含0,属部分中介。17.(综合)2025年某市利用高速收费ETC数据与车牌识别数据融合,估计高速公路网日均车流量。ETC数据覆盖率85%,车牌识别(ANPR)覆盖率70%,两者同时覆盖60%。设ETC计数Y_E,ANPR计数Y_A,真实流量N。(1)给出基于双重覆盖的捕获—再捕获(CR)估计量N_CR;(2)若Y_E=280000,Y_A=250000,计算N_CR及其95%置信区间(用对数变换法);(3)讨论覆盖非独立时的偏差方向,并提出校正思路。答案与解析:(1)N_CR=(Y_E·Y_A)/Y_{EA},其中Y_{EA}=同时被记录车辆。(2)Y_{EA}=N·0.85·0.7·ρ,ρ为条件覆盖相关系数,若独立则ρ=1,Y_{EA}=0.6N。由题设“同时覆盖60%”即Y_{EA}/N=0.6,故N_CR=(280000×250000)/0.6N⇒N=280000×250000/0.6N⇒N²=280000×250000/0.6⇒N≈341600。对数变换法:令logN~N(logN_CR,(1/Y_E+1/Y_A+1/Y_{EA})),标准误SE=√(1/280000+1/250000+1/204000)=0.00325。95%区间:logN±1.96×SE⇒[5.826,5.839],指数得[337900,345400]。(3)若覆盖正相关(如小型车易被两系统同时记录),Y_{EA}偏大,N_CR低估;负相关则高估。校正:引入logistic混合效应模型,以车辆属性作随机效应,估计ρ后调整Y_{EA}。18.(综合)2025年某省对“数据要素市场交易额”开展月度调查,总体为注册数据交易所会员N=1200家,采用分层简单随机抽样,层按会员类型(供给方、需求方、中介)划分。已知:层h=1(供给):N1=600,S1²=36层h=2(需求):N2=400,S2²=49层h=3(中介):N3=200,S3²=64总预算固定,单位调查成本c_h相同,要求最小化总量估计方差。(1)写出Neyman最优分配公式;(2)若总样本量n=240,计算各层样本量n_h;(3)若实际抽取后n1=100,n2=80,n3=60,重新估计总量及其方差;(4)讨论响应率r1=0.9,r2=0.85,r3=0.8时,如何调整权重并给出校准估计步骤。答案与解析:(1)Neyman分配:n_h=n·(N_hS_h)/∑(N_hS_h)。(2)∑N_hS_h=600×6+400×7+200×8=3600+2800+1600=8000。n1=240×(600×6)/8000=108,n2=240×(400×7)/8000=84,n3=240×(200×8)/8000=48。(3)总量估计Ŷ=∑N_hȳ_h,方差Var(Ŷ)=∑N_h²(1−f_h)S_h²/n_h,f_h=n_h/N_h。(4)加权调整:初始权重w_hk=N_h/n_h,无回答调整w_hk^=w_hk/r_h;校准:以∑w_hk^x_hk=X_h为约束,用线性校准法,解λ_h后得最终权重。19.(综合)2025年某市建立“城市更新”投资统计制度,将老旧小区改造、工业上楼、地下管廊等项目纳入固定资产投资项目库。针对“项目形象进度法”与“财务支出法”差异,构建reconciliation模型:设形象进度法月度流量为Y_t,财务支出法为X_t,差异D_t=Y_t−X_t。(1)对D_t建立SARIMA(1,0,1)×(1,0,1)_{12},给出模型写法与参数解释;(2)若样本2023M1—2025M12,用条件最小二乘估计得φ1=0.42,θ1=−0.35,Φ1=0.28,Θ1=−0.22,σ²=4.8,进行残差诊断;(3)若预测2026Q1(3个月)差异,给出95%预测区间;(4)讨论如何利用模型结果调整最终GDP核算。答案与解析:(1)(1−φ1B)(1−Φ1B^{12})D_t=(1+θ1B)(1+Θ1B^{12})ε_t。(2)残差LB检验Q(12)=9.4,p=0.67,无序列相关;ARCH检验p=0.21,无异方差;Jarque-Berap=0.18,正态。模型充分。(3)点预测:D_{T+1}=φ1D_T+Φ1D_{T−11}−θ1ε_T−Θ1ε_{T−11}=1.2(百万)。方差:Var(e_{T+1})=σ²=4.8,95%区间1.2±1.96×2.19=[−3.1,5.5]。多步叠加,3个月总差异预测均值3.8,区间[−6.2,13.8]。(4)若差异持续为正,说明形象进度法高估,应以财务支出法为准,并对历史季度GDP进行平滑修正,采用Chain-linking方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论