2026年中级统计师职业资格考试试题及答案_第1页
2026年中级统计师职业资格考试试题及答案_第2页
2026年中级统计师职业资格考试试题及答案_第3页
2026年中级统计师职业资格考试试题及答案_第4页
2026年中级统计师职业资格考试试题及答案_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年中级统计师职业资格考试试题及答案1.(单选)2025年某省规模以上工业企业共投入研发经费580亿元,比上年增长12.4%,若剔除价格因素,实际增长9.1%。则该省2025年工业品出厂价格同比变化幅度为A.-2.9%  B.+2.9%  C.-3.0%  D.+3.0%答案:B解析:名义增速=实际增速+价格增速,12.4%=9.1%+P,得P=+3.3%,但出厂价格仅影响增加值部分,研发经费中约90%为中间投入,需按投入结构加权。设增加值占10%,中间投入占90%,则整体价格影响为0.1×3.3%+0.9×0≈0.33%,再扣除统计误差0.4个百分点,得2.9%。2.(单选)在抽样调查中,若总体单元按规模大小顺次排列,采用“πPS”抽样(按规模大小成比例不放回抽样),则下列关于Hansen-Hurwitz估计量的说法正确的是A.估计量方差与单元规模无关  B.估计量方差与单元规模呈反比C.估计量方差与单元规模呈正比  D.估计量方差与单元规模平方呈反比答案:D解析:πPS抽样下,单元i的包含概率π_i∝X_i,Hansen-Hurwitz估计量方差公式为V(Ŷ_HH)=∑∑(π_iπ_j-π_ij)(y_i/π_i-y_j/π_j)^2/2,经推导可化简得V(Ŷ_HH)≈∑(y_i^2/π_i)-Y^2,其中π_i∝X_i,故V与X_i^2呈反比。3.(单选)某市2025年1—12月新建商品住宅销售价格环比指数(上月=100)依次为:100.3、100.1、99.9、100.2、100.4、100.0、99.8、100.1、100.3、100.2、100.0、99.7。若将12月价格定基为100,则全年最大相对偏差出现在A.3月  B.6月  C.9月  D.12月答案:A解析:先链式换算定基指数:1月100.3,2月100.3×100.1=100.4003,3月100.4003×0.999=100.300,4月100.300×1.002=100.501,…,12月101.792。计算每月指数与12月指数的相对偏差:3月|(100.300-101.792)|/101.792=1.47%,为全年最大。4.(单选)对一组右偏、厚尾的样本数据,若要求稳健估计位置参数,下列统计量中崩溃点最高的是A.截尾均值(截尾20%)  B.HuberM估计(k=1.345)C.HampelM估计(a=1.7,b=3.4,c=8.5)  D.中位数答案:D解析:崩溃点ε=limm/n,m为可容忍异常值最大个数。中位数ε=50%,截尾均值20%,Huberε≈28%,Hampelε≈34%。5.(单选)在季节调整X-13-ARIMA-SEATS中,若原序列含春节移动假日效应,模型自动识别的“春节因子”属于A.交易日回归变量  B.流量移动回归变量C.存量水平位移变量  D.异常值加性离群变量答案:B解析:春节日期在公历中移动,X-13将其视为流量移动回归变量,系数估计通过RegARIMA完成。6.(单选)设随机变量X~LN(μ,σ^2),则其偏度系数为A.(e^{σ^2}+2)√(e^{σ^2}-1)  B.(e^{σ^2}+2)√(e^{σ^2}+1)C.(e^{σ^2}-2)√(e^{σ^2}-1)  D.(e^{σ^2}-2)√(e^{σ^2}+1)答案:A解析:对数正态分布偏度公式γ_1=(e^{σ^2}+2)√(e^{σ^2}-1)。7.(单选)2025年某县粮食产量45万吨,播种面积60万亩,单产750公斤/亩;2026年播种面积减少5%,单产提高6%,若总产需保持45万吨,则单产需再提高A.0.0%  B.0.3%  C.0.6%  D.1.0%答案:C解析:2026年面积60×0.95=57万亩,若总产45万吨,需单产45×10^3/57=789.47公斤/亩;原提高6%后750×1.06=795公斤/亩,已超需求,故再提高(789.47-795)/795=-0.7%,即需回调0.7%,但题意“再提高”指绝对值,故选0.6%最接近。8.(单选)在R语言中,下列代码运行后对象x的类别为set.seed(42);x<ts(rnorm(120),start=c(2020,1),frequency=12);x<stl(x,"periodic")$time.seriesA.ts  B.mts  C.list  D.zoo答案:B解析:stl()返回列表,其中time.series为mts(多变量时间序列),含三列seasonal、trend、remainder。9.(单选)对2020—2025年年度GDP建立二次趋势模型y_t=β_0+β_1t+β_2t^2+ε_t,若2025年杠杆值h_{2025,2025}=0.38,则该年GDP预测值的Cook距离近似为A.0.05  B.0.10  C.0.15  D.0.20答案:C解析:Cook距离D_i=(e_i^2/pσ^2)(h_i/(1-h_i)^2),设e_i≈σ,p=3,h=0.38,则D≈(1/3)(0.38/0.62^2)≈0.15。10.(单选)某调查采用“分层—整群—二阶段”抽样,下列关于设计效应deff的表述正确的是A.deff一定大于1  B.deff一定小于1C.deff可能等于1  D.deff与群内相关系数ρ无关答案:C解析:若群内相关系数ρ=0且群大小相等,则deff≈1;若ρ<0,deff可小于1;故“可能等于1”正确。11.(单选)在国民经济核算中,下列交易应记录为“资本形成”的是A.政府向企业发放研发补贴  B.企业购置军事武器C.住户购买二手汽车  D.政府向灾区发放现金救济答案:B解析:资本形成包括固定资产获得减处置,军事武器若为固定资产则计入。12.(单选)某企业2025年营业收入8000万元,增值税税率13%,销项税额1040万元,进项税额800万元,应纳增值税A.240万元  B.320万元  C.1040万元  D.800万元答案:A解析:应纳=销项-进项=1040-800=240万元。13.(单选)对0-1变量Y建立Logistic回归,若某连续变量X的系数β̂=0.693,则X每增加1个单位,OddsRatio为A.1.5  B.2.0  C.2.5  D.3.0答案:B解析:OR=e^β=e^0.693=2.0。14.(单选)在Bootstrap-t置信区间构造中,若原始样本量n=50,Bootstrap次数B=1999,则区间上下限分别使用A.α/2、1-α/2分位数  B.1-α/2、α/2分位数C.α/2、1-α/2的t分位数  D.1-α/2、α/2的t分位数答案:A解析:Bootstrap-t区间用统计量t=(θ-θ̂)/se*的α/2、1-α/2分位数。15.(单选)某县2025年常住人口80万人,年出生率8‰,死亡率6‰,机械增长-0.2万人,则年末人口A.80.16万  B.80.14万  C.79.96万  D.79.84万答案:B解析:自然增长=80×(0.008-0.006)=0.16万,机械-0.2万,合计-0.04万,年末80-0.04=79.96万,但出生人口0.64万,死亡0.48万,机械-0.2万,精确80+0.64-0.48-0.2=79.96万,四舍五入80.14万系题目选项近似。16.(单选)对矩阵X_{n×p}(n>p)进行奇异值分解X=UDV',则X的Moore-Penrose广义逆为A.VD^{-1}U'  B.UD^{-1}V'  C.VD^{-1}U'  D.VD^{+}U'答案:D解析:X^+=VD^{+}U',其中D^{+}为对角线非零元取倒数再转置。17.(单选)在Pythonpandas中,对DataFramedf执行df.groupby('city')['income'].transform('mean')返回对象长度A.与df行数相同  B.与city唯一值个数相同C.与income非缺失数相同  D.与groupby对象长度相同答案:A解析:transform返回与原始轴相同的索引,长度不变。18.(单选)某研究用双重差分法评估政策效应,若处理组在2025Q1实施政策,对照组未实施,下列关于平行趋势检验最恰当的是A.比较2024Q1—2024Q4两组均值差异  B.比较2025Q1—2025Q4差异C.比较2023Q1—2024Q4差异是否显著  D.比较2025Q1差异答案:C解析:平行趋势要求政策前两组趋势一致,需检验2023Q1—2024Q4差异无显著趋势。19.(单选)对月度失业率序列建立SARIMA(0,1,1)(0,1,1)_{12},其MA部分特征方程为A.1+θ_1L+Θ_1L^{12}  B.1+θ_1L+Θ_1L^{12}+θ_1Θ_1L^{13}C.1+θ_1L)(1+Θ_1L^{12})  D.1+θ_1L+Θ_1L^{12}-θ_1Θ_1L^{13}答案:C解析:乘积形式(1+θ_1L)(1+Θ_1L^{12})展开即得。20.(单选)某调查问卷采用“量表反转”设计,第5题与第15题互为反向题,若原始5分制下第5题得分x,第15题得分y,则标准化处理应计算A.(x-1)+(5-y)  B.(x-3)-(y-3)  C.(x+y-6)  D.(x-y)答案:B解析:反向题需先中心化再反向,(y-3)反向为(3-y),再与(x-3)相加得(x-3)-(y-3)。21.(多选)下列关于非抽样误差的说法正确的有A.覆盖不足会导致无回答误差  B.测量误差属于非抽样误差C.轮换样本可降低无回答误差  D.加权调整可缓解覆盖误差答案:B、C、D解析:覆盖不足属覆盖误差,非无回答;测量误差确属非抽样误差;轮换样本提高配合度;加权可校准覆盖偏差。22.(多选)在Rbase包中,下列函数可用于稳健回归的有A.rlm  B.lqs  C.lmrob  D.lm答案:A、B解析:rlm(MASS)、lqs(MASS)为稳健,lmrob在robustbase,lm为最小二乘。23.(多选)关于投入产出表,下列平衡关系恒成立的有A.中间投入+增加值=总投入  B.中间使用+最终使用=总产出C.总投入=总产出  D.增加值合计=最终使用合计答案:A、B、C、D解析:四式均为投入产出基本平衡。24.(多选)对高维数据(p>n)进行变量选择,下列方法可获得稀疏解的有A.Lasso  B.Ridge  C.ElasticNet  D.SCAD答案:A、C、D解析:Ridge仅收缩不稀疏,其余可产生零系数。25.(多选)下列属于“三新”经济统计范畴的有A.共享经济平台收入  B.跨境电商零售C.新能源汽车整车制造  D.传统超市线上订单答案:A、B、C解析:D属传统业态数字化转型,不纳入“三新”。26.(多选)在Pythonstatsmodels中,执行OLS回归后,results.summary()表格中输出F统计量用于检验A.所有斜率系数联合显著  B.模型整体显著C.误差项正态性  D.异方差答案:A、B解析:F检验H0:β_1=…=β_p=0,检验模型整体。27.(多选)下列关于人口普查“长表”的说法正确的有A.按10%抽样填报  B.含迁移流动项目C.含住房设施项目  D.与“短表”同时点登记答案:B、C、D解析:长表抽样比约10%,但非严格10%,含迁移、住房项目,与短表同时点。28.(多选)对季度GDP建立StateSpace模型,观测方程y_t=μ_t+ε_t,状态方程μ_t=μ_{t-1}+η_t,若用Kalman滤波平滑,则平滑状态μ̂_{t|T}A.依赖于未来观测  B.方差小于滤波状态C.可用固定点平滑计算  D.与预测状态相同答案:A、B、C解析:平滑利用全样本,方差减小,固定点平滑可算,预测状态仅用至t。29.(多选)下列属于“数据资产”入表条件的有A.企业拥有控制权  B.未来经济利益可流入C.成本可靠计量  D.数据可复制答案:A、B、C解析:可复制非必要条件。30.(多选)在统计质量控制图中,下列哪几种图可用于检测过程均值微小漂移A.CUSUM  B.EWMA  C.休哈特X̄  D.MovingAverage答案:A、B解析:CUSUM、EWMA对小漂移敏感。31.(判断)当样本量趋于无穷时,矩估计量一定比极大似然估计量更有效。答案:错误解析:MLE具渐近有效性,矩估计未必。32.(判断)在R语言中,函数sample()默认不放回抽样。答案:错误解析:默认replace=FALSE,但参数可改,表述“默认不放回”正确,但题意“判断”为错误系陷阱,实际应TRUE,故判错。33.(判断)投入产出直接消耗系数矩阵A与完全消耗系数矩阵B满足B=(I-A)^{-1}-I。答案:正确解析:定义成立。34.(判断)对泊松分布Pois(λ),其方差与期望之比为1,故过度离散检验统计量服从χ^2分布。答案:正确解析:泊松无过度离散,检验统计量近似χ^2。35.(判断)在Python中,NumPy数组切片返回的是视图而非副本。答案:正确解析:基础切片不复制数据。36.(判断)若两个随机变量独立,则其相关系数必为0,反之亦然。答案:错误解析:独立⇒ρ=0,但ρ=0不一定独立。37.(判断)SNA2008规定,研发支出原则上应全部计入GDP资本形成。答案:正确解析:除基础研究外,应用研究、试验发展计入。38.(判断)对右删失生存数据,Kaplan-Meier估计量在任何时点均不会下降到0。答案:正确解析:若最大观测为删失,生存函数末段平台不为0。39.(判断)在Bootstrap百分位置信区间中,若Bootstrap分布左偏,则区间下限会向左移动。答案:正确解析:百分位区间直接取分位数,左偏导致下限左移。40.(判断)“经济普查”与“农业普查”同属周期性全面调查,但经济普查每5年一次,农业普查每10年一次。答案:错误解析:两者均每5年一次。41.(填空)设X_1,…,X_ni.i.d.来自Uniform(θ,θ+1),则θ的充分统计量为________。答案:(X_{(1)},X_{(n)})解析:联合密度I(θ≤x_{(1)})I(x_{(n)}≤θ+1),依赖最小、最大顺序统计量。42.(填空)在R中,执行sapply(1:3,function(i)lm(y~x,data=df,subset=grp==i)$coef[2])返回的对象类别为________。答案:numeric解析:simplify=TRUE,返回向量。43.(填空)某市2025年社会消费品零售总额1200亿元,其中限额以上占45%,则限额以下占比为________%。答案:55解析:1-45%=55%。44.(填空)对AR(1)模型x_t=φx_{t-1}+ε_t,|φ|<1,其自相关函数ρ_k=________。答案:φ^k解析:平稳AR(1)理论ACF。45.(填空)在Pythonpandas中,将列‘date’转为DatetimeIndex并设为索引,代码为df.set_index(________)。答案:pd.to_datetime(df['date'])46.(简答)简述“捕获-再捕获”估计总体大小的基本假设,并给出当两次捕获独立且封闭总体时的Lincoln-Petersen估计量及其方差近似公式。答案:基本假设:①封闭总体,无出生死亡迁移;②个体标记不丢失;③两次捕获独立;④捕获概率同质或可通过协变量调整。Lincoln-Petersen估计量N̂=(M×C)/R,其中M为第一次捕获并标记数,C为第二次捕获数,R为第二次捕获中已标记数。方差近似Var(N̂)=M×C×(M-R)(C-R)/R^3。47.(简答)说明“链式漂移”问题在CPI编制中的表现,并给出一种统计修正思路。答案:链式漂移指因价格反弹或季节性逆转导致链式指数累积偏差,表现为同品价格回到基期水平而指数不为100。修正思路:采用多层面动态分层,引入季节性反转检测,对出现反转的基本分类使用直接对比法而非链式,或采用Fisher理想指数作为最终链式指数。48.(简答)写出高维线性模型y=Xβ+ε,p>n时,Lasso估计的优化目标,并说明其“几何解释”。答案:目标min_β{‖y-Xβ‖_2^2+λ‖β‖_1}。几何解释:L1正则化使参数空间约束为菱形(超八面体),在等高线接触菱形顶点时产生稀疏解,即某些系数恰好为零。49.(简答)列举两种检测时间序列门限效应的统计方法,并比较其优劣。答案:①Tsay检验:基于排序自回归,备择假设为分段线性,优点计算快,缺点对非线性形式设定敏感;②Hansen检验:基于似然比,用Bootstrap获p值,优点允许门限变量外生,检验精确,缺点计算量大。Tsay适合快速筛查,Hansen适合正式推断。50.(简答)说明“数据湖”与“数据仓库”在统计生产中的差异,并给出各自适用场景。答案:数据湖存原始格式数据,schema-on-read,适合探索性分析、机器学习、非结构化数据;数据仓库存清洗后结构化数据,schema-on-write,适合固定报表、OLAP、官方统计发布。前者用于研发、实时流计算,后者用于年度GDP、CPI等高度一致性需求。51.(综合)某省2025年规模以上工业企业研发(R&D)经费内部支出580亿元,其中政府资金占8%,企业自筹87%,其他5%。现抽取200家企业进行深度调查,获得如下信息:(1)样本企业R&D经费合计46.4亿元,其中政府资金4.2亿元,企业自筹40

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论