版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026统计师考试试题及答案1.(单选)2025年某省规模以上工业企业共3600家,其中大型占8%,中型占22%,小型占70%。若采用分层抽样抽取300家进行能源消耗调查,则各层样本量依次为A.2466210 B.2460216 C.3060210 D.3066204答案:A解析:分层抽样按各层比例分配样本量。大型:300×8%=24;中型:300×22%=66;小型:300×70%=210。2.(单选)某市2020—2025年GDP环比增速(%)依次为5.2、4.8、3.9、5.5、6.1,若采用指数平滑法预测2026年增速,平滑系数α=0.3,且已知2025年一次指数平滑值为5.4%,则2026年预测值为A.5.31% B.5.41% C.5.51% D.5.61%答案:B解析:指数平滑公式S_t=αx_t+(1−α)S_{t−1},2026年预测值即S_{2025}=0.3×6.1%+0.7×5.4%=5.41%。3.(单选)在R语言中,执行以下代码后,对象x的维度是set.seed(6)x<-array(rpois(48,lambda=3),dim=c(4,6,2))A.4×6×2 B.2×6×4 C.6×4×2 D.4×2×6答案:A解析:array函数按dim参数顺序设定维度,故为4行6列2层。4.(单选)若随机变量X~N(μ,σ²),则E(e^X)等于A.e^{μ+σ²/2} B.e^{μ−σ²/2} C.e^{μ+σ} D.e^{μ}答案:A解析:利用矩母函数,E(e^{tX})=exp(μt+σ²t²/2),令t=1即得。5.(单选)对某二项分布B(n,p)进行假设检验,H₀:p=0.35,H₁:p>0.35。若n=200,样本比例p̂=0.42,则Z统计量值为A.2.07 B.2.17 C.2.27 D.2.37答案:C解析:Z=(p̂−p₀)/√(p₀(1−p₀)/n)=(0.42−0.35)/√(0.35×0.65/200)=0.07/0.0308≈2.27。6.(单选)某县2025年人口出生率为7.1‰,死亡率为6.4‰,迁入率1.8‰,迁出率1.2‰,则该县人口自然增长率为A.0.7‰ B.1.3‰ C.1.5‰ D.2.5‰答案:A解析:自然增长率=出生率−死亡率=7.1‰−6.4‰=0.7‰。7.(单选)对一组右偏数据取对数后,其偏态系数将A.增大 B.不变 C.减小 D.先增后减答案:C解析:对数变换可压缩右侧长尾,降低偏态。8.(单选)在Excel2025中,若单元格A1:A365存放2025年每日销售额,欲计算移动平均跨度为7天且居中对齐,可输入A.=AVERAGE(OFFSET(A1,−3,0,7,1)) B.=AVERAGE(A1:A7) C.=AVERAGE(A1:A3,A5:A7) D.=AVERAGE(A1:A365)/7答案:A解析:OFFSET以当前行为基准上下偏移,−3表示向前取3日,共7日居中。9.(单选)若X,Y独立且均服从Exp(λ),则P(X<Y)等于A.λ/(λ+1) B.1/2 C.λ² D.1/λ答案:B解析:由对称性,独立同分布连续变量P(X<Y)=1/2。10.(单选)某调查采用“二阶段抽样”,第一阶段抽村,第二阶段抽户,最终权重应为A.设计权重×无回答调整×事后分层调整 B.仅设计权重 C.仅事后分层 D.仅无回答调整答案:A解析:复杂抽样需综合设计权重、无回答校正及事后分层校准。11.(单选)在Pythonpandas中,将DataFramedf的缺失值用各列中位数填充,正确写法是A.df.fillna(df.median()) B.df.fillna(df.mean()) C.df.dropna() D.df.median().fillna(df)答案:A解析:df.median()返回各列中位数Series,fillna按列对齐填充。12.(单选)若回归模型存在异方差,OLS估计量仍具有A.无偏性 B.有效性 C.一致性 D.正态性答案:A解析:异方差下OLS仍无偏,但非有效,标准误需稳健修正。13.(单选)某企业2025年营业收入120亿元,统计误报为102亿元,则相对误差为A.−15% B.−18% C.15% D.18%答案:A解析:相对误差=(102−120)/120=−15%。14.(单选)对某时间序列建立ARIMA(1,1,1)模型,若AR特征根为0.65,MA特征根为−0.4,则模型平稳可逆条件A.满足 B.AR不满足 C.MA不满足 D.均不满足答案:A解析:|0.65|<1,|−0.4|<1,满足平稳与可逆。15.(单选)在假设检验中,若显著性水平α由0.05降至0.01,则置信区间宽度将A.变宽 B.变窄 C.不变 D.先宽后窄答案:A解析:α减小,临界值增大,区间变宽。16.(单选)对某森林蓄积量采用系统抽样,以遥感网格为起点,每隔5km布设样地,若总体呈明显梯度变化,则估计方差可能A.高估 B.低估 C.无偏 D.等于简单随机答案:B解析:系统抽样在梯度总体中样本高度相关,导致方差低估。17.(单选)若随机变量X~Bin(10,0.2),则其峰度为A.2.68 B.3.00 C.3.32 D.3.64答案:A解析:二项分布峰度=3+(1−6p(1−p))/(np(1−p))=3+(1−6×0.16)/(1.6)=2.68。18.(单选)在Excel中,若B2=DATE(2025,11,31)将返回A.2025/12/1 B.2025/11/30 C.#NUM! D.2025/11/31答案:A解析:Excel自动进位,11月仅30天,31日转为12月1日。19.(单选)对某变量进行Johnson−Su变换后,其偏度最接近A.0 B.1 C.−1 D.无法确定答案:A解析:Johnson族变换目标即实现近似正态,偏度趋0。20.(单选)某调查问卷采用“随机化回答技术”估计敏感比例,若随机抽取60%受访者回答敏感问题,其余回答无关问题,最终“是”比例0.42,无关问题“是”概率0.3,则敏感比例估计为A.0.50 B.0.55 C.0.60 D.0.65答案:B解析:设敏感比例π,则0.42=0.6π+0.4×0.3,解得π=0.55。21.(多选)下列属于“大数据5V”特征的有A.Volume B.Velocity C.Variety D.Veracity E.Value答案:ABCDE解析:5V即体量、速度、多样性、真实性、价值。22.(多选)关于抽样分布,以下说法正确的有A.样本均值标准误随n增大而减小 B.t分布比标准正态尾部更厚 C.卡方分布为对称分布 D.F分布取值非负 E.中心极限定理要求总体正态答案:ABD解析:卡方非对称;CLT不要求总体正态。23.(多选)在R中,下列可生成100行2列且服从N(0,1)随机数的代码有A.matrix(rnorm(200),100,2) B.array(rnorm(200),dim=c(100,2)) C.data.frame(V1=rnorm(100),V2=rnorm(100)) D.cbind(rnorm(100),rnorm(100))答案:ABCD解析:四种写法均正确生成所需结构。24.(多选)若回归模型含虚拟变量,且基准组为“农村”,则下列可能导致虚拟变量陷阱的有A.同时引入“城镇”“农村”二值变量 B.引入“城镇”并省略截距 C.引入“东部”“中部”“西部”并保留截距 D.引入“东部”“中部”并省略截距答案:AC解析:A、C出现完全共线。25.(多选)关于季节调整,下列说法正确的有A.X-13-ARIMA-SEATS基于ARIMA模型 B.TRAMO/SEATS可处理闰年 C.移动平均法可消除任意季节 D.季节调整后的序列仍含趋势 E.春节效应需专用回归变量答案:ABDE解析:移动平均法对春节等移动假日无效。26.(多选)下列属于非概率抽样方法的有A.便利抽样 B.判断抽样 C.配额抽样 D.雪球抽样 E.系统抽样答案:ABCD解析:系统抽样属概率抽样。27.(多选)在Excel中,可用于计算Spearman秩相关系数的函数组合有A.CORREL(RANK.AVG(),RANK.AVG()) B.SPEARMAN() C.PERCENTRANK.EXC() D.LINEST() E.无直接函数答案:AE解析:Excel无内置SPEARMAN,需手动排秩后求Pearson。28.(多选)关于Bootstrap,下列正确的有A.可估计中位数标准误 B.要求总体正态 C.可用于构建置信区间 D.重采样次数通常≥1000 E.对极值估计效果差答案:ACD解析:Bootstrap不依赖分布假设,极值估计需特殊技巧。29.(多选)若时间序列存在结构突变,可采用A.Chow检验 B.QLR检验 C.单位根检验 D.状态空间模型 E.季节差分答案:ABD解析:单位根检验不直接检测突变;季节差分无关。30.(多选)下列指标满足“时间可逆”性质的有A.几何平均收益率 B.算术平均收益率 C.对数收益率 D.调和平均数 E.绝对离差答案:AC解析:几何与对数收益率乘积顺序可逆。31.(判断)在简单随机抽样下,样本均值的方差与总体大小N无关。答案:错误解析:有限总体修正因子(N−n)/(N−1)显示与N有关。32.(判断)若两变量相关系数为0,则必然独立。答案:错误解析:相关为零仅说明无线性相关,非独立。33.(判断)对泊松过程,事件间隔时间服从指数分布。答案:正确解析:泊松过程间隔时间为i.i.d.指数。34.(判断)在Excel中,函数MODE.SNGL可返回多个众数。答案:错误解析:MODE.SNGL仅返回单一众数,MODE.MULT可返回多个。35.(判断)当自变量存在测量误差时,OLS估计量一定低估回归系数。答案:错误解析:经典误差下OLS趋于衰减,但非绝对。36.(判断)对右删失数据,Kaplan-Meier估计可给出生存函数。答案:正确解析:KM法专用于右删失。37.(判断)若模型R²=0.92,则模型必定不存在遗漏变量。答案:错误解析:R²高仍可能遗漏变量,只要遗漏变量与现有变量相关弱。38.(判断)在R中,运行sample(1:10,5,replace=FALSE)可能返回33579。答案:错误解析:replace=FALSE保证无重复。39.(判断)对分类变量采用One-Hot编码后,各列之和为1。答案:正确解析:每行仅一个1,其余0。40.(判断)若随机变量X~U(0,1),则−2lnX服从χ²(2)。答案:正确解析:−2lnX=χ²(2)为标准结论。41.(填空)某调查采用“捕获-再捕获”方法,第一次标记320尾鱼,第二次捕获400尾,其中标记80尾,则总体数量估计为________。答案:1600解析:N̂=(M×C)/R=(320×400)/80=1600。42.(填空)若X~N(3,4),则P(X²<16)=________(保留两位小数)。答案:0.91解析:X²<16⇔−4<X<4,Z₁=(−4−3)/2=−3.5,Z₂=(4−3)/2=0.5,查表得Φ(0.5)−Φ(−3.5)=0.6915−0.0002=0.6913,但X~N(3,4)即σ=2,故P=Φ(0.5)−Φ(−3.5)=0.6915−0.0002=0.6913,再校正双侧,实际应为P(|X|<4)=P(−1<Z<0.5)=0.6915−0.1587=0.5328,但题意X²<16即−4<X<4,故直接计算得0.6915−0.0002=0.6913≈0.69,但精确计算:P(X<4)=Φ(0.5)=0.6915,P(X<−4)=Φ(−3.5)=0.0002,差值0.6913,保留两位0.69。43.(填空)某企业2025年营业收入环比增速为8%,若2026年仍保持该速度,则两年累计增长率为________%。答案:16.64解析:(1+0.08)²−1=0.1664。44.(填空)在R中,执行sum(dbinom(0:10,10,0.5))的结果为________。答案:1解析:dbinom求和即累积概率,总为1。45.(填空)若回归模型y=β₀+β₁x+ε,已知β̂₁=2.5,se(β̂₁)=0.8,样本量n=36,则在5%显著性水平下,β₁的置信区间为________(保留两位小数)。答案:(0.88,4.12)解析:t₀.₀₂₅,₃₄≈2.032,2.5±2.032×0.8→(0.88,4.12)。46.(填空)某市2025年末常住人口为680万人,城镇化率75%,则城镇人口为________万人。答案:510解析:680×0.75=510。47.(填空)若X~Geo(p),则E(X)=________。答案:1/p解析:几何分布期望为1/p。48.(填空)在Excel中,将文本“2025/3/15”转为日期序列值的函数为________。答案:DATEVALUE解析:DATEVALUE专司文本转序列。49.(填空)对某变量进行Box-Cox变换,若λ=0,则实际变换为________。答案:对数变换解析:λ→0时退化为ln(x)。50.(填空)若随机变量X~Bin(20,0.3),则其众数为________。答案:6解析:[(n+1)p]=[6.3]=6。51.(综合)某电商平台欲估计2025年“双11”当日人均客单价,采用两阶段抽样:第一阶段从全国仓库中简单随机抽取30个仓库,第二阶段在每个抽中仓库内按订单时间系统抽取100单。已知数据如下:仓库i:123…30订单量M_i:500062004800…5500样本均值ȳ_i:412380395…402样本方差s_i²:250036002800…3200(1)估计全国人均客单价Ȳ;(2)计算Ȳ的标准误;(3)若要求相对误差不超过5%,置信水平95%,求需追加的最小样本仓库数(假定第二阶段样本量不变)。答案与解析:(1)两阶段抽样均值估计:Ȳ=(∑M_iȳ_i)/(∑M_i)先算分子:∑M_iȳ_i=5000×412+6200×380+…+5500×402=18420000∑M_i=5000+6200+…+5500=165000Ȳ=18420000/165000=396.36元(2)标准误公式:se(Ȳ)=√[(1−f₁)s_b²/(nM̄²)+(1−f₂)∑M_i²s_i²/(nmM̄²)]其中f₁=n/N=30/500=0.06(假设全国500仓库),f₂=m/M_i≈100/5000=0.02,M̄=165000/30=5500s_b²=∑M_i²(ȳ_i−Ȳ)²/(n−1)=1.28×10¹¹代入得se(Ȳ)=√[0.94×1.28×10¹¹/(30×5500²)+0.98×∑(M_i²s_i²)/(30×100×5500²)]计算第二项:∑M_i²s_i²=5000²×2500+…=2.75×10¹¹合并得se(Ȳ)=√[13.3+8.2]=√21.5=4.64元(3)相对误差限0.05×396.36=19.82,由se(Ȳ)∝1/√n,得n′=n×(4.64/19.82)²=30×0.055=1.65,即至少需追加仓库数:向上取整(1.65−30)不合理,应反推总仓库数:由se=19.82/1.96=10.11,解方程得n≥(4.64×√30/10.11)²=4.7,故总仓库至少5,已抽30,无需追加,但原se=4.64,需se≤19.82/1.96=10.11,当前se=4.64<10.11,已满足。故追加0。52.(综合)某市交通部门记录2025年工作日早高峰(7:00—9:00)通过某大桥的车流速度(km/h),样本量n=200,得平均速度x̄=28.5,标准差s=8.4。假设速度服从正态分布。(1)求95%置信区间;(2)若希望区间宽度不超过2km/h,求所需样本量;(3)现测得周一速度独立同分布,若连续5天样本均值低于26km/h,求该事件概率(假定总体参数不变)。答案与解析:(1)t₀.₀₂₅,₁₉₉=1.972,区间=28.5±1.972×8.4/√200=28.5±1.17→(27.33,29.67)km/h(2)宽度=2×z×σ/√n≤2,取z=1.96,σ=8.4,解得n≥(1.96×8.4)²=68.9,即69。(3)样本均值分布N(28.5,8.4²/5),P(x̄<26)=Φ((26−28.5)/(8.4/√5))=Φ(−0.66)=0.2546。53.(综合)某省2025年开展住户收支调查,采用分层PPS抽样,共抽中1200户。经数据清洗后获得如下信息:层h:123层权W_h:0.40.350.25样本量n_h:480420300人均可支配收入ȳ_h:3.24.15.0万元样本方差s_h²:0.640.811.00(1)估计全省人均可支配收入Ȳ;(2)计算Ȳ的标准误;(3)若层2样本量不足,拟追加样本,使各层样本量与层规模成比例,总样本量不变,求层2需追加户数。答案与解析:(1)Ȳ=∑W_hȳ_h=0.4×3.2+0.35×4.1+0.25×5.0=3.995万元(2)se(Ȳ)=√∑W_h²s_h²/n_h=√(0.4²×0.64/480+0.35²×0.81/420+0.25²×1/300)=√(0.000213+0.000236+0.000208)=0.028万元(3)原比例n_h∝W_h,层2理论样本量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 职业健康促进医疗安全风险防范
- 《老年衰弱门诊服务规范》编制说明
- 黑龙江2025年黑龙江省中医药科学院招聘99人笔试历年参考题库附带答案详解
- 长沙2025年湖南长沙麓山外国语实验中学编外合同制教师招聘29人笔试历年参考题库附带答案详解
- 职业倦怠的神经内分泌标志物与心理支持
- 通化2025年吉林通化师范学院招聘笔试历年参考题库附带答案详解
- 眉山2025年四川眉山彭山区招聘教育类高层次专业技术人才19人笔试历年参考题库附带答案详解
- 渭南2025年陕西渭南高新区选调紧缺学科专任教师25人笔试历年参考题库附带答案详解
- 济宁山东济宁市教育局北湖度假区分局所属事业单位引进急需紧缺教师25人笔试历年参考题库附带答案详解
- 江西2025年江西豫章师范学院招聘专职辅导员和专职思政课教师13人笔试历年参考题库附带答案详解
- AQT 1089-2020 煤矿加固煤岩体用高分子材料
- JJG596-2012电子式交流电能表
- 定安海恒槟榔产业有限公司槟榔初加工项目 环评报告
- 如何系统评价和整合医学文献中的数据与证据
- 中国泌尿外科围手术期血栓预防与管理专家共识
- 南京梅山冶金发展有限公司梅山铁矿矿山地质环境保护与土地复垦方案
- 2022公务员录用体检操作手册(试行)
- 吸声材料和吸声结构
- 特气系统安全操作规范方案
- GB/T 25724-2017公共安全视频监控数字视音频编解码技术要求
- GB/T 11060.8-2020天然气含硫化合物的测定第8部分:用紫外荧光光度法测定总硫含量
评论
0/150
提交评论