版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计法基础知识试题及参考答案一、单项选择题(每题2分,共30分)1.某市统计局欲了解居民网购支出,从全市300万户中按居委会规模大小排序后等距抽取60个居委会,再对抽中居委会全部住户进行调查。该抽样方法属于A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样答案:D解析:先以居委会为群单位进行等距抽取,再对群内全部单元调查,符合整群抽样定义。2.若总体容量N=1200,样本容量n=60,采用不重复简单随机抽样,样本均值的标准误约为总体标准差σ的A.0.083 B.0.089 C.0.095 D.0.102答案:B解析:标准误公式σ/√n·√(1−n/N)=σ/√60·√0.95≈σ/7.746·0.975≈0.089σ。3.在假设检验中,若显著性水平α由0.05降到0.01,则A.Ⅰ型错误概率减小,检验功效增大 B.Ⅰ型错误概率减小,检验功效减小C.Ⅰ型错误概率增大,Ⅱ型错误概率减小 D.Ⅰ型错误概率不变,Ⅱ型错误概率不变答案:B解析:α减小,拒绝域缩小,Ⅰ型错误概率下降;同时接受域扩大,Ⅱ型错误概率上升,检验功效1−β下降。4.对同一总体多次独立抽取容量为n的简单随机样本,则样本均值的分布A.随n增大趋于t分布 B.随n增大趋于正态分布 C.始终为正态分布 D.始终与总体分布相同答案:B解析:由中心极限定理,无论总体分布如何,只要n足够大,样本均值分布趋近正态。5.在回归模型Y=β₀+β₁X+ε中,若ε存在异方差,则OLS估计量A.有偏且非有效 B.无偏但非有效 C.有偏但有效 D.无偏且有效答案:B解析:异方差不影响无偏性,但使方差不再是最小,故OLS仍无偏却非有效。6.某指数数列以2015年为基期,2020年指数值为132,表示A.2020年比2015年增长了32% B.2020年比2015年增长了132%C.2020年是2015年的1.32倍 D.2020年比2015年增长了1.32个百分点答案:A解析:指数132即(报告期/基期)×100,故增长32%。7.若随机变量X服从参数为λ的泊松分布,则其期望与方差A.均为λ B.期望λ,方差λ² C.期望λ²,方差λ D.期望1/λ,方差1/λ²答案:A解析:泊松分布性质:E(X)=Var(X)=λ。8.对时间序列做移动平均法修匀,窗口宽度越大A.序列越光滑,滞后越弱 B.序列越光滑,滞后越强C.序列越波动,滞后越弱 D.序列越波动,滞后越强答案:B解析:宽窗口吸收更多波动,光滑度提高,但对转折点反应更迟缓,滞后增强。9.在方差分析中,若F统计量远大于1,则A.组间差异显著小于组内差异 B.组间差异显著大于组内差异C.各组均值相等 D.各组方差不相等答案:B解析:F=MSB/MSW,远大于1说明组间变异显著大于组内变异,拒绝原假设H₀:各组均值相等。10.若两变量X与Y的Pearson相关系数为−0.85,则A.X与Y无线性关系 B.X与Y存在强负线性关系C.X与Y存在强正线性关系 D.无法判断线性关系强度答案:B解析:|r|>0.8即强相关,符号负表示负向线性关系。11.在抽样调查中,设计效应(deff)A.一定小于1 B.一定大于1 C.等于1表示简单随机抽样效果 D.与样本量无关答案:C解析:deff=1说明复杂抽样方差与SRS相同;>1表示效率低于SRS;<1表示效率更高。12.对分类变量做卡方拟合优度检验,自由度为A.类别数 B.类别数−1 C.类别数+1 D.样本量−类别数答案:B解析:自由度=类别数−1−估计参数个数,拟合优度检验通常只减1。13.若某指标季节比率之和为400%,说明A.计算有误,应为100% B.季节波动剧烈 C.采用季度数据 D.采用月度数据答案:C解析:一年4季,比率基准100%×4=400%,故为季度数据。14.在质量控制图中,若点超出上控制限,则A.过程一定正常 B.过程一定异常 C.可能为Ⅰ型错误 D.可能为Ⅱ型错误答案:C解析:点出界小概率事件发生,可能过程真异常,也可能α=0.0027的Ⅰ型错误。15.对总体比例p做估计,若要求允许误差不超过0.03,置信水平95%,则所需样本量约为A.1068 B.1200 C.1500 D.2000答案:A解析:n=z²·p(1−p)/E²,取保守p=0.5,z=1.96,E=0.03,得n≈1.96²×0.25/0.0009≈1067.6,进位1068。二、多项选择题(每题3分,共30分)16.下列属于概率抽样方法的有A.简单随机抽样 B.便利抽样 C.分层抽样 D.系统抽样 E.雪球抽样答案:A、C、D解析:概率抽样要求每个单元入样概率可计算且非零,便利、雪球抽样属非概率抽样。17.关于置信区间,正确的有A.95%置信区间指参数有95%概率落入该区间 B.区间宽度与样本量平方根成反比C.置信水平越高,区间越宽 D.增大样本量可缩小区间 E.区间中心是样本统计量答案:B、C、D、E解析:A错,频率学派认为参数固定,区间随机,95%指重复构造区间有95%覆盖真值。18.下列哪些情况可能导致OLS估计量有偏A.遗漏重要变量且与包含变量相关 B.异方差 C.自相关 D.解释变量测量误差 E.模型函数形式设定错误答案:A、D、E解析:异方差、自相关不影响无偏,只影响有效;遗漏变量、测量误差、误设函数形式导致有偏。19.时间序列分解模型包括A.长期趋势 B.季节变动 C.循环波动 D.不规则波动 E.随机游走答案:A、B、C、D解析:经典四成分模型:趋势、季节、循环、不规则;随机游走属特殊过程非分解成分。20.下列关于偏度的说法正确的有A.偏度=0表示对称 B.偏度>0表示右偏 C.偏度<0表示左偏 D.偏度无量纲 E.偏度与峰度无关答案:A、B、C解析:偏度有量纲,单位与原始数据立方相同;偏度与峰度同为形状指标,但数学独立描述不同特征。21.在指数编制中,拉斯佩尔指数A.采用基期数量加权 B.采用报告期数量加权 C.可能高估生活成本 D.可能低估生活成本 E.满足传递性答案:A、C解析:拉斯佩尔用基期数量q₀加权,因忽略替代效应,通常高估成本;帕氏指数用报告期数量。22.下列属于离散型随机变量的有A.某网站日点击次数 B.电话呼叫间隔时间 C.一批产品不合格件数 D.电梯年故障次数 E.顾客排队等待时间答案:A、C、D解析:点击、不合格、故障次数皆可数,属离散;间隔、等待时间为连续。23.关于p值,正确的有A.p值是原假设为真时,得到当前或更极端样本的概率 B.p值越大越倾向于拒绝原假设C.p值小于α则拒绝原假设 D.p值与样本量无关 E.p值相同意味着证据强度相同答案:A、C解析:p值小拒绝H₀;p值受样本量影响,n越大,同样差异p值越小;相同p值不同n时证据强度不同。24.下列哪些统计图适用于展示分类数据A.条形图 B.饼图 C.帕累托图 D.箱线图 E.马赛克图答案:A、B、C、E解析:箱线图展示连续变量分布,其余皆可用于分类数据。25.在抽样误差公式中,与误差大小成正比的因素有A.总体方差 B.样本量 C.置信水平对应的z值 D.抽样比n/N E.总体容量N答案:A、C解析:误差∝z·σ/√n,与σ、z成正比;与√n成反比;有限总体修正项√(1−n/N)使误差略减,但非正比。三、判断题(每题1分,共10分)26.中位数对极端值比均值更敏感。答案:错解析:中位数仅与中间观测值有关,对极端值不敏感。27.若两变量协方差为0,则它们一定独立。答案:错解析:协方差为0仅表示无线性相关,非线性相关或依赖可能存在。28.在简单随机抽样中,样本均值是总体均值的无偏估计。答案:对解析:E(ȳ)=μ,为无偏估计。29.当样本量趋于无穷大时,t分布趋近标准正态分布。答案:对解析:t分布尾厚于正态,df→∞时与N(0,1)一致。30.若回归模型R²=0,说明解释变量与因变量无任何关系。答案:错解析:R²=0仅说明线性关系不存在,非线性关系可能存在。31.峰度大于3表示分布比正态峰更尖。答案:对解析:正态峰度=3,>3为尖峰,<3为平峰。32.在指数平滑法中,平滑系数α越接近1,历史数据权重下降越慢。答案:错解析:α→1时最新观测权重最大,历史权重下降最快。33.若置信区间不包含0,则对应假设检验在相同α下必拒绝H₀:μ=0。答案:对解析:区间与检验对偶,区间不含0即|t|>tα/2。34.非抽样误差可以通过增大样本量消除。答案:错解析:非抽样误差如测量、覆盖、无回答误差与n无关,需改进调查设计。35.卡方检验要求期望频数不小于5,否则需用Fisher精确检验。答案:对解析:期望频数<5时卡方近似不佳,宜用精确方法。四、计算与综合题(共80分)36.(15分)某厂生产袋装糖果,标准重量μ₀=500g。质检部门随机抽取25袋,测得平均重量ȳ=495g,样本标准差s=10g。假定重量服从正态分布。(1)在α=0.05下检验是否显著低于标准。(2)计算检验的p值并解释。(3)若要求检验功效在μ₁=490g时达到0.90,求所需样本量。解:(1)H₀:μ=500,H₁:μ<500,单尾t检验t=(ȳ−μ₀)/(s/√n)=(495−500)/(10/5)=−2.5df=24,t₀.₀₅=−1.711,t=−2.5<−1.711,拒绝H₀,显著低于标准。(2)p值=P(T₂₄≤−2.5),查t分布表得0.0096,p≈0.01,表明若H₀真,出现当前或更小样本均值的概率约1%,证据充分。(3)功效1−β=0.90,δ=|μ₁−μ₀|=10,σ≈s=10单尾公式n=[(zα+zβ)σ/δ]²,zα=1.645,zβ=1.28n=(1.645+1.28)²×100/100≈8.6²≈74,取75袋。37.(15分)某电商平台记录日访问量(万次)与促销费用(万元)数据如下:X:2 3 5 7 8 10Y:18 22 27 32 35 40(1)建立一元线性回归方程。(2)检验β₁是否显著(α=0.05)。(3)当X=12万元时,给出日均访问量的95%置信预测区间。解:n=6,ΣX=35,ΣY=174,ΣX²=247,ΣY²=5542,ΣXY=1235x̄=5.833,ȳ=29,Sxx=247−35²/6=42.833,Sxy=1235−35×174/6=220β̂₁=Sxy/Sxx=5.138,β̂₀=ȳ−β̂₁x̄=29−5.138×5.833≈−0.99方程:Ŷ=−0.99+5.138X(2)SSE=Σ(Y−Ŷ)²=5542−(−0.99)×174−5.138×1235=5542+172.26−6345.43≈368.83s²=MSE=SSE/(n−2)=368.83/4=92.21,s=9.60se(β̂₁)=s/√Sxx=9.60/√42.833≈1.467t=5.138/1.467≈3.50,df=4,t₀.₀₂₅=2.776,|t|>2.776,拒绝H₀:β₁=0,显著。(3)X₀=12,Ŷ₀=−0.99+5.138×12≈60.67预测标准误s_pred=s√[1+1/n+(X₀−x̄)²/Sxx]=9.60√[1+1/6+(12−5.833)²/42.833]=9.60√1.1667+0.889≈9.60√2.0557≈9.60×1.434≈13.77t₀.₀₂₅,4=2.776,区间:60.67±2.776×13.77≈60.67±38.23即[22.4,98.9]万次。38.(15分)某市调查居民网购支出,采用分层抽样,分高、中、低收入三层,数据如下:层 Nh Sh nh高 4000 3000 80中 10000 1800 120低 16000 1200 200(1)估计全市人均网购支出Ȳ及抽样标准误。(2)与同等样本量的简单随机抽样比较,计算设计效应。(3)若总费用固定为4万元,每层调查费用ch分别为200、150、100元,求Neyman最优分配。解:(1)层权重Wh:高0.1333,中0.3333,低0.5333层均值用样本均值代替(题中未给,假设ȳh:高8000,中5000,低3000元)Ȳ=ΣWhȳh=0.1333×8000+0.3333×5000+0.5333×3000=1066.4+1666.5+1599.9≈4333元层方差用Sh²Var(Ȳ)=ΣWh²(1−fh)Sh²/nhfh:高0.02,中0.012,低0.0125Var=0.1333²×0.98×9000000/80+0.3333²×0.988×3240000/120+0.5333²×0.9875×1440000/200=0.0178×110250+0.1111×26676+0.2844×7110≈1962+2964+2023≈6949标准误SE=√6949≈83.4元(2)SRS方差公式:Var_SRS=(1−n/N)S²/n先估总体方差S²=ΣWh[Sh²+(ȳh−Ȳ)²]计算得S²≈4560000,n=400,N=30000Var_SRS≈0.9867×4560000/400≈11250deff=Var_str/Var_SRS=6949/11250≈0.62,分层效率更高。(3)Neyman分配nh∝NhSh/√ch计算NhSh/√ch:高4000×3000/14.14≈848000,中10000×1800/12.25≈1469000,低16000×1200/10=1920000总和≈4237000费用约束Σchnh=40000,设比例k,则k(848000×200+1469000×150+1920000×100)=40000k≈40000/(1.696×10⁸+2.203×10⁸+1.92×10⁸)=40000/5.819×10⁸≈6.87×10⁻⁵nh:高≈848000×6.87×10⁻⁵≈58,中≈101,低≈132,总291,费用40000元。39.(15分)某连锁超市记录2018—2022年各季度销售额(百万元)如下:年份 Q1 Q2 Q3 Q42018 48 62 58 722019 52 68 63 782020 55 71 66 822021 58 75 70 862022 61 79 73 90(1)用移动平均法计算季节指数(中心化12项移动平均)。(2)剔除季节后,建立线性趋势方程并预测2023年Q4销售额。(3)计算预测值的95%置信区间(假设s=2.1百万元)。解:(1)先计算12项移动平均,再中心化,得趋势值T,则SI=Y/T,同季平均得季节指数,调整使平均为100。经计算:Q1指数≈88.2,Q2≈107.5,Q3≈100.3,Q4≈104.0。(2)剔除季节:Y_adj=Y/SI×100,得20个观测,对t=1…20做回归Σt=210,Σt²=2870,ΣY_adj=1428,ΣtY_adj=15426β̂₁=(15426−210×1428/20)/(2870−210²/20)=1632/665≈2.455β̂₀=71.4−2.455×10.5≈45.62趋势方程:Ŷ=45.62+2.455t2023Q4对应t=24,Ŷ=45.62+2.455×24≈104.54百万元还原季节
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 驻马店2025年河南驻马店市平舆县人民医院引进人才30人笔试历年参考题库附带答案详解
- 金华2025年浙江金华义乌市勘测设计研究院招聘笔试历年参考题库附带答案详解
- 职业健康与员工心理健康整合
- 舟山浙江舟山市普陀区桃花镇及下属单位工作人员招聘笔试历年参考题库附带答案详解
- 甘肃2025年甘肃财贸职业学院招聘博士研究生15人笔试历年参考题库附带答案详解
- 清远广东清远市第二中学临聘教师招聘笔试历年参考题库附带答案详解
- 毕节2025年贵州毕节市七星关区面向区内乡镇学校考调教师300人笔试历年参考题库附带答案详解
- 无锡2025年江苏无锡市中心血站招聘编外人员2人笔试历年参考题库附带答案详解
- 德宏2025年云南德宏州检察机关聘用制书记员考试招聘13人笔试历年参考题库附带答案详解
- 巴彦淖尔2025年内蒙古巴彦淖尔市五原县医疗卫生专业技术人员招聘22人笔试历年参考题库附带答案详解
- 压力性尿失禁教学课件
- 凝血六项课件
- 公路施工监理工作重点及难点分析
- 2025云南昆明公交集团招聘9人笔试历年备考题库附带答案详解2套试卷
- 雨课堂在线学堂《大数据技术与应用》作业单元考核答案
- 光伏电缆专业知识培训课件
- 养牛场消防知识培训
- 中好建造(安徽)科技有限公司招聘笔试题库2025
- 小儿体液不足的护理措施
- 管控人力成本课件
- 闸安全鉴定管理办法
评论
0/150
提交评论