版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计期末试题题库(附答案)1.(单选)某市调查1000名居民的月网购支出,记录“0元”“1–500元”“501–1000元”“1000元以上”四档,该变量属于A.数值型连续变量B.数值型离散变量C.有序分类变量D.无序分类变量答案:C解析:虽然原始金额是数值,但调查时进行了分段并赋予顺序,因此属于有序分类变量。2.(单选)为估计某高校学生平均每日刷手机时间,随机抽取36人,得样本均值200min,标准差60min。若要求95%置信区间宽度不超过20min,至少应追加多少人?A.52B.139C.196D.554答案:B解析:宽度=2×z×s/√n≤20,z₀.₀₂₅=1.96,解得n≥(2×1.96×60/20)²≈138.3,向上取整139。3.(单选)下列关于p值的陈述正确的是A.p值是原假设为真的概率B.p值越小,样本量一定越大C.p值<α时,拒绝原假设可能犯第一类错误D.p值与效应量大小成正比答案:C解析:p值是“在原假设成立下获得当前或更极端结果”的概率;拒绝时可能犯第一类错误,其概率被α控制。4.(单选)对同一批数据分别做线性回归y=β₀+β₁x与对数回归lny=β₀+β₁x,若两模型的R²分别为0.81与0.85,则A.可直接比较R²说明对数模型更好B.需将对数模型R²换算为y尺度后再比较C.线性模型一定解释力更高D.两个R²含义相同答案:B解析:因变量尺度不同,R²不可直接比较,需用“换算后的y尺度R²”或交叉验证误差。5.(单选)在单因素方差分析中,若F统计量=0,则A.组间平方和为0B.组内平方和为0C.各组样本均值相等D.各组总体均值相等答案:A解析:F=MSB/MSW,若F=0则MSB=0,即组间平方和为0,说明样本均值全相等。6.(单选)设X~N(μ,σ²),σ未知,n=16,检验H₀:μ=μ₀,若采用t检验,显著性水平α=0.05,则拒绝域为A.|t|>1.753B.|t|>2.131C.|t|>2.602D.|t|>1.746答案:B解析:自由度15,双侧临界值t₀.₀₂₅,15=2.131。7.(单选)对某2×2列联表做卡方检验,得χ²=6.25,则Cramér’sV为A.0.25B.0.50C.0.177D.0.354答案:D解析:V=√(χ²/(n×min(r-1,c-1))),此处min=1,若n=50,则V=√(6.25/50)=0.354。8.(单选)在时间序列加法模型Y=T+S+C+I中,若采用移动平均法估计T,则季节成分S一般用A.原始减TB.原始减T再平均C.原始减T再平均后做中心化处理D.原始除T答案:C解析:加法模型中S=Y−T−C−I,实际估计时先对Y−T按季节平均,再使各季节和为0。9.(单选)若随机变量X的期望存在,则A.其方差一定存在B.其中位数一定等于期望C.其所有阶矩都存在D.其方差不一定存在答案:D解析:期望存在仅要求一阶绝对矩有限,方差涉及二阶矩,可不存在,如柯西分布。10.(单选)Bootstrap置信区间的“百分位法”是指A.用正态近似求区间B.用bootstrap标准误乘t临界值C.直接用bootstrap抽样分布的α/2与1−α/2分位数D.对bootstrap均值做偏差校正答案:C解析:百分位法直接取bootstrap统计量的经验分位数,无需正态假设。11.(单选)在多元线性回归中,若某自变量xₖ的VIF=10,则A.该变量一定不显著B.该变量系数符号一定错误C.存在严重多重共线性D.应直接删除该变量答案:C解析:VIF=10说明1/(1−R²ₖ)=10,即该变量与其他变量复相关R²=0.9,共线严重,但未必需删除。12.(单选)对同一数据做K均值与层次聚类,若K均值SSE=120,层次聚类SSE=150,则A.K均值结果一定更优B.层次聚类结果一定更优C.仅说明K均值在SSE准则下更好D.SSE不可比较答案:C解析:SSE是K均值目标函数,层次聚类不直接最小化SSE,不能直接比“优劣”。13.(单选)设X₁,…,Xₙi.i.d.来自U(0,θ),则θ的矩估计为A.2X̄B.max(Xᵢ)C.min(Xᵢ)D.X̄答案:A解析:E(X)=θ/2,令X̄=θ̂/2,得θ̂=2X̄。14.(单选)在贝叶斯框架中,若先验为Beta(2,2),似然为二项分布Bin(n=10,x=3),则后验均值为A.0.3B.0.333C.0.375D.0.4答案:C解析:后验Beta(2+3,2+7)=Beta(5,9),均值5/(5+9)=0.357≈0.375(四舍五入)。15.(单选)若某指数平滑模型α=0.8,则A.对历史数据衰减较慢B.对最近观测权重高C.等价于简单移动平均D.平滑序列方差一定减小答案:B解析:α大则权重集中在最近,衰减快。16.(单选)在分类问题中,ROC曲线下面积AUC=0.85表示A.随机抽一个正类得分高于负类的概率0.85B.准确率85%C.召回率85%D.F1值0.85答案:A解析:AUC定义即为该概率。17.(单选)对泊松过程,单位时间事件数λ的MLE为A.样本中位数B.样本均值C.样本众数D.样本方差答案:B解析:泊松均值=λ,MLE=样本均值。18.(单选)若两变量秩相关系数ρₛ=0,则A.两变量独立B.两变量无线性相关C.两变量无单调关系D.两变量无斯皮尔曼单调关系答案:D解析:ρₛ=0仅说明无单调关系,不排除非单调关联。19.(单选)在正态总体方差已知时,关于均值μ的检验,若n增大,则A.第二类错误概率一定增大B.检验功效一定减小C.第一类错误概率不变D.置信区间宽度一定增大答案:C解析:α由研究者设定,不随n变;功效增大,区间变窄。20.(单选)对某数据集做主成分分析,第一主成分方差贡献率45%,第二主成分25%,则前两个主成分累计贡献率A.45%B.70%C.25%D.无法计算答案:B解析:45%+25%=70%。21.(多选)下列哪些方法可用于检验正态性A.Shapiro-Wilk检验B.Kolmogorov-Smirnov检验C.Q-Q图D.Anderson-Darling检验E.Levene检验答案:A,B,C,D解析:Levene检验用于方差齐性,不检验正态。22.(多选)关于多重比较校正,正确的有A.Bonferroni法控制族错误率B.FDR法比Bonferroni更宽松C.TukeyHSD适用于所有两两比较D.Scheffe法可用于任意线性对比E.不校正时第一类错误率膨胀答案:A,B,C,D,E解析:全对。23.(多选)下列属于非参数检验的有A.Mann-WhitneyUB.Kruskal-WallisC.Wilcoxon符号秩D.符号检验E.卡方独立性检验答案:A,B,C,D解析:卡方虽无分布假设,但通常归为列联表方法,非严格非参数。24.(多选)若随机变量X服从几何分布,则A.具有无记忆性B.期望为1/pC.方差为(1−p)/p²D.属于指数族E.其和服从负二项答案:A,B,C,D,E解析:几何分布是负二项r=1特例,和即负二项;属指数族;无记忆;期望方差如上。25.(多选)在线性回归中,若残差呈现“漏斗形”,则A.存在异方差B.可用加权最小二乘C.可用对数变换D.标准误估计有偏E.系数估计有偏答案:A,B,C,D解析:系数仍无偏,但标准误错,t检验失效。26.(填空)设X~N(0,1),则E(|X|)=____。答案:√(2/π)解析:利用积分∫₀^∞xφ(x)dx=1/√(2π)。27.(填空)若样本偏度为0,峰度为3,则该分布最接近____分布。答案:正态解析:正态偏度0峰度3。28.(填空)对某AR(1)模型Xₜ=0.7Xₜ₋₁+εₜ,其平稳方差为____(εₜ~iidN(0,1))。答案:1/(1−0.7²)=1/0.51≈1.9608解析:Var(X)=σ²/(1−φ²)。29.(填空)若Logistic回归系数β₁=0.8,则x每增加1单位,优势比变为原____倍。答案:e^0.8≈2.2255解析:OR=e^β。30.(填空)对某样本n=100,样本比例p̂=0.15,则其99%置信区间半宽为____(保留三位小数)。答案:2.576×√(0.15×0.85/100)=0.092解析:z₀.₀₀₅=2.576。31.(计算)某工厂两台机器生产同型号零件,分别抽取n₁=50,n₂=60,测得平均长度120mm与122mm,样本标准差分别为4mm与5mm。假定方差不相等,试在α=0.05下检验两台机器是否显著差异,并求均值差的95%置信区间。答案:t=(120−122)/√(4²/50+5²/60)=−2.309,df≈103.9,|t|>1.983,拒绝H₀。差值−2±1.983×√(16/50+25/60)=−2±1.983×0.896=−2±1.777→(−3.777,−0.223)mm。32.(计算)对某完全随机设计,四组样本量均为8,组均值分别为10,12,15,18,组内平方和480,试完成方差分析表并给出结论(α=0.01)。答案:SSB=8×[(10−13.75)²+(12−13.75)²+(15−13.75)²+(18−13.75)²]=8×24.75=198,SST=198+480=678,dfB=3,dfW=28,MSB=66,MSW=17.14,F=3.85,F₀.₀₁,3,28≈4.57,3.85<4.57,不拒绝,尚不能认为四组均值不同。33.(计算)某连锁超市记录10家门店促销前后一周销售额(万元)如下:门店:12345678910前:30283540293231333436后:33303842313534363739试用非参数方法检验促销是否有效(α=0.05)。答案:取差值:3,2,3,2,2,3,3,3,3,3,符号检验正符号10/10,p=2×(0.5)^10=0.00195<0.05,拒绝,促销显著有效。34.(计算)设X₁,…,Xₙ来自密度f(x)=θx^{θ−1},0<x<1,θ>0,求θ的MLE及其渐近方差。答案:L=θⁿ∏xᵢ^{θ−1},lnL=nlnθ+(θ−1)∑lnxᵢ,令导数得θ̂=−n/∑lnxᵢ,I(θ)=n/θ²,渐近方差θ²/n。35.(计算)对某2×3列联表,卡方独立性检验得χ²=12.5,n=200,求列联系数C与Cramér’sV,并解释。答案:C=√(χ²/(n+χ²))=√(12.5/212.5)=0.242,V=√(12.5/(200×1))=0.25,二者均显示中等强度关联。36.(综合)某电商想预测日销量Y,收集30天数据,变量:x₁=广告费(万元),x₂=周末虚拟(0/1),x₃=促销强度(1–5)。用最小二乘得:Ŷ=50+12x₁+30x₂+8x₃,R²=0.75,残差诊断:DW=1.8,残差Q-Q图基本直线,但x₁与x₃相关系数0.85。(1)解释系数12;(2)是否存在多重共线?如何改进?(3)若广告费增加1万元,周末且促销强度为4,销量变化?(4)给出DW=1.8的结论。答案:(1)控制其他变量,广告费每增1万元,日销量平均增12件。(2)x₁与x₃高相关,VIF可能高,存在共线;可中心化交互、主成分、岭回归或剔除一个。(3)ΔY=12×1+30×0+8×0=12件(仅广告效应)。(4)DW≈2无自相关,1.8接近2,尚不能认为存在显著自相关。37.(综合)某医学试验测量20名患者治疗前后血压,得平均差值−8mmHg,差值标准差10mmHg。(1)给出差值均值μd的95%置信区间;(2)若临床认为降低5mmHg才有效,请检验;(3)若n增至80,区间宽度如何变化?答案:(1)−8±2.093×10/√20=−8±4.68→(−12.68,−3.32);(2)H₀:μd=−5,t=(−8+5)/(10/√20)=−1.34,|t|<2.093,不拒绝,尚不能认为达到临床有效;(3)宽度与√n成反比,n×4,宽度/2,新宽≈2.34。38.(综合)设X~Exp(λ),Y~Exp(μ)独立,求P(X<Y)。答案:P(X<Y)=∫₀^∞∫x^∞λe^{−λx}μe^{−μy}dydx=λ/(λ+μ)。39.(综合)对某数据集做K均值聚类,K从2到8,绘制“肘部图”发现SSE下降缓慢,且silhouette均值在K=3时最大0.55,K=4时0.54,K=5时0.52,请给出建议并说明理由。答案:选K=3;silhouette最高且肘部图无显著下降,兼顾解释性与聚类质量。40.(综合)某质量控制图设置X̄图,中心线50,标准差2,n=5,试计算3σ上下控制限,并说明若连续7点同侧是否报警。答案:UCL=50+3×2/√5=52.68,LCL=47.32;连续7点同侧为典型“游程”准则,应报警,提示过程可能偏移。41.(证明)设X₁,…,Xₙi.i.d.N(μ,σ²),证明样本方差S²是σ²的无偏估计。答案:E(S²)=E(1/(n−1)∑(Xᵢ−X̄)²)=σ²,经典结论,利用E(∑(Xᵢ−X̄)²)=(n−1)σ²。42.(证明)对简单线性回归yᵢ=β₀+β₁xᵢ+εᵢ,证明β₁的OLS估计可写为β̂₁=∑(xᵢ−x̄)(yᵢ−ȳ)/∑(xᵢ−x̄)²。答案:最小化RSS,对β₁求导并令0即得。43.(软件应用)用R语言写一段代码:生成1000个服从N(3,4)的随机数,绘制直方图并叠加密度曲线,计算95%置信区间。答案:set.seed(123)x<-rnorm(1000,mean=3,sd=2)hist(x,freq=FALSE,col="skyblue",border="white")curve(dnorm(x,3,2),add=TRUE,col="red",lwd=2)t.test(x)$44.(软件应用)用Python完成:对iris数据做PCA,输出解释方差比,并绘制前两个主成分散点图,颜色按品种区分。答案:importseabornassnsfromsklearn.decompositionimportPCAimportmatplotlib.pyplotaspltiris=sns.load_dataset('iris')X=iris.drop('species',axis=1)pca=PCA(n_components=2)X2=pca.fit_transform(X)print(pca.explained_variance_ratio_)plt.scatter(X2[:,0],X2[:,1],c=iris.species.astype('category').cat.codes)plt.show()45.(案例)某市交通部门想评估限行政策对PM2.5的影响,收集政策前后各40天数据,已知前后平均浓度差−5μg/m³,标准差差值12μg/m³,但数据呈右偏。(1)应选t检验还是非参数?(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基础化工行业专题:东升西落全球化工竞争格局的重塑
- 宏观经济专题:美联储主席换届交易指南
- 赣州2025年江西师大附中赣江院分校紧急考核招聘高层次人才教师21人笔试历年参考题库附带答案详解
- 舟山浙江舟山市普陀海洋产业研究中心招聘紧缺高端人才笔试历年参考题库附带答案详解
- 白城2025年吉林白城市通榆县事业单位面向下半年应征入伍高校毕业生招聘笔试历年参考题库附带答案详解
- 泰安2025年山东泰安新泰市农业农村局招募特聘农技员笔试历年参考题库附带答案详解
- 榆林2025年陕西榆林市绥德县招聘学科教师15人笔试历年参考题库附带答案详解
- 无锡2025年江苏无锡市妇幼保健院编外人员招聘13人(第三批)笔试历年参考题库附带答案详解
- 德宏2025年云南德宏瑞丽市公安局招录公安辅警45人笔试历年参考题库附带答案详解
- 山西2025年山西药科职业学院招聘博士研究生笔试历年参考题库附带答案详解
- 清欠历史旧账协议书
- 临床创新驱动下高效型护理查房模式-Rounds护士查房模式及总结展望
- 乙肝疫苗接种培训
- 2025年江苏省苏州市中考数学模拟试卷(含答案)
- GB/T 45133-2025气体分析混合气体组成的测定基于单点和两点校准的比较法
- 食品代加工业务合同样本(版)
- 北京市行业用水定额汇编(2024年版)
- 安全生产应急平台体系及专业应急救援队伍建设项目可行性研究报告
- 中国传统美食饺子历史起源民俗象征意义介绍课件
- 医疗器械样品检验管理制度
- 中建“大商务”管理实施方案
评论
0/150
提交评论