版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河北大学2026年《统计学导论》期末试题A卷及答案一、单项选择题(每题2分,共20分。每题只有一个正确答案,请将正确选项的字母填入括号内)1.某市调查居民月平均收入,随机抽取400户,样本均值为8200元,标准差为1200元。若将置信水平从90%提高到99%,则置信区间的宽度将()。A.缩小为原来的一半B.扩大为原来的1.5倍C.扩大为原来的1.65/1.96倍D.扩大为原来的2.58/1.65倍答案:D解析:90%对应z=1.65,99%对应z=2.58,宽度与z值成正比,故宽度扩大2.58/1.65≈1.56倍。2.在简单线性回归模型y=β₀+β₁x+ε中,若ε满足E(ε)=0、Var(ε)=σ²,则下列说法正确的是()。A.β₁的最小二乘估计量一定无偏B.σ²的无偏估计量为SSE/(n-1)C.当x与ε相关时,β₁的估计仍无偏D.β₀的估计量方差与x的均值无关答案:A解析:高斯-马尔可夫定理保证在经典假设下OLS估计量无偏;B应为SSE/(n-2);C若x与ε相关则产生内生性问题,估计有偏;Dβ₀的方差公式含x̄。3.设X~N(μ,σ²),样本容量n=25,σ未知。检验H₀:μ=μ₀vsH₁:μ≠μ₀,显著性水平α=0.05,则拒绝域为()。A.|t|>1.711B.|t|>2.064C.|t|>2.797D.|t|>1.96答案:B解析:n=25,自由度24,双侧α=0.05,查t分布表得临界值2.064。4.对同一总体进行两次独立抽样,样本量分别为n₁=100,n₂=150,样本比例分别为p̂₁=0.42,p̂₂=0.38。检验H₀:p₁=p₂,则合并比例p̄为()。A.0.40B.0.396C.0.398D.0.402答案:B解析:p̄=(100×0.42+150×0.38)/(100+150)=99/250=0.396。5.在方差分析中,若组间均方MSB=120,组内均方MSE=30,则F统计量值为()。A.4B.0.25C.150D.90答案:A解析:F=MSB/MSE=120/30=4。6.若随机变量X的偏度为-0.8,峰度为2.5,则下列描述正确的是()。A.分布右尾较长B.分布比正态峰更尖C.分布左尾较长D.分布为对称分布答案:C解析:偏度<0表示左尾较长;峰度<3表示比正态峰更平。7.在指数平滑预测中,平滑系数α=0.1,则对新观测值的权重是()。A.0.1B.0.9C.0.01D.0.19答案:A解析:指数平滑公式Fₜ₊₁=αyₜ+(1-α)Fₜ,新观测值权重即α。8.若两变量Pearson相关系数r=0.85,Spearman相关系数ρ=0.62,则最可能的原因是()。A.存在异常值B.两变量非线性关系C.两变量为等级数据D.样本量过小答案:B解析:Pearson高而Spearman低提示存在非线性单调关系或异常值,但异常值通常使两者皆降,非线性单调更合理。9.在多元回归中,若某解释变量VIF=8.5,则一般认为()。A.不存在多重共线性B.存在轻微多重共线性C.存在严重多重共线性D.模型设定错误答案:C解析:VIF>10为严重,5-10为中等偏高,8.5已需关注。10.对某时间序列进行ADF检验,得到τ=-3.42,对应1%临界值-3.58,5%临界值-2.93,则()。A.在1%水平拒绝单位根B.在5%水平拒绝单位根C.不能拒绝单位根D.序列平稳答案:B解析:-3.42<-2.93,故5%水平拒绝,1%水平不拒绝。二、多项选择题(每题3分,共15分。每题至少有两个正确答案,多选少选均不得分)11.下列关于抽样分布的陈述正确的有()。A.样本均值的抽样分布均值等于总体均值B.当总体非正态且n小时,样本均值分布仍近似正态C.样本比例的抽样分布可用正态近似当np≥5且n(1-p)≥5D.样本方差的抽样分布为卡方分布当总体正态E.t分布比标准正态分布尾部更厚答案:ACDE解析:B错,n小且总体非正态时,样本均值分布不一定近似正态。12.在假设检验中,下列做法能够同时降低第一类与第二类错误概率的有()。A.增大样本量B.降低显著性水平αC.提高检验功效D.使用更精确的测量工具E.采用单侧检验代替双侧答案:AD解析:增大n与降低测量误差可同时降低两类错误;降低α仅降低第一类;提高功效即降低第二类,但α固定时与第一类呈反向;单侧检验与两类错误无必然同时降低关系。13.关于卡方检验,下列说法正确的有()。A.拟合优度检验要求期望频数不小于5B.列联表检验自由度=(r-1)(c-1)C.卡方值越大越倾向于拒绝原假设D.可用于检验两个连续变量的独立性E.若样本量很大,轻微差异也可能显著答案:ABCE解析:D错,卡方检验用于分类变量。14.在构建置信区间时,下列哪些情况需使用t分布临界值()。A.总体正态,σ已知,n=15B.总体正态,σ未知,n=20C.总体非正态,σ未知,n=200D.总体非正态,σ已知,n=30E.总体正态,σ未知,n=8答案:BE解析:σ未知且总体正态小样本用t;大样本可用z近似;σ已知用z。15.下列属于非参数检验方法的有()。A.Wilcoxon符号秩检验B.Kruskal-Wallis检验C.Mann-WhitneyU检验D.Friedman检验E.Durbin-Watson检验答案:ABCD解析:E用于检验自相关,属参数诊断。三、判断题(每题1分,共10分。正确打“√”,错误打“×”)16.若随机变量X与Y独立,则E(XY)=E(X)E(Y)。(√)17.在简单随机抽样中,抽样误差大小与总体容量N无关。(×)18.当回归模型出现异方差时,OLS估计量仍是无偏但非有效。(√)19.若某序列自相关系数r₁=0.85,则可直接判定为非平稳。(×)20.对于同一数据,置信水平越高,置信区间越窄。(×)21.在假设检验中,p值>α时,我们接受原假设。(×)22.峰度大于3的分布称为尖峰分布。(√)23.若两变量存在完全线性关系,则Pearson相关系数绝对值为1。(√)24.贝叶斯推断中,后验概率与先验概率无关。(×)25.当样本量趋于无穷大时,样本均值的标准误趋于0。(√)四、简答题(每题8分,共24分)26.简述中心极限定理的内容及其在统计推断中的意义。答案:中心极限定理(CLT)指出,从任意均值为μ、方差为σ²的总体中抽取容量为n的随机样本,当n足够大时,样本均值的抽样分布近似服从均值为μ、方差为σ²/n的正态分布。其意义在于:(1)无需知道总体分布形态,只要n大,即可用正态近似进行概率计算;(2)为构建置信区间与假设检验提供理论依据,如z检验;(3)解释了为何许多自然、经济现象叠加后呈钟形分布;(4)使得大样本下线性估计量具有渐近正态性,便于推断。27.说明多重共线性对回归模型的影响,并给出两种诊断及两种解决方法。答案:影响:(1)OLS估计量仍无偏但方差增大,导致t值不显著;(2)系数符号可能违背经济理论;(3)模型对样本变化极度敏感,预测不稳定。诊断:(1)方差膨胀因子VIF>10;(2)特征值法,条件数>30。解决:(1)删除或合并高度相关变量;(2)采用岭回归、Lasso等正则化方法。28.比较简单随机抽样与分层随机抽样的优缺点。答案:简单随机抽样:优点:操作直观,理论成熟,估计量方差公式简单;缺点:若总体异质性强,精度低;抽样框要求完整。分层随机抽样:优点:按层内同质、层间异质划分,可提高估计精度;便于组织与管理;可对子总体进行推断;缺点:需完整辅助信息划分层;分层变量选择不当反增方差;估计量及其方差计算复杂。五、计算与综合题(共31分)29.(10分)某电商平台想评估新版推荐算法对日均销售额的提升效果。随机抽取10家店铺,记录算法上线前后各7天的日均销售额(万元),数据如下:店铺|上线前|上线后|差值d|---|---|---1|12.3|14.1|1.82|10.8|11.9|1.13|15.2|16.0|0.84|9.7|12.5|2.85|11.4|13.2|1.86|13.0|14.6|1.67|10.1|11.5|1.48|14.6|15.9|1.39|8.9|10.7|1.810|13.5|15.0|1.5假设差值服从正态分布,在α=0.05下检验算法是否显著提升销售额,并求平均提升量的95%置信区间。答案:(1)建立假设:H₀:μd=0,H₁:μd>0(单侧)(2)计算:d̄=1.59,sd=0.557,n=10t=d̄/(sd/√n)=1.59/(0.557/3.162)=9.03(3)临界值:t₀.₀₅(9)=1.833,9.03>1.833,拒绝H₀,算法显著提升销售额。(4)置信区间:d̄±t₀.₀₂₅(9)×sd/√n=1.59±2.262×0.176=(1.19,1.99)万元。30.(10分)某校研究学生每日手机使用时间(分钟)与期末成绩的关系,随机调查20名学生,得到:∑x=17400,∑y=1520,∑x²=15525000,∑y²=118600,∑xy=1294500(1)求样本相关系数r;(2)建立回归方程ŷ=a+bx;(3)检验H₀:β₁=0(α=0.01);(4)当x=90分钟时,预测y并给出95%预测区间。答案:(1)r=(n∑xy-∑x∑y)/√[(n∑x²-(∑x)²)(n∑y²-(∑y)²)]=(20×1294500-17400×1520)/√[(20×15525000-17400²)(20×118600-1520²)]=-0.837(2)b=(n∑xy-∑x∑y)/(n∑x²-(∑x)²)=-0.051,a=ȳ-bx̄=1520/20-(-0.051)×17400/20=76+44.37=120.37方程:ŷ=120.37-0.051x(3)SSE=∑(y-ŷ)²=118600-120.37×1520-(-0.051)×1294500=2054.3s²=SSE/(n-2)=114.1,sb=√(s²/(∑x²-(∑x)²/n))=0.0067t=b/sb=-7.61,|t|>t₀.₀₀₅(18)=2.878,拒绝H₀。(4)x₀=90,ŷ=120.37-0.051×90=115.78预测区间:ŷ±t₀.₀₂₅(18)×s√(1+1/n+(x₀-x̄)²/∑(x-x̄)²)x̄=870,∑(x-x̄)²=15525000-17400²/20=405000区间:115.78±2.101×10.68×√(1+0.05+0.0003)=(93.1,138.5)。31.(11分)某工厂有三条生产线A、B、C,记录一周各线产出不合格品数:生产线|合格|不合格|合计|---|---|---A|380|20|400B
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年人事考试中心培训考试及答案
- 2025年山东枣庄事业单位考试题及答案
- 2025年江苏事业编4月1号考试及答案
- 2025年博士计量和经济学笔试及答案
- 2025年移动政企项目交付经理岗位笔试及答案
- 2025年赣州市事业单位报名考试及答案
- 2025年美术特岗笔试考试知识点及答案
- 2025年行政岗位笔试简答题题库及答案
- 2025年河南大专老师招聘笔试题及答案
- 2025年南京高校思政教师笔试题及答案
- 2026中国电信四川公用信息产业有限责任公司社会成熟人才招聘备考题库带答案详解
- 2026云南大理州事业单位招聘48人参考题库必考题
- 《公共科目》军队文职考试新考纲题库详解(2026年)
- 2025至2030中国啤酒市场行业调研及市场前景预测评估报告
- 报警受理工作制度规范
- 嘉宾邀请合同书
- 多源信息融合驱动的配电网状态估计:技术革新与实践应用
- 华电集团企业介绍
- 2025年安徽省从村(社区)干部中录用乡镇(街道)机关公务员考试测试题及答案
- 2025年AI时代的技能伙伴报告:智能体、机器人与我们(英文版)
- 中国舞蹈知识常见考点测试卷
评论
0/150
提交评论