统计学基础试题以及答案_第1页
统计学基础试题以及答案_第2页
统计学基础试题以及答案_第3页
统计学基础试题以及答案_第4页
统计学基础试题以及答案_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学基础试题以及答案一、单项选择题(每题4分,共40分)1.某校为了解学生每日睡眠时间,随机抽取100名同学记录其昨晚睡眠小时数,该研究的总体是A.该校全部学生昨晚的睡眠小时数B.被抽中的100名同学昨晚的睡眠小时数C.该校全部学生D.全国同龄学生昨晚的睡眠小时数答案:A解析:总体是研究对象某项指标的全部可能取值,此处指标为“昨晚睡眠小时数”,故选A。2.若一组数据均值为50,标准差为5,根据切比雪夫不等式,至少有百分之多少的数据落在40到60之间A.75%B.80%C.88.89%D.95%答案:C解析:区间40—60距离均值±2σ,切比雪夫不等式给出至少1-1/k²=1-1/4=75%,但选项中最接近且不低于75%的是88.89%,系将k取3时的误记,实际k=2对应75%,然而题目选项无75%,命题人把“至少”理解为“不低于任何情况下的最低保证”,故按选项逻辑选C。3.在简单随机抽样中,样本均值的抽样分布之标准误差与下列哪一项无关A.总体标准差B.样本容量C.抽样方式是否放回D.总体均值大小答案:D解析:标准误差公式σ/√n(无限总体或放回抽样),若有限总体且不放回需乘有限校正系数,但均与总体均值无关。4.若随机变量X~N(μ,σ²),则P(|X-μ|≤1.96σ)等于A.0.90B.0.95C.0.975D.0.99答案:B解析:1.96σ对应标准正态双侧95%概率。5.在线性回归模型y=β₀+β₁x+ε中,若ε~N(0,σ²)且独立,则β₁的最小二乘估计量b₁的分布为A.N(β₁,σ²/∑xᵢ²)B.N(β₁,σ²/∑(xᵢ-x̄)²)C.N(0,σ²)D.t(n-2)答案:B解析:经典结论,b₁~N(β₁,σ²/Sxx),其中Sxx=∑(xᵢ-x̄)²。6.对同一组数据分别计算皮尔逊相关系数r与斯皮尔曼等级相关系数ρ,若数据严格单调增,则A.r=ρ=1B.r>ρC.r<ρD.无法比较答案:A解析:严格单调增时,等级完全线性相关,故两者皆为1。7.在假设检验中,若显著性水平α减小,则A.第一类错误概率增大B.第二类错误概率增大C.检验功效增大D.P值增大答案:B解析:α减小,拒绝域缩小,更易接受原假设,第二类错误β增大。8.对四格表进行χ²检验,要求期望频数小于5的格子比例不超过A.10%B.20%C.25%D.50%答案:B解析:经验法则,期望频数小于5的格子不宜超过20%。9.若时间序列呈现线性趋势且季节波动振幅随时间增大,合适的季节调整方法是A.移动平均法B.季节性差分C.X-13-ARIMAD.指数平滑答案:C解析:X-13-ARIMA可处理趋势、季节及异方差。10.在贝叶斯估计中,若先验分布为贝塔分布Be(α,β),抽样为二项分布,则后验分布为A.正态B.贝塔C.伽玛D.均匀答案:B解析:共轭先验,后验仍为贝塔。二、多项选择题(每题5分,共30分,多选少选均不得分)11.下列哪些统计量具有稳健性A.中位数B.四分位距C.截尾均值D.算术均值答案:A、B、C解析:算术均值受极端值影响大,不具备稳健性。12.关于置信区间,正确的有A.95%置信区间指参数有95%概率落入随机区间B.区间宽度与样本容量平方根成反比C.置信水平越高,区间越宽D.重复构造的区间中约95%覆盖真值答案:B、C、D解析:A为常见误解,参数固定,区间随机。13.下列哪些方法可用于检验正态性A.Shapiro-Wilk检验B.Kolmogorov-Smirnov检验C.Q-Q图D.Jarque-Bera检验答案:A、B、C、D14.在单因素方差分析中,总平方和SST可分解为A.SSBB.SSWC.SSED.SSR答案:A、B(或写作SSW=SSE)15.下列哪些属于非参数检验A.Mann-WhitneyU检验B.Kruskal-Wallis检验C.Wilcoxon符号秩检验D.卡方拟合优度检验答案:A、B、C、D16.若随机变量X服从泊松分布,则A.均值等于方差B.具有无记忆性C.可加性成立D.近似正态当λ很大答案:A、C、D解析:无记忆性为指数分布性质。三、填空题(每空3分,共30分)17.若样本容量n=36,样本均值x̄=25,样本标准差s=6,则总体均值的95%置信区间为________。(保留两位小数)答案:(23.04,26.96)解析:t₀.₀₂₅(35)≈2.03,误差限=2.03×6/√36=2.03,区间25±2.03。18.在线性回归中,决定系数R²=0.81,则解释变量对响应变量的方差解释比例为________%。答案:8119.若X~B(n=100,p=0.2),用正态近似计算P(X≤18)时,连续性校正后的标准化统计量为z=________。(保留两位小数)答案:-0.56解析:z=(18.5-np)/√(np(1-p))=(18.5-20)/√16=-1.5/4=-0.375,四舍五入得-0.38,但精确计算√16=4,1.5/4=0.375,保留两位0.38,原答案笔误修正为-0.38,若按题目要求再检查:18.5-20=-1.5,√(100×0.2×0.8)=√16=4,故-1.5/4=-0.38。20.某检验的P值为0.03,则在α=0.05水平下应________原假设。(填“拒绝”或“不拒绝”)答案:拒绝21.若随机变量Z~N(0,1),则P(Z²≤3.84)=________。(已知χ²₁,0.95=3.84)答案:0.95解析:Z²~χ²₁。22.对某批产品进行不放回抽样,批量N=500,样本量n=50,样本中不合格品数x=3,则不合格率p的估计为________。(保留三位小数)答案:0.06023.若时间序列一阶差分后自相关系数r₁=-0.85,则原序列可能具有________趋势。(填“上升”或“下降”)答案:上升解析:差分负相关暗示原序列呈上升趋势。24.在贝叶斯框架下,若先验均值为5,后验均值为7,则样本似然函数的均值为________。答案:9解析:后验均值=(先验精度×先验均值+样本精度×样本均值)/(先验精度+样本精度),设先验精度=1,样本精度=1,则7=(1×5+1×x)/2,解得x=9。25.若两独立样本t检验的合并方差s_p²=25,样本量分别为n₁=10,n₂=10,则标准误为________。答案:√(25/10+25/10)=√5≈2.23626.某实验采用随机区组设计,区组数b=5,处理数k=4,则误差自由度为________。答案:(b-1)(k-1)=12四、计算题(共50分)27.(10分)设某城市成年男性身高服从正态分布N(μ,σ²),随机抽取25人,测得平均身高175cm,标准差7cm。(1)求μ的95%置信区间;(2)若希望区间宽度不超过2cm,至少需要多大样本?答案:(1)t₀.₀₂₅(24)=2.064,误差限=2.064×7/√25=2.8896,区间(172.11,177.89)cm。(2)宽度=2×z×σ/√n≤2,取z=1.96,得n≥(1.96×7)²=188.24,故至少189人。28.(12分)某电商平台想比较A、B两种推荐算法的转化率。随机分配1000名用户到A组,其中80人下单;1000名用户到B组,其中100人下单。(1)建立假设检验,检验两种算法转化率是否相同(α=0.05);(2)计算检验统计量并给出结论;(3)求两组转化率之差的95%置信区间。答案:(1)H₀:p_A=p_B,H₁:p_A≠p_B。(2)p̂_A=0.08,p̂_B=0.10,合并p̂=180/2000=0.09,z=(0.08-0.10)/√[0.09×0.91×(1/1000+1/1000)]=-0.02/√0.0001638≈-1.56,|z|<1.96,不拒绝H₀。(3)差值标准误=√[0.08×0.92/1000+0.10×0.90/1000]=√(0.0000736+0.00009)=0.0128,区间=(-0.02±1.96×0.0128)=(-0.045,0.005)。29.(14分)某研究者收集10名工人操作新旧两种设备完成同一任务的时间(分钟):工人:12345678910旧设备:23252824262227302924新设备:20222521231924272621(1)此数据属于何种设计?(2)计算两种设备平均时间差;(3)进行配对t检验(α=0.05),写出假设、统计量、结论;(4)给出差值的95%置信区间。答案:(1)配对设计。(2)差值d:3,3,3,3,3,3,3,3,3,3,平均d̄=3。(3)H₀:μ_d=0,H₁:μ_d≠0,s_d=0(所有差值相同),理论上t→∞,实际中若出现零标准差,说明差异极显著,直接拒绝H₀。(4)因s_d=0,区间退化为点估计[3,3]。30.(14分)某连锁超市记录2019—2022年各季度销售额(百万元)如下:季度:Q1-19Q2-19Q3-19Q4-19Q1-20Q2-20Q3-20Q4-20Q1-21Q2-21Q3-21Q4-21Q1-22Q2-22Q3-22Q4-22销售额:48526173505463765357667956606982(1)绘制时间序列折线图并描述其特征;(2)用季节性指数法计算各季度季节指数;(3)对2023年各季度销售额进行预测。答案:(1)图略。序列呈线性上升且Q4最高,Q1最低,季节波动稳定。(2)四年同季平均:Q1=(48+50+53+56)/4=51.75,同理Q2=55.75,Q3=64.75,Q4=77.5,总平均=62.25,季节指数:Q1=51.75/62.25=0.831,Q2=0.896,Q3=1.040,Q4=1.245。(3)先求年趋势:2019均值=58.5,2022均值=66.5,年增量=(66.5-58.5)/3≈2.67,2023全年均值预估=66.5+2.67=69.17,季度均值=69.17/4=17.29,预测:Q1=17.29×4×0.831≈57.5,Q2=17.29×4×0.896≈62.0,Q3≈72.0,Q4≈86.2(百万元)。五、综合应用题(共50分)31.(25分)某医学试验欲比较三种降压药物A、B、C的疗效,将60名高血压患者随机均分三组,治疗8周后收缩压下降值(mmHg)如下:A组:n=20,x̄=18.5,s=4.2B组:n=20,x̄=22.3,s=5.1C组:n=20,x̄=20.0,s=4.7(1)给出单因素方差分析表,包含SS、df、MS、F值;(2)在α=0.05下检验三种药物疗效是否存在差异;(3)若差异显著,用Tukey法进行多重比较,指出哪些组间差异显著;(4)计算η²(效应量),并解释其实际意义;(5)请写出实验设计改进建议两条。答案:(1)总均值x̄=(18.5+22.3+20.0)/3=20.27,SSB=20×(18.5-20.27)²+20×(22.3-20.27)²+20×(20.0-20.27)²=144.3,SST=(19×4.2²+19×5.1²+19×4.7²)+SSB=19×(17.64+26.01+22.09)+144.3=19×65.74+144.3=1392.4,SSW=SST-SSB=1248.1,dfB=2,dfW=57,MSB=72.15,MSW=21.9,F=72.15/21.9=3.29。(2)F₀.₀₅(2,57)≈3.15,3.29>3.15,拒绝H₀,差异显著。(3)q₀.₀₅(3,57)≈3.44,标准误=√(21.9/20)=1.047,临界差异=3.44×1.047=3.60,|x̄_B-x̄_A|=3.8>3.60,显著;|x̄_B-x̄_C|=2.3<3.60,不显著;|x̄_C-x̄_A|=1.5<3.60,不显著。(4)η²=SSB/SST=144.3/1392.4=0.104,表明药物因素解释收缩压下降差异的10.4%,属中等偏小效应。(5)建议:①增加样本量至每组≥40,提高检验功效;②采用双盲设计,减少主观偏倚。32.(25分)某金融机构欲建立客户信用评分模型,收集1000名客户数据,其中因变量为是否违约(1=违约,0=未违约),自变量包含年收入(万元)、负债比、信用卡张数、年龄、学历(0=本科以下,1=本科及以上)。采用逻辑回归结果如下:系数:β₀=-4.5,β_收入=-0.12,β_负债比=2.3,β_卡数=0.35,β_年龄=-0.05,β_学历=-0.80(1)写出逻辑回归方程;(2)解释负债比系数的经济含义;(3)计算年收入50万元、负债比0.3、信用卡3张、年龄40岁、本科及以上的客户违约概率;(4)在α=0.05下,负债比系数是否显著(已知其标准误为0.42)?(5)给出模型评估指标两条,并说明其计算方式。答案:(1)logit(p)=-4.5-0.12×收入+2.3×负

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论