版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年大学《统计学》专业题库及答案一、描述统计与数据可视化1.(单选)2023年某市人社局公布5000名应届本科毕业生起薪数据,其箱线图显示下须止于3.2万元,上须止于15.8万元,箱体内无异常点。若起薪服从右偏分布,则下列叙述正确的是A.均值一定小于中位数 B.均值一定大于中位数 C.箱体高度等于四分位距 D.上须长度等于1.5IQR答案:C2.(单选)某电商平台把连续30天的日GMV(百万元)绘制成茎叶图,其中茎单位为10,叶单位为1,发现“20|135”三片叶。若将数据同时乘以0.8再做对数变换ln(0.8x),则变换后数据的变异系数将A.增大 B.减小 C.不变 D.无法判断答案:C3.(填空)某高校统计学期末成绩服从对称分布,已知其众数为76分,中位数为78分,则依据经验关系,其皮尔逊偏度系数近似值为______。答案:–0.124.(计算)某城市地铁早高峰15个站点的进站量(万人次)如下:12.3 11.7 13.5 10.9 14.2 12.8 11.1 13.0 12.5 11.4 12.9 13.8 11.6 12.1 12.7要求:(1)用“2.5%修剪均值”估计平均进站量;(2)给出基于bootstrap(B=1000)的95%置信区间(百分位数法)。答案:(1)修剪后数据去掉最小0.375与最大0.375个观测,剩余13.25个,线性插值得12.42;(2)R语言模拟得[11.97,12.89](保留两位小数)。5.(综合)某医疗集团收集2021—2023年三年间共1095天的每日门诊量。(1)给出绘制日历热力的R代码框架(ggplot2);(2)若发现2月份门诊量存在明显周循环,请说明如何用LOESS分解得到季节成分,并写出检验周循环显著性的零假设。答案:(1)```rlibrary(ggplot2);library(lubridate)df$date<as.Date(df$date)df$yearWeek<week(df$date)df$weekday<wday(df$date,label=TRUE)ggplot(df,aes(x=weekday,y=yearWeek,fill=outpatient))+geom_tile(color="white")+facet_wrap(~year)+scale_fill_viridis_c()```(2)stl模型中s.window="periodic",零假设H0:每周7天系数相等。二、概率论基础与随机变量6.(单选)设X~U(–π/2,π/2),则Y=tan(X)的分布属于A.柯西 B.正态 C.对数正态 D.t分布答案:A7.(单选)若随机变量X的矩母函数为MX(t)=exp(λ(e^t–1)),则P(X≥1)等于A.1–e^(–λ) B.e^(–λ) C.λe^(–λ) D.1–λe^(–λ)答案:A8.(填空)设二维随机变量(X,Y)的联合密度f(x,y)=2,0≤x≤y≤1,则E(X|Y=0.5)=______。答案:0.259.(证明)设Z1,Z2i.i.d.N(0,1),证明X=Z1/Z2服从标准柯西分布,并写出其特征函数。答案:令U=Z1,V=Z2,联合密度f(u,v)=1/(2π)exp[–(u²+v²)/2]。做变换x=u/v,y=v,雅可比|J|=|y|,边缘密度fX(x)=∫–∞^∞|y|·1/(2π)exp[–y²(1+x²)/2]dy=1/(π(1+x²)),即柯西。特征函数φX(t)=E[e^(itX)]=exp(–|t|)。10.(应用)某型号LED寿命T(千小时)服从Gamma(α=3,β=2)。(1)求P(T>6);(2)若工厂对每件产品给出6千小时保修,求100件中至少5件在保修期内失效的概率(用泊松近似)。答案:(1)P(T>6)=1–F(6;3,2)=1–0.938=0.062;(2)λ=100×0.062=6.2,P(N≥5)=1–P(N≤4)=1–0.150=0.850。三、抽样分布与参数估计11.(单选)从N(μ,σ²)中抽取n=16,若σ²未知,则(Ẋ–μ)/(S/4)的分布为A.t15 B.t16 C.χ²15 D.N(0,1)答案:A12.(单选)设总体概率函数f(x;θ)=θx^(θ–1),0<x<1,θ>0,则θ的费雪信息量为A.1/θ² B.θ² C.1/θ D.–1/θ²答案:A13.(计算)某市欲估计共享单车日均故障率p,预调查得p̂=0.15。若要求估计绝对误差不超过0.02,置信水平95%,求所需样本量;若总体有限N=5000,请做有限总体校正。答案:n0=Z²p(1–p)/E²=1.96²×0.15×0.85/0.02²≈1936;n=n0/(1+n0/N)=1936/(1+1936/5000)≈1394。14.(综合)设X1,…,Xn来自LogNormal(μ,σ²),但仅记录是否超过阈值c,得Yi=I(Xi>c)。(1)给出基于Yi的μ矩估计方程;(2)讨论当c未知时如何利用EM算法迭代。答案:(1)E[Yi]=P(Xi>c)=1–Φ((lnc–μ)/σ),令样本比例p̂等于理论概率,解μ̂=lnc–σΦ⁻¹(1–p̂);(2)E步:用当前μ(t),σ²(t)计算Wi=E[lnXi|Yi=1或0];M步:对完整数据最大化似然,更新μ(t+1),σ²(t+1)。四、假设检验与方差分析15.(单选)在单因素ANOVA中,若组内平方和SSE=240,组间平方和SSA=60,则F统计量值为A.0.25 B.4 C.0.2 D.3答案:B16.(单选)对两独立正态总体均值差做检验,若n1=n2=10,方差未知但假定相等,则合并方差Sp²的自由度为A.20 B.19 C.18 D.9答案:C17.(计算)某制药公司比较三种降压药A,B,C的舒张压降幅,随机区组设计,10名患者,数据如下(单位mmHg):患者1:A11B13C15…患者10:A9B12C14已知SST=1020,SSB(患者)=380,SSE=330。(1)完成ANOVA表;(2)在α=0.05下检验药物效应是否显著;(3)若显著,用TukeyHSD给出两两差异95%同时置信区间。答案:(1)来源 SS df MS F药物 610 2 305 16.72患者 380 9 42.22误差 330 18 18.33(2)F=16.72>F0.05(2,18)=3.55,拒绝H0;(3)临界值q0.05(3,18)=3.61,标准误√(18.33/10)=1.354,HSD=3.61×1.354=4.89。区间:AB:[–6.89,–0.11]AC:[–8.89,–2.11]BC:[–6.89,–0.11]均不含0,差异显著。18.(综合)某质检部门欲检验饮料容量标准差是否超过标称σ0=5mL,随机抽取n=25瓶,测得样本标准差s=6.2mL。(1)写出假设;(2)计算检验统计量并给出p值;(3)若真实σ=6.5mL,求检验功效(α=0.05)。答案:(1)H0:σ²≤25vsH1:σ²>25;(2)χ²=(n–1)s²/σ0²=24×38.44/25=36.86,p=0.047;(3)临界值χ²0.95,24=36.42,功效=P(χ²>36.42|σ=6.5)=P(χ²>36.42×25/42.25)=P(χ²>21.55)=0.66。五、回归分析与模型诊断19.(单选)在多元线性回归中,若某自变量VIF=8.5,则其方差膨胀原因是A.与因变量高度相关 B.与其他自变量高度多重共线 C.异方差 D.自相关答案:B20.(单选)对模型y=β0+β1x1+β2x2+ε,若加入与x1完全线性相关的x3,则设计矩阵X’X的秩为A.n B.p+1 C.p D.p–1答案:D21.(计算)某数据集n=50,建立y对x1,x2的回归,得SSR=880,SSE=120,R²=0.88。(1)给出整体F检验统计量;(2)若x1系数t值为–3.5,求其偏Eta平方;(3)当新增x3后R²增至0.90,检验x3贡献是否显著(α=0.05)。答案:(1)F=(SSR/p)/(SSE/(n–p–1))=(880/2)/(120/47)=172.67;(2)偏Eta²=t²/(t²+df)=12.25/(12.25+47)=0.207;(3)ΔR²=0.02,F=(0.02/1)/(0.10/46)=9.2>F0.05(1,46)=4.05,显著。22.(综合)某城市交通流量模型取对数线性形式lnY=β0+β1lnX1+β2X2+ε,其中X1为人口密度,X2为01dummy(是否限行)。(1)若存在异方差且方差与X1²成比例,写出加权最小二乘权重;(2)限行政策效果估计为β̂2=–0.21,标准误0.08,求弹性解释;(3)用BreuschPagan检验异方差,给出R辅助代码。答案:(1)wi=1/X1²;(2)限行使平均流量下降约19%(=1–e^(–0.21));(3)```rlibrary(lmtest)bptest(lm(lnY~lnX1+X2),varformula=~X1^2,studentize=TRUE)```六、时间序列与预测23.(单选)对于ARIMA(1,1,1)模型,其自相关函数ρk在k≥2满足A.指数衰减 B.截尾 C.正弦衰减 D.线性衰减答案:A24.(单选)若某序列{xt}经ADF检验得τ=–2.8,5%临界值–2.9,则A.拒绝单位根 B.不拒绝单位根 C.序列平稳 D.无法判断答案:B25.(计算)某电商平台2019—2023年季度销售额(亿元)呈现明显季节峰值在Q4。建立SARIMA(0,1,1)(0,1,1)4模型,估计得θ=0.6,Θ=0.8,残差方差σ̂²=4。(1)写出模型方程;(2)已知2023Q4实际值42,模型一步预测值40,求2024Q1销售额的95%预测区间;(3)若2024Q1真实值出炉为45,计算其预测误差滚动MAPE(历史20期)。答案:(1)∇∇4xt=(1–0.6B)(1–0.8B⁴)εt;(2)预测值l=40–0.6×2–0.8×2=37.2,区间37.2±1.96×2=[33.28,41.12];(3)新增误差|45–37.2|=7.8,MAPE=(∑|et|/xt)/20更新为8.3%。26.(综合)某能源研究院收集2000—2023年月度风电发电量,共288期。(1)给出用Prophet模型捕捉年度与月度季节性的核心方程;(2)若发现节假日效应使发电量平均下降8%,写出假日组分κ(t)的构造;(3)讨论当残差呈现ARCH效应时,如何升级至GARCHProhet混合模型。答案:(1)y(t)=g(t)+s(t)+h(t)+εt,其中s(t)用傅里叶级数,P=12;(2)κ(t)=–0.08·I(t∈Holiday);(3)在模型残差εt上建立GARCH(1,1),再用条件方差调整预测区间:σ²t=ω+αε²t–1+βσ²t–1。七、贝叶斯统计与MCMC27.(单选)若X~Bin(n,θ),取θ~Beta(α,β),则后验均值为A.(α+x)/(α+β+n) B.x/n C.α/(α+β) D.(α+x)/(α+β)答案:A28.(单选)在MetropolisHastings算法中,若提议分布对称,则接受概率简化为A.min(1,π(θ)/π(θ)) B.min(1,π(θ)/π(θ)) C.1 D.0答案:A29.(计算)某罕见病患病率θ的先验为Beta(2,100),现筛查n=5000人,发现阳性x=8。(1)求θ的后验分布与95%可信区间;(2)计算后验预测分布下,再筛查m=1000人出现k≥3例阳性的概率。答案:(1)后验θ~Beta(10,5092),均值0.00196,95%CI=[0.00096,0.00356];(2)预测分布为Beta二项,P(k≥3)=1–P(k≤2)=0.323。30.(综合)对分层模型yij~N(μ+αi,σ²),αi~N(0,τ²),i=1…10,j=1…5。(1)写出联合后验p(μ,α,σ²,τ²|y);(2)设计Gibbs采样步骤,给
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025云南大理洱源县医共体邓川分院招聘编外人员1人考试备考题库及答案解析
- 幼儿园教师面试考核内容与评分标准
- 农村环境提升工程项目施工方案
- 市场营销经理面试题及参考答复
- 2025山东昌乐北大公学美加学校教师招聘备考笔试试题及答案解析
- 岳阳专利检索课件
- 通信行业技术面试题及答案解析
- 出版社财务经理面试题及答案
- 华为消费者产品体验与质量管理经理面试题目
- 广州建筑给排水工程师继续教育考试题库含答案
- 2025江苏南通轨道交通集团有限公司运营分公司招聘40人备考笔试题库及答案解析
- 贵州国企招聘:2025贵州锦麟化工有限责任公司第三次招聘7人考试题库附答案
- 2025年华医网医学继续教育抗菌药物临床应用原则试题及答案
- 诈骗退款协议书范本
- 统编版五年级上册习作 我想对您说 教学课件
- 2025年度校长述职报告:守正中求变用心办好这所“小而美”的学校
- 2026陕西西安市延长石油(集团)有限责任公司高校毕业生招聘(公共基础知识)综合能力测试题附答案解析
- 国开电大《11192,11657高层建筑施工》期末答题库(机考字纸考)排序版
- 内蒙古自治区行政执法人员招聘笔试真题2024
- 2025甘肃省水务投资集团有限公司招聘企业管理人员笔试考试参考题库及答案解析
- 美容店退股合同协议书
评论
0/150
提交评论