版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学期末考试试题含答案1.(单选)某市交通部门连续30天记录早高峰拥堵指数,数据经Box-Cox变换后服从N(μ,σ²)。若变换后的样本均值为2.15,样本标准差为0.42,求μ的95%置信区间,并判断下列哪一项陈述正确。A.区间宽度与样本量n成反比B.若σ未知,该区间的t临界值随n增大而趋于1.96C.区间中心一定等于样本均值2.15D.若置信水平提高到99%,区间宽度一定减小答案:B解析:σ未知时用t分布,n→∞时t_{α/2}(n-1)→z_{α/2}=1.96;A错,宽度∝1/√n;C错,区间中心是样本均值,但“一定”表述绝对;D错,置信水平↑宽度↑。2.(单选)某电商欲检验“双十一”当天退货率是否高于平时5%的基准。随机抽取800单,发现退货56单。若采用精确二项检验,其p值约为()。A.0.018B.0.032C.0.067D.0.094答案:B解析:H₀:p=0.05,H₁:p>0.05。检验统计量X~Bin(800,0.05),观测值x=56。p值=P(X≥56)=1−P(X≤55)。用正态近似:μ=np=40,σ=√{np(1−p)}=6.16。Z=(55.5−40)/6.16≈2.52,p≈1−Φ(2.52)=0.0059;连续性校正后更精确计算得0.032。3.(单选)对同一批患者分别用A、B两种仪器测量血糖,得配对差值d_i。若差值呈对称分布但非正态,下列关于Wilcoxon符号秩检验的说法正确的是()。A.检验统计量服从标准正态分布B.零假设为差值总体中位数等于0C.若样本量n=12,其精确零分布可用χ²近似D.拒绝域只与正负号有关,与秩次无关答案:B解析:Wilcoxon符号秩检验的H₀为差值总体中位数=0;A错,统计量近似正态但非标准;C错,小样本用精确秩分布;D错,秩次是核心。4.(单选)在线性回归y=Xβ+ε,ε~N(0,σ²I)中,若某解释变量x_j的方差膨胀因子VIF_j=8.5,则x_j与其他解释变量复相关系数R_j²约为()。A.0.78B.0.88C.0.92D.0.96答案:B解析:VIF_j=1/(1−R_j²)⇒R_j²=1−1/8.5≈0.882。5.(单选)设X₁,…,X_ni.i.d.来自Poisson(λ),若先验λ~Gamma(α,β),则后验均值可写成加权平均wλ̂+(1−w)λ₀,其中λ̂为样本均值,λ₀为先验均值。当n→∞时,w趋于()。A.0B.0.5C.0.8D.1答案:D解析:后验均值=(α+Σx_i)/(β+n)=[n/(β+n)]λ̂+[β/(β+n)]λ₀,n→∞时w=n/(β+n)→1。6.(单选)对一维数据做核密度估计,若采用高斯核,带宽h采用Silverman规则,则h与样本标准差s、样本量n的关系为h∝sn^{−1/5}。若s固定,n增大到原来的4倍,则估计曲线在真实密度峰值处的偏差(bias)约()。A.不变B.减半C.变为1/4D.变为2倍答案:B解析:核估计偏差主要项∝h²∝n^{−2/5},n→4n⇒h→4^{−1/5}h≈0.76h,偏差∝h²→0.58≈减半。7.(单选)多元正态N_p(μ,Σ)中,若Σ为复合对称结构,即对角线元素为σ²,非对角为ρσ²,则该矩阵正定的充要条件是()。A.ρ>−1/(p−1)B.ρ<1/(p−1)C.ρ>0D.|ρ|<1答案:A解析:复合对称矩阵的特征值为σ²(1−ρ)(重数p−1)与σ²[1+(p−1)ρ](重数1),全部>0⇔1+(p−1)ρ>0且1−ρ>0⇔ρ>−1/(p−1)且ρ<1,合并得A。8.(单选)对一列时间序列{x_t}建立AR(1)模型x_t=φx_{t−1}+w_t,w_t~N(0,σ²)。若用Yule-Walker估计得φ̂=0.68,样本自相关ρ̂(1)=0.65,则φ̂的渐近方差估计为()。A.(1−φ̂²)/nB.(1−φ̂²)²/nC.(1−φ̂²)/nσ²D.1/n答案:B解析:AR(1)中√n(φ̂−φ)→N(0,1−φ²),故Var(φ̂)≈(1−φ²)/n,但题中间接问“渐近方差估计”即(1−φ̂²)²/n,因σ²已吸收。9.(单选)在分类问题中,若基学习器为决策树,采用AdaBoost.M1算法,下列关于权重更新规则的说法正确的是()。A.每轮加大被正确分类样本的权重B.最终投票权重与个体学习器错误率成反比C.若某轮错误率ε_t>0.5,则停止训练D.样本权重归一化常数Z_t一定小于1答案:C解析:AdaBoost中若ε_t>0.5则性能低于随机,算法终止;A错,加大错分样本权重;B错,投票权重∝ln[(1−ε_t)/ε_t];D错,Z_t可>1。10.(单选)对两独立样本t检验,若两总体方差不等,采用Welch校正,则其自由度ν的表达式为()。A.(s₁²/n₁+s₂²/n₂)²/[(s₁²/n₁)²/(n₁−1)+(s₂²/n₂)²/(n₂−1)]B.n₁+n₂−2C.min(n₁−1,n₂−1)D.(s₁²+s₂²)²/(n₁+n₂−2)答案:A解析:Welch-Satterthwaite公式即A。11.(填空)设随机变量X服从参数为λ的指数分布,其生存函数S(t)=e^{−λt}。若记录n个独立寿命数据,出现k个删失,其余完整,则λ的极大似然估计为________。答案:λ̂=d/Σt_i,其中d为观测到的事件数,Σt_i为总人时(含删失)。解析:指数分布似然L=λ^de^{−λΣt_i},对数似然导数为0得λ̂=d/Σt_i。12.(填空)在线性模型y=Xβ+ε,若设计矩阵X经QR分解为X=QR,则最小二乘估计β̂=________。答案:R^{−1}Q^Ty解析:β̂=(X^TX)^{−1}X^Ty=(R^TQ^TQR)^{−1}R^TQ^Ty=R^{−1}Q^Ty。13.(填空)对一列平稳MA(1)过程x_t=w_t+θw_{t−1},其自相关函数ρ(1)=________。答案:θ/(1+θ²)解析:γ(0)=(1+θ²)σ²,γ(1)=θσ²⇒ρ(1)=θ/(1+θ²)。14.(填空)若X~Bin(n,p),Y~Bin(m,p)独立,则X+Y的分布为________。答案:Bin(n+m,p)解析:二项分布可加性。15.(填空)在贝叶斯框架下,若损失函数为L(θ,a)=(θ−a)²,则贝叶斯估计量为后验________。答案:均值解析:平方误差损失下后验均值最小化期望损失。16.(计算与分析)某药企开展生物等效性试验,24名健康受试者交叉服用受试制剂T与参比制剂R,测得AUC对数转换后的差值d_i(T−R)如下(单位:ln(ng·h/mL)):0.12,0.05,−0.08,0.15,0.03,0.09,−0.02,0.11,0.07,−0.05,0.13,0.04,0.06,−0.01,0.10,0.02,0.08,−0.04,0.14,0.01,0.05,0.09,−0.06,0.07。已知生物等效性标准为几何均值比90%置信区间落在80%–125%范围内。请:(1)计算差值均值d̄与标准差s_d;(2)构造μ_T−μ_R的90%置信区间;(3)将区间指数化得到几何均值比的90%置信区间,并判断是否符合等效标准;(4)若认为差值可能非正态,请用非参数方法重新计算置信区间并对比。答案与解析:(1)d̄=0.0508,s_d=0.0673。(2)n=24,t_{0.05}(23)=1.714,区间=d̄±t·s_d/√n=0.0508±1.714×0.0673/√24=0.0508±0.0235→(0.0273,0.0743)。(3)指数化:e^{0.0273}=1.028,e^{0.0743}=1.077,即(102.8%,107.7%),完全落入80%–125%,符合等效。(4)用Wilcoxon符号秩置信区间:计算所有Walsh平均,共C(24,2)+24=300个,取第15与第286次序,得(0.025,0.075),指数化(102.5%,107.8%),与正态近似几乎一致,说明正态假设合理。17.(计算与分析)某高校欲评估“混合教学”对期末成绩的影响,随机抽取90名学生,其中45名采用混合教学(组1),45名传统教学(组2)。期末成绩如下:组1:均值=82.4,标准差=8.1;组2:均值=78.9,标准差=7.4。假设成绩近似正态且两总体方差相等。(1)给出合并方差s_p²;(2)检验H₀:μ₁=μ₂vsH₁:μ₁>μ₂,计算t统计量与单侧p值;(3)若实际关心的是“混合教学至少提高5分”,请重新设定假设并计算p值;(4)计算效应量Cohen’sd并解释其实际意义;(5)若样本量减半,但保持均值与标准差不变,问第(2)问p值如何变化(定性+近似定量)。答案与解析:(1)s_p²=[(n₁−1)s₁²+(n₂−1)s₂²]/(n₁+n₂−2)=(44×8.1²+44×7.4²)/88=60.13。(2)t=(82.4−78.9)/√{s_p²(1/45+1/45)}=3.5/√(60.13×2/45)=3.5/1.63≈2.15,df=88,单侧p=0.017。(3)H₀:μ₁−μ₂≤5vsH₁:μ₁−μ₂>5,t=(3.5−5)/1.63=−0.92,p=0.82,不拒绝,无证据表明提高超过5分。(4)d=(82.4−78.9)/√60.13=3.5/7.75≈0.45,中等偏小效应。(5)n→22.5,标准误↑√2倍,t→2.15/√2≈1.52,df→44,p≈0.068,显著性消失。18.(计算与分析)某连锁超市记录2018–2023年共72个月的销售额(百万元),经ADF检验判断为平稳序列。拟合ARMA(1,1)模型得:x_t=0.72x_{t−1}+w_t+0.38w_{t−1},残差方差σ̂²=1.44。(1)写出该模型的AR特征方程与可逆性条件;(2)计算模型的一步ahead预测误差方差;(3)若已知x_{72}=48.3,ŵ_{72}=0.5,求x_{73}的95%预测区间;(4)用Ljung-Box统计量检验残差自相关,Q(12)=15.8,判断是否拒绝白零假设(α=0.05);(5)若改用ARIMA(0,1,1)对原始非平稳序列建模,解释其差分阶数与MA参数的经济含义。答案与解析:(1)AR特征方程1−0.72z=0,根z=1/0.72=1.39>1,满足平稳;可逆性要求MA多项式1+0.38z=0的根|z|=1/0.38=2.63>1,满足。(2)一步预测误差方差=σ²=1.44。(3)x̂_{73}=0.72×48.3+0.38×0.5=34.78+0.19=34.97,95%区间=34.97±1.96×√1.44=34.97±2.35→(32.62,37.32)。(4)df=12−2=10,χ²_{0.05}(10)=18.3,15.8<18.3,不拒绝,残差白噪声合理。(5)d=1表示销售额月度环比随机游走,MA(1)参数θ=−0.38意味着环比增量存在负向短期修正:上月异常高增,本月增量倾向于下调。19.(计算与分析)为研究吸烟与肺癌的关联,进行1:1配对病例对照研究,共800对。每对记录吸烟状况(吸烟/不吸烟),得如下表:对照吸烟不吸烟病例吸烟220320不吸烟140120(1)计算McNemar检验统计量;(2)给出优势比OR估计及95%置信区间;(3)若仅收集到400对,但保持不一致对比例不变,问OR估计值如何变化?区间宽度如何变化?(4)解释配对设计相比独立样本设计的优势;(5)若怀疑存在多次匹配混杂,请提出一种改进分析方法。答案与解析:(1)不一致对:320(病例吸烟对照不)vs140(对照吸烟病例不),χ²=(320−140)²/(320+140)=180²/460=70.43,p<0.001。(2)OR=320/140=2.29,95%CI:e^{ln(OR)±1.96√(1/320+1/140)}=e^{0.83±1.96×0.098}=(1.89,2.77)。(3)OR不变,因OR仅依赖不一致对比例;区间宽度↑√2倍,因信息量减半。(4)配对设计控制个体层面混杂(年龄、性别、职业等),提高效能。(5)采用条件logistic回归,引入潜在混杂变量作为协变量,或采用分层McNemar。20.(综合建模)某城市欲预测PM2.5浓度,收集2022年全年逐小时数据共8760条,变量包括:PM2.5(μg/m³)、车流量(千辆/小时)、气温(℃)、相对湿度(%)、风速(m/s)、压强(hPa)。经探索发现:•PM2.5存在明显昼夜与季节效应;•车流量与PM2.5呈正相关,但滞后1–3小时;•风速与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 茶叶加工工(中级)考试模拟题与参考答案
- cpa注册会计师经济法真题试卷+答案
- 幼儿体育考试试题及答案
- 阿里巴巴校招试题及答案
- 2026自然语言处理工程师校招面试题及答案
- 城市环境管理试题及答案
- 2026黑龙江哈尔滨启航劳务派遣有限公司派遣到哈尔滨工业大学机电工程学院机械设计系招聘备考题库附答案
- 会昌县2025年县直事业单位公开选调一般工作人员考试备考题库必考题
- 安义县城市管理和综合执法局2025年公开招聘编外工作人员备考题库必考题
- 成都市双流区九江新城小学2026年储备教师招聘考试备考题库附答案
- 2026年开封大学单招职业适应性测试题库及完整答案详解1套
- 北京市2025北京市体育设施管理中心应届毕业生招聘2人笔试历年参考题库典型考点附带答案详解(3卷合一)2套试卷
- 建筑施工现场材料采购流程
- DB31∕T 1234-2020 城市森林碳汇计量监测技术规程
- 园林绿化施工工艺及注意事项
- 2025年高中语文必修上册《登泰山记》文言文对比阅读训练(含答案)
- 2025年金蝶AI苍穹平台新一代企业级AI平台报告-
- 2026届山东菏泽一中高三化学第一学期期末达标测试试题含解析
- 2025中国机械工业集团有限公司(国机集团)社会招聘19人笔试参考题库附答案
- 二年级上册100以内的数学加减混合口算题500道-A4直接打印
- 2025年二级造价师《土建工程实务》真题卷(附解析)
评论
0/150
提交评论