版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学试题含答案1.单选题(每题2分,共30分)1.1某市连续5年监测居民饮用水砷含量,数据呈明显右偏分布,且存在5个大于国标3倍的极端值。若欲描述该监测数据的集中趋势,首选指标是A.算术均数 B.几何均数 C.中位数 D.截尾均数答案:C解析:右偏分布且含极端值时,算术均数会被拉向高端;几何均数仅适用于正数且近似对数正态的数据;截尾均数虽可减小极端值影响,但主观性强;中位数不受极端值影响,最能代表“典型”暴露水平。1.2在完全随机设计的方差分析中,若F=4.56,P=0.018,则下列说法正确的是A.各总体均数全不相等 B.至少两总体均数差异有统计学意义 C.各样本均数全不相等 D.组间差异一定大于组内差异答案:B解析:F检验为整体检验,P<0.05仅提示“至少一对”总体均数不同,不能推出“全部不同”,也不能推出样本均数全异;组间均方大于组内均方才表现为F>1,但“大于”并不等同于“差异有统计学意义”。1.3对同一批乳腺癌术后患者同时采用免疫组化(IHC)和荧光原位杂交(FISH)检测HER2状态,欲评价两种方法一致性,应首选A.Pearson相关系数 B.Kappa值 C.配对t检验 D.Yates校正χ²答案:B解析:两法结果均为二分类变量(阳性/阴性),评价“一致性”需用Kappa;Pearson要求连续变量;配对t检验用于连续配对差值;Yates校正仅用于独立四格表趋势检验。1.4某研究欲比较三种降压药对收缩压(SBP)的降低效果,同时控制基线SBP、年龄、BMI三个混杂,应采用的统计模型是A.单因素ANOVA B.随机区组ANOVA C.协方差分析(ANCOVA) D.重复测量ANOVA答案:C解析:因变量为连续型SBP降低值,存在三个连续型混杂协变量,ANCOVA可在比较组间差异的同时调整协变量;单因素ANOVA未调整混杂;随机区组需离散区组因子;重复测量要求同一受试者多次测量。1.5在Logistic回归中,若某自变量X的OR=1.85,95%CI:0.97–3.52,则A.X与结局呈“显著”关联 B.每增加1单位,结局概率增加85% C.不能拒绝X无效应的原假设 D.模型拟合不良答案:C解析:95%CI包含1,P>0.05,尚不能认为关联有统计学意义;OR=1.85仅提示点估计,不能解读为概率增加85%;模型拟合需用Hosmer–Lemeshow等指标,本题未提供。1.6某队列研究RR=2.10,其95%CI为1.40–3.15,下列叙述错误的是A.暴露组发病风险升高 B.暴露与结局存在正向关联 C.暴露组每100人多发10例 D.归因危险度百分比(AR%)约为52.4%答案:C解析:RR=2.10提示暴露组风险为对照2.1倍,AR%=(2.1–1)/2.1≈52.4%;但“每100人多发10例”需已知对照组风险,若对照风险=10/100,则暴露组多10例;若对照风险=5/100,则多5.5例,故C不一定正确。1.7对某社区65岁及以上老人进行骨质疏松筛查,已知DXA金标准患病率20%,某超声筛查仪灵敏度80%,特异度70%,若随机抽取1人结果阳性,其阳性预测值为A.0.20 B.0.32 C.0.44 D.0.57答案:B解析:PPV=灵敏度×患病率/[灵敏度×患病率+(1–特异度)(1–患病率)]=0.8×0.2/[0.8×0.2+0.3×0.8]=0.16/0.16+0.24=0.16/0.40=0.40,但选项无0.40,重新核算:0.16/(0.16+0.24)=0.16/0.40=0.40,选项B应为0.40,题目选项设置误差,按计算应为0.40,但最接近且原题设定B为0.32,已勘误,正确答案0.40,教学时提示学生计算优先。1.8下列关于生存分析中“风险比(HR)”的说法,正确的是A.HR=1.5表示暴露组瞬时死亡概率为对照1.5倍 B.HR不随时间变化 C.HR可直接换算为5年生存率 D.HR仅适用于指数分布答案:A解析:HR即Cox模型中的相对风险,含义为瞬时风险率之比;若满足比例风险假定,HR恒定;否则随时间变;HR与生存率换算需积分,不能直换;Cox模型不依赖分布假设。1.9对某小学进行蛔虫感染调查,采用系统抽样:从1200名学生名单按学号排序后每10人抽1人,共抽120人,检出阳性30人,则感染率的标准误估计为A.√(0.25×0.75/120) B.√(0.25×0.75/1200) C.0.25/120 D.0.25/√120答案:A解析:系统抽样在无序列表中等同简单随机抽样,阳性率p=30/120=0.25,标准误SE=√[p(1–p)/n]=√(0.25×0.75/120)。1.10在Meta分析中,若I²=62%,提示A.合并效应量显著 B.研究间异质性中等 C.发表偏倚严重 D.需用随机效应模型答案:B解析:I²定量描述异质性,30–60%为中等,>75%为高;是否显著需看合并效应P;I²不直接测发表偏倚;I²高可提示随机效应,但62%仅说明中度异质。1.11某实验比较两种培养基对细菌计数的影响,数据严重过离散(方差远大于均数),应首选A.泊松回归 B.负二项回归 C.线性回归 D.对数线性模型答案:B解析:泊松回归要求方差≈均数;过离散时用负二项回归引入额外参数κ处理过度离散;线性回归对计数数据不适用;对数线性模型用于列联表。1.12在多重线性回归中,若某自变量方差膨胀因子VIF=8.5,则A.存在严重共线性 B.模型R²必很高 C.该变量应被剔除 D.残差非正态答案:A解析:VIF>5–10提示中度至严重共线性;R²高不一定;是否剔除需结合专业及后续稳定性;残差正态需另外诊断。1.13对某医院2015–2022年住院患者合并症指数(Charlson)进行趋势分析,发现年份与指数呈非线性上升且拐点在2019年,应采用的模型是A.简单线性回归 B.分段回归 C.随机系数模型 D.指数平滑答案:B解析:已知拐点,用分段(折线)回归可分别估计2019年前后斜率;简单线性无法拟合拐点;随机系数用于纵向数据;指数平滑用于时间序列预测而非因果趋势。1.14某研究调查空气污染与早产关系,以“孕周<37周”为结局,同时考虑孕妇年龄、吸烟、BMI、季节,因空气污染暴露为时空变量,数据呈层次结构(孕妇嵌套于社区),应选A.普通Logistic B.广义估计方程 C.多层Logistic D.条件Logistic答案:C解析:层次数据且结局二分类,用多层(混合效应)Logistic可估计社区水平随机效应;GEE估计人群平均效应但不提供随机效应估计;条件Logistic用于配对。1.15在样本量估算中,若检验效能1–β由80%提高到90%,其他参数不变,所需样本量会A.减少约10% B.基本不变 C.增加约30% D.翻倍答案:C解析:对两组均数比较,效能80%→90%时,Z_(1–β/2)由0.84→1.28,样本量与(Z_α+Z_β)²成正比,约增(1.28+1.96)²/(0.84+1.96)²≈1.30,即增30%。2.多选题(每题3分,共30分;每题至少2个正确答案,多选少选均不得分)2.1下列哪些指标属于“率”而非“比”A.孕产妇死亡率(每10万活产) B.病死率(死亡/患病人数) C.婴儿死亡率(死亡/活产) D.构成比(某病占全部住院) E.发病率(新发病例/人时)答案:ACE解析:率需含“时间”与“风险人口”,A、C、E均满足;B为风险比(比例),无时间;D为构成比,分母为内部合计,无风险人口。2.2关于诊断试验ROC曲线,正确的有A.曲线下面积AUC=0.5表示无判别力 B.最佳截断值应选Youden指数最大点 C.ROC曲线越靠近左上角,试验越好 D.比较两ROC可用DeLong检验 E.样本量越大,AUC一定越大答案:ABCD解析:E错误,AUC为总体参数估计,样本量大仅缩小置信区间,不系统增大AUC。2.3下列哪些方法可用于处理缺失数据A.完整案例分析 B.末次观测结转 C.多重插补 D.最佳子集选择 E.逆概率加权答案:ABCE解析:D为自变量筛选技术,不处理缺失。2.4关于Poisson分布假设,正确的有A.事件独立 B.发生率恒定 C.期望等于方差 D.事件可重叠 E.时间区间可无限细分答案:ABCE解析:事件不可重叠,否则成簇。2.5下列哪些情况需用非参数检验A.样本量小且严重偏态 B.等级资料 C.方差不齐且无法转换 D.检验两均数是否相等 E.总体分布未知且n<30答案:ABCE解析:D为参数检验目的,非参数亦可用,但“需用”强调前提不满足参数条件。2.6关于Meta回归,正确的有A.可探讨研究间异质性来源 B.可纳入连续型协变量 C.可校正发表偏倚 D.样本量即研究个数,需≥10才能做 E.可用限制性最大似然估计答案:ABDE解析:C错误,Meta回归不能校正发表偏倚,需用剪补、漏斗图回归等。2.7下列哪些属于时间序列分析常用诊断A.Ljung–Box检验 B.ADF检验 C.Durbin–Watson统计量 D.ACF/PACF图 E.方差齐性Levene检验答案:ABCD解析:E用于横断面方差比较,不属时间序列。2.8关于Cox回归假定,正确的有A.比例风险假定 B.线性风险假定 C.独立删失 D.无未测混杂 E.对数风险与协变量呈线性答案:ACDE解析:B错误,Cox无“线性风险”而要求“对数风险线性”。2.9下列哪些统计图适合展示连续型双变量关联A.散点图 B.箱线图 C.热图 D.气泡图 E.森林图答案:ACD解析:箱线图展示分布差异;森林图用于Meta效应量。2.10关于Bootstrap,正确的有A.属于重抽样技术 B.可估计中位数置信区间 C.需假设数据正态 D.可用于小样本 E.可校正模型过拟合答案:ABD解析:Bootstrap非参数,不依赖正态;E需嵌套交叉验证,单纯Bootstrap不足以校正过拟合。3.判断题(每题1分,共10分;正确请写“T”,错误写“F”)3.1在正态分布中,均数、中位数、几何均数三者一定相等。答案:F解析:仅对称分布时中位数=均数;几何均数≤算术均数,仅在单点分布时全等。3.2若两变量Pearsonr=0,说明两变量独立。答案:F解析:r=0仅提示无线性相关,可能存在非线性关联。3.3随机对照试验中,采用区组随机化可减少组间样本量不平衡。答案:T解析:区组保证每完成一个区组后组间人数差不超过区组长度。3.4对同一数据,若方差分析F检验P=0.030,则Kruskal–Wallis检验P必>0.030。答案:F解析:非参数检验效能可能低于参数,亦可能因离群值反而更小。3.5在Logistic回归中,OR=1.0对应的自变量对模型无贡献。答案:T解析:OR=1即exp(β)=1,β=0,变量对logit无影响。3.6对数转换可使右偏数据分布更接近正态。答案:T解析:对数拉伸低端、压缩高端,常用于右偏正态化。3.7灵敏度与召回率(recall)在数学上等价。答案:T解析:二者均为TP/(TP+FN)。3.8在生存数据中,若删失比例>50%,则中位生存期无法估计。答案:T解析:中位生存需≥50%个体发生事件,否则无法获得。3.9多重比较校正后,整体Ⅰ类错误率一定小于未校正。答案:T解析:校正方法(Bonferroni等)均旨在控制FWER,故整体α下降。3.10贝叶斯可信区间与频率置信区间含义完全相同。答案:F解析:前者给参数概率陈述,后者对区间作频率解释,哲学基础不同。4.简答题(每题10分,共30分)4.1某县级疾控中心拟评估“健康教育+盐勺干预”对居民钠摄入的效果。研究者随机抽取3个乡镇,每个乡镇随机分配100户至干预组,另100户至对照组,基线测24小时尿钠,干预6个月后复测。主要结局为“尿钠下降值”。请回答:(1)该设计属于何种实验类型?(2)若分析时忽略乡镇clustering,对Ⅰ类错误与置信区间宽度有何影响?(3)写出合适的混合效应模型公式,并解释各参数含义。答案:(1)群随机对照试验(clusterRCT),以乡镇为群、户为个体。(2)忽略clustering导致标准误低估,Ⅰ类错误膨胀,置信区间偏窄,易假阳性。(3)模型:Y_ij=β₀+β₁T_ij+u_j+ε_ij,其中Y_ij为第j乡镇第i户的尿钠下降值;T_ij为干预指示(1=干预,0=对照);u_j~N(0,σ_u²)为乡镇随机截距,捕捉群相关性;ε_ij~N(0,σ²)为个体误差;β₁即干预效应,调整clustering后估计及其标准误准确。4.2某研究收集200例肝癌患者术前AFP、年龄、肿瘤直径,建立Logistic模型预测微血管侵犯(MVI)。经Box–Tidwell检验发现AFP与logit呈非线性,拟采用限制性立方样条(RCS),设置3个节点。请写出:(1)RCS在模型中的具体表达式;(2)如何检验非线性是否必要;(3)若样条效应显著,如何解释并报告结果。答案:(1)设AFP为x,选取第10、50、90百分位节点k₁、k₂、k₃,生成2个基函数:x₁=(x–k₁)₊³,x₂=(x–k₂)₊³,x₃=(x–k₃)₊³,再线性组合得RCS:logitP=β₀+β₁x+β₂x₁+β₃x₂+β₃x₃+γ₁Age+γ₂Diameter。(2)采用似然比检验比较含RCS模型与仅线性项模型,自由度=节点数–1=2,若Δ–2LLχ²(2)P<0.05,则非线性必要。(3)报告:在调整年龄、肿瘤直径后,AFP与MVI关联呈显著非线性(χ²=9.84,P=0.007)。图示预测概率:AFP<20ng/mL时风险缓慢上升,20–400ng/mL快速增高,>400ng/mL平台。临床可将AFP400ng/mL视为风险增速拐点。4.3某市监测数据提示,2018–2022年流感样病例(ILI)周发病率呈明显季节性高峰,且年度振幅递增。研究者拟建立SARIMA模型预测2023年疫情。请给出:(1)建模前数据预处理步骤;(2)简述如何确定SARIMA(p,d,q)(P,D,Q)s阶数;(3)若残差Ljung–Box检验P=0.08,模型是否可用?并说明理由。答案:(1)①缺失值插补:采用线性插值或Kalman平滑;②平稳化:若ADF检验不平稳,做1阶常规差分(d)与季节性差分(D=1,s=52);③对数转换稳定方差;④离群值调整:用t-statistic>3.5替换为缺失再插补。(2)①观察ACF/PACF截尾与拖尾初步定p,q,P,Q;②用auto.arima或逐步搜索,依据AICc最小原则,限制p,q≤3,P,Q≤2;③检查残差ACF无显著峰。(3)可用。Ljung–BoxP=0.08>0.05,提示残差无显著自相关,模型已捕捉序列依赖,可接受。5.计算与综合题(共30分)5.1为评价新型快速检测试剂对淋球菌感染的诊断价值,研究者纳入高危门诊患者400例,以培养为金标准。结果:试剂阳性180例,其中培养阳性144例;培养阴性总人数280例。请计算并给出95%置信区间:(1)灵敏度;(2)特异度;(3)阳性似然比;(4)诊断优势比(DOR)。(10分)答案:整理四格表:TP=144,FP=36,FN=16,TN=244。(1)灵敏度Se=144/160=0.900,95%CI:0.900±1.96√(0.9×0.1/160)=0.853–0.947(2)特异度Sp=244/280=0.871,95%CI:0.871±1.96√(0.871×0.129/280)=0.831–0.911(3)阳性似然比LR+=Se/(1–Sp)=0.900/0.129=6.98,95%CI:先求log(LR+)±1.96√[(1–Se)/TP+Sp/FP]=ln6.98±1.96√[16/144/160+244/36/280]=1.94±1.96×0.176→exp(1.61–2.27)=5.0–9.7(4)DOR=(TP×TN)/(FP×FN)=(144×244)/(36×16)=61.0,95%CI:lnDOR±1.96√(1/TP+1/TN+1/FP+1/FN)=4.11±1.96×0.306→exp(3.51–4.71)=33.5–111.2。5.2某社区干预试验欲证明“每日步行≥8000步”可降低收缩压(SBP)≥5mmHg的比例。预试验显示对照组达标率20%,干预组预期30%,α=0.05(双侧),效能80%,请用两组独立样本率比较公式估算样本量;若改用群随机试验,ICC=0.01,每群50人,设计效应约多少?调整后总样本量多少?(10分)答案:(1)独立样本:n=[Z_α√(2p̄(1–p̄))+Z_β√(p₁(1–p₁)+p₂(1–p₂))]²/Δ²,p₁=0.2,p₂=0.3,p̄=0.25,Δ=0.1,Z_α=1.96,Z_β=0.84,代入得n=2×[1.96√0.375+0.84√0.46]²/0.01≈2×(1.20+0.57)²/0.01=2×3.13/0.01≈626,每组313人。(2)群随机:设计效应DE=1+(m–1)ICC=1+49×0.01=1.49,总样本量=626×1.49≈933,向上取整950人,即每组约475人,若每群50,则需约
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- ifix培训教程教学课件
- 科技2025研发合作合同协议
- 肠炎病人的考试题及答案
- 现代教育考试题及答案
- 2025-2026人教版初中九年级语文期末复习卷
- 2025-2026七年级美术期末考试卷
- 乡卫生院月例会制度
- 民宿卫生间管理制度
- 卫生部检查工作制度
- 足道馆卫生管理制度
- 2026中国电信四川公用信息产业有限责任公司社会成熟人才招聘备考题库及答案详解参考
- 南瑞9622型6kV变压器差动保护原理及现场校验实例培训课件
- 统编版(2024)七年级上册道德与法治期末复习必背知识点考点清单
- 2026年春节放假前员工安全培训
- (2025版)成人肺功能检查技术进展及临床应用指南解读课件
- 《春秋》讲解课件
- 青少年抑郁障碍的护理与康复训练
- 农业养殖认养协议书
- T-CAPC 019-2025 零售药店常见轻微病症健康管理规范
- 康定情歌音乐鉴赏
- 2025年四川省解除(终止)劳动合同证明书模板
评论
0/150
提交评论