版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计软件应用试题及答案2026年全新版1.(单选)在R4.4.0中,使用survey包对复杂抽样数据计算高血压患病率时,下列哪段代码能正确给出按性别分层的95%置信区间并同时输出设计效应?A.svyby(~hypertension,~sex,design=dsv,svyciprop,method="logit",df=degf(dsv),deff=TRUE)B.svyby(~hypertension,~sex,design=dsv,svymean,deff=TRUE,keep.var=TRUE)C.svyby(~hypertension,~sex,design=dsv,svyciprop,method="logit",deff=TRUE)D.svyby(~hypertension,~sex,design=dsv,svyciprop,method="mean",deff=TRUE)答案:C解析:svyciprop专门用于比例指标的置信区间估计,method="logit"保证区间在0-1之间;deff=TRUE触发设计效应计算;svyby的默认自由度为Inf,若需有限校正可再传df参数,但题目未强制要求,故C最简洁合规。2.(单选)SAS9.4M7的procsurveymeans中,欲在输出数据集同时存放层内均数、标准误与累计权重,必须添加的选项是:A.ODSOUTPUTStatistics=mout;B.OUT=moutSTATSSE;C.OUT=mout/NOMCAR;D.OUT=mout/STACKING;答案:B解析:procsurveymeans的OUT=选项本身只输出统计量,需同时写STATSSE关键字才能把均数、标准误写入;累计权重需用WEIGHT语句,但题目问的是“必须添加”的选项,故B正确。3.(单选)Stata18利用svy:tabulate计算接种率,若变量vaccine为二分类(0/1),下列命令可获得Rao-Scott校正F值的是:A.svy:tabvaccine,pearsonB.svy:tabvaccine,waldC.svy:tabvaccine,lrD.svy:tabvaccine,count答案:B解析:svy:tabulate的wald选项输出Rao-Scott校正后的Waldχ²及其F转换;pearson给出未经校正的Pearsonχ²;lr为似然比检验;count仅输出加权计数。4.(单选)Python3.12的statsmodels0.15.0中,使用SurveyDesign对两阶段PPS抽样数据拟合logistic回归,若需获得有限总体校正的标准误,应在fit方法中设置:A.cov_type='cluster'B.cov_type='sandwich'C.cov_type='naive'D.cov_type='finite'答案:B解析:statsmodels的SurveyResults.fit默认使用三明治方差估计,其已包含有限总体校正;cov_type='sandwich'显式声明;cluster仅调整聚类,naive忽略设计,finite并非合法取值。5.(单选)SPSS29.0“复杂抽样”模块中,若抽样框按“县区”分层、按“乡镇”两阶段PPS抽取,最终权重变量为w_final,则“阶段”对话框中必须勾选:A.替换重复单元B.使用有限总体校正C.将权重标准化为样本量D.以上均不必勾选答案:B解析:两阶段PPS抽样下,有限总体校正(FPC)直接影响标准误;SPSS默认不勾选,必须手工激活;A用于处理重复标识,C用于事后标准化,均非必须。6.(单选)R语言的mice3.16.0对复杂抽样数据做多重插补,若变量age为完全观测,bmi存在20%缺失,下列说法正确的是:A.必须在mice()中指定survey.weights=TRUE才能保留抽样权重B.应在with()内使用svydesign对象重新声明设计C.插补模型应包含strata与PSU作为预测变量D.插补后无需合并即可直接汇报结果答案:C解析:复杂抽样下,层与PSU往往与缺失机制相关,纳入插补模型可减少偏差;mice本身不识别survey.weights,需在后续分析阶段使用svy对象;with()仅用于分析插补数据集,不能替代设计声明;必须pool()合并。7.(单选)SAS9.4调用procsurveylogistic拟合有序logit,若比例优势假设被拒绝,应改用:A.proclogistic;stratacluster;B.procsurveylogistic;link=glogit;C.procsurveylogistic;unequalslopes;D.procnlmixed;答案:B解析:link=glogit指定广义logit,即多项模型,可放松比例优势;unequalslopes并非合法语句;nlmixed可拟合但非survey过程,无法调用抽样权重。8.(单选)在Stata18中,使用estatgofaftersvy:logit可得到:A.Archer-Lemeshow拟合优度检验B.Hosmer-Lemeshow检验C.似然比检验D.无此子命令答案:A解析:svy:logit后仅支持Archer-Lemeshow设计校正检验,estatgof自动调用;Hosmer-Lemeshow假定独立同分布,不适用于复杂抽样。9.(单选)R语言epiR包的epi.2by2用于复杂抽样时,需提供:A.仅case与exposure列联表B.设计对象及权重向量C.层内OR及95%CID.无需额外信息答案:B解析:epi.2by2若处理调查数据,需通过design参数传入svydesign对象,否则按简单随机处理;权重向量已封装在设计对象内。10.(单选)Python3.12的samplics包中,VarianceEstimator类默认使用:A.泰勒线性化B.刀切法C.平衡半样本D.Bootstrap答案:A解析:samplics遵循世界银行等官方指南,默认泰勒线性化;刀切与半样本需显式指定method='jackknife'或'brr'。11.(单选)SPSS29.0对复杂抽样数据执行Cox回归,若时间变量为day,结局为death,需激活的对话框是:A.复杂样本→一般线性模型B.复杂样本→Cox回归C.生存→Coxw/复杂抽样D.生存→Kaplan-Meier答案:B解析:SPSS把“复杂样本”与“生存”拆分为两大模块,Cox回归位于“复杂样本→Cox回归”;C选项名称不存在。12.(单选)SAS9.4的procsurveyreg输出中,RootMSE对应:A.模型残差的标准差B.设计校正后的残差标准差C.有限总体均方误差D.仅用于简单随机样本答案:B解析:surveyreg的RootMSE已按设计效应调整,反映复杂抽样下的残差标准差;与普通reg不同。13.(单选)R语言srvyr包中,函数survey_mean()默认返回:A.加权均数与泰勒标准误B.加权均数与刀切标准误C.未加权均数D.仅计数答案:A解析:srvyr封装survey,survey_mean()默认method="linearized",即泰勒;刀切需指定vartype="jk"。14.(单选)Stata18执行svy:proportiondiabetes,over(agegrp)后,若需将结果导出为Excel,最佳命令是:A.putexcelA1=matrix(e(b))B.esttabusingout.xlsx,cells("bci")C.exportexcelusingout.xlsx,replaceD.outsheetusingout.xlsx,replace答案:B解析:esttab可自动识别svy结果,输出比例与置信区间;putexcel需手工拼矩阵;exportexcel不支持直接导出estimation结果;outsheet仅数据。15.(单选)Python3.12的pingouin0.5.4包对复杂抽样数据执行卡方检验,应使用:A.pingouin.chi2_independenceB.pingouin.chi2_surveyC.不支持复杂抽样D.scipy.stats.chi2_contingency答案:C解析:pingouin未实现设计校正;需转用statsmodels或samplics。16.(单选)在SAS9.4中,procsurveyselect用于PPS抽样,若按size变量排序后仍出现负抽取概率,最可能原因是:A.未指定selectallB.size变量含零或负值C.未使用strata语句D.未设置seed答案:B解析:PPS要求所有size>0;零或负值导致概率异常;selectall用于全选,strata与seed无关。17.(单选)R语言ICAR0.9.0对空间复杂抽样数据,若需考虑空间自相关,应在svydesign中新增:A.fpc=~spatialB.nest=TRUEC.目前不支持空间相关D.weights=~invdist答案:C解析:ICAR包尚处实验阶段,svydesign无空间协方差参数;需借助geoR或INLA。18.(单选)Stata18中,estateffects,deff用于:A.计算设计效应B.计算有限总体校正C.输出R²D.无此子命令答案:A解析:estateffects,deff在svy估计后给出每个变量的设计效应;estat不存在fpd子命令。19.(单选)SPSS29.0的CSPLAN语法中,定义PPS抽样需写:A.METHOD=PPS_WORB.METHOD=PPS_WRC.METHOD=SIMPLE_WORD.METHOD=STRATIFIED答案:A解析:PPS_WOR表示按概率与规模成比例无放回抽样;WR为有放回,其余不相关。20.(单选)Python3.12的sklearn1.5.0对复杂抽样数据做随机森林,若需将权重传入,应使用:A.RandomForestClassifier(sample_weight=sw)B.RandomForestClassifier(survey_weight=sw)C.不支持权重D.需改用statsmodels答案:A解析:sklearn的sample_weight参数可接受调查权重,树构建时按加权基尼分裂;无survey_weight参数。21.(多选)在R4.4.0中,使用survey包对两阶段分层PPS数据拟合logistic回归,下列哪些做法可正确获得有限总体校正的标准误?A.svyglm(hypertension~age+sex,design=dsv,family=quasibinomial)B.svyglm(hypertension~age+sex,design=dsv,family=binomial)C.svychisq(~hypertension+smoking,design=dsv)D.svyglm(hypertension~age+sex,design=dsv,family=binomial,influence=TRUE)答案:A、B解析:svyglm自动调用泰勒线性化,family=binomial或quasibinomial均可;influence=TRUE用于诊断,不影响SE;svychisq为列联表检验。22.(多选)SAS9.4的procsurveyfreq中,欲在一张表同时输出加权比例、未加权计数、Rao-Scott校正p值,应添加:A.TABLESvar/CLWTCELLCHI2;B.TABLESvar/CLWTCHISQ;C.ODSOUTPUTCrossTabs=ct;D.TEST=RS;答案:B、C解析:CHISQ触发Rao-Scott;CL输出置信区间;WT显示加权比例;ODSOUTPUT可导出全部格子;CELLCHI2仅格子卡方,TEST=RS需放在PROC语句。23.(多选)Stata18执行svy:melogit后,可用来评估模型拟合的命令有:A.estaticcB.estatvarianceC.predictu0,reffectsD.estatsummarize答案:A、B、C解析:melogit为多水平混合效应logit;icc给出组内相关系数;variance报告随机效应方差;reffects预测随机截距;summarize仅描述变量。24.(多选)Python3.12的linearmodels包对复杂抽样数据执行两阶段最小二乘,需提供的参数包括:A.工具变量列表B.权重向量C.层与聚类标识D.内生变量答案:A、B、C、D解析:linearmodels.IV2SLS支持survey_weights、clusters、strata;内生变量与工具变量为模型核心。25.(多选)SPSS29.0中,使用CSSELECT执行系统抽样,若随机起点需重复可复现,应设置:A.SEED=12345B.SORT=NC.METHOD=SYSD.SIZE=50答案:A、C解析:METHOD=SYS声明系统抽样;SEED保证复现;SORT用于排序变量,SIZE为样本量,非必须。26.(多选)R语言mitools包合并多重插补结果时,pool()函数可输出:A.合并系数B.合并标准误C.缺失信息比例D.相对效能答案:A、B、C、D解析:pool()基于Rubin规则,返回系数、SE、FMI、RE等完整指标。27.(多选)SAS9.4的procsurveylogistic中,link=probit与link=cloglog的主要区别有:A.尾部概率不同B.系数符号相反C.边际效应公式不同D.适用于不同分布假设答案:A、C、D解析:probit基于正态,cloglog基于极值;尾部形状差异导致边际效应不同;系数符号相同;均用于二分类。28.(多选)Stata18中,svyset声明两阶段设计,若PSU在同一层内重复编码,应:A.使用||strata:psuB.使用,singleunit(centered)C.使用,strata(strata)D.重新编码PSU为层内唯一答案:C、D解析:重复编码会导致错误,需层内唯一;strata()声明层;singleunit处理单单元层,非必须。29.(多选)Python3.12的survival1.0包对复杂抽样Cox模型,需传入:A.时间变量B.结局变量C.权重D.层与聚类答案:A、B、C、D解析:survival.SurveyCox支持weights、strata、cluster;与R的survey类似。30.(多选)在R语言的jtools2.2.0中,export_summs()可导出复杂抽样模型到Word,支持的统计量有:A.设计效应B.NagelkerkeR²C.AICD.系数与95%CI答案:B、C、D解析:export_summs()可提取拟合优度、信息准则、系数;设计效应需手动添加。31.(填空)在SAS9.4中,procsurveymeans的varmethod=________可调用平衡半样本法。答案:BRR解析:BRR(BalancedRepeatedReplication)为可选方差估计法;需提前定义repweights。32.(填空)Stata18中,命令svy:proportion,________可输出Bonferroni校正的同时置信区间。答案:mcompare(bonferroni)解析:mcompare()子选项支持多重比较校正;bonferroni为常用方法。33.(填空)R语言survey包中,函数________可计算Rao-Scott校正的二阶p值。答案:svychisq解析:svychisq默认返回一阶与二阶校正p值;二阶基于F分布。34.(填空)Python3.12的statsmodels0.15.0中,SurveyResults.summary_frame().loc[:,'________']可提取设计效应。答案:deff解析:summary_frame()返回数据框,含deff列;需fit时cov_type='sandwich'。35.(填空)SPSS29.0的CSPLAN中,定义有限总体校正需写________=value。答案:FPC解析:FPC关键字后跟总体规模或抽样比;如FPC=10000。36.(判断)在R语言中,svydesign的weights参数接受标准化权重即可,无需原始膨胀权重。答案:错解析:svydesign需膨胀权重(即总体和/样本和≈抽样比倒数);标准化权重会导致错误标准误。37.(判断)Stata18的svy:reg可自动识别分层变量并给出层内R²。答案:错解析:svy:reg仅给出模型整体R²;层内R²需手动循环。38.(判断)SAS9.4的procsurveyfreq可输出Cramér’sV设计校正版本。答案:错解析:surveyfreq仅提供Rao-Scott卡方与校正p值;Cramér’sV需手动计算。39.(判断)Python3.12的scipy.stats.chi2_contingency可用于复杂抽样列联表。答案:错解析:scipy假定独立同分布;需用statsmodels.survey。40.(判断)SPSS29.0中,复杂样本模块的Cox回归可输出设计校正的Schoenfeld残差图。答案:对解析:CSCOX支持设计校正残差;勾选“检验比例风险”即可。41.(简答)简述在R语言survey包中,使用svyglm拟合复杂抽样logistic回归后,如何利用influence残差发现高影响聚类,并给出两段关键代码。答案:步骤:1)计算DFBETA-like影响量:inf<svyinfluence(model,dsv)2)提取聚类层面最大影响:clinf<svyby(~inf$dfbeta,~PSU,dsv,max)plot(clinf$inf.dfbeta,type="h",main="最大DFBETAbyPSU")解析:svyinfluence返回每个观测的dfbeta;按PSU取最大可定位高影响聚类;可视化为条形图,超出±2/√n提示异常。42.(简答)SAS9.4中,如何利用procsurveylogistic输出设计校正的ROC曲线数据,并绘制AUC的95%置信区间?给出完整代码。答案:procsurveylogisticdata=dt;stratastrata;clusterpsu;weightw;modeloutcome(event='1')=x1x2/link=logit;outputout=predpredprobs=individual;run;procsurveyrocdata=pred/where=(outcome=.);weightw;rocpred;odsoutputROC=rocs;run;procsurveylogisticdata=dt;stratastrata;clusterpsu;weightw;modeloutcome(event='1')=x1x2;roc;odsoutputROCAssociation=auc;run;dataci;setauc;lower=Estimate1.96*StdErr;upper=Estimate+1.96*StdErr;run;procsgplotdata=ci;scatterx=Estimatey=Area;highlowy=Areahigh=upperlow=lower;run;解析:surveyroc过程尚不存在,故采用surveylogistic的roc语句输出AUC及其标准误;手动计算95%CI并绘图。43.(简答)Stata18中,如何对复杂抽样数据的多重插补结果执行多水平logistic回归,并合并系数?给出命令序列。答案:misetwidemiregisterimputedbmimiimputelogitbmi=agei.sexi.strata,add(20)miestimate,cmdok:melogitdiabetesagebmi||psu:,intpoints(7)解析:miimpute支持调查权重(需svyset后自动识别);melogit在miestimate框架下可正确传递权重与聚类;cmdok允许非线性混合效应。44.(简答)Python3.12中,使用samplics对两阶段PPS数据计算疫苗接种率,如何获得刀切方差并输出层内比例?给出代码。答案:fromsamplicsimportSurveyStatss=SurveyStat(param="proportion",method="jackknife",weights=wt,psu=psu,strata=strata)ss.estimate(y=vaccine,domain=region)print(ss.to_dataframe())解析:SurveyStat自动执行刀切;domain参数支持层内估计;to_dataframe()返回比例与标准误。45.(简答)SPSS29.0中,如何在复杂样本Cox回归后,利用语法输出设计校正的累积风险曲线数据?答案:CSCOXVARIABLES=timedeath/PLANfile='plan.csaplan'/PLOTSURVIVAL=BYgroup/EXPORTSURVIVAL='surv.sav'.解析:CSPLAN提前定义设计;PLOT子命令勾选生存曲线;EXPORT将累积风险表写入sav文件,含标准误。46.(综合)某全国营养调查采用分层、三阶段PPS抽样,目标估计儿童贫血率。提供变量:strata(31省市)、psu(街道/乡镇)、ssu(村/居)、weight(膨胀权重)、anemia(0/1)、agegroup(1=6-11月,2=12-23月,3=24-35月)、region(城乡)。请用R4.4.0完成:1)声明设计对象;2)计算总体贫血率及95%CI;3)按agegroup与region交叉分层给出率差与95%CI;4)检验agegroup与region交互作用;5)输出设计效应。给出完整代码、结果解读及结论。答案:library(survey)dsv<svydesign(ids=~psu+ssu,strata=~strata,weights=~weight,nest=TRUE,data=dat)r0<svyciprop(~anemia,design=dsv,method="logit")print(r0)结果:0.192(0.183,0.201),设计效应=1.82rd<svyby(~anemia,~agegroup+region,design=dsv,svyciprop,method="logit",deff=TRUE,vartype="ci")print(rd)率差示例:6-11月城市0.26,农村0.31,差值0.05(0.02,0.08)m1<svyglm(anemia~agegroup*region,design=dsv,family=quasibinomial)m0<svyglm(anemia~agegroup+region,design=dsv,family=quasibinomial)anova(m0,m1)F=8.3,p=0.004,交互显著summary(m1)设计效应:agegroup1.75,region1.82解读:贫血率19.2%,城乡差异随年龄组变化;12-23月农村高出城市5个百分点;交互显著提示需分年龄制定干预。47.(综合)SAS9.4M7对同一数据执行procsurveylogistic,要求:1)输出城乡OR及同时置信区间(Bonferroni);2)利用ESTIMATE语句计算农村vs城市在agegroup=2的预测边际概率;3)将边际概率差异及95%CI存入数据集。给出代码与结果。答案:procsurveylogisticdata=dat;stratastrata;clusterpsu;weightweight;classregionagegroup/param=ref;modelanemia(event='1')=regionagegroupregion*agegroup/link=logit;lsmeansregion*agegroup/diffcladjust=bonferronicovout=diffs;estimate'rural-city@12-23m'region1-1agegroup010region*agegroup0100-10;odsoutputLSMEANDIFFS=diffsESTIMATE=est;run;datawant;setest;prob_diff=exp(estimate)/(1+exp(estimate));lcl=exp(lower)/(1+exp(lower));ucl=exp(upper)/(1+exp(upper));run;结果:边际概率差0.048(0.021,0.075),p<0.01。48.(综合)Stata18中,使用svy:logit拟合后,如何利用marginsplot可视化agegroup与region交互的预测边际概率,并保存高分辨率PNG?答案:svy:logitanemiai.region##i.agegroupmarginsregion#agegroup,vce(uncond
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年企业风险管理试题风险评估与6S结合探讨
- 2026年机械工程师认证试题机械设备维修与维护题库
- 2026年大学计算机专业期末考试操作系统计算机网络综合题
- 2026年教育心理学学生心理辅导方法考试题库及答案
- 2026年网络安全工程师技能等级认证笔试指南
- 2026年少儿科普教育项目设计实战考核
- 2026年企业管理战略制定及执行力考察经典试题集
- 2026年网络直播带货的消费心理与市场前景认证题集
- 2025 小学二年级道德与法治上册公共场合不摸他人头发课件
- 2026年市场营销策略考试题目集
- 2026贵州贵阳市安航机械制造有限公司招聘8人考试重点试题及答案解析
- 2026重庆高新开发建设投资集团招聘3人备考考试试题及答案解析
- 2026年度宣城市宣州区森兴林业开发有限公司第一批次员工公开招聘笔试参考题库及答案解析
- 老年人管理人员培训制度
- 2025年湖南常德市鼎城区面向全市选调8名公务员备考题库及答案详解(新)
- 挥发性有机物(VOCs)执法监测能力建设项目可行性实施方案
- 工程施工月报表
- 锅炉外部检验报告
- GB/T 3098.6-2023紧固件机械性能不锈钢螺栓、螺钉和螺柱
- 音标拼读练习(彩色版)
- GB/T 6672-2001塑料薄膜和薄片厚度测定机械测量法
评论
0/150
提交评论