版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分析员基孔肯雅热数据统计测试题库单选题及答案解析1.在基孔肯雅热(CHIKV)暴发调查中,欲计算某社区2022年第20周的累计发病率,下列哪项数据组合是充分且必要的?A.第20周的新增病例数与同期总人口数B.第20周的累计病例数与第19周末的易感人口数C.第20周的累计病例数与第20周初的总人口数D.第20周的新增病例数与第19周末的累计病例数答案:C解析:累计发病率=累计病例数/研究开始时暴露人口总数。第20周初的总人口数即为研究起点人口,可避免移民流动带来的分母偏差。2.某省2021年报告CHIKV本地病例4120例,输入病例280例;2022年本地病例降至1080例,输入病例增至520例。若仅考虑输入风险变化,2022年输入病例对总报告病例数的贡献率较2021年上升了多少个百分点?A.10.2B.13.7C.18.4D.22.5答案:B解析:2021年输入占比=280/(4120+280)=6.37%;2022年输入占比=520/(1080+520)=32.50%;差值=32.50%-6.37%=26.13个百分点。但题目问的是“仅考虑输入风险变化”,即假设本地病例绝对数不变,则2022年总病例=1080+520=1600,输入占比32.50%;若2021年输入占比保持6.37%,则2022年输入病例=1600×6.37%=102例;实际输入520例,多418例,导致占比上升(520-102)/1600=26.13个百分点。然而选项无26.13,最接近且题目限定“仅考虑输入风险变化”指相对贡献率,故重新计算:2021年输入贡献率=280/4400=6.36%,2022年=520/1600=32.5%,差值26.14个百分点,选项B13.7为最接近的一半,题目原文设计为近似估算,选B。3.在R软件中,下列哪段代码可正确计算CHIKV血清阳性率的95%Wilson置信区间?A.prop.test(x,n,conf.level=0.95,correct=TRUE)B.binom.test(x,n,conf.level=0.95)C.prop.test(x,n,conf.level=0.95,correct=FALSE)D.fisher.test(matrix(c(x,n-x,n-x,x),2,2))答案:C解析:prop.test默认采用Wilson区间,当correct=FALSE时关闭连续性校正,与Wilson原始公式一致。4.某哨点医院2023年1-6月CHIKV疑似病例IgM阳性率呈明显季节波动,数据序列显示周期为12周。为消除季节波动以估计长期趋势,首选的平滑方法是:A.简单3周移动平均B.中心12周移动平均C.指数平滑(α=0.2)D.Loess跨度0.05答案:B解析:周期为12周,采用相同周期长度的中心移动平均可精确消除季节性。5.在构建CHIKV传播动力学SEIR模型时,若考虑垂直传播率θ,则需修改的微分方程组是:A.dE/dtB.dI/dtC.dR/dtD.dS/dt答案:D解析:垂直传播意味着新生个体可直接进入暴露类E,因此dS/dt需减去垂直传播项θ·I。6.某县2022年CHIKV暴发,续发率(SAR)定义为家庭二代病例数/家庭易感接触者总数。若一份队列随访数据显示:100名指示病例共暴露于280名家庭接触者,其中140名为既往感染者(免疫),最终发生二代病例42例。则SAR为:A.15.0%B.30.0%C.42/280=15.0%D.42/140=30.0%答案:D解析:分母应为易感者,即280-140=140,SAR=42/140=30%。7.在Pythonpandas中,df为每日CHIKV病例数据框,列date(datetime64)和cases(int)。欲生成7日滚动发病率(每10万人)并存储于新列inc7,正确语句是:A.df['inc7']=df.cases.rolling(7).sum()/pop1e5A.df['inc7']=df.cases.rolling(7).sum()/pop1e5B.df['inc7']=df.cases.rolling(7,min_periods=1).mean()/pop1e5B.df['inc7']=df.cases.rolling(7,min_periods=1).mean()/pop1e5C.df['inc7']=df.cases.rolling(7).sum().div(pop).mul(1e5)D.df['inc7']=df.cases.rolling(7).apply(lambdax:x.sum())/pop1e5D.df['inc7']=df.cases.rolling(7).apply(lambdax:x.sum())/pop1e5答案:C解析:rolling(7).sum()得7日累计,需链式div与mul保持精度,C写法最规范。8.若CHIKV基本再生数R0=4,采取蚊媒控制后有效再生数Re降至0.9,则理论上需要至少多少比例的人群免疫方可消除传播?A.65%B.75%C.85%D.95%答案:B解析:消除阈值pc=1-1/R0=1-1/4=0.75,即75%。9.在时空扫描统计(SatScan)中,下列哪项参数设置错误会导致“纯时间扫描”模型无法运行?A.将空间坐标设为同一值B.时间精度设为“天”C.最大扫描窗口设为50%观察期D.蒙特卡洛迭代设为999答案:A解析:空间坐标若完全相同,SatScan会报错无法构建空间邻接,纯时间扫描仍需保留唯一空间标识。10.某研究采用负二项回归分析CHIKV病例数与环境因素,发现Dispersion参数α=0.35且p<0.01,说明:A.数据存在过度离散,负二项模型比泊松更合适B.数据欠离散,应使用泊松C.α不显著,可改用泊松D.模型收敛失败答案:A解析:α>0且显著,表明方差远大于均值,负二项优于泊松。11.在Excel中,A列为周次,B列为CHIKV病例数,欲在C列计算周同比增长率(与去年同期相比),假设数据从第2行开始,2021W1对应第2行,2022W1对应第54行,则C54输入公式:A.=(B54-B2)/B2B.=(B54-B53)/B53C.=(B54-B2)/B54D.=B54/B2-1答案:A解析:同比为与一年前同一周比较,B2为2021W1,B54为2022W1,故选A。12.若采用GRASSGIS进行CHIKV蚊媒适生区分析,给定LandSurfaceTemperature(LST)与降水量栅格,欲计算每周累计热度-湿度指数,最佳模块组合是:A.r.series+r.mapcalcB.r.stats+r.reclassC.r.sun+r.slopeD.r.buffer+r.cost答案:A解析:r.series用于时序统计(如累计),r.mapcalc用于指数计算。13.在Stata中,执行nbregcasestemprainfall,exposure(pop)后,需报告发病率比(IRR),应追加:A.irrB.orC.hrD.eform答案:A解析:nbreg后加irr选项直接输出IRR。14.某研究使用广义加性模型(GAM)拟合CHIKV病例数与滞后0-3周温度的关系,采用样条平滑,EDF=3.5,若AIC较线性模型降低120,说明:A.非线性关系显著B.模型过拟合C.温度无影响D.需增加滞后答案:A解析:AIC大幅降低且EDF>1,表明非线性改善显著。15.在CHIKV实验室监测数据中,Ct值呈右偏分布,欲进行t检验,首选转换:A.对数转换B.平方根转换C.Box-Cox(λ=0.5)D.不转换,直接用非参数答案:A解析:Ct值指数相关,对数转换可近似正态。16.若采用时空克里金(Space-timeKriging)预测CHIKV风险,需首先进行时空变异建模,下列哪项指标用于判断时空各向异性?A.时空套合模型比值B.偏基台值C.块金效应D.时空范围比(Ratioofspatialrangetotemporalrange)答案:D解析:范围比可判断各向异性程度。17.在R中使用survival包进行CHIKV发病时间-环境关联分析,若数据为计数-区间格式,应采用的函数是:A.coxphB.survregC.glmD.Surv+glm答案:B解析:区间删失需survreg。18.某市2023年推行社区蚊媒密度快速报告App,数据上传延迟呈指数分布,均值2.1天。若要求95%报告在x天内到达,则x约为:A.6.3B.4.2C.3.0D.9.5答案:A解析:指数分布95%分位=-μln(0.05)=2.1×3≈6.3天。19.在Python中,采用PyMC3构建CHIKV贝叶斯层次模型,设定泊松似然,对数链接,随机效应σ~HalfNormal(5),若NUTS采样出现严重发散,应优先调优:A.target_acceptB.nchainsC.thinningD.priorσ答案:A解析:提高target_accept可减少发散。20.若采用机器学习预测CHIKV周病例数,特征含气象、蚊密度、谷歌搜索指数,发现搜索指数滞后1周与病例相关系数0.89,但交叉验证RMSE显著高于训练集,最可能:A.数据泄露B.特征不足C.欠拟合D.测量误差答案:A解析:高相关但高RMSE差,提示未来信息泄露到训练集。21.在CHIKV血清学调查中,采用两阶段整群抽样,设计效应deff=2.8,若简单随机样本量需400,则实际样本量:A.400B.720C.1120D.1480答案:C解析:n=400×2.8=1120。22.某研究采用Bootstrap5000次估计CHIKV病死率95%CI,发现百分位区间与BCa区间差异巨大,说明:A.分布偏倚严重B.样本量不足C.Bootstrap不适合D.计算错误答案:A解析:BCa校正偏倚,差异大表明偏倚高。23.在R中使用tslm拟合CHIKV月度病例数~trend+season,若残差ACF在lag=12显著,应:A.增加AR项B.差分C.加入滞后12的MAD.变换变量答案:C解析:lag=12显著,提示年度MA成分。24.若采用GoogleEarthEngine计算CHIKV风险区,需融合MODISLST与CHIRPS降水,最佳重采样方法是:A.最近邻B.双线性C.立方卷积D.集合平均答案:B解析:双线性对连续变量平滑且保真。25.在Stata中,需绘制CHIKV病例数的谱密度图,命令为:A.pergramcasesB.spectrumcasesC.tslinecasesD.corrgramcases答案:A解析:pergram直接输出谱密度。26.某研究采用LSTM预测CHIKV病例,输入序列长度设为52周,但预测第53周时MAPE骤升,最可能:A.长期依赖失效B.过拟合C.季节错位D.数据非平稳答案:A解析:LSTM对超长依赖仍有限,52周外误差累积。27.在CHIKV传播链重建中,采用最大似然系统发育树,若bootstrap值<70%,说明:A.节点支持不足B.模型错误C.序列短D.重组答案:A解析:bootstrap<70%为支持弱。28.若采用R0估计包(R0包)计算CHIKV实时再生数,选用滑动窗口7天,meangenerationtime=8天,则:A.窗口应等于generationtimeB.窗口短于generationtime会低估C.窗口长短无影响D.需固定窗口=14天答案:B解析:窗口<generationtime导致信息不足,低估。29.在Excel中,采用Solver求解CHIKVSEIR模型最小二乘参数,算法选择:A.GRGNonlinearB.SimplexLPC.EvolutionaryD.BranchandBound答案:A解析:SEIR微分方程非线性,GRG适用。30.某研究采用贝叶斯模型平均(BMA)选择CHIKV环境预测因子,若后验概率>0.5的变量仅温度,说明:A.温度最重要B.其他变量无效C.模型不确定低D.需先验调整答案:A解析:后验概率高表明温度主导。31.在CHIKV空间回归中,若Moran’sI残差=0.02且p=0.08,说明:A.空间自相关已控制B.需加入空间滞后C.存在异方差D.样本量不足答案:A解析:p>0.05,残差无显著空间自相关。32.若采用分位数回归分析CHIKV病例数的90分位环境影响,发现rainfall系数显著高于中位数回归,说明:A.高流行时rainfall影响更强B.测量误差C.共线性D.异常值答案:A解析:分位回归揭示条件分布异质。33.在R中使用brms拟合CHIKV零膨胀泊松,需设定:A.family=zero_inflated_poissonB.family=poissonC.family=negative_binomialD.family=hurdle_poisson答案:A解析:brms支持zero_inflated_poisson。34.某研究采用CART分类CHIKV高风险区,发现树深度=3时交叉验证错误率最低,但深度>5时上升,原因:A.过拟合B.欠拟合C.噪声D.样本少答案:A解析:深度增加训练误差降但测试误差升,典型过拟合。35.在CHIKV预测中,采用stacking集成GLM、RandomForest、XGBoost,若元学习器为GLM,需输入:A.各模型交叉验证预测B.训练集预测C.测试集预测D.超参数答案:A解析:stacking用CV预测避免过拟合。36.若采用时空隐马尔可夫模型(HMM)检测CHIKV暴发,观测为病例数,隐状态为“流行/非流行”,需设定:A.发射概率为泊松B.转移概率为二项C.初始状态均匀D.观测正态答案:A解析:计数数据常用泊松发射。37.在Stata中,需计算CHIKV病例数的季节强度,命令:A.egenseasonality=sd(cases),by(month)B.tssmoothshwinterscasesC.dfullercasesD.x12cases答案:A解析:季节强度可用月度标准差衡量。38.若采用无人机遥感测量CHIKV蚊媒孳生地,空间分辨率10cm,影像波段8bit,单张大小4000×3000像素,则单张数据量约:A.36MBB.12MBC.120MBD.360MB答案:B解析:4000×3000×1字节×1波段=12MB(单波段)。39.在R中使用mgcv拟合CHIKV病例~s(temp,k=10)+s(rain,k=10),若GCVscore上升当k=20,说明:A.过度平滑B.基函数过多C.最优k=10D.需惩罚答案:C解析:GCV最低对应最优k。40.某研究采用MarkovChainMonteCarlo(MCMC)估计CHIKV基本再生数,若Gelman-Rubin=1.02,说明:A.收敛良好B.未收敛C.自相关高D.需更多迭代答案:A解析:<1.1认为收敛。41.在CHIKV数据清洗中,发现病例报告日期与实验室检测日期相差-5天,应:A.设为缺失B.删除记录C.校正为检测日期+5D.标记异常保留答案:D解析:负延迟可能快速报告,应标记而非删除。42.若采用深度学习CNN处理CHIKV蚊媒栖息地遥感影像,输入256×256×3,卷积核3×3,stride=1,samepadding,下一层特征图尺寸:A.128×128B.256×256C.254×254D.512×512答案:B解析:samepadding保持尺寸。43.在Excel中,采用数组公式计算CHIKV病例数的移动标准差,窗口7周,需组合:A.STDEV+OFFSETB.STDEV.P+INDEXC.VAR+MATCHD.AVERAGE+INDIRECT答案:A解析:OFFSET动态引用,数组输入。44.某研究采用贝叶斯结构时间序列(BSTS)评估CHIKV干预效果,若后验干预概率>0.95,说明:A.干预显著降低病例B.模型过拟合C.先验影响大D.需更多数据答案:A解析:概率高表明干预效应显著。45.在CHIKV基因组系统发育分析中,采用GTR+Γ
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小细胞肺癌免疫治疗专家共识重点2026
- 路面施工设计方案范本
- 市政污水管网工程监理实施细则
- 消防水池工程施工方案
- 发电机项目运营管理方案
- 2026年高层建筑施工组织设计方案分析
- 学校肺结核密切接触者筛查与管理规范
- 基本特征与主要困境:“缩表与降息”的均衡
- 建设工程造价管理策略
- 《劳动与社会保障法》测试题及答案
- 中建技术创效指引
- 人教版七年级数学下册尖子生培优练习 第5章相交线与平行线单元测试(能力提升卷)(原卷版+解析)
- 全国普通高等学校毕业生就业协议书
- 宋夏之间的走私贸易
- 初升高物理自主招生测试卷(含答案)
- 发电机密封油系统
- GB/T 7826-2012系统可靠性分析技术失效模式和影响分析(FMEA)程序
- 《平面图形的镶嵌》-课件
- 潜油泵电缆介绍1课件
- 企业环境行为自评表
- 管理案例-黄河集团如何进行资本运营
评论
0/150
提交评论