研究生中医药统计学与软件应用试题及答案_第1页
研究生中医药统计学与软件应用试题及答案_第2页
研究生中医药统计学与软件应用试题及答案_第3页
研究生中医药统计学与软件应用试题及答案_第4页
研究生中医药统计学与软件应用试题及答案_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

研究生中医药统计学与软件应用试题及答案一、单项选择题(每题2分,共20分)1.某课题组欲比较三种不同炮制方法对黄连中盐酸小檗碱含量的影响,随机抽取9批药材,每批均制成3份样品,分别采用三种方法炮制。若资料满足正态性与方差齐性,应首选的统计方法是A.单因素方差分析B.随机区组设计方差分析C.双因素无重复方差分析D.双因素有重复方差分析答案:B解析:同一批药材的3份样品为“区组”,炮制方法为处理因素,符合随机区组设计,故选B。2.在SPSS中,对“证候积分”这一有序分类变量进行非参数检验,欲比较两组差异,应选择的菜单路径为A.分析→非参数检验→旧对话框→2个独立样本→Mann-WhitneyUB.分析→比较均值→独立样本t检验C.分析→非参数检验→独立样本→Kruskal-WallisD.分析→描述统计→交叉表答案:A解析:有序分类变量、两组比较、非参数,对应Mann-WhitneyU检验,旧对话框路径更稳定。3.对“针刺镇痛潜伏期”进行log-rank检验,其主要零假设为A.两组潜伏期总体均数相等B.两组潜伏期总体中位数相等C.两组生存曲线相同D.两组风险比等于0答案:C解析:log-rank检验属于生存分析,零假设为“两组生存曲线相同”,而非均数或中位数。4.在R语言中,将数据框df的“age”变量按65岁切分为“<65”“≥65”二分类,正确语句是A.dfagB.dfagC.dfagD.dfag答案:A解析:cut函数可设定区间与标签,breaks含右端点,labels对应区间名称,A完整且无误。5.对“中药复方干预后血脂下降值”建立多重线性回归,发现“年龄”与“基线血脂”高度相关(r=0.86,VIF=8.9),最佳处理策略为A.强制剔除“年龄”B.采用主成分回归C.将两变量中心化处理D.扩大样本量答案:B解析:VIF>10才严格剔除,8.9属高度共线,主成分回归可保留信息且降维,优于简单剔除。6.用GraphPadPrism9绘制中药提取物对肿瘤体积的抑制曲线,横轴为“给药后天数”,纵轴为“相对肿瘤体积”,若需在同一图内展示两组均值±SEM,应选择A.散点图→带连线的散点B.分组柱状图C.折线图→均值与误差线D.生存曲线答案:C解析:折线图可表现时间趋势,误差线选SEM,符合重复测量资料展示规范。7.对“舌象评分”进行Kappa一致性检验,两医师评分为2×2列联表,Kappa=0.42,其一致性强度属于A.微弱B.轻度C.中度D.高度答案:C解析:Kappa0.41–0.60为中度一致,0.21–0.40轻度,>0.80高度。8.在Stata17中,拟合随机效应Meta分析,命令为A.metaneffectstderr,randomB.metaneffectlowerupper,fixedC.metasummarizeeffect,randomD.metaregeffect,wsse(stderr)答案:A解析:metan命令后加random选项即可调用DerSimonian-Laird随机效应模型。9.对“脉象参数”进行聚类分析,欲确定最佳聚类数,可综合参考A.轮廓系数与Calinski-Harabasz指数B.Bartlett球形检验C.Levene检验D.Shapiro-Wilk检验答案:A解析:轮廓系数越接近1、CH指数越大,聚类效果越好;其余为方差或正态检验。10.在Python的statsmodels库中,执行Logistic回归后,输出结果中“PR(>|z|)”对应A.偏回归系数B.标准误C.P值D.优势比答案:C解析:PR(>|z|)即双侧Z检验的P值,用于判断变量显著性。二、多项选择题(每题3分,共15分)11.下列哪些情况适合采用非参数检验A.方差不齐且样本量小B.数据为等级资料C.变量呈明显偏态D.总体分布未知E.大样本且近似正态答案:ABCD解析:非参数检验对分布无要求,等级、偏态、方差不齐、小样本均适用;大样本近似正态仍可用参数法,E不选。12.关于多重比较校正,下列说法正确的是A.Bonferroni法可降低Ⅰ型错误B.TukeyHSD适用于所有两两比较C.FDR校正比Bonferroni更宽松D.预先计划的小部分比较可不做校正E.校正后P值可能大于1答案:ABCD解析:E错误,校正后P值仍≤1;其余均正确。13.在R的ggplot2中,可用于美化箱线图元素的函数包括A.geom_boxplot()B.scale_fill_manual()C.theme_bw()D.coord_flip()E.stat_summary()答案:ABCDE解析:均可调整箱线图颜色、主题、坐标翻转及添加统计摘要。14.对“中药注射剂不良反应”进行信号挖掘,可采用A.比例报告比(PRR)B.报告优势比(ROR)C.贝叶斯置信传播神经网络(BCPNN)D.多item伽马泊松缩减(MGPS)E.Cox回归答案:ABCD解析:E用于生存分析,不属于信号挖掘算法。15.下列属于诊断试验评价指标的是A.灵敏度B.特异度C.似然比D.约登指数E.归因危险度答案:ABCD解析:归因危险度属于队列研究指标,不属于诊断试验。三、判断题(每题1分,共10分)16.对同一数据既做t检验又做Mann-WhitneyU检验,若结论相反,应以非参数结果为准。答案:错解析:需先检验假设,若正态且方差齐,t检验效能更高,不能简单以非参数为准。17.在多重线性回归中,标准化回归系数可比较不同量纲变量的相对重要性。答案:对解析:标准化后系数无量纲,可直接比较。18.随机效应Meta分析中,τ²=0表示研究间无异质性。答案:对解析:τ²为异质性方差,等于0即无异质性。19.对“穴位贴敷治疗哮喘”进行系统评价,纳入RCT后发现Jadad评分均<3分,仍可进行Meta分析,但证据等级降低。答案:对解析:低质量RCT可合并,但推荐强度下降,需敏感性分析。20.在SPSS中,变量视图将“小数”设为0,则数据视图自动四舍五入,原始精度丢失且无法恢复。答案:对解析:SPSS按显示格式存储,小数位截断后不可逆。21.对“中医体质分类”进行机器学习,随机森林的OOB误差可用于内部验证,无需额外交叉验证。答案:对解析:OOB误差是无偏估计,可代替交叉验证。22.对“血府逐瘀汤干预后血液流变学”重复测量资料,若球形检验P<0.05,可直接报告Greenhouse-Geisser校正结果。答案:对解析:违反球形假设需校正自由度,降低Ⅰ型错误。23.在Stata中,使用“svy”前缀可调用复杂抽样设计,使OR值更可信。答案:对解析:svy系列命令可调整抽样权重、聚类、分层。24.对“针刺镇痛”动物实验,每组仅3只小鼠,仍可用单因素方差分析,只要数据正态。答案:错解析:样本量过小,检验效能不足,且无法可靠检验正态性,宜用非参数。25.在Excel2021中,利用“分析工具库”可进行随机分组,但无法实施分层随机化。答案:错解析:通过辅助列与排序功能,可实现简单分层随机。四、简答题(每题10分,共30分)26.某研究拟评价“加味逍遥散对肝郁脾虚证抑郁患者的疗效”,主要结局为HAMD-17评分下降值,次要结局为中医证候积分、血清5-HT水平。请写出完整统计分析方案,包括样本量估算、随机化、盲法、统计模型、多重比较校正、缺失值处理、软件实现细节。答案与解析:(1)样本量:以HAMD-17下降值为主要指标,预试验得对照组下降5±3分,预期中药组多下降2.5分,设α=0.05(双侧),效能90%,采用两独立样本t检验公式:n=2[(Z_{1-α/2}+Z_{1-β})σ/δ]^2=2[(1.96+1.28)×3/2.5]^2≈37,考虑20%脱落,每组45例,共90例。(2)随机化:采用中央随机系统,按1:1分配,区组长度为4,分层因素为“性别、基线HAMD≥20分”。(3)盲法:双盲,药物与安慰剂颗粒外观、气味、包装一致,设盲由独立药师完成,揭盲前研究者不知分组。(4)统计模型:主要结局采用协方差分析(ANCOVA),以基线HAMD为协变量,校正后比较调整均值;次要结局中中医证候积分为等级资料,用Mann-WhitneyU;5-HT为正态,用ANCOVA。(5)多重比较:次要结局3个,采用Holm逐步法校正,保持族系错误率α≤0.05。(6)缺失值:采用多重插补(m=20),基于基线HAMD、性别、年龄、分组变量,用Rmice包预测均值匹配法,插补后合并结果。(7)软件:样本量用PASS2022;随机化用Stata17的“ralloc”命令;主要分析用SAS9.4PROCMIXED;次要非参数用SPSS28;插补用R4.3.1。(8)敏感性分析:①按方案集再分析;②不同插补模型;③剔除极端值。(9)结果报告:遵循CONSORT中药扩展声明,提供流程图、基线表、校正前后效应值、95%CI、P值。27.某实验研究“不同煎煮时间对葛根芩连汤中黄芩苷溶出率的影响”,设5个水平(0、15、30、45、60min),每水平重复6次,资料呈正态但方差不齐。请写出详细分析步骤、代码、结果解释、图形绘制、事后比较及专业结论。答案与解析:步骤1:数据录入SPSS,变量“time”为分类变量,“baicalin”为连续变量。步骤2:方差齐性Levene检验P=0.002,方差不齐,改用WelchANOVA。步骤3:SPSS操作:分析→比较均值→单因素ANOVA→选项→勾选Welch;事后选择Games-Howell。步骤4:主要输出:WelchF(4,15.6)=23.47,P<0.001,说明不同煎煮时间溶出率差异显著。步骤5:事后比较:0min与15min均值差=-3.2mg/g,95%CI[-4.5,-1.9],P<0.01;30min与60min差异无统计学意义(P=0.12)。步骤6:图形:GraphPadPrism绘制箱线图+散点叠加,横轴time,纵轴baicalin,颜色区分组别,箱线显示中位数与四分位,散点抖动避免重叠,标题“不同煎煮时间黄芩苷溶出率(n=6)”。步骤7:R代码实现:```rlibrary(onewaytests)data<-read.csv("baicalin.csv")res<-welch.test(baicalin~time,data)pairwise.t.test(databalibrary(ggplot2)ggplot(data,aes(factor(time),baicalin,fill=factor(time)))+geom_boxplot(alpha=0.6)+geom_jitter(width=0.2)+theme_bw()```步骤8:专业结论:煎煮15min内黄芩苷溶出率显著升高,30min后趋于平台,提示工业制备无需超过30min,以节约能耗。28.某回顾性队列研究探讨“益气活血中药对PCI术后主要心血管事件(MACE)的影响”,暴露组320例,非暴露组800例,随访2年。数据含年龄、性别、BMI、高血压、糖尿病、血脂、术式、用药时间等。请构建Cox模型,详述变量筛选、比例风险假定检验、分层分析、竞争风险、软件代码、结果报告。答案与解析:(1)数据清理:Stata17导入Excel,变量MACE为0/1,stime为生存时间(天)。(2)变量筛选:①单因素Cox,P<0.1纳入多因素;②共线性诊断,VIF>5剔除;③临床强制纳入“用药时间”。(3)比例风险假定:Stata命令```stsetstime,failure(MACE)estatphtest,detail```全局P=0.18,>0.05,假定满足;对“糖尿病”绘制Schoenfeld残差,P=0.03,不满足,采用分层Cox,按糖尿病分层。(4)竞争风险:死亡为竞争事件,采用Fine-Gray模型,R代码```library(cmprsk)cov<-model.matrix(~age+sex+bmi+hypertension+TC+med_time)[,-1]fg<-crr(ftime,stime,fstatus,cov1=cov,failcode=1,cencode=0)summary(fg)```(5)最终模型:调整年龄、性别、BMI、高血压、TC、用药时间,分层糖尿病。Stata输出:HR=0.72,95%CI[0.55,0.94],P=0.016,提示益气活血中药降低MACE风险28%。(6)剂量反应:将用药时间按四分位分组,趋势检验P=0.008,呈L型曲线,拐点约6个月。(7)结果报告:遵循STROBE,附流程图、基线表、HR森林图、累积风险曲线;敏感性分析:①剔除30天内MACE;②PSM1:1后Cox;③E值评估未测混杂,E=1.68,中等强度混杂才可能解释结果。五、综合应用题(25分)29.数据文件“TCM_stroke.csv”包含200例缺血性卒中患者,变量:ID、group(0=对照,1=通窍活血汤)、age、sex、baseline_NIHSS(神经功能缺损)、time_1w、time_2w、time_4w(第1、2、4周NIHSS)、complication(0/1)。研究目的:评价通窍活血汤对神经功能恢复的动态效果及并发症影响。要求:(1)撰写R代码完成数据导入、变量衍生、基线比较、重复测量分析、并发症比较、可视化、结果导出;(2)报告主要结果与专业解释;(3)附核心图表截图描述(文字描述即可)。答案与解析:(1)R代码```r加载包library(tidyverse);library(tableone);library(lme4);library(emmeans);library(ggeffects);library(openxlsx);library(corrplot)导入df<-read.csv("TCM_stroke.csv")%>%mutate(group=factor(group,labels=c("Control","Tongqiao")))基线比较tab1<-CreateTableOne(vars=c("age","sex","baseline_NIHSS"),strata="group",data=df,test=TRUE)print(tab1,smd=TRUE)重复测量转换为长格式long<-df%>%pivot_longer(cols=c(time_1w,time_2w,time_4w),names_to="timepoint",values_to="NIHSS")%>%mutate(timepoint=as.numeric(str_extract(timepoint,"\\d")))线性混合模型mod<-lmer(NIHSS~group*timepoint+age+sex+baseline_NIHSS+(1|ID),data=long)summary(mod)边际估计emm<-emmeans(mod,~group|timepoint)pairs(emm,adjust="bonf")可视化plt<-ggpredict(mod,terms=c("timepoint","group"))%>%plot(rawdata=T,jitter=T)+labs(y="EstimatedNIHSS",x="Weeks",title="LongitudinalRecoveryofNIHSS")+theme_bw()ggsave("stroke_NIHSS.pdf",width=6,height=4)并发症比较comp<-table(dfgrchisq.test(comp,correct=FALSE)fisher.test(comp)导出结果write.xlsx(as.data.frame(tab1),"Table1.xlsx")```(2)结果:Table1显示两组年龄、性别、基线NIHSS差异无统计学意义(P>0.05,SMD<0.1),可比性好。混合模型:group×timepoint交互F=5.42,P=0.005,提示通窍活血汤效应随时间变化。边际估计:第1周两组NIHSS差异-0.8(95%CI-1.5~-0.1),P=0.028;第2周-1.5(-2.3~-0.7),P<0.001;第4周-1.7(-2.5~-0.9),P<0.001,效应逐渐增大并趋于稳定。并发症:通窍活血汤组并发症率8.0%,对照组18.0%,Fisher精确P=0.032,OR=0.40(0.18–0.89),提示中药降低并发症风险60%。(3)图形:PDF图显示两条预测曲线,治疗组下降更陡,95%置信带不重叠于2–4周;散点提示个体差异,无严重离群。六、计算题(20分)30.某研究测定“丹参酮ⅡA纳米乳”粒径(nm

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论