2025级硕士研究生卫生统计学试卷及答案_第1页
2025级硕士研究生卫生统计学试卷及答案_第2页
2025级硕士研究生卫生统计学试卷及答案_第3页
2025级硕士研究生卫生统计学试卷及答案_第4页
2025级硕士研究生卫生统计学试卷及答案_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025级硕士研究生卫生统计学试卷及答案考试时间:180分钟满分:100分姓名:__________学号:__________得分:__________一、名词解释(每题3分,共15分)抽样误差置信区间Ⅰ类错误方差齐性线性回归二、单项选择题(每题2分,共20分)以下关于标准差与标准误的区别,正确的是()

A.标准差描述个体变异,标准误描述抽样误差

B.标准差随样本量增大而增大,标准误随样本量增大而减小

C.标准差用于描述总体特征,标准误用于描述样本特征

D.标准差的单位与原数据相同,标准误的单位与原数据不同

P值的定义是()

A.原假设正确的概率

B.原假设错误的概率

C.观察到当前或更极端结果的概率,假设原假设为真

D.拒绝原假设的概率

置信区间与假设检验的关系,正确的是()

A.95%置信区间不包含0等价于双侧检验P<0.05

B.置信区间宽度与样本量无关

C.置信区间只能用于估计参数,不能用于假设检验

D.置信区间包含0时,假设检验一定不显著

χ²检验的应用条件不包括()

A.观察值相互独立

B.理论频数均≥5

C.数据服从正态分布

D.分类变量无序

两独立样本t检验的前提条件不包括()

A.两组数据方差齐性

B.两组数据均服从正态分布

C.样本量相等

D.数据为连续变量

线性回归的前提条件不包括()

A.线性关系

B.误差项独立且服从正态分布

C.误差项方差齐性

D.自变量与因变量无相关

方差分析的前提条件不包括()

A.各组样本量相等

B.各组数据服从正态分布

C.各组方差齐性

D.样本相互独立

相关系数r的取值范围是()

A.(-1,1)

B.(0,1)

C.(-∞,+∞)

D.(0,+∞)

抽样研究中,S为定值,若逐渐增大样本含量,则样本均数的标准误()

A.增大

B.减小

C.不变

D.变化不确定

完全随机设计方差分析中,总变异可分解为()

A.组间变异和组内变异

B.处理变异和区组变异

C.误差变异和区组变异

D.处理变异和误差变异

三、简答题(每题5分,共25分)简述假设检验的基本步骤。比较独立样本t检验与配对t检验的适用条件。方差分析的前提条件有哪些?如何检验?简述相关分析与回归分析的区别与联系。应用相对数时应注意哪些事项?四、计算题(每题10分,共20分)某研究测量10名患者治疗前后的血红蛋白值(g/L),数据如下:治疗前:120,115,130,125,118,122,128,123,127,124;治疗后:125,118,135,128,120,125,132,126,130,127。请进行配对t检验,分析治疗是否有显著效果(α=0.05)。某调查比较吸烟与不吸烟者的肺癌发生率,数据:吸烟组:肺癌患者50例,非肺癌患者150例;不吸烟组:肺癌患者20例,非肺癌患者180例。请进行四格表χ²检验,分析吸烟与肺癌是否相关(α=0.05)。五、案例分析题(每题10分,共20分)某研究探讨体重指数(BMI,kg/m²)与收缩压(SBP,mmHg)的关系,数据如下:BMI:22,24,26,28,30;SBP:120,125,130,135,140。请建立线性回归方程,并进行假设检验(α=0.05),解释回归系数的意义。某药物临床试验比较新药A与安慰剂对糖尿病患者血糖的影响。随机纳入60例患者,分为A组(n=30)和安慰剂组(n=30)。测量治疗前后空腹血糖值(mmol/L),核心数据如下:A组治疗前均数8.76±0.42,治疗后均数7.28±0.35;安慰剂组治疗前均数8.81±0.39,治疗后均数8.62±0.41。问题:(1)选择合适的统计方法分析A组的治疗效果;(2)比较A组与安慰剂组的血糖下降值是否有差异;(3)解释结果的专业意义。2025级硕士研究生卫生统计学试卷答案一、名词解释(每题3分,共15分)抽样误差:由抽样引起的样本统计量与总体参数之间的差异(1分),是不可避免的随机误差(1分),其大小可用标准误来衡量(1分)。置信区间:按一定的置信水平(如95%)估计总体参数所在的范围(1分),反映了参数估计的可靠性和精确性(1分),区间越窄,精确性越高;置信水平越高,可靠性越高(1分)。Ⅰ类错误:当原假设H₀为真时,却错误地拒绝H₀(1分),即“假阳性”错误(1分),其发生概率为检验水准α(通常取0.05)(1分)。方差齐性:指多个总体的方差相等(1分),是方差分析、t检验等参数检验的重要前提条件(1分),常用Levene检验进行判断(1分)。线性回归:研究两个连续型变量之间线性依存关系的统计方法(1分),通过建立回归方程,用自变量的值预测因变量的可能值(1分),核心是求解回归系数和常数项(1分)。二、单项选择题(每题2分,共20分)A2.C3.A4.C5.C6.D7.A8.A9.B10.A解析:A正确;B错误,标准差不随样本量变化,标准误随样本量增大而减小;C错误,标准差可描述样本或总体特征,标准误描述样本均数的抽样误差;D错误,两者单位均与原数据相同。P值定义为原假设为真时,观察到当前或更极端结果的概率,C正确,其余选项均为对P值的误解。A正确;B错误,样本量越大,置信区间越窄;C错误,置信区间可用于假设检验;D错误,单尾检验中置信区间包含0可能仍显著。χ²检验用于分类数据,不要求正态分布,C为非应用条件,其余均为χ²检验的核心应用条件。两独立样本t检验不要求样本量相等,C为非前提条件,其余均为其前提条件。线性回归要求自变量与因变量存在线性相关,D为非前提条件,其余均为线性回归的前提(线性、独立、正态、方差齐)。方差分析不要求各组样本量相等,A为非前提条件,其余均为其核心前提条件。相关系数r的取值范围为[-1,1],即(-1,1)(不包含端点时表述),A正确。标准误计算公式为Sₓ̄=S/√n,S固定时,样本量n增大,标准误减小,B正确。完全随机设计方差分析中,总变异分解为组间变异(处理因素+随机误差)和组内变异(随机误差),A正确。三、简答题(每题5分,共25分)假设检验的基本步骤:

①建立检验假设,确定检验水准(1分):建立H₀(原假设,无差异)和H₁(备择假设,有差异),设定α(通常为0.05);

②计算检验统计量(1分):根据资料类型和研究设计选择合适的统计量(如t值、χ²值);

③确定P值,作出统计推断(2分):根据检验统计量的分布,查界值表得到P值,若P≤α,拒绝H₀,接受H₁,认为差异有统计学意义;若P>α,不拒绝H₀,认为差异无统计学意义;

④给出专业结论(1分):结合专业知识,解释统计推断的结果,说明差异的实际意义。

独立样本t检验与配对t检验的适用条件:

(1)独立样本t检验(2.5分):适用于完全随机设计的两样本比较(1分),要求两组数据均服从正态分布(1分),且两组总体方差齐性(0.5分);

(2)配对t检验(2.5分):适用于配对设计的资料(1分),如自身前后对照、配对设计的两组样本(1分),要求配对差值服从正态分布(0.5分)。

方差分析的前提条件及检验方法:

前提条件(3分):①独立性:各组样本相互独立,观察值之间无关联;②正态性:各组数据均服从正态分布;③方差齐性:各组总体方差相等。

检验方法(2分):①正态性检验:采用Shapiro-Wilk检验(小样本)或Kolmogorov-Smirnov检验(大样本);②方差齐性检验:采用Levene检验(常用)或Bartlett检验。

相关分析与回归分析的区别与联系:

联系(2分):两者均用于研究两个连续型变量之间的关系,相关分析是回归分析的基础,若变量间无相关,则无回归意义;相关系数r与回归系数b的符号一致。

区别(3分):①目的不同:相关分析研究变量间的关联程度和方向,回归分析研究变量间的依存关系,用于预测;②变量地位不同:相关分析中两变量地位平等,无自变量和因变量之分;回归分析中需明确自变量和因变量;③结果解读不同:相关系数r反映关联强度,回归系数b反映自变量每变化1个单位,因变量的平均变化量。

应用相对数时的注意事项:

①计算相对数的分母不宜过小,分母过小时(如<30),相对数稳定性差,应直接报告绝对数(1分);

②避免以构成比代替率,构成比反映部分与整体的比例,率反映某现象的发生频率(1分);

③注意资料的同质性,对比不同组的相对数时,需保证各组的研究对象、研究条件一致(1分);

④进行率的比较时,若各组内部构成不同,需进行率的标准化处理(1分);

⑤多个相对数比较时,需进行假设检验,不能仅凭数值大小下结论(1分)。

四、计算题(每题10分,共20分)配对t检验(α=0.05)

步骤1:建立检验假设,确定检验水准(1分)

H₀:μd=0(治疗前后血红蛋白值无差异);H₁:μd≠0(治疗前后血红蛋白值有差异);α=0.05。

步骤2:计算配对差值d及检验统计量(4分)

治疗前(X₁):120,115,130,125,118,122,128,123,127,124

治疗后(X₂):125,118,135,128,120,125,132,126,130,127

差值d=X₁-X₂:-5,-3,-5,-3,-2,-3,-4,-3,-3,-3

计算得:d̄=-3.2,Sd=0.943,n=10,Sd̄=Sd/√n=0.943/√10≈0.298

t=|d̄-μd|/Sd̄=|-3.2-0|/0.298≈10.74

步骤3:确定P值,作出统计推断(4分)

自由度ν=n-1=9,查t界值表,t₀.05/2,9=2.262。

本例t=10.74>2.262,P<0.05,拒绝H₀,接受H₁,差异有统计学意义。

步骤4:专业结论(1分)

可认为该治疗方法能显著提高患者的血红蛋白值,治疗有效。

四格表χ²检验(α=0.05)

步骤1:建立四格表(2分)

分组肺癌患者(阳性)非肺癌患者(阴性)合计吸烟组50(a)150(b)200(a+b)不吸烟组20(c)180(d)200(c+d)合计70(a+c)330(b+d)400(n)

步骤2:建立检验假设,确定检验水准(1分)

H₀:吸烟与肺癌无关(两总体率相等);H₁:吸烟与肺癌有关(两总体率不等);α=0.05。

步骤3:计算检验统计量χ²值(4分)

n=400≥40,所有理论频数T=(行合计×列合计)/总合计,计算得最小T=(200×70)/400=35≥5,可用四格表专用公式:

χ²=(ad-bc)²n/[(a+b)(c+d)(a+c)(b+d)]

代入数据:χ²=(50×180-150×20)²×400/[200×200×70×330]≈12.90

步骤4:确定P值,作出统计推断(2分)

自由度ν=(行数-1)(列数-1)=1,查χ²界值表,χ²₀.05,1=3.841。

本例χ²=12.90>3.841,P<0.05,拒绝H₀,接受H₁,差异有统计学意义。

步骤5:专业结论(1分)

可认为吸烟与肺癌有关联,吸烟人群的肺癌发生率高于不吸烟人群。

五、案例分析题(每题10分,共20分)线性回归分析(α=0.05)

步骤1:建立变量关系,设BMI为自变量(X),SBP为因变量(Y)(1分)

步骤2:计算回归系数b和常数项a(3分)

X:22,24,26,28,30;Y:120,125,130,135,140

计算得:X̄=26,Ȳ=130,Σ(X-X̄)(Y-Ȳ)=50,Σ(X-X̄)²=40

回归系数b=Σ(X-X̄)(Y-Ȳ)/Σ(X-X̄)²=50/40=1.25

常数项a=Ȳ-bX̄=130-1.25×26=97.5

线性回归方程:Ŷ=97.5+1.25X

步骤3:回归方程的假设检验(t检验,4分)

H₀:β=0(回归方程无统计学意义);H₁:β≠0(回归方程有统计学意义);α=0.05。

计算得:Sy.x=√[Σ(Y-Ŷ)²/(n-2)]=0,Sb=Sy.x/√Σ(X-X̄)²=0

t=b/Sb=1.25/0→∞,自由度ν=n-2=3,查t界值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论