版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
样本量的估算
为什么要估算样本量样本量估算的两类问题样本量估算的步骤目录1234使用PASS软件计算样本量一、为什么要估算样本量两个装有红黑色玻璃球的瓶子偶然性检验效能临床研究发现治疗高血压A药有效率90%,B药有效率80%A药是否比B药疗效好?每组研究人数有效人数(AvsB)P值109vs80.535045vs400.1610090vs800.048每组研究人数低于100时,组间差异并不显著!!!样本代表性在保证某个临床试验/临床研究的结论具有一定科学性、真实性和可靠性前提下,估算某研究所需的最小观察例数。不足的样本量可重复性差,不能排除偶然因素的影响检验效能低,阴性结果难以解释过大的样本量负担不起(财力、人力、时间)增加临床研究的难度合适的样本量确保研究具有可行性且能够得到有价值、可靠的信息二、样本量估算的两类问题样本量估算的两类问题2.假设检验:确保正确发现差异设定假设,根据样本统计量推断总体参数是否不相等比较A和B两种治疗方法疗效是否不同1.区间估计:保证测量准确度与精确度按一定的概率(置信度),估计总体参数所在的范围估计人群中某种疾病患病率以下三个研究分别属于上述哪类研究问题?1.某地区肺癌发病率是多少?2.某地区肺癌发病率是否为10%?3.吸烟者肺癌发病率是否高于非吸烟者?选项:A.假设检验类;B.区间估计类思考题区间估计类假设检验类假设检验类三、样本量估算的步骤1.区间估计类研究问题2.假设检验类研究问题1.区间估计类研究问题2.假设检验类研究问题大部分区间估计类研究问题采用横断面调查设计类型1.确定研究设计类型四川凉山地区HIV感染者/艾滋病患者自我管理现状及影响因素研究采用横断面调查估计整体均数的样本量计算公式N=(Z1-α/2S/δ)2进行样本量估计,取置信度1-α=0.95,Z1-α/2=1.96,
参考相关文献,取S=9.8,允许误差δ=1.2进行样本量计算,考虑20%的无应答和无效问卷,最终所需样本量为320例。结局指标不同,样本量的估计方法不同连续变量:如年龄、身高;分类变量:如患病率、死亡率2.确定结局指标主要指标和次要指标仅估计主要指标所需样本量(比较常见)估算每个结局指标所需的样本量,取样本数量最大者多个结局指标估算每个结局指标所需的样本量取样本数量最大者2.确定结局指标例:急性胰腺炎患者生活质量与心理状态、社会支持的相关性分析A.估算每个结局指标所需的样本量,取样本量最大者B.仅估计主要指标所需样本量1-α,反映估计准确度,即置信区间包含总体参数的概率。1-α越接近于1,所需样本量越大。通常取双侧95%。3.确定置信度反映估计精确度,两倍的容许误差(δ)为置信区间的宽度(CU-CL)容许误差越大,所需样本量越小,反之,所需样本量越大。容许误差的确定:根据研究对精确度的要求、调查预算、调查性质确定。4.确定容许误差B省与A省情况相近,想估计B省学生考试成绩平均分A省88分85分95分CUCL95%CI:85,95结局指标为数值变量时,总体标准差σ为估计样本量所必须的条件。结局指标为分类变量时,总体率π为估计样本量条件。总体标准差σ和总体率π的估计:查阅文献、预实验或对研究作出合理的假设来获得。5.确定总体标准差或总体率(1)调查某医院护士法律知识水平,应获取某市、或我国护士的法律知识水平及标准差(2)调查某市艾滋病的发病率,总体率则为我国艾滋病的发病率6.计算样本量公式查表软件:PASS、Stata、SAS、SamplePower等连续变量的区间估计
率的区间估计
受试者可能有不合作者(无应答)、中途失访、意外死亡等,因此需对样本量进行校正。另外,当总体人数较小时,需明确总体人数(N)并使用有限总体校正公式对样本量进行校正。7.校正样本量f通常为:10%、15%、20%
公式:n'=n/(1-f)三、样本量估算的步骤1.区间估计类研究问题2.假设检验类研究问题1.区间估计类研究问题2.假设检验类研究问题研究设计方案不同,样本量的估计方法不同随机对照试验/队列研究病例对照研究横断面调查……1.确定研究设计类型2.确定结局指标结局指标不同,样本量的估计方法不同连续变量:如年龄、身高;分类变量:如发病率、死亡率;生存数据;等级变量(有序多分类):如痊愈、显效、好转、无效多个结局指标估算每个结局指标所需的样本量取样本数量最大者2.确定结局指标主要指标和次要指标仅估计主要指标所需样本量(比较常见)估算每个结局指标所需的样本量,取样本数量最大者3.确定检验水平和检验效能检验水准αα又称I类错误。H0正确时,拒绝H0的概率。α越小,所需样本量越大。通常取α=0.05。检验效能1-βH0错误时(即H1
正确时),拒绝H0的概率。1-β越大,所需样本量越大。通常取1-β为0.80或0.90。组间出现统计学上显著性差异组间存在的真实差异有无有正确(1-β)I类错误(α)无II类错误(β)正确(1-α)不同组之间的差值越大,所需样本量越小,差值越小,所需样本量越大。差值的确定:查阅文献、预实验或专业上认为有意义的差值。4.确定差值A药的治疗有效率是50%预计B药的有效率为51%预计C药的有效率为99%拟比较B药和A药的疗效差异拟比较C药和A药的疗效差异4.确定差值合理膳食对降低血清胆固醇疗效的探索研究某研究者拟开展一项随机对照试验,探讨合理膳食是否能降低血清胆固醇。参考相关文献,估计对照组血清胆固醇水平的平均值为(215±30)mg/dl;根据临床经验,预期合理膳食可以使试验组的血清胆固醇水平较对照组降低15mg/dl。依那普利叶酸片对降低高血压发病率的效果研究某研究者拟开展一项随机对照试验,探讨使用某药物是否能降低高血压病的发病率。估计安慰剂对照组的发病率为40%。实施干预措施1年后,估计试验组的发病率为20%。结局指标为连续变量时,总体标准差σ为估计样本量所必须的条件。结局指标为分类变量时,总体率π为估计样本量条件。总体标准差σ和总体率π的估计:查阅文献、预实验或对研究作出合理的假设来获得。5.确定总体标准差或总体率单侧检验需要的样本量比双侧检验小。如果我们肯定试验组的效果要高于对照组(优效性试验),那么可以用单侧检验。在没有充分理由或专业知识说明的情况下,应该选择双侧检验。6.确定单双侧检验公式7.计算样本量查表软件PASS、Stata、SAS、SamplePower等两样本率的检验
两样本均数的检验
7.计算样本量单侧α0.400.300.200.100.050.0250.010.005双侧α/20.800.600.400.200.100.050.020.01β0.400.300.200.100.050.0250.010.0051-β0.600.700.800.900.950.9750.990.995Z值0.25320.52430.84171.28161.64491.9602.32632.5758Z值表7.计算样本量拟开展一项随机对照试验探讨合理膳食是否能降低血清胆固醇。估计对照组血清胆固醇水平的平均值为(215±30)mg/dl,合理膳食估计可以使试验组较对照组降低15mg/dl。设α=0.05(双侧),把握度1-β=0.90,估算试验组和对照组所需样本量。
两样本均数的检验
受试者可能有不合作者(无应答)、中途失访、意外死亡等,因此需对样本量进行校正。另外,当总体人数较小时,需明确总体人数(N)并使用有限总体校正公式对样本量进行校正。8.校正样本量f通常为:10%、15%、20%
公式:n'=n/(1-f)估算样本量的步骤1.
确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.计算8.校正样本量假设检验类研究问题1.
确定研究设计类型2.确定结局指标确定置信度确定容许误差确定总体标准差或总体率计算校正样本量区间估计类研究问题总体所起的作用视它规模的大小而有所差异
小规模总体的大小将起重要作用对于中等规模的总体,其作用中等重要大总体的规模对样本容量确定则不起作用在样本容量确定的过程中总体的大小对样本量的影响对于小规模总体,通常必须调查较大比例的样本,以取得所期望的精度。因此,实际操作中,对小规模总体经常采用普查而不是抽样调查。总体规模所需的样本量5044100805002221,0002865,00037010,000385100,0003981,000,00040010,000,000400不同规模总体抽样所需样本量(P=0.5,δ=0.05,1-α=0.95)总体的大小对样本量的影响估算样本量时:分层抽样得到的估计值通常比相同规模的简单随机抽样更精确,或者至少一样精确整群抽样得到的估计值通常低于简单随机抽样的估计值的精度。抽样方法对有样本量的影响实际应用时:简单说:确定样本量后,采用分层抽样来获取样本更好,其次为简单随机、整群、方便抽样通常假定采用的抽样方式为简单随机抽样(SRS)。使用PASS软件计算样本量PowerAnalysisandSampleSize横断面调查的样本量估算RCT/队列研究的样本量估算成组设计、病例对照研究样本量估算方法适用于Windows系统PASS软件介绍研究设计/结局指标1.横断面调查+连续变量2.横断面调查+分类变量3.RCT/队列研究+连续变量4.RCT/队列研究+分类变量5.成组设计病例对照研究+OR常见研究背景研究类型:横断面调查结局指标:连续变量1研究类型:横断面调查结局指标:分类变量2横断面调查的样本量估算研究类型:横断面调查结局指标:连续变量1横断面调查—连续变量某研究者拟开展一项横断面调查,调查某县高三年级男生的身高。据文献报道,邻县高三年级男生的身高均值大约为173cm,标准差约为10cm。规定容许误差为1cm,置信度1-α=0.95,已知该县高三年级男生共有3800人,则样本含量至少应有多少人?区间估计的样本量估算横断面调查—连续变量1.
确定研究设计类型2.确定结局指标确定置信度确定容许误差确定总体标准差或总体率计算校正样本量区间估计类研究问题某研究者拟开展一项横断面调查,调查某县高三年级男生的身高。据文献报道,邻县高三年级男生的身高均值大约为173cm,标准差约为10cm。规定容许误差为1cm,置信度1-α=0.95,已知该县高三年级男生共有3800人,则样本含量至少应有多少人?1.研究设计类型2.结局指标3.置信度4.容许误差5.总体标准差横断面调查—连续变量某研究者拟开展一项横断面调查,调查某县高三年级男生的身高。据文献报道,邻县高三年级男生的身高均值大约为173cm,标准差约为10cm。规定容许误差为1cm,置信度1-α=0.95,已知该县高三年级男生共有3800人,则样本含量至少应有多少人?1.研究设计类型2.结局指标3.置信度4.容许误差5.总体标准差连续变量的区间估计
选择Means→One
Mean→Confidence
Interval→Confidence
Interval
forOne
MeanPASS操作PASS操作总体标准差允许误差置信度样本总体PASS操作DistancefromMeantoLimit(s):是指均值到置信区间上限(或下限)的宽度,即容许误差。KnowStandardDeviation选项:勾选→表示研究者认为结局指标符合正态分布;不勾选→表示研究者认为结局事件符合t分布。(不勾选时样本量略大,一般情况下可以不勾选)PopulationSize:当总体数量可以认为是无限大时,填写Infinite;当知道调查对象大约总体数量时,填入相应的数值或近似值。(不同总体数量,样本量差别较大,请务必填入)PASS操作利用PASS2021软件进行样本量计算,取置信度1-α=0.95,取容许误差δ=1,参考相关文献,取标准差s=10,选择单个均数置信区间的样本量计算公式进行计算,需要调查的样本量N=387例,假定应答率为80%,则公需要样本量N=387÷0.8=484例。撰写结论某研究者拟开展一项横断面调查,调查某县高三年级男生的身高。据文献报道,邻县高三年级男生的身高均值大约为173cm,标准差约为10cm。规定容许误差为1cm,置信度1-α=0.95,已知该县高三年级男生共有3800人,则样本含量至少应有多少人?PASS操作样本总体设定为有限总体PASS操作无限总体有限总体样本量与置信度1-α及总体标准差σ成正比,与容许误差δ成反比。置信度1-α及容许误差δ一定时,总体标准差σ越大,所需样本量越大。置信度1-α及总体标准差σ一定时,容许误差δ越小,所需样本量越大。样本量影响因素横断面调查+连续变量研究类型:横断面调查结局指标:连续变量1研究类型:横断面调查结局指标:分类变量2横断面调查的样本量估算研究类型:横断面调查结局指标:分类变量2某研究者拟开展一项横断面调查,调查北京市40岁及以上人群的高血压病患病率。根据其它地区同类调查的结果,估计该年龄段人群中的高血压病患病率为30%。规定容许误差为3%,置信度1-α=0.95,则至少应该调查多少人?横断面调查—分类变量1.
确定研究设计类型2.确定结局指标确定置信度确定容许误差确定总体标准差或总体率计算校正样本量区间估计类研究问题1.研究设计类型2.结局指标3.置信度4.容许误差5.总体率率的区间估计
PASS操作选择Proportions→OneProportion→ConfidenceInterval→ConfidenceIntervalforOneProportionPASS操作置信度置信区间宽度、两倍允许误差总体率估计值PASS操作样本量影响因素包括置信度1-α、总体率及容许误差。置信度1-α及容许误差一定时,所需样本量随总体率π增大先增加后减少。总体率π为0.5时,所需样本量最大。置信度1-α及总体率π一定时,容许误差越小,所需样本量越大。样本量影响因素横断面调查+分类变量当总体是有限总体,例如,计算样本量需要1000人,但是总人群只有900人,怎么办?有限总体样本量校正(分类变量)
有限总体样本量校正公式:
例子中最终的样本量:
Distance
from
Mean
to
Limit(s)
Confidence
Interval
Width
(Two-Sided)均值到上或下95%可信区间的距离
可信区间上下限的距离(双侧)无Population
Size选项两倍于前者1横断面调查PASS中分类变量与连续变量的区别12允许误差×2允许误差总体率估计值总体标准差置信度置信度样本总体欲调查某市成年人冠心病患病率,因各种原因无法获得该市成年人患病率估计值(P),如何估算样本量?
A.
假设P为0.2,计算样本量
B.
假设P为0.5,计算样本量
C.
假设P为0.8,计算样本量
D.
假设P为0.9,计算样本量
E.
无法估算思考题研究类型:RCT/队列研究结局指标:连续变量1研究类型:RCT/队列研究结局指标:分类变量2RCT/队列研究的样本量估算研究类型:RCT/队列研究结局指标:连续变量1RCT与队列研究REO1XAO2O3…
RCO1XBO2O3…R=随机分组E=试验组C=对照组X=干预措施On=第n次观察或测量随机对照试验研究对象暴露组非暴露组结局结局追踪观察追踪观察队列研究均具有对照组,样本量计算方法相同研究问题—连续变量某研究者拟开展一项随机对照试验,探讨合理膳食是否能降低血清胆固醇。估计对照组血清胆固醇水平的平均值为(215±30)mg/dl,合理膳食估计可以使试验组较对照组降低15mg/dl。设α=0.05(双侧),把握度1-β=0.90,请估算试验组和对照组所需样本量。假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.计算8.校正样本量某研究者拟开展一项随机对照试验,探讨合理膳食是否能降低血清胆固醇。估计对照组血清胆固醇水平的平均值为(215±30)mg/dl,合理膳食估计可以使试验组较对照组降低15mg/dl。设α=0.05(双侧),把握度1-β=0.90,请估算试验组和对照组所需样本量。假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.计算8.校正样本量5.标准差3.检验水平3.检验效能4.差值6.双侧检验1.研究设计类型2.结局指标研究问题—连续变量选择Means→Two
Independent
Means
→T-Test
(Inequality)→Two-SampleT-TestAssumingEqualVariancePASS操作Two-SampleT-TestAssumingEqualVarianceTwo-SampleT-TestAllowingUnequalVariance假设两组的方差是相等的两组的方差可以不相等PASS操作检验效能检验水准两组的均数两组的标准差默认两组样本相等PASS操作利用PASS2021软件进行样本量计算,取检验水准α=0.05,检验效能1-β=0.9,根据临床数据,取μ1=215,S1=30;根据临床经验,预测通过合理膳食后,试验组的血清胆固醇水平可以降至200mg/dl,选择“两独立样本t检验,假定两组方差齐”样本量计算模块
,计算得所需样本量为:N1=N2=86,考虑10%的脱落率,校正后所需样本为N1=N2=96。撰写结论某研究者拟开展一项随机对照试验,探讨合理膳食是否能降低血清胆固醇。估计对照组血清胆固醇水平的平均值为(215±30)mg/dl,合理膳食估计可以使试验组较对照组降低15mg/dl。设α=0.05(双侧),把握度1-β=0.90,请估算试验组和对照组所需样本量。样本量影响因素RCT/队列研究+连续变量不同组之间的差值越大,所需样本量越小,差值越小,所需样本量越大;结局指标为数值变量时,总体标准差σ为估计样本含量所必须的条件;检验水准α越小,所需样本量越大;检验效能1-β越大,所需样本量越大。1两样本均数的检验
样本量影响因素RCT/队列研究+连续变量不同组之间的差值越大,所需样本量越小,差值越小,所需样本量越大。试验组均值对照组均值均值之差每组样本量1952152048200215158520521510190对照组保持215mg/dl不变,试验组变化Mean1(MeansofGroup1):
215Mean2(MeansofGroup2):195200205样本量影响因素RCT/队列研究+连续变量试验组均值对照组均值均值之差每组样本量2002202048200215158520021010190试验组保持200mg/dl不变,对照组变化样本量影响因素RCT/队列研究+连续变量试验组均值对照组均值均值之差每组样本量1952152048200215158520521510190对照组保持215mg/dl不变,试验组变化不同组之间的差值越大,所需样本量越小,差值越小,所需样本量越大。研究类型:RCT/队列研究结局指标:连续变量1研究类型:RCT/队列研究结局指标:分类变量2RCT/队列研究的样本量估算研究类型:RCT/队列研究结局指标:分类变量2研究问题—分类变量某研究者拟开展一项随机对照试验,探讨使用某药物是否能降低高血压病的发病率。估计安慰剂对照组的发病率为40%。实施干预措施1年后,估计试验组的发病率为20%。规定α=0.01(双侧),β=0.10,请计算试验组和对照组所需样本量。假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.计算8.校正样本量研究问题—分类变量某研究者拟开展一项随机对照试验,探讨使用某药物是否能降低高血压病的发病率。估计安慰剂对照组的发病率为40%。实施干预措施1年后,估计试验组的发病率为20%。规定α=0.01(双侧),β=0.10,请计算试验组和对照组所需样本量。假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.计算8.校正样本量1.研究设计类型2.结局指标4.差值5.总体率3.检验水平3.检验效能6.双侧检验选择Proportions→TwoIndependentProportions→Test(Inequality)→TestforTwoProportions[Proportions]PASS操作PASS操作检验效能检验水准两组的率双侧检验默认两组的样本相等PASS操作以下关于样本量估算的描述中正确的有?(多选)A.RCT中试验组与对照组预计差值越大,所需样本量越小
B.检验效能越高,所需样本量越大
C.检验水平α越小,所需样本量越小
D.对于连续变量,总体标准差σ为必备条件,且σ越大,所需样本量越小思考题两样本均数的检验
两样本率的检验
研究类型:成组设计/病例对照研究结局指标:比值比(OR)1成组设计、病例对照研究样本量估算方法研究问题—比值比(OR)拟采用病例对照研究探讨吸烟与肺癌的关系。选择肺癌患者为病例组,非肺癌患者为对照组。预期吸烟者发生肺癌的比值比(OR)为2.0,对照组人群的吸烟率约为20%,设α=0.05(双侧),β=0.10。病例组和对照组采用相等样本量,请问如何估计病例组和对照组的样本量?假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.计算8.校正样本量比值比取值(0,+∞)OR值(oddsratio,OR),又称比值比、优势比主要指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值是否暴露于某因素病例组(肺癌)对照组(非肺癌)合计是(吸烟)aba+b否(吸烟)cdc+d合计a+cb+dN
研究问题—比值比(OR)拟采用病例对照研究探讨吸烟与肺癌的关系。选择肺癌患者为病例组,非肺癌患者为对照组。预期吸烟者发生肺癌的比值比(OR)为2.0,对照组人群的吸烟率约为20%,设α=0.05(双侧),β=0.10。病例组和对照组采用相等样本量,请问如何估计病例组和对照
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 知识产权保护策略-第15篇
- 2026灭绦灵行业投资风险预判及竞争格局展望研究报告
- 2025-2030智慧农业种植行业市场前景与投资布局规划分析研究
- 2025-2030智慧养老服务体系建设现状分析及创新服务模式与市场需求研究
- 无人化AI智慧停车管理合同范本合同
- 2026年工业安全管理中的风险识别
- 2026年机械设计中的加速器创新案例
- 2026年智能环境监测技术及应用
- 渔光互补日常运维方案
- 2026年工艺设计中的系统思维
- ISO9001:2015版质量管理体系试题
- 铁路工程路基真空预压施工质量验收标准
- 肿瘤科MDT课件教学课件
- 强碱岗位安全培训课件
- 青海招警考试真题及答案
- DB11∕T 2271-2024 村庄供水站建设导则
- 医学数据标注培训课件
- 西藏政治-历史-文化常识
- 浙江空调管理办法
- 小学动感中队活动方案
- 猪群周转培训课件
评论
0/150
提交评论