第18章样本含量的估计_第1页
第18章样本含量的估计_第2页
第18章样本含量的估计_第3页
第18章样本含量的估计_第4页
免费预览已结束,剩余26页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品文档第十八章样本含量估计无论是调查研究还是实验性研究, 医学研究大都是抽样研究, 最终目的在于利用实际观测得到的样本信息推断未知的总体特征, 即统计推断。抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象 (人、动物、生物学材料等 )才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题, 从而最大限度控制研究成本和研究风险, 提高研究效率。 这就是样本含量估计 (estimation of sample size)。本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计 (power analysis)。第

2、一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免, 样本统计量与其所对应的总体参数间总是存在一定差异。 因此,尽量减小抽样误差是提高统计推断精度的必然要求。 在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好, 假设检验中的检验效能 (power=1- )亦会越高,从而避免出现假阴性的结论。同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。但在实际研究中, 除了要考虑抽样误差外, 还需考虑研究的可行性、 结论的时效性、医学伦理以及非随机误差的影响等实际

3、问题, 并非研究对象数越多越好。比如在改良肩周炎贴膏临床试验中, 如果片面地追求大样本, 研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。由于需纳入更多病例,可能会延长产品研发周期, 影响新药投产上市; 若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。 同时增加各种混杂、 偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题, 使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。 另外,由于所施加干预措施可能存

4、在的不良事件反应尚属未知,让过多的临床病例面临风险,亦有悖医学伦理原则。因此,恰当的样本含量应该是满足医学科研统计学要求, 保证一定推断精度.精品文档和检验效能的前提下的最少研究对象数。二、样本含量估计的方法样本含量的估计方法目前主要有两种:一是公式法, 可根据研究目的、 设计类型、已知条件等选择合适的公式进行估算,是目前使用最广泛的方法。二是查表法,统计学家利用公式法获得样本含量后编制成工具表,使用者只需根据已知条件查表即可获得相应的样本含量,省去了繁杂的计算过程, 但较为局限。 本章将主要介绍公式法样本含量的估计。第二节调查设计中样本含量估计调查研究的目的在于描述健康相关状态、 事件在研究

5、当时某特定群体中的分布,并在此基础上通过不同群体分布的比较, 探索可能的关联或影响因素。 但其主要目的仍在于描述分布, 如考察某地菜农钩虫感染率、 医学生的吸烟率、 某地健康男性居民血红蛋白的含量等。 若研究方式为抽样研究, 便需要利用已知的样本信息推断总体参数, 如总体均数 、总体率 的估计等。 因此本节将根据所估计的参数不同, 介绍样本含量估计的基本条件, 及总体均数、 总体率估计中的样本含量估计方法。一、样本含量估计的基本条件采用公式计算样本含量,必须有一些先决条件和基本信息,下面以例18.1为例简单介绍总体参数估计中样本含量估计的基本条件。例 18.1 拟采用单纯随机抽样的方法调查某地

6、区男性成年人群血红蛋白含量 (g/L) 的平均水平。根据文献,中国男性成人血红蛋白含量为(140 30)g/L ,要求所获得允许误差不超过 5g/L,取 0.05 ,问需要调查多少位该地区成年男性?此研究为调查研究,目的在于利用抽样获得的样本均数X 估计该地区成年男性血红蛋白含量 (g/L) 的总体均数。假定该地区成年男性血红蛋白含量X 服从正态分布,以文献中中国男性成人的血红蛋白含量信息进行替代(140 g/L ,30g/L),则该地区成年男性的血红蛋白含量XN(140, 302)。题意要求允许误差不超过5g/L, =0.05,可解释为样本均数X 与总体均数之间的差距(X) 不超过5g/L

7、,且 X 落在135145g/L 之间的概率为.精品文档1- =0.95。由于总体服从正态分布,样本均数的分布亦服从正态分布,当抽样方式为单纯随机抽样,且总体为无限总体时,标准误XX N ( ,x2 ) 。可用图 18.1 表示。n , X 的分布记为图 18.1样本均数的抽样分布示意图结合图 18.1,根据正态分布的原理可得:XZ 2(18.1)nn上式反推即可获得单纯随机抽样研究中总体均数估计中的样本含量公式:Z2/2(18.2)n式中, 为总体标准差; 为允许误差;Z / 2 为标准正态分布下双尾 Z 值。如例 18.1 中=30 g/L, =5 g/L,Z / 2 Z0.05/ 2 1

8、.96,代入式得:(18.2)1.96302n138.35所以至少需要调查 139 人才能达到所要求的精度。由公式 (18.2)可知,在总体服从正态分布且为无限总体、抽样方式为单纯随机抽样的前提下,其所需基本信息包括:1. 置信度 1-置信度越高,需要的样本含量越大,常取= 0.05。2. 允许误差 (allowable error) 是指研究者要求的样本统计量与其对应的总体参数之间的最大差距,其既可以用绝对误差(X或p),也可以用相对误差来表示,其中X或p,则绝对误差或。根据前面章节置信区间的估计,即区间长度的一半。 允许误差越小,所需样本含量越大。.精品文档3. 总体变异度常用总体标准差刻

9、画,总体率估计中的1。总体的变异程度越高,所需样本含量越大。二、单纯随机抽样的样本含量估计(一 ) 估计总体均数时的样本含量估计调查研究中利用抽样获得的样本均数X 估计总体均数。例 18.1 即为估计总体均数时的样本含量估计,这里不再赘述。需指出的是,式(18.2)适用于无限总体抽样时的样本含量估计,对个体数为N 的有限总体中进行单纯随机抽样时,需在式 (18.2)计算出样本含量 n 的基础上利用式 (18.3)进行校正:ncn(18.3)1n N若抽样比 n N 很小,如小于 0.05 或 0.1,这种校正可省略。同时,实际工作中总体标准差常常未知,可首先通过小规模预调查获得的样本标准差 S

10、 估计 。此时,若继续采用式 (18.2)估计样本含量,往往造成样本量的低估,尤其当样本量较小时, 实际上难以达到总体均数估计的精度要求。需用式 (18.4)进行校正:t /22Sn(18.4)式(18.4)中 t /2 表示自由度n1 时 t 分布界值,在估计出样本含量前其未知,可先用 Z / 2 计算出初步的样本含量 n(1),并以自由度 v(1)n1获得 t /2 ,,(1)(1)代入式 (18.3),求出更近似的 n(2) ,依次类推,直至样本例数稳定。但在实际应用中,如果样本估计量较大(如 n50 ),为方便起见可无需校正。如例 18.1 中,若根据前期预调查得该地血红蛋白含量标准差

11、s =30g/L,其余条件不变,问需要调查多少该地区居民?根据 Z /2 计算出的初步样本含量 n(1) =139 ,t0.05/2 ,1381.9773,带入式 (18.4)得:2n(2)1.9773 30140.7 1415以 n(2) =141, t0.05/2 ,140 1.9771,代入式 (18.4)得 n(3)140.7141, n(2) n(3) ,可停止计算。故至少需要调查141 位成年男性。.精品文档(二) 估计总体率时的样本含量估计调查研究中常需利用抽样获得的样本率p 估计总体率,由第十章的学习可知,当 n 较大, 和 1均不太小,如 n和 n(1) 均大于5时,样本率

12、p 的分布亦近似服从正态分布,记为 p N ( ,p2 ) ,其中p(1) n ,同样根据正态分布原理,由式 (18.1)反推可得:Z2/2(1)(18.5)n式中, 为总体率,其它符号含义同前。总体率未知时,可取= 50% ,以使(1) 达到最大,算得样本含量也最大,从而保证总体率推断的精确性。例 18.2 研究某地菜农钩虫感染率,要求允许误差不超过2%,取0.05 ,需调查多少人?根据题意,0.05 ,=Z0.05/ 2,= 0.50Z / 2=1.96 =2%=0.02。总体率未知,取代入式 (18.5)得:Z /222n(1)1.9624010.5 (1 0.5)0.02式(18.5)

13、同样仅适用于无限总体抽样的样本含量估计,对有限总体进行抽样时,仍需按式 (18.3)进行校正。同时,当总体率接近 0或1时,如70%或30%,应用式 (18.5)会有偏差,此时可对 作以弧度为单位的平方根反正弦变换,再利用正态分布原理获得样本含量的估计公式:57.3Z /22(18.6)n(1 )arcsin(此外,亦可使用基于 Poisson分布的正态近似样本含量估计等,读者可根据上述理论自行推导,或参考其它书籍,这里不再赘述。三、其它概率抽样方法的样本含量估计概率抽样方法不同, 样本含量估计方法各异。 对系统抽样而言,抽样间隔不同,其抽样误差也不同, 故系统抽样尚无统一的方法估计样本含量。

14、 但如果研究的变量与总体中个体的编号无确定的上升、 下降或周期性变化的关系, 系统抽样的抽样误差应小于单纯随机抽样, 可参照单纯随机抽样所计算的样本含量。 这里.精品文档简单介绍分层随机抽样和整群抽样中样本含量的估计。(一 ) 分层随机抽样样本含量的估计抽样方式为分层抽样研究中, 若总体为无限总体, 可在估计各层总体参数2i或 i 基础上,以各层例数在总体中所占比例 Wi 为权重进行加权平均,获得总体方差( 22Wi )或总体率(i Wi ),再按式或式估计调查总i(18.2)(18.5)例数。若总体为有限总体,设总体例数为N,共有 L 层,每层例数为 Ni ,各层总体2(总体率的估计中2i

15、(1i ) ),则调查总例数的估计公式为:方差为 iinN i2i2 wi(18.7)2(2222NZ 2 )N ii式中 wi 为各层样本比例 (sample fraction),即 winin ,余符号同前。 若按比例分配,则 wiN i N Wi ;若进行最优分配,wiNiiNi i 。得到总的样本例数 n 后,各层样本量为 ninwi 。(二 ) 整群随机抽样样本含量的估计整群抽样中, 由于群内个体的相似性和群间个体的异质性, 使得整群抽样获得的方差往往大于单纯随机抽样的方差。 若定义整群抽样中计算的方差与单纯随机抽样中方差比值为设计效率 DEFF(design effect),其估计

16、公式为:DEFF 1(m1)式中 m 为各群平均个体数;为群内相关系数 (intra-cluster correlation, ICC) ,即群间方差222B2 (B2W2 ) ),反映群内个体的相似B 与总方差BW的比值(程度,其未知时,可通过预调查进行估计。整群随机抽样样本含量nC 的计算,首先按单纯随机抽样计算样本含量n,再乘以整群抽样的设计效应,则:nC n DEFF(18.8)所需群数 GnC m 。.精品文档第三节实验研究中的样本含量估计实验研究的目的主要在于通过不同干预措施或实验条件效应指标 (均数或率 ) 的比较,说明处理因素的作用, 如研究方式为抽样研究, 比较的过程即为假设

17、检验。需要特别指出的是不仅在实验研究中存在比较的过程, 在调查设计中为了探索可能的影响因素,以及流行病学中的病例对照研究、 队列研究也需要进行比较,即也存在假设检验的问题。 因此本节将从假设检验中不同变量类型及设计形式出发,介绍样本含量估计条件和估计方法。一、样本含量估计的基本条件假设检验中样本含量的估计公式在不同情况下虽有所不同, 但其基本思想大同小异,估计的基本条件也大致相同。这里以例 18.3 为例介绍估计的基本条件。例 18.3 欲研究海拔对血红蛋白的影响, 拟在某高原地区对健康成年男性进行抽样调查,以确定高原地区成年男性的血红蛋白是否高于一般成年男性。 已知一般正常成年男子血红蛋白为

18、 (140 30)g/L ,根据医学专业知识, 当血红蛋白含量相差至少在 10g/L 以上时,可认为二者存在差异。 取单侧= 0.05 ,1-= 0.90 ,问应对多少名高原地区健康成年男性进行检查?若血红蛋白服从正态分布, 此研究目的在于若高原成年男性血红蛋白总体均数与一般成年男性人群总体均数0 =140g/L 之间的差别在 10g/L 及以上,且总体标准差30 g/L ,则利用抽样研究获得的高原地区成年男性血红蛋白样本信息发现这种差异,并保证发现所存在差异的能力(即检验效能 )1-= 0.90。通过前面章节学习不难发现,此时需进行单样本设计均数比较的假设检验:H 0 :0140 g/L (

19、高原地区成年男性血红蛋白均数与一般正常成年男子相同 )H 1 :0150 g/L (高原地区成年男性血红蛋白均数比一般正常成年男子高 10 g/L)注意: 这里 的 H1:1 不同于 前面章 节建 立假设时备择假 设的 写法H1 :0 ,后者未给出的具体数值。所以前面有关章节介绍过的假设检验,不能估计犯第二类错误的概率和检验效能 1-。例 18.3 中,由于总体服从正态分布,样本均数的分布亦服从正态分布,标.精品文档准误n ,在 H0 规定的总体中 X N (0 ,x2 ) ,在 H 1 规定的总体中抽样,X样本均数 X N (0,x2 ) ,可用图 18.2 表示。图 18.2 假设检验中样

20、本均数的分布示意图从图 18.2 可见,在 H 0 成立的正态分布中,在特定的检验水准下,临界点c(图 18.2 中的圆点 )的坐标为: c0Zn 。进一步考虑控制第二类错误时,假设真正的总体分布位置为图中H1 所对应的0,那么当 H1 分布 c 点坐标左侧面积为时,可同时控制此假设检验的效能为1-, 即c ( 0 ) Zn ,从而有:0Zn(0) Zn(18.9)推导可得:(ZZ)2n(18.10)这样得到的样本量估计就同时控制了假设检验的第一类错误和第二类错误(即检验效能为 1-)。式 18.10 中,为总体标准差,为总体均数间差异, Z为指定检验水准下的单侧 Z 值,若为双侧检验应改为Z

21、2 ,Z 为指 II 型错误下的单侧 Z 值。需要注意的是,公式18.10 中的根据无效假设有单双侧之分,而只有单侧。因为确定必须考虑无效假设H 0 不成立时真正的总体分布位置,而此时真正的总体分布位置只会在0 的左边或右边 (0 在左边,0 在右边 ),两者只能居其一,不可能既在左边又在右边。例 18.3 中=30 g/L ,=10g/L, ZZ0.051.65 , ZZ0.101.28 ,代入.精品文档式 (18.10)得:(1.651.28)230n1077.3 78所以至少需要调查78 人。由公式 (18.10)可知,在假设检验样本含量估计中,所需基本信息包括:1.I 型错误概率即假设

22、检验中的检验水准,愈小,所需样本含量愈多。对于相同的 ,双侧检验比单侧检验所需样本含量多。通常取 0.05。2.II 型错误概率或检验效能 (1) II 型错误的概率愈小,检验效能愈大,所需样本含量愈多。一般要求检验效能0.80, 通常取 0.20 或 0.10。3.欲比较的两总体参数间的实际差异如两总体均数的差值12 ,两总体率的差值12 。 愈大,所需样本含量愈小。4.总体变异度比较均数时需了解总体标准差,比较频率时需了解总体概率1 和2 。总体的变异度愈高,所需样本含量愈多。二、均数比较中的样本含量估计(一 ) 单样本设计均数比较的样本含量估计例 18.3 即为单样本设计均数比较的样本含

23、量估计的情形,这里不再赘述。当总体标准差未知时,可用样本标准差S 代替。此时,以 t 分布中对应的 t 和 t界值代替 Z 和 Z ,式 (18.10)就转换为:(t t2)Sn(18.11)但 n 求出之前,自由度未知,t 和 t 查不出,可首先利用 Z 计算出初步的样本含量 n(1) ,并以自由度 v(1)n(1)1获得 t , (1),代入式 (18.11),求出更近似的 n(2) ,依次类推,直至样本例数稳定。(二 ) 配对设计均数比较的样本含量估计配对设计假设检验的目的在于通过样本信息考察配对数据差值的总体均数d 与 0 之间的差异,与上述单样本设计均数的比较并无本质区别,其样本含量

24、计算公式只要将式 (18.10)中改为d 即可,单侧检验时即:.精品文档(Z Z)2d(18.12)n例 18.4欲研究某药对四氧嘧啶糖尿病模型小鼠的降血糖作用。假设该药使空腹血糖下降 2.0mmol/L 及以上有专业意义, 若 d =1.7mmol/L ,取单侧 0.05,检验效能 1-取 0.90,需要多大的样本含量?本例的研究目的在于通过某药治疗四氧嘧啶糖尿病模型小鼠前后血糖的动态变化 (差值 )来说明药物的疗效,治疗前、治疗后血糖值间存在关联,可看成是配对设计,或关联样本。根据题意d =1.70mmol/L , =2.0mmol/L ,=0.05, Z0.05 =1.65;=0.10,

25、Z0.10 =1.28,代入式 (18.12)得:(Z Z)22d(1.65 1.28) 1.7n6.22.0故需 7 只四氧嘧啶糖尿病模型小鼠。(三 ) 独立两样本设计均数比较的样本含量估计独立两样本设计指的是相对于配对设计 (或关联样本 )而言,两样本中的个体测量值彼此独立, 没有关联。常见于实验性研究中的完全随机设计样本, 及观察性研究中分别独立从两个总体抽样获得的样本。独立两样本设计均数比较的假设检验中H0 :12,H1: 12进一步可改写为 H 0 :120 , H 1 :120 ,即通过样本均数的差值考察两总体均数差值与 0 之间的差异。此时,若两总体均服从正态分布,且总体方差齐,

26、样本均数差值的分布记为 X1 X 2 N 12 ,2 ( 11 ) ,定义样本比例 Q1n1 / N ,n1n2Q2 n2 / N ,不难推导两组总例数N 的计算公式为:(Z /2Z )2Q11Q21(18.13)N式中、 Z/2 、 Z 含义同前,12 , n1 NQ1 , n2 NQ2 。例 18.5欲采用完全随机设计比较A 药与 B 药对改善贫血的效果,据以往.精品文档经验,A药可增加红细胞11012 /L ,B药可增加红细胞 21012/L 。若1.8 1012 / L ,取双侧0.05,0.20 ,每组例数相等,问需要多少病例?若 A 药组样本含量占整个样本含量的60%,每组各需多少

27、病例?(1) 已知1.81012 / L ,=(21)1012 /L=11012 /L , Z /2 = Z0.05/ 2 =1.96,Z = Z0.20 =0.84。代入式 (18.13):(1.96 0.84) 1.8 10122N(0.5 1 0.5 1 ) 101.61 1012即两组例数相等时,共需病例102 例,每组 51 例。(2) 若要求 A 药组样本占整个样本含量的60%,即 Q16.0,Q21Q10.4 ,则代入式 (18.13):(1.96 0.84) 1.8 10122N(0.6 10.4 1)105.81 1012即两组病例共需106 例,其中 A 药组 n1NQ11

28、060.6 64 例; B 药组n2NQ21060.442 例。从上述计算可以看出,在其它条件不变的情况下,若两组样本含量的比例相同,所需的样本含量最少。当总体标准差未知时,可用两样本合并方差的平方根,或两样本标准差中较大的一个进行估计。同时以t 2 和 t 界值代替公式 (18.13)中的 Z2 和 Z 。三、率比较中的样本含量估计(一 ) 单样本设计率比较的样本含量估计根据二项分布正态近似原理, 单样本设计率比较的样本含量估计过程与单样本设计均数的比较基本类似,唯一的区别在于由于标准误p 的计算与有关。则在 H0规 定 的 总 体 中 p N ( 0 ,0 (10 ) n ) , 在 H1

29、 规 定 的 总 体 中p N ( ,(1 ) n) 。单侧检验时,样本含量的公式为:2Z0(1 0)Z(1 )(18.14)n0例 18.6 已知静脉滴注抗生素治疗盆腔炎模型兔的有效率为 50%,现欲研究腹腔穿刺灌注法的效果是否优于静脉滴注,预计腹腔穿刺灌注法的有效率为80%。若取单侧=0.05,检验效能 1取 0.80,问需多少只盆腔炎模型兔?.精品文档本例,0 =0.50,=0.80,0.800.50 =0.30。 Z0.05 =1.65, Z0.20 =0.84,代入式 (18.14)得:1.650.50(10.50)0.840.80(120.80)n0.3015.0故至少需 15 只

30、盆腔炎模型兔。(二 ) 配对设计样本率比较的样本含量估计表 18.1配对设计四格表乙甲合计+/2/12合 计1111由表 18.1 可见,配对设计率1 、2 的比较可通过考察配对的甲、乙两种处理措施不一致率/ 和/ 的差别实现。若已知甲、乙两种措施阳性率分别为1 、2 ,两种方法均阳性率为/ ,则/1/ ,/2/ , 双侧检验时样本含量的估计公式为:2Z /22Z2( 1/)(2/)/n(18.15)12式中,/122/ ,余符号意义同前。22例 18.7 欲比较心电图和生化测定法诊断低钾血症阳性率的差别, 分别采用两种方法对同一批临床确诊的低钾血症患者进行检查, 已知心电图法的阳性率为80%

31、,生化法阳性率为 65%,两法均阳性率为 50%。若取双侧0.05,检验效能 10.80 ,问需检查多少低钾血症患者?表 18.2 例 18.7 配对设计四格表生化法心电图法合计+/0.50/2/ 0.1520.65/1/ 0.30/0.051 20.35合计10.8011 0.201.精品文档根据题意, Z0.05 21.96,ZZ0.200.800.6520.500.84 ,20.225,代入式 (18.15)得:21.9620.2250.8420.800.500.650.50 / 0.225n0.800.65151.5152故至少需检查 152 名低钾血症患者。(三) 独立两样本设计率比

32、较的样本含量估计独立两样本设计率比较的假设检验中,若定义两组样本比例Q1n1 / N ,Q2 n2 / N ,则 H 0 : 12 ,且设 12cQ1 1Q2 2;H1: 120 ,双侧检验两组总例数N 的计算公式为:Z(1)(Q1Q1 ) Z(1) Q(1) Q2/2cc11222N121(18.16)12若两组样本例数相等,则每组的例数为:2n1n2Z /22 c(1 c ) Z1 (11)2 (12 )(18.17)12例 18.8 欲比较上颌窦窦口扩大术与上颌窦窦口开放术治疗真菌性上颌窦炎模型兔的疗效。 根据文献,上颌窦窦口扩大术有效率为 83%,上颌窦窦口开放术有效率为 33%。若取

33、双侧 =0.05,=0.20,两组例数相等,问每组需多少只真菌性上颌窦炎模型兔?根据题意,Z / 2= Z0.05/ 2=1.96,Z= Z0.20=0.84。1=0.83,2=0.33,Q =0.50,1Q2 =0.50, c 0.830.500.33 0.500.58,代入式 (18.17)得:2n1 n2Z /22 c (1c ) Z1(1 1)2 (12 )121.9620.58(10.58)0.840.83(10.83)0.33(120.33)0.830.3314.0515故每组需 15 只真菌性上颌窦炎模型兔。.精品文档四、简单直线相关和回归分析中样本含量估计抽样研究中,两正态分布

34、定量变量间的关联性可通过假设检验考察总体直线相关系数 与 0之间的差别来说明。其检验假设为 H 0 :0, H1:0 ,同时样本相关系数 r经 z 转换 ( z 0.5ln( 1r ) )后近似地服从均数为1 ln( 1) ,标准1r2 11差为的正态分布,则直线相关分析中的样本含量公式推导为:n32Z/2Z(18.18)n 413ln()1式中,为总体相关系数,余符号含义同前。对于两正态分布定量变量间的直线相关分析和回归分析的假设检验是等价的,因此直线回归分析与相关分析的样本含量估计公式也是一致的。例 18.9 欲探讨男性腰围与腹腔内脂肪面积的关系,根据以往调查结果, 两者间的直线相关系数=

35、0.75,取双侧0.05,0.10 ,问需测量多少男性?由题意可知 Z /2Z0.05/2 =1.96, ZZ0.10 =1.28,=0.75,代入式 (18.18)得:2n 41.96 1.28 3 14.1 1510.75l n ()10.75即需要 15 个观察对象。第四节样本含量估计中的注意事项样本含量估计是抽样研究设计阶段的一个关键问题,是根据分析目的、 已知条件 (抽样方法、设计方法、总体特征信息等)及推断精度或检验效能的要求,利用样本统计量与其所对应总体参数之间的关系,一般在正态分布基础上, 进行数学推导的过程,在具体计算过程中应注意以下一些问题。(一 ) 正确理解和应用样本含量

36、估计公式。样本含量估计公式有严格的应用条件,包括研究目的、研究设计类型、 抽样方法、总体分布特征以及数据类型等。在使用时应具体分析, 选择合适的计算公式。 同时,前面对于样本含量估计公式.精品文档的介绍只是研究中最基本、 最简单的情况, 主要在于让大家理解样本含量估计的意义和基本思想。 理论上,只要存在样本统计量的抽样误差计算公式, 其必然与样本含量 n 有关,即可在以一定分布理论基础上, 根据分析目的和已知条件, 获得样本含量 n 的估计公式。比如在多重线性回归、 logistic 回归、 Cox 回归分析等, 其分析目的在于确定自变量对应变量的影响作用,可通过假设检验考察偏回归系数i 是否

37、等于0 实现,因此亦可采用假设检验中样本含量估计的方法进行样本含量估计,大家可参阅相关文献,但由于其计算过于繁杂,一般均通过软件进行估计。(二 ) 样本含量估计的基本参数信息获得方式。抽样研究中,有关总体特征的指标 (如总体标准差、总体率、总体相关系数、总体参数间的差异等)一般是未知的,其获得常见两种途径: 根据既往文献提供的信息进行估计; 通过正式研究前进行的小规模预调查或预实验获得的样本信息进行估计,此时需以 t 分布中对应的 t (单侧检验时,双侧检验时为 t 2 )和 t 界值代替公式中的 Z (或Z 2)和Z 。(三 ) 多指标时样本含量的估计。前述的样本含量估计都是基于单指标,当效

38、应指标涉及多个时, 其最佳的处理方法是基于指标联合分布的分析方法获得相2应的估计公式。如在多个定量变量比较中,其假设检验方法多用HotellingTs检验或 MANOV A 等,相关估计方法可参阅相关文献。此外,也可通过在多指标中确定一个主要指标进行粗略估计,或分别根据各指标进行计算, 取样本含量最大者作为保守估计。(四) 样本含量的调整。应用上述公式估计出的样本含量是满足统计学要求的最小样本含量或有效样本含量。若直接以此作为最终研究对象数,由于各种原因 (如调查研究、回顾性研究中缺失值、无效访问等,前瞻性研究中对象的退出、失访、意外死亡、剔除等 ),造成实际上样本量不足。因此,设计时必须对此

39、情况予以充分考虑, 对通过样本含量估计公式获得的样本数 n 予以校正。比如在临床试验中,其校正公式为 nc = n / (1 R0 R1) 2 , R0 和 R1 分别表示试验组退出试验和对照组接受试验药物的比例。.精品文档也有研究者为简便起见, 在样本含量公式估计值基础上增加20%,作为研究设计的样本含量。(五 ) 样本含量估计的软件。样本含量的估计过程是利用给定条件进行数学运算的过程,其计算公式较为繁杂,不过目前已经有相关的软件完成相应的计算,如专门用于样本含量及检验效能估计的PASS、G*Power、PC-Size、PS、NQueryAdvisor,以及在 SAS、 Stata 中一些相

40、关过程等。第五节检验效能的估计一、检验效能估计的意义检验效能是指假设检验中H0 实际上不成立,而检验结果亦拒绝H 0 、发现其差异的概率,用 1表示。差异性假设检验中即为总体间差异客观存在时,通过样本信息发现这种差异的能力。 由前述样本含量估计可知, 为了使假设检验的结果足够可靠,在研究设计时通过事先设定检验效能并据此来估计所需样本量,检验效能越高,所需的样本量就越大。不难推理,除个别假设检验(如正态性检验、方差齐性检验、拟合优度检验等)外,对于任何一个基于抽样的研究,如果检验结果 P,则需要进一步估计检验效能,以判断样本量是否足够,结论是否为假阴性。但实际研究中,总体参数未知,检验效能是不可估计的。此时,若根据已知的样本量n 及其它样本信息,在既定的检验水准下,推算检验效能 1,是一种假设检验后利用样本信息估计检验效能的方法,即所谓的观察检验效能 (observed power),也称为回顾性检验效能 (retrospective power),并以此作为理论检验效能的估计值。一般情况下,要求检验效能应高于80%;当检验效能低于75%时,则认为结果不可靠。二、检验效能估计的方法样本含量估计与检验效能估计方法的理论基础其实是一致的,只不过分析目的和已知条件不同。 前者

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论