样本量估算的统计学方法研究_第1页
样本量估算的统计学方法研究_第2页
样本量估算的统计学方法研究_第3页
样本量估算的统计学方法研究_第4页
样本量估算的统计学方法研究_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、样本量估算的统计学方法研究一、临床研究为什么需要估计样本含量复习1:统计学三大任务与三大规则任务:描述样本特征、估计总体参数、检验总体差别规则:(必须考虑) 数据类型、分布类型、对比类型1. 统计描述任务例:某样本个体分布的集中趋势与离散趋势怎样 ?(1V点,2V线,3面.影子_线)数据:计数(%),定量(平均数),等级(平均Ridit值) 分布:正态(Mean,SD,95%CR),对数正态(G),偏态(M, Q/R,PP) (双/多变量-相关回归)对比:变量=两组观察值(各组均数与标准差),变量=差值(差值的均数与标准差)2. 置信区间任务例:某总体指标在哪一区间 ?(借鉴反推)数据:计数(

2、直接法/正态近似),计量(正态法),等级(正态近似)分布:正态(正态法),对数正态(lg值置信区间),偏态(百分位数法) 对比:变量参数置信区间,差值参数置信区间(临床试验)3. 假设检验任务例:某2个总体指标相同 ? (直接应用概率分布)数据:计数(正态近似法u,卡方),计量(均数检验),等级(秩和检验)分布:正态(u,t),对数正态(lg值t检验),偏态(秩和检验)对比:组间比较(u, t, H),与总体比较(u, t, H)统计推断中的误差估计最基本公式:误差=个体变异程度/n的平方根均数误差 = 标准差/sqrt(n)率的误差 = sqrtp(1-p)/ nn大小举例1、n=3,三个克

3、隆2、女大学生33%自动退学? n=?3、n1=20,n2=100,n=?4、1987年某产科医师为研究胎次与儿童智力的关系,收集病案资料(考上大学人数):第一胎19人、第二胎18人、第三胎10人、第四胎7人、第五胎4人。由此得出结论:智力与胎次有关,胎次愈多智力愈差,第一胎智力最好。 n=?可重复原则样本含量(Sample)的估计是临床研究科学设计的重要内容。可重复性,是指任何科学研究必须遵守的原则,其目的是要排除偶然因素的影响,得出科学的、真实的、规律性的结论。样本含量的大小在临床研究中,样本含量越小,其抽样误差越大。若样本含量不足,可重复性差,检验效能低,不能排除偶然因素的影响,其结论缺

4、乏科学性、真实性。若样本含量过大,试验条件难以严格控制,容易造成人力、物力和时间上的浪费。估计样本含量的目的在保证某个临床试验/临床研究的结论具有一定科学性、真实性和可靠性前提下,确定某研究所需的最小观察例数。二、估计样本含量的方法两大类方法1、公式法,可满足多种设计的要求,目前应用广泛。2、查表法,简单、方便,但受条件限制,有时不一定完全适应。三、估计样本含量的步骤1、确定设计方法任何临床试验,其设计方案是首先需要确定的,而样本含量的估计也是在设计方案基础上的。不同的临床科研设计方法,其样本含量的估计方法不相同2、确定资料类型当临床试验的设计方案确定后,需要确定临床试验所得数据的类型,例如,

5、计量(数值)、计数(无序分类)、等级(有序分类),因为样本含量估计方法与数据类型有关3、考虑统计方法样本含量的估计还要与以后将要使用的统计方法的条件相结合。如单因素分析、相关与回归、多因素分析等。目前样本含量估计的公式计算主要针对单因素分析,而多因素分析的例数估计请参考有关书籍4、确定基本参数 在各种临床科研设计方法的样本含量估计中,需要研究者事先确定的条件有:第一类错误的概率,第二类错误概率,容许误差。若终点指标为数值变量时,还需要研究者确定总体标准差。若终点指标为分类变量时,有时需要研究者确定总体率。(1)确定第一类误差的概率所有样本含量估计公式中,都需要u的值,研究者确定检验水准()的大

6、小后,查表得u值。有单侧与双侧之分,单侧的u小于双侧u值,所以按单侧计算的样本含量小于双侧。越小所需样本含量越大,反之越小,一般取 (2)确定第二类误差的概率样本含量计算中,需要u的值,即研究者确定大小后,查表的u值。确定大小,主要是要确定检验效能(Power),用1-表示其概率的大小,检验效能是指总体间确有差别时,假设检验能发现这种差别的能力大小。为第二类误差的概率,值越小,检验效率越高,所需样本量也就越大,通常或。一般认为检验效率不能小于。(3)确定容许限或插座 即有临床意义或研究意义的最小差值。若为数值变量时,可为有临床意义的均数差值、实验前后之差等。若为分类资料, 可为有临床意义的有效

7、率、患病率等率之差。(4)确定总体标准差总体率若研究的终点指标为数值变量时,总体标准差为估计样本含量所必须的条件。若研究的终点指标为分类变量时,有时,总体率为估计样本含量条件。若总体标准差和总体率,常常通过文献检索、预试验或对研究作出合理的假设来获得。5、计算样本含量用按设计方案、资料类型及可能涉及的统计分析方法来选择样本含量的计算方法(查书),也可以利用统计软件帮助完成样本含量的计算。6、校正样本含量由于估算的样本含量是最少需要量,考虑到受试者可能有不合作者、中途失访、意外死亡等情况出现,而减少有效观察对象的例数(失访),因此,应该在估算的样本含量增加若干样本例数。通常,失访人数不得大于20

8、%。 四、样本含量估计的注意事项1.组间例数相等成组设计的例数,应尽可能采用例数相等的设计,尤其是多组设计时,一般要求各组间的样本含量相等,只有在某些特殊情况下才考虑各组的样本含量不相等。2.多指标估算若某研究有多个效应指标,其样本含量估计应对每个效应指标进行样本量的估计,然后取样本数量最大者为其研究的样本量。若某研究能区分主要指标和次要指标时,也可以只对主要指标进行样本含量估计,然后取量大者为其研究的样本含量。3.多种估计条件尽可能将多样本含量估计方法联合使用,并且在使用计算法估算时,可多做几种估算方案,以便选择。如:不同的、等条件组合下,估计其样本含量。4.与研究目的结合根据研究目的,严格

9、选择估算样本含量的方法,如单、双侧不同,估计参数与假设检验不同,一般假设检验与等价检验不同,样本率超过与位于()范围不同,t检验与u检验不同等。5.估计的适用条件目前,国内有关书籍提供的样本含量计算公式,主要适用于临床试验,而并非适用于其他医学实验,如动物实验。动物实验的样本含量可以参考临床试验的样本含量,并在此基础上适当减少其数量。五、数值变量的样本含量估计简介两均数比较的估算实例分析(例数相等)欲研究某新药降低高血脂患者的胆固醇疗效,研究者认为试验组与安慰剂组比较,其血清胆固醇值平均下降才有临床意义,查阅文献得血清胆固醇值的标准差为0.8mmol/L,且规定两组例数相等,且, (),该研究所需的样本含量为多少?计算结果例数不相等实例分析(例数不等)某医院研究吲螨酰胺治疗原发性高血压的疗效,经预试验得治疗前后舒张压差值(kPa)资料如下,若, 时需治疗多少例?均数标准差吲螨酰胺2.281.09安慰剂1.320.40计算结果六、分类变量的样本含量估计简介两个率比较的估算实例分析(例数相等)用旧的治疗方案治疗慢性肾炎的控制率为30%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论