样本含量估计_第1页
样本含量估计_第2页
样本含量估计_第3页
样本含量估计_第4页
样本含量估计_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于样本含量估计第1页,讲稿共46页,2023年5月2日,星期三第三节样本含量估计

样本含量估计的目的确定样本量的方法样本含量估计的注意事项第2页,讲稿共46页,2023年5月2日,星期三

按照总体客观存在的性质与特征和研究者所欲承担的误差风险而决定的最小样本量。

样本含量过小

指标不稳定检验效能低

样本含量过大

增加研究困难难于控制条件浪费人力物力样本含量(samplesize)第3页,讲稿共46页,2023年5月2日,星期三估计样本含量的目的在保证某项研究/临床试验的结论具有一定科学性、真实性和可靠性前提下,确定某研究所需的最小观察例数。第4页,讲稿共46页,2023年5月2日,星期三确定样本量的方法

经验法查表法计算法计算机软件协助

第5页,讲稿共46页,2023年5月2日,星期三确定样本量的方法---经验法计量资料:30-40例计数资料:50-100例调查研究在100以上:

地区性研究:平均样本人数500-1000人;全国性研究:1500-2500人描述性研究:样本最少占总体的10%,如果总体较小,则最少占总体20%相关性研究:受试者至少30人以上第6页,讲稿共46页,2023年5月2日,星期三确定样本量的方法---计算法和查表法α1-βσ和πTEXT

检验水准检验效能总总体体标率准差容许误差样本含量估计常用的两种方法。需要提前确定以下参数:δ第7页,讲稿共46页,2023年5月2日,星期三

即假设检验第一类错误出现的概率,也称假阳性率,,即检验水准或显著性。α越小,所需的样本量越大,反之就要越小。α水平由研究者根据具体情况决定,通常α取0.05或0.01。

另外还应明确是单侧或双侧检验。用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的U界值通过查标准正态分布的分位数表可得。

检验水准(a值)第8页,讲稿共46页,2023年5月2日,星期三

又称把握度,为1-β,即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。β即假设检验第二类错误出现的概率,为假阴性错误出现的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.9或0.95,也就是说把握度为80%,90%或95%。

检验效能(1-β)第9页,讲稿共46页,2023年5月2日,星期三临床试验计数资料结局根据假设检验可能出现的结果I类错误的概率:单侧为α,双侧为α/2,α越小所需样本越大,一般取α≤0.05;检验效能:1-β,β为II类错误,一般β=0.1或β=0.2,β越大,检验效能越低,样本数量也越小;第10页,讲稿共46页,2023年5月2日,星期三总体标准差σ反映计量资料总体中各观察单位计量值的变异程度。如:计量(定量)指标血压、血糖、血清酶等。总体率π反映计数资料总体率的变异程度。如:计数(定性)指标死亡与存活,阳性与阴性,正常与异常等。通过以往的实验得出的经验或查阅文献资料作出估计。如无依据,可从研究者所作的预备实验结果中获取的样本的标准差s或样本率P分别作为σ和π的估计值。在其他条件相同的情况下,σ越大,π越接近0.5,所需样本含量越大。总体标准差σ和总体率π第11页,讲稿共46页,2023年5月2日,星期三即预计样本统计量和相应总体参数的最大相应误差控制在什么范围。即本研究有研究意义或临床实际意义的最小差值。计量资料,δ为两均数差值或实验前后差值。计数资料,δ为具有实际临床意义的有效率或患病率等差值。其他条件确定的情况下,δ越小,所需样本含量越大。

容许误差δ第12页,讲稿共46页,2023年5月2日,星期三确定样本量的方法---计算法

通过数学公式估算出所需样本含量。其计算公式往往是根据检验统计量的公式反推过来求样本含量。研究的性质不同、研究的科研设计不同、抽样方法不同,估计样本量的计算公式也不同。不同的检验方法都有确定样本含量的方法计算公式。第13页,讲稿共46页,2023年5月2日,星期三1.1估计总体均数所需样本含量公式σ为总体标准差,一般用样本标准差s表示;δ为容许误差,即样本均数与总体均数间的容许差值;α取双侧,u值可以查表。1.

单纯随机抽样样本含量的估计第14页,讲稿共46页,2023年5月2日,星期三例1:某医院拟用抽样调查评价本地区健康成人白细胞数的水平,要求误差不超过0.2*109/L。根据文献报告,健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人?(双侧α=0.05)

uα/2=1.96(查界值表所得)σ=1.5δ=0.2n=(1.96)2(1.5)2/(0.2)2=216.1≈2171.1估计总体均数所需样本含量第15页,讲稿共46页,2023年5月2日,星期三1.2估计总体率所需样本含量公式P为总体率π的估计值,若π同时有几个估计值供参考,应取最接近0.5者;若对总体一无所知,亦可设π=0.5。因为此时π(1-π)=0.52=0.25为最大,以免样本量n过小。δ为允许误差,即允许样本率和总体率的最大容许误差为多少。α取双侧,uα值可以查表。1.

单纯随机抽样样本含量的估计率第16页,讲稿共46页,2023年5月2日,星期三例2:某口腔医院研究青少年龋齿发病情况,拟了解某市青少年龋齿患病情况,期望误差在平均患龋齿率30%的1/6范围内,当双侧α=0.05,问需要抽样调查多少人?1.2估计总体率所需样本含量ua/2=u0.05/2=1.96p=0.3

δ=0.3/6=0.05n=(1.96)2(0.30)(1-0.30)/(0.05)2=322.7≈323第17页,讲稿共46页,2023年5月2日,星期三2.实验研究设计样本含量估计2.1样本均数与总体均数比较(或配对设计均数比较)公式n为所需样本含量,如为配对设计时n为对子数。ua是检验水准a所对应的u值,查表可得。uβ是第二类错误的概率β相对应u值,查表可得。δ=µ1-µ0为研究者提出的差值,µ0为已知的总体均数,µ1为估计实验结果的总体均数。σ用样本标准差s代替。第18页,讲稿共46页,2023年5月2日,星期三2.1.1样本均数与总体均数比较例3:已知某地成年男性的血红蛋白含量(135±15)g/L,拟在当地煤矿工人中对成年男性进行抽样调查,研究煤矿工人的血红蛋白量水平与当地一般成年男性无差异。根据专业医学知识,当血红蛋白含量相差10g/L以内时,认为二者无差异。取双侧=0.05,=0.10,问应检查多少煤矿工人?ua/2=1.96uβ=1.2816

σ=15δ=10

n=(1.96+1.2816)2(15)2/(10)2=23.6≈24第19页,讲稿共46页,2023年5月2日,星期三例4:某院普查市区2-6岁幼儿体格发育情况,其中体重未达标的幼儿,血红蛋白平均为100g/L,标准差25g/L。现欲使用抗贫血药物,如果治疗前后血红蛋白上升10g/L为有效。设单侧α=0.05,β=0.1时,试问应治疗多少人可以认为该药是有效的?

ua=1.6449

uβ=1.2816

σ=25δ=10

n=(1.6449+1.2816)2(25)2/(10)2=54.9≈552.1.2配对设计均数比较第20页,讲稿共46页,2023年5月2日,星期三2.2

两样本均数比较

试验组样本量为n,对照组样本含量为kn,当两组样本含量相等时,k=1。

2.3多样本均数比较

2.实验研究设计样本含量估计第21页,讲稿共46页,2023年5月2日,星期三2.4.1

样本率与总体率比较例6:某医师研究药物对产后宫缩、外阴创伤的镇痛效果,公认稳定有效的老药物镇痛有效率55%,若新药镇痛有效率达75%,可说明新药优于标准药物,需治疗多少例数?(设α=0.05,β=0.20)查表u0.05=1.6449,u0.2=0.8417δ为容许的误差,即允许样本率和已知总体率的最大容许误差。δ=0.75-0.55=0.2π为已知总体率。π=0.552.4定性资料的样本含量估计

n=(1.6449+0.8417)2×0.55×(1-0.55)/(0.2)2=38.3≈39率第22页,讲稿共46页,2023年5月2日,星期三2.4.2

两样本率比较

2.4定性资料的样本含量估计率此公式计算得到的样本量N为单样本量。试验组需要样本量为n时,对照组需要样本含量为kn。当两组样本含量相等时,k=1。式中pe、pc分别代表两组样本率,p代表两组的合并率。当两组样本含量相等时,k=1,p=(pe+pc)/2。

第23页,讲稿共46页,2023年5月2日,星期三例7:初步观察甲、乙两药治疗湿疹的疗效,得甲药有效率60%,乙药有效率为85%,现拟进一步作治疗实验,设双侧α=0.05,β=0.1,两样本例数相等时,需要观察多少例能说明乙药效果优于甲药?查表u0.05/2=1.96,u0.1=1.282两样本例数相等k=1pe=0.85,pc=0.6,p=(pe+pc)/2=(0.85+0.6)/2=0.725pe-pc=0.85-0.6=0.252.4.2两样本率比较n1=n2=2×(1.96+1.282)2×0.725×(1-0.725)/0.25=67.1≈68第24页,讲稿共46页,2023年5月2日,星期三确定样本量的方法---查表法按照研究条件直接查样本含量表来获得样本含量。样本含量表是统计学家为方便应用,根据特定公式按不同检验水准α,检验效能1-β等条件编制的数据表。研究目的不同,资料性质不同,估计方法不同,样本含量表也不同。第25页,讲稿共46页,2023年5月2日,星期三例1:某医院拟用抽样调查评价本地区健康成人白细胞数的水平,要求误差不超过0.2*109/L。根据文献报告,健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人?(双侧α=0.05)

估计总体均数所需样本含量第26页,讲稿共46页,2023年5月2日,星期三σ=1.5δ=0.2σ/δ=1.5/0.2=7.5确定样本量的方法---查表法公式计算法:uα/2=1.96n=(1.96)2(1.5)2/(0.2)2=216.1≈217第27页,讲稿共46页,2023年5月2日,星期三样本均数与总体均数比较例3:已知某地成年男性的血红蛋白含量(135±15)g/L,拟在当地煤矿工人中对成年男性进行抽样调查,研究煤矿工人的血红蛋白量水平与当地一般成年男性无差异。根据专业医学知识,当血红蛋白含量相差10g/L以内时,认为二者无差异。取双侧=0.05,=0.10,问应检查多少煤矿工人?

ua/2=1.96uβ=1.2816

n=(1.96+1.2816)2(15)2/(10)2=23.6≈24σ=15δ=10δ/σ=10/15=0.67第28页,讲稿共46页,2023年5月2日,星期三例4:某院普查市区2-6岁幼儿体格发育情况,其中体重未达标的幼儿,血红蛋白平均为100g/L,标准差25g/L。现欲使用抗贫血药物,如果治疗前后血红蛋白上升10g/L为有效。设单侧α=0.05,β=0.1时,试问应治疗多少人可以认为该药是有效的?

配对设计均数比较σ=25δ=10δ/σ=10/25=0.4

ua=1.6449

uβ=1.2816

n=(1.6449+1.2816)2(25)2/(10)2=54.9≈55第29页,讲稿共46页,2023年5月2日,星期三例7:初步观察甲、乙两药治疗湿疹的疗效,得甲药有效率60%,乙药有效率为85%,现拟进一步作治疗实验,设双侧α=0.05,β=0.1,两样本例数相等时,需要观察多少例能说明乙药效果优于甲药?

两样本率比较pe=85%,pc=60%,δ=pe-pc=85%-60%=25%

若两样本率有小于50%者,取较小的样本率作为较小率;若两样本率均大于50%,则计算1-p,用1-pe、1-pc中较小者为较小率查表。pe=85%,pc=60%,

1-pe=15%,1-pc=40%n1=n2=2×(1.96+1.282)2×0.725×(1-0.725)/0.25=67.1≈68第30页,讲稿共46页,2023年5月2日,星期三确定样本量的方法---查表法第31页,讲稿共46页,2023年5月2日,星期三PASS(Poweranalysisandsamplesize,网址为:http//)

SAS统计软件确定样本量的方法---计算机软件第32页,讲稿共46页,2023年5月2日,星期三样本含量估计的注意事项1、选择恰当的估算样本含量的方法。2、尽量选择的总体单一,减少个体变异;尽量选择客观指标;选择较优实验设计方案,严格控制实验条件;成组设计的例数,应尽可能采用例数相等的设计,尤其是多组设计时,一般要求各组间的样本含量相等。第33页,讲稿共46页,2023年5月2日,星期三3、多种样本含量估计方法相结合。若某研究有多个效应指标,其样本含量估计应对每个效应指标进行样本量的估计,然后取样本数量最大者为其研究的样本量。若某研究能区分主要指标和次要指标时,也可以只对主要指标进行样本含量估计,然后取量大者为其研究的样本含量。样本含量估计的注意事项第34页,讲稿共46页,2023年5月2日,星期三4、由于估算的样本含量是最少需要量,考虑到受试者可能有不合作者、中途失访、意外死亡等情况出现,而减少有效观察对象的例数(失访),因此,估算的样本含量必须考虑样本的丢失情况,进行实验时需增加10%~15%的样本量。样本含量估计的注意事项第35页,讲稿共46页,2023年5月2日,星期三吴胜贤,王成祥.《临床研究样本含量估算》[M].北京:人民卫生出版社孙振球,徐勇勇.《医学统计学》第3版[M].北京:人民卫生出版社参考文献第36页,讲稿共46页,2023年5月2日,星期三第六章收集资料的方法第37页,讲稿共46页,2023年5月2日,星期三本章学习内容第一节收集资料前的准备第二节自陈法第三节观察法第四节生物学测量法及其他方法第38页,讲稿共46页,2023年5月2日,星期三第一节收集资料前的准备一、资料的定义资料收集:是指收集研究问题相关信息和测量研究变量的过程,是一个系统的有计划的过程。资料:课题研究过程中的全部资料,包括反映课题研究基本情况的资料。(广义)科研资料:根据研究目标,用系统的方式所收集、储存和处理的信息,它最终用以回答研究问题,也是研究产生的过程性资料。(狭义)第39页,讲稿共46页,2023年5月2日,星期三资料的种类(根据资料的属性)第一节收集资料前的准备资料质性量性文字、图像声音、录像1、2、35、6…….第40页,讲稿共46页,2023年5月2日,星期三第一节收集资料前的准备资料的来源

一手资料:研究者根据研究目的和研究计划,通过使用不同资料收集方法所收集的资料,包括对研究对象进行调查、观察、访谈等方式收集的资料。

二手资料:在其他课题的现有资料的基础上进行二次分析,得出新的研究结论。第41页,讲稿共46页,2023年5月2日,星期三第一节收集资料前的准备常用的收集资料的方法问卷法访谈法观察法生物医学测量法德费尔法自陈法结构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论