样本含量估计ppt课件.ppt_第1页
样本含量估计ppt课件.ppt_第2页
样本含量估计ppt课件.ppt_第3页
样本含量估计ppt课件.ppt_第4页
样本含量估计ppt课件.ppt_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章总体和样本,第三节样本含量估计,第一节基本概念第二节抽样过程及方法,1,第三节样本含量估计,2,按照总体客观存在的性质与特征和研究者所欲承担的误差风险而决定的最小样本量。,样本含量过小指标不稳定检验效能低,样本含量过大增加研究困难难于控制条件浪费人力物力,样本含量(samplesize),3,估计样本含量的目的,在保证某项研究/临床试验的结论具有一定科学性、真实性和可靠性前提下,确定某研究所需的最小观察例数。,4,确定样本量的方法,经验法查表法计算法计算机软件协助,5,确定样本量的方法-经验法,计量资料:30-40例计数资料:50-100例调查研究在100以上:地区性研究:平均样本人数5001000人;全国性研究:15002500人描述性研究:样本最少占总体的10,如果总体较小,则最少占总体20相关性研究:受试者至少30人以上,6,确定样本量的方法-计算法和查表法,1-,和,TEXT,检验水准,检验效能,总总体体标率准差,容许误差,样本含量估计常用的两种方法。需要提前确定以下参数:,7,即假设检验第一类错误出现的概率,也称假阳性率,,即检验水准或显著性。越小,所需的样本量越大,反之就要越小。水平由研究者根据具体情况决定,通常取0.05或0.01。另外还应明确是单侧或双侧检验。用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其或的U界值通过查标准正态分布的分位数表可得。,检验水准(a值),8,又称把握度,为1-,即在特定的水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。即假设检验第二类错误出现的概率,为假阴性错误出现的概率。检验效能即避免假阴性的能力,越小,检验效能越高,所需的样本量越大,反之就要越小。水平由研究者具情决定,通常取为0.2,0.1或0.05。即1=0.8,0.9或0.95,也就是说把握度为80%,90%或95%。,检验效能(1-),9,临床试验计数资料结局根据假设检验可能出现的结果,I类错误的概率:单侧为,双侧为/2,越小所需样本越大,一般取0.05;检验效能:1-,为II类错误,一般=0.1或=0.2,越大,检验效能越低,样本数量也越小;,10,总体标准差反映计量资料总体中各观察单位计量值的变异程度。如:计量(定量)指标血压、血糖、血清酶等。总体率反映计数资料总体率的变异程度。如:计数(定性)指标死亡与存活,阳性与阴性,正常与异常等。通过以往的实验得出的经验或查阅文献资料作出估计。如无依据,可从研究者所作的预备实验结果中获取的样本的标准差s或样本率P分别作为和的估计值。在其他条件相同的情况下,越大,越接近0.5,所需样本含量越大。,总体标准差和总体率,11,即预计样本统计量和相应总体参数的最大相应误差控制在什么范围。即本研究有研究意义或临床实际意义的最小差值。计量资料,为两均数差值或实验前后差值。计数资料,为具有实际临床意义的有效率或患病率等差值。其他条件确定的情况下,越小,所需样本含量越大。,容许误差,12,确定样本量的方法-计算法,通过数学公式估算出所需样本含量。其计算公式往往是根据检验统计量的公式反推过来求样本含量。研究的性质不同、研究的科研设计不同、抽样方法不同,估计样本量的计算公式也不同。不同的检验方法都有确定样本含量的方法计算公式。,13,1.1估计总体均数所需样本含量公式为总体标准差,一般用样本标准差s表示;为容许误差,即样本均数与总体均数间的容许差值;取双侧,u值可以查表。,1.单纯随机抽样样本含量的估计,14,例1:某医院拟用抽样调查评价本地区健康成人白细胞数的水平,要求误差不超过0.2*109/L。根据文献报告,健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人?(双侧=0.05),u/2=1.96(查界值表所得)=1.5=0.2n=(1.96)2(1.5)2/(0.2)2=216.1217,1.1估计总体均数所需样本含量,15,1.2估计总体率所需样本含量公式P为总体率的估计值,若同时有几个估计值供参考,应取最接近0.5者;若对总体一无所知,亦可设=0.5。因为此时(1-)=0.52=0.25为最大,以免样本量n过小。为允许误差,即允许样本率和总体率的最大容许误差为多少。取双侧,u值可以查表。,1.单纯随机抽样样本含量的估计,率,16,例2:某口腔医院研究青少年龋齿发病情况,拟了解某市青少年龋齿患病情况,期望误差在平均患龋齿率30%的1/6范围内,当双侧=0.05,问需要抽样调查多少人?,1.2估计总体率所需样本含量,ua/2=u0.05/2=1.96p=0.3=0.3/6=0.05n=(1.96)2(0.30)(1-0.30)/(0.05)2=322.7323,17,2.实验研究设计样本含量估计,2.1样本均数与总体均数比较(或配对设计均数比较)公式,n为所需样本含量,如为配对设计时n为对子数。ua是检验水准a所对应的u值,查表可得。u是第二类错误的概率相对应u值,查表可得。=1-0为研究者提出的差值,0为已知的总体均数,1为估计实验结果的总体均数。用样本标准差s代替。,18,2.1.1样本均数与总体均数比较,例3:已知某地成年男性的血红蛋白含量(13515)g/L,拟在当地煤矿工人中对成年男性进行抽样调查,研究煤矿工人的血红蛋白量水平与当地一般成年男性无差异。根据专业医学知识,当血红蛋白含量相差10g/L以内时,认为二者无差异。取双侧=0.05,=0.10,问应检查多少煤矿工人?,ua/2=1.96u=1.2816=15=10n=(1.96+1.2816)2(15)2/(10)2=23.624,19,例4:某院普查市区2-6岁幼儿体格发育情况,其中体重未达标的幼儿,血红蛋白平均为100g/L,标准差25g/L。现欲使用抗贫血药物,如果治疗前后血红蛋白上升10g/L为有效。设单侧=0.05,=0.1时,试问应治疗多少人可以认为该药是有效的?,ua=1.6449u=1.2816=25=10n=(1.6449+1.2816)2(25)2/(10)2=54.955,2.1.2配对设计均数比较,20,2.2两样本均数比较试验组样本量为n,对照组样本含量为kn,当两组样本含量相等时,k=1。2.3多样本均数比较,2.实验研究设计样本含量估计,21,2.4.1样本率与总体率比较例6:某医师研究药物对产后宫缩、外阴创伤的镇痛效果,公认稳定有效的老药物镇痛有效率55%,若新药镇痛有效率达75%,可说明新药优于标准药物,需治疗多少例数?(设=0.05,=0.20)查表u0.05=1.6449,u0.2=0.8417为容许的误差,即允许样本率和已知总体率的最大容许误差。=0.75-0.55=0.2为已知总体率。=0.55,2.4定性资料的样本含量估计,n=(1.6449+0.8417)20.55(1-0.55)/(0.2)2=38.339,率,22,2.4.2两样本率比较,2.4定性资料的样本含量估计,率,此公式计算得到的样本量N为单样本量。试验组需要样本量为n时,对照组需要样本含量为kn。当两组样本含量相等时,k=1。式中pe、pc分别代表两组样本率,p代表两组的合并率。当两组样本含量相等时,k=1,p=(pe+pc)/2。,23,例7:初步观察甲、乙两药治疗湿疹的疗效,得甲药有效率60%,乙药有效率为85%,现拟进一步作治疗实验,设双侧=0.05,=0.1,两样本例数相等时,需要观察多少例能说明乙药效果优于甲药?查表u0.05/2=1.96,u0.1=1.282两样本例数相等k=1pe=0.85,pc=0.6,p=(pe+pc)/2=(0.85+0.6)/2=0.725pe-pc=0.85-0.6=0.25,2.4.2两样本率比较,n1=n2=2(1.96+1.282)20.725(1-0.725)/0.25=67.168,24,确定样本量的方法-查表法,按照研究条件直接查样本含量表来获得样本含量。样本含量表是统计学家为方便应用,根据特定公式按不同检验水准,检验效能1-等条件编制的数据表。研究目的不同,资料性质不同,估计方法不同,样本含量表也不同。,25,例1:某医院拟用抽样调查评价本地区健康成人白细胞数的水平,要求误差不超过0.2*109/L。根据文献报告,健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人?(双侧=0.05),估计总体均数所需样本含量,26,=1.5=0.2/=1.5/0.2=7.5,确定样本量的方法-查表法,公式计算法:u/2=1.96n=(1.96)2(1.5)2/(0.2)2=216.1217,27,样本均数与总体均数比较,例3:已知某地成年男性的血红蛋白含量(13515)g/L,拟在当地煤矿工人中对成年男性进行抽样调查,研究煤矿工人的血红蛋白量水平与当地一般成年男性无差异。根据专业医学知识,当血红蛋白含量相差10g/L以内时,认为二者无差异。取双侧=0.05,=0.10,问应检查多少煤矿工人?,ua/2=1.96u=1.2816n=(1.96+1.2816)2(15)2/(10)2=23.624,=15=10/=10/15=0.67,28,例4:某院普查市区2-6岁幼儿体格发育情况,其中体重未达标的幼儿,血红蛋白平均为100g/L,标准差25g/L。现欲使用抗贫血药物,如果治疗前后血红蛋白上升10g/L为有效。设单侧=0.05,=0.1时,试问应治疗多少人可以认为该药是有效的?,配对设计均数比较,=25=10/=10/25=0.4,ua=1.6449u=1.2816n=(1.6449+1.2816)2(25)2/(10)2=54.955,29,例7:初步观察甲、乙两药治疗湿疹的疗效,得甲药有效率60%,乙药有效率为85%,现拟进一步作治疗实验,设双侧=0.05,=0.1,两样本例数相等时,需要观察多少例能说明乙药效果优于甲药?,两样本率比较,pe=85%,pc=60%,=pe-pc=85%-60%=25%,若两样本率有小于50%者,取较小的样本率作为较小率;若两样本率均大于50%,则计算1-p,用1-pe、1-pc中较小者为较小率查表。pe=85%,pc=60%,1-pe=15%,1-pc=40%,n1=n2=2(1.96+1.282)20.725(1-0.725)/0.25=67.168,30,确定样本量的方法-查表法,31,PASS(Poweranalysisandsamplesize,网址为:http/)SAS统计软件,确定样本量的方法-计算机软件,32,样本含量估计的注意事项,1、选择恰当的估算样本含量的方法。2、尽量选择的总体单一,减少个体变异;尽量选择客观指标;选择较优实验设计方案,严格控制实验条件;成组设计的例数,应尽可能采用例数相等的设计,尤其是多组设计时,一般要求各组间的样本含量相等。,33,3、多种样本含量估计方法相结合。若某研究有多个效应指标,其样本含量估计应对每个效应指标进行样本量的估计,然后取样本数量最大者为其研究的样本量。若某研究能区分主要指标和次要指标时,也可以只对主要指标进行样本含量估计,然后取量大者为其研究的样本含量。,样本含量估计的注意事项,34,4、由于估算的样本含量是最少需要量,考虑到受试者可能有不合作者、中途失访、意外死亡等情况出现,而减少有效观察对象的例数(失访),因此,估算的样本含量必须考虑样本的丢失情况,进行实验时需增加1015的样本量。,样本含量估计的注意事项,35,吴胜贤,王成祥.临床研究样本含量估算M.北京:人民卫生出版社孙振球,徐勇勇.医学统计学第3版M.北京:人民卫生出版社,参考文献,36,第六章收集资料的方法,37,本章学习内容,第一节收集资料前的准备第二节自陈法第三节观察法第四节生物学测量法及其他方法,38,第一节收集资料前的准备,一、资料的定义资料收集:是指收集研究问题相关信息和测量研究变量的过程,是一个系统的有计划的过程。资料:课题研究过程中的全部资料,包括反映课题研究基本情况的资料。(广义)科研资料:根据研究目标,用系统的方式所收集、储存和处理的信息,它最终用以回答研究问题,也是研究产生的过程性资料。(狭义),39,资料的种类(根据资料的属性),第一节收集资料前的准备,资料,质性,量性,文字、图像声音、录像,1、2、35、6.,40,第一节收集资料前的准备,资料的来源一手资料:研究者根据研究目的和研究计划,通过使用不同资料收集方法所收集的资料,包括对研究对象进行调查、观察、访谈等方式收集的资料。二手资料:在其他课题的现有资料的基础上进行二次分析,得出新的研究结论。,41,第一节收集资料前的准备,常用的收集资料的方法问卷法访谈法观察法生物医学测量法德费尔法,自陈法,结构式、半结构式或者非结构式,42,第一节收集资料前的准备,设计收集资料方案前应考虑的问题1.研究目的2.研究设计复杂性3.研究可利用的资源4.研究对象特点5.是否存在霍桑效应,43,1.研究目的:明确研究的问题和目的是决定收集资料方法的关键因素。研究目的决定了所需资料的性质。研究目的:通过自我认识、自我情感体验、自我控制和调节,分析5岁、6岁幼儿的自我意识发展水平。方法:运用问卷法及观察法筛选社会

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论