医学统计学之总体均数的估计与假设检验.ppt_第1页
医学统计学之总体均数的估计与假设检验.ppt_第2页
医学统计学之总体均数的估计与假设检验.ppt_第3页
医学统计学之总体均数的估计与假设检验.ppt_第4页
医学统计学之总体均数的估计与假设检验.ppt_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 总体均数的估计与假设检验,第一节 均数的抽样误差与标准误,了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。 对无限总体不可能对所有个体逐一观 察,对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究。 借助抽样研究。,欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。 由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。 由个体变异和抽样造成的样本统计量与总体参数的差异,称为抽样误差。,这些来自同一总体的若干样本统计量间,也存在抽样误差。 在抽样研究中,抽样误

2、差是不可避免的。 由于其产生的根本原因是生物个体的变异性,故抽样误差分布具有一定的规律性。,例3-1 某市1999年18岁男生身高服从 =167.7cm、 =5.3cm正态分布,从该N(167.7, 5.32)总体中随机抽样 (图3-1)。 每次 =10人,共有样本g=100个,得到每个样本均数 及标准差 。 将上述100个样本均数看成新变量值,这100个样本均数构成一新分布。,样本均数抽样分布具有如下特点: 各样本均数未必等于总体均数; 各样本均数间存在差异(表3-1); 样本均数围绕总体均数(167.7cm) 呈正态分布(图3-2); 样本均数变异范围较原变量变异范 围大大缩小,这100个

3、样本均数的 均数为167.69cm、标准差为1.69cm。 在非正态分布总体中可进行类似抽样。,可得到如下结论: 若 服从正态分布 则 服从正态分布 若 不服从正态分布 n大:则 近似服从正态分布 n小:则 为非正态分布,的总体均数为;而 的标准差比原个体值的标准差要小,为区别两者, 的标准差用 表示。 样本统计量的标准差称标准误(standard error, SE)。 样本均数的标准差称均数的标准误(standard error of mean, SEM),反映样本均数间离散程度。,可证明均数标准误 在实际工作中常未知,用S来估计。均数标准误估计值,均数标准误大小与标准差大小成正比,与样本

4、含量n的平方根成反比。,第二节 t 分布,一、t 分布的概念 若某一随机变量X服从总体均数为、总体标准差为 的正态分布N(,2),由于样本均数服从总体均数为、总体标准差为 的正态分布N(, ),=2,n为计算某一统计量用到的数据个数,m为计算该统计量用到其它独立统计量的个数。,t分布最早 由英国统计学家W.S. Gosset 于1908年 以“Student”笔名发表, 故又称Students t-distribution。 它的发现, 开创了小样本统计推断的新纪元。,二、t分布的图形与特征 t分布是一簇曲线。不同,曲线形状不同(图3-3)。 单峰分布,以0为中心,左右对称越小,t值越分散,t

5、分布的峰部 越矮而尾部翘得越高; 当逼近, 逼近 ,t分布逼近u 分布。,t分布曲线下面积(概率P或)与横轴t值间的关系(附表2):,在t界值表中,一侧尾部面积称单侧概率,两侧尾部面积之和称双侧概率。 在相同自由度时, 值增大,P减小;在相同 值时,双尾P为单尾P的两倍。如双尾 =单尾 =1.812。,第三节 总体均数的估计,一、可信区间的概念,参数估计是用样本统计量推断总体参数。有点估计和区间估计两种。 点估计是用相应样本统计量直接作为其总体参数的估计值。如用 估计、S估计等。其方法虽简单,但未考虑抽样误差的大小。,区间估计是按预先给定的概率(1)所确定的包含未知总体参数的一个范围。该范围称

6、为参数的可信区间或置信区间(confidence interval, CI); 预先给定的概率(1)称为可信度或置信度(confidence level),常取95%或99%。,可信区间通常由两个数值即可信限/置信限(confidence limit, CL)构成。其中较小的值称可信下限(lower limit, L),较大的值称可信上限(upper limit, U),一般表示为LU。,二、总体均数可信区间的计算,1. 单一总体均数的可信区间 (1)未知:按t分布。 (2) 已知 或未知但n足够大(如n60)时: 按u分布。 2. 两总体均数之差的可信区间,1.单一总体均数的可信区间 (1)

7、未知: 双侧1可信区间 单侧1可信区间,例3-2 在例3-1中抽得第15号样本的 =166.95(cm),S=3.64(cm),求其总体均数的95%可信区间。 (cm) 故该地18岁男生身高均数的95%可信区间为(164.35, 169.55)cm。,(2)已知或未知但n足够大: 已知: 双侧1可信区间 单侧1可信区,未知但n足够大: 双侧1可信区间 单侧1可信区,例3-3 某地抽取正常成年人200名,测得其血清胆固醇均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数95%可信区间。 本例 =3.64、S=1.20、n=200、 =0.0849, =(

8、3.47, 3.81)(mmolL) 该地正常成年人血清胆固醇均数双侧95% 可信区间为(3.47, 3.81)mmolL。,2. 两总体均数之差的可信区间,双侧1可信区间 单侧1可信区间,三、可信区间的确切含义,从例3-1及表3-1可看出,在算得的100个样本均数的95%可信区间中,平均约有95个可信区间包含了总体均数,另外5个(第20号、31号、54号、76号和82号)不包括。,可信区间确切含义: 如果能够进行重复抽样试验,平均有(1)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为(1)。 在实际工作中,只能根据一次试验结果估计可信区间,就认为该区间包含了,该结论犯错误的概率

9、 。,可信区间估计的优劣取决两个方面: 一是可信度1,即区间包含的理论概率大小,愈接近1愈好。 二是区间的宽度,区间愈窄愈好。 当样本含量为定值时,上述两者互相矛盾。若只顾提高可信度,则可信区间会变宽。,四、总体均数可信区间与参考值范围的区别,第四节 t 检验和u检验,由样本信息推断总体特征,除参数估计外,还会遇到这样的问题: 某一样本均数是否来自于已知均数总体?两个不同样本均数是否来自均数相同的总体等? 要回答这类问题,更多的是用统计推断的另一方面 假设检验(hypothesis test)。,观测到的样本均数与总体均数间或两样本均数间差异的可能原因: 总体均数不同; 总体均数相同,差别由抽

10、样造成。 需要通过统计学假设检验来判断。,假设检验一般做法: 1.进行检验假设:假设样本对应的总体参数与某已知总体参数相等, 2.计算检验统计量:根据统计量分布规律, 3.确定P 值:根据检验统计量大小, 4.作出统计推断:根据P值判断样本信息是否支持原假设。 蕴含独特的逻辑和统计学思维方式。,t 检验(Students t-test) 当n较小时(如n60),要求样本随机地取自正态总体,两小样本均数比较要求所对应两总体方差相等 ,即方差齐性。 U 检验(U-test,亦称Z-test)。 要求n较大;或n虽小但总体标准差已知。,一、单样本t 检验,即 (代表未知)与已知0(理论值、标准值或稳

11、定值)比较。 例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?,(1)建立检验假设,确定检验水准 H0: =0=140g/L,从事铅作业男性工人平均血红蛋白含量与正常成年男性平均值相等。 H1: 0 , =0 。 (2)计算检验统计量,(3)确定P值,作出推断结论 t0.05/2,352.138t0.02/2,35 0.02P 0.05 按=0.05水准,拒绝H0,接受H1,有统计学意义。可认为从事铅作业男性工人的平均血红蛋白含量低于正常成年男性的。,二、

12、配对t 检验 又称成对t 检验。 按重要特征配对,随机分组。 两同质受试对象分别接受两种不同处理;同一受试对象分别接受两种不同处理;同一受试对象(一种)处理前后。,配对t 检验实质同单样本t 检验。 若两处理效应相同,即1=2,则12=0(当成已知总体0)。 差值的样本均数所代表的未知总体均数d与已知总体均数0=0的比较,,例3-6 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里罗紫法测定其结果如表3-3第(1) (3)栏。问两法测定结果是否不同?,(1)建立检验假设,确定检验水准 H0:d=0,两种方法的测定结果相同 H1:d

13、0, =0.05 (2)计算检验统计量,(3)确定P 值,作出推断结论 t=7.925t0.001/2,9=4.781 P0.001 按=0.05水准,拒绝H0,接受H1,有统计学意义。两种方法对脂肪含量的测定结果不同,哥特里罗紫法测定结果较高。,三、两样本t 检验 1.总体方差相等的t 检验 当两总体方差相等,可将两样本方差合并,求两者的共同方差 合并方差 。,例3-7 为研究国产四类新药阿卡波糖胶囊降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后空腹血糖,算得空腹血糖下降值

14、见表3-4,能否认为国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?,(1)建立检验假设,确定检验水准 H0:1=2 H1:1 2 =0.05,(2)计算检验统计量,=n1+n22=2(n1)=2(201)=38,(3)确定P值,作出推断结论 按=0.05 水准,不拒绝H0,无统计学意义。还不能认为阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同。,2.总体方差不相等的t 检验 数据变换后进行t 检验 秩转换的非参数检验(第8章) 近似t检验 t检验 (separate variance estimation t-test),t检验 Cochran & Cox法(1950) 对临

15、界值校正, Satterthwaite法(1946) 对自由度校正。 Welch法(1947) 对自由度校正。,四、u 检验,1.单样本u检验: 适用于n较大(n60)或0已知时。,2.两样本u 检验: 适用于两样本含量较大 (如n160且n260)时。,第五节 两均数的等效检验,前述两样本t检验,得到P,拒绝H0,可认为两总体均数不等。得到P,不拒绝H0,还不能证明两总体均数相等。 要推断两总体均数是否相等或相差很小,需借助等效检验(equivalence test)。 等效检验常用于新药临床试验评价,一、等效检验的基本步骤 例3-9 为研究某新药对高血脂患者胆固醇的降低作用是否同于标准药物

16、,随机将202例高血脂患者分为新药试验组和标准药物对照组,测得各组治疗前后胆固醇(mmol/L)降低的平均值和标准差如表3-6。若等效界值=0.52mmol/L,问新药和标准药物的疗效是否相同?,(1)建立检验假设,确定检验水准 H0: mmol/L,两药物不等效 H1: mmol/L,两药物等效 =0.05,(2)计算检验统计量 =0.52mmol/L,(3)确定P 值,作出推断结论 t=3.569t0.001/2,200=3.340 P 0.001。 按=0.05水准,拒绝H0,接受H1,有统计学意义。可认为新药和标准药物对降低胆固醇的疗效相同。,二、应用等效检验的注意事项 1. 值须在等

17、效试验前根据专业知识予以确定。研究者可把专业上或公认有临床实际意义的差值作为等效界值。如血压值为0.67kPa(5mmHg),胆固醇值为0.52mmol/L(20mg/dl),白细胞值为0.5 109/L(500个/mm3)。当难以确定时,可用0.20.5倍标准差作为参考。,2. 等效检验和一般假设检验即“差别检验”的基本思想一致。,等效检验和一般“差别检验”最大不同之处:采用两个同时进行的单侧检验去判断无效假设是否成立。 假定TC的等效区间为, ,判断试验药和对照药是否等效,第一次单侧t检验H1为:TC ,第二次单侧t检验H1为:TC ,只有两次单侧t检验均拒绝H0,接受H1,才能认为试验药

18、和对照药等效。,3. 在等效检验中,拒绝H0,接受H1,有统计学意义,所下专业结论是两总体均数等效。,第六节 假设检验的基本步骤 及注意事项,假设检验利用小概率反证法思想,从问题对立面(H0)出发间接判断要解决的问题(H1)是否成立。在H0成立的条件下计算检验统计量,获得P值来判断。当P ,就是小概率事件。 小概率事件原理:小概率事件在一次抽样中发生的可能性很小,如果它发生了,则有理由怀疑H0,认为H1成立,该结论可能犯的错误。,一、假设检验的基本步骤 1.建立检验假设,确定检验水准: (1)=0:检验假设(hypothesis under test),常称无效假设或零假设(null hypo

19、thesis)。用H0表示。 (2)0:备择假设,常称对立假设(alternative hypothesis)。用H1或HA表示。,注意事项: 针对总体而不是针对样本而言; H0和H1是相互联系、对立假设,结论根据H0和H1作出,两者缺一不可; H0通常是:某两个(或多个)总体参数相等,或某两个总体参数之差等于0,或无效,或某资料服从某一特定分布等;,H1反映了检验的单双侧。 H1:0或0 ,单侧检验。有无差异,差异方向。 H1:0 ,双侧检验。 单双侧检验确定,首先根据专业知识,其次根据所要解决的问题。双侧检验较保守和稳妥。,(3):检验水准,也称显著性水准,它属于I型错误的范畴。是预先规定

20、的概率值,它确定了小概率事件标准。在实际工作中常取=0.05。但并非一成不变。,2.计算检验统计量 应根据变量和资料类型、设计方案、统计推断的目的、方法的适用条件等选择检验统计量。 所有检验统计量都是在H0成立的前提条件下计算出来的。,3.确定P 值,作出推断结论 P 的含义是指从H0规定的总体中随机抽样,其检验统计量等于及大于现有样本获得检验统计量值的概率。 根据获得的事后概率P,与事先规定的概率进行比较,看其是否为小概率事件而得出结论。,结论应包含统计结论和专业结论。统计结论只说明有统计学意义(statistical significance)或无统计学意义(no statistical

21、significance),而不能说明专业上的差异大小。它必须同专业结论有机结合,才能得出恰如其分、符合客观实际的最终结论。,若P ,结论为按检验水准,拒绝H0,接受H1,有统计学意义(统计结论)。可认为不同, 高于(专业结论)。 若P,结论为按检验水准,不拒绝H0,无统计学意义(统计结论)。还不能认为不同(专业结论)。,P过去称“无显著性”,文献中常用NS(non-significant / no significance)表示,“阴性结果”。 虽然否定之否定为肯定,但不拒绝H0不等于接受H0,因此时证据不足。可暂时“接受”它,或“阴性待诊”。 下结论时,对H0只能说:拒绝或不拒绝;对H1只

22、能说:接受H1。,二、I型错误和II型错误,是预先规定允许犯I型错误概率的最大值,可取单尾亦可取双尾。 II型错误的概率大小用 表示, 只取单尾, 值的大小一般未知,须在知道两总体差值 (如12等)、及n 时,才能算出(图3-6)。,1 称检验效能(power of a test),过去称把握度。为当两总体确有差异,按检验水准所能发现该差异的能力。1只取单尾。 愈小, 愈大; 愈大, 愈小。若要同时减小和,唯一方法是增加样本含量n。,若重点减少(如一般假设检验),一般取=0.05; 若重点减少(如方差齐性检验,正态性检验等),一般取=0.10或0.20甚至更高。 拒绝H0,只可能犯I型错误,不

23、可能犯II型错误;“接受”H0,只可能犯II型错误,不可能犯I型错误。,三、假设检验应注意的问题 1.要有严密的研究设计 组间应均衡,具有可比性,也就是除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近。,2.不同资料应选用不同检验方法 配对设计计量资料:配对t检验。 完全随机设计两样本计量资料: 小样本(任一ni60)且方差齐,两样本t检验;若方差不齐,近似t检验。 大样本(所有ni60),u检验。,3.正确理解“显著性”一词的含义 差别有或无统计学意义,过去称差别有或无“显著性”,是对样本统计量与总体参数或样本统计

24、量之间的比较而言,相应推断为:可以认为或还不能认为两个或多个总体参数有差别。,4.结论不能绝对化 因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,而不简单写成P0.05,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。,5.统计“显著性”与医学“显著性” 统计“显著性”对应统计结论,医学“显著性”对应专业结论。 统计结论有意义,专业结论无意义,最终结论没有意义,样本含量过大或设计存在问题。统计结论无意义,专业结论有意义,检查设计是否合理、样本含量是否足够。,6.可信区间与假设检验区别和联系

25、 可信区间说明量的大小即推断总体均数范围,假设检验推断质的不同即判断两总体均数是否不等。 可信区间可回答假设检验问题,可信区间若包含了H0 ,按水准,不拒绝H0;若不包含H0 ,按水准,拒绝H0 ,接受H1。,可信区间不但能回答差别有无统计学意义,还能提示差别有无实际专业意义(图3-7)。 可信区间不能够完全代替假设检验。可信区间只能在预先规定概率的前提下进行计算,假设检验能获得一较为确切的P值。,第七节 正态性检验 和两样本方差齐性检验,两小样本t 检验:相应的两总体为正态总体且两总体方差相等,即方差齐性; 配对t 检验:每对数据差值的总体为正态总体。,一、正态性检验 1.图示法 概率图(probab

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论