总体均数估计与假设检验及t检验_第1页
总体均数估计与假设检验及t检验_第2页
总体均数估计与假设检验及t检验_第3页
总体均数估计与假设检验及t检验_第4页
总体均数估计与假设检验及t检验_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、定量资料的统计推断,在医学科研当中,常常要利用抽样研究的方法,通过对总体中部分样本的研究来估计总体。这种用样本的指标来推断总体的方法,统计上叫做“统计推断”,统计推断的方法是我们统计工作中最常用的方法。,参数估计 假设检验,统计推断的内容,参数估计,均数的抽样误差和标准误 t分布 总体均数的估计,既然是抽样研究,那么就一定存在着抽样误差(由于个体变异),每次抽到的样本均数之间或者样本均数与总体均数之间都不尽相同,总是有差别的。 因此,估计抽样误差的大小,就成为统计推断必须要解决的问题。,一、均数的抽样误差和标准误:,假设一个已知总体,从该总体中重复抽取样本量相等(为m)的样本n次,对每个样本计

2、算样本统计量(均数、方差等),观察n个样本统计量的分布规律抽样分布规律。 考察: 不同的分布-正态分布、偏态分布 不同的样本含量,抽样试验,由中心极限定理及大数定理得出: 若原变量X服从正态分布,随机抽取样本含量为n的样本均数 也服从正态分布。 即使从偏态总体中随机抽样,当n足够大(n50),样本均数也近似服从正态分布。 这个定理不仅具有理论价值,而且具有很高的实用价值。因为在实际工作当中,许多医学测量结果并不知道它的确切分布,有了这个性质,就可以利用正态分布的原理对其特征进行统计推断。,样本均数的分布:,从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n5,并计算其均数与标准

3、差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。 按上述方法再做样本含量n10、样本含量n30的抽样实验;比较计算结果。,抽样试验(n=5),抽样试验(n=10),抽样试验(n=30),3个抽样实验结果图示,样本均数的抽样分布特点,各样本均数未必等于总体均数; 样本均数之间存在差异; 样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布; 样本均数的变异较原变量的变异大大缩小。 随着样本含量的增加,样本均数的变异范围逐渐缩小。,均数的标准误(standard error of mean):,样本均数

4、之间的差异,反映了样本均数的离散程度,即为抽样误差。这时的样本均数的标准差,称为样本均数的标准误,简称标准误。,标准误的概念,抽样的样本量越大,标准误就越小; 原来总体变异度小,标准误就越小。 标准误反映了样本均数间的离散程度,也反映了样本均数与总体均数之间的差异。当标准误大时,用样本均数对总体均数的估计的可靠程度就小;反之亦然。,标准差与标准误,意义:标准差用于描述个体值之间的变异,即观察值间的离散度, 标准差小,表明观察值围绕均数的波动小;标准误描述统计量的抽样误差,即样本统计量与总体参数的接近程度。标准误小,表明抽样误差小,则统计量稳定,与参数接近。 用途:标准差表示观察值间波动的大小,

5、用于医学参考值范围;标准误表示抽样误差的大小,用于参数估计。 关系:随着样本含量增加,都减小。 联系:都是表示变异度的指标,当样本量一定时,两者成正比。,标准误用途,衡量样本均数的可靠性:标准误越小,表明样本均数越可靠; 参数估计:估计总体均数的置信区间(区域); 假设检验:用于总体均数的假设检验(比较)。,t-分布,t-distribution,t 分布的概念,用样本方差代替总体方差,此时 不再服从正态分布。而服从 t 分布。记为:,开创了小样本统计的新纪元,t分布主要用于总体均数的 区间估计和t检验!,t分布曲线,t 分布有如下性质: 单峰分布,曲线在t0 处最高,并以t0为中心左右对称

6、与正态分布相比,曲线最高处较矮,两尾部翘得高(见绿线) 随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。,t分布曲线下面积(附表2),双侧t0.05/2,92.262 单侧t0.025,9 单侧t0.05,91.833 双侧t0.01/2,93.250 单侧t0.005,9 单侧t0.01,92.821 双侧t0.05/2,1.96 单侧t0.025, 单侧t0.05, 1.64,三、总体均数的估计:,是一种参数估计,是统计推断的一个重要方面。是指用样本指标(称为统计量)估计总体指标(称为参数),这里我们主要介绍总体均数的估计。估计方式有点估计(point estimation)

7、和区间估计(interval estimation)两种。 1点值估计:是用样本统计量直接作为总体参数的估计值,这种方法虽简单,但未考虑抽样误差,一般不用。 2区间估计:是按一定的概率如95%估计总体均数所在的范围,即总体均数的可信区间或置信区间,通常用样本均数和均数的标准误来估计。估计方法:,总体均数估计方法,总体均数的估计:,点值估计(point estimation):例,120名成年男子血清铁含量的均数是18.57。那么,该总体范围(这个地区)的成年男子血清铁含量的均数就是18.57。这种方法虽简单,但未考虑抽样误差,一般不用。,区间估计(interval estimation),也称

8、置信区间。利用样本信息给出一个区间,并同时给出按预先给定的概率估计该区间包含总体均数的可能范围。,可信度:给定的概率称为可信度。用 表示。通常取99%、95%。,t分布方法,应用条件:总体方差未知,样本量小,例 某医师测的40名老年性慢性支气管炎病人尿中17-酮类固醇排出量均数为15.19umol/d,标准差为5.03umol/d,试估计该种病人尿17-酮类固醇排出量总体均数的95%可信区间。,分析条件:总体方差未知,样本量小,(13.5816.80),正态分布近似法,应用条件:当总体标准差已知时;或总体标准差未知,而样本量较大时(n50),例4.3 某市随机抽查12岁男孩100人,得身高均数

9、139.6cm,标准差6.85cm。计算该地12岁男孩身高均数的95%的可信区间。,分析条件:总体方差未知,但样本量大,用正态分布法,(-0.79,7.21),可信区间的意义:用样本均数估计出一个总体均数的范围,可信的程度有95%。也就是说总体均数落在这个范围的可能性有95%。 从理论上讲,这样估计100次,约有95次是对的,也就是总体均数在这个范围的可能性是95%,约有5次是不对的,也就是总体均数没有在这个范围的可能性是5%。,例题:随机抽样调查1998年某市区232例足月龄正常女婴的出生体重,结果见下表,试估计1998年该市区正常女婴的出生体重均数所在范围。,假设检验的推断原理 假设检验的

10、基本步骤 t检验和Z检验 两样本总体方差齐性检验 正态性检验 假设检验的两类错误 注意事项,假设检验(Hypothesis test),一、假设检验的推断原理,上面介绍过的区间估计方法是统计推断的内容之一(对总体参数做估计),假设检验是统计推断的另一重要内容(对总体参数做比较)。正是应用统计推断的理论和方法,人们才能顺利地通过有限的样本信息去把握总体特征,实现抽样研究的目的。,假设检验是对所估计的总体首先提出一个假设 (即假设样本来自这个总体),然后通过样本数据去推断是否拒绝这一假设,如果拒绝,认为该样本很可能不是来自这个总体;否则,认为该样本很可能来自这个总体。,例, 某医生测量了36名从事

11、铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?,由上面的例子可以看出,需要检验两个方面:与正常人群相同,均数之间的差别是由于抽样误差所致,抽样误差影响的可能性大,其它因素影响的可能性小。与正常人群不同,是由于从事铅作业环境条件的影响,抽样误差影响的可能性小。那么,如何进行判断呢?统计上就是以抽样误差发生的可能性,也就是以小概率事件发生来判断。,假设检验 通过对假设作出取舍抉择来达到解决问题的目的 A.从事铅作业男性工人血红蛋白含量的总体均数与一般成年男子的相等 无差异假设、零假设 H0

12、(null hypothesis) B.从事铅作业男性工人血红蛋白含量的总体均数与一般成年男子的不相等 对立假设、备择假设 H1(alternative hypothesis),证明A还是证明B? 在H0成立的条件下,均数之间的差异是由抽样误差引起的,有规律可循; 在H1成立的条件下,均数间的不同包含种种未知情形,无规律可循。 故从H0成立的角度出发,寻求其成立的概率。,变量值(血红蛋白)X服从正态分布,且为小样本,假定H0成立,样本均数服从t-分布,则 在H0成立的前提下,当前t值出现的概率有多大?,如何给出这个量的界限?,小概率事件在一次试验中基本上不会发生 !,从附表2中查出在显著性水平

13、=0.05(双侧),自由度为35所对应的t界值=2.318,即为拒绝域与接受域的界限。如果计算出的t统计量大于相应的t界值,则落在拒绝域中,该统计量出现的概率小于5%,为小概率事件。,-2.318,2.318,接受域,拒绝域,拒绝域,常取,的选择要根据实际情况而定,通常取0.05,检验水准的概念,在假设检验中,称预先规定的小概率值为检验水准,也称为显著性水准,用表示。,这里所依据的逻辑是:,如果H0 是成立的,那么衡量差异大小的某个统计量落入区域 拒绝域 是个小概率事件。如果该统计量的实测值落入拒绝域,也就是说, H0 成立下的小概率事件发生了,那么就认为H0不可信而否定它。否则我们就不能否定

14、H0 (只好接受它).,1. 建立检验假设,确定检验水准; H0:零假设、无效假设。是与研究假设有关的、被推断特征某种确定的关系; H1:备择假设、对立假设。是被推断总体特征的另一种关系或状况,与H0既有联系又互相对立。 检验水准,将小概率事件具体化,即规定概率不超过 就是小概率。 2. 根据试验设计、资料类型、统计方法的条件选择检验方法,计算相应的统计量; 3. 确定P值,下结论。,假设检验的基本步骤:,3确定P值,下结论.根据P值大小,在两个假设之间进行二者取一的选择。规则是: 如果P(0.05),意味着在H0设定的前提下发生了(支持H0的)小概率事件。怀疑H0的真实性(即推测实际情况应为

15、H1)。从而做出拒绝H0,接受H1的推断结论。 如果P(0.05),按照事先确定的标准,在H0的前提下没有发生(支持H1的)小概率事件,因而没有充足的理由对H0提出怀疑。于是做出不拒绝H0的推断结论。 无论做出哪一种推断结论,都面临着发生判断错误的风险。这就是假设检验的两类错误。,t 检验,t-test,三、t检验和Z检验(参数检验),以t分布为基础的检验称为t检验。t分布的发现使得小样本统计推断成为可能。因而,它被认为是统计学发展历史中的里程碑之一。 在医学统计学中,t检验是重要的假设检验方法之一。常用于两个均数之间差别的比较,并根据资料的分布情况及设计类型,选择不同的t检验方法。,本章结构

16、,单个样本t检验 配对样本t检验 两独立样本t检验 t检验中的注意事项 假设检验中两类错误,单样本t检验,One sample t-test,试验设计 一组样本均数(代表未知总体均数)与已知总体均数(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。,应用条件:样本来自正态分布的总体!,例:根据大量调查,已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查30名健康男子,求得脉搏均数为74.2次/分,标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?,建立检验假设,确定检验水准; 确定检验方法,计算统计量; 确定P值,下结论。 查附表2,t界值

17、为2.045,统计量小于界值,则P0.05。拒绝H1,接受H0,差异无统计学意义。尚不能认为该山区成年男子脉搏数与一般男子不同。,配对样本t检验,Paired design t-test,试验设计 配对设计 将受试对象按照某些重要特征(主要是非处理因素)配成对子,每对中的两个受试对象随机分配到两处理组。 特点 控制较多的个体变异,可比性好, 常用于个体变异较大的资料。 类型 将受试对象配成特征相近的对子,随机接受两种处理; 同一受试对象或同一份样品分成两份,随机分别接受不同处理; 同一受试对象处理前后的结果比较。,12名儿童分别用两种结核菌素的皮肤浸润反应结果(mm),12名接种卡介苗的儿童,

18、8周后用两批不同结核菌素,一批是标准结核菌素,一批 是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径 如下表,问两种结核菌素的反应性有无差别?,配对设计下的数据具有一一对应的特征,人们关心的变量是对子的效应差值而不是各自的效应值。把两种处理后的数据之差看作处理效果的一个样本,假定这种差值服从正态分布,那么其总体均数为0,即表明该处理没有作用。问题转化为单组完全随机化设计资料总体均数为零的检验。,应用条件:差值服从正态分布!,建立检验假设,确定检验水准; 计算统计量; 3. 确定P值,下结论。,假设检验的步骤,两种方法对乳酸饮料中脂肪含量的测定结果(%),两独立样本t检验

19、,Two independent sample t-test,试验设计 完全随机设计 将受试对象完全随机地分配到两组中,分别接受不同的处理;或者从两个总体完全随机地抽取一部分个体进行研究。 目的:比较两总体均数是否相同。 特点 设计简单易行。常用于个体变异较小、同质性较好的资料。,应用条件,两样本含量较小(n60); 两样本来源于正态分布的总体; 两总体方差相同,即方差齐性。 独立样本。,方差齐性检验 (homogeneity of variance test),查附表3F界值表。,附表3,方差齐性时,方差不齐时,检验统计量为:,校正临界值为:,有25例糖尿病患者随机分成2组,甲组单纯用药物治

20、疗,乙组 采用药物治疗合并饮食疗法,2个月后测空腹血糖(mmol/L), 问两组血糖值是否相同?,t=2.639,t0.05(23)=2.069,15.21,10.85,有两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠 体重增加量(g)如下表,问两组动物体重增加量的均数是否相等?,完全随机设计两样本几何均数比较的t检验,基本思想:某些资料不服从正态分布,两样本所代表的总体方差也可能不齐,但进行变量变换后(对数变换),则服从正态分布,相应的两总体方差也可能具有齐性。数据变换后两组间的关系并没有改变。,选甲型流感病毒血凝抑制抗体滴度(倒数)小于5者24人,随机 分为2组,每组12人。用甲型

21、流感病毒活疫苗进行免疫,一组 用气雾法,另一组用鼻腔喷雾法,免疫一个月后,分别测定血 凝抑制抗体滴度,结果如下表,问两种方法免疫的效果有无差 别?,Z检验: 这里,当样本含量较大时,t分布临界值接近Z分布临界值,可用1.96或1.645来代替 。这就是所谓的Z检验。,建议:不管大样本,小样本,均用t检验!,五、正态性检验,进行t检验的各种资料,必须满足符合正态分布的总体,若不能满足该条件,就不能进行t检验。,正态概率纸法: 以变量量纲的刻度(组段)为横坐标,以概率单位(相应频率转换)为纵坐标,将数据在直角坐标平面描点,为正态概率纸法。 如果数据服从正态分布,所描出的散点(尤其是中间的点)沿一直

22、线分布。,P-P图法: 以样本的实际累计频率作为横坐标,以按照正态分布规律计算的相应的理论累计概率作为纵坐标,把样本点在直角坐标平面中。所得到的点图就是P-P图。如果资料服从正态分布,样本点应围绕第一象限的对角线散布。 Q-Q图法: 以样本的实际分位数(PX)作为横坐标,以按照正态分布规律计算的相应的理论分位数作为纵坐标,把样本点在直角坐标平面中。所得到的点图就是Q-Q图。如果资料服从正态分布,样本点应围绕第一象限的对角线散布。 目前流行的统计学软件主要提供P-P图或Q-Q图。,统计检验法: W检验(S.S. Shapiro and M.B. Wilk):统计量为W 值。 D检验(DAgost

23、ino):统计量为D值。 矩法峰度与偏度检验、皮尔逊拟合优度检验等,也可以用于正态性检验。,25例正常人TL-6资料的P-P图,综合上述:t检验的应用条件是: 正态总体 方差齐性(完全随机设计的资料),七、 应用假设检验需要注意的问题:,1严格按照研究设计方案,收集客观的数据;样本的获取必须遵循随机的原则。 2应用检验方法必需符合其适用条件。 3正确理解差别有无统计意义。 4结论不能绝对化 5. 权衡两类错误的危害来确定的大小。 6对均数或概率作假设检验时,应与总体参数的区间估计结合进行。 7作假设检验应注意样本容量是否合理。,假设检验的前提是要有严密的抽样研究设计,这是假设检验的前提。组间应

24、均衡,具有可比性,也就是除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近。保证均衡性的方法主要是从同质总体中随机抽取样本,或随机分配样本。,选用的假设检验方法应符合其应用条件,应根据分析目的、资料类型以及分布、设计方案的种类、样本含量大小等选用适当的检验方法。如:配对设计的计量资料采用配对t检验。而完全随机设计的两样本计量资料,若为小样本且方差齐,则选用两样本t检验;若方差不齐,则选用近似t检验(Cochran & Cox法或Satterthwaite法)。若为大样本,则可选用大样本u检验。,正确理解差别有无统计意义

25、,统计“显著性”与医学/临床/生物学“显著性” 统计“显著性”对应于统计结论,而医学/临床/生物学“显著性”对应于专业结论。假设检验是为专业服务的,统计结论必须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义);若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。若统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在问题,那么最终结论就没有意义。,正确理解差别有无统计意义,例如:有人欲比较A、B两种降压药物的降压效果,随机抽取了高血压病人各100名,分别测定两组病人服药后舒张压的改变

26、值,得两组舒张压改变值之差的平均数为0.83 mmHg (0.11kPa)。作两大样本u检验得u=6.306,P0.001,有统计学意义。但因A、B两组高血压病人服药后舒张压改变值之差较小,仅0.83 mmHg,未达到有临床意义的差值5mmHg(0.67kPa),故最终结论没有意义。相反,若统计结论无意义,而专业结论有意义,那就应当检查设计是否合理、样本含量是否足够。,结论不能绝对化,因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,如写成P=0.040或0.02P0.05,而不简单写成P0.05,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。,假设检验中单侧检验与双侧检验,1.699,假设检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论