




已阅读5页,还剩118页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第三章 总体均数的估计与假设检验 流行病与卫生统计学系,2,内 容 1. 均数的抽样误差与标准误 2. t分布(t- distribution) 3. 总体均数的估计 4. t检验 5. 假设检验注意事项 6. 正态性检验和两样本方差比较的F检验,3,第一节 均数的抽样误差 与标准误,统计推断:由样本信息推断总体特征。,4,正态(分布)总体: 可 利用样本均数推断总体均数,5,例3-1 若某市1999年18岁男生身高服从均数=167.7cm、标准差 =5.3cm的正态分布。对该总体进行随机抽样,每次抽10人,( =10),共抽得100个样本( =100),计算得每个样本均数 及标准差,6,将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图,9,以n=60为界限,10,标准误:表示样本统计量抽样误差大小的统计指标 均数标准误:说明均数抽样误差的大小,计算公式: (3-1),2、标准误(standard error, SE),实质:样本均数的标准差,11,数理统计证明:,12,若用样本标准差S来估计 , (3-2) 降低抽样误差的途径有: 通过增加样本含量 通过设计减少S,13,第二节 t 分布 (t-distribution),t分布概述 抽样误差的分布规律 样本 总体 t分布 理论 手段 (桥梁) 目的,14,15,一、t 分布的概念,16,17,式中 为自由度(degree of freedom, df),3实际工作中,由于 未知,用 代替,则 ,服从t 分布,18,二、t 分布的图形与特征,分布只有一个参数,即自由度,19,图3-3 不同自由度下的t 分布图,20,1特征:,21,2 t界值表: 详见附表2,可反映t分布曲线下的面积。 单侧概率或单尾概率:用 表示; 双侧概率或双尾概率:用 表示。,22,23,举例:,24,第三节 总体均数的估计,25,一、参数估计 用样本统计量推断总体参数 总体均数估计:用样本均数(和标准差)推断总体均数,26,27,总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围 如给定=0.05,该范围称为参数的95%可信区间或置信区间 如给定=0.01,该范围称为参数的99%可信区间或置信区间,2区间估计(interval estimation):,总体均数可信区间的计算 需考虑: (1)总体标准差是否已知 (2)样本含量n的大小 通常有两类方法: (1)t分布法 (2)u分布法,28,二、总体均数可信区间的计算,29,1. 单一总体均数的可信区间,单侧1-a可信区间则为:,(1)s未知:按t分布 双侧1-a可信区间则为:,30,例3-2 在例3-1中抽得第15号样本得均数 (cm),标准差 (cm),求其总体均数的95可信区间,31,32,33,34,例3-3 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。,35,故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47, 3.81)mmolL。,36,2. 两总体均数之差的可信区间: 从相等,但m不等的两个正态总体N(1, 2)和N(2, 2)进行随机抽样。则两总体均数之差(m1-m2)的双侧1-a可信区间为,37,38,同理,两总体均数之差(m1-m2)的单侧1-a可信区间为 当两样本的样本含量均较大时(如n1和n2均大于60),可按正态分布处理,39,例3-4 为了解氨甲喋呤(MTX)对外周血IL-2水平的影响,某医生将61名哮喘患者随机分为两组。其中对照组29例( ),采用安慰剂;实验组32例( ),采用小剂量氨甲喋呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10 IU/ml ( ),标准差为7.02 IU/ml ( );试验组治疗前IL-2的均数为16.89 IU/ml ( ),标准差为8.46 IU/ml ( )。问两组治疗前基线的IL-2总体均数相差有多大?,40,第一步:,41,1. 95%的可信区间的理解: (1)所要估计的总体参数有95%的可能性在我们所估计的可信区间内 (2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数 (3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数,42,三、可信区间的确切涵义,2.可信区间的两个要素 (1)准确度:用可信度(1)表示:即区间包含总体均数的理论概率大小 。 当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好 。 (2)精确度:即区间的宽度 区间愈窄愈好,如95%的可信区间比99%的可信区间要好 。,43,当n确定时,上述两者互相矛盾 提高准确度(可信度),则精确度降低 (可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间要好 相反,在实际应用中,95%可信区间更为常用,44,在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度,45,表3-2 总体均数的可信区间与参考值范围的区别,四、总体均数可信区间与参考值范围的区别,46,回 顾 均数的抽样误差:由于抽样造成的样本均数与总体均数的差别,样本均数间的差别 均数标准误:说明均数抽样误差的大小,t值服从t分布,t界值:单侧概率或单尾概率:用t, 表示 双侧概率或双尾概率:用t/2, 表示,总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围,47,1. 单一总体均数的可信区间,双 侧,单 侧,(1)未知,n小,(2)未知,n足够大 呢? (3) 已知呢?,2. 两总体均数之差的可信区间,双 侧,单 侧,48,第四节 t 检验,49,1、样本均数 与已知某总体均数 比较的t检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计 2、两个样本均数 与 比较的t检验 目的:推断两个未知总体均数 与 是否有差 别,用成组设计 3、配对设计资料均数比较的t检验 目的:推断两个未知总体均数 与 是否有差 别用配对设计,t 检验(student t 检验),对于大样本,也可以近似用u检验,t检验和u检验的应用条件: 1. t检验应用条件: 样本含量n较小时(如n60) (1)资料服从正态分布 (2)方差齐性(homogeneity of variance) 2. u 检验应用条件: 样本含量n较大,或n虽小但总体标准差已知 (1)正态分布 (2)方差齐性(homogeneity of variance),50,51,假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。根据H0成立的假设,计算检验统计量,最后获得P值来判断,假设检验基本思想及步骤,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白含量是否不同于正常成年男性平均值140g/L? 130.83g/L 140g/L 原因: 1.可能是总体均数不同 2.是抽样造成的,52,53,1.建立检验假设,确定检验水准 (选用单侧或双侧检验) (1)无效假设又称零假设,记为H0 (2)备择假设又称对立假设,记为H1 对于检验假设,须注意: 检验假设是针对总体而言 H0和H1是相互联系,对立的假设,后面的结论是根据H0和H1作出的,因此两者不是可有可无,而是缺一不可,54, H1的内容直接反映了检验单双侧。若H1中只是 0 或 0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向 单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。一般认为双侧检验较保守和稳妥,55,(3)检验水准,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取 = 0.05。可根据不同研究目的给予不同设置,56,57,3. 确定P值,P的含义是指从H0规定的总体随机抽样,抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量(如t、u等)值的概率 例3-5的P值可用图3-5说明,P为在=0=140g/L的前提条件下随机抽样,其 t 小于及等于-2.138和大于及等于2.138的概率,58,图3-5 例3-5中P值示意图,59,若 ,按所取检验水准a,拒绝H0,接受H1,下“有差别”的结论 统计学依据:在H0成立的条件下,得到现有检验结果的概率小于a,因为小概率事件不可能在一次试验中发生,所以拒绝H0,60,若 ,是否也能下“无差别”或“相等”的结论?,不能。正确的说法是按所取检验水准a,接受H1的统计证据不足。其统计学依据是,在H1成立的条件下,如果试验样本少,也同样可以得到 的检验结果,我们不知道下“无差别”或“相等”的结论犯错误的概率有多大,也就是说,假设检验方法不能为我们提供相信“无差别”结论正确的概率保证,一、单样本 T 检验 (ONE SAMPLE / GROUP T-TEST),即样本均数 (代表未知总体均数)与已知总体均数0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算,61,62,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L? (1)建立检验假设,确定检验水准 H0: =0 =140g/L,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值相等 H1: 0=140g/L,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值不等 =0.05,63,(2)计算检验统计量,本例n36, 130.83g/L,S25.74g/L,m0140g/L。按公式(3-15),64,(3)确定P值,作出推断结论,以=35、 查附表2的t界值表,因 ,故双尾概率0.02P0.05。按 = 0.05水准,拒绝H0,接受H1,有统计学意义 结合本题可认为从事铅作业的男性工人平均血红蛋白含量低于正常成年男性,65,配对t 检验适用于配对设计的计量资料 配对设计类型: 两同质受试对象分别接受两种不同的处理; 同一受试对象分别接受两种不同处理; 同一受试对象(一种)处理前后。,二、配对t 检验 (paired / matched t-test),d为每对数据得差值,Sd为差值得标准差,n为对子数,为差值的样本均数,为差值样本均数得标准误,例3-6 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里罗紫法测定其结果如表3-3第(1)(3)栏。问两法测定结果是否不同?,66,67,表3-3 两种方法对乳酸饮料中脂肪含量的测定结果(%),68,(1)建立检验假设,确定检验水准 H0:d0,即两种方法的测定结果相同 H1:d0,即两种方法的测定结果不同 =0.05 (2)计算检验统计量 本例n=10,d =2.724,d 2=0.8483,,69,(3)确定P值,作出推断结论 查附表2的t界值表得P0.001。按=0.05水准,拒绝H0,接受H1,有统计学意义 可认为两种方法对脂肪含量的测定结果不同,哥特里罗紫法测定结果较高,70,三、两样本t检验 (two-sample /group t-test),又称成组 t 检验,适用于完全随机设计两样本均数的比较,此时人们关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同处理组,适用范围: 完全随机设计两样本均数的比较 检验方法:依两总体方差是否齐性而定,71,1.总体方差相等的t检验 当两总体方差相等,即 时,可将两样本方差合并,求两者的共同方差 合并方差,72,例3-7 为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见表3-4,能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?,73,74,(1) 建立检验假设,确定检验水准,(2)计算检验统计量,75,(3)确定P值,作出推断结论,以=38、 ,查附表2的t界值表得P0.50。按=0.05 水准,不拒绝H0,无统计学意义。还不能认为阿卡波糖胶囊与拜唐平胶囊对空腹血糖的降糖效果不同,76,若变量变换后总体方差齐性 可采用t 检验(如两样本几何均数的t 检验,就是将原始数据取对数后进行t 检验) 若变量变换后总体方差仍然不齐 可采用t 检验或Wilcoxon秩和检验,若两总体方差不等( )?,77,2. Cochran & Cox近似t 检验 (t 检验) 调整 t 界值,78,注意: 当n1n2n时,v1v2v,tt,tata,v, 实际上没有起到校正的作用,采用缩小自由度的方式,vn-1(不是2n-2) 用双尾概率时,ta为ta/2,ta,v1和ta,v2取ta/2,v1和ta/2,v2,79,例3-8 在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜唐苹胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人,其8周时糖化血红蛋白HbA1c(%)下降值如表3-5。问用两种不同药物的病人其HbA1c下降值是否不同?,80,表3-5 对照组和试验组HbA1c下降值(%),对照组方差是试验组方差的3.77倍,经方差齐性检验,认为两组的总体方差不等,故采用近似 t 检验,81,(1)建立检验假设,确定检验水准(略),(2)计算检验统计量,82,(3)确定P值,作出推断结论 查t界值表t0.05/2,19=2.093。,由t=0.9650.05。按=0.05水准,不拒绝H0,无统计学意义。还不能认为用两种不同药物的病人其HbA1c下降值不同,83,3. Satterthwaite近似t检验 : 而Satterthwaite法则是对自由度校正,84,以=28.428、t=0.965查附表2的t界值表得0.20P0.40。结论同前,按Satterthwaite法对例3-8做检验,得,85,4.Welch法近似t检验 Welch法也是对自由度进行校正 校正公式为,86,对例3-8,如按Welch法,则,以=29.429、t =0.965查附表2的t界值表得0.20P0.40。结论同前,87,第五节 假设检验注意事项,一、I型错误和II型错误,假设检验是利用小概率反证法思想,根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误,88,表3-8 可能发生的两类错误,89,90,I 型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准) II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是(其值未知) 但 n 一定时, 增大, 则减少 1- :检验效能(power):当两总体确有差别,按检验水准 所能发现这种差别的能力,91,图3-6 I型错误与II型错误示意图(以单侧u检验为例),92,减少I型错误的主要方法:假设检验时设定小 值 减少II型错误的主要方法:提高检验效能 提高检验效能的最有效方法:增加样本量 如何选择合适的样本量:实验设计,二、假设检验应注意的问题 1.要有严密的研究设计 这是假设检验的前提。组间应均衡,具有可比性,除对比的主要因素外,影响结果的因素在对比组间应相同或相近其它可能 保证均衡性的方法主要是从同质总体中随机抽取样本,或随机分配样本,93,2.不同的资料应选用不同检验方法 应根据分析目的、资料类型以及分布、设计方案的种类、样本含量大小等选用适当的检验方法,94,3.正确理解“显著性”一词的含义 差别有或无统计学意义,过去称差别有或无“显著性”,是对样本统计量与总体参数或样本统计量之间的比较而言 相应推断为:可以认为或还不能认为两个或多个总体参数有差别,95,4.结论不能绝对化 因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用 报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,如写成P=0.040或0.02P0.05,而不简单写成P0.05,以便读者与同类研究进行比较,96,5. 统计结论必须和专业结论有机地相结合 若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义) 若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。若统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在问题,那么最终结论就没有意义,97,6.可信区间与假设检验各自不同的 作用,要结合使用,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1 可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义,98,99,图3-7 可信区间在统计推断上提供的信息,虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验 可信区间只能在预先规定的概率 检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值,100,101,第六节 正态性检验 和两样本方差比较的F检验,t 检验的应用条件是正态总体且方差齐性; 配对t 检验则要求每对数据差值的总体为正态总体 进行两小样本t检验时,一般应对资料进行方差齐性检验,尤其两样本方差悬殊时 若方差齐,采用一般的t 检验;若方差不齐,则采用t检验,102,一、正态性检验 (NORMALITY TEST),1图示法:P-P plot,Q-Q plot 2矩法 偏度系数(skewness), 峰度系数(kurtosis)。 3 W 检验法 4 D 检验法,103,104,图3-8 例3-1中100个样本均数的P-P图,105,图3-9 例3-1中100个样本均数的Q-Q图,106,矩法是利用数学上的矩原理来检验偏度和峰度。偏度指分布不对称的程度和方向,用偏度系数(coefficient of skewness)衡量,样本偏度系数用g1表示,总体偏度系数用1表示;而峰度则指分布与正态曲线相比的冒尖程度或扁平程度,用峰度系数(coefficient of kurtosis)衡量,样本峰度系数用g2表示,总体峰度系数用2表示,107,理论上,总体偏度系数1=0为对称,10为正偏态,10为尖峭峰,20为平阔峰 只有同时满足对称和正态峰两个条件时,才能认为资料服从正态分布,108,例3-9 试用矩法对表3-1中计算机模拟抽样所得100个样本均数进行正态性检验。,(1)建立检验假设,确定检验水准 H0:1=0且2=0,即总体服从正态分布 H1:1 0或/和2 0,即总体不服从正态分布 =0.10(欲不拒绝H0,宜稍大以减少II型错误),109,(2)计算检验统计量,(3)确定P值,作出推断结论,峰度P0.50,偏度P0.50。按=0.10水准,不拒绝H0,无统计学意义。还不能认为这些样本均数的总体不服从正态分布,二、两样本方差比较的F检验 两小样本T 检验时,检查两样本方差代表的总体方差是否相等,110,111,数理统计理论证明:当H0( )成立时, 服从F分布。F分布曲线的形状由两个参数1=n11和2=n21决定,F的取值范围为0。图3-10为1=1、2=10和1=5、2=10时F分布的图形,统计学家为应用的方便编制了附表3的F界值表,表中单尾或单侧的界值用 表示,双尾或双侧的界值则用 表示,112,求得F值后,查F界值表得P值(F值愈大,P值愈小),然后按所取的水准作出推断结论,检验是双侧检验。,113,图3-10 不同自由度时F分布的图形,114,例3-10 对例3-7,用F 检验判断两总体空腹血糖下降值的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 铅管样强直的临床护理
- 统编二年级上册《狐假虎威》教学设计
- 《花的勇气》信息化教学设计资料
- 腹腔室隔综合征的临床护理
- 儿童抗磷脂综合征的临床护理
- 病理生理休克课件
- 2025年内蒙古货运从业资格证考试模拟试题及答案解析
- 2025年防城港货运从业资格考试
- 2025年广州货运从业资格证模拟考试题目
- 2025年呼和浩特货运从业资格证考试科目
- 新209道100以内四个数字的加减法混合题目
- 山东省烟台市2024-2025学年高二地理下学期期末考试试题
- 非油气探矿权转让申请书
- 企业员工心理健康培训主题:构建和谐职场促进员工福祉
- 第七章第四节创新实验葡萄糖银镜反应实验的改进设计课件高一下学期化学人教版
- 2023年法律职业资格《客观题卷一》真题及答案
- 民宿合同转让协议书
- 航天科工网上测评题库
- 【新课标】Unit 3 My weekend plan 单元整体教学设计(5个课时 表格式)
- 2025年日历中文版横向排版周日开始带周数带节假日调休1
- 合同终止公函模板
评论
0/150
提交评论