统计学-多组定量比较_第1页
统计学-多组定量比较_第2页
统计学-多组定量比较_第3页
统计学-多组定量比较_第4页
统计学-多组定量比较_第5页
已阅读5页,还剩64页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章多组定量资料的比较青岛大学医学院流行病与卫生统计教研室沈晓丽授课内容:第一节单因素方差分析第二节多个样本均数的两两比较第三节Kruskal-Wallis检验科研设计中只安排一种处理因素的设计称为单因素设计,不安排其他任何控制因素的单因素设计即为完全随机设计。如果单因素设计实验所得单变量资料满足每组资料服从正态分布并且方差齐性,则可用方差分析来处理。茶多酚保健饮料对小白鼠耐缺氧时间/min的影响组别对照组低剂量组中剂量组高剂量组合计耐缺氧时间Xij21.3123.4623.1420.3427.4826.9819.5419.5618.0317.3924.0324.3722.8216.0118.7220.1626.1324.4925.2421.3220.2319.4622.4725.6329.3828.8120.1618.7422.5118.4235.0724.3328.1133.9724.7421.8629.7928.6522.6825.1323.0134.4428.3231.6929.0430.2338.4736.8435.1038.6128.0127.1323.3728.7928.4433.2434.2231.6835.0828.29niXisi1521.54533.42741522.87673.55561528.05534.38121531.83334.53736026.07775.6984为什么不能用T检验?当k>2时,即检验两组以上的总体均数是否相等时,如采用前面所学两样本t检验进行两两比较,而得出结论,会使犯Ⅰ类错误的概率增大。

如从已知正态总体N(10,52)进行随机抽样,共抽取k=10组样本,每组样本含量均20,每组样本均数和标准差结果见表1。样本编号k1234567891012.6110.859.239.1110.909.249.5510.289.128.754.295.443.936.554.834.863.883.895.384.08表1从已知正态总体N(10,52)进行随机抽取10个样本的(ni=20)的结果

如要进行两两比较的t检验,即10个样本每两个进行,其比较的次数为:

实验结果表示:若=0.05,则在45次比较中,发现有5次有统计学意义,结果见表2。从理论上讲10个样本均来自同一正态总体,应当无差别,但我们用两样本比较的t检验时,规定=0.05,其实际犯第一类错误的概率为5/45=0.11,显然比所要控制的0.05要大。样本编号k1与31与61与71与91与10tp2.6010.0132.3290.0252.3720.0232.7270.0292.9180.006表2.45次比较中5次有统计学意义的结果需采用本章介绍的方差分析(ANOVA)

一、方差分析的基本思想例1某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人,低剂量组19人,对照20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表1所示。问治疗4周后,餐后2小时血糖下降值的总体平均水平是否不同?

高剂量组低剂量组对照组合计5.616.3-0.62.012.42.79.511.85.75.60.97.86.014.612.87.07.06.98.74.94.17.93.91.59.28.1-1.84.31.69.45.03.8-0.16.46.43.83.56.16.37.03.07.55.813.212.75.43.98.48.016.59.83.12.212.215.59.212.66.06.011.8211920609.19525.80005.43006.865017.360518.186712.384318.4176表32型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/L)总变异三个组共60人的餐后2小时血糖测定值大小不等;该变异既包含随机误差,又包含了三组用药即处理的不同组内变异仅反映随机误差包括个体差异和测量误差组间变异不同用药的影响及随机测量误差。变异的分解V总=N-1V组间=k-1V组内=N-k各种变异的表示方法SS总总MS总SS组内组内MS组内SS组间组间MS组间三者之间的关系:SS总=SS组内+SS组间总=组内+组间变异比较:F=

F=1:处理因素(三种药物)的作用相同。F>1:处理因素(三种药物)的作用不相同F服从自由度为ν1与ν2的F分布,见:p435附表3F与比较:F<,p>α处理因素的作用相同F≥,P≤α处理因素的作用不同表4完全随机设计设计方差分析的计算公式变异来源SSνMSF总组间组内N-1K-1N-KSS组间/组间SS组内/组内MS组间/MS组内(1)建立假设并确定检验水准

H0:三个总体均数相等;即μ1=μ2=μ3

H1:三个总体均数不等或不全相等

α=0.05

(2)计算检验统计量F值

二、完全随机设计的方差分析的基本步骤表5例1的方差分析表变异来源SSdfMSFP组间(处理组间)176.7612288.38065.537<0.01组内(误差)909.87235715.9627总1086.6335593)确定P值并作出推断结论以分子的自由度ν组间=2为ν1,分母的自由度ν组内=57为ν2,查附表,方差分析用F界值表,F0.05(2,57)=3.15F0.01(2,57)=4.98,F=5.537>F0.01(2,60)=4.98,P<0.01。在α=0.05水准上拒绝H0,接受H1可以认为三种人的血糖水平不同。例2为研究茶多酚保健饮料对急性缺氧的影响,将60只Wistar小白鼠随机分为低、中、高三个剂量组和一个对照组,每组15只小白鼠。对照组给予蒸馏水0.25ml灌胃,低、中、高剂量组分别给予2.0、4.0、8.0g/kg的饮料溶于0.2-0.3ml蒸馏水后灌胃,每天一次。40天后,对小白鼠进行耐缺氧存活实验,结果如下表。试比较不同剂量的茶多酚保健饮料对延长小白鼠的平均耐缺氧存活时间有无差别。表7各组小白鼠耐缺氧时间/min组别对照组低剂量组中剂量组高剂量组合计耐缺氧时间Xij21.3123.4623.1420.3427.4826.9819.5419.5618.0317.3924.0324.3722.8216.0118.7220.1626.1324.4925.2421.3220.2319.4622.4725.6329.3828.8120.1618.7422.5118.4235.0724.3328.1133.9724.7421.8629.7928.6522.6825.1323.0134.4428.3231.6929.0430.2338.4736.8435.1038.6128.0127.1323.3728.7928.4433.2434.2231.6835.0828.29niXisi1521.54533.42741522.87673.55561528.05534.38121531.83334.53736026.07775.6984(1)建立假设并确定检验水准

H0:四个总体均数相等;即μ1=μ2=μ3=μ4

H1:四个总体均数不等或不全相等

α=0.05

(2)计算检验统计量F值变异来源SSdfMSFP组间(处理组间)1017.413339.1421.14<0.01组内(误差)898.395616.04总1915.80593)确定P值并作出推断结论以分子的自由度ν组间=3为ν1,分母的自由度ν组内=56为ν2,查附表,方差分析用F界值表,F0.05(3,60)=2.76F0.01(3,60)=4.13,F=21.14>F0.01(2,60)=4.13,P<0.01。在α=0.05水准上拒绝H0,接受H1。可以认为不同剂量的茶多酚保健饮料对延长小白鼠的平均耐氧存活时间有差别。

注意:以上结论表明,总的说三种人的血糖水平有差别,但并不能说明任何两种人的血糖值均有差别。只能说可能至少有两组人的血糖值有差别,可能有的组间没有差别。要了解哪些组均数间有差别,哪些组均数间没有差别,需要进一步做两两比较。

当k=2时,对同一资料,单因素方差分析等价于成组设计的t检验,且F=t2。三、方差分析的条件1、各样本为独立的随机样本(独立)2、各样本来自正态总体(正态)3、各样本所代表的总体方差齐性或相等(方差齐)四、方差齐性检验(Levene检验法)(1)建立检验假设,确定检验水准H0:四个总体方差相等;即

H1:四个总体方差不等或不全相等

α=0.1

(2)计算检验统计量表例2的Levene方差齐性检验结果离差Zij计算方法FP0.760.5253(3)确定p值,做出统计推断F0.01(3,60)=2.76F=0.76<2.76p>0.1,按α=0.1的水准,不拒绝H0,尚不能认为四个总体方差不等或不全相等。五、数据变换数据变换的意义:使用一定的公式,对数据加以变换,使经过变换的新的随机变量:(1)满足方差齐性的要求;(2)对总体的正态性有所改善。平方根转换

1.适用资料:Poisson分布资料。Poisson分布资料的特点:方差随均数的变化而变化。2.计算:当原测量数据较小时,如x<10,甚至x=0时,可用平方根反正弦变换1.适用资料:呈二项分布的百分数资料。资料的要求:计算每个百分数的原基数相同。如:白细胞的分类计数都是数100个白细胞得出的中性粒细胞百分数等。2.计算:表不同温度对玫瑰花簇形成率(%)的影响病员编号低温室温高温140.048.049.0234.058.036.0334.049.040.0434.565.516.0534.555.515.0病员编号低温室温高温139.2343.8544.43235.6749.6036.87335.6744.4339.23435.9754.0323.58535.9748.1622.79表arcsin转换后的数据对数变换1.适用资料:

(1)对数正态分布资料(抗体滴度、潜伏期)

(2)等比级数资料;(3)正偏态分布的资料。2.计算:当原始观测值较小如x<10甚至x=0时,可用编号发汞含量(x)对数转换值(x=lgx)ⅠⅡⅢⅠⅡⅢ10.610.790.62-0.2147-0.1024-0.207020.721.011.01-0.14270.02910.004330.721.241.18-0.14270.09340.071941.021.411.470.00860.14920.167350.881.581.35-0.05550.19870.130361.361.751.520.13350.24300.181871.441.941.810.15840.28780.257781.902.541.860.27880.40480.269591.823.052.370.26010.48430.3747102.162.760.33450.4409均数1.261.711.600.06180.19870.1691标准差0.560.720.630.19770.18260.1869表3组人发汞含量比较注意:使用数据变换进行方差分析后,各均数间差别的比较以及可信限的计算,应该用转换后的数据,当分析最终结论时,应返回原测量单位加以说明。第七章多组定量资料的比较第一节单因素方差分析第二节多个样本均数的两两比较第三节Kruskal-Wallis检验一、LSD-t检验(最小有意义差异t检验)当LSD-t≥tα/2,v,即时,可认为在α水准上比较的两组总体均数μA和μB有差别。称为最小有意义差异,记做LSD。H0:,即任两对比组的总体均数相等H1:,即任两对比组的总体均数不等α=0.051、建立检验假设,确立检验水准

2、计算统计量:根据资料类型和检验方法选择3、确定P值,做出统计推断P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。按α=0.05水准,除对照组与低剂量组外,其他各比较组之间对延长小白鼠的耐缺氧生存时间的差别均具有统计学意义。二、Bonferroni法当比较次数m不多时,该法效果较好。m表示比较的次数1、建立检验假设,确立检验水准H0:,即任两对比组的总体均数相等H1:,即任两对比组的总体均数不等α=0.05

2、计算统计量:根据资料类型和检验方法选择对比组A与B两均数之差标准误tP(1)(2)(3)(4)(5)1与4-10.22801.46257.03<0.0011与3-6.51001.46254.45<0.0011与2-1.33141.46250.910.20~0.402与4-8.95661.46256.12<0.0012与3-5.17861.46253.54<0.0013与43.77801.46252.580.01~0.02表例2的Bonferroni检验计算表3、确定P值,做出统计推断P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。按α=0.05水准,除对照组与低剂量组外,其他各比较组之间对延长小白鼠的耐缺氧生存时间的差别均具有统计学意义。第七章多组定量资料的比较第一节单因素方差分析(属于参数检验)第二节多个样本均数的两两比较第三节Kruskal-Wallis检验(属于非参数检验)什么资料使用Kruskal-Wallis检验偏态分布资料方差不齐的资料有序分类变量Kruskal-Wallis检验的基本思路将大小为n1,n2,…,ng的样本混合起来成为一个新的数据集,将数据从小到大顺序编秩,每一个观察值在混合数据集中都有自己的秩。如果有相同的数值,则取秩的平均值,记观测值Xij的秩为Ri。对同一组所有观测值的秩求和得到Ri,再计算每组中平均秩次如果无效假设成立,则平均秩与所有资料平均秩(N+1)/2的偏差应该很小。可以证明,两组的Wilcoxon秩和检验是Krustal-Wallis统计量H在两样本时的特例。一、多个样本的比较当存在较多的相同秩次时,检验统计量H可以修正为:tj为第j个相同秩次的个数。例某研究者欲研究A、B两菌种对小鼠巨噬功能的激活作用,将60只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬功能的监测方法,获得三组的吞噬指数,试比较三组吞噬指数有无差别?对照组(1)A菌种(2)B菌种(3)吞噬指数秩次吞噬指数秩次吞噬指数秩次吞噬指数秩次吞噬指数秩次吞噬指数秩次1.301.02.3026.51.8014.52.6844.51.504.02.6040.01.402.02.3026.51.8014.52.7047.01.8014.52.6040.01.504.02.3026.52.2020.52.8049.51.8014.52.6040.01.504.02.4033.52.2020.53.0049.51.8017.02.7047.01.606.52.4033.52.2020.53.1051.02.0026.52.7047.01.606.52.2020.53.1054.52.3026.53.1054.51.7010.02.3026.53.1054.52.3033.53.1054.51.7010.02.3026.53.1054.52.4033.51.7010.02.3026.53.2054.52.4033.51.7010.02.6642.54.3058.02.4033.51.7010.02.6642.54.3029.52.4037.52.1018.02.6844.54.3059.52.5037.5Ri238.5956.5635.0ni172419

表不同菌种对小鼠巨噬细胞的吞噬指数(1)假设:H0:三个总体分布相同.

H1:三个总体分布不同或不全相同.

α=0.05

(2)编秩:将各组数据混合,由小到大排列并编秩,如遇相同数值取平均秩。

(3)求秩和:分别将各组秩次相加,求出各组秩和。

(4)计算检验统计量

22.537(5)确定P值和作出推断结论查表法χ2检验若组数等于k=3,每组例数小于等于5时,可查H界值表得出P值。若最小样本数大于5时,或组数大于3时则H分布近似服从=k-1卡方分布,查卡方界值表,得出P值。本例H=22.537>χ0.05,2,P<0.05,拒绝H0,接受H1,三组吞噬指数不等或不全相等。二、多个样本间的两两比较检验水准的调整通常有两种情况:1)多组间的两两比较2)实验组与同一对照组的比较(1)建立检验假设,确立检验水准H0:任两对比组的总体分布相同H1:任两对比组的总体分布不同α=0.05(2)编秩:将各组数据混合,由小到大排列并编秩,如遇相同数值取平均秩。

(3)求秩和:分别将各组秩次相加,求出各组秩和。

(4)计算检验统计量

对比组P值对照组与A菌种25.8255.544.66<0.001对照组与B菌种19.3925.363.62<0.001表三组样本秩和的两两比较(5)确定P值,做出统计推断P值的意义:如果总体状况和H0一致,统计量获

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论