




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第九章第九章 数值变量资料的数值变量资料的统计推断统计推断第一节 均数的抽样误差与总体均数的估计第二节 假设检验的基本思想和基本步骤第三节 t检验和u检验第四节 方差分析第五节 假设检验中的两类错误及应注意的问题第一节第一节 均数的抽样误差与总体均数的估计均数的抽样误差与总体均数的估计l均数的抽样误差和标准误lt分布l总体均数置信区间的估计 一、均数的抽样误差和标准误 了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。 对无限总体不可能对所有个体逐一观察,对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究。 借助抽样研究
2、。抽样误差抽样误差l从总体均数 为155.4cm,标准差 为5.3cm的正态分布总体中随机抽样。样本大小为30。,nnXS2, 11,X Sn=3033,XS22,XS .从正态总体从正态总体 抽样得到的抽样得到的1000个样本均个样本均数的频数分布数的频数分布(ni=30)2(155.4,5.3 )NMean=155.426 Std=0.966抽样误差抽样误差l结果:l各样本均数不一定等于总体均数l样本均数间存在差异l样本均数的分布规律:围绕总体均数上下波动l样本均数的变异:由样本均数的标准差描述。 例: 欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男
3、性作为样本。 由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。 由个体变异和抽样造成的样本统计量与总体参数的差异,称为抽样误差。 这些来自同一总体的若干样本统计量间,也存在抽样误差。 在抽样研究中,抽样误差是不可避免的。 由于其产生的根本原因是生物个体的变异性,故抽样误差分布具有一定的规律性。小结:抽样误差小结:抽样误差l抽样误差Sampling error l由抽样引起的样本统计量与总体参数间的差异l来源:l个体变异l抽样l表现l样本统计量与总体参数间的差异l样本统计量间的差异l样本均数的规律性l随机的l在概率意义下是有规律的-抽样分布l通过大量重复抽样,借助频数表描述l样本均数的
4、变异规律(抽样分布)与个体观察值变异规律有关l即使只有一个样本资料,也可由样本资料的个体观察值的变异规律间接得到样本均数的变异规律抽样分布抽样分布例:某市1999年18岁男生身高服从 =167.7cm、 =5.3cm正态分布,从该N(167.7, 5.32)总体中随机抽样。每次 =10人,共有样本g=100个,得到每个样本均数 及标准差 。将上述100个样本均数看成新变量值,这100个样本均数构成一新分布。 jnjSjX样本均数抽样分布具有如下特点:1. 各样本均数未必等于总体均数;2. 各样本均数间存在差异;3. 样本均数围绕总体均数(167.7cm)呈正态分布;4. 样本均数变异范围较原变
5、量变异范围大大缩小,这100个样本均数的均数为167.69cm、标准差为1.69cm。 在非正态分布总体中可进行类似抽样。 可得到如下结论:可得到如下结论: 若若 服从正态分布服从正态分布 则则 服从正态分布服从正态分布 若若 不服从正态分布不服从正态分布 n n大:则大:则 近似服从正态分近似服从正态分布布 n n小:则小:则 为非正态分布为非正态分布iXjXiXjXjX 的总体均数为的总体均数为;而;而 的标准的标准差比原个体值的标准差要小,为区差比原个体值的标准差要小,为区别两者,别两者, 的标准差用的标准差用 表示。表示。样本统计量的标准差称标准误样本统计量的标准差称标准误(stand
6、ard error, SE)(standard error, SE)。样本均数的标准差称均数的标准误样本均数的标准差称均数的标准误(standard error of mean, SEM)(standard error of mean, SEM),反映样本均数间离散程度。反映样本均数间离散程度。jXjXXjX可证明均数标准误在实际工作中常未知,用S来估计。均数标准误估计值 XnXSSn均数标准误大小与标准差大小成正比,与样本含量n的平方根成反比。 减小抽样误差的方法减小抽样误差的方法增大样本含量增大样本含量n ;选择标准差较小的指标。选择标准差较小的指标。标准误的应用标准误的应用表示抽样误差的
7、大小,说明样本均数推论总体均数的可表示抽样误差的大小,说明样本均数推论总体均数的可靠性。(标准误越小,可靠性越好;反之,标准靠性。(标准误越小,可靠性越好;反之,标准误越大,可靠性越差)误越大,可靠性越差)估计总体均数的可信区间(参数估计)。估计总体均数的可信区间(参数估计)。用于均数的假设检验。用于均数的假设检验。 例:在例8.1中,n=132, 4.653mmol/L,s0.40066mmol/L,请计算标准误。 (0.03487mmmol/L)x标准误与标准差的关系标准误与标准差的关系标准误标准误 与标准差成正比;与标准差成正比;标准误标准误 与样本含量与样本含量n的平方根成反比(说明增
8、大样本含的平方根成反比(说明增大样本含量可以减少抽样误差);量可以减少抽样误差);标准误与标准差的意义不同(标准差反映了变量值的离标准误与标准差的意义不同(标准差反映了变量值的离散程度,标准误则反映了均数的离散程度)。散程度,标准误则反映了均数的离散程度)。标准误的应用标准误的应用反映抽样误差的大小(样本均数的离散程度;样本均数反映抽样误差的大小(样本均数的离散程度;样本均数与总体均数的接近程度;均数的代表性如何。)与总体均数的接近程度;均数的代表性如何。)用于计算其它统计指标(参数估计、假设检验)。用于计算其它统计指标(参数估计、假设检验)。均数的标准差和标准误的区别标准差标准误意义描述观察
9、值的变异程度。其值越小,观察值的变异程度越小,均数的代表性越好描述样本均数的变异程度,说明抽样误差的大小。其值越小,估计总体均数的可靠性越大计算用途描述资料的频数分布状况,可用于制定医学参考值范围用于表示抽样误差大小、总体均数的区间估计和均数的假设检验等二、二、t t 分布分布(一)(一) t t 分布的概念分布的概念若某一随机变量若某一随机变量X X服从总体均数为服从总体均数为、总、总体标准差为体标准差为 的正态分布的正态分布N(N(, ,2)2)1 ,0(2NXu)1,0(2NXuX 由于样本均数服从总体均数为由于样本均数服从总体均数为、总体标、总体标准差为准差为 的正态分布的正态分布N(
10、 N( , ) , ) 2XX, 1XXXtnSSnnmn为计算某一统计量用到的数据个数,m为计算该统计量用到其它独立统计量的个数。 XXut分布最早由英国统计学家W.S. Gosset于1908年以“Student”笔名发表,故又称Students t-distribution。它的发现,开创了小样本统计推断的新纪元。 总体为N的m个样本(样本大小为n)的t值xsxtm个样本的均数 标准误 t值 1x 1xs t1 2x 2xs t2 3x 3xs t3 mx mxs tm t分布的特征:以0为中心的对称分布;与U分布比,曲线低平;t分布是一簇曲线,形态与自由度(n-1)有关。 t分布与标准
11、正态分布的比较1、二者都是单峰分布,以0为中心左右对称。2、t分布的峰部较矮而尾部翘得较高说明远侧的t值个数相对较多即尾部面积(概率P值)较大。当逐渐增大时,t分布逐渐逼近标准正态分布,当=时,t分布完全成为标准正态分布。t 界值表(附表9-1 )t/2,:表示自由度为,双侧概率P为时t的界值01-12-2-33f(t),05. 0t,05.0tt 界值:界值:自由度的自由度的 t 分布曲线下两侧尾部面积或单侧尾部面积为指定值分布曲线下两侧尾部面积或单侧尾部面积为指定值时,横轴上相应的时,横轴上相应的 t 值,值,记为记为 t,。大于。大于或小于或小于某个某个 t 界界值的两侧尾部面积之和或单
12、侧尾部面积称为值的两侧尾部面积之和或单侧尾部面积称为概率(概率(P) 。 t 界值记法界值记法: t0.05/2,为双侧为双侧=0.05 时时的的 t 界值;界值;t0.01/2,为双侧为双侧=0.01 时时的的 t 界值。界值。 (u0.05/2=1.96,u0.01/2=2.58) t0.05,为单侧为单侧=0.05 时时的的 t 界值;界值;t0.01,为单侧为单侧=0.01 时时的的 t 界值。界值。 (u0.05=1.645,u0.01=2.326) 05.0Ptt05.0Pttv ,05.0v ,05.0,;, t分布曲线下的面积规律:中间95%的t值:- t0.05/2, t0.
13、05/2,中间99%的t值:- t0.01/2, t0.01/2,单尾概率:一侧尾部面积双尾概率:双侧尾部面积(1)自由度()一定时,p与t成反比;(2)概率(p)一定时,与t成反比;计量资料统计推断一般包括以下两个方面:一般包括以下两个方面: 参数估计:用样本指标估计总体指标参数估计:用样本指标估计总体指标 (1) (1)点估计:用样本均数直接作为总体均数的估计值点估计:用样本均数直接作为总体均数的估计值 优点优点: :简单简单 缺点:没有考虑抽样误差缺点:没有考虑抽样误差 (2) (2)区间估计:常用区间估计:常用95%95%的可信区间的可信区间 假设检验假设检验 三、总体均数置信区间的估
14、计三、总体均数置信区间的估计 点估计 区间估计 意义 直接用样本统计量代替总体均数 用统计量x和xs确定一个有概率意义的区间,该区间具有较大的可信度包含总体均数 估计方法 以x作为估计值 小样本(xvstx,xstx,) 大样本(xsux,xsux) 区间估计:根据选定的置信度(或可信度,用概率表示)估计总体参数所在的范围。 置信度:估计正确的概率。1- 置信区间(confidence level, CI): 可信区间总体均数的可信区间 按一定的可信度由样本均数计算的总体按一定的可信度由样本均数计算的总体均数可能所在的范围,这个范围称为总体均均数可能所在的范围,这个范围称为总体均数的可信区间。
15、数的可信区间。方法:方法:(1) u (1) u 分布法分布法(2) t (2) t 分布法分布法总体均数的95可信区间l总体均数的95可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)区间估计公式的推导: )()(ttt )()(tsxtx xxstxstx)()( 故小样本资料的95%CI: (xstx)(05. 0,xstx)(05. 0) 99%CI: (xstx)(01. 0,xstx)(01. 0) 大样本资料的95%CI: (xsx96. 1,xsx
16、96. 1) 99%CI: (xsx58. 2,xsx58. 2) 区间估计的准确度:说对的可能性大小,区间估计的准确度:说对的可能性大小, 用用 (1-) 来衡量。来衡量。99%的可信区间好于的可信区间好于95%的可信区间的可信区间(n, S一定时)一定时) 。区间估计的精确度:指区间范围的宽窄,范围越宽区间估计的精确度:指区间范围的宽窄,范围越宽精确度越差。精确度越差。99%的可信区间差于的可信区间差于95%的可信区间的可信区间(n, S一定时)一定时) 。 准确度与精确度的关系:在准确度确定的情况下,准确度与精确度的关系:在准确度确定的情况下,增加样本含量可提高精确度。增加样本含量可提高
17、精确度。可信区间估计的优劣可信区间估计的优劣 例:某地抽取正常成年人200名,测得其血清胆固醇均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数95%可信区间。 本例 =3.64、S=1.20、n=200、 =0.0849, =(3.47,3.81)(mmolL) 该地正常成年人血清胆固醇均数双侧95%可信区间为(3.47, 3.81)mmolL。XXS0.05/21.96u3.64 1.96 0.0849, 3.641.96 0.0849 例:随机抽取某地健康男子18人,测得空腹静脉血的甘油三酯,均数 为1.298mmol/L,标准差s为0.663,
18、试估计该地男子空腹静脉血甘油三酯总体均数的95置信区间。 (0.9681.628)x注注意意: (sx96. 1,sx96. 1)与(xsx96. 1,xsx96. 1)的区别 (sx96. 1,sx96. 1)表示95频数分布范围、正常值范围; (xsx96. 1,xsx96. 1)表示95可信区间,该区间有95的把握包含了总体均数,或总体均数有95的可能性落在该区间。 总体均数可信区间与参考值范围的区别总体均数可信区间总体均数可信区间参考值范围参考值范围含义含义按预先给定的概率,确定未知参数按预先给定的概率,确定未知参数 的的可能范围。实际上一次抽样算得的可信可能范围。实际上一次抽样算得的
19、可信区间要么包含总体均数,要么不包含。区间要么包含总体均数,要么不包含。95%CI估计错误的概率估计错误的概率0.05.总体均数的波动范围总体均数的波动范围“正常人”的解剖,生理,生化某项指标的波动范围。个体值的波动范围计算计算公式公式 未知:未知: 已知或已知或 未知但未知但n60: 或或正态分布正态分布偏态分布偏态分布 PX P100X用途用途总体均数的区间估计总体均数的区间估计绝大多数绝大多数(如如95%)观察对象观察对象某项指标的分布范围某项指标的分布范围,XXtS XXuXXu SXu S 由样本信息推断总体特征,除了参数估由样本信息推断总体特征,除了参数估计外,还会遇到这样的问题:
20、计外,还会遇到这样的问题: 某一样本均数是否来自于已知均数总体?某一样本均数是否来自于已知均数总体?两个不同样本均数是否来自均数相同的总体两个不同样本均数是否来自均数相同的总体等?等? 要回答这类问题,更多的是用统计推断要回答这类问题,更多的是用统计推断的另一方面的另一方面假设检验假设检验(hypothesis test)(hypothesis test)。第二节第二节 假设检验的基本思想和基本步骤假设检验的基本思想和基本步骤观测到的样本均数与总体均数间或两样本均数间差异的可能原因:1. 总体均数不同;2. 总体均数相同,差别由抽样造成。需要通过统计学假设检验来判断。l假设检验的基本思想假设检
21、验的基本思想l l 以一定假设为前提,通过计算某种以一定假设为前提,通过计算某种统计量(统计量(t、U、F等)来判断假设成立的可等)来判断假设成立的可能性大小,如果假设成立的可能性大,就能性大小,如果假设成立的可能性大,就接受这个假设;反之,则拒绝这个假设。接受这个假设;反之,则拒绝这个假设。假设检验的一般步骤假设检验的一般步骤1.1.建立假设和设定检验水准建立假设和设定检验水准2.2.无效假设无效假设H0H0: ;3.3.备择假设备择假设H1H1: (双侧检验)(双侧检验) 4.4. 或或 (单侧检验)(单侧检验)5.5. =0.05=0.056.6. 0000 检验水准:过去称显著性水准,
22、用表示。是预先规定的小概率事件的概率值,为允许结果出现错误的概率,或出现假阳性的概率,常取=0.05或0.01。未未知知总总体体均均数数 与与已已知知总总体体均均数数 0的的比比较较 目目的的 H0 H1 双双侧侧检检验验 是是否否 0 = 0 0 单单侧侧检检验验 是是否否 0 是是否否 0 = 0 = 0 0 0 两两未未知知总总体体均均数数 1与与 2的的比比较较 目目的的 H0 H1 双双侧侧检检验验 是是否否 1 2 1= 2 1 2 单单侧侧检检验验 是是否否 1 2 是是否否 1 2 1= 2 1= 2 1 2 1 2 2.选择相应统计方法,计算统计量选择相应统计方法,计算统计量
23、3. 两均数的差别:两均数的差别:t、U检验(检验(t、U值)值)4. 多个均数的差别:方差分析(多个均数的差别:方差分析(F值)值)5. 两个率的差别:两个率的差别:2检验(检验(2值)值)3. 确定确定P值和做出统计推断值和做出统计推断 P值是指由值是指由H0所规定的总体作随机抽样,所规定的总体作随机抽样,获得大于等于和(或)小于等于统计量获得大于等于和(或)小于等于统计量观察值的概率。观察值的概率。0,10,HHH,不拒绝,则,接受,拒绝,则PttPtt若检验统计量现有统计量,则P,结论为按所取的 检验水准 ,拒绝 H 0,接受H1,有统计学意义(统计结论)。可认为不同或不等(专业结论)
24、 若检验统计量现有统计量,则P,结论为按 检验水准 ,不拒绝 H 0,无统计学意义(统计结论)。尚不能认为不同或不等(专业结论) 0-1.9601.96095%2.5%2.5%接受域接受域拒绝域拒绝域拒绝域拒绝域假设检验 图 a 单 侧 检 验 ( t 检 验 ) 图 b 双 侧 检 验 ( t 检 验 ) )(tf 2/ 2/P 0 t t 不 拒 绝 H0 拒 绝 H0 2/ 2/P t t 拒 绝 H0 )(tf P 0 t t 不 拒 绝 H0 拒 绝 H0 例9.2 某地抽查了26名男性管理人员的空腹血糖,均数 为4.841mmol/L,标准差s为0.854mmol/L,已知大量调查
25、的一般健康成年男性空腹静脉血糖均数为4.70mmol/L。试问能否认为该地抽查的26名健康男性管理人员的空腹血糖均值与一般正常健康成年男性的均值不同?x例例9.21. 建立假设,确定检验水准:H0 0 H1 0 0.05 2. 计算检验统计量t 值:844. 026/854. 07 . 4841. 4n/Sxsxtx 3. 确定P值,判断结果 t0.8440.05 按0.05,不拒绝 H0,不能认为健康男性健康管理人员的血糖均数与一般成年男性的均数不同。 第三节第三节 t检验和检验和u检验检验l样本均数与总体均数的比较l配对资料的比较l两个样本均数的比较一、小样本均数与已知总体均数比较的一、小
26、样本均数与已知总体均数比较的t t检验检验 已知的总体均数:一般为理论值、标准值或经过大量观察所得的稳定值(0)。 比较的目的:样本所代表的未知总体均数与已知的总体均数0是否不同。 统计量t的计算公式: = n - 10/XtSn例1. 根据大量调查,已知健康成年男子脉搏的均数为72次/分钟,某护士在一山区随机测量了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?建立假设:建立假设: H0:0 H1:0 确定检验水准:确定检验水准:0.05 计算计算 t值:值: 692. 125/5 . 6722 .
27、74n/sxsxtx,=n-1=25-1=24 确定确定 P 值:值: t1.6920.05。 (t界值表见界值表见 P178) 推断结论:推断结论:在在0.05 的水准上, 不拒绝的水准上, 不拒绝 H0,即根据本资料,即根据本资料还不能认为此山区健康成年男子脉搏数与一般健康成年男子还不能认为此山区健康成年男子脉搏数与一般健康成年男子不同。不同。 l例2. 已知一般无肝肾疾患的健康人群尿素氮均值为4.882(mmol/L),16名脂肪肝患者的尿素氮(mmol/L)测定值为5.74,5.75,4.26,6.24,5.36,8.68,6.47,5.24,4.13,11.8,5.57,5.61,4
28、.37,4.59,5.18,6.96。问脂肪肝患者尿素氮测定值的均数是否高于健康人?1n,sxtx二、配对资料的二、配对资料的t检验检验l配对设计:l同一受试对象处理前后的比较或不同部位测定值的比较,目的是推断这种处理有无作用(测定值相互独立);l同一样品用两种不同方法测定,目的是比较不同的测试方法之间有无差别;l成对设计,每个对子中的两个受试对象分别接受不同处理,目的是推断两种处理的效果有无差别。 配对t检验实质同单样本t检验。 若两处理效应相同,即1=2,则12=0(当成已知总体0)。 差值的样本均数所代表的未知总体均数d与已知总体均数0=0的比较。0, 1dddddddtnSSnSn表
29、1. 10 名矽肺患者克矽平治疗前后血红蛋白含量((g/L) 病人编号 治疗前 治疗后 差数,d d2 1 140 113 27 729 2 138 150 -12 144 3 140 150 -10 100 4 135 135 0 0 5 135 128 7 49 6 120 100 20 400 7 147 110 37 1369 8 114 120 -6 36 9 138 130 8 64 10 120 123 -3 9 合计 68 2900 建立假设: H0:该药不影响血红蛋白的变化,d0 H1:该药影响血红蛋白的变化,d0 确定检验水准:0.05 计算 t 值: 303. 110/5
30、 .168 . 6n/sds0dtdd 确定 P 值:t1.3030.05 推断结论:在0.05 的水准上,不拒绝 H0,故不能认为克矽平治疗矽肺患者会引起血红蛋白的变化。 三、两个样本均数的比较三、两个样本均数的比较l目的:由两个样本均数的差别推断两样本目的:由两个样本均数的差别推断两样本所代表的总体均数间有无差别。所代表的总体均数间有无差别。 1.两个大样本均数的比较(两组两个大样本均数的比较(两组n均大于均大于50)2. 3. 4. 222121212221212121nsnsxxssxxsxxuxxxx 例9.5 某地随机抽取正常男性264名,测得空腹血中胆固醇的均数为4.404mmo
31、l/L,标准差为1.169mmol/L;随机抽取正常女性160名,测得空腹血中胆固醇的均数为4.288mmol/L,标准差为1.106mmol/L,问男、女胆固醇浓度有无差别?2.两个小样本均数的比较两个小样本均数的比较成组资料的样本例数,各组样本例数可相同,也可不同。 2nn,sxxt21xx2121 2121121nnSscxx 211212222112nnsnsnSc 2cS 为合并方差,21xxs为两均数差数的标准误。 例3. 某克山病地区抽样测得11例急性克山病患者和13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同? 患 者 X1:0.84 1.
32、05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人 X2:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 建立假设:建立假设:H0:该地急性克山病患者与健康人的血磷值相同该地急性克山病患者与健康人的血磷值相同,即即12 H1:该地急性克山病患者与健康人的血磷值不同,即该地急性克山病患者与健康人的血磷值不同,即12 确定检验水准:确定检验水准:0.05 计算计算 t 值:值: 22,522. 21729. 0085. 1521. 12121xxsxxt 确定确定
33、P 值:值:t2.522t0.05,22=2.074,P,说明处理因素有统计,说明处理因素有统计学意义。学意义。 用用 F 统计量比较两个方差的假设检验称统计量比较两个方差的假设检验称为为F检验。检验。F统计量服从统计量服从F分布,有两个自由分布,有两个自由度,即两个均方相应的自由度。度,即两个均方相应的自由度。 总变异的分解总变异的分解组间变异组间变异总变异总变异组内变异组内变异方差分析应用条件1 1、各样本来自正态或接近正态的总体、各样本来自正态或接近正态的总体2 2、各样本为相互独立的随机样本、各样本为相互独立的随机样本3 3、各样本所来自的总体方差相等、各样本所来自的总体方差相等单因素
34、方差分析也称完全随机设计的方差分析也称完全随机设计的方差分析单因素方差分析lSS总 = SS组间 + SS组内l总 = 组间 + 组内l总 = N-1 组间=k-1 组内=N - k总组内组间2222222()SS =() =()SS=() =SS()ijijijijijijijjijiijijijiiiiixxxxNxxxxnn xx单因素方差分析表单因素方差分析表变异来源变异来源SSSS MSMSF FP P总总 N-1 N-1组间组间 K-1 K-1SSSS组间组间/ /组间组间 MS MS组间组间/MS/MS组组内内组内组内( (误差误差) )SSSS总总-SS-SS组组间间 N-k
35、N-kSSSS组内组内/ /组内组内2ijijxC2()ijjiixCn 例例9.7 9.7 随机抽取随机抽取50-5950-59岁男性正常者、冠心岁男性正常者、冠心病人、脂肪肝患者病人、脂肪肝患者1111人,测定空腹血糖值见人,测定空腹血糖值见表表9-39-3,试推断三类人群总体均值是否相同。,试推断三类人群总体均值是否相同。组内组间组间组间组间组间组间组内组内组内组内组内总MSMSF/SSMS1k,)xx(nSS/SSMSkN,xxSSxxSS2iii2ijiij2ijij 经方差分析后各组均数间的差别有统计学意义时,只说明几个组的总体均数不同或不全相同。若要进一步了解哪两个组间的总体均数
36、不同,应进行多个样本均数间的两两比较又称多重比较(multiple comparison)。 多个样本均数间的两两比较不能直接用两均数比较的t检验,因其会增加类错误的概率。多个样本均数间的两两比较多个样本均数间的两两比较l为什么不能用t检验或U检验?l l 如有4个样本均数,两两组合数为6,若用t检验作6次比较,且每次比较的检验水准为0.05,则每次比较不犯类错误的概率为(1-0.05)=0.95,6次均不犯类错误的概率为0.956,这时总的检验水准为1-0.956=0.26,比0.05大多了,因此多重比较不能用两样本均数比较的t检验。l 多个样本均数间两两比较的方法有:lSNK-q检验(适用
37、于任意两组间的两两比较)lLSD-t检验(适用于一对或几对临床上有特殊意义的两组间比较)lDunnett-t检验(适用于多个实验组与一个对照组的两组间比较)多个样本均数间两两比较的多个样本均数间两两比较的q检验(检验(SNK法)法)l首先将所比较的组均数按从大到小的顺序排列,标上秩次(均数序次);均数5.715.064.61秩次123组别脂肪肝组冠心病组正常组)(误差BAxxxxBAn1n12MSSSxxqBABA方差分析与方差分析与t t检验的关系检验的关系 当比较两个均数时,从同一资料算得当比较两个均数时,从同一资料算得之之 F 值与值与t值有如下关系:值有如下关系:F = t2 可见在两
38、组均数比较时,方差分析可见在两组均数比较时,方差分析与与t检验的效果是完全一样的。检验的效果是完全一样的。假设检验中的两类错误假设检验中的两类错误 假设检验采用小概率反证法的思想,根据样本假设检验采用小概率反证法的思想,根据样本统计量作出的推断结论具有概率性,因此其结论统计量作出的推断结论具有概率性,因此其结论不可能完全正确,可能发生下面两类错误不可能完全正确,可能发生下面两类错误: : 错误:拒绝了实际上是成立的错误:拒绝了实际上是成立的H0H0,犯,犯“弃真弃真”的的错误。其概率大小用错误。其概率大小用 表示表示, , 可取单侧亦可可取单侧亦可取双侧。取双侧。错误:不拒绝实际上是不成立的错
39、误:不拒绝实际上是不成立的H0H0,其概率大小,其概率大小用用表示。表示。 只取单侧,其大小一般未知,只有只取单侧,其大小一般未知,只有在已知两总体差值在已知两总体差值, 及及 n n 时,才能估算出时,才能估算出来。来。 第五节第五节 假设检验中的两类错误及应注意的问题假设检验中的两类错误及应注意的问题 可可能能发发生生的的两两类类错错误误 假设检验的结果 客观实际 拒绝 H0 不拒绝 H0 H0成立 I 型错误() 推断正确(1) H0不成立即 H1成立 推断正确(1) II 型错误() 错误与错误与错误的定义如下表:错误的定义如下表: A B D C 判断正确 (1) 1 0 1 1 判断错误(型错误,) 判断错误(型错误,) 判断正确(1) 图 型错误与错误的关系(以单侧检验为例)不拒绝H0,假设检验的结果 拒绝H0 引申的几个概念:引申的几个概念:错误与错误与错误的关系:错误的关系: 愈小,愈小, 愈大;反愈大;反 之之 愈大,愈大, 愈小。若要同时减小愈小。若要同时减小
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年法学考试热点分析试题及答案
- 企业战略中的人力资源风险分析试题及答案
- 编程环境的搭建与配置技巧试题及答案
- 鼓舞信心协议书
- 餐饮退资协议书
- 规划变更协议书
- 印度船级社协议书
- 鼓励中考协议书
- 分红型入股协议书
- 食品包销协议书
- 强度梯度对生物地理格局的塑造
- 《科技创新引领未来》主题班会
- 死亡丧葬垫付协议书范本
- 日产300吨大米加工生产线智能化技术改造项目可行性研究报告写作模板-拿地申报
- 2024年国债资金管理办法
- 黑龙江科技大学创业创新答案
- 智联招聘行测笔试题库
- 地坪工程合同格式模板
- 小满 课件小满 课件(21张)
- 中国抗日战争史智慧树知到期末考试答案章节答案2024年浙江大学
- AED(自动体外除颤仪)的使用
评论
0/150
提交评论