




已阅读5页,还剩9页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章 连续型资料的假设检验 联系:数据/变量分布的概况分布的特征数分布的应用样本数据x 频数分布表频数分布图 描述指标(,Sx)参考范围 随机变量X ,误差-m概率分布表概率分布图 总体参数() ()置信区间 m:假设检验 P(Zk|m=m0)=? P值是样本信息支持H0的概率 P(Zk|m=m0)= 在H0: m=m0条件下,误差不小于当前统计量值k的概率 例如,单侧:P(Z1.96|m=m0)=0.025,双侧:P(|Z|1.96|m=m0)=0.05 假设检验任务:Pa?(a可忽略的小概率值)Pa则认为mm0 区间估计判断“mm0 ?”:依据 N(m, s2)(抽样实验) 95%CI不包含m0 P0.05 95%CI包含m0 P0.05例3.1 95%CI m:(8.15, 10.15),文献报道 m0=10.50 决策 认为mm0,P0.05 假设检验判断“mm0 ?”:依据 N(m0, s2)4.1 假设检验的独特逻辑 假设检验的步骤及逻辑思维:例3.1中, =9.15(对应m),m0=10.50,|m0|=1.35 样本结果差异原因:抽样误差引起;mm0(本质差异) 必须在两者中作抉择(1) 建立统计假设(假设前提下才有规律可循) 。二种情形有、且H0:m=m010.50, H1:mm0=10.50 H0比较单纯、明确,在H0下,抽样误差服从某个特定的分布,便有规律可循;而H1却包含着种种未知情形,不容易弄清在H1下有什么规律。 故我们着重于考察样本信息是否支持H0。(2) 计算统计量(统计量的当前值多大?) 本例观察变量X服从正态分布N(m,s2),今s未知,若有H0: m10.50,则据第三章知识,统计量t t分布, nn-1 本例9.15,S2.13,n20,统计量t的当前值为t-2.8345 ,n20-119(3)确定P值(当前t值对应的P值有多大?) PP(t2.8345)=? 查阅t分布界值表可知PP(t2.093)=0.05即t0.05=2.093 今 tt0.05,故P0.05 -2.8345 0 2.8345图4.1 t 统计量的当前值与P值示意图0.01Pt0.05(24)=2.064,Pt0.05(24)=1.711,Pm0 (或H1: m0时,PP(t统计量当前值) ?(要根据专业知识)或当t统计量的当前值72,单侧a0.05。结果是,t=2.69,0.005P0.01。4.3 随机化配对设计资料均数的t检验(单样本 / 样本与总体比较)例4.2 设有12名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重(kg),数据如表4.1所示。试判断此减肥药是否有效。t4_1解 表面看,这里似乎存在服药前和服药后两组资料。 实际上,真正的处理效应是服药前后的体重差值d(研究变量是差值,观察值是差值,个体变异即差值的变异) 问题转化为单组完全随机化设计资料总体均数为零的检验(1) 建立检验假设 记差值的总体均数为md,检验的假设为H0: md0,H1: md0(4.6) (2) 计算统计量 已知H0成立时,统计量tt 分布,n-1(4.7) 其中和Sd分别表示差值的均数和标准差。本例16/121.3362.6061Sd7.91代入(4.7), 得统计量的当前值t0.58,n12-1=11(4.8)?(3) 确定P值 t=0.580.05(4) 抉择与结论 本例P0.05,不拒绝H0,故尚不能认为此减肥药有效。 第类错误(type error): 不拒绝H0时也可能犯错误,这种错误称为第类错误(type error)。犯第类错误的概率记为,不能从假设检验中获得(第五章专门讨论)。表4.1 某减肥药研究的观察值 ex4_2个体号体重(kg)差值dX1-X2服药前(X1) 服药后(X2) 1101100 1 2131136 -5 3131126 5 4143150 -7 5124128 -4 613712611 712611610 8 95105-10 9 90 87 310 67 571011 84 741012101109 -8d16 本节的方法适用于一般的随机化配对设计资料的分析。需提醒的是,我们假定差值的总体分布为正态分布,并不是假定服药前后两组体重值分别服从正态分布。4.4 两组完全随机化设计资料均数的t检验两组完全随机化设计是指将实验对象完全随机地分配到两组中,这两组对象分别接受不同的处理,或分别从两个总体完全随机地抽取一部份个体进行研究。这种设计简单易行。相比于配对设计,这种设计常于个体变异性较小、同质性较好时使用。例4.3 (续例3.2)男女红细胞计数(1012/L)的样本均数、样本标准差、样本量分别为4.66, S10.47, n120和4.18,S20.45, n215。试判断男女红细胞计数的总体均数是否相等。假定男女红细胞计数值均服从正态分布,并分别记为 N(m1,)和N(2,),则分析数据的任务是推断两个总体均数是否相等,即检验H0: m1m2, H1: m1m2(4.9) 对上述假设作检验,需根据两个总体的变异性(方差)是否相同而采取不同的方法。1. 总体方差相等的情形 若男、女性红细胞计数值的总体方差相同,即,则称这两个总体具有方差齐性(homogeneity)。记两组样本的均数、标准差和样本量分别为,S1,n1和,S2,n2,则如前章(3.10)所述,我们可以用和的加权平均值来联合估计2,即(4.10)或(4.11)其中X1i, i1,2,.n1和X2i, i1,2,.n2分别为两组样本观察值。 当H0:12成立时,可以证明,统计量tt分布,n1+n2-2(4.12) 以样本均数,、联合估计和样本量n1,n2的数值代入,可计算得t统计量的当前值;然后由t分布表可查出相应的P值;最后将这个P值与事先规定的小概率a相比较,若Pa即拒绝H0,否则,不拒绝。例4.3的解 由例3.2,我们已经求得了男女红细胞计数总体均数之差的95%置信区间为(0.16,0.80),它不包含0这个数, 故可以认为总体均数之差不等于零,即m1m2。 下面通过假设检验来回答这个问题。(1) 建立检验假设 H0: m1m2,H1: m1m2,a0.05。(2) 计算统计量 由于和数值相近,不妨假定总体方差和相等(严格的检验见下节)。总体方差的联合估计为0.2131。将,n1,n2, 的数值代入(4.12)式的右端,得统计量t的当前值为t3.04(3) 确定P值 查阅t分布表,得相应的双侧尾部面积P0.01(4) 决策与结论 本例t3.04,P0.01,拒绝H0,接受H1,可认为男女红细胞计数的总体均数不相等;结合样本均数作判断,可认为男性比女性高。 对比上述置信区间的方法和假设检验的方法,不难看出,两者并无根本差别。只是前者提供了总体均数之差的大致范围,而没有提供P值; 后者提供了P值,却没有提供总体均数之差的大致范围。因此,在实践中,许多学者主张两种方法都采用,写报告时应提及三件事:讨论(拒绝H0与否),P值(可信程度如何),均数之差的置信区间(参数的可能范围)。这一提议适用于其他假设检验问题,以后不再赘述2. 总体方差不相等的情形 若,则没有理由象(4.10)和(4.11)式那样将两组样本的方差联合在一起,即使联合了,既不近似于,也不近似于。此情形下,有两种方法可用:基于秩次的非参数检验方法和t检验法。前者见第七章,下面介绍t检验法。t检验中,先计算统计量t(4.13)因其分布比较复杂,通过查阅分布表确定P值不方便;但可较方便地计算它的界值的近似值,(4.14)其中t1a为自由度n1-1时的界值,t2a为自由度n2-1时的界值,w1/n1, w2。换言之,的界值相当于分组得到的两个界值的加权平均数。特别要注意的是,使得自由度不能合并,因而界值偏大。 当t当前值的绝对值大于或等于上述近似的界值时,P值a,拒绝H0;否则,P值a,不拒绝H0。例4.4 随机抽取n110名病人和n220名正常人,分别测定某项生化指标,病人组的均数和标准差为0.05和S13.21,正常人组是2.72和S21.52。试推断相应的两个总体均数是否相等。解 令两个总体均数为m1和m2(1) 建立检验假设 H0: m1m2,H1: m1m2;a0.05。(2) 计算统计量 先考察两组方差之比,(3.21)2/(1.52)24.46。据经验,不妨认为两个总体方差不等(严格的检验见下一节)。利用(4.13)式计算统计量t的当前值t2.18(3) 确定P值 分别据自由度10-19和20-119 查得t分布的双侧界值t1a2.26和t2a2.09。于是,t的近似界值为 由于t,故P0.05。(4) 决策与结论 本例t2.18,P0.05,不能拒绝H0,即尚不能认为病人的某生化指标不等于正常人。此例题有一定代表性,应引起重视,即从样本均数的差值粗略判断,似乎两个总体均数不相同;但由于两组标准差较为悬殊,病人组内部变异较大,正常人组内部变异较小(这可能是一种普遍现象),而研究者在设计上又没有注意这一现象,界值就必定较大,以致由5.05-2.722.33这样大的样本均数之差也不能推论总体均数存在差异。4.5 两组完全随机化设计资料方差齐性的F-检验 前已指出,对两组完全随机化设计资料的均数作检验之前,需要判断两个总体方差是否相等。那里我们只是从样本方差的数值凭经验作粗略判断,若两者相近,则认为总体方差相等; 若两者悬殊过甚,则认为总体方差不等。然而,“相近”和“悬殊”的标准是什么?严格说来需进行方差齐性的检验。方差齐性检验也遵循前述的逻辑和步骤。 设有两个总体N(m1,)和N(m2,),欲推断与是否相等,方法如下:(1) 建立检验假设 方差齐性检验通常规定a0.10,无效假设为 H0: , H1: ,规定小的概率a(4.15)(2) 计算统计量 记样本方差分别为和。据数理统计学知识, F分布, n1=n1-1, n2=n2-1(4.16)F分布具有两个自由度,它们分别是上式左端分子中的自由度和分母中的自由度。前者称分子自由度(numerator degrees of freedom),记为n1,后者称分母自由度(denominator degrees of freedom ),记为n2。本书后面附有F分布上侧尾部面积a所对应的上侧界值Fa表。由于F分布并非对称分布,其下侧尾部面积a所对应的下侧界值并不等于-Fa,而是(4.17)基于这个关系式,下侧界值的表格就不必另造了,必要时可由(4.17)式推算。参见图4.2。FFa,n1,n2aaFa,n1,n2图4.2 F分布及其单侧界值示意图 当H0: 成立时,(4.16)式约简为VR F分布,n1 =n1-1,n2 =n2-1(4.18)从而我们可以用方差比(variance ratio,VR)作为检验统计量。(3) 确定P值 对于双侧检验,习惯上将数值较大的样本方差作为分子来计算VR。这样,给定a的数值后,只需用a/2去查F分布的上侧界值,将VR的当前值与Fa/2相比较,若VRFa/2,则Pa,反之Pa。 对于单侧检验,习惯上同样将数值较大的样本方差放在分子上计算VR的当前值。给定a值,查出F分布的上侧尾部面积为a的界值Fa。若VR的当前值大于或等于Fa,则Pa,反之Pa。(4) 决策与结论 将P值与事前规定的小概率a比较。若Pa,则拒绝H0; 否则,不拒绝H0。然后结合实际问题给出结论。 回到例4.3,那里VR1.09,n119,n214。令a0.10, F分布的上侧界值F0.10/2F0.052.40。由于VRF0.05,不能拒绝H0,故尚不能认为两个总体方差不相等。回到例4.4,那里VR(3.12)2/(1.52)24.46,n19,n219。令a0.02,F分布的上侧界值F0.02/2F0.013.52。由于V.RF0.01,拒绝H0,故可认为两个总体方差不等。 事实上,除服务于两个总体均数相等与否的检验之外,方差齐性检验还有其自身的直接应用。例4.5 将同一瓶液体试样搅匀后等分成2组各10份样品,分别交由两个实验室测定含量(mg/ml),结果两组的样本均数相等,但两组的样本标准差分别为S15和S23.5,问这两个实验室的测量精度谁好谁差?解 问题归结为方差齐性的检验,即推断两个总体和是否相等。VR(5)2/(3.5)22.04,n1n29令a0.10。注意到这是双侧检验,查阅F分布的上侧界值F0.10/2F0.053.18。由于VR3.18,P0.10,不能拒绝H0,尚不能断定两个实验室测定的精度谁好谁差。例4.6 某项多中心合作研究对某测定方法的质量控制标准规定:重复测定的标准差不得超过1.5U。现某实验室进行自查,将同一试液搅匀后分成10份样品,独立测定结果的标准差为2.1U,问该实验室的总体标准差是否高于标准值?解 这是方差齐性检验的一个特例,欲检验的假设是H0: s2(1.5)2,H1: s2(1.5)2,单侧a0.05这里虽然只有一个样本,(2.1)2, n110。但不妨将标准方差(1.5)2视为另一个样本量为无穷大的样本的方差,于是(1.5)2,n2。我们有 VR(2.1)2/(1.5)21.96。令a0.05。注意到对应假设是单侧的, 自由度为9和时F分布上侧界值 F0.051.88。由于VRF0.05,P0.05,拒绝H0,可以认为该实验室的总体标准差高于质量控制的标准值。4.6 二项分布和Poisson分布大样本资料参数的Z-检验1. 二项分布总体概率的Z-检验 前(见第二章)已指出,设X(p,n),则当np和n(1-p)均相当大时,N(np, np(1-p)(4.19)并且 PX/n N(p, p(1-p)/n)(4.20)其中,X相当于0-1变量n个观察值之和,PX/n相当于0-1变量n个观察值的均数。根据这一性质可利用大样本资料对二项分布的总体概率作假设检验。(1)单组样本 例4.7 某地区随机抽取传染科工作人员150名作关于乙型肝炎的血清学检查,其中阳性者共35名。已知当地一般人群中的阳性概率为17%。问当地传染科工作人员的阳性概率是否高于一般人群的阳性概率?设样本来自二项分布总体(p,150),则需检验H0: p0.17,H1:p0.17;解:建立检验假设 H0: p0.17,H1:p0.17;单侧a0.05 计算统计量 当H0成立时,由(4.20)式,以0.17代入,PN(0.17,(0.17)(1-0.17)/150)或ZN(0,1)计算统计量Z的当前值,Z 2.06 查阅标准正态分布表,得相应的单侧P值为0.02。由于Pa,拒绝H0,可认为传染科工作人员的阳性概率高于一般人群的阳性概率。 上例的方法不难推广到一般情形。设有n次独立重复试验,得该事件的样本频率P,欲问其总体概率p是否等于给定的常数p0,可作检验:H0: pp0,H1: pp0,确定小概率a(4.21) 计算检验统计量Z(4.22) 查阅标准正态分布表,确定P值,作决策。 当双侧对立假设H1: pp0改为某个单侧对立假设H1:pp0或H1: pp0时, 统计量照旧,但需改查单侧P值。(2) 两组样本例4.8 为考察在常规治疗的同时辅以心理治疗的效果,某医院将同种疾患的病人随机分成常规治疗组和常规与心理联合治疗组,经一个疗程治疗后,以同一标准衡量,常规组80名中有效者48名,联合治疗组75名中有效者55名。试判断就总体而言两种疗法有效的概率是否确有差异。设两样本分别来自二项分布总体(p1,n1)和(p2,n2),其中n1=80,n2=75,问题归结为检验 H0: p1p2,H1: p1p2;解:建立检验假设 H0:p1p2,H1:p1p2;a0.05。 计算统计量 由(4.20)式, P1 N(p1,p1(1-p1)/n1) P2 N(p2, p2(1-p2)/n2)P1-P2 N(0, p1(1-p1)/n1+p2(1-p2)/n2)(4.23)当H0成立时,将两组数据联合起来计算样本频率, P0 用此频率近似地代替p1和p2,便有P1-P2 N(0,(1-)(+)或N(0,1) 以Z为检验统计量,计算其当前值,Z-1.76 确定P值 由标准正态分布表查得双侧P0.08 抉择与结论 Z=-1.76,P=0.08,不能拒绝H0,即不能认为两治疗组有效的概率不等。 上述方法不难推广到一般。设有二项分布总体(p1,n1)和(p2,n2),已知样本频率为P1和P2,欲检验H0: p1p2, H1:p1p2(4.24)事先规定一个小概率a。采用检验统计量 Z(4.25)其中P0为两组联合的样本频率,即P1和P2的加权平均, P0(4.26)已知当H0成立时,(4.25)服从标准正态分布。根据样本观察值由(4.25)算得统计量的当前值; 查阅标准正态分布表,得到双侧P值; 与事先规定的a比较即可作出是否拒绝H0的决策。 当双侧对立假设H1:p1p2改为单侧对立假设H1:p1p2时,统计量照旧,但需改查单侧P值。2. Poisson分布总体均数的Z检验(l较大) 前(见第二章)已指出,服从Poisson分布p(l)的变量X当l较大时,近似地服从正态分布,即XN(l, l)(4.27)根据这一结果,我们可以对Poisson分布的总体均数作假设检验。(1)单个观察值例4.9 质量控制标准规定某装置在规定的时间长度内发放放射性质点的总体均数不得超过50。今抽查一次,在规定时间内测得发放的质点数为58。问该装置的总体均数是否符合要求?解:设规定时间长度内放射性质点数服从Poisson分布p(l),参数为l。于是问题可归结为检验 H0: l50, H1: l50。确定小概率a=0.05。依(4.27)式,在H0: l50条件下有XN(50,50);于是可计算检验统计量Z,即=1.13查阅标准正态分布,得单侧P值为0.13; 由于Pa,不能拒绝H0,即尚不能认为该装置不符合质量控制标准。上述方法可推广到一般。从Poisson分布总体p(l)获得观察值X,参数为l。欲检验H0: ll0, H1: ll0(4.28)l0是给定的常数。于是,在H0成立条件下,根据(4.27)式有XN(l0,l0)N(0,1)(4.29) 将Poisson分布的一次观察值代入可得统计量的当前值; 查阅标准正态分布表,得双侧P值; 与事先给定的一个小概率a相比较,即可决定是否拒绝H0。 有趣的是,对Poisson分布变量只作一次观察便能估计置信区间(见第三章)和进行假设检验,这是由Poisson分布只含一个参数,且该参数既是总体方差又是总体均数这一特点决定的。(2)两个观察值例4.10 用同位素方法独立地测量两份样品的放射性。样品的制备完全相同,测量时间同为1分钟,测得发射的放射性质点数分别为X1150和X2120。问相应的两总体均数是否相等?设每分钟发射的放射性质点数服从Poisson分布,并设两个观测值来自Poisson分布总体p(l1)和p(l2),l1和l2是参数,于是问题可归结为检验H0: l1l2,H1: l1l2。分析:更一般地,设有两个观察单位相同的Poisson分布变量X1和X2,参数l1和l2均相当大。现各作了一次观察,欲据此观察值检验H0: l1l2, H1: l1l2(4.30)当H0成立时,记l1l2l。据(4,27)式,X1 N(l,l)X2 N(l,l)X1-X2 N(0, 2l) 用两个观察值的均数(X1+X2)/2近似地代替l,我们有统计量ZN(0,1)(4.31)将X1和X2的观察值代入等式右端得到统计量的当前值; 查阅标准正态分布表,得到双侧P值; 与事先规定的一个小概率a比较,便可决定是否拒绝H0。例4.10的解:事先规定a0.05。据二个观察值计算(4.31)中统计量Z的当前值Z1.83查阅标准正态分布表,得双侧P值为0.067; 由于Pa,不能拒绝H0,即尚不能认为两个总体均数不等。 (3)两组观察值例4.11 用同位素方法独立地测量两份标本的放射性,标本的制备完全相同, 但测量的时间长度不同,一份测了10分钟,另一份测了15分钟, 测得质点数分别为1500和1800。问若在相同时间长度内测量,两份标本发放质点的总体均数是否相等?分析:设每分钟发射的放射性质点数服从Poisson分布,对第一个Poisson分布总体p(l1)作了10分钟的观察,质点总数是1500,平均每分钟质点数是150;对第二个总体p(l1)作了15分钟的观察,质点总数是1800,平均每分钟质点数是180。于是问题可归结为检验H0:l1l2,H1:l1l2。 更一般地,设有两个观察单位相同的Poisson分布变量X1p(l1)和X2p(l2),l1和l2均较大。今分别独立重复观察了n1和n2个单位,观察值的和记为和,欲检验假设H0: l1l2,H1: l1l2(4.32)由(4.27)式,X1N(l1,l1), X2N(l2,l2)记两组观察值的均数为, 则据正态分布理论,N(l1,l1/n1),N(l2,l2/n2)从而N(l1-l2,(l1/n1)+( l2/n2)(4.33)当H0成立时,上述正态分布的均数l1-l20,以和近似地代替l1和l2以便计算此正态
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025西部矿业集团有限公司专业技术人员社会招聘30人笔试参考题库附带答案详解
- 2025神农科技集团有限公司第一批校园招聘17人(山西)笔试参考题库附带答案详解
- 2025浙江省盐业集团有限公司招聘22人笔试参考题库附带答案详解
- 2025河南郑州航空港国际教育投资发展集团有限公司招聘劳务派遣人员12人笔试参考题库附带答案详解
- 2025江苏苏海投资集团有限公司下属子公司对外招聘公交车驾驶员10人笔试参考题库附带答案详解
- 2025德曼节能科技(山东)有限公司招聘10人笔试参考题库附带答案详解
- 2025年阜阳市皖西北(阜南)粮食产业园有限公司招聘14人笔试参考题库附带答案详解
- 2025年福州市名城古厝设计院有限公司招聘4人笔试参考题库附带答案详解
- 2025年河南通航机场管理有限公司社会招聘23人笔试参考题库附带答案详解
- 2025年宁夏国运铁建高新材料科技有限公司急需岗位社会招聘6人笔试参考题库附带答案详解
- DB51T 2975-2022气凝胶复合保温隔热材料及系统通用技术条件
- 外科学-第十一章-外科感染(含案例分析)课件
- 《ch棘皮动物》课件
- 急诊科岗位职责
- 中国服用过兴奋剂运动员名单 兴奋剂真的是毒品吗
- 小学英语语法时态讲解与归纳
- 《生存与修炼》熊厚音讲《道德经》教学文案
- 淘宝新店运营计划书文献
- 产教融合校企合作[可修改版ppt]课件
- ICH Q6B 生物技术产品和生物制品的检验方法和可接受标准
- 12贮水花盆案例总结-2015天津中心修改43
评论
0/150
提交评论