浙大统计——假设检验_第1页
浙大统计——假设检验_第2页
浙大统计——假设检验_第3页
浙大统计——假设检验_第4页
浙大统计——假设检验_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章连续型资料的假设检验(123)联系:数据/变量在离散点 或区间上分布分布特征数应用样本数据X频数分布 表频数分 布图描述指标(X,Sx)参考氾围 X 1.96 Sx随机变量XX,误差X概率分布 表概率分 布图总体参数(,x)(,x)置信区间:x 1.96Sx假设检验P(x- 0|H0)= ?条件概率:P(x- 0|H0)=在曰0条件下 =0的概率(记为 P)?假设检验任务:PW ?(=可忽略的小概率值)PW则认为丰04.1 假设检验的独特逻辑区间估计判断“工0 ?” :依据N( , 2)(抽样实验)? 95%CI 不包含 0 P V 0.05? 95%CI 包含 0 P 0.05例 3.

2、195%CI: (8.15, 10.15),文献报道 0=10.50决策认为工0, PV 0.05假设检验判断“工0 ?” :依据N( 0, 2)假设检验的步骤及逻辑思维:例 3.1 中, x=9.15 (对应),0=10.50, |X 0|=1.35?样本结果差异原因:抽样误差引起(=0)本质差异(丰0)?必须在两者中作抉择(1) 建立统计假设(假设前提下才有规律可循)H 0: = 0= 10.50, H 1:丰 0=10.50? H0比较单纯、明确,在 H。下,抽样误差服从某个特定的分布,便有规律可循;而H祛卩包含着种种未知情形,不容易弄清在 H1下有什么规律。?故我们着重于考察样本信息是

3、否支持H 0(2) 计算统计量(统计量的当前值多大?)?本例观察变量X服从正态分布N( 0, 2),今 未知,若有H0: 0= 10.50,则据第三章知识,统计量X 10.50S/ nt分布,=n-1本例X = 9.15, S= 2.13, n = 20,统计量t的当前值为9.15 10.502.13/ 20=-2.8345=20-1 = 19确定P值(当前t值对应的P值有多大?)P = P( | t | 2.8345)= ?查阅t分布界值表可知P = P( | t | 2.093)=0.05即 10.05=2.093今 tt 0.05,故 P 2.8345是小概率事件,可认为目前的差异不是由

4、抽样误差所致,而 是两个总体均数不相等。? 一般地,抉择的标准为:当PW时,拒绝H。,接受Hi;当P时,不拒绝H。?结果报告:首先给出统计推断结果,即列出统计量、P值(尽量用精确值),以及是否拒绝H。;然后结合问题的具体背景给出推断结论。?为方便叙述,人们常将拒绝H0说成差别有统计学意义”(statistically significant differenee),简称有统计学意义” (statistically significant),但不提倡差别有显著性”或有显著性差别”的提法,因 其易被误解为差别很大;相应地,将不拒绝H。说成“差别无统计学意义”,简称“无统计学意义”。?本例结论:t

5、= -2.8345, P V 0.02,拒绝H0,接受Hi,即认为样本对应的总体均数与文献报导的数值10.50mm/h不相同。结合实际,可认为该类患者血沉值低于10.50。当然,这时?第I类错误(type I error):决策者拒绝H。时可能犯错误,这种错误称为第I类错误。P值就是H。成立的条件下,犯第I类错误的概率。4.2 单组完全随机化设计资料均数的t检验(样本与总体比较)例4.1根据大量调查,健康成年男子脉搏的均数为72次/分。某医生在一山区抽样调查了25名健康成年男子,其脉搏均数为75.2次/分,标准差为6.5次/分,能否据此认为该山区健康成年男子的脉搏高于一 般水平?分析因每分钟脉

6、搏数服从正态分布,可用单组完全随机化设计资料均数的t检验作分析。(1) 建立检验假设0, H1:丰 0(4.1)(2) 计算统计量基于已有知识,H0成立时检验统计量(4.2)_ X _S/ n75.2 726.5/ 252.69例如,标准t离差?检验统计量 就是以标准误为单位来度量的样本指标与总体参数的标准离差。确定P值P = P( I t | t统计量当前值的绝对值 )(4.3)双侧:t=2.69t 0.05(24)=2.064 , Pt 0.05(24)=1.71 1 , P 0(或 H1:0时,P P(t统计量当前值)?(要根据专业知识)或当t统计量的当前值72,单侧 =0.05。结果是

7、,t=2.69 , 0.005P0.01。4.3 随机化配对设计资料均数的t检验(单样本/样本与总体比较)例4.2设有12名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重(kg),数据如表4.1所示。试判断此减肥药是否有效。t4_1解?表面看,这里似乎存在服药前和服药后两组资料。?实际上,真正的处理效应是服药前后的体重差值d (研究变量是差值,观察值是差值,个体变异即差值的变异)?问题转化为单组完全随机化设计资料总体均数为零的检验(1)建立检验假设记差值的总体均数为d,检验的假设为H 0: d= 0, H1: dM 0(4.6)(2)计算统计量 已知H0成立时,统计量-j cl

8、t 分布, =n-1(4.7)Sdn其中d和Sd分别表示差值的均数和标准差。本例d = 16/12 = 1.33S2 d;丄 dj 2 / 12 1 = 62.606112Sd= 7.91代入(4.7),得统计量的当前值t =33= 0.58,= 12-1=11(4.8) ?7.91/ ,12确定P值t=0.580.05(4)抉择与结论本例P0.05,不拒绝Ho,故尚不能认为此减肥药有效。第 n 类错误(type n error):不拒绝H0时也可能犯错误,这种错误称为第n类错误(type n error)。犯第n类错误的概率记为B,能从假设检验中获得(第五章专门讨论)。表4.1某减肥药研究的

9、观察值ex4_2个体号体重(kg)差值d= X1-X2服药前(X1)服药后(X2)110110012131136-5313112654143150-75124128-4613712611712611610895105-10990873106757101184741012101109-8刀 d = 16配对设计注意事项(1) 自身配对(前后、左右 ):要求无残留效应(2) 异体配对(同窝、孪生 ):一般不适用于人联系:把握度(1-)=歴=中间面积 图ex-a参考范围Prcci数据/变量在离散点 或区间上 分布分布特征数应用样本数据x频数分布 表频数分 布图描述指标(x ,Sx)参考范围x 1.9

10、6Sx随机变量XX,误差x-概率分布 表概率分 布图总体参数(,x)(,x)置信区间:应1.96$假设检验P(当前离差 | = 0)=?P(当前离差| = 0)=在Ho:= 0条件下,离差不小于当前数值的概率区间估计判断“工0?”:依据N( , 2)(抽样实验)95%CI不包含o贝U P V 0.05,认为 丰0 (不能准确估计P值) 假设检验判断“工0?”:依据N( o, 2)(可准确估计P值)4.4两组完全随机化设计资料均数的t检验例4.3 (续例 3.2)男女红细胞计数(1012/L), 比=4.66, Si = 0.47, ni= 20; X2 = 4.18, S2= 0.45, =1

11、5。试判断男女红细胞计数的总体均数是否相等。n2分析 假定红细胞计数值服从正态分布N( 1,12)和N( 2,2),则分析数据的任务是推断两个总体均数1.是否相等,即检验H 0:1= 2, H1:1工 2(4.9)需根据两个总体方差是否相同而采取不同的方法总体方差相等的情形(方差齐性:我们可以用s2和s;的加权平均值Scn1sc2i1X1i_ 2 n2X1X2ii 1 2X 2n1 n22221 =2 =s:来联合估计2,即(4.10)(4.11)t = X1 X2t 分布,v= n1+n 2-2(4.12)#Sc 1 / m 1 / n2例4.3的解(1) 建立检验假设H0: 1= 2, H

12、1: 1工 2,= 0.05。2(2) 计算统计量 总体方差的联合估计为Sc = 0.2131。t =4.66 4.18= 3.043),据经验认为方差不齐t=确定P值 近似界值为5.05 2.72= 2.1821.52 /2010-1 = 9和20-1 = 19查得t分布的双侧界值t1 = 2.26和t2 = 2.09。于是,23.21 /10 分别据自由度t的23.212.26103.211.5210 201.03041 2.260.11552 2.092 2421.52 ccc 2.09to 052021.030410.11552由于丨 t |V t005,故 P 0.05。 决策与结论

13、本例t = 2.18, P0.05,不能拒绝Ho,即尚不能认为病人的某生化指标不等于正常人。4.5两组完全随机化设计资料方差齐性的F-检验例4.5将同一瓶液体试样搅匀后等分成2组各10份样品,分别交由两个实验室测定含量(mg/ml),结果两组的样本均数相等,但两组的样本标准差分别为S1= 5和S2= 3.5,问这两个实验室的测量精度谁好谁差?分析 设两总体N( 1,12)和N( 2, f),欲推断 2与2是否相等(1)建立检验假设方差齐性检验通常规定=0.10H0:12 =; , H仁 2工f,小概率(2)计算统计量记样本方差为S; , S;,则有S2/ 12(4.15)F分布, 1=n 1

14、-1,2=n 2-1件佝(略)S;/ :? F分布具有两个自由度:1=分子的自由度,2=分母的自由度?F分布不对称,下侧尾部面积所对应的下侧界值为1件17)(略),1,22 2?当H0: 1 = 2成立时,(4.16)式约简为VR = F分布,1 =n 1-1 ,2 =n 2-1 (4.18) S-|2 S;图4.2F分布及其单侧界值示意图确定P值=0.10,因是双侧检验,查阅F分布的上侧界值(P-583)F0.10/2 = Fo.05 = 3.18, VR = 2.04 V 3.18, P 0.10?对于单侧检验(如规定2 1.52),查F上侧界值(P-582)F0.10= 2.44, VR

15、 = 2.04 0.10(4)决策与结论P 0.10,不拒绝H0,尚不能认为两总体方差不等例4.6 某项多中心合作研究对某测定方法的质量控制标准规定:重复测定的标准差不得超过1.5U。现某实验室进行自查,将同一试液搅匀后分成10份样品,独立测定结果的标准差为2.1U,问该实验室的总体标准差是否高于标准值?解这是方差齐性检验的一个特例,欲检验的假设是H0: 2= (1.5)2, H1: 2 (1.5)2,单侧 =0.054.6 二项分布和Poisson分布大样本资料参数的Z-检验1.二项分布总体概率的Z-检验X近似 N(n , n (1- )(4.19)(略)P = X/n 近似 N( , (1

16、- )/n)(4.20)(略)1.1单组样本例4.7某地区随机抽取传染科工作人员150名作关于乙型肝炎的血清学检查,其中阳性者共 35名。已知当地一般人群中的阳性概率为17%。问当地传染科工作人员的阳性概率是否高于一般人群的阳性概率解:(1)建立检验假设H。: = 0.17, H1: 0.17;单侧 =0.052)计算统计量当H。成立时,由(4.20)式,以0.17代入,Z =P 0.17N(0 , 1)v0.17 1 _0.17 /150Z =35/1500.17= 2.060.17 10.17 /150(3) 确定P值+( 4)决策与结论查阅标准正态分布表,得单侧P值为0.02,拒绝H0

17、,可认为传染科工作人员的阳性概率高于一般人群的阳性概率。H 0: = 0, H仁 丰0,确定小概率(4.21)计算检验统计量P 0Z =件22)十0 1 0 / n1.2两组样本例4.8为考察在常规治疗的同时辅以心理治疗的效果,某医院将同种疾患的病人随机分成常规治疗组和常规与心理联合治疗组,经一个疗程治疗后,以同一标准衡量,常规组80名中有效者48名,联合治疗解:建立检验假设 H : 1 =2, H 1: 1工 2;= 0.05。1)/n 1+ 2(1- 2)/n2)(4.23)(略)组75名中有效者55名。试判断就总体而言两种疗法有效的概率是否确有差异。近似P1-P2 N(0,1(1-厂 4

18、8 55103P0=-80 7515548 55Z =80 75型1型丄155155 80 750.13330.13330.00575914 0.0759确定P值 由标准正态分布表查得双侧P = 0.08抉择与结论 Z=-1.76 , P=0.08,不能拒绝H0,即不能认为两治疗组有效的概率不等。H 0:1 = 2,H1: 1工 2RP2(4.24)件25) Po合计率P0= n1P1n2P2rnn2(4.26)2. Poisson分布总体均数的Z检验(较大)近似X N(,)(4.27)(略)2.1单个观察值 例4.9次,解:质量控制标准规定某装置在规定的时间长度内发放放射性质点的总体均数不得

19、超过 在规定时间内测得发放的质点数为58。问该装置的总体均数是否符合要求50。今抽查一H 0:= 50,Zx_ 50,=0.05。V 0查阅标准正态分布, 制标准。H 0:= 0,zxH1: 5850 ,不能拒绝H。,即尚不能认为该装置不符合质量控=1.13H1: 0近似0 N(0 , 1)0(4.28)(4.29)2.2两个观察值1分钟,测得例4.10用同位素方法独立地测量两份样品的放射性。样品的制备完全相同,测量时间同为 发射的放射性质点数分别为X1= 150和X2= 120。问相应的两总体均数是否相等分析:H 0:1= 2, H1:1工 2(4.30)用两个观察值的均数(X什X2)/2近

20、似地代替,我们有统计量近似X 1 X 2(4.31)-12 N(0 , 1)X1 X2例4.10的解:事先规定 =0.05。据二个观察值计算 (4.31)中统计量Z的当前值150120Z = 1.83J150120查阅标准正态分布表,得双侧P值为0.067;由于P ,不能拒绝H0,即尚不能认为两个总体均数不等。(3) 两组观察值但测量的时间长度不同,1500和1800。问若在相同时间长度内测量,例4.11用同位素方法独立地测量两份标本的放射性,标本的制备完全相同, 一份测了 10分钟,另一份测了 15分钟, 测得质点数分别为 两份标本发放质点的总体均数是否相等?分析:H0:1 = 2, H 1: 1工2(4.32)(略)X1Y近似X2 N( 1-2, ( 1/n 1)+( 2/n2)(4.33)(略)XX近似 入2N(0 ,(X1/n 1)+( X2/in2)(4.34)(略)故可计算Z统计量作检验,即N(0 , 1)(4.35)Xi X2X 1 niX 2 n2例4.11的解:Ho:1= 2, H1:1工 2 ,=0.05_10X 1 X1i. 10 = 1500/10 = 150_15X2 X2i 15 = 1800/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论