医学统计非参数假设检验_第1页
医学统计非参数假设检验_第2页
医学统计非参数假设检验_第3页
医学统计非参数假设检验_第4页
医学统计非参数假设检验_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数假设检查第六章讨论了总体分布为正态分布或总体分布类型已知的前提下对重要参数进行的检查,即参数检查。但实际应用中许多实际推断问题并不满足总体分布为正态分布或总体分布是未知的。非参数检查指那些推断假设不依赖于总体分布形式或推断假设与总体的参数无关的假设检查措施。假设检验记录措施描述记录推断记录参数估计假设检查分类变量数值变量分类变量的假设检查χ2检查(chi-squaretest):是英国人K.Pearson于19提出理论根据:χ2分布(chi-squaredistribution)拟合优度检查(goodnessoffittest)用途第一节2拟合优度检查当总体分布未知时,需由样本值考察总体与否服从某个已知的分布,这种考察理论分布与样本数据的实际分布与否吻合的检查称为拟和优度检查(goodness-of-fittest)。Pearson2检查是最常用最重要的拟和优度检查之一。一、2拟合优度检查的思想设总体X的分布函数F(x),但其详细形式未知。现根据随机变量X的样本值x1,x2,…,xn来检查有关总体分布的假设H0:总体X服从分布F0(x)由于只关怀样本数据与给定的分布与否吻合,而不考虑当H0不真时X的也许分布,因此此类检查可以不写出备择假设。离散型变量:持续型变量:在用χ2检查法检查原假设时,假如F0(x)的分布形式已知,但具有未知参数时,则应首先估计参数,然后再作检查。二、χ2检查法基本思想将总体X的取值区域分为k个互不相容的组类,再将样本观测值x1,x2,…,xn落在各组的实际频数与已知分布对应的理论频数进行比较,由此构造检查记录量来衡量样本观测值与已知分布的吻合程度,从而检查H0与否成立。重要理论根据是Pearson定理(定理7-1,P168)三、检查环节P168O:观测频数E:理论频数(observedvalue)(expectedvalue)(A:actualT:theoretical)

四、公式:基本公式校正公式拟合检查应注意事项:1.样本容量n需足够大,一般规定n50。2.检查时规定各组理论频数Ei5,否则要通过合理合并相邻类别使之不不不小于5。3.计算理论频数时,若先估计r个参数,则df=k-1-r。例7-2某药师用随机抽样措施检查了某药100片,测量其含药量,检测成果如表7-3,试用2法检查该药的含量与否服从正态分布(α=0.05)。解检查假设H0:该药的含量服从正态分布;H1:该药的含量不服从正态分布由于μ,σ未知,估计μ,σ。见P14公式1-7组限组中值实际频数标准化组限概率理论频数fi-npi[xi,xi+1)mifi[ui,ui+1)pinpi(1)(2)(3)(4)(5)(6)(7)(8)<4038.53(-∞,-1.96)0.0252.500.00040~41.56[-1.96,-1.34)0.0656.543~44.515[-1.34,-0.73)0.14314.30.70.03446~47.518[-0.73,-0.11)0.22322.3-4.30.82949~50.530[-0.11,0.50)0.23523.56.51.79852~53.514[0.50,1.12)0.17817.8-3.80.81155~56.511[1.12,1.73)0.0898.90.90.06258~59.52[1.73,2.35)0.0333.3>6162.51[2.35,+∞)0.0090.9合计—100—1.000100—3.534表7-3某药100片含药量正态分布检查计算表标准化变换检查假设H0:X服从正态分布N(49.54,4.882)在H0成立的前提下,将表中第(1)列x组限作原则化变换据成果可得检查记录量为用样本值估计参数μ和σ,因此df=6-2-1=3,对α=0.05查x2分布表,x2(0.05.3)=7.815>3.534,P>0.05,不拒绝H0,可认为该药的含量服从正态分布。表5Χ2界值表(部分)P279第二节列联表2检查χ2分布是一种持续型随机变量的概率分布假如Z服从原则正态分布,那么Z2服从自由度为1的χ2分布设有ν个互相独立的原则正态分布随机变量Z1,Z2,……Zν,Z12+Z22+……+Zν2服从自由度为ν的χ2分布χ2分布(chi-squaredistribution)3.847.8112.59P=0.05的临界值χ2分布(chi-squaredistribution)图2x2分布的临界值示意图Χ2分布的特点1Χ2分布是非对称的分布2.Χ2分布的图形与其自由度有关列联表是用于多重分类的一种频数分布表,将每个观测对象按行和列两方面的属性分类,从而表中数据有r行c列,常称为r×c表。最简朴形式为2×2表,又称四格表。对实际频数与理论频数的一致性作2检查。一、列联表2独立性检查(一)2×2四格表独立性检查例7-4,某医生将两种药物在60名受试者的不一样部位进行药敏试验,试验成果见表7-8,问两种药物的成果与否有关联?(α=0.05)表7-8两种药物的药敏成果药物A药物B合计阳性阴性阳性28(18.1)6(15.9)34阴性4(13.9)22(12.1)26合计322860自由度df=(行数-1)(列数-1)公式:基本公式校正公式专用公式解检查假设H0:两种药物的成果无关联;H1:两种药物的成果有关联因E>5,故得检查记录量对α=0.05及df=(2-1)×(2-1)=1,查2界值表(附表5),得x20.05(1)=3.841,P<0.05,拒绝H0,接受H1,即认为两种药物的药敏成果有关联。表5Χ2界值表(部分)一、列联表2独立性检查(二)R×C列联表的独立性检查例7-3某药厂为了探讨根据药物的外观状况判断药物内在质量的也许性,随机抽取若干同类药物,在相似条件下放置6个月,分别检查其内在质量X与外观状况Y,得检查数据见表7-6,试分析药物的内在质量X与外观Y这两种属性之间与否独立?(α=0.01)内在质量X外观状况Y合计好中差好3515555中819734差441624合计473828113表7-6药剂的检查成果解检查假设H0:药物的属性X与Y互相独立;H1:药物的属性X与Y有关联理论频数:检查记录量:df=(3-1)×(3-1)=4,查χ2临界值表(附表5,P279)χ0.012(4)=13.277,记录量χ2=43.097>13.277,P<0.01,则拒绝H0,接受H1,即认为两种药物的属性有关联。因而从药物外观状况判断药物内在质量的也许性是存在的。1.两个样本率不相似的原因有两种也许:一种是抽样误差所致;另一种是总体率确有所不一样。2.通过假设检查对两种原因进行判断:为了鉴别这两种状况,先作出“无效假设”,即假设这两个率相似,差异仅是抽样误差所致。χ2检查的基本思想:如实际频数与理论频数相差过大,即值不小于所规定的检查水准的界值时,就可拒绝这一假设,否则没有理由拒绝这一假设。3.χ2检查的基本思想:假如两个率不一样只是抽样误差所致,那未实际频数与理论频数之差就不会很大,即χ2值不会太大:理论频数实际频数二、样本(总体)率比较的列联表2检查例7-5某地观测磺胺三甲吡嗪加增效剂防止疟疾复发的效果,用已知有抗疟疾复发的乙胺嘧啶和不投药组作对照,发生复发的状况见表7-9,比较三种不一样措施复发率有无差异?(α=0.05)表7-9三种不一样处理措施的复发状况处理组脐带感染合计复发率(%)复发未复发吡嗪磺合剂76(105.39)1920(1890.61)19963.81乙胺嘧啶27(24.97)446(448.03)4735.71对照53(25.56)431(458.44)48410.95合计156279729535.28E11==1996×=105.39156×199629531562953理论复发率分析:与前面独立性检查从同一种总体中随机抽样的抽样方式不一样,本例是从多种总体中进行抽样,是有关多组样本率的比较问题。解H0:三种措施的总体复发率相等,p1=p2=p3=pH1:三种措施的总体复发率不全相等计算理论频数:

E12=1890.61,E21=24.97,E22=448.03,E31=25.56,E32=458.44

检查记录量为:对α=0.05及df=(3-1)×(2-1)=2,查2界值表(附表5),得x20.05(2)=5.991,P<0.05,拒绝H0,接受H1,即三种不一样措施复发率记录学差异,以不投药组的复发率最高。R×C表χ2检查的应用注意事项1.对R×C表,不易有1/5以上格子的理论频数不不小于5,或有一种格子的理论频数不不小于1。 出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最佳!)(2)删去该格所在的行或列(丢失信息!)(3)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象)

删除丙组乙丙合并2.多组比较时,若效应有强弱的等级,如+,++,+++,最佳采用背面的秩和检查措施。χ2检查只能反应其构成比有无差异,不能比较效应的平均水平。

表8观测组与对照组的疗效比较组别数例7-5的两两比较小结在选用χ2检查时,一定要考虑其对总例数和理论频数的规定。多种独立样本的χ2检查,结论为拒绝检查假设时,只认为总体率或构成比之间总的来说有差异,若要理解差异的详细状况,要深入做卡方分割。对于成组分类数据的2×2表:

n

≥40且所有E≥5

n≥40但有1<E<5

四格表资料的措施选择行列表资料的χ2检查第三节秩和检查秩和检查的基本思想在不知总体分布的状况下怎样运用数据所包括的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有对应的位置和次序,称为该数据的秩(rank)。在一定的假设下,这些秩及其记录量的分布是可以求出来的,且与本来的总体分布无关,可进行所需要的记录推断。秩和检查的重要长处①合用范围广。对变量的类型和分布无特殊规定,不管样本资料所来自的总体分布形式怎样,甚至是未知的,都能合用。②对数据规定不严。对某些指标不便精确测定,只能以严重程度,优劣等级,先后次序等作记录的资料也可应用。③对样本量无严格规定。秩和检查的重要缺陷对于符合参数检查的资料假如用非参数检查,由于没有充足运用资料提供的信息,故检查效能低于参数检查,若要使检查效能相似,往往需要更大的样本含量。因此,在实际工作中对符合参数检查的资料,或经变量变换后符合参数检查的资料应首选参数检查;若不能满足参数检查条件的资料,应选用非参数检查。非参数记录措施诸多,本章重要简介其中应用最广的秩和检查。秩和检查在非参数检查中效能较高,又比较系统完整。所谓“秩”,又称等级,就是将数据按从小到大进行排序,给出1,2,3,…序号或等级的一种编码。重要用于等级数据或不符合参数检查的数值数据资料。已知总体分布类型,对未知参数(μ、π)进行统计推断依赖于特定分布类型,比较的是参数

参数记录(parametricstatistics)非参数记录(nonparametricstatistics)对总体的分布类型不作任何要求

不受总体参数的影响,比较分布或分布位置

适用范围广;可用于任何类型资料(等级资料)对于符合参数记录分析条件者,采用非参数记录分析,其检查效能较低配对设计的符号秩和检查又称Wilcoxon符号秩和检查(Wilcoxon配对法,或Wilcoxonsignedranktest)是推断其差值与否来自中位数为零的总体的措施,可用于配对设计差值的比较和单同样本与总体中位数的比较。一、配对比较的符号秩和检查一、配对比较的符号秩和检查例7-7为考察某种药物的疗效,对患呼吸疾病病人进行临床治疗,得到其治疗前后谷丙转氨酶指标资料如下表7-11所示,试问治疗前后病人的ALT指标有无差异?(α=0.05)病人编号治疗前xi治疗后yid=xi-yi秩次(1)(2)(3)(4)(5)114.414.7-0.3-229.49.6-0.2-1319.613.95.75458.238.619.67525.122.82.34628.628.00.63746.516.430.18824.517.27.36合计——T+=33T-=3表7-11病人治疗前后ALT指标解(1)检查假设H0:配对差值的总体中位数为0;H1:配对差值的总体中位数不为0(2)求差值,编秩次。首先求出各对数据的配对差值d,按差值的绝对值大小由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为0,舍去不计;若差值的绝对值相等,则取其平均秩次.(3)求秩和,确定记录量T分别求出正、负秩次之和,正秩和以T+表达,负秩和以T-表达。T+与T-之和应为n(n+1)/2(其中n为不等于0的对子数),本例T+=33,T-=3,其和为36,n=8,8(8+1)/2=36,可见T+、T-计算无误。再取两者中较小者为记录量T值,本例取T=3。确定P值,做出推断结论以T值查附表T界值表(附表11:配对设计用P292),若检查记录量T值在上、下界值范围内,其P值不小于对应的概率水平;若T值在上、下界值上或范围外,则P值不不小于对应的概率水平。本例n=8,T=3,查T界值表(配对设计用),得界值范围3~33,P<0.05,按α=0.05检查水准,拒绝H0,可认为治疗前后ALT差异有记录学意义。配对资料的符号秩和检查的基本思想是:假如两种检测措施的效果无差异,这些配对数值之差应服从于以0为中心的对称分布,也就相称于把这些差值按其绝对值大小编秩并标上本来的符号后,正秩和与负秩和在理论上应是相等的(都等于n(n+1)/4,n为有效对子数),假如H0成立,T值就应靠近n(n+1)/4。T值愈小,T与n(n+1)/4的差距就越大,对应的P值就愈小,当P≤α时,就拒绝H0,接受H1,认为差值的总体中位数不等于0。本法的基本思想正态近似法若n>25,超过附表的范围,可用正态近似法作u检查式中0.5是持续性校正数,由于T值是不持续的,而u分布是持续的,这种校正影响甚微,常可略去。若相似秩次较多时(不包括差值为0者),用上式求得的u值偏小,应计算较正的uc。式中tj为第j(j=1,2…)个相似秩次的个数。完全随机设计两样本比较的秩和检查,亦称成组设计的两个样本比较的秩和检查(Wilcoxon两样本比较法)。本法运用两样本观测值的秩和来推断样本分别代表的总体分布与否相似。二、两样本比较的秩和检查二、两样本比较的秩和检查例7-8为研究某种抗生素新药的作用,用已知的抗生素作为对照药,对肺炎患者进行临床治疗。试验成果为治疗后病人的白细胞指标WBC,原始数据的记录见表7-13。检查两组抗生素药物治疗后的WBC与否相似?某新药对照药WBC秩次WBC秩次4.703.54.4617.70197.32166.70145.74124.4824.703.57.08155.52105.4685.83134.7457.40178.30205.5295.71115.2977.52184.896n1=10T1=115.5n2=10T2=94.5表7-13两组治疗后病人的WBC(109/L)1.建立检查假设,确定检查水准H0:两组治疗后病人的WBC总体分布相似H1:两组治疗后病人的WBC总体分布不一样α=0.052.计算记录量T值(1)编秩将两组数据由小到大统一编秩。编秩时不一样组有相似数据时取平均秩次,同组内可不求平均秩次。(2)求秩和,确定记录量T两组秩次分别相加,其对应的秩和分别为115.5和94.5。若两组例数相等,则任取一组的秩和为记录量。若两组例数不等,则以样本例数较小者对应的秩和为记录量。本例n1=10,检查记录量T=115.5。3.确定P值,做出推断结论查T界值表(附表12:成组设计用P293),先从左侧找到n1(较小的n),本例为10,再从表上方找两组例数的差(n2-n1),本例n2-n1=0,在两者交叉处即为T的界值。将检查记录量T值与T界值相比,若T值在界值范围内,其P值不小于对应的概率;若T值等于界值或在界值范围外,其P值等于或不不小于对应的概率。本例概率为双侧0.05对应的T界值为78~132,T=115.5未超过该范围,故P>0.05。按α=0.05检查水准,不拒绝H0,不认为两组治疗后病人的WBC分布的位置不一样附表12本法的基本思想由上例可见,假如检查假设H0成立,分别有n1与n2的两个样本,来自同一总体或分布相似的两个总体,两样本的平均秩次T1/n1与T2/n2应相等或相近,且都和总体的平均秩次(N+1)/2相差很小。含量较小的样本n1的秩和T与平均秩和n1(N+1)/2一般相差不大;若T值偏离此值太远,即T与n1(N+1)/2相差很大,则表达抽得样本记录量T值的概率很小,因而拒绝检查假设H0;反之,则接受H0。正态近似法假如n1或n2-n1超过了成组设计T界值的范围,可用正态近似检查。式中N=n1+n2,0.5为持续性校正数。上式用于无相似秩次,或相似秩次不多时;若相似秩次较多(例如超过25%)时,应按式进行校正。其中,,tj为第j个相似秩次的个数。三、多样本总体比较的秩和检查例7-9研究白血病时,测定四组鼠脾DNA的含量,成果列于表7-14。试检查各组DNA含量有无明显差异?(α=0.05)解(1)检查假设H0:四组鼠脾DNA含量的总体分布相似H1:四组鼠脾DNA含量的总体分布不全相似(2)编秩次四个样本总例数N=32.将这四个样本32个观测值混合,统一从小到大编秩次,对相等的数值,如在不一样组时取平均秩次,由此得各组秩次见表7-14.不一样组中有相似的含量值10.3两个,12.3三个,均取各自的平均秩次。(3)求秩和,计算检查记录量公式:(4)记录判断:对α=0.05,由df=3,查χ2临界值表得χ20.05(3)=7.81,因H=19.90>7.81,则P<0.05,拒绝H0,接受H1,即可认为四组鼠脾DNA含量差异有记录学意义。频数表资料(或等级资料)的两样本比较例用某药治疗不一样病型的老年慢性支气管炎病人,疗效见表7.4第(2)、(3)栏,试比较该药对两种病型的疗效?1.建立检查假设,确定检查水准H0:两种病型的病人疗效总体分布相似H1:两种病型的病人疗效总体分布不一样α=0.052.计算检查记录量(1)编秩本例为等级资料,先按组段计算各等级的合计人数,见表7.4第(4)栏,由此确定第(5)栏各组段秩次范围,然后计算出各组段的平均秩次见第(6)栏,如疗效为“控制”共107例,其秩次范

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论