卡方检验()PPT课件_第1页
卡方检验()PPT课件_第2页
卡方检验()PPT课件_第3页
卡方检验()PPT课件_第4页
卡方检验()PPT课件_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,1,第六章2检验,.,2,一、2分布的定义,2分布是从正态分布派生出来的一个连续型分布,与正态分布和t分布关系密切。下面的定理清楚地表明了其间的关系。定理1:设Z1,.,Zn是n个独立的标准正态变量N(01),则其平方和服从自由度为n的2分布。推论1:标准正态变量Z的平方服从自由度为1的2分布。即:Z2=2(1)在定理中令n=1即得此推论。,.,3,二、2分布的性质,1、2分布的概率密度函数f(2,)的图形见下图。特点:(1)自由度越大,曲线越趋近于对称;(2)当自由度,2分布趋向正态分布。,.,4,2、若2,则E(X)=,Var(X)=23、2分布具有可加性。若X12X22,且X1与X2独立,则(X1+X2)2,.,5,检验的基本思想以两样本率比较的检验为例,介绍检验的基本思想。分布是一种连续型分布分布的形状依赖于自由度的大小,当自由度2时,曲线呈L型;随着的增加,曲线逐渐趋于对称;当自由度时,分布趋向正态分布。分布的具有可加性。,.,6,有时为方便用a、b、c、d分别为四格表中四个实际频数,.,7,1.独立性假设与理论频数计算在对22表作统计处理之前,通常都有一个笼统的检验假设,即属性A与B相互独立。为便于理解这个独立性假设,不妨给上表赋予实际内容。以研究吸烟与肺癌的关系为例,设A代表“吸烟与否”,A1=“吸烟”,A2=“不吸烟”,B代表“患肺癌与否”,B1=“患肺癌”,B2=“未患肺癌”。于是,A与B相互独立,就意味着吸烟与肺癌无关联。,.,8,吸烟与不吸烟患者患肺癌的概率应当相等,即P(B1/A1)=P(B1/A2)=P(B1)=a+c/n而吸烟者出现的概率P(A1)=a+b/n,不吸烟者出现的概率P(A2)=c+d/n,故吸烟者同时患有肺癌的概率为:P(A1B1)=P(A1)P(B1/A1)公式P(A1B1)=P(A1)P(B1)=(a+b)/n(a+c)/n,.,9,故在前述独立性假设检验的前提下,与观察频数a对应的理论频数为:式中TRC为第R(row)行、第C(column)列的理论频数,nR为相应行的合计,nc为相应列的合计,n为总例数.,.,10,基本公式(亦称Pearson),.,11,值反映了实际频数与理论频数的吻合程度,其中反映了某个格子实际频数与理论频数的吻合程度。若检验假设成立,实际频数与理论频数的差值小,则值也会小;反之,若检验假设不成立,实际频数与理论频数的差值会大,则值也会大。值的大小还取决于个数的多少(严格地说是自由度的大小)。,.,12,K.Pearson(1899)提出的拟合优度检验是用来检验实际观察数于依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观察数相配合。包括两种类型:1、检验观察数与理论数之间的一致性。2、通过检验观测数与理论数之间的一致性来判断事物之间的独立性。Pearson拟合优度(goodnessoffittest)2检验,.,13,由于各皆是正值,故自由度愈大,值也会愈大;所以只有考虑了自由度的影响,值才能正确地反映实际频数和理论频数的吻合程度。检验时,要根据自由度查界值表。当时,拒绝,接受;当,时,尚没有理由拒绝。,.,14,检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,自由度(df)=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值.自由度=(行数-1)(列数-1),自由度,.,15,22表的计算(1)当n40,Tij5的条件下可用下列简化公式,(1)四格表检验,.,16,例1工农业高血压患病率的比较(50岁以上男性),首钢调查50-59岁男性工人1281人、高血压患者386人,患病率为30.13%。石景山区农民387人,血压血患者65人,患病率为16.80%,从事工农业生产的男性患病率有无差别。,.,17,.,18,解:建立检验假设H0:1=2(工人与农民的总体患病率相同)=0.05估计总体某现象的发生或存在的概率,假定高血压的发生和这两种工种众彼此独立无关,因此,这两组资料是一总体中的两个随机样本,估计总体患病率=451/1668=0.2704未患率=1217/1668=0.7296,.,19,.,20,计算检验统计量2值查2分布界值表,作出统计结论。d.f=(r-1)(c-1)=1;故按p0.01水准拒绝Ho接受H1。结合具体问题作出专业结论:不同职业的高血压患病率极显著意义,工人的高血压患病率显著高于农民。,.,21,应用简化公式计算:,.,22,(2)n40,但有1Tij0.05,1P40,按原理要求应进行校正计算,0.05,1P0.05无显著性意义。,即不能得出使用丹参注射液降低死亡率的结论。,.,31,(3)n40,或T0,须计算满足DiD*和PiP*条件的各种组合下四格表的累计概率。若D*0.05。按=0.05检验水准,不拒绝H0,结论:尚不能认为预防注射与非预防的新生儿HBV的总体感染率不等。,.,40,.,41,.,42,(三)配对四格表资料的2检验,属于配对设计的两组频数分布的2检验。这类问题的原始数据可以表示为表2所示的四格表形式。表1和表2的区别仅在设计上,表1中左边一列是两个独立样本,行合计是事先固定的;而表2这里的“两份样本”互不独立,样本量都是n,是固定的,而行合计与列合计却是事先不确定的。常用于:1、比较两种处理方法的阳性率的差别2、检验两种方法的结果的相关性,.,43,变量1的阳性率变量2的阳性率=可见,两个变量阳性率的比较只和b、c有关,而与a、d无关。,.,44,H0:B=C,即两种方法的总体检测结果相同H1:BC,即两种方法的总体检测结果不相同若H0成立,变量1与变量2所示的结果不一致的两个格子理论频数都应该是。由2检验基本思想得,.,45,2统计量的计算公式为当b+c40时,需对上式校正,校正公式为,.,46,例题:,某市疾病预防控制中心用荧光抗体(甲法)和常规培养基(乙法)两种检测方法测定了249分食品检样中的沙门菌,检测结果见表。荧光抗体法的检出率为77.11%,常规培养基法的检出率为67.87%。试问两种方法的检测结果是否有差别?,.,47,.,48,单一样本按两种处理交叉分类的配对设计资料,每种处理的观察结果只有阴性、阳性两种可能。从配对结果看,共有4种情况;两种方法检测结果均为阳性(甲+乙+);两种方法均为阴性(甲-乙-);甲方法为阳性而乙方法为阴性(甲+乙-);乙方法为阴性而乙方法为阳性(甲-乙+)。这类资料有以下两种分析目的,分析方法各异。,.,49,一、两种处理方法的阳性率比较,H0:两种方法的总体阳性检出率相同H1:两种方法的总体阳性检出率不同=0.05查界值表,得P0.05,按=0.05水准拒绝H0,接受H1,可以认为两种方法的阳性检出率不同,荧光抗体法的阳性检出率高于常规培养基法。,.,50,二、两种处理结果的关联性分析,此类设计,如果分析时考虑两种处理间有无关系或相互独立时,可按每个对象分别按两种处理而得到的结果分组,用一般四格表的处理办法。H0:两种处理方法的结果无关H1:两种处理方法的结果有关=0.05查界值表,得P0.01,按=0.05水准拒绝H0,接受H1,可以认为两种方法的检测结果具有相关性,即如果荧光抗体法的阳性检出率高,常规培养基法也高。,.,51,(2)RC表资料的2检验,RC表又称为行列表,其检验用于多个样本率的比较、两个或多个构成比的比较、以及双向无序分类资料的关联性检验。基本数据有三种情况:多个样本率比较时,有R行2列,称为R2表;两个样本的构成比比较时,有2行R列,称2R表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,有R行C列,称为RC表。,.,52,行列表资料的检验仍可用Pearson公式,化简后得行列表检验的专用公式:但在使用时须注意,简化计算公式只有在所有Tij均大于5的情况下使用。若出现一个理论数小于1的格子,或1T5的格子数超过总格子数的1/5,都不宜使用上述方法,应进行适当的处理。,.,53,处理的方法继续观察,适当扩大样本量。将邻近有意义的(或性质相同)分类进行合并,以适当增加频数,满足计算公式的应用条件时,方可做出适当的分析。,.,54,一、多个样本率比较例:为了研究盐酸苯钠普利对原发性高血压病的治疗效果,某医师对1019例原发性高血压病人进行了6个月的用药治疗,并观察不同类型高血压患者的疗效,试问盐酸苯钠普利治疗不同类型高血压病的有效率是否有差别?,.,55,.,56,H0:盐酸苯钠普利治疗不同类型高血压病的有效率相同H1:盐酸苯钠普利治疗不同类型高血压病的有效率不全相同=0.05,(R-1)(C-1)(4-1)(2-1)3,界值表,得P0.05,按=0.05水准,不拒绝H0,尚不能认为有行为问题和无行为问题儿童的意外伤害类型分布不同,即可认为发生过意外伤害的儿童中,有行为问题和无行为问题儿童的意外伤害类型分布一致。,.,60,三、趋势检验,当某因素是按自然顺序的等级分层或连续资料等级化再分层的分析,可采用CochranArmitage趋势分析,以分析是否随分层等级而变化的趋势。式中:N=总人数n各组人数T=阳性总数t各组阳性数Z=各组的分数,.,61,例、调查了不同工龄的纺织女工神经衰弱的患病情况,按工龄长短分别统计患病率见下表,问纺织女工神经衰弱的患病率有无随工龄增加而增加的趋势?,.,62,.,63,H0:纺织女工神经衰弱的患病率无随年龄增加而增加趋势H1:纺织女工神经衰弱的患病率有随年龄增加而增加趋势=0.05工龄的组中值分别为:0.5、1.5、3、5、7、10为计算简化各组分数Z组中值5,.,64,查附表3,p0.005。按=0.05水准,拒绝H0,接受H1。故可以认为纺织女工的神经衰弱患病率有随年龄增加而增加趋势。,.,65,.,66,H0:K反应的强弱与临床情况无关。H1:K反应的强弱与临床情况有关。逐项计算其理论值,在行合计和列合计求积值最小者算起得到如下的理论数:T11=70137/404=23.7T12=70.6T13=42.7T21=70183/404=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论