医学统计学-定性资料的分析_第1页
医学统计学-定性资料的分析_第2页
医学统计学-定性资料的分析_第3页
医学统计学-定性资料的分析_第4页
医学统计学-定性资料的分析_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1/73,第七章定性资料的分析,参数估计:率的区间估计假设检验:,2/73,一、率的可信区间,与均数一样,率也存在抽样误差,率的标准差又称率的标准误为:,率的抽样误差,3/73,(一)率的分布,当总体率0.5时为正偏态,当0.5时为负偏态,当=0.5时为对称分布。只有当n较大、率和(1-)都不太小时,例如n和n(1-)均大于5时,率的抽样分布近似于正态分布。,4/73,(二)总体率的区间估计,正态近似法查表法,5/73,1.正态近似法,条件:样本例数n足够大,且样本率p和(1-p)都不太小时,即np和n(1-p)均大于5时,样本率p的抽样分布近似正态分布。总体率的可信区间:,6/73,例从某地人群中随机抽取144人,检查乙型肝炎表面抗原携带状况,阳性率为9.20,求该地人群的乙型肝炎表面抗原阳性率的95可信区间。,n=144,p=9.20,95可信限为:9.20%1.962.41%即该地人群的乙型肝炎表面抗原阳性率的95可信区间为:4.48%13.92%。,7/73,2.查表法,例4.5有人调查29名非吸毒妇女,出狱时有1名HIV(人免疫缺陷病毒)阳性,求阳性率95可信区间?直接查附表6.2,在行n=29,列x=1交叉处0.117.8即为阳性率95可信区间,8,二、定性资料的假设检验样本率与总体率的比较两样本率的比较多个率的比较构成比的比较配对设计两样本率的比较两事件数的比较定性资料假设检验的正确应用,9/73,0,p,例7.1据临床经验,一般的胃溃疡病患者有20会出现胃出血症状。某医院观察了304例65岁的胃溃疡病患者,其中有96例发生胃出血,占31.58,问老年患者是否较一般患者易出血?,7.1样本率与总体率的比较,例7.1据临床经验,一般的胃溃疡病患者有20会出现胃出血症状。某医院观察了304例65岁的胃溃疡病患者,其中有96例发生胃出血,占31.58,问老年患者是否较一般患者易出血?,p,10/73,样本率与总体率比较的正态近似检验,目的:推断样本是否来自某已知总体条件:正态近似检验:np5同时n(1-p)5,11/73,检验假设:H0:=0,老年胃溃疡病患者的胃出血率等于20;H1:0,老年胃溃疡病患者的胃出血率大于20。单侧=0.05。P3.84的可能性只有0.05,是一小概率事件。,33/73,本例2=3.520.05。按=0.05水准不拒绝H0,差别无统计学意义。故尚不能认为单纯手术疗法与联合疗法对乳腺癌患者治疗效果有差别。,34/73,基本思想概括,若H0成立,则四个格子的实际频数A与理论频数T之差异纯系抽样误差所致,故一般不会很大,2值也就不会很大;在一次随机试验中,出现大的2值的概率P是很小的。,35/73,因此,若根据实际样本资料求得一个很小的P,且P(检验水准),根据小概率原理,就有理由怀疑H0的真实性,因而拒绝它;若P,则没有理由拒绝H0,36/73,四格表资料2检验专用公式,37/73,由于2分布是一种连续性分布,附表3中2界值是根据此连续性分布的理论公式计算出来的,但两个或多个率比较的原始数据却属定性资料,是不连续的,故式(7.5)只是一个近似计算公式。计算出来的2值往往偏大,相应的P值偏小,从而人为地增加了范第一类错误的机会。为纠正这种偏性,可采用校正2,用C2表示。,四格表资料2检验的校正,38/73,2检验不校正的条件:n40且所有T52检验校正的条件:n40但有lT5,四格表资料2检验的应用条件,确切概率法:当n和T过小,如T1或n40时因近似程度太差,不宜用2检验,而应改用确切概率法。,39/73,四格表资料2检验的校正公式,40/73,例7.3比较单用甘磷酰芥(单纯化疗组)与复合使用争光霉素、环磷酰胺等药(复合化疗组)对淋巴系统肿瘤的疗效,问两组患者总体的完全缓解率有无差别,41/73,H0:1=2;H1:12。0.05。,按=1查附表3,2界值表,得P0.05,按=0.05水准不拒绝H0,差异无统计学意义。故根据本资料尚不能认为两种疗法的总体缓解率有差别。,本例a格的理论频数最小,T11=1216/41=4.6840,故考虑用校正公式计算2值。,42/73,u检验与2检验的关系,两样本率比较时,如为双侧检验,则u检验和四格表2检验是等价的,即自由度为1的2=u2;校正u检验和四格表校正2检验也是等价的,应用条件亦相同。若为单侧检验,则用u检验较为方便。,43/73,数据特点:多(R)个率的比较,其基本数据有R行2列,构成R2表,用以表述R个率的基本数据。目的:R2表的2检验用于推断R个样本率各自所代表的总体率是否相等。,7.3多个样本率的比较,44/73,多个样本率的比较的公式,式中,A为第R行第C列对应的实际频数,nR为第R行的行合计,nC为第C列的列合计,n为总样本含量。,45/73,例7.4某地调查了19951998四个年度中小学女生的贫血状况,见表7.4,问各年度间学生贫血率有无差别?,46/73,H0:四个年度学生的贫血检出率相等;H1:四个年度学生的贫血检出率不等或不全相等。=0.05。=(4-1)(2-1)=3。查附表3,2界值表,得P0.005。按=0.05水准拒绝H0,接受H1,差异有统计学意义。故可认为该地四个年份中小学女生贫血检出率不相等,47/73,多个率的多重比较,当多个样本率比较的2检验,结论为拒绝H0时,只能认为各总体率之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别。若要进一步比较哪些率之间有差别,应进行多重比较。,48/73,Scheff可信区间法,原理:通过计算两率之差的可信区间来推断比较组间有无差异。两率之差的(1-)100%可信区间,pA和pB分别为比较组的样本率;nA和nB分别为比较组的样本含量;k所有的组数。,49/73,例7.5试对例7.4四个年度学生贫血检出率的分析结果进一步作两两比较.,2=281.6263,P0.005,该地四个年份中小学女生贫血检出率总的说来有差别。,2检验的结果:,2=281.6263,P40但有一个理论频数lT5时,需用校正2检验;若出现T1或n40时,则用确切概率法检验为妥,7.9定性资料假设检验的正确应用,68/73,两样本率比较时,如为双侧检验,则u检验和四格表2检验是等价的,校正u检验和四格表校正2检验也是等价的,应用条件亦相同。若为单侧检验,则用u检验较为方便。,69/73,当多个样本率(或构成比)比较的假设检验结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别。若要进一步明确差别之所在,可进行多重比较。,70/73,RC表2检验的应用注意事项,1.对RC表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好!)(2)删去该格所在的行或列(丢失信息!)(3)根据专业知识将该格所在行或列与别的行或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论