分类资料的推断与x2检验统计学.ppt_第1页
分类资料的推断与x2检验统计学.ppt_第2页
分类资料的推断与x2检验统计学.ppt_第3页
分类资料的推断与x2检验统计学.ppt_第4页
分类资料的推断与x2检验统计学.ppt_第5页
免费预览已结束,剩余58页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

C班理论课:4.5(周一)上午3-4节改为:4.2(周五)上午3-5节501课室B班理论课:4.5日(周一)上午8-10节改为:4.8(周四)上午3-5节201课室,第十章分类变量资料的统计分析,公共卫生学院医学统计与流行病学系林爱华,第二节分类变量资料统计推断,一、率的抽样分布二、率的抽样误差与标准误三、总体率的区间估计四、率比较的u检验,一、率的抽样分布,二项分布(binomialdistribution):例:假设注射某种免疫疫苗会有10%的人出现不适反应。问3人接种后各种可能后果的概率是多少?,贝努利试验(Bernoullitrials):,n次独立、重复试验(每次试验只出现A和之一,每次概率都是和)。贝努利试验中,事件A可能发生0,1,2,n次,A恰好发生k次的概率为:,二项分布(binomialdistribution):,若随机变量X只能在:中取值,各种可能值的概率满足前式,我们就说X服从参数n和的二项分布,记为:,已知:=0.3,n=5;=0.3,n=10;=0.3,n=15;=0.5,n=10。试根据式(10-6)求各阳性数事件的概率并作概率分布图。,图10-1率的抽样分布图(二项分布),率的抽样分布特征:,1.为离散型分布;2.当=0.5时,呈对称分布;3.当n增大时,逐渐逼近正态分布。一般认为,当n和n(1-)5时,可近似看作正态分布。,1.抽样误差的概念:在抽样研究中,率和均数一样,也存在抽样误差,即样本率和总体率或各样本率之间存在着差异,这种差异称为率的抽样误差(samplingerrorofrate)。,二、率的抽样误差与标准误,2.率的标准误:,率的抽样误差用率的标准误(standarderrorofrate)表示。其计算公式为:其估计值为:,例10-6为了解某地人群结核菌素试验阳性率情况,某医疗机构在该地人群中随机检测了1773人,结核菌素试验阳性有682人,阳性率为38.47%,试计算其标准误。,三、总体率的估计,包括点估计和区间估计。点估计即用样本率来估计总体率;区间估计是按一定概率来估计总体率所在的范围,即估计总体率的可信区间(estimationofconfidenceintervalofrate)。根据n和P的大小,总体率的可信区间可按下面的两种方法计算:,(一)正态近似法:当样本含量n足够大(例如大于50),样本率P或1-P均不太小时(如nP和n(1-P)均大于5),样本率的分布近似正态分布,可按正态分布的理论来估计总体率的可信区间。,(二)查表法:当n较小,如n50,特别是P接近于0或1时,可查阅有关专著,查出可信区间。,正态近似法举例(基于例10-6),可信区间的计算公式为:,95%的可信区间:38.47%1.961.16%=36.20%40.74%99%的可信区间:38.47%2.581.16%=35.48%41.46%,四、样本率比较的u检验:,(一)样本率与总体率的比较:(二)两个样本率的比较:,应用条件:,(一)样本率与总体率的比较:,例10-7一般情况下,直肠癌围术期并发症发生率为30%,现某医院手术治疗了385例直肠癌患者,围术期出现并发症有100例,并发症发生率为26%,问该院直肠癌患者围术期并发症发生率与一般情况比较有无统计学差异。,首先讨论应用条件:是否满足下式。本例:,1.建立检验假设:H0:=0H1:0=0.052计算u值:,3.确定P值,判断结果本题u=1.7131.96,P0.05,按=0.05的水准不拒绝H0,差异无统计学意义,故尚不能认为该院直肠癌患者围术期并发症发生率与一般情况不同。,(二)两个样本率的比较:,例10-8为了解某地小学生蛔虫感染率的城乡差异,抽样调查了该地小学生22792人,其中城镇小学生8207人,粪检蛔虫卵阳性数为701人,蛔虫感染率为8.54%,乡村小学生14585人,粪检蛔虫卵阳性数为2167人,蛔虫感染率为14.86%,试比较该地小学生蛔虫感染率城乡差异有无统计学意义。,首先讨论应用条件。1.建立检验假设:H0:1=2H1:12=0.05,2计算u值:,3.确定P值和判断结果:本题u=13.7392.58,P0.01,按=0.05的水准,拒绝H0,差异具有统计学意义,该地城镇和乡村小学生蛔虫感染率不相等,乡村小学生蛔虫感染率高于城镇小学生。,一、2检验的基本思想二、四格表资料的2检验三、配对设计分类变量资料的2检验四、行列表资料的2检验,第三节2检验,方法简介:检验(chi-squaretest或称卡方检验)是英国统计学家Pearson在1900年提出的一种用途广泛的假设检验方法。这里介绍其用于两个或两个以上独立样本的率(或构成比)的比较以及配对资料比较的方法。,一、检验的基本思想:,例10-9某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治疗71例,有效52例,乙药治疗42例,有效39例,结果见表10-7。问两种药物的有效率是否有差别?,四个格子的数据是表10-7中基本数据,其余的数据都是从这四个数据推算得来的,这种资料称四格表(fourfoldtable)资料。,表10-7甲、乙两种药物治疗动脉硬化的疗效比较,A为实际频数(actualfrequency),即每个格子的实际发生数,T为理论数(theoreticalfrequency),是根据无效假设推算出来的。H0:1=2=p0=80.53%(91/113),卡方检验的基本公式:,A药治疗71人,理论上应该有:71(91/113)=57.18人有效;B药治疗42人,理论上应该有:42(91/113)=33.82人有效。理论频数可由下式求得:例如:,2值反映的是实际频数与理论频数的吻合程度,在无效假设H0成立的情况下,理论数和实际数相差不应该太大,出现较大的2值的概率较小,或说2值越大,就越有理由推翻无效假设H0。,四格表资料值的自由度:,在行合计与列合计固定的情况下,一个格子的数值确定之后,其它三个格子的数值也就确定下来。自由度为1。通式计算:,自由度一定时,其2值的概率分布也就确定。根据自由度和检验水准,查表10-13可得2界值,若2值20.05(),则可按=0.05的检验水准拒绝H0;若2值20.05(),则还不能拒绝H0。,2界值表,1.建立检验假设,确定检验水准:H0:两药有效率相同,即12H1:两药有效率不同,即12=0.05,二、四格表资料的2检验,(一)2检验的基本步骤:例10-9:某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治疗71例,有效52例,乙药治疗42例,有效39例,结果见表10-7。问两种药物的有效率是否有差别?,3.确定P值,做出推论:=(行数-1)(列数-1)=(2-1)(2-1)=1,20.025(1)=5.02,20.01(1)=6.63。本例5.022=6.486.63,所以,0.025P0.01,按=0.05水准,拒绝H0,接受H1,故认为甲、乙两药的疗效不同,乙药疗效要好于甲药。,2.计算检验统计量和自由度:,(二)四格表资料专用公式:,(三)连续性校正的公式:,2分布是一种连续性分布,而分类变量资料属离散性分布,由此得到的统计量也是不连续的。为改善2统计量分布的连续性,英国统计学家YatesF建议将实际频数和理论频数之差的绝对值减去0.5以作校正。,(四)卡方检验的应用条件:,1.T5,且N40时,用不校正公式计算2值。2.1T5,且N40时,用连续性校正2检验。3.T1或N20.01(2),P0.01,按=0.05的检验水准,拒绝H0,接受H1,故可认为甲、乙、丙三家医院院内感染率总的来讲有差别。,例10-13某研究者欲了解白内障发病是否与ABO血型有关,收集有关资料见表10-11,问白内障组与对照组ABO血型分布有无差别?,1检验假设:H0:白内障组与对照组ABO血型分布相同。H1:白内障组与对照组ABO血型分布不同或不全相同。=0.052计算2值:,3确定概率P值和判断结果:=(4-1)(2-1)=3,查2值表,20.05(3)=7.81,20.05,不拒绝检验假设,尚不能认为白内障组与对照组ABO血型分布不同。,行列表资料2检验的注意事项,1进行行列表资料2检验时,要求不能有1/5以上的格子理论数小于5,或者不能有任意一个格子的理论数小于1,否则易导致分析的偏性。出现这些情况时可采取以下措施:,(1)在可能的情况下再增加样本含量;(2)从专业上如果允许,可将太小的理论数所在的行或列的实际数与性质相邻的行或列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论