相对数及卡方检验_第1页
相对数及卡方检验_第2页
相对数及卡方检验_第3页
相对数及卡方检验_第4页
相对数及卡方检验_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相对数及卡方检验第一页,共五十八页,2022年,8月28日2、比例(proportion)

又称构成指标,表示某一事物内部各组成部分所占的比重或分布,常用百分数表示。计算公式为注意:构成比之和为100%(或1),具体计算时,有时受尾数取舍的影响,其和不等于100%,可将尾数作适当调整,使其和等于100%。各构成比之间是相互制约的,其比重的增减互相影响(取值在0~1)。第二页,共五十八页,2022年,8月28日疾病种类死亡人数百分比(%)恶性肿瘤5033.33循环系统疾病4026.67呼吸系统疾病3020.00消化系统疾病2013.33传染病106.67合计150100.00某医院2001年住院病人中5类疾病的死亡情况第三页,共五十八页,2022年,8月28日3、率(rate):又称频率指标,表示某现象发生的频率或强度,比例基数用k表示,据习惯定,一般至少保留12为整数。包括%、‰、1/万、1/10万,计算公式为率=(某时期内某现象实际发生的观察单位数/同时期内某现象可能发生的观察单位总数)K院内感染率(月)=59/650=0.0908=9.08%院内感染率(日)=(59/30)/650=0.0030=0.3%第四页,共五十八页,2022年,8月28日某地各年龄组妇女宫颈癌患者构成比及患病率年龄(岁)危险人数患者数患者构成比(%)患病率(1/万)

30以下100000 31.20.330~966672911.23.040~630008231.813.050~240009637.240.060~60004818.680.0合计289667258100.08.9第五页,共五十八页,2022年,8月28日4、相对危险度(relativerisk,RR)同一事件在两种不同情况下的发生率之比。患病未患病合计吸烟1090100不吸烟24850合计12138150P1=10/100=0.1;P2=2/50=0.04;RR=P1/P2=0.1/0.04=2.5第六页,共五十八页,2022年,8月28日5.优势比(oddsratio,OR)某事件在某一种情况下的发生率与不发生率之比,与该事件在另一种情况下的发生率与不发生率之比的比。第七页,共五十八页,2022年,8月28日高血压和饮酒关系经常饮酒不经常饮酒合计

患者243660非患者126880合计36104140

OR=ad/bc=(2468)/(3612)=3.78

第八页,共五十八页,2022年,8月28日二、动态数列(dynamicseries):将反映某种现象在时间上的变化发展的一系列统计指标按时间先后顺序排列称为动态数列。可以用来观察和比较事物在时间上的变化和发展趋势。定基比:统一用某个时间的数据作基数,以各时间的数据与之相比,反映动态数列相对于基数的变化趋势。环比:用前一个时间的数据作基数,以相邻的后一个时间的数据与之相比,反映动态数列的逐期变化趋势。第九页,共五十八页,2022年,8月28日某省1972~1980年人口死亡率的变动年死亡率(%0)定基比(%)环比(%)19729.01100.019738.0589.389.319748.6796.2107.719758.3492.696.219767.7085.592.319777.7886.3101.019787.0177.890.119797.1279.0101.619806.8876.496.6

第十页,共五十八页,2022年,8月28日三、应用相对数应注意的问题1,计算相对数时总观察单位数应足够多。即率和构成比的分母不宜过小:否则样本率不稳定,易造成错觉;2,不要将构成比作率分析;

3、求平均率时不能直接将几个率相加求其合并率或平均率,而应以总发生数除以总可能发生例数。4,应注意率(或构成比)的可比性;当内部结构不同的相对数间进行比较时,若比较合计率,应计算标准化率。

第十一页,共五十八页,2022年,8月28日四、率的标准化1.标准化法的意义当比较两个总率时,如果两组内部某种能影响指标水平的重要特征的构成上有差别,往往造成总率的升高或下降,影响两个总率的对比;因此要设法消除其内部构成的差异,使之能合理地进行比较,所用的方法称为标准化法。目的:采用统一的标准构成以消除内部构成不同对总率的影响,使标准化后的标准化总率具有可比性。

第十二页,共五十八页,2022年,8月28日2.标准化法的计算方法

(1).选择标准人口:a.

应选择有代表性、较稳定的、数量较大的人群,如世界的、全国的、全省的、本地区的或本单位历年积累的数据的人口构成作标准。b.

将比较的两组(或多组)的人口数合并作为标准组c.

选其中一组(选人口数较多组)作为标准组。第十三页,共五十八页,2022年,8月28日[2].计算标准化率

将原率资料按影响因素的标准人口构成调整后算得标准化率(也称调整率)。直接法:

以标准人口数为标准人口构成p´=(N1p1+N2p2+…+Nkpk)/N=(Nipi)/N

Nipi为按照原各小组的率乘于标准组各小组的人口数所得各小组发生数,叫组各小组的分配发生数或预期发生数。

第十四页,共五十八页,2022年,8月28日某年甲乙两厂石棉工的石棉肺发病比较年龄组甲厂乙厂(岁)接触病人数发病率(‰)接触病人数发病率(‰)人数人数45400410.08001012.5

456001830.02001050.0合计10002222.01000

2020.0第十五页,共五十八页,2022年,8月28日某年甲乙两厂石棉肺发病率标化率演算和比较年龄组甲厂乙厂(岁)标准发病率预期发病发病率预期发病人口数(%)人数(%)人数(1)(2)(3)(4)(5)(6)45120010.01212.515>=45

80030.02450.040

合计200018.036

27.555第十六页,共五十八页,2022年,8月28日五、

医学中常用的相对数指标1、医学人口统计指标(1)人口总数(2)人口构成(3)人口生育自然增长率=粗出生率-粗死亡率(4)人口死亡粗死亡率(总死亡率)

mortalityrate:综合因素对一定时间和空间范围内的全部人群生命威胁的统计量。=一年的总死亡人数/年中(或平均)人口数年龄别死亡率、婴儿死亡率、新生儿死亡率、围生儿死亡率、孕产死亡率、死因别死亡率、死因构成别。(5)人口寿命第十七页,共五十八页,2022年,8月28日2、反映疾病发生水平的频率指标(疾病统计指标)1、发病率(incidencerate)某病发病率=(一定时期某病新发生的病例数/同时期内可能发生某病的人口数)K(1)时期:指观察所包括的时间范围,通常为年或月;

(2)可能发生“某病”:指存在发生某病的危险性和条件(流行病学上为暴露人群)。2、患病率(prevalencerate)

指在某时点接受医学检查时,可能发生某病的全体受检人群中被发现的某病病人现患新、旧病例数。第十八页,共五十八页,2022年,8月28日某病患病率=(检查时发现的某病现患病例数/该时点受检人口数)K

适用于病程较长的疾病的统计,反映某种疾病在一定人群中流行的规模或水平

3、病死率(fatality)某病死亡率=(观察期间内因某病死亡人数/同期某病病人总数)K第十九页,共五十八页,2022年,8月28日计数资料的统计推断

一、率的抽样误差(一)率的标准误:由抽样造成的样本率和总体率的差别称为率的抽样误差。总体率用表示,样本率用p表示,率的总体标准误用p表示,因总体率一般是未知的,若用样本率p估计,p的样本估计值为率的样本标准误sp,其计算公式为:第二十页,共五十八页,2022年,8月28日第二十一页,共五十八页,2022年,8月28日Eg:在某镇按人口的1/20随机抽取329人,作血清登革热血凝抑制抗体反应检验,发现阳性者29人,求阳性率及阳性率的标准误。

P=29/329=0.0881(8.81%)第二十二页,共五十八页,2022年,8月28日二、总体率的区间估计当n足够大(n>50),且np5或n(1-p)5时,样本率p近似服从均数为、标准误为P的正态分布,当总体率未知时,p用估计值sp取代,总体率的95%可信区间为p1.96sp:(p-1.96sp~p+1.96sp)总体率的99%可信区间为p2.58sp:(p-2.58sp~p+2.58sp)第二十三页,共五十八页,2022年,8月28日求某镇按人群血清登革热血凝抑制抗体反应阳性率的95%可信区间p=0.0881sp=0.01560.08811.960.0156=0.0575~0.1187(5.75~11.87%)第二十四页,共五十八页,2022年,8月28日三、率与构成比的假设检验(一)2分布与2检验设有标准正态变量Z,其概率密度在(-,+)区间上呈中间高,两边低且左右对称。Z2则不同,可能的取值范围为(0,+),Z12

+Z22

+…+Zk2

的分布称为自由度为K

的2分布,呈偏峰,随着自由度的增大,偏峰的情形逐渐改善,自由度相当大时接近正态分布。根据2分布界值表可以查到不同自由度的2分布的各种临界值。

第二十五页,共五十八页,2022年,8月28日自由度为2、3、5的c2-分布密度曲线图第二十六页,共五十八页,2022年,8月28日

适用:

检验两组(或几组)率或构成比差异是否有统计意义(样本量不限)。行与列两个顺序变量之间是否相关。第二十七页,共五十八页,2022年,8月28日一、四格表资料的2检验四格表是特殊的行列表,即22表

01characteristic0abn1.Ⅱ1cdn2.n.1n.2n

第二十八页,共五十八页,2022年,8月28日groupeffectivefailuresumeffectiverate%treatmentⅠ19a24b4344.2treatmentⅡ34c10d4477.3sum53348760.9比较两种治疗方法对卵巢癌的疗效第二十九页,共五十八页,2022年,8月28日假定成立平均有效率=60.9%(53/87)平均无效率=39.1%(34/87)treatmentⅠ的预期(理论)有效人数=43×(53/87)treatmentⅠ的预期(理论)无效人数=43×(34/87)treatmentⅡ的预期(理论)有效人数=44×(53/87)treatmentⅡ的预期(理论)无效人数=43×(34/87)第三十页,共五十八页,2022年,8月28日groupeffectivefailuresumtreatmentⅠ19(26.2)24(16.8)43treatmentⅡ34(26.8)10(17.2)44sum533487理论数:TRC=nR×nC/nR为行;nR为行合计C为列;nC为列合计第三十一页,共五十八页,2022年,8月28日卡方检验的基本思想反映了实际频数和理论频数吻合的程度。如果检验假设成立,则实际频数与理论频数之差一般不会很大,出现大的卡方值的概率是很小的=(R-1)(C-1)服从自由度为的2分布,在H0成立前提下,出现2≧2,

的情形是一个小概率事件,(P<),拒绝H0,反之,2<2,,则不拒绝H0第三十二页,共五十八页,2022年,8月28日1.基本公式法(1)建立假设(2)计算理论数(TRC)T1.1=26.2,T1.2=43-26.2=16.8T2.1=53-26.2=26.8,T2.2=44-26.8=17.22检验的步骤第三十三页,共五十八页,2022年,8月28日

(3)计算X2

值(4)根据P值,下结论

=(R-1)(C-1)第三十四页,共五十八页,2022年,8月28日拒绝H0

,接受H1,差别有高度统计学意义,可以认为化疗联合放疗疗效优于单独化疗。第三十五页,共五十八页,2022年,8月28日2.

2检验的专用公式法

01characteristic0aba+bⅡ1cdc+da+cb+dn第三十六页,共五十八页,2022年,8月28日3.Correctionfor2valueof(2*2table)

连续性较正公式校正条件当四格表中有任一格子理论数1≦T<5,同时总例数n≧40,

第三十七页,共五十八页,2022年,8月28日

eg:ComparetheeffectoftwotreatmentforindigestionofchildrentreatmentcuredfailuresumA26(28.82)7(4.18)33B36(33.18)2(4.82)38sum62971第三十八页,共五十八页,2022年,8月28日第三十九页,共五十八页,2022年,8月28日二、配对四格表资料检验2-test

ofpairedcomparisonofenumerationdata(1)两种检测结果比率比较(观察结果有无差异比较)comparisonoftwomediumbacteriumdiphtheriaeBmediumAmedium†—total

†11(a)9(b)20

—1(c)7(d)8total1216282第四十页,共五十八页,2022年,8月28日第四十一页,共五十八页,2022年,8月28日拒绝H0,接受H1,差别有统计学意义,可以认为化两种方法的检测结果有差别。第四十二页,共五十八页,2022年,8月28日(2)配对四格表资料的关联性分析comparisonoftworesultsofdeterminationHbsAg-HBc†—total

†102(a)49(b)151

—727(c)1184(d)1911total82912332062第四十三页,共五十八页,2022年,8月28日Pearson列联系数第四十四页,共五十八页,2022年,8月28日拒绝H0,接受H1,差别有高度统计学意义,可以认为化两种检测结果有关联。第四十五页,共五十八页,2022年,8月28日4.行乘列表资料的2检验当R>2orC>2两个以上的率的比较两个或多个构成比的比较按两种属性分类的频数表资料的关联性分析第四十六页,共五十八页,2022年,8月28日Eg:比较卧室朝向对婴儿佝偻病发病的影响resultsdirectionsum

southwest,east,north,eastnorth,southwestsoutheastwestnorthwith1801412065379without200168433333sum3803020498712prevalencerate(%)47.446.758.866.353.2第四十七页,共五十八页,2022年,8月28日

H0:卧室朝向对婴儿佝偻病发病无影响

H1:卧室朝向对婴儿佝偻病发病有影响

=0.05第四十八页,共五十八页,2022年,8月28日多个样本率间的多重比较Bonferroni法第四十九页,共五十八页,2022年,8月28日多个实验组间的两两比较人中穴组腰痛穴组卡方分割表组别治愈数未愈数合计人中穴202040腰痛穴243862合计4458102第五十页,共五十八页,2022年,8月28日(1)H0:任意两个对比组的总体治愈率相等

H1:任意两个对比组的总体治愈率不相等

=0.05(2)四格表资料卡方检验求出2值,2=1.26(3)按0.0167的水准,不拒绝H0,尚不能认为两组总体治愈率有差别。第五十一页,共五十八页,2022年,8月28日Attentionof

2-testforR*Ctable

(1)R*C表中4/5以上格子的理论数应该>5;

假设1/5以上格子理论数小于5,a.增加实验样本含量b.相邻行或列数字合并;C.删除所在行或列的数据D.直接计算概率第五十二页,共五十八页,2022年,8月28日

(2)2

检验的结果接受H1时仅提示所比较的各组总体来说有差别,但不能表示其间任一两者间有差别,也不表示差别的强度.(3)对于顺序变量,用秩和检验更合适.第五十三页,共五十八页,2022年,8月28日三、确切概率法(Fisherprobabilitiesin22table)条件:四格表资料中若n<40,或有任一格子理论数T<1。基本思想是在周边合计数不变的条件下,表格中实际频数各种组合的概率。P值=所有小于等于样本点的各种组合的概

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论