计数资料的统计分析_第1页
计数资料的统计分析_第2页
计数资料的统计分析_第3页
计数资料的统计分析_第4页
计数资料的统计分析_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计数资料的统计分析计数资料的统计分析计数资料的统计分析计数资料的统计分析 相对数及其应用相对数及其应用 率的标准化率的标准化 二项分布二项分布 2检验检验一、一、常用的相对数常用的相对数什么是计数资料?什么是计数资料?计数资料有何指标来描述?计数资料有何指标来描述?例:例:甲、乙两地发生麻疹流行,甲地患儿甲、乙两地发生麻疹流行,甲地患儿100100人,乙地人,乙地患儿患儿150150人,何地发病较为严重?人,何地发病较为严重? 若甲地易感儿童若甲地易感儿童500500人,而乙地易感儿童人,而乙地易感儿童10001000人。人。 甲地麻疹发病率为甲地麻疹发病率为 100/500100/50010

2、0%=20%100%=20%乙地麻疹发病率为乙地麻疹发病率为 150/1000150/1000100%=15%100%=15%相对数是两个有关联的数值或指标之比,通常用于描相对数是两个有关联的数值或指标之比,通常用于描述分类资料的特征。述分类资料的特征。(一)率(一)率( (rate) )k k为比例基数,其确定原则为:为比例基数,其确定原则为: (1 1)习惯用法;)习惯用法; (2 2)保留)保留1 12 2位整数。位整数。ka aa比例基数比例基数可能发生该现象的总数可能发生该现象的总数某现象实际发生数某现象实际发生数率率(二)构成比(二)构成比( (proportion)%100aa

3、%100cb观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比构成比的特点构成比的特点: :1.1.各部分的构成比相加必等于各部分的构成比相加必等于100%100%,故又称百分比。,故又称百分比。2.2.各构成部分之间相互影响各构成部分之间相互影响, ,呈此消彼长的关系呈此消彼长的关系. .(三)相对比(三)相对比(ratio)对比指标:对比指标:两个同类事物某种指标(绝对数,率或两个同类事物某种指标(绝对数,率或其它指标)的比。如男女性比。其它指标)的比。如男女性比。关系指标:关系指标:两个有关的、但非同类事物的数量之比。两个有关的、但非同类事物的数量之比。如医护人员与病床数之比

4、。如医护人员与病床数之比。指标指标指标指标相对比相对比ba (注意:(注意:a、b互不包含)互不包含)例例(1 1)分母不宜过小)分母不宜过小(2 2)正确区分构成比和率()正确区分构成比和率(避免以比代率避免以比代率)(3 3)注意平均率(合并率)的计算)注意平均率(合并率)的计算 321321nnnxxxpc(4 4)样本率或样本构成比的比较需假设检验样本率或样本构成比的比较需假设检验(5)若两个合计率比较,其内部构成不同,)若两个合计率比较,其内部构成不同,并能影响其结果,需进行率的标准化。并能影响其结果,需进行率的标准化。甲甲乙乙两两县县各各年年龄龄组组人人口口数数及及食食管管癌癌死死

5、亡亡率率(1/10 万万)甲甲县县乙乙县县年年龄龄人人口口数数人人口口构构成成食食管管癌癌死死亡亡数数食食管管癌癌死死亡亡率率人人口口数数人人口口构构成成食食管管癌癌死死亡亡数数食食管管癌癌死死亡亡率率0-17568970.65200017258190.65800030-2449420.0909124.92892980.1103258.640-2516780.09349136.22504800.095512549.950-2069470.0768307148.31912040.0729344179.960-1438930.0534460319.71143550.0436371324.470-9

6、02700.0335292323.5516700.0197170329.0合合计计26946271.0000116243.1226228261.0000103539.461、大范围内的人口资料大范围内的人口资料2、两组年龄段人口合并两组年龄段人口合并3、以其中一组为标准组,对另一组作标准化以其中一组为标准组,对另一组作标准化选择标准组的方法:选择标准组的方法:iiiiipcpnpnp或(1 1)直接法:)直接法:已知各年龄组的实际率,用标准人口数或标已知各年龄组的实际率,用标准人口数或标准人口构成对率进行标准化。准人口构成对率进行标准化。 ni 为第为第i 组标准人口数组标准人口数pi 为第为

7、第i 组的实际率组的实际率ci 为第为第i 组标准人口构成组标准人口构成 直接法计算食管癌标准死亡率直接法计算食管癌标准死亡率(1/10 万)万)甲甲县县乙乙县县年龄年龄(岁)(岁)标准人口数标准人口数ni原死亡率原死亡率 pi预期死亡数预期死亡数 nipi原死亡率原死亡率 pi预期死亡数预期死亡数 nipi0-3860241000030-5536814.9278.64840-56671736.220549.928350-482455148.3715179.986860-344998319.71103324.4111970-207377323.5671329.0683合计合计601546943

8、.12272139.463000(2)间接法:)间接法: 已知死亡总数及年龄别人口数,但不知各年龄已知死亡总数及年龄别人口数,但不知各年龄组的实际死亡率组的实际死亡率 p: 标准组死亡率;标准组死亡率;r:被标化组实际死亡数;:被标化组实际死亡数; nipi:被标化组预期死亡数;被标化组预期死亡数;smr:标准化死亡比:标准化死亡比若若smr1或或1,表示被标化人群的死亡率高于或低于标准组,表示被标化人群的死亡率高于或低于标准组 (1)标准化率不能反映实际水平,仅用)标准化率不能反映实际水平,仅用于比较;于比较;(2)有明显交叉资料,则不能用标准化)有明显交叉资料,则不能用标准化率比较;率比较

9、;(3)若总率为样本率,仍需假设检验。)若总率为样本率,仍需假设检验。抽抽样样研研究究得得下下表表资资料料,试试分分析析比比较较两两种种方方法法治治疗疗乳乳腺腺癌癌后后的的5 5年年生生存存率率。 两两种种方方法法治治疗疗乳乳腺腺癌癌后后的的5 5年年生生存存率率(% %) 甲甲 乙乙 淋淋巴巴转转移移 病病例例数数 生生存存数数 生生存存率率(% %) 病病例例数数 生生存存数数 生生存存率率(% %) 无无 4 45 5 3 35 5 7 77 7. .7 77 7 3 30 00 0 2 21 10 0 7 70 0. .0 00 0 有有 7 71 10 0 4 45 50 0 6 6

10、3 3. .3 38 8 7 70 0 3 35 5 5 50 0. .0 00 0 合合 计计 7 75 55 5 4 48 85 5 6 64 4. .2 24 4 3 37 70 0 2 24 45 5 6 66 6. .2 22 2 二、二、二项分布二项分布1. 概念:概念: 为率的抽样分布,各种情况的概率等于二项式展开各项。为率的抽样分布,各种情况的概率等于二项式展开各项。 例:设小白鼠接受某种毒物一定剂量时,其死亡率为例:设小白鼠接受某种毒物一定剂量时,其死亡率为 80%。若。若随机用甲、乙、丙三只小白鼠做试验,问出现各种死亡情况的概率?随机用甲、乙、丙三只小白鼠做试验,问出现各种

11、死亡情况的概率?小鼠存亡的组合方式小鼠存亡的组合方式排列方式排列方式死亡数死亡数(x) 生存数生存数(n-x)甲甲 乙乙 丙丙每种组合的概率每种组合的概率 0 3 生生 生生 生生 0.2 0.2 0.2 0.008 1 2 死死 生生 生生 0.8 0.2 0.2 生生 死死 生生 0.2 0.8 0.2 生生 生生 死死 0.2 0.2 0.8 0.0962 1 死死 死死 生生 0.8 0.8 0.2 死死 生生 死死 0.8 0.2 0.8 生生 死死 死死 0.2 0.8 0.8 0.384 3 0 死死 死死 死死 0.8 0.8 0.8 0.512p 1.000(0.8 +0.2

12、)3= (0.8)3 + 3(0.8)2 (0.2) + 3(0.8)(0.2)2 + (0.2)3 三死三死 二死一生二死一生 一死二生一死二生 三生三生2. 概率的计算:概率的计算:(1)恰有)恰有x例阳性的概率:例阳性的概率: nxnnxnnnnnn 11111222211(2)至少有)至少有k例阳性的概率:例阳性的概率:(3)至多有)至多有k例阳性的概率:例阳性的概率:3. 二项分布的图形二项分布的图形 (1 1)离散型)离散型(2 2)当)当 =1-=1- =0.5=0.5时,两边对称时,两边对称(3 3)当)当n n增大,二项分布逐渐逼近正态分布增大,二项分布逐渐逼近正态分布n 和

13、和n(1- ) 5 5,并且,并且 和(和(1-1- )均不接近于)均不接近于0 0时,可时,可近似看作正态分布。近似看作正态分布。 未知时,未知时,np和和n(1-p) 5,并且,并且p和和(1-p)均不接近)均不接近于于0时,可近似看作正态分布。时,可近似看作正态分布。4、率的抽样误差与标准误、率的抽样误差与标准误 np 1当当未知时,常以样本率未知时,常以样本率p来估计来估计nppsp)1( 例例为了解某地人群结核菌素试验阳性率情况,某医疗机构在该地人群中随机检测了1773人,结核菌素试验阳性有682人,阳性率为38.47%,试计算其标准误。 %16. 10116. 017733847.

14、 03847. 0 ps(1)总体率可信区间估计)总体率可信区间估计 现现 n=41,x=19,p=46.34%。查附表。查附表6 ,p713得:得:31% 63%若若x n/2 则按则按n-x 查表得?,然后查表得?,然后100-?例:上题若例:上题若 x=29,则,则 n-x=41-29=12查表得:查表得:16% 46%然后然后100-?得:?得:54% 84% 若若n 50 或或 n p和和n( 1-p) 5时时 例例 3.2 某某医医院院对对手手术术证证实实的的 41 例例肝肝外外胆胆管管结结石石病病人人的的术术前前 b超超诊诊断断质质量量进进行行分分析析,发发现现 b 超超诊诊断断

15、符符合合者者 19 例例,诊诊断断符符合合率率为为 46.34%。试试求求该该医医院院 b 超超诊诊断断肝肝外外胆胆管管结结石石符符合合率率的的95%可可信信区区间间。psup2/ (2)样本率与总体率比较)样本率与总体率比较例:据以往经验,新生儿染色体异常率一般为例:据以往经验,新生儿染色体异常率一般为 1%,某医院观,某医院观察了当地察了当地 400 名新生儿,只有名新生儿,只有 1 例染色体异常,问该地新生例染色体异常,问该地新生儿染色体异常率是否低于一般。儿染色体异常率是否低于一般。h0: 1 = 0 =0.01h1: 1 0 =0.2 单侧单侧 = 0.05(3)两样本率比较(近似正

16、态法)两样本率比较(近似正态法) 例:设小白鼠接受某种毒物一定剂量时,其死亡率为例:设小白鼠接受某种毒物一定剂量时,其死亡率为 80%。若。若随机用甲、乙、丙三只小白鼠做试验,问出现各种死亡情况的概率?随机用甲、乙、丙三只小白鼠做试验,问出现各种死亡情况的概率?小鼠存亡的组合方式小鼠存亡的组合方式排列方式排列方式死亡数死亡数(x) 生存数生存数(n-x)甲甲 乙乙 丙丙每种组合的概率每种组合的概率 0 3 生生 生生 生生 0.2 0.2 0.2 0.008 1 2 死死 生生 生生 0.8 0.2 0.2 生生 死死 生生 0.2 0.8 0.2 生生 生生 死死 0.2 0.2 0.8 0

17、.0962 1 死死 死死 生生 0.8 0.8 0.2 死死 生生 死死 0.8 0.2 0.8 生生 死死 死死 0.2 0.8 0.8 0.384 3 0 死死 死死 死死 0.8 0.8 0.8 0.512p 1.000二项分布概率计算二项分布概率计算spssspss演示演示h0: = 0 =0.01h1: 0.05若未校正,若未校正,x2=4.47,p 0.05应用条件应用条件(1)t 5,而且,而且n 40 直接用直接用 2检验。检验。(2)1 t 5,而且,而且n 40 校正校正 2检验。检验。(3)t 1 或或n 40, 不能用不能用 2检验。检验。注意:上述条件是以理论数为依

18、据,而非实际数。注意:上述条件是以理论数为依据,而非实际数。 0 20 20 20 30 50 20 50 70表 3.5 两种药物治疗十二指肠球部溃疡效果 处理 愈合 未愈合 合计 愈合率(%)54(48.22) 8(13.78) 62 87.1044(49.78) 20(14.22) 64 68.75呋喃硝胺组甲氰咪胍组合计 98 28 126 77.78chi-square tests6.133b1.0135.1181.0246.3041.012.018.0116.0841.014126pearson chi-squarecontinuity correctionalikelihood

19、ratiofishers exact testlinear-by-linear associationn of valid casesvaluedfasymp. sig.(2-sided)exact sig.(2-sided)exact sig.(1-sided)computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. the minimum expected count is 13.78.b. h0: b ch1: b c = 0.05(二)(二)配对四格表资料的配对四格表资料的 2检验检验(

20、mcnemar法)法)例7-3 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别?应用条件:应用条件: 当当 b+c 40当当 b+c 40注意:该法一般用于样本含量不太大的资料。注意:该法一般用于样本含量不太大的资料。 为什么?为什么?025. 0 79. 5212)1212(2 p查表查表 现:现:b+c=14配对卡方配对卡方对频数进行加权对频数进行加权chi-square tests.013a58mcnemar testn of valid casesvaluedfasymp. sig.(2-sided)

21、exact sig.(2-sided)binomial distribution used.a. (三)四格表资料的(三)四格表资料的fisher确切概率法确切概率法当当t 1 或或n 40时时 例:在某牧区观察慢性布氏病患者植物血凝素例:在某牧区观察慢性布氏病患者植物血凝素(pha)皮肤试验反应,资料如下表,问活动型与稳)皮肤试验反应,资料如下表,问活动型与稳定型布氏病患者定型布氏病患者pha皮试反应阳性率有无差别?皮试反应阳性率有无差别?两两行行慢慢性性布布氏氏病病的的 pha 皮皮试试反反应应病病人人分分型型阳阳性性数数阴阴性性数数合合计计阳阳性性率率(%)活活动动型型1(2.4)14(

22、12.6)156.67稳稳定定型型3(1.6)7(8.4)1030.00合合计计4212516.00h0: 1 = 2 h1: 1 2 = 0.05列出周边合计不变的四格表组合。列出周边合计不变的四格表组合。 (“周边合计中最小数周边合计中最小数+1”个)个)两两行行慢慢性性布布氏氏病病的的 pha 皮皮试试反反应应病病人人分分型型阳阳性性数数阴阴性性数数合合计计阳阳性性率率(%)活活动动型型1(2.4)14(12.6)156.67稳稳定定型型3(1.6)7(8.4)1030.00合合计计4212516.00 选取选取|p1 p2|值大于等于原始表格值大于等于原始表格| p1 p2 |值的组值

23、的组合,并计算其概率。合,并计算其概率。p1 p2 -0.4 -0.23 -0.07 0.1 0.27p=0.0166+0.1423+0.1079=0.2688p1 p2 -0.4 -0.23 -0.07 0.1 0.271423.0!25!7 ! 3 !14! 1!21! 4 !10!15)2(p问题:如何进行单侧检验?问题:如何进行单侧检验? 若上例问稳定型患者若上例问稳定型患者pha皮试反应阳性率是否高于活动型皮试反应阳性率是否高于活动型布氏病患者?布氏病患者?两两行行慢慢性性布布氏氏病病的的 pha 皮皮试试反反应应病病人人分分型型阳阳性性数数阴阴性性数数合合计计阳阳性性率率(%)活活

24、动动型型1(2.4)14(12.6)156.67稳稳定定型型3(1.6)7(8.4)1030.00合合计计4212516.00 h1: 1 2选取选取p1-p2 -0.23 的的组合。组合。即即: p=p(1)+p(2)=0.1589p1 p2 -0.4 -0.23 -0.07 0.1 0.27(四)行(四)行列表资料的列表资料的 2检验检验 是多个样本率或构成比的比较是多个样本率或构成比的比较表表 3.8 三三种种药药物物治治疗疗高高血血压压的的疗疗效效处处理理有有效效无无效效合合计计有有效效率率%复复方方哌哌唑唑嗪嗪35 5 4087.50复复方方降降压压片片2010 3066.67安安慰

25、慰剂剂 725 3221.88合合计计624010260.78专用公式:专用公式:h0:三种处理方法的有效率相等三种处理方法的有效率相等h1:三种处理方法的有效率不等或不全相等三种处理方法的有效率不等或不全相等 = 0.05 = (3 1)(2 1)=2,查表得:查表得:p 0.005spss演示演示表表 3.9 正正常常妇妇女女和和血血栓栓形形成成者者的的血血型型分分布布分分 组组a 型型b 型型ab 型型o 型型合合计计血血栓栓形形成成组组32810959正正常常妇妇女女组组51191270152合合计计83272279211注意事项:注意事项:1、 1/5格子以上格子以上1 t 5或任一

26、格或任一格t 1 处理:处理:1)增大样本含量)增大样本含量 2)合理的合并或删除)合理的合并或删除 3)rc表的表的fisher确切概率法确切概率法某厂职工冠心病与眼底动脉硬化检查结果某厂职工冠心病与眼底动脉硬化检查结果冠心病诊断结果冠心病诊断结果a 硬化硬化正常正常可疑可疑冠心病冠心病合计合计 034011 6357 i 7313 6(4.9) 92ii1002019139合计合计51344315882)合并理论数较小的行列后,用合并理论数较小的行列后,用x2检验检验3)直接用行列表直接用行列表fisher确切概率法(统计软件)确切概率法(统计软件)2、等级资料一般不宜用等级资料一般不宜用

27、 2检验检验针针刺刺不不同同穴穴位位的的镇镇痛痛效效果果镇镇痛痛效效果果合合谷谷足足三三里里3853442912282416问题:若上题用问题:若上题用 2检验,其结果说明什么?检验,其结果说明什么? 调整检验水准调整检验水准 (2 k组资料)组资料) 1)共同对照组)共同对照组表表 3.11 5 种种药药物物治治疗疗精精神神抑抑郁郁症症的的效效果果效效果果安安慰慰剂剂药药物物 1药药物物 2药药物物 3药药物物 4药药物物 5合合计计有有效效 81221151419 89无无效效2218 9151611 91合合计计303030303030180 )( 12 k3、 多个样本率两两比较多个样

28、本率两两比较表表 3.11 5 种种药药物物治治疗疗精精神神抑抑郁郁症症的的效效果果效效果果安安慰慰剂剂药药物物 1药药物物 2药药物物 3药药物物 4药药物物 5合合计计有有效效 81221151419 89无无效效2218 9151611 91合合计计303030303030180药物药物1与安慰剂比较:与安慰剂比较:按按 = 0.005的水准,尚不能拒绝的水准,尚不能拒绝h0005016205012.)(.)( k2)两两比较)两两比较若上例进行两两比较,则按若上例进行两两比较,则按 =0.003水准来判断水准来判断。152562)1()!2( ! 2!)(003. 011505. 01

29、2 kkkknnk (五)(五)两分类变量资料的关联性检验两分类变量资料的关联性检验1、双向无序分类资料的关联性检验、双向无序分类资料的关联性检验pearson列联系数列联系数22xnxc 例 7-8 测得某地 5801 人的 abo 血型和 mn 血型结果如表7-10,问两种血型系统之间是否有关联? 表 7-10 测得某地 5801 人的血型结果 mn 血型 abo 血型 m n mn 合计 o 431 490 902 1823 a 388 410 800 1598 b 495 587 950 2032 ab 137 179 32 348 合计 1451 1666 2684 5801 pea

30、rson列联系数介于列联系数介于 01之间,愈接近之间,愈接近 0,关系愈弱,愈接近关系愈弱,愈接近1,则关系愈密切。,则关系愈密切。例 7-8 测得某地 5801 人的 abo 血型和 mn 血型结果如表7-10,问两种血型系统之间是否有关联? 表 7-10 测得某地 5801 人的血型结果 mn 血型 abo 血型 m n mn 合计 o 431 490 902 1823 a 388 410 800 1598 b 495 587 950 2032 ab 137 179 32 348 合计 1451 1666 2684 5801 h0:两种血型无关联两种血型无关联(构成比无差别构成比无差别)

31、h1:两种血型有关联两种血型有关联(构成比有差别构成比有差别) = 0.05本例:本例:x2=213.16, v=6, p0.0051883062135801621322. xnxcpa:实际观察一致率;:实际观察一致率;pe:期望一致率,即偶然机会造成的一致率。:期望一致率,即偶然机会造成的一致率。 kappa值波动于值波动于 0 1 之间。之间。k=1,说明两次结果完全,说明两次结果完全一致;若一致;若 k = 0,则完全由于机遇造成。,则完全由于机遇造成。一般情况,一般情况,k 0.75,一致性程度较好,一致性程度较好,k 0.4, 则较差。则较差。2 2、双向有序同属性两分类变量的判断

32、一致性检验、双向有序同属性两分类变量的判断一致性检验表表 11.16 200 例棉屑沉着病可疑患者的诊断结果例棉屑沉着病可疑患者的诊断结果第二人检查第二人检查第一人检查第一人检查正常正常i 型型ii 型型合计合计正常正常785083i 型型6561375ii 型型0103242合计合计847145200则:则:kappa = (0.83 - 0.355)/(1 - 0.355)= 0.736注意:样本资料计算出的注意:样本资料计算出的kappa值需要假设检验。值需要假设检验。355. 0200/ )452004271200758420083(pe 上表中红色数字为上表中红色数字为200例患者中两次检查结果一致的患者例患者中两次检查结果一致的患者数,总计数,总计 166 例,一致率例,一致率 pa = 166/200 = 0.83 若两次检查结果一致的患者数是随机的,则:若两次检查结果一致的患者数是随机的,则:不不同同期期次次矽矽肺肺患患者者肺肺门门密密度度级级别别分分布布肺肺门门密密度度级级别别矽矽肺肺期期次次+合合计计4318814245196721696175578合合计计50301141492用等级相关分析用等级相关分析3、双向有序属性不同的两分类变量相关分析双向有序

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论