计数资料的统计分析_第1页
计数资料的统计分析_第2页
计数资料的统计分析_第3页
计数资料的统计分析_第4页
计数资料的统计分析_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计数资料的计数资料的统计推断统计推断靳利梅靳利梅内容内容: :计数资料的统计推断计数资料的统计推断四格表数据的卡方检验四格表数据的卡方检验1 RC无序列联表卡方检验无序列联表卡方检验2 Fishers 精确检验精确检验3卡方检验卡方检验 2检验是常用于检验是常用于计数资料计数资料的假设检验,又的假设检验,又称为称为卡方检验卡方检验。该方法主要用于两个或者。该方法主要用于两个或者多个样本率或者构成比的比较。多个样本率或者构成比的比较。 内容内容1.1 一般四格表卡方检验一般四格表卡方检验卡方检验的零假设,假定比较样本来自卡方检验的零假设,假定比较样本来自总体率总体率()相等的总体,即相等的总体,

2、即H0:1=2.卡方卡方检验的统计量也称为检验的统计量也称为Pearsons卡方检验卡方检验1.1 一般四格表卡方检验一般四格表卡方检验四格表资料四格表资料T为理论频数:行合计为理论频数:行合计列合计除以列合计除以N应用条件应用条件理论频数理论频数(T)均应大于均应大于5或或1 T5的格子数的格子数不宜不宜大于总格子数的大于总格子数的1/5(20%)1.1 一般四格表卡方检验一般四格表卡方检验例题例题1.1 有有195例肾炎患者,分别采用中例肾炎患者,分别采用中药和西药的方法治疗,疗效见表药和西药的方法治疗,疗效见表5.1.问两问两组的疗效有无差异?组的疗效有无差异?表表1.1 两种药物的疗效

3、对比结果两种药物的疗效对比结果1.1 一般四格表卡方检验一般四格表卡方检验检验步骤检验步骤H0:1=2(两药物总体治愈率相等)(两药物总体治愈率相等)H1:12(两药物总体治愈率不相等)(两药物总体治愈率不相等)=0.051.1 一般四格表卡方检验一般四格表卡方检验检验步骤检验步骤1.1 一般四格表卡方检验一般四格表卡方检验检验步骤检验步骤(1) 频数加权频数加权1.1 一般四格表卡方检验一般四格表卡方检验检验步骤检验步骤(2) Crosstabs(交叉表)过程对话框操作提示(交叉表)过程对话框操作提示1.1 一般四格表卡方检验一般四格表卡方检验(3) 定义定义Crosstabs过程对话框过程

4、对话框检验步骤检验步骤1.1 一般四格表卡方检验一般四格表卡方检验检验步骤检验步骤1.1 一般四格表卡方检验一般四格表卡方检验检验步骤检验步骤1.1 一般四格表卡方检验一般四格表卡方检验检验步骤检验步骤由由b可知,本例不需要校正,可知,本例不需要校正,Pearson 2=6.273,P=0.012,在,在0.05的检验水准下,的检验水准下,拒绝拒绝H0,说明西药中药的治愈率差异有统计,说明西药中药的治愈率差异有统计学意义,可认为中药的治愈率比西药高。学意义,可认为中药的治愈率比西药高。内容内容1.2 连续校正卡方检验连续校正卡方检验当样本含量较大,且有当样本含量较大,且有20%格子的理论格子的

5、理论频数小于频数小于5时,则需要采用连续性校正卡时,则需要采用连续性校正卡方检验方检验四格表数据的样本含量较大(四格表数据的样本含量较大(n40)一个一个格子的理论频数格子的理论频数1T 51.2 连续校正卡方检验连续校正卡方检验例例1.2 冠心病复发与体育锻炼的关系研究冠心病复发与体育锻炼的关系研究,结果见表,结果见表5.2.为冠心病复发与体育锻炼为冠心病复发与体育锻炼有关系吗?关联强度是多大?有关系吗?关联强度是多大? 表表1.2 体育锻炼与冠心病复发关系的研究体育锻炼与冠心病复发关系的研究1.2 连续校正卡方检验连续校正卡方检验检验步骤检验步骤H0:1=2(参加体育锻炼与不参加体育(参加

6、体育锻炼与不参加体育锻炼者的冠心病复发率一致)锻炼者的冠心病复发率一致)H1:12(参加体育锻炼与不参加体育(参加体育锻炼与不参加体育锻炼者的冠心病复发率不一致)锻炼者的冠心病复发率不一致)=0.051.2 连续校正卡方检验连续校正卡方检验检验步骤检验步骤1.2 连续校正卡方检验连续校正卡方检验检验步骤检验步骤1.2 连续校正卡方检验连续校正卡方检验1.2 连续校正卡方检验连续校正卡方检验n=114, 最小理论频数最小理论频数=4.39 5,因此选用,因此选用校正的卡方检验结果,即卡方校正的卡方检验结果,即卡方=4.317,P=0.038,按,按0.05的检验水准拒绝的检验水准拒绝H0,认为,

7、认为两组复发率差异有统计学意义两组复发率差异有统计学意义1.2 连续校正卡方检验连续校正卡方检验即冠心病初发后进行体育锻炼的人复发冠心即冠心病初发后进行体育锻炼的人复发冠心病的危险是不锻炼的病的危险是不锻炼的0.169倍。倍。内容内容应用条件应用条件理论频数理论频数(T)均应大于均应大于5,或或1 T5的格子数的格子数不宜不宜大于总格子数的大于总格子数的1/5(20%)2.1 多个样本率的卡方检验多个样本率的卡方检验 例例2.1 随机抽取某市三个地区,调查随机抽取某市三个地区,调查60岁以上岁以上老年人高血压患病情况,结果见表老年人高血压患病情况,结果见表2.1.问三个问三个区的老年人高血压患

8、病率有无差别?区的老年人高血压患病率有无差别?表表2.1 某市三个区某市三个区60岁以上老年人高血压患病情况岁以上老年人高血压患病情况2.1 多个样本率的卡方检验多个样本率的卡方检验 检验步骤检验步骤H0:1=2=3(三个地区高血压患病率相同)(三个地区高血压患病率相同)H1:三个地区高血压患病率不相同或不全相同三个地区高血压患病率不相同或不全相同=0.052.1 多个样本率的卡方检验多个样本率的卡方检验 检验步骤检验步骤2.1 多个样本率的卡方检验多个样本率的卡方检验 检验步骤检验步骤操作方式与上述相同操作方式与上述相同(1)加权频数加权频数(2)交叉表交叉表2.1 多个样本率的卡方检验多个

9、样本率的卡方检验 检验步骤检验步骤2.1 多个样本率的卡方检验多个样本率的卡方检验 三个地区三个地区60岁以上老年人高血压患病率分别岁以上老年人高血压患病率分别为为25.2%,23.3%,21.2%,Pearson卡方卡方=6.293,P=0.043,按,按0.05的检验水准拒绝的检验水准拒绝H0,认为三个地区的认为三个地区的60岁以上老年人高血压患病岁以上老年人高血压患病率间的差异有统计学意义。率间的差异有统计学意义。2.2 多个样本构成的卡方检验多个样本构成的卡方检验 例例2.2 2002年某市某区妇幼保健院对该区年某市某区妇幼保健院对该区幼儿园幼儿园46岁儿童视力进行筛查,结果见岁儿童视

10、力进行筛查,结果见表表2.2。问不同年龄的儿童视力健康状况构。问不同年龄的儿童视力健康状况构成比是否有差异?成比是否有差异?2.2 多个样本构成的卡方检验多个样本构成的卡方检验 例例2.2 46岁儿童视力筛查情况岁儿童视力筛查情况2.2 多个样本构成的卡方检验多个样本构成的卡方检验 据题意,本题需分析两组的构成比例之间有无差异据题意,本题需分析两组的构成比例之间有无差异H0:三组的总体构成相同三组的总体构成相同H1:三组的总体构成不同或不全相同三组的总体构成不同或不全相同=0.052.2 多个样本构成的卡方检验多个样本构成的卡方检验 检验步骤检验步骤2.2 多个样本构成的卡方检验多个样本构成的

11、卡方检验 检验步骤检验步骤操作方式与上述相同操作方式与上述相同(1)加权频数加权频数(2)交叉表交叉表检验步骤检验步骤2.2 多个样本构成的卡方检验多个样本构成的卡方检验 检验步骤检验步骤2.2 多个样本构成的卡方检验多个样本构成的卡方检验 2.2 多个样本构成的卡方检验多个样本构成的卡方检验 Pearson卡方值为卡方值为51.790,P=0.000,按,按0.05的的水准拒绝水准拒绝H0,认为不同年龄的儿童视力健康,认为不同年龄的儿童视力健康状况构成比差异有统计学意义。状况构成比差异有统计学意义。注意事项注意事项(1) 2检验一般要求检验一般要求不宜不宜有有20%以上的格子的理以上的格子的

12、理论频数论频数(T) 5,或有一个格子的,或有一个格子的T 1. 增加样本含量增加样本含量 删除删除T太小的行或者列太小的行或者列 将将T太小的行或列与相邻合并太小的行或列与相邻合并(性质相同或者相近性质相同或者相近)注意事项注意事项(2) 多个样本率或构成的多个样本率或构成的 2检验,结论拒绝检验,结论拒绝H0,只能认为总体上有差异,并不能认为各个样本只能认为总体上有差异,并不能认为各个样本率之间有差异。想具体知道哪两个之间有差异率之间有差异。想具体知道哪两个之间有差异,需要进行行,需要进行行列表的卡方分割。列表的卡方分割。 内容内容应用条件应用条件在四格表在四格表 2检验中检验中 一个格子

13、理论频数一个格子理论频数T 1 或或 n 403.1四格表的精确概率法四格表的精确概率法 比较两种药物的驱虫疗效,对比较两种药物的驱虫疗效,对18名患名患者进行治疗,结果见下表。问两种驱虫药的者进行治疗,结果见下表。问两种驱虫药的疗效有无差异疗效有无差异?表表3.1 两种药物的驱虫疗效对比两种药物的驱虫疗效对比3.1四格表的精确概率法四格表的精确概率法 据题意,本题据题意,本题n40,故需用,故需用Fisher精确概率法精确概率法H0:1=2H1:12=0.053.1四格表的精确概率法四格表的精确概率法 检验步骤检验步骤3.1四格表的精确概率法四格表的精确概率法 检验步骤检验步骤操作方式与上述

14、相同操作方式与上述相同(1)加权频数加权频数(2)交叉表交叉表3.1四格表的精确概率法四格表的精确概率法 检验步骤检验步骤操作方式与上述相同操作方式与上述相同(1)加权频数加权频数(2)交叉表交叉表3.1四格表的精确概率法四格表的精确概率法 检验步骤检验步骤操作方式与上述相同操作方式与上述相同(1)加权频数加权频数(2)交叉表交叉表检验步骤检验步骤3.1四格表的精确概率法四格表的精确概率法 检验步骤检验步骤由于由于n 40,且且50%的格子的的格子的T 5,所以采用,所以采用四格表精确概率法计算,得出四格表精确概率法计算,得出P=0.050,按照按照=0.05的水平拒绝的水平拒绝H0,认为甲药

15、、乙,认为甲药、乙药的疗效差异有统计学意义。药的疗效差异有统计学意义。3.1四格表的精确概率法四格表的精确概率法 应用条件应用条件 有格子理论频数有格子理论频数(T) 小于小于1,或或1 T5的格子数的格子数大于大于总格子数的总格子数的1/5(20%)3.2 RC列联表的精确概率法列联表的精确概率法 肝动脉介入治疗加肝动脉介入治疗加(减减)全身化疗治疗转全身化疗治疗转移性肝癌的临床观察结果如下表。试比较两移性肝癌的临床观察结果如下表。试比较两种治疗方法的疗效是否有统计学意义?种治疗方法的疗效是否有统计学意义?表表3.2 不同方法治疗转移性肝比较不同方法治疗转移性肝比较3.2 RC列联表的精确概

16、率法列联表的精确概率法 H0:两种疗法治疗转移性肝癌疗效相同两种疗法治疗转移性肝癌疗效相同H1:两种疗法治疗转移性肝癌疗效不同两种疗法治疗转移性肝癌疗效不同=0.053.2 RC列联表的精确概率法列联表的精确概率法 检验步骤检验步骤3.2 RC列联表的精确概率法列联表的精确概率法 检验步骤检验步骤操作方式与上述相同操作方式与上述相同(1)加权频数加权频数(2)交叉表交叉表检验步骤检验步骤3.2 RC列联表的精确概率法列联表的精确概率法 检验步骤检验步骤P=0.007,可信区间,可信区间0.0040.009,=0.05的的水平拒绝水平拒绝H0,认为静脉化疗与介入加化疗,认为静脉化疗与介入加化疗治疗转移性肝癌疗效有差异。治疗转移性肝癌疗效有差异。3.1四格表的精确概率法四格表的精确概率法 计数资料的假设检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论