分类变量资料的统计推断.ppt_第1页
分类变量资料的统计推断.ppt_第2页
分类变量资料的统计推断.ppt_第3页
分类变量资料的统计推断.ppt_第4页
分类变量资料的统计推断.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,分类变量资料的 统计推断,广州医学院预防医学系,2,一、率的抽样误差和总体率的估计 1. 率的抽样误差与标准误 (sampling error & standard error of rate ) 率的抽样误差:由抽样造成的样本率与总体率的差别,或样本率之间的差别。 率的标准误:表示率的抽样误差大小的统计指标。,( Sp 为p的估计值, p为 的估计值 ),3,正态近似法: 当n足够大,若 n p 5 和n (1-p) 5,则总体率 (1- ) 可信区间为: 总体率95%可信区间为 p 1.96 sp 总体率99%可信区间为 p 2.58 sp,p u sp = p - u sp p + u sp,2. 总体率的区间估计,4,例:,抽样误差:,(A):,(B):,5,总体率95%可信区间为 p 1.96 sp 总体率99%可信区间为 p 2.58 sp,总体感染率95%可信区间:,(A): 6.74% 1.962.66% = 1.53% 11.95%,(B): 4.50% 1.961.97% = 0.64% 8.36%,6,二、率的u检验 1. 样本率与总体率比较 目的:推断样本率所代表的总体率 与某总体率 0 是否相等。,条件:np 5 和 n (1 - p ) 5,公式:,7,例:某地城镇25岁以上居民高血压患病率为 11,随机抽查该地矿区25岁以上居民598 人,确诊高血压者有82人。矿区居民与城镇 居民高血压患病率有何不同?,城镇居民高血压患病率:0 =11= 0.11 矿区居民高血压患病率:p = 82/598 = 0.14 ,分析目的: 推断 与 0 是否不同?,8,假设:H0: = 0= 0.11, H1: 0 0.11, 0.05,= 2.34,0.01 P 0.05,结论:可认为矿区居民高血压患病率高于城镇居民,9,2. 两个样本率比较(完全随机设计) 目的:推断两样本率分别代表的总体率 1与 2是否相等。,| p1 - p2 | u = S p1-p2,(pc为两个样本率的合并率。),条件:两样本率近似正态分布,即 n1p1 、n1(1-p1) 和 n2p2、n2(1-p2)均大于 5。,公式:,10,例:,是否体重指数(BMI)不同糖尿病的患病率不同?,BMI 25 : p = 5.26% BMI 25 : p =10.11% ,分析目的: 推断 与 是否不同,11,假设:H0: = , H1: , = 0.05,| p1 - p2 | u = S p1-p2,= 3.76,P 0.01,结论:BMI 25者糖尿病患病率高于BMI 25者 BMI与糖尿病有关,12,三、 2检验 1. 用途:推断两个或多个总体率(或总体构成 比)之间有无差别,以及配对资料的 比较。,2. 2 检验的基本思想,例:,两种疗法的2年生存率是否不同?,13,假设:两疗法生存率一致为 57/104 54.81 甲疗法的生存人数 T1.1 : 4657/10425.21 乙疗法的生存人数 T2.1 : 5857/10431.79 假设: 两疗法病死率一致为 47/104 45.19 甲疗法的病死人数 T1.2 : 4647/10420.79 乙疗法的病死人数 T2.2 : 5847/10426.21,T 理论值,(nR),(nC),(n),14,A 实际值 T 理论值, = (行-1)(列-1) =(R-1)(C-1),15,3. 2检验的种类 ( 1) 四格表资料的 2检验(完全随机设计) ( 2 test for fourfold table) 目的:用于两个样本率或构成比的比较,推断两个样本所代表的总体率(或总体构成比)是否相等。,专用公式:,( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d),基本公式:,(A - T) 2 2 = T, = 1,16,检验假设:H0:12 , H1:12 ,0.05,(A - T) 2 2 = , T, 2 (2225.21)2 / 25.21 + (35 31.79)2 / 31.79 + (24 20.79)2 / 20.79 + (23 26.21)2 / 26.21 =1.62, = 1, 2 0.05 P ,结论:还不能认为甲、乙疗法的两年生存率有差别,17,(a),(b),(c),(d),(a+b),(c+d),(a+c),(b+d),(n),( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d),P 0.05,结论:还不能认为甲、乙疗法的两年生存率有差别,18,19,四格表 2值的校正 当:1 40 时,需计算校正 2值,( | A - T | - 0.5 ) 2 2 = , T ( | ad - bc | - n/2 ) 2 n 或 2 = (a + b)(c + d)(a + c)(b + d),当:T 1,或 n 40 时,需用确切概率法计算。, = 1,20,例:,试比较不同就餐方式的乙肝病毒感染率是否不同?,21,检验假设:H0:AB , H1:AB ,0.05,( | ad - bc | - n/2 ) 2 n 2 = (a + b)(c + d)(a + c)(b + d),= 0.142,P 0.05,结论:不同就餐方式乙肝病毒感染率无差别,(4.9),( 84.1),(6.1),(104.9),22,(3.84),(11.16),(7.16),(20.84),( | ad - bc | - n/2 ) 2 n 2 = (a + b)(c + d)(a + c)(b + d),= 2.94,0.10 P 0.05,( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d),= 4.33,0.01 P 0.05,(正确),(错误),23,基本公式:,(A - T) 2 2 = , T, = (行-1)(列-1) = (R-1)(C-1),A 2 2 = n ( - 1) nR nC,(2)行 列表资料的 2 检验 ( 2 test for RC table ) 目的:用于多个样本率(或构成比)的比较, 推断样本所代表的几个总体率(或总 体构成比)之间有无差别。,专用公式:,24,例.,假设:H0: 三种药物的有效率相同 H1: 三种药物的有效率不同或不全相同 = 0.05,A 2 2 = n ( - 1) nR nC,2 =(62/4648+422/7648+82/7637 1) 122 = 40.05 ,, =(R-1)(C-1), =(R-1)(C-1)=(3-1) (2-1)= 2,25, 2 = 40.05 , 2 0.005(2) = 10.60,P 0.005,结论:三种药物治疗失眠有效率不同或不全相同,新药组 12.50% 传统药组29.73%,新药组 12.50% 安慰剂组78.38%,传统药组29.73% 安慰剂组78.38%,组间比较:卡方分割,26, 当推断结论为拒绝 H0 时,是认为各总体率(或总体构成比)不等或不全相等,即只能认 为其中至少有两个总体率(或总体构成比)不 等,而不能确定任意两个总体率(或总体构成比)不等。,行 列表资料 2 检验的注意事项:, 当有 1 / 5 及以上格子的 T 5, 或有一个格子 T 1 时,不能直接做卡方检验。应将资料合理 合并;或增大样本含量重新观察以增加理论频数T。,27,28,29,(3) 配对资料的四格表 2 检验 ( 2 test of paired comparision of enumeration data ) 用于配对设计的计数资料。,配对的方法: 1)同源配对:是通过两种不同的处理方法对同 一样品进行处理,从而推断两种 处理方法的结果有无差别。,30,a :甲乙 b :甲乙 C :甲乙 d :甲乙,甲法阳性率:35/50 70,乙法阳性率:30/50 60,公式:,(a),(b),(c),(d),( | b - c | - 1) 2 2 = , = 1 b + c,31,例:,假设:H0:两法阳性率一致, H1:两法阳性率不一致, 0.05,( |

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论