X2表资料统计分析与错误辨析.ppt_第1页
X2表资料统计分析与错误辨析.ppt_第2页
X2表资料统计分析与错误辨析.ppt_第3页
X2表资料统计分析与错误辨析.ppt_第4页
X2表资料统计分析与错误辨析.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

定性资料的统计分析,22表 讲授者:刘惠刚 单 位:首都医科大学 继续教育学院,内容提要,一、何为定性资料? 二、合理分析定性资料的要领; 三、22表的分型以及统计分析 方法的合理选择; 四、22表错误辨析; 五、用软件实现22表的统计分析。,一、何为定性资料,定性 资料,名义资料:变量的具体取值是名称 (文字、符号或代号), 即名义变量。,有序资料:变量的具体取值在“量或质” 上可排出一定顺序,此变量 就是“有序变量”。,附表 资料类型,注:G=1为冠心病人、G=2为正常人;X1为性别、X2为年龄、X3为高血压史、X4为吸烟史、X5-X11为血脂指标、X12基因型、X13为尿糖、X14为用药史。,二、合理分析定性资料的要领,1、认准列联表类型 2、检查资料的前提条件 3、弄清分析的目的,第一类:22表 ,四型,(一)横断面研究设计22表; (二)队列研究设计22表; (三)病例-对照研究设计22表; (四)配对研究设计22表。,三、22表的分型以及统计分析 方法的合理选择,第二类:RC表,四型,(一)双向无序列联表; (二)单向有序列联表; (三)双向有序且属性不同的列联表; (四)双向有序且属性相同的列联表。,第三类:高维表,三型,(一)结果变量为“二值变量” 的高维表; (二)结果变量为“多值有序变量”的高维表; (三)结果变量为“多值名义变量”的高维表。,列联表分类,(一)横断面研究设计22表,手术时 感染 未感染 合计 感染率 间(h) 例数 例数 (%) 5 13(a) 229(b) 242(e) 5.4 5 7(c) 56(d) 63(f) 11.1 合 计 20(g) 285(h) 305(n) 6.6,1、实例:,理论频数(T)=(行合计)(列合计)/N (2)N40但至少有一个1T5,用校正的卡方检验; (3)N40或有一个T1,应选用Fisher的精确检验; (4)若用软件计算,均可选用Fisher的精确检验结果。,2、检验目的及结果解释 3、计算方法,(1)N40、T5,23.841,用一般卡方检验; 2稍大于3.841,用校正卡方检验;,前提条件的检查: n=30540、TC=6320/305=4.130.05,第一类:22表 ,四型,(一)横断面研究设计22表; (二)队列研究设计22表; (三)病例-对照研究设计22表; (四)配对研究设计22表。,三、 22表的分类、分型 以及统计分析方法的合理选择,第二类:RC表,四型,(一)双向无序列联表; (二)单向有序列联表; (三)双向有序且属性不同的列联表; (四)双向有序且属性相同的列联表。,第三类:高维表,三型,(一)结果变量为“二值变量” 的高维表; (二)结果变量为“多值有序变量”的高维表; (三)结果变量为“多值名义变量”的高维表。,列联表分类,(二) 队列研究设计22表,当初血 患冠心 未患冠心 压状况 病例数 病例数 偏高 19(a) 61(b) 正常 20 (c) 465(d),1、实例:,发病率(%),23.8a/(a+b),4.1c/(c+d),2、计算方法,(1)先将其视为“横断面研究设计的22表资料”来处理; (2)若结果为“P0.05”,计算一个重要的统计量RR(即相对危险度); (3)用MH卡方检验,检验RR与1之间的差别是否有统计学意义。,a b | 2=(n-1)(ad-bc)2/w c d | w=(a+b)(c+d)(a+c)(b+d),第一类:22表 ,四型,(一)横断面研究设计22表; (二)队列研究设计22表; (三)病例-对照研究设计22表; (四)配对研究设计22表。,三、22表的分型以及统计分析 方法的合理选择,第二类:RC表,四型,(一)双向无序列联表; (二)单向有序列联表; (三)双向有序且属性不同的列联表; (四)双向有序且属性相同的列联表。,第三类:高维表,三型,(一)结果变量为“二值变量” 的高维表; (二)结果变量为“多值有序变量”的高维表; (三)结果变量为“多值名义变量”的高维表。,列联表分类,(三)病例-对照研究设计22表,服避孕 子代染色体 子代染色体 药与否 异常例数 正常例数 服药 34(a) 68(b) 未服 20(c) 128(d),1,实例:,2、计算方法,(1)先将其视为“横断面研究设计的22表资料”来处理; (2)若结果为“P0.05”,计算一个重要的统计量OR(即比数比); (3)用MH卡方检验,检验总体中OR与1之间的差别是否有统计学意义。,a b | 2=(n-1)(ad-bc)2/w c d | w=(a+b)(c+d)(a+c)(b+d),第一类:22表 ,四型,(一)横断面研究设计22表; (二)队列研究设计22表; (三)病例-对照研究设计22表; (四)配对研究设计22表。,三、22表的分型以及统计分析 方法的合理选择,第二类:RC表,四型,(一)双向无序列联表; (二)单向有序列联表; (三)双向有序且属性不同的列联表; (四)双向有序且属性相同的列联表。,第三类:高维表,三型,(一)结果变量为“二值变量” 的高维表; (二)结果变量为“多值有序变量”的高维表; (三)结果变量为“多值名义变量”的高维表。,列联表分类,(四)配对研究设计22表。,1、实例:,(1) 缺乏金标准的配对设计22表,2、计算方法,用McNemar2检验进行统计分析,比较两种 方法测定结果不一致部分之间的差别在总体上是 否具有统计学意义。,缺乏金标准的22表资料不值得计算,(2)隐含金标准的配对设计22表,(a),(b),(c),(d),2、计算方法,用McNemar2检验进行统计分析,比较两种 方法测定结果不一致部分之间的差别在总体上是 否具有统计学意义。,a b | c d | 2=(|b-c|-1)2/(b+c),(3)特设金标准的配对设计22表,2、计算方法,用McNemar2检验进行统计分析,比较两种 方法测定结果不一致部分之间的差别在总体上是 否具有统计学意义。,a b | c d | 2=(|b-c|-1)2/(b+c),第一类:22表 ,四型,(一)横断面研究设计22表; (二)队列研究设计22表; (三)病例-对照研究设计22表; (四)配对研究设计22表。,三、22表的分型以及统计分析 方法的合理选择,第二类:RC表,四型,(一)双向无序列联表; (二)单向有序列联表; (三)双向有序且属性不同的列联表; (四)双向有序且属性相同的列联表。,第三类:高维表,三型,(一)结果变量为“二值变量” 的高维表; (二)结果变量为“多值有序变量”的高维表; (三)结果变量为“多值名义变量”的高维表。,列联表分类,四、22表错误辨析,例1:错在哪?,某人将下面的资料直接代入卡方检验公式进行计算,并得出结论,对吗?,表1 螺纹管消毒处理前后采样结果 螺纹管消毒 采样份数 合格数 合格率(%) 前 20 3 15.00 后 20 18 90.00 2= n(ad-bc)2/(efgh) =61(2018-320)2/(23384021) =7.478,错 在 哪 ?,对例1实验过程的了解,(一)若消毒前、后是同一批螺纹管,则例1的处理犯了两个错误(设计、计算错误); (二)若消毒前、后是两批螺纹管,则例1的处理犯了一个错误(计算错误)。,(一)若消毒前、后是同一批螺纹管,则例1的处理犯了两个错误: 1、实验设计错误 2、计算中常识性错误,基本概念的复习,同一根螺纹管消毒前检测、消毒后再检测,这本身就是自身配对设计,当观察结果为定性的结果时,应按配对设计四格表资料格式来列表,不应按成组设计格式来列表。,按配对设计应采取的列表格式,*代表“消毒后检测结果”,配对设计定性资料的 统计分析方法,运用McNemar 2检验,即 2=(|b-c|-1)2/(b+c) =(|1-16|-1)2/(1+16) =11.529 因2=11.5292(1)0.01=6.635 故P0.01,结论:消毒后的合格率明显高于消毒前的合格率。,(二)若消毒前、后是两批螺纹管,则例1的处理犯了一个错误:计算错误。,再分析例1的错误所在,若消毒前、后是分别采样的,即消毒前采样20根螺纹管,消毒后采的是另外的20根螺纹管,这属于成组设计,由于观测结果为定性的,故可按横断面研究设计格式来列表,但例1的统计计算有概念性错误。,仅从统计计算角度看, 例1的错误所在,基本概念的复习: 进行卡方检验时所用的原始频数a、b、c、d必须是两个实验分组中的“阳性数”与“阴性数”,本例中原作者采用了“部分合计数”与“合格数”作为原始频数计算,这是错误的!,表1 螺纹管消毒处理前后采样结果 螺纹管消毒 采样份数 合格数 合格率(%) 前 20 3 15.00 后 20 18 90.00 2= n(ad-bc)2/(efgh) =61(2018-320)2/(23384021) =7.478,错 在 哪 ?,正确的列表格式,按成组(横断面)设计 例1的正确计算,前提条件的检查: n=40、无小于5的理论频数,故可用一般的卡方检验试算。 2= n(ad-bc)2/(efgh) =40(32-1718)2/(20202119) =22.556,例1的正确结论,因2=22.5562(1)0.01=6.635, 故P0.01。 螺纹管消毒前、后的合格率之间的差别有统计学意义,消毒后的合格率(90.0%)明显高于消毒前的合格率(15.0%)。,例2:错在哪?,某人将下面的资料直接代入卡方检验公式进行计算,并得出结论,对吗?,2=n(ad-bc)2/(efgh) =22(89-14)2/(9131210) =7.246,例2的错误所在,前提条件的检查: 因n=2240,故本例不适合选用一般的卡方检验处理资料,宜选用Fisher的精确检验直接计算概率。,例2的正确计算,本例采用Fisher的精确检验直接计算概率,其结果为:P=0.0115

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论