




已阅读5页,还剩65页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分类资料的统计推断 statisticalinferenceforcategoricaldata 易洪刚 DepartmentofEpidemiology Biostatistics SchoolofPublicHealthNanjingMedicalUniversity 简要回顾 统计分析 统计描述 统计推断 参数估计 假设检验 均数 标准差 总体均数的可信区间 t检验 Example 定量资料 分类资料 率 比 构成比 总体率的可信区间 2检验 检验Fisher精确概率法 主要内容 两个率的比较配对设计两个率的比较R C列联表的分析正确应用 Chi squaretest 问题的提出 KarlPearson1857 1936描述统计学派的代表人物 现代统计科学的创立者 始于数学 继之哲学和法律学 进而生物学和遗传学 集大成于统计学 坚决的反对推断统计学派 统计分布 Pearson分布曲线 理论分布和实际分布间总存在差异 1900年 KarlPearson提出检验 随机误差 本质性差异 Why 问题的提出 四格表资料 2检验 例7 2 page75 某医院肿瘤科3年来共治疗乳腺癌患者n 131例 每例均观察满5年 其中单纯手术治疗组观察n1 84例 存活x1 57例 存活率p1 67 9 联合治疗 手术 术后化疗 组观察n2 47例 存活x2 39例 存活p2 83 0 问两组存活率有无差别 398 5727 表7 1两组存活率的比较 四格表 fourfoldtable 四格表资料 fourfoldtable 理论频数 theoreticalfrequence 如果两个样本来自同一总体 则两组存活率相同 则用合计的存活率作为总体存活率的点估计值 在这样的假设前提下 可以计算各组理论存活人数和理论死亡人数 根据检验假设H0计算出来的数称作理论频数 theoreticalfrequency T 73 3 理论频数 34 44 理论频数的计算 theoreticalfrequence 理论频数 12 56 理论频数 理论频数 73 3 61 56 22 44 2检验的基本思想 1 通过构造A与T吻合程度的统计量来反映两样本率的差别 实际数A理论数T 如果H0假设成立 则实际频数与理论频数应该比较接近 差值属于随机误差 用 2统计量表示 H0成立时 实际数与理论数的差别不会很大 出现较大 2值概率很小 若P 则拒绝H0 若P 则尚无理由拒绝它 2检验的基本思想 2 1 假设两总体率相等H0 两组总体存活率相同 即 1 2 H1 两组总体存活率不同 即 1 2 0 05 2检验的步骤 1 2 实际数与理论数的差值服从 2分布 2检验的步骤 2 自由度为1的 2分布界值 自由度为1的 2分布界值 0 0 0 1 0 2 0 3 0 4 0 5 3 查 2分布界值表确定P值并作出推论 按 2 1 2 1 1查附表3 2界值表 得P 0 05 按 0 05水准不拒绝H0 差别无统计学意义 故尚不能认为单纯手术疗法与联合疗法对乳腺癌患者治疗效果有差别 2检验的步骤 3 总结 比较两个样本率所代表的总体率是否有差别 实质是考察现有的样本频数分布是否与假设下的理论频数分布间差异到底是否包含了本质上的差异 2统计量代表了实际数与理论数吻合的程度 2检验相关问题 2分布 0 0 0 1 0 2 0 3 0 4 0 5 2分布与自由度有关 Chi squaredistribution 请看演示 c2分布 四格表及行 列表的自由度在表中周边合计数不变的前提下 基本数据可以自由变动的格子数 8 27 57 2检验相关问题 自由度 2检验相关问题 四格表专用公式 2 a b c d分别为四格表的四个实际频数 n a b c d 2检验相关问题 四格表专用公式 2分布是连续性分布 定性资料 实际数过小 增加了第一类错误 校正公式 2检验相关问题 2值的校正 n 40 T 5 用 2检验 N 40 但1 T 5 用校正 2 n 40 或T 1 用确切概率法 2检验相关问题 应用条件 例题 某矿石粉厂当生产一种矿石粉石时 在数天内即有部分工人患职业性皮肤炎 在生产季节开始 随机抽取15名车间工人穿上新防护服 其余仍穿原用的防护服 生产进行一个月后 检查两组工人的皮肤炎患病率 结果如表 问两组工人的皮肤炎患病率有无差别 2检验相关问题 应用条件 2检验相关问题 应用条件 H0 两组工人的皮肤炎患病率无差别 即 1 2 H1 两组工人的皮肤炎患病率有差别 即 1 2 0 05 最小的理论频数T11 15 11 43 3 84 140 所以宜用 2检验的校正公式 查附表 2界值表得0 05 P 0 10 按 0 05水平不拒绝H0 差别无统计学意义 尚不能认为穿不同防护服的皮肤炎患病率有差别 2检验相关问题 应用条件 0 05 0 025 0 025 1 96 1 96 2检验相关问题 与正态分布的关系 配对四格表资料的 2检验 McNemar检验 McNemar stest 目的通过对单一样本数据的分析 推断两种处理的结果有无差别 用途比较两种检验方法 两种培养方法 两种提取方法等的差别 例7 8 page81 用两种检验方法对某食品作沙门氏菌检验 结果如表7 9 试比较两种方法的阳性结果是否有差别 配对四格表资料的 2检验 两种检验方法阳性率结果 配对四格表资料的 2检验 两种检验方法结果比较 配对四格表资料的 2检验 配对四格表资料的实际数与理论数 实际数 理论数 1 连续性校正 当20 b c 40时 需要校正 配对四格表资料的 2检验步骤 H0 两种检验方法阳性率相同 总体B C H1 两种检验方法阳性率不同 总体B C 0 05 计算统计量 1 P 0 05按 0 05水准 拒绝H0 接受H1 差别有统计学意义 可以认为两法检验结果不一样 荧光抗体法阳性结果高于常规培养法 多个率比较的 2检验 多组率或构成比比较时 由于行数或列数超出了2 我们把这样的资料称为行 列表资料 行 列表的 2检验统计量 某省三个地区花生的黄曲酶毒素B1污染率比较 多个率比较的 2检验 理论数的计算 实际数A理论数T 2值的计算 实际数A理论数T 2值的计算 自由度为2的 2分布界值 3个率比较的 2检验步骤 H0 1 2 3H1 1 2 3不等或不全相等 0 05 计算统计量 2 17 91 v 2 P 0 0000按 0 05水准 拒绝H0 接受H1 认为三个地区花生中黄曲酶毒素B1污染率不等或不全相等 例7 4 page78 某地调查了1995 1998四个年度中小学女生的贫血状况 见表7 4 问各年度间学生贫血率有无差别 多个率比较的 2检验 多个率比较的 2检验步骤 H0 四个年度学生的贫血检出率相等 即 1 2 3 4 H1 四个年度学生的贫血检出率不等或不全相等 0 05 计算统计量 v 2 4 1 2 1 3 查附表3 2界值表 得P 0 005 按 0 05水准拒绝H0 接受H1 差异有统计学意义 故可认为该地四个年份中小学女生贫血检出率不相等 多个率比较的 2检验步骤 构成比的比较 美国 中国 挪威三种不同国籍者的ABO血型分布 构成比的比较 美国 中国 挪威三种不同国籍者的ABO血型分布 2值的计算 实际数A理论数T 2值的计算 3个构成比比较的 2检验步骤 H0 三种国籍国民的血型构成相同 H1 三种国籍国民的血型构成不同或不全相同 0 05 计算统计量 2 332 9668 v 6 P 0 0000按 0 05水准 拒绝H0 接受H1 认为三种国籍国民的血型构成不同或不全相同 例7 6 page80 某市对城 郊区小学三 四年级学生营养状况进行了抽样调查 资料如表7 6试考察该地城 郊儿童营养状况的构成比有无差别 构成比的比较 构成比的比较 H0 城郊儿童营养状况的构成比相同 H1 城郊儿童营养状况的构成比不同 0 05 构成比的比较 按 3 1 2 1 2查附表3 2界值表 得P 0 05 按 0 05水准拒绝H0 接受H1 差异有统计学意义 可认为该市城郊两地儿童营养类型构成比不同 构成比的比较 2检验的应用条件 1 四格表的分析方法选择条件 n 40 T 5 用 2 n 40 但1 T40 20 b c 40用校正 2 b c 20 二项分布直接计算概率 2检验的应用条件 2 R C表的分析方法选择条件 理论数不能小于1 理论数大于等于1小于5的格子数不超过总格子数的1 5 否则用Fisher确切概率 或似然比检验 likelihoodratiotest 如果以上条件不能满足 可采用 增加样本含量删去某行或某列合理地合并部分行或列Fisher精确概率法 2检验的应用条件 3 多个率或构成比比较的 2检验 结论为拒绝H0时 仅表示几组有差别 并非任2组之间都有差别 若要了解之 可进行多重比较 2表的分割或率的可信区间法 2检验的应用条件 4 对于有序的分类变量 采用卡方检验方法不能考虑数据的有序性质 为此 对于单向有序可采用秩和检验 Ridit分析 双向有序可采用趋势检验等 2检验的应用条件 5 四格表的确切概率 page83 Fisher sexactprobabilityin2 2table 大脑左半球与右半球的恶性肿瘤作占比例 四格表周边合计不变 x min a b c d x 0 1 min a c a d 四格表 周边合计不变时 所有可能的排列 每一种组合的概率 超几何分布 hypergeometricdistribution 四格表所有可能排列的概率 P值 A T 值大于等于现有样本差别的各组合概率之和 P 0 225586 总结 是否需要Fisher s精确概率法 周边合计不变情况下有多少种组合 每一种组合的概率及 A T 值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中医食疗学试题及答案
- 中医水平测试题目及答案
- 2025年事业单位工勤技能-安徽-安徽经济岗位工三级(高级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-安徽-安徽水工监测工四级(中级工)历年参考题库含答案解析
- Folic-acid-OVA-生命科学试剂-MCE
- 压力之下如何处理婚姻危机?面试题及应对策略
- 售票员工作个人心得体会
- 煤矿技术员考试试卷及答案
- 护理课件酒精擦浴
- 电工职业资格考试全攻略
- 班组长团队管理能力考试题库-上(选择题)
- 医学精美课件《颈肩痛腰腿痛》讲座
- 厨房设备备品备件、标准件及易损件清单
- 心源性晕厥的查房
- 第31届全国中学生物理竞赛决赛理论考试试题与参考答案
- 中医适宜技术老年病
- 光伏电站巡检记录表完整
- (高清版)DZT 0275.5-2015 岩矿鉴定技术规范 第5部分:矿石光片鉴定
- 《养老护理员》-课件:协助老年人洗浴及清洁会阴部
- 2024年公安局招考警务辅助人员考试题库附答案
- 《幕墙工程UHPC单元体幕墙施工专项方案》
评论
0/150
提交评论