




已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卡方检验 SAS应用 蒋红卫Email JHWCCC 21CN COM 学习目标 掌握四格表普通卡方检验和配对卡方检验方法以及相应的SAS程序 了解FREQ过程语句格式 熟悉R C表资料的分类类型以及相应的统计检验方法 掌握双向无序R C表资料检验以及SAS程序 掌握单向有序R C表资料检验以及SAS程序 掌握趋势卡方检验方法以及SAS程序 掌握分层R C表的分析以及SAS程序 概述 前面已介绍了两个率比较的检验 在观察例数不够大或拟对多个率进行比较时 检验就不适宜了 因为直接对多个样本率作两两间的检验有可能增加第一类误差 2检验可解决此类问题 卡方检验是用途很广的一种假设检验方法 这里我们主要学习它在分类资料统计推断中的应用 包括 两个率或两个构成比比较的卡方检验 多个率或多个构成比比较的卡方检验以及分类资料的相关分析等 四格表资料 定性指标分为有序的 如 疗效分为 治愈 显效 好转 无效 死亡 和名义的 如 血型分为 O A B AB 型 类 对于每 个受试者来说 有序指标的观测结果只能是该有序指标若干等级中的 级 如某人的疗效为 显效 名义指标的观测结果只能是该名义指标若干标志中的 个 如某人的血型为 型 显然 无法像处理定量指标那样去直接分析定性指标 故这类资料常被整理成列联表的形式后再进行分析 当表中只有 个定性指标时 称为 维列联表 有 个或 个以上定性指标时 称为多维列联表 常用R C表示 维列联表的行数和列数 并称为R C表 当R C 时 称为 表 或四格表 表看起来很简单 但根据资料所具备的条件有许多不同的处理方法 四格表卡方检验的SAS程序 在SAS STAT模块中FREQ TABULATE和SUMMARY等过程可用于分类资料的统计描述 其中FREQ过程兼具统计描述和统计推断的功能 对分类变量计算频数分布 产生从一维到n维的频数表和列联表 对于二维表 可进行 2检验 对于三维表 可作Mentel Hanszel分层分析 FREQ过程是SAS用于分析分类资料的一个常用过程 本节将先向大家介绍FREQ过程的语句及其格式 FREQ过程的语句基本格式如下 Procfreqdata order Table分类变量 分类变量 Weight变量 Run 四格表卡方检验的SAS程序 DATA 数据集 规定PROCFREQ语句使用的数据集 ORDER FREQ 按频数递减顺序排列 ORDER DATA 按数据集中出现的顺序排列 ORDER INTERNAL 按内部值排列 缺省 ORDER FORMATTED 按外部格式值排列 Table语句指定构成表格的变量和表格结构 表格的结构由变量个数和变量排列顺序决定 一个table语句允许列出多个表格结构 PROCFREQ过程中可有多条TABLES语句 TABLES语句后可接多个表格请求式 每个请求式可包含任何数量的变量 从而得到所需的表格 四格表卡方检验的SAS程序 如果TABLES语句缺省 则FREQ过程对数据集中的所有变量都给出相应的一维频数表 不规定任何选项时 若需某变量的一维频数 FREQ给出该变量每一水平的频数 累积频数 频数的百分比和累积百分比 若需二维频数表 FREQ产生交叉分组列表 即包括各格的频数 总频数的格百分数 行频数的格百分数和列频数的格百分数 请求式由一个或多个用 连接起来的变量名组成 几个变量可放在括号中 如 TABLESA BC 等价于TABLESA BA C TABLES A C D 等价于TABLESA DB DC D 四格表卡方检验的SAS程序 下列选项可用于TABLES语句中 的后面 OUT 数据集 建立一个包含变量值和频数计数的输出数据集 如果TABLES语句中不止一个请求式 数据集的内容相应于TABLES语句中最后一个请求 CHISQ对每层作c2检验 包括Pearsonc2 似然比c2和Mantel Haenszelc2 此外还给出与c2检验有关的关联指标包括Phi系数 列联系数和Cramer sV 对于2 2表 给出Fisher精确概率 AGREE进行配对c2检验 EXACT对大于2 2的列联表计算Fisher精确概率 同时也给出CHISQ选项的全部统计量 四格表卡方检验的SAS程序 MEASURES对每层的二维表计算一系列关联指标及相应的标准误 包括Pearson和Spearman相关系数 以及Gamma和Kendall系数等 对于2 2表 还给出常用的危险度指标及其标准误 CMH给出Cochran Mantel Haenszel统计量 可检验在调整了TABLES语句中其它变量后 行变量与列变量之间的关联程度 对于2 2表 FREQ过程给出相对危险度估计及其可信区间 还给出各层关联度指标是否齐性的Breslow检验 ALL给出CHISQ MEASURES CMH所请求的全部统计量 ALPHA p给出检验水准 缺省为0 05 四格表卡方检验的SAS程序 EXPECTED给出期望频数 DEVIATION给出每格的实际频数与期望频数的差值 CELLCHISQ给出每格对总c2的贡献 即计算每格的 实际频数 期望频数 2 期望频数 CUMCOL给出累积列百分数 NOFREQ不给出列联表中的格频数 NOPERCENT不给出列联表中的格百分数 四格表卡方检验的SAS程序 NOROW不给出列联表中各格的行百分数 NOCOL不给出列联表中各格的列百分数 NOCUM不给出频数表的累积频数和累积百分数 NOPRINT不给出表格 但给出CHISQ MEASURES或CMH等语句所指定的统计量 Trend指令系统对2 C频数表的C个百分率进行Cochran Armitage趋势检验 WEIGHT语句 通常每个观察值提供数值1给频数计数 当WEIGHT语句出现时 每个观察值提供的是该观察值的加权变量值 该值必须非负 但可不必为整数 只能使用一个WEIGHT语句 且该语句作用于所有的表 四格表卡方检验 理论频数 记为T 理论数的计算公式为 四格表卡方检验 卡方检验的统计量是 2值 它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和 每个格子中的理论频数T是在假定两组的发病率相等的情况下计算出来的 故 2值越大 说明实际频数与理论频数的差别越明显 两组发病率不同的可能性越大 例题 某医院欲比较异梨醇口服液 试验组 和氢氯噻嗪 地塞米松 对照组 降低颅内压的疗效 将200例颅内压增高症患者随机分为两组 问两组降低颅内压的总体有效率有无差别 连续性校正公式 2分布是正态变量的一种分布 设是k个独立的标准正态变量 则 2界值表就是根据这种连续性分布计算出来的 2统计量计算公式实质上是正态近似法 分类资料是间断性的 由此计算的 2值不连续 尤其自由度为1的四格表 求出的概率可能偏小 此时需要对 2值进行连续性校正 公式为 2检验的应用条件 连续性校正主要针对四格表资料 尤其理论数较小时 连续性校正不可忽略 四格表 2检验的应用条件为 当n 40且所有T 5时 用普通的 2检验 若所得 改用确切概率法 当n 40但有1 T 5时 用校正的 2检验 当n 40或有T 1时 不能用 2检验 改用确切概率法 例题 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效 将78例脑血管疾病患者随机分为两组 问两种药物治疗脑血管疾病的有效率是否有差别 配对计数资料的卡方检验 把每一份样本平均分成两份 分别用两种方法进行化验 比较此两种化验方法的结果 两类计数资料 是否有本质的不同 或者分别采用甲 乙两种方法对同一批病人进行检查 比较此两种检查方法的结果 两类计数资料 是否有本质的不同 此时要用配对卡方检验 配对计数资料的卡方检验 比较两法结果有无差别 要着眼于两法结果不一致的部分 表中观察变量是对子中两法的差值或差别 由b和c两格数据来反映 总体中与b和c对应的数据可用B和C表示 a格和d格表示两法差值为0 不予考虑 当 40时 当 40时 需作连续性校正 例题 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定 问两种方法的检测结果有无差别 行 列表资料的 2检验 前面介绍了两个样本率比较的 2检验方法 其基本数据有2行2列 称为2 2表或四格表资料 本节介绍的行 列表资料的 2检验 用于多个样本率的比较 两个或多个构成比的比较以及双向有序或无序分类资料的检验等 R C表可以分为双向无序 单向有序 双向有序属性相同和双向有序属性不同4类 双向无序R C表 R C表中两个分类变量皆为无序分类变量 对于该类资料 若研究目的为多个样本率 或构成比 的比较 可用行 列表资料的 2检验 若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时 可以用行 列表资料的 2检验以及Pearson列联系数进行分析 例题1 某医师研究物理疗法 药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效 问三种疗法的有效率有无差别 例题2 测得某地5801人的ABO血型和MN血型结果 问两种血型系统之间是否有关联 单向有序R C表 有两种形式 一种是R C表中的分组变量是有序的 而指标变量是无序的 此种单向有序R C表资料可用行 列表资料的 2检验进行分析 另一种情况是R C表中的分组变量是无序的 而指标变量是有序的 此种单向有序R C表资料宜用秩和检验进行分析 例题 某地城市与农村高血压患者严重程度情况 试比较该地城市和农村高血压患者高血压严重程度是否有差别 双向有序R C表 双向有序属性相同的R C表R C表中的两分类变量皆为有序且属性相同 实际上是2 2配对设计的扩展 此时宜用一致性检验 或称Kappa检验 双向有序属性不同的R C表R C表中的两分类变量皆为有序且属性不相同 对于该类资料 需要分析两有序分类变量间是否存在线性变化趋势 宜用有序分组资料的线性趋势检验 行列均为顺序变量的相关检验 变量虽然是有序的 但毕竟还不是定量的 需要给有序变量的各等级赋值方可进行相关分析 最简单的赋值法是按顺序赋给秩次 即得分 即给行变量的等级赋值1 2 R和给列变量的等级赋值1 2 C 这样 X Y 的不同取值就有R C对 表中的R C个频数就是这R C对取值所对应的频数 然后计算Spearman秩相关系数 并作显著性检验 这是比较粗糙的分析方法 行列均为顺序变量的相关检验 Spearman秩相关分析比较粗糙 这是因为它给有序变量的等级赋值过于简单 不能最大限度地获得有序变量之间的相关信息 而典型相关分析是在使有序变量的相关达到极大的前提下给有序变量的各等级赋值 就是对于表的边缘 指 行合计 与 列合计 设法产生一双变量正态 从而进行相关分析 因产生各等级的得分值的计算过程中涉及矩阵运算 故手工计算较麻烦 将用SAS程序实现统计计算 一旦有了各等级的得分值后 就可运用求 维频数资料相关系数的公式计算了 典型相关分析可以得出几个典型相关系数R 与每一个典型相关系数对应的检验为卡方检验 其数值为nR2 其中n为R C表中的总频数 与第k个卡方值对应的自由度dfk R C 2k 1 行列均为顺序变量的相关检验 与定量资料的相关与回归分析类似 也可对R C表资料中有序变量之间是否存在线性趋势作显著性检验 通常这两种检验的结果是基本一致的 即相关分析结果显著 线性趋势检验结果也显著 可以通过检验实现线性趋势检验 即利用回归分析思想产生的与线性回归有关的卡分量和偏离线性回归的卡分量 行列均为顺序变量的相关检验 首先计算R C表的值 然后将总的值分解成线性回归分量与偏离线性回归分量 若两分量均具有统计学意义 说明两分类变量存在相关关系 但关系不是简单的直线关系 若线性回归分量有统计学意义 偏离线性回归分量无统计学意义时 说明两分类变量不仅存在相关关系 而且是线性关系 行列均为顺序变量的相关检验 计算总的值计算线性回归分量回归b为回归系数计算偏线性回归分量将总的值分解成线性回归分量和偏离线性回归分量 若两分量均有统计学意义 说明两分类变量存在相关关系 但关系不是简单的直线关系 若线性回归分量有统计学意义 偏离线性回归分量无统计学意义时 说明两变量不仅存在相关关系 而且是线性关系 例题 某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系 将278例尸解资料整理成行乘列表 问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势 分层资料的分析 按一个或多个因素分层后 研究行变量与列变量间的联系 通过控制分层变量的影响 检验研究行变量与列变量的关系 例题 某研究者欲研究男女性使用别嘌呤是否引发皮疹 本章小节 2检验是用途很广的一种假设检验方法 这里我们主要学习它在分类资料统计推断中的应用 包括 两个率或两个构成比比较的卡方检验 多个率或多个构成比比较的卡方检验以及分类资料的相关分析等 本章第一节介绍了四格表的普通 2检验方法 理论频数与实际频数的定义 2检验统计量的计算方法 2分布以及 2界值表确定P值的方法 说明了四格表 2检验的应用条件 以及连续性校正公式和四格表专用公式 通过SAS分析实例演示了四格
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民族传统与可持续发展-洞察及研究
- 高校毕业生实习管理流程详解
- 基于迁移学习的多模态对话系统开发-洞察及研究
- 教师职业发展规划指导书
- 智慧邮政应急调度体系优化-洞察及研究
- 房地产合同纠纷案例分析
- 心理辅导工作计划
- 动力农业装备关键部件的精密制造工艺优化
- 中医临床诊断流程及操作指南
- 员工工号编码管理规范
- 葫芦种植技术
- 热敏电阻器配方设计与制备工艺详解
- 监理工程师题库检测试题打印含答案详解【完整版】
- 2025年江西省高考生物试卷真题(含标准答案及解析)
- 2025年辅警笔试题库行测及答案指导
- 运维7×24小时服务保障方案
- 单招临床医学试题及答案2025年版
- 2025年辽宁省中考语文真题卷含答案解析
- 2《归园田居》任务式公开课一等奖创新教案(表格式)统编版高中语文必修上册
- 银行文明礼仪课件
- 虚拟电厂运行关键课件
评论
0/150
提交评论