第五章_χ2检验.ppt_第1页
第五章_χ2检验.ppt_第2页
第五章_χ2检验.ppt_第3页
第五章_χ2检验.ppt_第4页
第五章_χ2检验.ppt_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卡方检验的原理与方法 适合性检验 独立性检验 第五章 2检验 离散型资料 连续型资料 资料 离散型资料 小样本 大样本 二 2检验与连续型资料假设检验的区别 一 2检验的定义 三 2检验的用途 概述 2检验 Chi squaretest 对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验 即根据样本的频数分布来推断总体的分布 一 2检验的定义 2检验与测量数据假设检验的区别 1 测量数据的假设检验 其数据属于连续型变量 而 2检验的数据属于点数而来的离散型变量 测量数据所来自的总体要求呈正态分布 而 2检验的数据所来自的总体分布是未知的 2检验与测量数据假设检验的区别 2 测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验 而 2检验在多数情况下不是对总体参数的检验 而是对总体分布的假设检验 2检验与测量数据假设检验的区别 3 二 2检验与连续型资料假设检验的区别 三 2检验的用途 适合性检验 独立性检验 同质性检验 适合性检验 吻合度检验 是指对样本的理论数先通过一定的理论分布推算出来 然后用实际观测值与理论数相比较 从而得出实际观测值与理论数之间是否吻合 因此又叫吻合度检验 是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验 通过假设所观测的各属性之间没有关联 然后证明这种无关联的假设是否成立 独立性检验 在连续型资料的假设检验中 对一个样本方差的同质性检验 也需进行 2检验 同质性检验 第一节 2检验的原理与方法 2检验的基本原理 2检验统计量的基本形式 2值的特点 2检验的基本步骤 2检验的注意事项 2检验就是统计样本的实际观测值与理论推算值之间的偏离程度 实际观测值与理论推算值之间的偏离程度就决定其 2值的大小 理论值与实际值之间偏差越大 2值就越大 越不符合 偏差越小 2值就越小 越趋于符合 若两值完全相等时 2值就为0 表明理论值完全符合 原理 理论值 观测值 2检验统计量的基本形式 2 Oi Ei 2 Ei O 实际观察的频数 observationalfrequency E 无效假设下的期望频数 expectationfrequency 抽样误差 实质性变化 玉米花粉粒碘反应观察值与理论值 要回答这个问题 首先需要确定一个统计量 将其用来表示实际观测值与理论值偏离的程度 然后判断这一偏离程度是否属于抽样误差 即进行显著性检验 判断实际观测值与理论值偏离的程度 最简单的办法是求出实际观测值与理论值的差数 玉米花粉粒碘反应观察值与理论值 由于差数之和正负相消 并不能反映实际观测值与理论值相差的大小 0 为了避免正 负相抵消的问题 可将实际观测值与理论值的差数平方后再相加 也就是计算 O E 2 O 实际观察的频数 E 无效假设下的期望频数 玉米花粉粒碘反应观察值与理论值 值越大 观测值与理论值相差也就越大 反之越小 200元 0元 奖学金 一等 三等 10元 10元 实际得到190元 实际得到60元 谁的贡献大 5 14 这两组观测值与理论值的偏离程度是不相同的 两组差数虽然相同 但其差数占理论值的比重不同 为了弥补这一不足 可先将实际观测值与理论值的差数平方 即 O E 2 再用差数的平方除以相应的理论值 将之化为相对数 从而来反映 O E 2的比重 最后将各组求和 这个总和就是 2 回顾 总体与样本方差公式 2 Oi Ei 2 Ei 2值就等于各组观测值和理论值差的平方与理论值之比 再求其和 玉米花粉粒碘反应观察值与理论值 2值的特点 可加性 非负值 随O和E而变化 2值与概率P成反比 2值越小 P值越大 说明实际值与理论值之差越小 样本分布与假设的理论分布越相一致 2越大 P值越小 说明两者之差越大 样本分布与假设理论分布越不一致 观测值与理论值的差异由抽样误差引起 即观测值 理论值 同时给出相就的备择假设HA 观测值与理论值的差值不等于0 即观测值 理论值 一般确定为0 05或0 01 1 提出无效假设H0 基本步骤 2 确定显著水平 3 计算样本的 2值 4 进行统计推断 2 2 P 2 2 P 建议SPSS等统计软件 1 任何一组的理论次数Ei都必须大于5 如果Ei 5 则需要合并理论组或增大样本容量以满足Ei 5 2 在自由度 1时 需进行连续性矫正 其矫正的 2c为 2 Oi Ei 0 5 2 Ei 2检验的注意事项 2分布是连续型变量的分布 每个不同的自由度都有一个相应的 2分布曲线 所以其分布是一组曲线 由于检验的对象 次数资料是间断性的 而 2分布是连续型的 检验计算所得的 2值只是近似地服从 2分布 所以应用连续型的 2分布的概率检验间断性资料所得的 2值就有一定的偏差 由次数资料算得的 2均有偏大的趋势 即概率偏低 当df 1 尤其是小样本时 必须作连续性矫正 比较观测数与理论数是否符合的假设检验 compatibilitytest 也称吻合性检验或拟合优度检验 goodnessoffittest 适合性检验 定义 第二节 适合性检验 用途1 判定样本实际分布与理论分布是否相等 适合性检验的df由于受理论值的总和等于观测值总和这一条件的约束 故df n 1 1 H0 本资料服从泊松分布 HA 本资料不服从泊松分布 300个单位容积内的细菌计数结果如下表 问此资料是否服从泊松分布 2 取显著水平 0 05 3 计算统计数 2 4 查 2值表 当df 7 2 5时 20 05 11 07 现实得 2 4 44 20 05 故接受H0 拒绝HA 即认为本资料服从泊松分布 例 有一鲤鱼遗传试验 以红色和青灰色杂交 其F2代获得不同分离尾数 问观测值是否符合孟德尔3 1遗传定律 用它来检验实验结果是否符合各种规律 用途2 本例为判断典型的两组数据的适应性检验 1 H0 鲤鱼体色分离符合3 1 HA 不符 2 确定显著水平 0 05 3 计算 2 由于理论资料k 2 df 2 1 1 需要进行连续性矫正 假设H0正确时 青灰色E1和红色E2理论数 E1 1602 3 4 1201 5E2 1602 1 4 400 5 将数据代入公式得 4 查 2值表 当df 1时 故应应否定H0 接受H 即认为鲤鱼体色F2分离不符合3 1比率 SPSS的适合性检验 由于上例给出的是频数值 因此要先用WeightCases对话框指定频数变量 在遗传学中 有许多显 隐性比率可以划分为两组的资料 如欲测其与某种理论比率的适合性 则 2值可用下表中的简式进行计算 检验两组资料与某种理论比率符合度的 2值公式 1 1 2 1 3 1 15 1 9 7 r 1 r m 大豆花色遗传试验F2观测结果 例 1 H0 大豆花色F2分离符合3 1比率 HA 大豆花色F2分离不符合3 1比率 2 取显著水平 0 05 3 计算统计数 2值 2 20 05 4 查值表 进行推断 接受H0 即大豆花色F2分离符合3 1比率 df 1 P 0 05 对于资料组数多于两组的值 还可以通过下面简式进行计算 Oi 第i组的实际观测数 pi 第i组的理论比率 n 总次数 F2代 共556粒 豌豆 此结果是否符合自由组合规律 根据自由组合规律 理论分离比为 豌豆杂交实验F2分离结果 方法一 1 H0 豌豆F2分离符合9 3 3 1的自由组合规律 HA 豌豆F2分离不符合9 3 3 1的自由组合规律 2 取显著水平 0 05 3 计算统计数 2值 2 0 016 0 101 0 135 0 218 0 470 4 查值表 进行推断 df 4 1 3 2 20 05 P 0 05 接受H0 即豌豆F2分离符合9 3 3 1的自由组合规律 方法二 2 0 016 0 101 0 135 0 218 0 470 课堂练习 P83例5 2P83例5 3数据在chapter4 2008 第三节 独立性检验 独立性检验的定义 2 2列联表的独立性检验 2 列联表的独立性检验 r 列联表的独立性检验 独立性检验 independencetest 又叫列联表 contigencytable 2检验 它是研究两个或两个以上因子彼此之间是独立还是相互影响的一类统计方法 一 2 2列联表的独立性检验 设A B是一个随机试验中的两个事件 其中A可能出现r1 r2个结果 B可能出现c1 c2个结果 两因子相互作用形成4格数 分别以O11 O12 O21 O22表示 下表是2 2列联表的一般形式 2 2列联表的一般形式 Row行 Column列 检验步骤 1 提出无效假设H0 事件A和事件B无关 同时给出HA 事件A和事件B有关联关系 2 给出显著水平 3 依据H0 可以推算出理论数 计算 2值 4 确定自由度 df r 1 c 1 进行推断 H0HA H0HA 2 2 P P 2 2 给药方式与给药效果的2 2列联表 1 H0 给药方式与给药效果相互独立 HA 给药方式与给药效果有关联 2 给出显著水平 0 05 3 根据H0 运用概率乘法法则 事件A与事件B同时出现的概率为 P AB P A P B 口服与有效同时出现的理论频率 口服频率 有效频率 即P AB P A P B 98 193 122 193 理论频数Ei 理论频率 总数 98 193 122 193 193 98 122 193 61 95 即Eij Ri Cj T 行总数 列总数 总数 E11 R1 C1 T 61 95E12 R1 C2 T 36 05 E21 R2 C1 T 60 05E22 R2 C2 T 34 95 给药方式与给药效果的2 2列联表 计算 2值 由于df r 1 c 1 2 1 2 1 1 故所计算的 2值需进行连续性矫正 4 查 2表 当df 1时 20 05 3 841 而 2c 0 863 20 05 P 0 05 应接受H0 拒绝HA 说明给药方式与给药效果相互独立 2 2列联表的 2检验可利用以下简式而不必计算理论次数 T 2 为矫正数 P86例5 4的SPSS处理 二 2 c列联表的独立性检验 2 c列联表的一般形式 由于df 2 1 c 1 2 故计算值时不需作连续性矫正 检测甲 乙 丙三种农药对烟蚜的毒杀效果 结果如下 使分析这三种农药对烟蚜的毒杀效果是否一致 三种农药毒杀烟蚜的死亡情况 例子 1 H0 对烟蚜毒杀效果与农药无关 农药类型间互相独立 HA 二者有关 2 取显著水平 0 05 3 统计数的计算 理论值的计算 2值的计算 4 查 2值表 进行推断查 2表 当df 2 1 3 1 2时 20 05 5 99 现实得 2 7 694 20 05 则拒绝H0 接受HA 说明三种农药对烟蚜的毒杀效果不一致 简便计算公式 课堂练习P87例5 5如何在SPSS中录入数据 运算方法同2X2 三 r c列联表的独立性检验 r c列联表是指r 3 c 3的计数资料 上表是r c列联表的一般形式 df r 1 c 1 1 故不需进行连续性矫正 r c列联表的计算公式 i 1 2 rj 1 2 c 例 某医院用碘及治疗地方性甲状腺肿 不同年龄的治疗效果列于下表 试检验不同年龄的治疗效果有无差异 不同年龄用碘剂治疗甲状腺肿效果比较 1 H0 治疗效果与年龄无关 HA 治疗效果与年龄有关 即不同年龄治疗效果不同 2 给出显著水平 0 01 3 计算统计数 2 4 查 2表 当df 3 1 4 1 6时 20 01 16 81 所以 2 46 988 20 01 P 0 01 应拒绝H0 接受HA 说明治疗效果与年龄有关 在治疗效果与年龄有关的基础上 可以将下面的3 4列联表做成3个2 4列联表 测验2个年龄段疗效的差异 11 30岁与31 50岁两个年龄段疗效的比较 11 30岁与50岁以上两个年龄段疗效的比较 31 50岁与50岁以上两个年龄段疗效的比较 1 11 30岁与31 50岁两个年龄段疗效的比较 2 11 30岁与50岁以上两个年龄段疗效的比较 3 31 50岁与50岁以上两个年龄

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论