第五章_χ2检验.ppt

上传人：g*** IP属地：河南上传时间：2020-01-09 格式：PPT 页数：95 大小：1.43MB 积分：20 举报 版权申诉

已阅读5页，还剩90页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

卡方检验的原理与方法适合性检验独立性检验第五章 2检验离散型资料连续型资料资料离散型资料小样本大样本二 2检验与连续型资料假设检验的区别一 2检验的定义三 2检验的用途概述 2检验 Chi squaretest 对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验即根据样本的频数分布来推断总体的分布一 2检验的定义 2检验与测量数据假设检验的区别 1 测量数据的假设检验其数据属于连续型变量而 2检验的数据属于点数而来的离散型变量测量数据所来自的总体要求呈正态分布而 2检验的数据所来自的总体分布是未知的 2检验与测量数据假设检验的区别 2 测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验而 2检验在多数情况下不是对总体参数的检验而是对总体分布的假设检验 2检验与测量数据假设检验的区别 3 二 2检验与连续型资料假设检验的区别三 2检验的用途适合性检验独立性检验同质性检验适合性检验吻合度检验是指对样本的理论数先通过一定的理论分布推算出来然后用实际观测值与理论数相比较从而得出实际观测值与理论数之间是否吻合因此又叫吻合度检验是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验通过假设所观测的各属性之间没有关联然后证明这种无关联的假设是否成立独立性检验在连续型资料的假设检验中对一个样本方差的同质性检验也需进行 2检验同质性检验第一节 2检验的原理与方法 2检验的基本原理 2检验统计量的基本形式 2值的特点 2检验的基本步骤 2检验的注意事项 2检验就是统计样本的实际观测值与理论推算值之间的偏离程度实际观测值与理论推算值之间的偏离程度就决定其 2值的大小理论值与实际值之间偏差越大 2值就越大越不符合偏差越小 2值就越小越趋于符合若两值完全相等时 2值就为0 表明理论值完全符合原理理论值观测值 2检验统计量的基本形式 2 Oi Ei 2 Ei O 实际观察的频数 observationalfrequency E 无效假设下的期望频数 expectationfrequency 抽样误差实质性变化玉米花粉粒碘反应观察值与理论值要回答这个问题首先需要确定一个统计量将其用来表示实际观测值与理论值偏离的程度然后判断这一偏离程度是否属于抽样误差即进行显著性检验判断实际观测值与理论值偏离的程度最简单的办法是求出实际观测值与理论值的差数玉米花粉粒碘反应观察值与理论值由于差数之和正负相消并不能反映实际观测值与理论值相差的大小 0 为了避免正负相抵消的问题可将实际观测值与理论值的差数平方后再相加也就是计算 O E 2 O 实际观察的频数 E 无效假设下的期望频数玉米花粉粒碘反应观察值与理论值值越大观测值与理论值相差也就越大反之越小 200元 0元奖学金一等三等 10元 10元实际得到190元实际得到60元谁的贡献大 5 14 这两组观测值与理论值的偏离程度是不相同的两组差数虽然相同但其差数占理论值的比重不同为了弥补这一不足可先将实际观测值与理论值的差数平方即 O E 2 再用差数的平方除以相应的理论值将之化为相对数从而来反映 O E 2的比重最后将各组求和这个总和就是 2 回顾总体与样本方差公式 2 Oi Ei 2 Ei 2值就等于各组观测值和理论值差的平方与理论值之比再求其和玉米花粉粒碘反应观察值与理论值 2值的特点可加性非负值随O和E而变化 2值与概率P成反比 2值越小 P值越大说明实际值与理论值之差越小样本分布与假设的理论分布越相一致 2越大 P值越小说明两者之差越大样本分布与假设理论分布越不一致观测值与理论值的差异由抽样误差引起即观测值理论值同时给出相就的备择假设HA 观测值与理论值的差值不等于0 即观测值理论值一般确定为0 05或0 01 1 提出无效假设H0 基本步骤 2 确定显著水平 3 计算样本的 2值 4 进行统计推断 2 2 P 2 2 P 建议SPSS等统计软件 1 任何一组的理论次数Ei都必须大于5 如果Ei 5 则需要合并理论组或增大样本容量以满足Ei 5 2 在自由度 1时需进行连续性矫正其矫正的 2c为 2 Oi Ei 0 5 2 Ei 2检验的注意事项 2分布是连续型变量的分布每个不同的自由度都有一个相应的 2分布曲线所以其分布是一组曲线由于检验的对象次数资料是间断性的而 2分布是连续型的检验计算所得的 2值只是近似地服从 2分布所以应用连续型的 2分布的概率检验间断性资料所得的 2值就有一定的偏差由次数资料算得的 2均有偏大的趋势即概率偏低当df 1 尤其是小样本时必须作连续性矫正比较观测数与理论数是否符合的假设检验 compatibilitytest 也称吻合性检验或拟合优度检验 goodnessoffittest 适合性检验定义第二节适合性检验用途1 判定样本实际分布与理论分布是否相等适合性检验的df由于受理论值的总和等于观测值总和这一条件的约束故df n 1 1 H0 本资料服从泊松分布 HA 本资料不服从泊松分布 300个单位容积内的细菌计数结果如下表问此资料是否服从泊松分布 2 取显著水平 0 05 3 计算统计数 2 4 查 2值表当df 7 2 5时 20 05 11 07 现实得 2 4 44 20 05 故接受H0 拒绝HA 即认为本资料服从泊松分布例有一鲤鱼遗传试验以红色和青灰色杂交其F2代获得不同分离尾数问观测值是否符合孟德尔3 1遗传定律用它来检验实验结果是否符合各种规律用途2 本例为判断典型的两组数据的适应性检验 1 H0 鲤鱼体色分离符合3 1 HA 不符 2 确定显著水平 0 05 3 计算 2 由于理论资料k 2 df 2 1 1 需要进行连续性矫正假设H0正确时青灰色E1和红色E2理论数 E1 1602 3 4 1201 5E2 1602 1 4 400 5 将数据代入公式得 4 查 2值表当df 1时故应应否定H0 接受H 即认为鲤鱼体色F2分离不符合3 1比率 SPSS的适合性检验由于上例给出的是频数值因此要先用WeightCases对话框指定频数变量在遗传学中有许多显隐性比率可以划分为两组的资料如欲测其与某种理论比率的适合性则 2值可用下表中的简式进行计算检验两组资料与某种理论比率符合度的 2值公式 1 1 2 1 3 1 15 1 9 7 r 1 r m 大豆花色遗传试验F2观测结果例 1 H0 大豆花色F2分离符合3 1比率 HA 大豆花色F2分离不符合3 1比率 2 取显著水平 0 05 3 计算统计数 2值 2 20 05 4 查值表进行推断接受H0 即大豆花色F2分离符合3 1比率 df 1 P 0 05 对于资料组数多于两组的值还可以通过下面简式进行计算 Oi 第i组的实际观测数 pi 第i组的理论比率 n 总次数 F2代共556粒豌豆此结果是否符合自由组合规律根据自由组合规律理论分离比为豌豆杂交实验F2分离结果方法一 1 H0 豌豆F2分离符合9 3 3 1的自由组合规律 HA 豌豆F2分离不符合9 3 3 1的自由组合规律 2 取显著水平 0 05 3 计算统计数 2值 2 0 016 0 101 0 135 0 218 0 470 4 查值表进行推断 df 4 1 3 2 20 05 P 0 05 接受H0 即豌豆F2分离符合9 3 3 1的自由组合规律方法二 2 0 016 0 101 0 135 0 218 0 470 课堂练习 P83例5 2P83例5 3数据在chapter4 2008 第三节独立性检验独立性检验的定义 2 2列联表的独立性检验 2 列联表的独立性检验 r 列联表的独立性检验独立性检验 independencetest 又叫列联表 contigencytable 2检验它是研究两个或两个以上因子彼此之间是独立还是相互影响的一类统计方法一 2 2列联表的独立性检验设A B是一个随机试验中的两个事件其中A可能出现r1 r2个结果 B可能出现c1 c2个结果两因子相互作用形成4格数分别以O11 O12 O21 O22表示下表是2 2列联表的一般形式 2 2列联表的一般形式 Row行 Column列检验步骤 1 提出无效假设H0 事件A和事件B无关同时给出HA 事件A和事件B有关联关系 2 给出显著水平 3 依据H0 可以推算出理论数计算 2值 4 确定自由度 df r 1 c 1 进行推断 H0HA H0HA 2 2 P P 2 2 给药方式与给药效果的2 2列联表 1 H0 给药方式与给药效果相互独立 HA 给药方式与给药效果有关联 2 给出显著水平 0 05 3 根据H0 运用概率乘法法则事件A与事件B同时出现的概率为 P AB P A P B 口服与有效同时出现的理论频率口服频率有效频率即P AB P A P B 98 193 122 193 理论频数Ei 理论频率总数 98 193 122 193 193 98 122 193 61 95 即Eij Ri Cj T 行总数列总数总数 E11 R1 C1 T 61 95E12 R1 C2 T 36 05 E21 R2 C1 T 60 05E22 R2 C2 T 34 95 给药方式与给药效果的2 2列联表计算 2值由于df r 1 c 1 2 1 2 1 1 故所计算的 2值需进行连续性矫正 4 查 2表当df 1时 20 05 3 841 而 2c 0 863 20 05 P 0 05 应接受H0 拒绝HA 说明给药方式与给药效果相互独立 2 2列联表的 2检验可利用以下简式而不必计算理论次数 T 2 为矫正数 P86例5 4的SPSS处理二 2 c列联表的独立性检验 2 c列联表的一般形式由于df 2 1 c 1 2 故计算值时不需作连续性矫正检测甲乙丙三种农药对烟蚜的毒杀效果结果如下使分析这三种农药对烟蚜的毒杀效果是否一致三种农药毒杀烟蚜的死亡情况例子 1 H0 对烟蚜毒杀效果与农药无关农药类型间互相独立 HA 二者有关 2 取显著水平 0 05 3 统计数的计算理论值的计算 2值的计算 4 查 2值表进行推断查 2表当df 2 1 3 1 2时 20 05 5 99 现实得 2 7 694 20 05 则拒绝H0 接受HA 说明三种农药对烟蚜的毒杀效果不一致简便计算公式课堂练习P87例5 5如何在SPSS中录入数据运算方法同2X2 三 r c列联表的独立性检验 r c列联表是指r 3 c 3的计数资料上表是r c列联表的一般形式 df r 1 c 1 1 故不需进行连续性矫正 r c列联表的计算公式 i 1 2 rj 1 2 c 例某医院用碘及治疗地方性甲状腺肿不同年龄的治疗效果列于下表试检验不同年龄的治疗效果有无差异不同年龄用碘剂治疗甲状腺肿效果比较 1 H0 治疗效果与年龄无关 HA 治疗效果与年龄有关即不同年龄治疗效果不同 2 给出显著水平 0 01 3 计算统计数 2 4 查 2表当df 3 1 4 1 6时 20 01 16 81 所以 2 46 988 20 01 P 0 01 应拒绝H0 接受HA 说明治疗效果与年龄有关在治疗效果与年龄有关的基础上可以将下面的3 4列联表做成3个2 4列联表测验2个年龄段疗效的差异 11 30岁与31 50岁两个年龄段疗效的比较 11 30岁与50岁以上两个年龄段疗效的比较 31 50岁与50岁以上两个年龄段疗效的比较 1 11 30岁与31 50岁两个年龄段疗效的比较 2 11 30岁与50岁以上两个年龄段疗效的比较 3 31 50岁与50岁以上两个年龄

人人文库> 全部分类> 生活休闲 > 文化艺术

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第五章_χ2检验.ppt

文档简介

温馨提示

最新文档

评论

第五章_χ2检验.ppt

文档简介

温馨提示

最新文档

评论

相关文档