独立性检验的基本思想及其初步应用(收藏).ppt_第1页
独立性检验的基本思想及其初步应用(收藏).ppt_第2页
独立性检验的基本思想及其初步应用(收藏).ppt_第3页
独立性检验的基本思想及其初步应用(收藏).ppt_第4页
独立性检验的基本思想及其初步应用(收藏).ppt_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独立性检验的基本思想及其初步应用 对于性别变量 其取值为男和女两种 这种变量的不同 值 表示个体所属的不同类别 像这类变量称为分类变量 生活中的分类变量 是否吸烟 宗教信仰 国籍 两个分类变量之间是否有关系 为调查吸烟是否对患肺癌有影响 某肿瘤研究所随机地调查了9965人 得到如下结果 单位 人 那么吸烟是否对肺癌有影响 吸烟与患肺癌列联表 列出两个分类变量的频数表 称为列联表 吸烟者与不吸烟者患肺癌的可能性存在差异 从上面数据和图形可以看出吸烟和患肺癌有关 从上面数据和图形可以看出吸烟和患肺癌有关 事实是否如此 我们能够有多大的把握认为 吸烟与患肺癌有关 吸烟与患肺癌列联表 假设 H0 吸烟与患肺癌没有关系A 不吸烟B 不患肺病 P AB P A B a 事件AB发生的频数a b 事件A发生的频数a c 事件B发生的频数 构造一个随机变量 建立统一标准 n a b c d 根据前面数据 K2的观察值 在 吸烟与患肺癌没有关系 成立的条件下可以估算出 99 的把握认为 吸烟与患肺癌有关系 利用随机变量K2来确定在多大程度上可以认为 两个分类变量有关系 的方法称为两个分类变量的独立性检验 确认 两个分类变量有关系 成立的可信程度 假设该结论不成由观测数据计算K2的观测值k通过概率评价该假设不合理的程度 k 6 635 假设不合理程度约为99 假设有两个分类变量X和Y 它们的值域分别为 x1 x2 和 y1 y2 其样本频数列联表 2 2列联表 可以按如下步骤判断结论H1成立的可能性 1 通过等高条形图 可以粗略地判断两个分类变量是否有关系 但是这种判断无法精确地给出所得结论的可靠度 2 可以利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度 根据观测数据计算检验随机变量K2的观察值k 当得到的观测数据a b c d都不于5时 可以通过查阅下表来确定其可信程度 在某医院 因为患心脏病而住院的665名男性病人中 有214人秃顶 而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系 你所得的结论在什么范围内有效 解 根据数据得到如下列联表 秃顶与患心脏病列联表 认为 秃顶与患心脏病有关 这组数据来自住院的病人 因此所得到的结论适合住院的病人群体 研究人员表示 掉头发在很大程度上是由日渐增大的工作压力 不能充分休息 不正确饮食和睡眠不足等因素引起的 在接受调查的人群中 有41 的受秃头威胁的人表示 他们一日睡觉时间不足4小时 秃顶 心脏病 为考察高中生性别与是否喜欢数学课程之间的关系 在某城市的某校高中生中随机抽取300名学生 得到如下列联表 由表中数据计算得K2 4 513 高中生的性别与是否喜欢数学课程之间是否有关系 为什么 解 认为 性别与喜欢数学课之间有关系 利用独立性检验的基本思想 假设该结论不成由观测数据计算K2的观测值k通过概率评价该假设不合理的程度 作业 课本习题3 2题1 2 实习作业 1 我校学生的体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论