




已阅读5页,还剩57页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 判断分类变量及其关系的方法 1 利用数形结合思想 借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法 2 一般地 在等高条形图中 与相差越大 两个分类变量有关系的可能性就越大 分类变量关系的分析 2 分析分类变量关系的步骤 1 作大量的调查 研究 统计出结果 2 列出列联表利用频率粗略估计 3 作出等高条形图 从直观上进一步判断分类变量之间的关联关系 通过等高条形图可以粗略地判断两个分类变量是否有关系 但无法精确地给出所得结论的可靠程度 例1 从发生交通事故的司机中抽取2000名司机作随机样本 根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下 试分析血液中含有酒精与对事故负有责任是否有关系 审题指导 题目已给出了2 2列联表 可利用等高条形图定性分析两个分类变量之间的相关性 规范解答 作等高条形图如下 图中阴影部分表示有酒精负责任与无酒精负责任的比例 从图中可以看出 两者差距较大 由此我们可以在某种程度上认为 血液中含有酒精与对事故负有责任 有关系 变式训练 某学校对在校部分学生课外活动内容进行调查 结果整理成下表 学生喜欢课外活动的类别与性别有关系吗 试用学过的知识进行分析 解析 作出等高条形图如下 由图可以直观地看出喜欢体育还是喜欢文娱 在性别上有较大差异 说明学生喜欢课外活动的类别与性别在某种程度上有关系 有关 相关性检验 解决一般的独立性检验问题的步骤 1 根据实际问题的需要确定容许推断 两个分类变量有关系 犯错误概率的上界 然后查下表确定临界值k0 2 根据2 2列联表 利用公式计算随机变量K2的观测值k 3 如果k k0 就推断 X与Y有关系 这种推断犯错误的概率不超过 否则 就认为在犯错误的概率不超过 的前提下不能推断 X与Y有关系 或者在样本数据中没有发现足够证据支持结论 X与Y有关系 通常认为k 2 706时 样本数据就没有充分的证据显示 X与Y有关系 例2 某企业为了更好地了解设备改造与生产合格品的关系 随机抽取了180件产品进行分析 其中设备改造前生产的合格品有36件 不合格品有49件 设备改造后生产的合格品有65件 不合格品有30件 根据上面的数据 你能得出什么结论 审题指导 可先由题中已给数据 列出2 2列联表 再计算K2的值作出判断 规范解答 由已知数据列出2 2列联表如下 由2 2列联表中的数据 得K2的观测值为 12 38 10 828 所以在犯错误的概率不超过0 001的前提下认为 生产合格品与设备改造有关系 变式训练 为了调查患慢性气管炎是否与吸烟有关 调查了339名50岁以下的人 调查结果如下表 根据上表分析患慢性气管炎是否与吸烟有关 解析 a 43 b 162 c 13 d 121 a b 205 c d 134 a c 56 b d 283 n 339代入公式得K2的观测值 7 4688 6 635 所以在犯错误的概率不超过0 01的前提下认为 患慢性气管炎与吸烟有关 例 为调查某地区老年人是否需要志愿者提供帮助 用简单随机抽样方法从该地区调查了500位老年人 结果如下 1 估计该地区老年人中 需要志愿者提供帮助的老年人的比例 2 能否在犯错误的概率不超过0 01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关 3 根据 2 的结论 能否提出更好的调查方法来估计该地区的老年人中 需要志愿者提供帮助的老年人的比例 说明理由 附 审题指导 解答第 2 问时 可先计算K2的值 再对照表格作出判断 规范解答 1 调查的500位老年人中有70位需要志愿者提供帮助 因此该地区老年人中 需要志愿者提供帮助的老年人的比例的估计值为 2 9 967 由于9 967 6 635 所以在犯错误的概率不超过0 01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关 3 由 2 的结论知 该地区的老年人是否需要志愿者提供帮助与性别有关 并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异 因此在调查时 先确定该地区老年人中男 女的比例 再把老年人分成男 女两层并采用分层抽样方法 这比采用简单随机抽样方法更好 变式备选 用两种检验方法对某食品做沙门氏菌检验 结果如下表 能否在犯错误的概率不超过0 001的前提下认为两种方法和阳性结果有关系 解题提示 由于题目要求 犯错误的概率不超过0 001 故需求解K2的观测值 再利用临界值的大小来判断假设是否成立 解析 由等高条形图 如图 可知 采用荧光抗体法与检验结果呈阳性有关系 而通过计算可知 查表可知 P K2 10 828 0 001 而113 185远大于10 828 所以它们之间有关系的概率大于0 999 也就是说 在犯错误的概率不超过0 001的前提下认为它们之间有关系 独立性检验的综合应用判断变量X与Y有无关系的三种方法 1 2 2列联表 由2 2列联表中 ad bc 的大小判断 2 等高条形图 观察条形图中的阴影比例大小判断 3 独立性检验 计算K2的观测值k 再利用临界值的大小判断 其中独立性检验的方法相对较准确 例3 为了调查某生产线上质量监督员甲对产品质量好坏有无影响 现统计数据如下 甲在生产现场时 990件产品中有合格品982件 次品8件 甲不在生产现场时 510件产品中有合格品493件 次品17件 试分别用列联表 等高条形图 独立性检验的方法分析监督员甲对产品质量好坏有无影响 能否在犯错误的概率不超过0 001的前提下 认为质量监督员甲是否在生产现场与产品质量有关 审题指导 本题要求分别用列联表 等高条形图 独立性检验的方法分析 要注意三种方法的判断思路 规范解答 1 2 2列联表如下 由列联表可得 ad bc 982 17 493 8 12750 相差较大 可在某种程度上认为 质量监督员甲是否在现场与产品质量有关系 2 画等高条形图 如图可知 在某种程度上认为 质量监督员甲是否在生产现场与产品质量有关系 3 由2 2列联表中数据 计算得到K2的观测值为因此 在犯错误的概率不超过0 001的前提下 认为质量监督员甲在不在生产现场与产品质量好坏有关系 互动探究 将本题中的产品质量问题改为成绩优秀问题 某校高三年级在一次全年级的大型考试中 数学成绩优秀和非优秀的学生中物理 化学 总分也为优秀的人数如下表所示 则数学成绩优秀分别与物理 化学 总分也优秀哪个关系较大 注 该年级此次考试中数学成绩优秀的有360人 非优秀的有880人 解析 1 列出数学与物理优秀的2 2列联表将表中数据代入公式得观测值k1 270 1143 2 列出数学与化学优秀的2 2列联表将表中数据代入公式计算得观测值k2 240 6112 3 列出数学与总分优秀的2 2列联表 将表中数据代入公式计算得观测值k3 486 1225 由上面分析可知 数学成绩优秀分别与物理 化学 总分优秀都有关系 经计算观测值都大于6 635 说明在犯错误的概率不超过0 01的前提下 认为数学优秀分别与物理 化学 总分优秀都有关系 k3 k1 k2 与总分关系最大 物理次之 典例 12分 1 下表是某地区的一种传染病与饮用水的调查表 这种传染病是否与饮用水的卫生程度有关 请说明理由 2 若饮用干净水得病5人 不得病50人 饮用不干净水得病9人 不得病22人 按此样本数据分析这种疾病是否与饮用水有关 并比较两种样本在反映总体时的差异 审题指导 1 根据表中的信息计算K2的观测值 并根据临界值表来分析相关性的大小 对于 2 要列出2 2列联表 方法同 1 规范解答 1 假设H0 传染病与饮用水无关 把表中数据代入公式得 K2的观测值 54 21 3分 54 21 10 828 所以拒绝H0 因此在犯错误的概率不超过0 001的前提下认为该地区这种传染病与饮用不干净水有关 5分 2 依题意得2 2列联表 此时 K2的观测值 5 785 9分由于5 785 2 706所以在犯错误的概率不超过0 1的前提下认为该种疾病与饮用不干净水有关 10分 两个样本都能统计得到传染病与饮用不干净水有关这一相同结论 但 1 中在犯错误的概率不超过0 001的前提下肯定结论的正确性 2 中在犯错误的概率不超过0 1的前提下肯定结论的正确性 12分 误区警示 对解答本题时易犯错误具体分析如下 即时训练 某高校 统计初步 课程的教师随机调查了一些学生的专业情况 得到如下2 2列联表 单位 名 为了判断主修统计专业是否与性别有关系 根据表中的数据计算得到K2的观测值k 4 84 因为k 3 841 所以认为 主修统计专业与性别有关系 这种判断出错的可能性为 解析 由k 4 84 可知我们有95 的把握认为 主修统计专业与性别有关系 故判断出错的可能性为5 答案 5 1 在研究吸烟与患肺癌的关系中 通过收集数据 整理分析数据得 吸烟与患肺癌有关 的结论 并且在犯错误的概率不超过0 01的前提下认为这个结论是成立的 下列说法中正确的是 A 100个吸烟者中至少有99人患有肺癌 B 1个人吸烟 那么这个人有99 的概率患有肺癌 C 在100个吸烟者中一定有患肺癌的人 D 在100个吸烟者中可能一个患肺癌的人也没有 解析 选D 独立性检验的结果与实际问题有差异 即独立性检验的结论是一个数学统计量 它与实际问题中的确定性存在差异 2 分类变量X和Y的列联表如下 则 A ad bc越小 说明X与Y的关系越弱 B ad bc越大 说明X与Y的关系越强 C ad bc 2越大 说明X与Y的关系越强 D ad bc 2越接近于0 说明X与Y的关系越强 解析 选C 由K2的计算公式可知 ad bc 2越大 则K2越大 故相关关系越强 3 若由一个2 2列联表中的数据计算得K2 4 013 则两个变量有关系的概率为 解析 因随机变量K2的观测值k 4 013 3 841 所以在犯错误的概率不超过0 05的前提下 认为两个变量有关系 答案 0 95 4 根据下表计算k 解析 根据列联表中的数据得K2的观测值 1 78 答案 1 78 5 运动员参加比赛前往往做热身
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学英语高分作文写作方法
- 幼儿园亲子互动游戏设计案例
- 智能制造行业技术需求分析报告
- 小学英语期末复习知识点
- 高校英语听力教学方法与实践探索
- 销售渠道拓展与合作协议范文
- 企业员工分红激励方案模板
- 企业市场推广策划方案模板与案例分析
- 中学免疫学重点知识梳理笔记
- 润滑油质量保证体系建设方案
- 2025年北森潜力测评试题及答案
- 2025银行招聘试题及答案详解
- 腾讯新员工培训
- 2025年成人高考高升专试题(含答案)
- 实验室生物安全管理制度完整版
- 层林尽染枫叶红课件
- 车管所备案申请书
- 河南成人2024学位英语考试真题及答案
- 2025年淮南市大通区和寿县经开区公开招聘社区“两委”后备干部30名考试参考试题及答案解析
- 长期照护师培训考核试卷及答案
- 医院感染监测
评论
0/150
提交评论