




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 2独立性检验的基本思想及其初步应用 自主学习 新知突破 1 了解分类变量 列联表的含义 会作2 2列联表 2 了解随机变量k2的含义以及观测值k的计算公式 3 了解独立性检验的基本思路及其初步应用 饮用水的质量是人类普遍关心的问题 据统计 饮用优质水的518人中 身体状况优秀的有466人 饮用一般水的312人中 身体状况优秀的有218人 人的身体健康状况与饮用水的质量之间有关系吗 1 分类变量变量的不同 值 表示个体所属的 像这样的变量称为分类变量 分类变量和列联表 不同类别 2 列联表 1 定义 列出的两个分类变量的 称为列联表 2 2 2列联表一般地 假设有两个分类变量x和y 它们的取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称2 2列联表 为 频数表 1 分类变量及其关系的分析的理解 1 这里的 变量 和 值 都应作为广义的变量和值来理解 只要不属于同种类别都是变量和值 并不一定是取具体的数值 如 男 女 上 下 左 右等 2 频数分析是指用不同类别的事件发生的频率的大小比较来分析分类变量是否有关联关系 3 等高条形图更加形象直观地反映两个分类变量之间的差异 进而推断它们之间是否具有关联关系 1 等高条形图与表格相比 更能直观地反映出两个分类变量间是否 常用等高条形图展示列联表数据的 2 观察等高条形图发现 和 相差很大 就判断两个分类变量之间有关系 等高条形图 相互影响 频率特征 2 绘制等高条形图时 列联表的行对应的是高度 两行的数据不相等 但对应的条形图的高度是相同的 两列的数据对应不同的颜色 独立性检验 3 独立性检验思想的理解及常用的几个数值 1 独立性检验的基本思想类似于数学中的反证法 要确认两个分类变量有关系这一结论成立的可信程度 首先假设该结论不成立 即假设结论 两个分类变量没有关系 成立 在该假设下我们构造的随机变量k2应该很小 如果由观测数据计算得到的k2的观测值很大 则在一定程度上说明假设不合理 根据随机变量k2的含义 可以通过p k2 6 635 0 01来评价假设不合理的程度 由实际计算得k2的观测值k 6 635 说明假设不合理的程度约为99 即两个分类变量有关系这一结论成立的可信程度为99 2 在实际问题中要记住以下几个常用值 若k 6 635 则在犯错误的概率不超过0 01的前提下认为 x与y有关系 若k 3 841 则在犯错误的概率不超过0 05的前提下认为 x与y有关系 若k 2 706 则在犯错误的概率不超过0 1的前提下认为 x与y有关系 若k 2 706 则认为没有充分证据显示 x与y有关系 1 下面是一个2 2列联表 则表中a b处的值分别为 a 94 96b 52 50c 52 60d 54 52解析 a 21 73 a 52 又b a 8 52 8 60 故选c 答案 c 2 对两个分类变量进行独立性检验的主要作用是 a 判断模型的拟合效果b 对两个变量进行相关分析c 给出两个分类变量有关系的可靠程度d 估计预报变量的平均值解析 独立性检验的目的是明确两个分类变量有关系的可靠程度 答案 c 解析 k2是用来判断两个分类变量是否有关的随机变量 所以 错 k2的值越大 只能说明我们有更大的把握认为二者有关系 却不能判断相关性的大小 错 中 ad bc 应为 ad bc 2 答案 4 某班主任对全班50名学生进行了作业量多少的调查 喜欢玩电脑游戏的同学认为作业多的有18人 认为作业不多的有9人 不喜欢玩电脑游戏的同学认为作业多的有8人 认为作业不多的有15人 1 请根据所给数据 列出2 2列联表 2 喜欢玩电脑游戏与认为作业多有关系的把握大约是多少 解析 1 根据题意 列出2 2列联表如下 合作探究 课堂互动 利用等高条形图判断分类变量间的关系 2012年5月1日起我国对醉驾列入法律 交通事故明显降低 现从发生交通事故的司机中抽取2000名司机的随机样本 根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下 1 试作出相应的等高条形图 2 结合等高条形图分析血液中含有酒精与对事故负有责任是否有关系 思路点拨 1 相应的等高条形图如图 2 图中两个深色条的高分别表示司机血液中有酒精和无酒精样本中对事故负有责任的频率 从图中可以看出 司机血液中有酒精样本中对事故负有责任的频率明显高于司机血液中无酒精样本中对事故负有责任的频率 由此可以认为司机血液中含有酒精与对事故负有责任有关系 2 分析分类变量关系的步骤 1 作大量的调查 研究 统计出结果 2 列出列联表利用频率粗略估计 3 作出等高条形图 从直观上进一步判断分类变量之间的关联关系 特别提醒 通过等高条形图可以粗略地判断两个分类变量是否有关系 但无法精确地给出所得结论的可靠程度 1 在一次恶劣气候的飞行航程中 调查男女乘客在机上晕机的情况如下表所示 据此资料你是否认为在恶劣气候飞行中男性比女性更容易晕机 解析 由数据的列联表可以得到等高条形图为 从图中可以发现男性中晕机的频率与女性中晕机的频率相差较大 故我们认为性别和是否晕机有关系 且在恶劣气候飞行中男性比女性更容易晕机 利用随机变量k2判断分类变量间的关系 在调查的480名男士中有38名患有色盲 520名女士中有6名患有色盲 利用独立性检验的方法来判断色盲与性别是否有关 你所得的结论在什么范围内有效 根据题目所给的数据作出如下的列联表 4分 利用随机变量k2判断两分类变量是否有关系的方法 2 某电视台联合相关报社对 男女同龄退休 这一公众关注的问题进行了民意调查 数据如下表所示 根据表中数据 能否在犯错误的概率不超过0 001的前提下认为这一问题的看法与性别有关系 p k2 10 828 0 001 独立性检验的综合应用 为了调查某生产线上质量监督员甲对产品质量的好坏有无影响 现统计数据如下 甲在生产现场时 990件产品中有合格品982件 次品8件 甲不在生产现场时 510件产品中有合格品493件 次品17件 试分别用列联表 等高条形图 独立性检验的方法分析监督员甲对产品质量的好坏有无影响 能否在犯错误的概率不超过0 001的前提下 认为质量监督员甲在不在生产现场与产品质量的好坏有关系 思路点拨 解析 1 2 2列联表如下 由列联表可得 ac bd 982 17 493 8 12750 相差较大 可在某种程度上认为 质量监督员甲是否在生产现场与产品质量有关 2 由等高条形图可知 在某种程度上认为 质量监督员甲是否在生产现场与产品质量有关系 判断两个分类变量之间有无关系 可以用2 2列联表 等高条形图 独立性检验等方法作出判断 其中从列联表和等高条形图中只能粗略地进行估计 要进行精确的判断 必须利用独立性检验进行计算并与临界值对比 3 调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况 获数据如下 1 判断吸烟习惯与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 快递员数字化技能考核试卷及答案
- 电气设备装配效率提升工艺考核试卷及答案
- 索道滑轮组装质量控制工艺考核试卷及答案
- 草坪园艺师入职考核试卷及答案
- 玉米技术员考试题及答案
- 室内装潢公司劳动协议
- 银行中层面试题及答案
- 银行招聘考试题型及答案
- 【课件】全等三角形及其性质++课件+++2025-2026学年人教版数学八年级上册+
- 维修类专业试题及答案
- 辽宁省沈阳市2025-2026学年七年级上学期第一次月考数学试卷(含答案)
- 小学生日常行为规范知识竞赛试题(附答案)
- 2025年食品安全员考试题库及答案
- 民宿入住免责协议书范本
- 岭南版小学美术四年级上学期教学进度计划
- 管廊运维招聘题库及答案
- 江西省2025年高考物理真题及答案解析
- 2025年广东卷物理高考试卷(原卷+答案)
- 污水处理站运行记录台账范本
- 天坛建筑结构讲解
- 兼顾电网脆弱性与经济性的PMU配置策略深度剖析
评论
0/150
提交评论