




已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3.2独立性检验的基本思想及其初步应用1了解分类变量、22列联表、随机变量K2的意义2通过对典型案例的分析,了解独立性检验的基本思想方法(重点)3通过对典型案例的分析,了解两个分类变量的独立性检验的应用(难点)基础初探教材整理1列联表和等高条形图阅读教材P91P94,完成下列问题1分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的频数表称为列联表22列联表一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为y1y2总计x1ababx2cdcd总计acbdabcd2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征(2)观察等高条形图发现和相差很大,就判断两个分类变量之间有关系1下面是22列联表:y1y2总计x1a2173x222527总计b46则表中a,b的值分别为_【解析】a2173,a52.又a2b,b54.【答案】52542下面的等高条形图可以说明的问题是_(填序号)图321“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的;“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同;此等高条形图看不出两种手术有什么不同的地方;“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握【答案】3下列说法正确的有_(填序号)分类变量的取值仅表示个体所属的类别,它们的取值一定是离散的;分类变量的取值也可以用数字来表示,但这时的数字除了分类以外没有其他的含义;22列联表是两个分类变量的频数汇总统计表;22列联表和等高条形图都能反映出两个分类变量间是否相互影响【解析】由分类变量的定义可知正确;由22列联表的定义可知正确;22列联表和等高条形图都能展示样本的频率特征,若在一个分类变量所取值的群体中,另一个分类变量所取值的频率相差较小,则说明这两个变量不相互影响,否则就相互影响故正确【答案】教材整理2独立性检验阅读教材P93P96,完成下列问题1定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验2K2,其中nabcd为样本容量3独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”1若由一个22列联表中的数据计算得K24.013,那么有_的把握认为两个变量之间有关系【解析】查阅K2表知有95%的把握认为两个变量之间有关系【答案】95%2考察棉花种子经过处理与生病之间的关系,得到下表中的数据:种子处理种子未处理总计得病32101133不得病61213274总计93314407根据以上数据可得出种子是否经过处理与是否生病_(填“有关”或“无关”). 【导学号:97270061】【解析】k0.16410.828,因此在犯错误的概率不超过0.001的前提下认为实施西部开发战略的公布对应届大学毕业生的选择产生了影响探究共研型独立性检验与统计的综合应用探究1从容量为400人的中年人与容量为100人的老年人中抽出50人去体检某项健康指标,若采取分层抽样方法,应从中抽取老年人为多少人?【提示】10010(人)探究2高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”下表是一次针对高三文科学生的调查所得的数据:总成绩好总成绩不好总计数学成绩好478a490数学成绩不好39924423总计bc913你能求出a,b,c的值吗?该问题中有几个分类变量?它们的取值分别是什么?【提示】a12,b877,c36.该问题中有“总成绩”和“数学成绩”两个分类变量;“总成绩”的取值有“总成绩好”与“总成绩不好”两个值,“数学成绩”的取值也有“好”与“不好”两个值探究3在探究2中,你认为文科学生总成绩不好与数学成绩不好有关系吗?【提示】由探究2计算随机变量K2的观测值:k6.2335.024,P(k5.024)0.025,在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与数学成绩不好有关系(2016黄冈高二检测)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品,从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)频数126386182分组30.02,30.06)30.06,30.10)30.10,30.14)频数92614乙厂:分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)频数297185159分组30.02,30.06)30.06,30.10)30.10,30.14)频数766218(1)试分别估计两个分厂生产零件为优质品的概率;(2)由以上统计数据填下面22列联表,并问能否有99%的把握认为“两个分厂生产的零件的质量有差异”甲厂乙厂总计优质品非优质品总计【精彩点拨】解答本题先由各组及频数求出优质品的概率,然后完成列联表,最后判断两个变量是否相互独立【自主解答】(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为100%72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为100%64%.(2)甲厂乙厂总计优质品360320680非优质品140180320总计5005001 000由表中数据得k7.356.635,因此,有99%的把握认为“两个分厂生产的零件的质量有差异”解决独立性检验与统计综合应用的步骤1认真审题、弄清所求问题中的两个分类变量是什么,它们的取值分别是什么2充分利用统计知识,完成22列联表3利用独立性检验判断两分类变量间的关系再练一题3某学生对其亲属30人的饮食进行了一次调查,并用如图322所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)图322(1)根据以上数据完成下列22列联表:主食蔬菜主食肉类总计50岁以下50岁以上总计(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?并写出简要分析【解】(1)22列联表如下:主食蔬菜主食肉类总计50岁以下481250岁以上16218总计201030(2)因为K2106.635,P(K26.635)0.01,所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关构建体系 1对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()Ak越大,“X与Y有关系”的可信程度越小Bk越小,“X与Y有关系”的可信程度越小Ck越接近于0,“X与Y没有关系”的可信程度越小Dk越大,“X与Y没有关系”的可信程度越大【解析】k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,k越小,“X与Y有关系”的可信程度越小【答案】B2下面是调查某地区男女学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图323中可以看出()图323A性别与喜欢理科无关B女生中喜欢理科的比为80%C男生比女生喜欢理科的可能性大些D男生不喜欢理科的比为60%【解析】由题图知女生中喜欢理科的比为20%,男生不喜欢理科的比为40%,故A,B,D错误,C正确男生比女生喜欢理科的可能性大些【答案】C3在一个22列联表中,由其数据计算得K213.097,认为两个变量有关系犯错误的概率不超过_【解析】如果K2的观测值k6.635时,认为“两变量有关系”犯错误的概率不超过0.01.【答案】0.014给出下列实际问题:一种药物对某种病的治愈率;两种药物治疗同一种病是否有区别;吸烟者得肺病的概率;吸烟人群是否与性别有关系;网吧与青少年的犯罪是否有关系其中用独立性检验可以解决的问题有_(填序号) 【导学号:97270062】【解析】独立性检验主要是对两个分类变量是否有关系进行检验,主要涉及两种变量对同一种事物的影响,或者是两种变量在同一问题上体现的区别等【答案】5调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人(1)将下面的22列联表补充完整;晚上白天总计男婴女婴总计(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?【解】(1)晚上白天总计男婴243155女婴82634总计325789(2)由所给数据计算K2的观测值k3.6892.706.根据临界值表知P(K22.706)0.10.因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系我还有这些不足:(1) (2) 我的课下提升方案:(1) (2) 学业分层测评(建议用时:45分钟)学业达标一、选择题1通过对K2的统计量的研究得到了若干个临界值,当K22.706时,我们认为()A在犯错误的概率不超过0.05的前提下认为X与Y有关系B在犯错误的概率不超过0.01的前提下认为X与Y有关系C没有充分理由认为X与Y有关系D不能确定【解析】K22.706,没有充分理由认为X与Y有关系【答案】C2下列关于等高条形图的叙述正确的是()A从等高条形图中可以精确地判断两个分类变量是否有关系B从等高条形图中可以看出两个变量频数的相对大小C从等高条形图中可以粗略地看出两个分类变量是否有关系D以上说法都不对【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错在等高条形图中仅能够找出频率,无法找出频数,故B错【答案】C3分类变量X和Y的列联表如下:y1y2总计x1ababx2cdcd总计acbdabcd则下列说法正确的是()Aadbc越小,说明X与Y关系越弱Badbc越大,说明X与Y关系越弱C(adbc)2越大,说明X与Y关系越强D(adbc)2越接近于0,说明X与Y关系越强【解析】对于同一样本,|adbc|越小,说明X与Y之间关系越弱;|adbc|越大,说明X与Y之间的关系越强【答案】C4利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是()Ak6.635Bk6.635Ck7.879 Dk6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误其中说法正确的是_(填序号)【解析】K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法不正确;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确【答案】三、解答题9用两种检验方法对某食品做沙门氏菌检验,结果如下表阳性阴性总计荧光抗体法1605165常规培养法264874总计18653239附:P(K2k0)0.0100.0050.001k06.6357.87910.828(1)利用图形判断采用荧光抗体法与检验结果呈阳性是否有关系;(2)能否在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系?【解】(1)作出等高条形图如图所示,由图知采用荧光抗体法与检验结果呈阳性有关系(2)通过计算可知K2113.184 6.而查表可知,因为P(K210.828)0.001,而113.184 6远大于10.828,所以在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系10有人发现一个有趣的现象,中国人的邮箱里含有数字比较多,而外国人邮箱名称里含有数字比较少,为了研究国籍和邮箱名称里含有数字的关系,他收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字(1)根据以上数据建立22列联表;(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?【解】(1)22的列联表:中国人外国人总计有数字432770无数字213354总计6460124(2)假设“国籍和邮箱名称里与是否含有数字无关”由表中数据得k6.201.因为k5.024,所以有理由认为假设“国籍和邮箱名称里与是否含有数字无关”是不合理的,即在犯错误的概率不超过0.025的前提下认为“国籍和邮箱名称里与是否含有数字有关”能力提升1对两个分类变量A,B,下列说法中正确的个数为()A与B无关,即A与B互不影响;A与B关系越密切,则K2的值就越大;K2的大小是判定A与B是否相关的唯一依据A1B2C3D0【解析】正确,A与B无关即A与B相互独立;不正确,K2的值的大小只是用来检验A与B是否相互独立;不正确,也可借助等高条形图等故选A.【答案】A2(2016晋江市季延中学期中)某研究所为了检验某血清预防感冒的作用,把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用22列联表计算得K23.918,经查临界值表知P(K23.841)0.05.则下列叙述中正确的是()A有95%的把握认为“这种血清能起到预防感冒的作用”B若有人未使用该血清,那么他一年中有95%的可能性得感冒C这种血清预防感冒的有效率为95%D这种血清预防感冒的有效率为5%【解析】K23.9183.841,因此有95%的把握认为“这种血清能起到预防感冒的作用”,故选A.【答案】A3为研究
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 税法相关的国际条约试题及答案
- 了解持续交付与敏捷开发的实践案例试题及答案
- VB API调用的基本问题及答案
- Photoshop中实现全局颜色调整的方法试题及答案
- 丰富案例分享2025年计算机二级VB考试试题及答案
- 汉字的演讲艺术试题及答案
- 影响2025年逻辑考试的关键因素试题及答案
- WPS云端存储指南试题及答案
- 现代汉语考试中的案例分析试题及答案
- 关键词与计算机二级VB考试的试题及答案对照
- 转动机械找对轮找中心(有图、有公式)课件
- 天然气管道阴极保护共66张课件
- 大学学院成绩表模板
- 厨房知识考题切配答案
- 《电机学》课程思政教学设计案例(一等奖)
- 生物化学技术基本原理和应用
- 浙江省大中型水库控制运用计划编制导
- 消防安全有关的重点工种人员及消防安全管理
- APG IV 系统(修订版)
- OPEN-3000系统安装操作系统及公共软件-LINUX分册(redhat-5.4)—20120713(1)
- 常见保温材料传热系数及修正系数#(精选.)
评论
0/150
提交评论