版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4节列联表与独立性检验【课标要求】(1)掌握分类变量的含义;(2)通过实例,理解2×2列联表的统计意义;(3)通过实例,了解独立性检验的基本思想、方法及其简单应用.知识点一分类变量与列联表1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.2×2列联表列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数,n是样本容量,其样本频数列联表(称为2×2列联表)如表所示:XYabCd(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征;0相差很大,就判断两个分类变量之间有关系.(2)如果通过直接计算或等高堆积条形图发和相差很大,就判断两个分类变量之间有关系.(2)如果通过直接计算或等高堆积条形图发【例1】(1)〔多选〕根据如图所示的等高堆积条形图,下列叙述正确的是(ABC)ll□不患肺病□患肺病A.吸烟患肺病的频率约为0.2B.吸烟不患肺病的频率约为0.8C.不吸烟患肺病的频率小于0.05解析:(1)从等高堆积条形图上可以明显地看出,吸烟患肺病的频率远远大于不吸烟患肺病的频率.都abCd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(D)越弱;Iad-bc|越大,说明x与y之间的关系越强,经过逐一验证,可知选D.练1(1)(2024·江西模拟)在某次独立性检验中,得到如下列联表:AA合计BBa合计最后发现,两个分类变量没有关联,则a的值可能是(B)A.200B.720C.100XY2a7bnmS1.概念:利用随机变量x²的取值推断分类变量X和Y是否独立的方法称为x²独立性检验,读作“卡方独立性检验”,简称独立性检验.3.基于小概率值a的检验规则:当x²≥x。时,我们就推断H₀不成立,即认为X和Y不独立,该推断犯错误的概率不超过a;当x²<x。时,我们没有充分证据推断H₀不成立,可以认为X和Y独立(其中xa为a的临界值).4.独立性检验中几个常用的小概率值和相应的临界值:a角度1分类变量关联性的判断【例2】(1)(2024·盐城模拟)根据分类变量I与Ⅱ的统计数据,计算得到x²=2.954,则(B)aB.变量I与Ⅱ相关,这个结论犯错误的概率不超过0.1C.变量I与Ⅱ不相关D.变量I与Ⅱ不相关,这个结论犯错误的概率不超过0.1解析:(1)零假设为Ho:变量I与Ⅱ不相关,因为x²=2.954>2.706,依据a=0.1的独立性检验可知,推断H₀不成立,即认为变量I与Ⅱ相关,这个结论犯错误的概率不超过0.1,故选B.(2)根据分类变量X和Y的样本观察数据的计算结果,有不少于95%的把握认为X和Y有关,则x²的值不可能aA.2.819B.5.512解析:(2)因为有不少于95%的把握认为X和Y有关,所以x²≥3.841,只有A不满足要求.故选A.规律方法分类变量关联性的判断如果x²≥xa,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过a的前提下不能推断“X与Y有关系”,或者在样本数据中没有充分证据支持结论“X与Y有关系”.角度2独立性检验的应用【例3】在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):未被某病毒感染未注射疫苗(1)补全2×2列联表(单位:只);未被某病毒感染未注射疫苗(2)零假设为Ho:“给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果”.Xa;(2)规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优秀”.强化训练是否优秀非优秀强化训练前强化训练后将上面的表格补充完整,依据小概率值a=0.005的独立性检验,能否据此推断跳水运动员是有关?解:(1)强化训练后的平均成绩约为55×0.04+65×0.16+75×0.2+85×0.32+95×0.28=81.4(分).由于前三组频率之和为0.04+0.16+0.2=0.4,设中位数为80+x,则0.032x=0.1,解得x=3.125,所以中位数约为83.13.(2)零假设为Ho:跳水运动员是否优秀与强化训练无关.是否优秀非优秀强化训练后认为跳水运动员是否优秀与强化训练有关.课时跟踪检测1.在研究打鼾与患心脏病的关系中,通过收集错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个吸烟者中至少有99人打鼾B.1个人患有心脏病,那么这个人有99%的概率打鼾C.在100个心脏病患者中一定有打鼾的人D.在100个心脏病患者中可能一个打鼾的人也没有解析:D在犯错误的概率不超过0.01的前提下认为这个结论是成立的,其意义就是我们有99%的把握认为打鼾与患心脏病有关,在100个心脏病患者中可能一个打鼾的人也没有,故D正确;对于A,题设中没有给出吸烟与打鼾相关性判断,故A错误;对于B,独立性检验是对分类变量相关性的判断,不能具体到个体,故B错误;对于C,在100个心脏病患者中可能一个打鼾的人也没有,故C错误.故选D.2.为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联是否喜欢体育锻炼性别男女喜欢ab不喜欢CA.7C.9解析:C根据题意,可得c=120-73-25=22,a=74-23.(2025·黑龙江一模)根据分类变量x与y的成对样本数据,计算得x²=2.826,依据a=0.05的独立性检验,结论为()A.x与y不独立B.x与y不独立,这个结论犯错误的概率不超过0.05D.x与y独立,这个结论犯错误的概率不超过0.05解析:C零假设为Ho:x与y独立,由x²=2.826<3.841,依据a=0.05的独立性检验,可得Ho成立,故可以认为x与y独立.故选C.4.已知某独立性检验中,日,n=a+b+c+d计算出x²=x²,若将2×2列联表中的数据a,b,c,d分别变成2a,2b,2c,2d,计算出的x²=x2,则()A.χ₂=χ₁²B.x²=2xiC.x²=2x25.(2025·菏泽一模)足球是一项大众喜爱的运动,为了解喜爱足球是否与性别有关,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,则被调查的男性人数至A.10B.11C.12解析:C设被调查的男性人数为x,则女性人数为2x,依据题意可得列联表如下:是否喜爱足球性别男性女性喜爱足球不喜爱足球x由表中数据得x=.因为本次调查得出“在犯错与性别有关”的结论,所以有即,解得x≥11.8185,又因为上述列联表中的所有数字均为整数,故x的最小值为12.二、多项选择题6.每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两家公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具体数据如下:公司文史男理工男理工女甲乙5分析毕业生的选择意愿与性别的关联关系时,已知对应的x²的值xi≈1.010;分析毕业生的选择意愿与专业的关联关系时,对应的x²的值x₂≈9.091,则下列说法正确的是()A.有99.9%的把握认为毕业生的选择意愿与专业相关联B.毕业生在选择甲、乙公司时,选择意愿与专业的关联性比与性别的关联性更大一些C.理工科专业的毕业生更倾向于选择甲公司D.女性毕业生更倾向于选择乙公司更倾向于选择乙公司,所以C,D均正确.故选B、C、D.100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则()A.高中M的前50名学生中有60%的学生学习效率高B.高中N的前50名学生中有40%的学生学习效率高C.有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关D.认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率超过0.05解析:AC高中M的前50名学生中有30人学习效率高,即,所以A正确.这100名学生中学习效率高的学生有100×0.4=40(人),高中N的前50名学生中有10人学习效率高,即,所以B错误,故根据题意列出列联表如下:学校学习效率高低学习效率高学习效率不高高中M高中N0不支持男生女生若通过计算得,根据小概率值α=0.05的独立性检验,认为支持增加中学生体育锻炼时间的政策与性别有关,则优级品合格品不合格品总计甲车间0乙车间2总计2优级品非优级品甲车间乙车间能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?(2)已知升级改造前该工厂产品的优级品率p=0.5.设节为升级改造后抽取的n件产品的优级品率,如果p>p+则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(√150≈12.247)解:(1)填写如下列联表:优级品非优级品甲车间乙车间优级品非优级品总计甲车间乙车间总计因为x²=4.6875>3.841,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异;因为x²=4.6875<6.635,所以没有99%的把握认为甲、乙两车间产品的优级品率存在差异.(2)由题意可知所以能认为生产线智能化升级改造后,该工厂产品的优级品率提高了.11.为了了解空气质量指数(AQI)与参加户外健身运动的人数之间的关系,某校环保小组在暑假期间(60天)进行了一项统计活动:每天记录到体育公园参加户外健身运动的人数,并与当天AQI值(从气象部门获取)构成60组成对数据(x;,y;)(i=1,2,…,60),其中x;为当天参加户外健身运动的人数,y为当天的AQI值,并制作了如下散点图:806004050607080901001101环保小组发现散点有分区聚集的特点,尝试作聚类分析.用直线x=100与y=100将散点图分成I、Ⅱ、Ⅲ、IV四个区域(如图),统计得到各区域的点数分别为5,10,10,35,并初步认定“参加户外健身运动的人数不少于100与AQI值不大于100有关联”,则该“初步认定”犯错误的概率范围是_(0.001,0.005)·解析:根据散点图,建立2×2列联表为人数<100人数≥100则.因为7.87
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 孤独症儿童的教育与康复训练
- 企业财务基础全员培训纲要
- 肥胖症常见症状及护理实操培训
- 生产新员工入职培训大纲
- 英山企业获客策略解析
- 工作方法与技巧
- 急性阑尾炎治疗原则及方法
- 钳形表的使用方法
- 教育创新理念与实践路径
- 民营企业员工法制教育
- GB/T 45762-2025精细陶瓷室内照明环境下半导体光催化材料测试用光源
- 医院末位淘汰管理办法
- 公司设计合同管理办法
- 2025年贵南县公安局招聘警务辅助人员考试试题
- 四川省公需科目(超全):2025年度四川省专业技术人员继续教育考试题库
- 学堂在线 新闻摄影 期末考试答案
- 耳鸣患者护理课件
- 体育足球教学课件
- 期权开户测试题目和答案
- 养老护理员环境及物品清洁培训
- GB/T 19027-2025质量管理GB/T 19001-2016的统计技术指南
评论
0/150
提交评论