




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.2独立性检验的基本思想及其初步应用1.分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表称为_______.②2×2列联表:必备知识·自主学习导思独立性检验的方法步骤是怎样的?列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d【思考】如何用列联表判定两个分类变量是否有关?提示:利用列联表中计算的|ad-bc|值越小,越独立,两个分类变量关系越弱;|ad-bc|值越大,越不独立,两个分类变量关系越强.2.等高条形图(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)如果直接观察等高条形图发现和相差很大,就判断两个分类变量之间有关系.3.独立性检验定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验公式,其中n=a+b+c+d【思考】独立性检验与反证法有何异同?提示:两者都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指一种不符合逻辑事情的发生;而独立性检验中的“矛盾”是指一种不符合逻辑的小概率事件的发生,即在结论不成立的假设下,推出有利于结论成立的小概率事件发生.【基础小测】1.辨析记忆(对的打“√”,错的打“×”)(1)分类变量中的变量与函数中的变量是同一概念. (
)(2)独立性检验的方法就是反证法. (
)(3)独立性检验中可通过统计表从数据上说明两分类变量的相关性的大小.(
)【基础小测】1.辨析记忆(对的打“√”,错的打“×”)(1)分类变量中的变量与函数中的变量是同一概念. (
)(2)独立性检验的方法就是反证法. (
)(3)独立性检验中可通过统计表从数据上说明两分类变量的相关性的大小.(
)提示:(1)×.变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量,有时可以把分类变量的不同取值用数字表示,但这时的数字除了分类以外没有其他含义,而函数中的变量分为自变量与因变量,都是数的集合,有它们各自的意义.(2)×.独立性检验的思想类似于反证法,但不能说它就是反证法.(3)√.独立性检验是对两个分类变量有关系的可信度的判断,其结论是两个分类变量有关系,这种推断犯错误的概率不超过α,可以通过统计表从数据上进行运算,再进行判断.2.班级与成绩2×2列联表:表示数据m,n,p,q的值应分别为 (
)A.70,73,45,188 B.17,73,45,90C.73,17,45,90 D.17,73,45,45优秀不优秀总计甲班103545乙班738p总计mnq【解析】选B.依据2×2列联表的列法以及各行各列的实际意义,可得m=17,n=73,p=45,q=90.3.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是 (
)A.100个心脏病患者中至少有99人打鼾B.1个人患心脏病,则这个人有99%的概率打鼾C.100个心脏病患者中一定有打鼾的人D.100个心脏病患者中可能一个打鼾的人都没有【解析】选D.这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.【解析】选D.这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.关键能力·合作学习类型一分析两变量间的关系(数据分析)角度1用2×2列联表分析两变量间的关系
【典例】在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用判断二者是否有关系.【思路导引】作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.【解析】2×2列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得=0.671875.=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.角度2用等高条形图分析两变量间的关系
【典例】为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?【思路导引】依据题设要求以及所求,可直接画出等高图,然后再分析即可.【解析】等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.【解题策略】1.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.2.利用等高条形图判断两个分类变量是否相关的步骤(1)统计:收集数据,统计结果.(2)列表:列出2×2列联表,计算频率、粗略估计.(3)绘图:绘制等高条形图,直观分析.3.利用列联表直接计算,如果两者相差很大,就判断两个分类变量之间有关系.4.在等高条形图中展示列联表数据的频率特征,比较图中两个深色条的高可以发现两者频率不一样而得出结论,这种直观判断的不足之处在于不能给出推断“两个分类变量有关系”犯错误的概率.【题组训练】1.观察下列各图,其中两个分类变量x,y之间关系最强的是(
)【解析】选D.在四幅图中,D图中的两个深色条的高相差最明显,说明两个分类变量之间关系最强.2.某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【解析】作列联表如下:所以ad-bc=332×381-213×94=106470.所以ad-bc比较大,说明考前紧张与性格类型有关.性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情紧张与性格类型有关.类型二独立性检验(数据分析)【典例】“中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人对“中国式过马路”的态度是否与性别有关,从马路旁随机抽取30名路人进行了问卷调查,得到了如下列联表:男性女性总计反感10不反感8总计30已知从这30人中随机抽取1人,抽到反感“中国式过马路”的路人的概率是.将上面的列联表补充完整,并据此分析能否在犯错误的概率不超过0.05的前提下认为对“中国式过马路”的态度与性别有关.【思路导引】(1)依据2×2列联表的定义填表;(2)计算K2,查找犯错误的概率不超过0.05的临界值,与此临界值比较大小.【解析】补充完整的列联表如下:因为K2的观测值k=≈1.158<3.841,所以不能在犯错误的概率不超过0.05的前提下认为对“中国式过马路”的态度与性别有关.男性女性总计反感10616不反感6814总计161430【解题策略】独立性检验的步骤(1)确定分类变量,获取样本频数,得到列联表.(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(3)利用公式K2=计算随机变量K2的观测值k.(4)作出判断.如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y的关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.【跟踪训练】1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:积极支持企业改革不太支持企业改革总计工作积极544094工作一般326395总计86103189根据列联表的独立性检验,能否在犯错误的概率不超过0.005的前提下认为员工工作态度与支持企业改革之间有关系?【解析】由列联表中的数据,得K2的观测值为k=≈10.759>7.879,因此,在犯错误的概率不超过0.005的前提下,认为员工工作态度与支持企业改革之间有关系.2.新冠肺炎疫情期间,讲究卫生,垃圾分类已经深入人心,某校通过网络组织了高三年级学生参与“垃圾分类,从我做起”的知识问卷作答,随机抽出男、女各20名同学的问卷进行打分,作出如图所示的茎叶图,成绩大于70分的为“合格”.(1)由以上数据绘制成2×2列联表,能否在犯错误的概率不超过0.05的前提下认为“性别”与“问卷结果”有关?(2)从上述样本中,成绩在60分以下(不含60分)的男女学生问卷中任意选2个,求这2个学生性别不同的概率.男女总计合格不合格总计【解析】(1)根据茎叶图可得由K2的观测值k=≈3.956>3.841知可以在犯错误的概率不超过0.05的前提下认为“性别”与“问卷结果”有关.男女总计合格101626不合格10414总计202040(2)从题干茎叶图可知,成绩在60分以下(不含60分)的男、女学生人数分别是4人和2人,分别用A,B,C,D和E,F表示,基本事件为:AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共有15个,其中性别不同的基本事件有AE,AF,BE,BF,CE,CF,DE,DF,共8个,所求概率为.3.(2020·全国Ⅲ卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K2=人次≤400人次>400空气质量好空气质量不好P(K2≥k)0.0500.0100.001k3.8416.63510.828【解析】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为=0.43,等级为2的概率为=0.27,等级为3的概率为=0.21,等级为4的概率为=0.09.(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
=350.(3)2×2列联表如下:K2的观测值k=≈5.820>3.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.人次≤400人次>400空气质量好3337空气质量不好228课堂检测·素养达标1.为调查中学生近视情况,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力(
)A.平均数B.方差C.独立性检验D.概率【解析】选C.因为平均数描述的是整体水平,方差描述的是数据偏离平均水平的程度,独立性检验是检验两个分类变量之间的相关关系,概率是描述某一事件发生的可能性.所以检验中学生眼睛近视是否与性别有关时应用独立性检验.2.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:心脏病无心脏病秃发20300不秃发5450根据表中数据得到K2的观测值k=≈15.968,因为k>10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为 (
)A.0.1 B.0.05 C.0.025 D.0.001【解析】选D.P(K2>10.828)=0.001.3.下面是一个2×2列联表:则表中a,b处的值分别为________,________.
【解析】因为a+21=73,所以a=52.b=a+8=52+8=60.答案:52
60y1y2总计x1a2173x282533总计b464.在三维柱状图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形高度的乘积相差越大,H1(即两个分类变量有关系)成立的可能性就________.
【解析】主对角线上两个柱形高度的乘积与副对角线上的两个柱形高度的乘积相差越大,H1成立的可能性就越大.答案:越大5.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:由表中的数据,你认为在犯错误的概率不超过多少的前提下可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300【解析】K2的观测值k=≈4.514>3.841,在假设“性别与是否喜欢数学课程之间没有关系”的前提下,K2应该很小,并且P(K2>3.841)≈0.05,而我们所得到的K2的观测值4.514超过3.841,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论是错误的可能性约为0.05,即在犯错误的概率不超过0.05的前提下可以认为“性别与是否喜欢数学课程之间有关系”.Thebestclassroomintheworldisatthefeetofanelderlyperson.世界上最好的课堂在老人的脚下.Havingachildfallasleepinyourarmsisoneofthemostpeacefulfeelingintheworld.让一个孩子在你的臂弯入睡,你会体会到世间最安宁的感觉.Beingkindismoreimportantthanbeingright.善良比真理更重要.Youshouldneversaynotoagiftfromachild.永远不要拒绝孩子送给你的礼物.Sometimesallapersonneedsisahandtoholdandahearttounderstand.有时候,一个人想要的只是一只可握的手和一颗感知的心.Love,nottime,healsallwounds.治愈一切创伤的并非时间,而是爱.Lifeistough,butI'mtougher.生活是艰苦的,但我应更坚强.励志名言请您欣赏5.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:由表中的数据,你认为在犯错误的概率不超过多少的前提下可以认为高中生的性别与是否喜欢数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年医用高频仪器设备项目发展计划
- 小学1-6年级奥数题及答案每日一练
- 2025年血橙提取物化妆品项目发展计划
- 2025年多功能抑尘车项目合作计划书
- 父亲的拥抱阅读答案 父亲让我抱抱你 答案
- 消防设施检测合同范本(2024版)
- 2025年绝缘材料:绝缘套管合作协议书
- 2025年全数字摄影测量系统合作协议书
- 教育法规执行中的挑战与对策
- 2025年PU系列水乳型聚氨酯皮革涂饰剂项目建议书
- 体育审计整改报告范文
- 2021年1月国家开放大学汉语言文学本科《外国文学专题》期末纸质考试试题及答案
- 公司合伙人合同协议书模板7篇
- 煤矸石处置合同范本
- 中暑急救培训课件
- 能源管理体系及节能知识培训课件
- 《SOP编写培训》课件
- 《纺织工艺》课件
- 厨房规范参观流程
- 2025年陕西汉中市略阳县绿色循环经济产业园区管委会招聘笔试参考题库附带答案详解
- 2025年中煤集团招聘笔试参考题库含答案解析
评论
0/150
提交评论