19-202独立性检验的基本思想及其初步应用_第1页
19-202独立性检验的基本思想及其初步应用_第2页
19-202独立性检验的基本思想及其初步应用_第3页
19-202独立性检验的基本思想及其初步应用_第4页
19-202独立性检验的基本思想及其初步应用_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.2独立性检验的基本思想及其初步应用学习目标核心素养1. 理解独立性检验的基本思想及其实施 步骤.(重点)2. 能利用条形图、列联表探讨两个分 类变量的关系.(易混点)3 .了解K2的含义及其应用.(重点)4.通过对数据的处理,来提咼解决实 际问题的能力.(难点)1. 通过学习独立性检验的基本思想,提 升逻辑推理的素养.2. 借助K2公式培养数学运算的素养.3. 借助条形图培养直观想象的素养.自主预习吋SJ新Ml mct 显 jaTWSI読匚新知初探二1. 分类变量及2X 2列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.列联表 定义:列出的两个分类变量

2、的频数表,称为列联表. 2X2列联表:一般地,假设有两个分类变量 X和Y,它们的取值分别为xi, X2和yi, y2,其样本频数列联表(称为2X 2列联表)为:y1y2总计X1aba+ bX2cdc+ d总计a+ cb+ da+ b+ c+ d2等高条形图(1)等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相 互影响,常用等高条形图展示列联表数据的频率特征.ac(2) 观察等高条形图发现計b和*相差很大,就判断两个分类变量之间有 关系.3.独立性检验n(ad bcf(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立 性检验.a+ b+ c+ d.其中n =a+

3、 b c+ d a+ c b+ d (3) 独立性检验的具体做法根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率 的上界a然后查表确定临界值 利用公式计算随机变量K2的观测值k. 如果kko,就推断“ X与丫有关系”,这种推断犯错误的概率不超过 a 否则就认为在犯错误的概率不超过 a的前提下不能推断“ X与丫有关系”,或者 在样本数据中没有发现足够证据支持结论“ X与丫有关系”.思考:有人说:“我们有99%的把握认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗?为什么?提示观点不正确.99%的把握说明的是吸烟与患肺癌有关的程度,不是患 肺癌

4、的百分数.壬初试身手1 .下列变量中不属于分类变量的是()A .性别B .吸烟C.宗教信仰D .国籍B “吸烟”不是分类变量,“是否吸烟”才是分类变量.故选B.2. 下面是一个2X 2列联表:y1y2总计X1a2173X282533总计b46则表中a, b处的值分别为.52,60 v a + 21 = 73,二 a = 52.b = a + 8 = 52+ 8 = 60.14不看电视看电视男3785女351433 根据下表计算:K2的观测值(保留3位小数).2300X 37 X 143- 85 X 35 24. 514k=122X 178X 72X 2284.514.合作探究煨羞春H 乂 UO

5、T 丸 NJ 1 l;Tl$ U用2X2列联表分析两变量间的关系建型2【例1】 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为 主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用誌c与佔判断二者是否有关系.解2X 2列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以疏采为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得aa+ b4344- .671 875cc+ d2760=0.45.显然

6、二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与 年龄有关系._規H*右IA1 作2X2列联表时,关键是对涉及的变量分清类别注意应该是4行4列,计算时要准确无误.2.利用2X2列联表分析两变量间的关系时,首先要根据题中数据获得2X2 列联表,然后根据频率特征,即将 一与一J或与的值相比,直观地a+b c+ di a+b c+d丿反映出两个分类变量间是否相互影响,但方法较粗劣.跟踪训练1.假设有两个分类变量X与丫,它们的可能取值分别为XI, X2和yi,呵,其2X2列联表为:y1y2X11018X2m26则当m取下面何值时,X与丫的关系最弱()A. 8B . 9C. 14D. 19

7、C 由10X 26 18m,解得m 14.4,所以当m= 14时,X与Y的关系最弱.用等高条形图分析两变量间的关系类型2丿【例2】为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?解等高条形图如图所示:塞中秦病人 对册蛆其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异 明显,因此铅中

8、毒病人与尿棕色素为阳性有关系规H*方梏利用等高条形图判断两个分类变量是否相关的步骤働跟踪训练2.如图所示的是调查某地区男、女中学生喜欢理科的等高条形图,阴影部 分表示喜欢理科的百分比,从图中可以看出()876543210 o.o.o.o.o.oado.A .性别与喜欢理科无关B. 女生中喜欢理科的比例约为 80%C. 男生比女生喜欢理科的可能性大些D 男生中不喜欢理科的比例约为 60%C 由题图可知女生中喜欢理科的比例约为 20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.故选C.用K2进行独立性检验类型3丿- _ 探究问题1 .在K2运算后,得到K2的值为29.78

9、,在判断变量相关时,P(K26.635)0.01和P(K2 7.879) 0.005,哪种说法是正确的?提示:两种说法均正确.P(K26.635) 0.01的含义是在犯错误的概率不超 过0.01的前提下认为两个变量相关;而 P(K2 7.879) 0.005的含义是在犯错误 的概率不超过0.005的前提下认为两个变量相关.2.你能说一下用K2进行独立性检验的依据吗?提示:独立性检验的基本思想类似于数学中的反证法 .先假设“两个分类变 量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2 越大,两个分类变量有关系的可能性越大.【例3】随着生活水平的提高,人们的休闲方式也发

10、生了变化.某机构随2机调查了 n个人,其中男性占调查人数的2.已知男性中有一半的人的休闲方式是51运动,而女性中只有3的人的休闲方式是运动.(1) 完成下列2X 2列联表:运动非运动总计男生女生总计n(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有 关”,那么本次被调查的人数至少有多少?思路探究:(1)依据2X2列联表的定义填表;(2) 计算K母题探究1. (变结论)根据的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 解根据的结论,本次被调查的人中,至少有5X 140= 56(人)的休闲方,利用临界值建立不等关系,求n的值.解(1)补全2X2列联表如下:运动非运

11、动总计男性15n15n25n女性15n25n35n总计25n35nn(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,则 P(K2 k0)= 3.841.2n 2n n n2、nE55 5丿n由于K的观测值k= 2n 3n 2n 3n = 36,5 5 5 5故363.841,即 n 138.276.1又由gn Z,故n140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有 关”,那么本次被调查的至少有140人.式是运动2. (变条件)若增加条件n= 100,问能否在犯错误不超过0.1的前提下,可 认为“性别与休闲方式有关”?解由(2)可知,当n=

12、 100时,K2的观测值k= 呀2.782.706故在犯错误不超过0.1的前提下,我们可以认为性别与休闲方式有关.解决一般的独立性检验问题的步骤匚课堂小结独立性检验问题的求解策略(1) 等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地 判断两个变量的相关性.(2) K2统计量法:通过公式2n(ad be)k_ a+ b c+ d a+ e b+ d先计算观测值k,再与临界值表作比较,最后得出结论.当堂达标1.判断正误(1) 在独立性检验中,若K2越大,则两个分类变量有关系的可能性越大.()(2) 2X 2列联表是借助两个分类变量之间频率大小差异说明两个变量之间是否有关联关系.()

13、(3) 应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的.()答案(1)2V X2 在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得 到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是 ()A. 100个心脏病患者中至少有99人打鼾B. 1个人患心脏病,则这个人有 99%的概率打鼾C. 100个心脏病患者中一定有打鼾的人D. 100个心脏病患者中可能一个打鼾的人都没有D 这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”,这只是一个概率,即打鼾与患心脏病有关的可能性为 99%.根据概率的意义可知答案应选D.3.观察下列各图,其中两个分类变量x, y之间关系最强的是口匸I期匚*在四幅图中图中两个深色条的高相差最明显,说明两个分类变量之 间关系最强,故选.4. (2019全国卷I )某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1) 分别估计男、女顾客对该商场服务满意的概率;(2) 能否有95%的把握认为男、女顾客对该商场服务的评价有差异?0.8,因此男附:P(代 Nk)0. 0500. 0100.001k3. 841& 63510. 828k2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论