




已阅读5页,还剩40页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独立性检验的基本思想及其初步应用 教材分析本节课是人教A版(选修)23第三章第二单元第二课时的内容在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。 教学目标【知识与能力目标】通过生活中新闻案例的探究,理解独立性检验的基本思想,明确独立性检验的基本步骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。【过程与方法目标】通过探究“玩电脑游戏与注意力集中是否有关系”引出独立性检验的问题,借助样本数据的列联表分析独立性检验的实施步骤。利用上节课所学已经由数据直观判断出玩电脑游戏与注意力集中可能有关系。这一直觉来自于观测数据,即样本。问题是这种来自于样本的印象能够在多大程度上代表总体。这节课就是为了解决这个问题,在学生亲身体验感受的基础上,提高学生的数据分析能力。【情感态度价值观目标】通过本节课的学习,加强数学与现实生活的联系。以科学的态度评价两个分类变量有关系的可能性。培养学生运用所学知识,解决实际问题的能力。教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。 教学重难点【教学重点】理解独立性检验的基本思想及实施步骤。【教学难点】 了解独立性检验的基本思想; 了解随机变量K2的含义,K2的观测值很大,就认为两个分类变量是有关系的。 课前准备 预习任务:任务1,任务2;预习自测 教学过程(一)课前设计1.预习任务任务1阅读教材P10P12,思考什么是分类变量,列联表如何画?阅读教材P12P14,思考独立性检验与反证法有何区别?阅读教材P10P15,回顾本节主要知识点有哪些?任务2有哪些方法可以直观判断两个分类变量是否有关系?独立性检验的基本思想是什么?利用独立性检验判断两个分类变量相关关系的一般步骤是什么?2.预习自测1.下列不是分类变量的是()A.近视B.身高C.血压D.药物反应解:B.判断一个量是否是分类变量,只需看变量的不同值是否表示个体的不同类别,A,C,D选项的不同值都可以表示个体的不同类别,只有B选项的不同值不表示个体的不同类别.2.下面是一个列联表不健康健康总计不优秀a2173优秀22527总计b46100则表中a,b的之分别是( )A. 94,96 B. 52,50 C. 52,54 D. 54,52解:C3.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k3.841时,我们()A.在犯错误的概率不超过0.05的前提下可认为A与B有关B.在犯错误的概率不超过0.05的前提下可认为A与B无关C.在犯错误的概率不超过0.01的前提下可认为A与B有关D.没有充分理由说明事件A与B有关系解:A4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110计算得到的观测值约为7.822.下列说法正确的是( )A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”解:C 由随机变量的值,查表知,有以上的把握认为“爱好该项运动与性别有关”.故本题答案选C.5.与表格相比,能更直观地反映出相关数据总体状况的是()A.列联表B.散点图C.残差图D.等高条形图解: D6.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若的观测值为,我们有的把握认为吸烟与患肺病有关系,那么在个吸烟的人中必有人患有肺病.B.从独立性检验可知有的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有的可能患有肺病.C.若从统计量中求出有的把握认为吸烟与患肺病有关系,是指有的可能性使得推判出现错误.D.以上三种说法都不正确.解: C(二)课堂设计1.知识回顾 (1)线性回归方程:,其中:,(2)回归分析:是对具有相关关系的两个变量进行的统计分析的一种常用方法.(3)线性回归模型:其中和为模型的未知参数,称为随机误差.(4)变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量.(5)列出两个分类变量的频数表,称为列联表.(6)等高条形图是用来分析两个分类变量之间是否具有相关关系,可以形象、直观地反映两个分类变量之间的总体状态和差异大小,进而判断它们之间是否具有相关关系的图形.(7)变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量.(8)列出两个分类变量的频数表,称为列联表.(9)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即:两个分类变量没有关系成立,在该假设下我们构造的随机变量应该很小,如果由观测数据计算得到的观测值很大,则在一定程度上说明假设不合理,即断言不成立,即认为“两个分类变量有关系”;如果观测值很小,则说明在样本数据中没有发现足够证据拒绝.2.问题探究 问题探究一 什么是分类变量?活动一 理论研究,概念学习分类变量在现实生活中,会遇到各种各样的变量,如果要研究它们之间的关系,观察下面两组变量,分析在取不同的值时表示的个体有何差异?变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量.(1) 分类变量也称为属性变量或定性变量,它的不同值表示个体所属的不同类别.(2) 分类变量的取值一定是离散的,如性别只取男、女两个值.(3) 可以把分类变量的不同取值用数字表示,如用0表示男,1表示女,这是性别变量就成了取值为0和1的随机变量,但这些数字的大小没有意义.分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍等问题探究二 如何研究两个分类变量之间是否有关系? 重点、难点知识在日常生活中,我们常常关心两个分类变量之间是否有关系.例如,吸烟与患肺癌是否有关系?性别是否对喜欢数学课程有影响?活动一 实例探究,引出问题例1 为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:表格 1那么吸烟是否对患肺癌有影响?估计吸烟者与不吸烟者患病的可能性差异?活动二 实例探究,引出概念1.列联表类似于上面的表格这样列出两个分类变量的频数表,称为列联表.即列联表是两个或者两个以上分类变量的频数表,书中仅限于研究两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表成为22列联表.一般的,假设有两个分类变量和,它们的取值分别为和,其样本频数列联表为:总计总计其中是样本容量.活动三 利用旧知,研究问题利用频率分布表判断;由患肺癌在吸烟者与不吸烟者中的频率差异可粗略估计吸烟对患肺癌有影响;活动四 学习新知,对比研究与表格相比,图形更能直观的反映出两个分类变量间是否相互影响,我们常用等高条形图展示列联表数据的频率特征.2.等高条形图 利用等高条形图来分析两个分类变量之间是否具有相关关系,可以形象、直观地反映两个分类变量之间的总体状态和差异大小,进而判断它们之间是否具有相关关系.(1)绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的;两行的数据对应不同的颜色.(2)等高条形图中由两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显,就判断两个分类变量之间有关系.下图是吸烟与是否患肺癌的等高条形图由条形图可以发现,在吸烟样本中,患肺癌的频率要高些,因此直观上可以认为吸烟更容易引发肺癌.例2 在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?【知识点:分类变量,等高条形图】详解根据题目给出的数据作出如下的列联表:色盲不色盲总计男38442480女6514520总计449561 000根据列联表作出相应的等高条形图:从等高条形图来看在男人中患色盲的比例要比在女人中患色盲的比例大得多,因而,我们认为性别与患色盲是有关系的.点拨:利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一.一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大.问题探究三 如何从统计学方面研究两个分类变量之间是否有关系? 重点、难点知识通过数据和图形分析,我们得到的直观判断是“吸烟和患肺癌有关”那么这种判断是否可靠?我们通过统计分析回答这个问题.为研究的一般性,在列联表中用字母代替数字为了回答上述问题,我们先假设:吸烟与患肺癌没有关系,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多,即: ,即.因此,越小,说明吸烟与患肺癌之间关系越弱;越大,说明吸烟与患肺癌之间关系越强. 为了使不同样本容量的数据有统一的评判标准,构造一个随机变量 (1) (其中为样本容量.)若成立,即“吸烟与患肺癌没有关系”,则应该很小.根据表1中的数据,利用公式(1)计算得到的观测值为这个值到底能告诉我们什么呢?统计学家经过研究后发现,在成立的情况下, (2) 在成立的情况下,的观测值大于6.635的概率非常小,近似为0.010,是个小概率事件. 现在的观测值,远远大于,所以有理由断定不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过.上面这种利用随机变量来确定是否能以一定把握认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.问题探究四 我们主要从几个方面来研究两个分类变量之间有无关系?活动一 回归旧知,忆分类变量间关系的判断例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?【知识点:分类变量,独立性检验,变量间的关系】详解:根据题中所给数据列出列联表相应的等高条形图如图所示:比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程度上认为“秃顶与患心脏病有关”.活动二 对比学习,提炼优缺点根据数据有多大把握判断秃顶与患心脏病是否有关系?在假设的前提下,所以有99的把握认为“秃顶与患心脏病有关”.这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.点拨:(1)列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.(2)独立性检验能精确判断可靠程度,而等高条形图的优点是直观,但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后还需要用独立性检验来确认.问题探究五 什么是独立性检验?利用独立性检验判断两个分类变量的是否有关系的一般过程是什么? 重点、难点知识活动一 理论学习,提升高度1.定义:利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验.活动二 对比学习,提炼方法通过反思例1的解答过程中,你能总结出利用独立性检验判断两个分类变量的是否有关系的一般过程吗?一般地,假设有两个分类变量和,它们的取值分别为和,其22列联表为下表:总计总计我们构造一个变量:,其中.利用随机变量来确定在多大程度上可以认为两个分类变量有关系:利用上述公式求出的观测值为,其中.再得出与有关系的程度:如果k 10.828,就有99.9%的把握认为与有关系;如果k 7.879,就有99.5%的把握认为与有关系;如果k 6.635,就有99%的把握认为与有关系;如果k 5.024,就有97.5%的把握认为与有关系;如果k 3.841,就有95%的把握认为与有关系;如果k 2.706,就有90%的把握认为与有关系;如果k 2.706,就认为没有充分的证据证明与有关系.问题探究六 独立性检验的基本思想是什么? 难点知识活动一 深层思考,得出基本思想通过上述问题,我们可以利用独立性检验来说明两个分类变量是否有关系,相关性有多强.那么为什么可以用独立性检验来判断两个分类变量的相关性呢?其基本思想是什么?独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即:两个分类变量没有关系成立,在该假设下我们构造的随机变量应该很小,如果由观测数据计算得到的观测值很大,则在一定程度上说明假设不合理,即断言不成立,即认为“两个分类变量有关系”;如果观测值很小,则说明在样本数据中没有发现足够证据拒绝.如何判断的观测值的大小?确定一个正数,当时认为的观测值大.此时相应于的判断规则为:如果,则认为“两个分类变量有关系”;否则认为“两个分类变量没有关系”.我们称这样的为一个判断规则的临界值.按照上述规则,把“两个分类变量没有关系”错误判断为“两个分类变量有关系”的概率为根据随机变量的含义,可以通过来评价假设的不合理程度,又实际计算出,说明假设不合理的程度约为,级两个变量是由关系这一结论成立的可信度为.活动二 对比提升,区分不同独立性检验的原理与反证法的原理是否一样呢?我们对比可以发现:(1) 反证法原理是在假设下,如果推出一个矛盾,就证明了不成立.(2) 独立性检验原理是在假设下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率.例2 某高校为研究学生的身体素质与课外体育锻炼时间的关系,对该校一年级200名学生的课外体育锻炼平均每天运动的时间进行调查,如下表:(平均每天锻炼的时间单位:分钟)平均每天锻炼的时间(分钟)总人数203644504010将学生日均课外体育运动时间在上的学生评价为“课外体育达标”.请根据上述表格中的统计数据填写下面列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关?课外体育不达标课外体育达标合计男女20110合计参考公式:,其中.参考数据:0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828【知识点:分类变量,独立性检验,变量间的关系】详解:其列联表如下课外体育不达标课外体育达标合计男603090女9020110合计15050200计算,故所以在犯错误的概率不超过0.01的前提下不能判断“课外体育达标”与性别有关;点拨:独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论.在分析问题时一定要注意这一点,不可对某个问题下确定性结论否则就可能对统计计算得结果作出错误的解释.问题探究七 我们主要从几个方面来研究两个分类变量之间有无关系?活动一 回归旧知,巩固复习重点知识例1.为了调查某生产线上,某质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中合格品982件,次品87件;甲不在现场时,510件产品中合格品493件,次品17件.试分别用列联表,等高条形图,独立性检验的方法对数据进行分析.【知识点:分类变量,独立性检验,变量间的关系】详解:(1)22列联表如下:产品正品数次品数总数甲在现场9828990甲不在现场49317510总数1 475251 500由列联表看出|ac-bd|=|98217-4938|=12750,即可在某种程度上认为“甲在不在场与产品质量有关”.相应的等高条形图如图所示:活动二 对比学习,巩固重点由22列联表中数据,计算.所以约有99%的把握认为“质量监督员甲在不在现场与产品质量有关系”.点拨:(1)在现在等高条形图中,与相差越大,两个分类变量有关系的可能性越大.(2)在解答独立性检验题目过程中.数据有时比较多,一定不要混淆,要分辨清楚,否则会影响解题的下一步,同时计算不能失误.问题探究八 利用独立性检验判断两个分类变量是否有关系的一般步骤是什么? 重点、难点知识活动一 实际操作例2.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本.(1)根据所给样本数据完成下面22列联表;(2)请问能有多大把握认为药物有效?不得禽流感得禽流感总计服药不服药总计【知识点:分类变量,独立性检验,变量间的关系】详解:(1)不得禽流感得禽流感总计服药402060不服药202040总计6040100(2)由列联表得:所以大概90认为药物有效.活动二 深层思考,得出一般步骤通过上述解答过程,利用独立性检验判断两个分类变量是否有关系的一般步骤是什么? 1.独立性检验的基本步骤根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查临界值表确定临界值.0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828利用公式计算随机变量的观测值.如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.2.独立性检验的基本思想(1)利用进行独立性检验,可以对推断的正确性的概率作出估计,样本容量越大,这个估计值越准确,如果抽取的样本容量很小,那么利用进行独立性检验的结果就不具有可靠性.(2)独立性检验的思想就是在假设成立的条件下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率.3.课堂总结【知识梳理】(1)变量的不用“值”表示个体所属的不同类别,像这样的变量成为分类变量.(2)列出两个分类变量的频数表,称为列联表.(3)设:吸烟与患肺癌没有关系,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多,即: ,即.因此,越小,说明吸烟与患肺癌之间关系越弱;越大,说明吸烟与患肺癌之间关系越强. 为了使不同样本容量的数据有统一的评判标准,构造一个随机变量 (1) (其中为样本容量.)若成立,即“吸烟与患肺癌没有关系”,则应该很小.(4)利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验.(5)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量应该很小,如果由观测数据计算得到的观测值很大,则在一定程度上说明假设不合理.(6)独立性检验的原理与反证法的原理比较:反证法原理是在假设下,如果推出一个矛盾,就证明了不成立;独立性检验原理是在假设下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率.(7).独立性检验的基本步骤根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查临界值表确定临界值.0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828利用公式计算随机变量的观测值.如果,就推断“与有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”,或者在样本数据中没有发现足够证据支持结论“与有关系”.(8).独立性检验的基本思想(1)利用进行独立性检验,可以对推断的正确性的概率作出估计,样本容量越大,这个估计值越准确,如果抽取的样本容量很小,那么利用进行独立性检验的结果就不具有可靠性.(2)独立性检验的思想就是在假设成立的条件下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率.【重难点突破】 (1)列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大.(2)利用等高条形图判断两个分类变量是否有关的步骤:(3)独立性检验是对两个分类变量间是否有关系的一种案例分析方法,其分析方法有:等高条形图法和利用假设检验的思想方法,计算出来一个随机变量的观测值来进行判断(4)独立性检验的基本思想是:假设结论不成立,即“两个分类变量没有关系”.在此假设下随机变量 应该很能小,如果由观测数据计算得到的观测值很大,则在一定程度上说明假设不合理.根据随机变量的含义,可以通过评价该假设不合理的程度,由实际计算出的,说明假设合理的程度为99.9%,即“两个分类变量有关系”这一结论成立的可信度为约为99.9%.(5)利用三维柱形图、二维条形图、等高条形图直观判断两个分类变量之间是否有关系.(6)利用22列联表以及随机变量对两个变量进行独立性检验.4.随堂检测1.独立性检验中,可以粗略地判断两个分类变量是否有关的是( ) A. 残差B. 等高条形图C.假设检验的思想 D.以上都不对【知识点:独立性检验】解: B.2.分类变量和的列联表如下,则( ) 合计aba+bcdc+d合计a+cb+da+b+c+dA. 越小,说明与的关系越弱B. 越大,说明与的关系越强C. 越大,说明与的关系越强D. 越接近于,说明与关系越强【知识点:独立性检验】解:C 解:因为, 越大, 越大, 犯错误的概率的越小,说明与的关系越强.3.在一次独立性检验中,得出22列联表如下:y1y2合计x12008001000x2180m180+m合计380800+m1180+m最后发现,两个分类变量x和y没有任何关系,则m的可能值是( )A.200 B.720 C.100 D.180【知识点:独立性检验】解:B 分类变量和没有任何的关系,所以,得到,故选B.4.在一个22列联表中,由其数据计算得到K2的观测值k13.097,则其两个变量间有关系的可能性为( )A.99.9% B.95% C.90% D.0附表: 0.0500.0100.001k3.8416.63510.828【知识点:独立性检验】解:A 因为所求的,故可能性为,所以选A.5.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用22列联表进行独立性检验,经计算K27.069,则至少有 _的把握认为“学生性别与是否支持该活动有关系”.附:P(K2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828【知识点:独立性检验】解:6.下列变量中不属于分类变量的是()A.性别 B.吸烟 C.宗教信仰 D.国籍【知识点:分类变量】解:B “吸烟”不是分类变量,“是否吸烟”才是分类变量.7.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%【知识点:等高条形图】解:C 由等高条形图知:女生喜欢理科的比例为20%,男生不喜欢理科的比例为40%,因此,B、D不正确.从图形中,男生比女生喜欢理科的可能性大些.8.为大力提倡“厉行节约,反对浪费”,某区通过随机询问100名性别不同的居民是否做到“光盘”行动,经计算:参照附表,得到的正确结论是( )kA.在犯错误的概率不超过1%的前提下,认为“该市民能否做到光盘行动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市民能否做到光盘行动与性别无关”C.有90%以上的把握认为“该市民能否做到光盘行动与性别有关”D.有90%以上的把握认为“该市民能否做到光盘行动与性别无关”【知识点:独立性检验】解:C 因为因为2.7063.0303.841所以有90%以上的把握认为“该市居民能否做到光盘与性别有关”.9.若两个分类变量和的列联表为:合计104050203050合计3070100参考公式:独立性检测中,随机变量0.100.050.0250.0100.0050.0012.7063.8415.02406.6357.87910.828则认为“与之间有关系”的把握可以达到 ( )A. B. C. D.【知识点:独立性检验】解:A 根据列联表可以得到有100个样本,且,代入表达式,得到,.10.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”.利用22列联表计算,得K23.918.经查对临界值表,知P(K23.814)0.05.给出下列结论:有95%把握认为“这种血清能起到预防感冒的作用”;若某人未使用血清,那么他在一年中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为5%.其中正确结论的序号是()A. B. C. D.【知识点:独立性检验】解:C11.独立性检验所采用的思路是:要研究X,Y两个分类变量彼此相关,首先假设这两个分类变量彼此_,在此假设下构造随机变量K2.如果K2的观测值较大,那么在一定程度上说明假设_.【知识点:独立性检验】解:无关系不成立(三)课后作业基础型 自主突破1.下面说法正确的是()A.统计方法的特点是统计推断准确、有效B.独立性检验的基本思想类似于数学上的反证法C.任何两个分类变量有关系的可信度都可以通过查表得到D.不能从等高条形图中看出两个分类变量是否相关【知识点:独立性检验】解:B2.观察下列各图,其中两个分类变量x,y之间关系最强的是()【知识点:独立性检验】解:D3.确定结论“与有关系”的可信度为时,则随机变量的观测值必须( )A.大于 B.大于 C.小于 D.大于【知识点:独立性检验】解:B 通过表中的数据可知可信度为时P(K2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.8284. 想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( )A.H0:男性喜欢参加体育活动 B.H0:女性不喜欢参加体育活动C.H0:喜欢参加体育活动与性别有关 D.H0:喜欢参加体育活动与性别无关【知识点:独立性检验】解: D5.对分类变量X 与Y 的随机变量的观测值K ,说法正确的是( ) A .K 越大, X 与Y 有关系”可信程度越小;B . K 越小, X 与Y 有关系”可信程度越小;C . K 越接近于0, X 与Y 无关”程度越小D . K 越大, X 与Y 无关”程度越大【知识点:独立性检验】解: B6.下列关于等高条形图的叙述正确的是().A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图可以粗略地看出两个分类变量是否有关系D.以上说法都不对【知识点:独立性检验】解:C在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.7.如果有95%的把握说事件A和B有关系,那么具体计算出的数据是( )A. B. C. D. 【知识点:独立性检验】解: A8.下面关于的说法正确的是( ) A. 在任何相互独立的问题中都可以用于检验有关还是无关B. 的值越大,两个事件的相关性就越大C. 是用来判断两个分类变量是否相关的随机变量,当的值很小时可以推定两个变量不相关D. 的观测值的计算公式是【知识点:独立性检验】解: B9. 为了研究学生性别与是否喜欢数学课之间的关系,得到列联表如下,请判断有( )把握认为性别与喜欢数学课有关.参考数据:A. B. C. D.【知识点:独立性检验】解:D ,因此有99.9%的把握认为性别与喜欢数学课有关.10.以下关于独立性检验的说法中,错误的是.(填序号)独立性检验依据小概率原理;独立性检验得到的结论一定正确;样本不同,独立性检验的结论可能有差异;独立性检验不是判定两个分类变量是否相关的唯一方法.【知识点:独立性检验】解:11.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是()A.吸烟,不吸烟 B.患病,不患病C.是否吸烟、是否患病 D.以上都不对【知识点:独立性检验】解:C“是否吸烟”是分类变量,它的两个不同取值;吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A、B都是一个分类变量所取的两个不同值.故选C.12.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015附:P(K2k0)0.100.050.025k02.7063.8415.024参照附表,得到的正确结论是()A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别无关”C.有90%以上的把握认为“该市居民能否做到光盘与性别有关”D.有90%以上的把握认为“该市居民能否做到光盘与性别无关”【知识点:独立性检验】解:C 由题设知:a45,b10,c30,d15,所以k3.030,2.7063.0303.841,由附表可知,有90%以上的把握认为“该市居民能否做到光盘与性别有关”,故选C.13.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是() 若K2的观测值满足K26.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.B. C.D.【知识点:独立性检验】解:C 推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,正确.排除D.14.在一个22列联表中,由其数据计算得K2的观测值,则这两个变量间有关系的可能性为()A.99% B.99.5% C.99.9% D.无关系【知识点:独立性检验】解:AK2的观测值6.635k7.879,所以有99%的把握认为两个变量有关系.15. 在600人身上实验某种新药预防感冒的作用,把一年中的记录与另外600个未用新药的人作比较,结果如下未感冒感冒总计试验292308600未用过284316600总计5766241200问该种新药起到预防感冒的作用的可能性为( ) A. 99%B. 90%C.99.9% D.小于90%【知识点:独立性检验】解:D16.分析两个分类变量之间是否有关系的常用方法有_;独立性检验的基本思想类似于.【知识点:独立性检验】解:.频率比较法、图形分析法(三维柱形图、二维条形图、等高条形图)、独立性检验;反证法能力型 师生共研17.若有的把握说事件与事件有关,那么具体算出的的观测值一定满足( )A. B. C. D.【知识点:独立性检验】解: A18.假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其22列联表为:YXy1y2总计x1ababx2cdcd总计acbdabcd对同一样本,以下数据能说明X与Y有关的可能性最大的一组为(D)A.a5,b4,c3,d2B.a5,b3,c4,d2C.a2,b3,c4,d5D.a3,b2,c4,d5【知识点:独立性检验】解: D19.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论为:有 把握认为“学生性别与支持该活动有关系” P(Kk0)0.1000.0500.0250.0100.001k.2.7063.8415.0246.63510.828【知识点:独立性检验】解: 99 【解析】根据,所以犯错误率低于,所以应该有的把握,认为“学生性别与支持该活动有关系” ,探究型 多维突破20.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法点拨:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由.(参考下表)P(K2k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828【知识点:独立性检验,古典概型】解:(1)积极参加班级工作的学生有24人,总人数为50人,概率为;不太主动参加班级工作且学习积极性一般的学生有19人,概率为.(2),有的把握说学习积极性与对待班级工作的态度有关系.21.2016年夏季奥运会将在巴西里约热内卢举行,体育频道为了解某地区关于奥运会直播的收视情况,随机抽取了名观众进行调查,其中岁以上的观众有名,下面是根据调查结果绘制的观众准备平均每天收看奥运会直播时间的频率分布表(时间:分钟):分组频率将每天准备收看奥运会直播的时间不低于分钟的观众称为“奥运迷”,已知“奥运迷”中有名岁以上的观众.(1)根据已知条件完成下面的列联表,并据此资料你是否有以上的把握认为“奥运迷”与年龄有关?非“奥运迷”“奥运迷”合计岁以下岁以上合计(2)将每天准备收看奥运会直播不低于分钟的观众称为“超级奥运迷”,已知“超级奥运迷”中有名岁以上的观众,若从“超级奥运迷”中任意选取人,求至少有名岁以上的观众的概率.附:【知识点:独立性检验,概率统计】解:(1)由频率分布表可知,在轴取的人中,“奥运迷”有人,从完成列联表如下:非“奥运迷”“奥运迷”合计岁以下岁以上合计.因为,所以没有以上的把握认为“奥运迷”与年龄有关.(2)由频率分布表可知,“超级奥运迷”有人,从而所有可能结果所组成的基本事件空间为:其中表示男性,表示女性,.由个基本事件组成,且是等可能的,用表示事件“任意选人,至少有名岁以上观众”,则,即事件包含个基本事件,所以.22.有两个分类变量X与Y的一组数据,由其列联表计算得k4.523,则认为“X与Y有关系”犯错误的概率为( )A.95% B.90% C.5% D.10%【知识点:独立性检验】解: C23.某医疗所为了检查新开发的流感疫苗对甲型流感的预防作用,把名注射疫苗的人与另外名未注射疫苗的人半年的感冒记录作比较,提出假设“这种疫苗不能起到预防甲型流感的作用”,并计算,则下列说法正确的是( )A.这种疫苗能起到预防甲型流感的有效率为B.若某人未使用疫苗则他在半年中有的可能性得甲型C.有的把握认为“这种疫苗能起到预防甲型流感的作用”D.有的把握认为“这种疫苗能起到预防甲型流感的作用”【知识点:独立性检验】解: C 因为,这说明假设不合理的程度为,即这种疫苗不能起到预防甲型流感的作用不合理的程度约为,所以有的把握认为“这种疫苗能起到预防甲型流感的作用”,故选C.24.某企业为研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了名员工进行调查,所得的数据如下表所示:积极支持改革不太支持改革合 计工作积极工作一般合 计对于人力资源部的研究项目,根据上述数据能得出的结论是()(参考公式与数据:.当时,有的把握说事
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民法通则培训课件
- 民法居住权课件
- 初中化学考试题型及答案
- 病理学考试题及答案大全
- 民治企业安全培训价格课件
- 体育领域新质生产力发展挑战
- 苏州房地产工作方案
- 知识产权与新质生产力报告
- 民族理论课件
- 中国一重:新质生产力实践
- 全科医生题库-云南省基层卫生岗位练兵和技能竞赛试题
- 《立在地球边上放号》与《峨日朵雪峰之侧》比较阅读教学设计-统编版高一语文必修上册
- 运维安全管理措施
- 镁铝合金行业前景
- 煤炭工业矿井工程建设项目设计文件编制标准
- 前列腺增生科普知识
- 5G-Advanced通感融合网络架构研究报告(第二版)
- 言语发音训练课件
- 深度学习:从入门到精通(微课版)全套教学课件
- 2025年反洗钱知识竞赛多选题库及答案(共70题)
- 见证取样送检计划方案
评论
0/150
提交评论