高二数学:8-3-1 分类变量与列联表 8-3-2 独立性检验_第1页
高二数学:8-3-1 分类变量与列联表 8-3-2 独立性检验_第2页
高二数学:8-3-1 分类变量与列联表 8-3-2 独立性检验_第3页
高二数学:8-3-1 分类变量与列联表 8-3-2 独立性检验_第4页
高二数学:8-3-1 分类变量与列联表 8-3-2 独立性检验_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.3.1分类变量与列联表8.3.2独立性检验激趣诱思知识点拨有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?“如果你认为健康问题不一定是由吸烟引起的,那么可以吸烟”的说法对吗?要回答这个问题,我们先一起来学习本课时的知识吧!激趣诱思知识点拨一、分类变量与列联表1.分类变量:为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.2.列联表:在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存.这种形式的数据统计表称为2×2列联表.2×2列联表给出了成对分类变量数据的交叉分类频数.激趣诱思知识点拨名师点析制作2×2列联表的基本步骤第一步,合理选取两个变量,且每一个变量都可以取两个值;第二步,抽取样本,整理数据;第三步,画出2×2列联表.激趣诱思知识点拨微练习在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,得到以下数据:对150只动物服用药物,其中132只动物存活,18只动物死亡,对150只动物进行常规治疗,其中114只动物存活,36只动物死亡.请根据以上数据建立一个2×2列联表.解:2×2列联表如下:类别存活数死亡数合计药物治疗13218150常规治疗11436150合计24654300激趣诱思知识点拨二、独立性检验1.2×2列联表XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d上表是关于分类变量X和Y的抽样数据的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n是样本容量.激趣诱思知识点拨2.χ2统计量的计算公式

3.独立性的判断方法

α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.激趣诱思知识点拨4.独立性检验利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.激趣诱思知识点拨微练习某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:态度积极支持企业改革不太赞成企业改革合计工作积极544094工作一般326395合计86103189对于人力资源部的研究项目,依据小概率α=0.005的独立性检验,分析企业员工工作积极性和对待企业改革态度是否有关联.激趣诱思知识点拨解:零假设为H0:企业的员工工作积极性和对待企业改革的态度无关联.从题表中的数据可知:a=54,b=40,c=32,d=63,a+b=94,c+d=95,a+c=86,b+d=103,n=189,代入公式得依据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为员工工作积极性与对待企业改革的态度有关联.探究一探究二素养形成当堂检测独立性检验例1某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:类型喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100试根据小概率值α=0.05的独立性检验,分析南方学生和北方学生在选用甜品的饮食习惯方面是否有差异.探究一探究二素养形成当堂检测解:零假设为H0:南方学生和北方学生在选用甜品的饮食习惯方面无差异.将2×2列联表中的数据代入公式计算,得依据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.探究一探究二素养形成当堂检测反思感悟

独立性检验的具体做法(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;(3)根据检验规则得出推断结论;(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.探究一探究二素养形成当堂检测变式训练1某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)试根据小概率值α=0.01的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关联.探究一探究二素养形成当堂检测解:(1)2×2列联表如下:教师类型赞同不赞同合计老教师101020青年教师24630合计341650(2)零假设为H0:对新课程教学模式的赞同情况与教师年龄无关联.依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为对新课程教学模式的赞同情况与教师年龄无关联.探究一探究二素养形成当堂检测独立性检验的综合应用例2海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:探究一探究二素养形成当堂检测(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计事件A的概率;(2)填写下面列联表,并依据α=0.01的独立性检验,分析箱产量与养殖方法是否有关联;类型箱产量<50

kg箱产量≥50

kg合计旧养殖法

新养殖法

合计

探究一探究二素养形成当堂检测(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:α0.0500.0100.001xα3.8416.63510.828探究一探究二素养形成当堂检测解:(1)记B表示事件“旧养殖法的箱产量低于50

kg”,C表示事件“新养殖法的箱产量不低于50

kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50

kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50

kg的频率为(0.068+0.046+0.010+0.008)×5=0.66.故P(C)的估计值为0.66.因此,事件A的概率估计值为0.62×0.66=0.409

2.探究一探究二素养形成当堂检测(2)零假设为H0:箱产量与养殖方法无关联.根据箱产量的频率分布直方图得如下列联表:类型箱产量<50

kg箱产量≥50

kg合计旧养殖法6238100新养殖法3466100合计96104200根据列联表中的数据,经计算得到

依据α=0.01的独立性检验,我们推断H0不成立,即认为箱产量与养殖方法有关联.探究一探究二素养形成当堂检测(3)因为在新养殖法的箱产量频率分布直方图中,箱产量低于50

kg的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55

kg的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法箱产量的中位数的估计值为反思感悟

两个分类变量相关关系的判断通过2×2列联表,先计算χ2的值,再借助χ2的取值判断两个分类变量是否有关联.探究一探究二素养形成当堂检测变式训练2为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,并得到了如下的2×2列联表:性别喜爱打篮球不喜爱打篮球合计男生

6

女生10

合计

48已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为探究一探究二素养形成当堂检测(1)请将上面的2×2列联表补充完整(不用写计算过程).(2)依据α=0.05的独立性检验,能否认为喜爱打篮球与性别有关联?说明你的理由.(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.探究一探究二素养形成当堂检测解:(1)列联表补充如下:性别喜爱打篮球不喜爱打篮球合计男生22628女生101020合计321648(2)零假设为H0:喜爱打篮球与性别无关联.根据列联表中的数据,经

依据α=0.05的独立性检验,我们推断H0不成立,即认为喜爱打篮球与性别有关联.探究一探究二素养形成当堂检测(3)喜爱打篮球的女生人数X的可能取值为0,1,2.其概率分别为故X的分布列为

探究一探究二素养形成当堂检测独立性检验与统计的综合应用典例某校为了探索一种新的教学模式,进行了一项课题实验,乙班为实验班,甲班为对比班,甲、乙两班均有50人,一年后对两班进行测试,成绩如下表(总分:150分):甲班成绩[80,90)[90,100)[100,110)[110,120)[120,130)人数42015101乙班

成绩[80,90)[90,100)[100,110)[110,120)[120,130)人数11123132探究一探究二素养形成当堂检测(1)现从甲班成绩位于[90,120)内的试卷中抽取9份进行试卷分析,请问用什么抽样方法更合理,并写出最后的抽样结果.(2)根据所给数据可估计在这次测试中,甲班的平均分是101.8分,请你估计乙班的平均分,并计算两班平均分的差距.(3)完成下面2×2列联表,并依据α=0.05的独立性检验,分析这两个班在这次测试中成绩的差异与实施课题实验是否有关联,并请说明理由.班别成绩小于100分成绩不小于100分合计甲班a=

2650乙班12d=

50合计3664100探究一探究二素养形成当堂检测解:(1)用分层随机抽样的方法更合理.甲班成绩位于[90,120)内的试

探究一探究二素养形成当堂检测(3)补全列联表如下:班别成绩小于100分成绩不小于100分合计甲班a=242650乙班12d=3850合计3664100零假设为H0:这两个班在这次测试中成绩的差异与实施课题实验无关联.由表中的数据,依据α=0.05的独立性检验,我们推断H0不成立,即认为这两个班在这次测试中成绩的差异与实施课题实验有关联.探究一探究二素养形成当堂检测方法点睛

1.由[90,120)内的三组数据存在差异确定抽样方法,从而确定各区间抽样份数.2.累加各组的组中值与频率的积,并计算乙班的平均分,从而得到两班平均分的差.3.根据所给的数据得到2×2列联表,由列联表中的数据求出χ2,结合临界值表得出结论.探究一探究二素养形成当堂检测1.(2019天津高二期中)在吸烟与患肺病这两个分类变量中,零假设为H0:吸烟与患肺病无关联.下列说法正确的是(

)①依据α=0.05的独立性检验认为吸烟与患肺病有关联时,我们说某人吸烟,他一定患有肺病;②从统计量中得知依据α=0.05的独立性检验认为吸烟与患肺病有关联,是指不超过0.05的概率使得推断出现错误;③如果由χ2的值得到依据α=0.05的独立性检验认为吸烟与患肺病有关联,那么在100个吸烟的人中必有95人患有肺病.A.① B.② C.③ D.②③解析:根据α=0.05的独立性检验认为吸烟与患肺病有关联时,指的是不超过0.05的概率使得推断出现错误,故②正确;可知①③错误.故选B.答案:B探究一探究二素养形成当堂检测2.(2019重庆巴蜀中学高二期末)在对人们休闲方式的一次调查中,根据数据建立如下的2×2列联表:性别看书运动合计男82028女161228合计243256附:α0.050.01xα3.8416.635A.0.99 B.0.95C.0.01

D.0.05探究一探究二素养形成当堂检测解析:零假设为H0:休闲方式与性别无关联.结合题意和独立性检验的结论,由χ2≈4.667>3.841=x0.05,根据α=0.05的独立性检验,我们推断H0不成立,即认为休闲方式与性别有关联.故选D.答案:D探究一探究二素养形成当堂检测3.(2020湖北高二期末)手机给人们的生活带来便捷,但同时也对中学生的生活和学习造成了严重的影响.某校高一几个学生成立研究性学习小组,就使用手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成下表,则下列说法正确的是(

)类别成绩优秀成绩不优秀合计不用手机401050使用手机54550合计4555100α0.010.0050.001xα6.6357.87910.828探究一探究二素养形成当堂检测A.依据α=0.001的独立性检验认为使用手机与学习成绩有关联B.依据α=0.001的独立性检验认为使用手机与学习成绩无关联C.依据α=0.005的独立性检验认为使用手机对学习成绩无影响D.依据α=0.01的独立性检验认为使用手机对学习成绩有影响解析:零假设为H0:使用手机与学习成绩无关联.因为

所以依据α=0.001的独立性检验,我们推断H0不成立,即认为使用手机与学习成绩有关联.故选A.答案:A探究一探究二素养形成当堂检测4.(2020广东高三月考)2019年10月18日到27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示:满意度男性运动员女性运动员合计对主办方表示满意200220420对主办方表示不满意503080合计250250500探究一探究二素养形成当堂检测现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为;②依据α=0.01的独立性检验认为对主办方表示满意与运动员的性别有关联;③依据α=0.01的独立性检验认为对主办方表示满意与运动员的性别无关联.其中正确的个数为(

)α0.10.050.010.001xα2.7063.8416.63510.828A.0 B.1 C.2 D.3探究一探究二素养形成当堂检测答案:B探究一探究二素养形成当堂检测5.(2019北京师大附中高考模拟)已知某企业有职工5000人,其中男职工3500人,女职工1500人.该企业为了丰富职工的业余生活,决定新建职工活动中心.为此,该企业工会采用分层随机抽样的方法,随机抽取了300名职工每周的平均运动时间(单位:h),汇总得到频率分布表(如表所示),并据此来估计该企业职工每周的运动时间.平均运动时间频数频率[0,2)150.05[2,4)m0.2[4,6)450.15[6,8)7550.25[8,10)900.3[10,12)pn合计3001探究一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论