新教材2023年高中数学第八章成对数据的统计分析8.3列联表与独立性检验课件新人教A版选择性必修第三册_第1页
新教材2023年高中数学第八章成对数据的统计分析8.3列联表与独立性检验课件新人教A版选择性必修第三册_第2页
新教材2023年高中数学第八章成对数据的统计分析8.3列联表与独立性检验课件新人教A版选择性必修第三册_第3页
新教材2023年高中数学第八章成对数据的统计分析8.3列联表与独立性检验课件新人教A版选择性必修第三册_第4页
新教材2023年高中数学第八章成对数据的统计分析8.3列联表与独立性检验课件新人教A版选择性必修第三册_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章成对数据的统计分析8.3列联表与独立性检验必备知识•探新知关键能力•攻重难课堂检测•固双基素养目标•定方向素养目标•定方向学习目标特别关注1.通过实例,理解2×2列联表的统计意义.2.会用2×2列联表的方法解决两个变量独立性检验的简单实际问题.重点:2×2列联表、独立性检验的思想和方法.难点:χ2统计量的导出和意义,独立性检验的思想和方法.核心素养:数据分析、数学运算、逻辑推理.必备知识•探新知

基础知识分类变量用来区别不同的现象或性质的随机变量,其取值可以用实数表示.知识点1知识点22×2列联表及随机事件的概率(1)2×2列联表:如果随机事件X与Y的样本数据如下表格形式

Y=0Y=1合计X=0aba+bX=1cdc+d合计a+cb+da+b+c+d在这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表.(2)2×2列联表中随机事件的概率:如上表,记n=a+b+c+d,则事件{Y=0}发生的概率可估计为______________;事件{X=1}发生的概率可估计为______________;事件{X=1,Y=0}发生的概率可估计为____________________.事件{X=1|Y=0}发生的概率可估计为____________________.独立性检验(1)零假设:设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互为对立事件,故要判断事件{X=1}和{Y=1}之间是否有关联,需要判断假定关系_______________________________是否成立.通常称H0为零假设.(2)独立性检验:利用随机变量χ2来判断“两个分类量有关系”的方法称为独立性检验.知识点3H0:P(Y=1|X=0)=P(Y=1|X=1)(4)对照表及检验规则:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828当χ2≥xα时就推断“X与Y不独立”,这种推断犯错误的概率不超过α;当χ2<xα时,可以认为“X与Y独立”.关键能力•攻重难题型探究题型一分类变量关联性的直观判断

某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张.性格外向的学生594人中有213人在考前心情紧张,作出等高堆积条形图,利用图形判断考前心情紧张与性格类别是否有关系.典例1[解析]

作列联表如下:

性格内向性格外向合计考前心情紧张332213545考前心情不紧张94381475合计4265941020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数所占的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.(2022·山东青岛一中高二期中)为了了解某高校学生喜欢使用手机支付是否与性别有关,抽取了部分学生作为样本,统计后作出如图所示的等高堆积条形图,则下列说法正确的是 (

)A.喜欢使用手机支付与性别无关B.样本中男生喜欢使用手机支付的约60%典例2DC.样本中女生喜欢使用手机支付的人数比男生多D.女生比男生喜欢使用手机支付的可能性大些[解析]

A错误,根据等高堆积条形图,喜欢和不喜欢使用手机支付的比例因性别差距很明显,所以喜欢使用手机支付与性别有关;B错误,样本中男生喜欢使用手机支付的约为40%;女生比男生喜欢使用手机支付的可能性大些,由于不知道男女生人数,所以不能认定女生喜欢使用手机支付的人数是否比男生多,所以C错误,D正确.【对点训练】❶

为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下表.问:铅中毒病人组和对照组的尿棕色素阳性数有无差别?

尿棕色素合计阳性数阴性数铅中毒病人组29736铅中毒对照组92837合计383573[解析]

由上述列联表可知,在铅中毒病人组中尿棕色素为阳性的占80.56%,而铅中毒对照组仅占24.32%.说明它们之间有较大差别.画出等高堆积条形图如图所示.由列联表及等高堆积条形图可知,铅中毒病人组与对照组相比较,尿棕色素为阳性数差别明显,因此铅中毒病人组和对照组的尿棕色素阳性数有明显差别.(2019·全国Ⅰ卷)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:题型二独立性检验

典例3

满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?[分析]

(1)根据列联表,用频率代替概率,可分别估计男、女顾客对该商场服务满意的概率;(2)求出χ2的值,与临界值表对比可得结论.[规律方法]

解决独立性检验问题的基本步骤【对点训练】❷2022年春季,某出租汽车公司决定更换一批小汽车以代替原来报废的出租车,现有A,B两款车型的使用寿命(单位:年)频数表如下:使用寿命/年5678总计A型出租车/辆10204525100B型出租车/1)填写下表,并判断是否有99%的把握认为出租车的使用寿命与汽车车型有关;

使用寿命不高于6年使用寿命不低于7年总计

A型

B型

总计

(2)司机师傅小李准备在一辆开了4年的A型车和一辆开了4年的B型车中选择,为了尽最大可能实现3年内(含3年)不换车,试通过计算说明,他应如何选择.[解析]

(1)根据题目所给数据得到如下2×2的列联表:

使用寿命不高于6年使用寿命不低于7年总计A型3070100B型5050100总计80120200某校鼓励即将毕业的大学生到西部偏远地区去支教,校学生就业部针对即将毕业的男、女生是否愿意到西部支教进行问卷调查,得到的情况如下表所示:

题型三独立性检验的综合应用

典例4性别支教合计愿意去支教不愿意去支教女生

20

男生

40

合计70

100(1)完成上述2×2列联表;(2)根据表中的数据,试根据小概率值α=0.05的独立性检验,分析愿意去西部支教是否与性别有关?(3)若在接受调查的所有男生中按照“是否愿意去支教”进行分层抽样,随机抽取10人,再在10人中抽取3人进行面谈,记面谈的男生中,不愿意去支教的人数为ξ,求ξ的分布列以及数学期望.[分析]

(2)根据列联表求出χ2和相应的频率,从而分析是否与性别有关;(3)由超几何分布公式求出相应的分布列,计算出数学期望.[解析]

(1)2×2列联表如下:性别支教合计愿意去支教不愿意去支教女生302050男生

401050合计7030100[规律方法]

解决一般的独立性检验问题的步骤:【对点训练】❸

某地为了调查市民对“一带一路”倡议的了解程度,随机选取了100名年龄在20岁至60岁的市民进行问卷调查,并通过问卷的分数把市民划分为了解“一带一路”倡议与不了解“一带一路”倡议两类,数据如表所示.年龄/岁[20,30)[30,40)[40,50)[50,60]调查人数30302515了解“一带一路”倡议人数1228155(1)完成下面的2×2列联表,并判断是否有90%的把握认为以40岁为分界点对“一带一路”倡议的了解有差异;(结果精确到0.001)

年龄低于40岁的人数年龄不低于40岁的人数合计了解

不了解

合计

(2)以频率估计概率,若在该地选出4名市民(年龄在20岁至60岁),记4名市民中了解“一带一路”倡议的人数为X,求随机变量X的分布列、数学期望和方差.附:[分析]

(1)由表格读取信息,年龄低于40岁的共60人,年龄不低于40岁的共40人,填写2×2列联表,再把数据代入χ2公式计算;(2)在总体未知的市民中选取4人,由频率估计概率得出选出的每位市民是了解“一带一路”倡议的概率,可知随机变量X服从二项分布.[解析]

(1)根据已知数据得到2×2列联表:

年龄低于40岁的人数年龄不低于40岁的人数合计了解402060不了解202040合计6040100易错警示没有准确掌握公式中参数的含义致误有甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表班级与成绩列联表典例5

优秀不优秀总计甲班103545乙班73845总计177390试问能有多大把握认为“成绩与班级有关系”?[辨析]

由于对2×2列联表中a、b、c、d的位置不清楚,在代入公式时代错了数值导致计算结果的错误.[点评]

独立性检验中,参数χ2公式复杂计算量大,要弄清公式特点熟记公式,小心计算避免粗心致误.课堂检测•固双基1.判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是

(

)A.残差 B.独立性检验C.等高堆积条形图 D.回归分析[解析]

用独立性检验考查两个分类变量是否有关系时,算出随机变量χ2的值越大,说明“X与Y有关系”成立的可能性越大.B2.下列关于独立性检验的叙述:①常用等高堆积条形图表示列联表数据的频率特征;②独立性检验依据的是小概率原理;③独立性检验的结果是完全正确的;④对分类变量X与Y的随机变量χ2的观测值来说,χ2越小,X与Y有关系的把握程度就越大.其中叙述正确的个数为

(

)A.1 B.2C.3 D.4B[解析]

因为独立性检验常用等高堆积条形图表示列联表数据的频率特征,故①正确;独立性检验依据的是小概率原理,故②正确;独立性检验的结果不是完全正确的,故③不正确;对分类变量X与Y的随机变量χ2的观测值来说,χ2越大,X与Y有关系的把握程度才越大,故④不正确.所以正确的个数为2,故选B.3.(2022·河北省石家庄市期末)一个2×2列联表如下:则表中m,n的值分别是

(

)A.10,38 B.17,45C.10,45 D.17,38[解析]

由a+35=45,得a=10.由a+7=m,得m=17.由m+73=s,得s=90.由45+n=s,得n=45.B

y1y2总计x1a3545x27bn总计m73s4.下列关于χ2的说法中正确的是 (

)A.χ2越大,“事件A,B有关”的可信度越小B.χ2越大,“事件A,B无关”的可信度越大C.χ2越小,“事件A,B有关”的可信度越小D.χ2越小,“事件A,B无关”的可信度越小[解析]

χ2越大,“事件A,B有关”的可信度越大,“事件A,B无关”的可信度越小;χ2越小,“事件A,B有关”的可信度越小,“事件A,B无关”的可信度越大.C5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:

男女总计爱好4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论