分类变量与列联表课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第1页
分类变量与列联表课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第2页
分类变量与列联表课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第3页
分类变量与列联表课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第4页
分类变量与列联表课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.3.1分类变量与列联表第八章

成对数据的统计分析新课引入有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?吸烟是否会增加患肺癌的风险?新课引入在现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或互相影响的问题.近视与看电子产品时间长短有关吗?外貌是随着基因和年龄变化的吗?概念生成在讨论上述问题时,为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称之为分类变量。分类变量分类变量的取值可以用实数来表示,例如男性、女性可以用1,0表示,学生的班级可以用1,2,3来表示。这些数值只作编号使用,并没有大小和运算意义.如何利用统计数据判断一对分类变量之间是否具有关联性呢?新知学习问题背景:为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查.全校学生的普查数据如下:

523名女生中:有331名经常锻炼;601名男生中:有473名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?新知学习

523名女生中:有331名经常锻炼;601名男生中:有473名经常锻炼.方法1——计算经常锻炼的男、女生比例结论:男生经常锻炼的比率比女生高出15.4个百分点,可知该校女生和男生在体育锻炼的经常性方面有差异,而且男生更经常锻炼.f1-f2≈0.787-0.633=0.154,新知学习

523名女生中:有331名经常锻炼;601名男生中:有473名经常锻炼.方法2——

借助条件概率在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计:令并做成2×2列联表加以保存.新知学习

523名女生中:有331名经常锻炼;601名男生中:有473名经常锻炼.方法2——

借助条件概率2×2列联表列联表给出了成对分类变量数据的交叉分类频数.性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)331523男生(X=1)473601合计1921281124320804新知学习2×2列联表女生中属于经常锻炼的概率为P(Y=1|X=0)=男生中属于经常锻炼的概率为

结论:在该校的学生中,性别对体育锻炼的经常性有影响,男生更经常性锻炼.P(Y=1|X=1)=性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601合计3208041124方法归纳在上面问题的两种解答中,使用了学校全部学生的调查数据,利用这些数据能够完全确定解答问题所需的比率和条件概率。然而,对于大多数实际问题,我们无法获得所关心的全部对象的数据,但可以利用随机抽样获得一定数量的样本数据,再利用随机事件发生的频率稳定于概率的原理作出推断.(用样本估计总体)典例剖析例1

为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取

88

名学生.

通过测试得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.

试分析两校学生中数学成绩优秀率之间是否存在差异.定义分类变量X和Y如下:解析:典例剖析定义分类变量X和Y如下:解析:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀我们将所给数据整理成2×2列联表(单位:人).学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788典例剖析甲校学生中数学成绩优秀的频率为:乙校学生中数学成绩优秀的频率为:不优秀的频率为0.7674不优秀的频率为0.8444学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788典例剖析甲校学生中数学成绩优秀的频率为:乙校学生中数学成绩优秀的频率为:不优秀的频率为0.7674不优秀的频率为0.8444我们可以用等高堆积条形图直观地展示上述计算结果,如图所示.甲校的频率明显高于乙校的频率依据频率稳定于概率的原理,可以推断甲校学生数学成绩优秀的概率大于乙校学生.因此,可以认为两校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高.方法归纳2×2列联表XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+da+b+c+d若不相等,则推断两个分类变量有关联或存在明显差异.若相等,则推断两个分类变量无关联或没有明显差异.(样本容量n)方法归纳等高堆积条形图等高条形图展示可列联表数据的频率特征,依据频率稳定与概率的原理,我们可以推断结果.①和表格相比,等高条形图更能直观地反映出两个分类变量间是否相互影响.②比较同色的条形图高度差,若高度差明显,则判断两个分类变量有关系或存在明显差异.变式训练B变式训练练习2在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施(

)优、良、中差总计实验班48250对比班381250总计8614100A.

有关

B.无关C.关系不明确

D.以上都不正确A变式训练练习3为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如图所示的等高堆积条形图,根据图中的信息,下列结论中不正确的是

()A.

样本中的男生人数多于女生人数B.

样本中喜欢手机支付的人数多于喜欢现金支付的人数C.

样本中多数男生喜欢现金支付D.

样本中多数女生喜欢手机支付C变式训练练习4在关于人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视;男性中有21人主要的休闲方式是看电视;男性、女性中另外的人主要的休闲方式是运动.根据以上数据建立一个2×2的列联表.依据题意得“性别与休

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论