列联表与独立性检验课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第1页
列联表与独立性检验课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第2页
列联表与独立性检验课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第3页
列联表与独立性检验课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第4页
列联表与独立性检验课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人教A版选择性必修第三册8.3列联表与独立性检验第八章

成对数据的统计分析1.一元线性回归模型:Y称为因变量或响应变量,x称为自变量或解释变量;a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.知识回顾2.经验回归方程:3.决定系数R2:R2越接近1,则线性回归刻画的效果越好.知识回顾1.了解分类变量、2×2列联表、随机变量χ2的意义;2.了解独立性检验的基本思想方法;3.能够运用2×2列联表及χ2进行独立性检验.学习目标自学指导阅读课本124--131页,完成以下问题:问题1分类变量与列联表。问题2独立性检验。

在现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或相互影响的问题.例如,就读不同学校是否对学生的成绩有影响,不同班级学生用于体育锻炼的时间是否有差别,吸烟是否会增加患肺癌的风险,等等.为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.教师点拨分类变量问题为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查.数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?

该校的女生和男生在体育锻炼的经常性方面有差异,而且男生更经常锻炼.为了清楚起见,我们用表格整理数据.性别锻炼合计不经常经常女生192331523男生128473601合计3208041124我们将形如上表这种形式的数据统计表称为2×2列联表.2×2列联表给出了成对分类变量数据的交叉分类频数.组别甲乙合计Aaba+bBcdc+d合计a+cb+da+b+c+d教师点拨列联表练习

下面是一个2×2列联表:XY合计Y=0Y=1X=0a2173X=122527合计b46100则表中a,b处的值分别为(

)A.94,96 B.52,50C.52,54

D.54,52C小组互助例1为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788小组互助作出等高堆积条形图甲校乙校1.00.80.60.40.00.2优秀不优秀学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788

由等高堆积条形图可知,可以认为两校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高.甲校学生数学成绩不优秀和数学成绩优秀的频率乙校学生中数学成绩不优秀和数学成绩优秀的频率思考你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的?样本的随机性导致了两个频率间出现较大差异.变式1

网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?成绩上网合计经常上网不经常上网不及格80120200及格120680800合计2008001000等高堆积条形图比较图中阴影部分,可以发现经常上网期末考试不及格的频率明显高于经常上网期末考试及格的频率,因此可以认为经常上网与学习成绩有关.小组互助4.假设在本小节“问题”中,只是随机抽取了44名学生,按照性别和体育锻炼情况整理为如下的列联表:性别锻炼合计不经常经常女生51520男生61824合计113344(1)据此推断性别因素是否影响学生锻炼的经常性;(2)说明你的推断结论是否可能犯错,并解释原因.(2)推断可能犯错误.因为样本是通过随机抽样得到的,频率具有随机性.

前面我们通过2×2列联表整理成对分类变量的样本观测数据,并根据随机事件频率的稳定性推断两个分类变量之间是否有关联.对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算.教师点拨零假设或原假设零假设H0:分类变量X和Y独立.思考如何利用2×2列联表中的数据,构造适当的统计量,对成对分类变量X和Y是否相互独立作出推断?XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+da+b+c+d随机变量χ2取值的大小可作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.那么,究竟χ2大到什么程度,可以推断H0不成立呢?或者说,怎样确定判断χ2大小的标准呢?χ2计算公式:小概率值α的临界值:对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.概率值α越小,临界值xα越大.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.例2依据小概率值α=0.1的χ2独立性检验,分析例1中的抽样数据,能否据此推断两校学生的数学成绩优秀率有差异?学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828小组互助思考例1和例2都是基于同一组数据的分析,但却得出了不同的结论,你能说明其中的原因吗?相对于简单比较两个频率的推断,用χ2独立性检验得到的结果更理性、更全面,理论依据也更充分.抽样数据中两个频率的差异很有可能是由样本随机性导致的.小组互助变式2

某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,依据α=0.001的独立性检验,分析数学成绩优秀分别与物理、化学、总分优秀的相关性.注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.数学成绩物理优秀化学优秀总分优秀优秀228225267非优秀14315699例3某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.疗法疗效合计未治愈治愈甲155267乙66369合计21115136α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828小组互助观察在例3的2×2列联表中,若对调两种疗法的位置或对调两种疗效的位置,则卡方计算公式中a,b,c,d的赋值都会相应地改变.这样做会影响χ2取值的计算结果吗?疗法疗效合计未治愈治愈甲155267乙66369合计21115136对调两种疗法的位置,不会影响χ2取值的计算结果,同理对调两种疗效的位置也不会影响结果.对调前疗法疗效合计未治愈治愈乙66369甲155267合计21115136对调后小组互助变式3某周末,某公园内汇聚了八方来客.面对该公园内相邻的两个主题园区A和B,成年人和未成年人选择游玩的意向会有所不同.某统计机构对公园内的100位游客(这些游客只在两个主题园区中二选一)进行了问卷调查.调查结果显示,在被调查的50位成年人中,只有10人选择A,而选择A的未成年人有20人.(1)根据题意,请将下面的2×2列联表填写完整;年龄特征主题园区合计选择A选择B成年人104050未成年人203050合计3070100(2)根据小概率值α=0.01的独立性检验,分析选择哪个主题园区与年龄特征的相关性.年龄特征主题园区合计选择A选择B成年人104050未成年人203050合计3070100零假设为H0:吸烟与患肺癌之间无关联.例4为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,如下表所示.依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险.吸烟肺癌合计非肺癌患者肺癌患者非吸烟者7775427817吸烟者2099492148合计9874919965α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根据小概率值α=0.001的χ2独立性检验,推断H0不成立,即认为吸烟与患肺癌有关联,此推断犯错误的概率不大于0.001.吸烟更容易引发肺癌.小组互助小组互助变式4

为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿者性别男女需要4030不需要160270(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例.(2)试根据小概率值α=0.01的独立性检验,分析该地区老年人需要志愿者提供帮助是否与性别有关.小组互助例5

某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民仅有一次参加机会,通过简单随机抽样,得到参与问卷调查的100人的得分(满分:100分)数据,统计结果如表所示.组别[40,50)[50,60)[60,70)[70,80)[80,90)[90,100)男235151812女051010713(1)若规定问卷得分不低于70分的市民称为“环保关注者”,请列出2×2列联表,依据小概率值α=0.05的独立性检验,分析“环保关注者”是否与性别有关.(2)若问卷得分不低于80分的人称为“环保达人”,视频率为概率:①在我市所有“环保达人”中,随机抽取3人,求抽取的3人中,既有男“环保达人”又有女“环保达人”的概率;②为了鼓励市民关注环保,针对此次的调查制定了如下奖励方案:“环保达人”获得两次抽奖活动;其他参与的市民获得一次抽奖活动,每次抽奖获得红包的金额和对应的概率如下表:小组互助变式5

为比较注射A,B两种药物产生的皮肤疱疹的面积,选200只家兔作试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2所示的分别是注射药物A和药物B后皮肤疱疹面积的频数分布.(疱疹面积单位:mm2)表1疱疹面积[60,65)[65,70)[70,75)[75,80]频数30402010表2疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85]频数1025203015(1)完成图①和图②所示的分别注射药物A,B后皮肤疱疹面积的频率分布直方图,并求注射药物A后疱疹面积的中位数;图①

图②(2)完成下面的2×2列联表,依据小概率值α=0.001的独立性检验,分析注射两种药物是否与疱疹面积有关.注射药物疱疹面积合计疱疹面积小于70

mm2疱疹面积不小于70

mm2注射药物Aa=70b=30100注射药物Bc=35d=65100合计105952001.对于例3中的抽样数据,采用小概率值α=0.05的独立性检验,分析乙种疗法的效果是否比甲种疗法好.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根据小概率值α=0.05的χ2独立性检验,推断H0不成立,即认为两种疗法的效果有差异,该推断犯错误的概率不超过0.05.可以推断乙种疗法的效果比甲种疗法好.疗法疗效合计未治愈治愈甲155267乙66369合计211151363.为考察某种药物A对预防疾病B的效果,进行了动物试验,根据105个有放回简单随机样本的数据,得到如下列联表:依据α=0.05的独立性检验,分析药物A对预防疾病B的有效性.药物A疾病B合计未患病患病未服用291544服用471461合计7629105α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828零假设为H0:药物A与预防疾病B无关联,即药物A对预防疾病B没有效果.根据小概率值α=0.05的χ2独立性检验,没有充分证据推断H0不成立,即可以认为药物A对预防疾病B没有效果.解:4.从某学校获取了容量为400的有放回简单随机样本,将所得数学和语文期末考试成绩的样本观测数据整理如下:依据α=0.05的独立性检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论