人教 选择性必修 第三册 第八章 成对数据的统计分析 独立性检验 教案_第1页
人教 选择性必修 第三册 第八章 成对数据的统计分析 独立性检验 教案_第2页
人教 选择性必修 第三册 第八章 成对数据的统计分析 独立性检验 教案_第3页
人教 选择性必修 第三册 第八章 成对数据的统计分析 独立性检验 教案_第4页
人教 选择性必修 第三册 第八章 成对数据的统计分析 独立性检验 教案_第5页
已阅读5页,还剩1页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第人教2019A版选择性必修第三册第八章成对数据的统计分析8.3.2独立性检验【教学内容】独立性检验【教学目标】(1)知识目标:通过实例了解独立性检验的基本思想(2)能力目标:掌握独立性检验的基本步骤(3)素养目标:会用独立性检验解决简单的实际问题,提升数据分析能力。【教学重点】独立性检验的思想方法【教学难点】χ2统计量的导出和意义【教学过程】1.问题引入及情境架设 (1)旧知回顾:在上一节课,我们学习了列联表,由随机事件的稳定性,了解并作出判断两个分类变量是否有关联,请同学们思考:用频率推断两个分类变量是否独立有什么缺点? 引导学生对频率与概率的比较,由频率具有随机性,与概率之间存在差异; 通过数据改变,由样本容量较小时,犯错误的概率较大. (2)问题激发:有没有更合理的推断方法,同时也希望对出现的错误推断的概率一定的控制或估算?由概率知识分析,如果两个事件的独立,它们的充要条件是什么? 我们需要更好的方法弥补因频率的随机性带来判断两个分类变量的不可靠性,改进提高判断的结论科学性与稳定性.如何改进提高,先回头看独立事件,我们已知道,事件与事件独立的充要条件是,这与两个分类变量的频率之间又有什么样的联系呢?2.教师引导分析与学生合作探究 我们将两个分类变量的列联表抽象简化,以0,1分别表示事件发生的两种结果,如下表所示,独立的另一层含义,即我们需要了解事件与是否存在关联? 我们知道与不独立,互为对立事件,与不独立,互为对立事件. 我们需要判断下面的假定关系:是否成立? 通常称为零假设或原假设(nullhypothesis). 这里,表示从中随机选取一个样本点,该样本点属于的概率;而表示从中随机选取一个样本点,该样本点属于的概率. 由条件概率的定义可知,零假设等价于. ; 同理:独立含义的全解(展示) 与独立; 与独立; 与独立; 与独立; 我们将列联表分类汇总: 得到,, 和对应的频率的乘积; 发生的频率的期望值; 其中与实际值应当相差不大,如何衡量两者之间的差别呢? 同理,,,,,这四个量差别也不应太大, 疑问:有没有更好的方式一次性将4个量全部考虑包含? 于是,1900年,英国数学家卡方·皮尔逊在研究的基础上,提出了如下统计量: 化简得是不是看起来更好一点?其中具体的化简过程为:(本部分内容不讲,留学有余力的同学自行完成)把代人上式各项分子,得,对上式右边的分式进行通分,得进一步化简得. 连续疑问:卡方统计量有什么用呢? 统计学家建议,用卡方的大小作为判断零假设是否成立的依据,当它比较大时推断不成立,否则认为成立.那么,究竟大到什么程度,可以推断不成立呢?或者说,怎样确定判断卡方大小的标准呢? 在假定的条件下,对于有放回简单随机抽样,当样本容量充分大时,统计学家得到了卡方的近似分布。忽略卡方的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得下面关系成立:.(*) 我们称为的临界值,这个临界值就可作为判断大小的标准.概率值越小,临界值越大.当总体很大时,抽样有、无放回对的分布影吅较小.因此,在应用中往往不严格要求抽样必须是有放回的. 由(*)式可知,只要把概率值取得充分小,在假设成立的情况下,事件是不大可能发生的.根据这个规律,如果该事件发生,我们就可以推断不成立.不过这个推断有可能犯错误,但犯错误的概率不会超过. 基于小概率值的检验规则是: 当时,我们就推断不成立,即认为和不独立, 该推断犯错误的概率不超过; 当时,我们没有充分证据推断不成立,可以认为和独立. 这种利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验(testofindependence).(小概率值)临界值表3.典例讲解,实际操作 例2.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生,通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀。依据的卡方独立性检验,试分析两校学生中数学成绩优秀率之间是否存在差异?解:零假设:分类变量与相互独立,即两校学生的数学成绩优秀率无差异根据表中的数据,计算得到,根据小概率值的卡方独立性检验,没有允分证据推断不成立,因此可以认为成立,即认为两校的数学成绩优秀率没有差异. 基于这些数据计算出的频率与例1中的相同.然而在相同的检验标准下作独立性检验,可以推出两校学生数学成绩的优秀率有明显差异,结论却发生了变化. 思考:为什么出现了与例1完全不同的结论? 例1事实上是根据两个频率的差异进行推断的,没有考虑随机性的影响。但事实上,即便两个样本来自同一个总体,也会因为随机性使得频率产生差异,因此需要用概率的方法进行推断,由于样本具有随机性,依据频率所作的推断可能会犯错误. 通常情况下,样本量越大,提供的信息越充分,观测的结果通常会更准确.与例1中的数据相比,这里的每个数据都变为原来的10倍,即样本量变为原来的10倍,这种差异无法通过频率的计算表现出来,而独立性检验可能会得出不同的结论,可见统计量能够有效地提取样本所包含的有用信息.【设计意图】利用独立性检验的方法得到的结论与例1用频率估计概率的方法得到的结论截然相反,使学生体会独立性检验的必要性。例3.某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.将所给数据进行整理,得到两种疗法治疗数据的列联表,问题:若对调两种疗法的位置或对调两种疗效的位置,这样做会影响χ2【设计意图】重点放在解释独立性检验的基本思想上,避免学生单纯地记忆处理问题的步骤和机械套用公式进行计算。 例4.为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,如下表所示.依据小概率值的独立性检验,分析吸烟是否会增加患肺癌的风险.解:零假设:吸烟与患肺癌之间无关联,根据小概率值的卡方独立性检验,推断不成立,因此可以吸烟与患肺癌之间有关联,此推断犯错误的概率不大于.用频率计算再次进行比较: 不吸烟者中患肺癌的频率:; 吸烟者中患肺癌的频率:; 其中两者的比值为:; 在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌的频率的4倍以上.于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌概率,即吸烟更容易引发肺癌。【设计意图】①通过复习列联表的制作,引导学生运用学过的知识解决问题,熟悉运用独立性检验的方法解决具体问题的步骤。②让学生亲自处理数据、解决问题,从中体会统计思维和确定性思维之间的差异。③理解独立性检验的思想过程,培养学生数据处理的能力,提升学生的数学运算、数据分析等核心素养。4.总结独立性检验的步骤 应用独立性检验解决实际问题主要环节: (1)提出零假设:和相互独立,并给出在问题中的解释. (2)根据抽样数据整理出列联表,计算的值,并与临界值比较. (3)根据检验规则得出推断结论. (4)在和不独立的情况下,根据需要,通过比较相应的频率,分析和间的影响规律.5.思考与升华 思考1:列联表中,对换行或列的值,会影响卡方的取值计算结果吗?自己动手试一试! 教师借助于GGB软件展示,结论对换行或列的值是不会影响卡方的取值计算结果. 思考2:独立性检验与反证法有什么区别? 反证法:在假设下,如果推出一个矛盾,则证明不成立;若未推出矛盾、不能对下任何结论,即反证法不成功. 独立性检验:在假设下,如果出现一个与相矛盾的小概率事件,则推断不成立,且该推断犯错误的概率不大于这个小概率.否则,不能推断不成立,通常会接受,即认为两个分类变量相互独立. 通述的讲,反证法只有两种结果中的一种,在严密正确的推理下,结论100%可靠;但独立性检验不是,结论是否成立与犯错误的概率有关系,有可能出现将正解的结论判断成错误,也有可能将错误的结论判断成正确.6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论