2024-2025学年高中数学第3章统计案例3.1独立性检验讲义新人教B版选修2-3_第1页
2024-2025学年高中数学第3章统计案例3.1独立性检验讲义新人教B版选修2-3_第2页
2024-2025学年高中数学第3章统计案例3.1独立性检验讲义新人教B版选修2-3_第3页
2024-2025学年高中数学第3章统计案例3.1独立性检验讲义新人教B版选修2-3_第4页
2024-2025学年高中数学第3章统计案例3.1独立性检验讲义新人教B版选修2-3_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE1-3.1独立性检验学习目标:1.了解分类变量、2×2列联表、随机变量χ2的意义.2.通过对典型案例的分析,了解独立性检验的基本思想方法.(重点)3.通过对典型案例的分析,了解两个分类变量的独立性检验的应用.(难点)教材整理独立性检验阅读教材P77~P78例2以上部分,完成下列问题.1.卡方统计量χ2=eq\f(nn11n22-n12n212,n1+n2+n+1n+2),用χ2的大小可以确定是否拒绝原来的统计假设H0.假如算出的χ2值较大,就拒绝H0,也就是拒绝“事务A与B无关”,从而就认为它们是有关的了.2.两个临界值(1)当依据详细的数据算出的χ2>3.841时,有95%的把握说事务A与B有关;(2)当χ2>6.635时,有99%的把握说事务A与B有关,当χ2≤3.841时,认为事务A与B是无关的.1.推断(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念.()(2)独立性检验的方法就是反证法.()(3)独立性检验中可通过统计表从数据上说明两分类变量的相关性的大小.()【答案】(1)×(2)×(3)√2.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:种子处理种子未处理合计得病32101133不得病61213274合计93314407依据以上数据可得出()A.种子是否经过处理与是否生病有关B.种子是否经过处理与是否生病无关C.种子是否经过处理确定是否生病D.有90%的把握认为种子经过处理与生病有关【解析】χ2=eq\f(407×32×213-61×1012,93×314×133×274)≈0.164<3.841,即没有足够的理由认为种子是否经过处理跟生病有关.【答案】B3.若由一个2×2列联表中的数据计算得χ2=4.013,那么有__________的把握认为两个变量之间有关系.【解析】查阅χ2表知有95%的把握认为两个变量之间有关系.【答案】95%用2×2列联表分析两变量间的关系【例1】在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33人则以肉类为主.请依据以上数据作出饮食习惯与年龄的列联表,并利用eq\f(n11,n1+)与eq\f(n21,n2+)推断二者是否有关系.【精彩点拨】eq\x(对变量进行分类)→eq\x(求出分类变量的不同取值)→eq\x(作出2×2列联表)→eq\x(计算\f(n11,n1+)与\f(n21,n2+)的值作出推断)【解】饮食习惯与年龄2×2列联表如下:年龄在六十岁以上年龄在六十岁以下合计饮食以蔬菜为主432164饮食以肉类为主273360合计7054124将表中数据代入公式得eq\f(n11,n1+)=eq\f(43,64)≈0.67,eq\f(n21,n2+)=eq\f(27,60)=0.45.明显二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,留意应当是4行4列,计算时要精确无误.2.作2×2列联表时,关键是对涉及的变量分清类别.1.上例中条件不变,尝试用|n11n22-n12n21|的大小推断饮食习惯与年龄是否有关.【解】将本例2×2列联表中的数据代入可得|n11n22-n12n21|=|43×33-21×27|=852.相差较大,可在某种程度上认为饮食习惯与年龄有关系.由χ2进行独立性检验【例2】在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.未感冒感冒合计运用血清258242500未运用血清216284500合计4745261000【精彩点拨】独立性检验可以通过2×2列联表计算χ2的值,然后和临界值比照作出推断.【解】假设感冒与是否运用该种血清没有关系.由列联表中的数据,求得χ2=eq\f(1000×258×284-242×2162,474×526×500×500)≈7.075.χ2=7.075>6.635,P(χ2≥6.635)=0.01,故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.1.独立性检验的关注点在2×2列联表中,假如两个分类变量没有关系,则应满意n11n22-n12n21≈0,因此|n11n22-n12n21|越小,关系越弱;|n11n22-n12n21|越大,关系越强.2.独立性检验的详细做法(1)依据实际问题的须要确定允许推断“事务A与B有关系”犯错误的概率的上界α,然后查表确定临界值k0.(2)利用公式χ2=eq\f(nn11n22-n12n212,n1+n2+n+1n+2)计算随机变量χ2.(3)假如χ2≥k0,推断“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发觉足够的证据支持结论“X与Y有关系”.2.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:患胃病未患胃病合计生活不规律60260320生活有规律20200220合计80460540依据以上数据推断40岁以上的人患胃病与生活规律有关吗?【解】由公式得χ2=eq\f(54060×200-260×202,320×220×80×460)≈9.638.∵9.638>6.635,∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.独立性检验的综合应用[探究问题]1.利用χ2进行独立性检验,估计值的精确度与样本容量有关吗?【提示】利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越精确,假如抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有牢靠性.2.在χ2运算后,得到χ2的值为29.78,在推断变量相关时,P(χ2≥6.635)≈0.01和P(χ2≥7.879)≈0.005,哪种说法是正确的?【提示】两种说法均正确.P(χ2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P(χ2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.【例3】为调查某地区老年人是否须要志愿者供应帮助,用简洁随机抽样方法从该地区调查了500位老年人,结果如下:男女须要4030不须要160270(1)估计该地区老年人中,须要志愿者供应帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否须要志愿者供应帮助与性别有关?(3)依据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中须要志愿者供应帮助的老年人的比例?说明理由.【精彩点拨】依据题中表格供应的数据,可通过求χ2的值进行判定.对于(1)(3)可依据古典概率及抽样方法分析求解.【解】(1)调查的500位老年人中有70位须要志愿者供应帮助,因此该地区老年人中,须要帮助的老年人的比例的估计值为eq\f(70,500)=14%.(2)χ2=eq\f(500×40×270-30×1602,200×300×70×430)≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否须要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否须要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中须要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采纳分层抽样方法进行抽样,这比采纳简洁随机抽样方法更好.1.检验两个变量是否相互独立,主要依据是利用χ2=eq\f(nn11n22-n12n212,n1+n2+n+1n+2)公式计算χ2的值,再利用该值与3.841,6.635两个值进行比较作出推断.2.χ2计算公式较困难,一是公式要清晰;二是代入数值时不能张冠李戴;三是计算时要细心.3.统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推想全部数据的性质.因此,统计推断是可能犯错误的,即从数据上体现的只是统计关系,而不是因果关系.3.若两个分类变量x和y的列联表为:yxy1y2x1515x24010则x与y之间有关系的概率约为________.【解析】χ2=eq\f(5+15+40+105×10-40×152,5+1540+105+4015+10)≈18.822.∵18.822>6.635,∴x与y之间有关系的概率约为1-0.01=0.99.【答案】0.991.下列选项中,哪一个χ2的值可以有95%以上的把握认为“A与B有关系”()A.χ2=2.700 B.χ2=2.710C.χ2=3.765 D.χ2=5.014【解析】∵5.014>3.841,故D正确.【答案】D2.通过随机询问110名性别不同的高校生是否爱好某项运动,得到如下的列联表:男女合计爱好402060不爱好203050合计6050110经计算得χ2=eq\f(110×40×30-20×202,60×50×60×50)≈7.8.则正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【解析】依据独立性检验的思想方法,正确选项为C.【答案】C3.在一个2×2列联表中,由其数据计算得χ2=13.097,认为“两个变量有关系”犯错误的概率不超过________.【解析】假如χ2>6.635时,认为“两变量有关系”犯错误的概率不超过0.01.【答案】0.014.某高校在探讨性别与职称(分正教授、副教授)之间是否有关系,你认为应当收集的数据是________.【解析】由探讨的问题可知,需收集的数据应为男正教授人数,女正教授人数,男副教授人数,女副教授人数.【答案】男正教授人数,女正教授人数,男副教授人数,女副教授人数5.调查某医院某段时间内婴儿诞生的时间与性别的关系,得到下面的数据:诞生时间在晚上的男婴为24人,女婴为8人;诞生时间在白天的男婴为31人,女

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论