版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.3.2独立性检验(2)复习引入XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+da+b+c+d例题例1:某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.将所给数据进行整理,得到两种疗法治疗数据的列联表.课本132页疗法疗效合计未治愈治愈甲155267乙66369合计21115136α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根据列联表中的数据,经计算得到根据小概率值α=0.005的χ2独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异.为了研究每周累计户外暴露时间是否足够(单位:小时)与近视发病率的关系,对某中学一年级100名学生进行不记名问卷调查,得到如下数据:
近视不近视足够的户外暴露时间2035不足够的户外暴露时间3015α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(1)用样本估计总体思想估计该中学一年级学生的近视率;解:由题可知该中学一年级学生近视的人数为50,总数为100,利用样本估计总体思想可知50该中学一年级学生的近视率为练习
近视不近视足够的户外暴露时间2035不足够的户外暴露时间3015α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(2)能否在犯错误的概率不超过0.001的前提下认为不足够的户外暴露时间与近视有关系?解:零假设为H0:不足够的户外暴露时间与近视相互独立.由卡方计算公式,可得没有充分证据推断H0不成立,因此可以认为H0成立,即不足够的户外暴露时间与近视没有关系.(3)能否在犯错误的概率不超过0.01的前提下认为不足够的户外暴露时间与近视有关系?在犯错误的概率不超过0.01的前提下可以推断H0不成立,即认为不足够的户外暴露时间与近视有关系.
近视不近视足够的户外暴露时间2035不足够的户外暴露时间3015α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:零假设为H0:不足够的户外暴露时间与近视相互独立.反思归纳
对犯错误概率的解释在零假设H0成立的前提下,随着小概率值α的逐渐减小,χ2统计量对应的临界值xα逐渐增大,则事件{χ2≥xα}越来越不容易发生,零假设越来越不容易被拒绝;随着小概率值α的逐渐增大,χ2统计量对应的临界值xα逐渐减小,则事件{χ2≥xα}越来越容易发生,零假设越来越容易被拒绝.例如,对于例1中的数据,经计算得χ2≈4.881.(1)当小概率值α=0.005时,x0.005=7.879,此时χ2≈4.881<7.879,则没有充分理由拒绝零假设.因此可以接受H0,即认为两种疗法的效果没有差异.(2)当小概率值α=0.05时,x0.05=3.841,此时χ2≈4.881>3.841,则拒绝零假设,即认为两种疗法的效果有差异,该推断犯错误的概率不超过0.05.(3)当小概率值α=0.1时,x0.05=2.706,此时χ2≈4.881>2.706,则拒绝零假设,即认为两种疗法的效果有差异,该推断犯错误的概率不超过0.1.观察:在例1的2×2列联表中,若对调两种疗法的位置或对调两种疗效的位置,则卡方计算公式中a,b,c,d的赋值都会相应地改变.这样做会影响χ2取值的计算结果吗?疗法疗效合计未治愈治愈甲155267乙66369合计21115136这说明,对调两种疗法的位置,不会影响χ2取值的计算结果,同理对调两种疗效的位置也不会影响结果.对调前疗法疗效合计未治愈治愈乙66369甲155267合计21115136对调后解:零假设为H0:吸烟与患肺癌之间无关联.例2:为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,如下表所示.依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险.吸烟肺癌合计非肺癌患者肺癌患者非吸烟者7775427817吸烟者2099492148合计9874919965α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828例题根据列联表中的数据,经计算得到课本133页吸烟肺癌合计非肺癌患者肺癌患者非吸烟者7775427817吸烟者2099492148合计9874919965α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根据小概率值α=0.001的χ2独立性检验,推断H0不成立,即认为吸烟与患肺癌有关联,此推断犯错误的概率不大于0.001.根据列联表中的数据计算,不吸烟者中不患肺癌和患肺癌的频率
分别为吸烟者中不患肺癌和患肺癌的频率分别为可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌的频率的4倍以上,于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌的概率,即吸烟更容易引发肺癌.吸烟肺癌合计非肺癌患者肺癌患者非吸烟者7775427817吸烟者2099492148合计9874919965应用独立性检验解决实际问题大致应包括以下几个主要环节:(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.注意,上述几个环节的内容可以根据不同情况进行调整.例如,在有些时候,分类变量的抽样数据列联表是问题中给定的.反思归纳思考:独立性检验的思想类似于我们常用的反证法,你能指出二者之间的相同和不同之处吗?简单地说,反证法是在某种假设H0之下,推出一个矛盾结论,从而证明H0不成立;而独立性检验是在零假设H0之下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不大于这个小概率.另外,在全部逻辑推理正确的情况下,反证法不会犯错误,但独立性检验会犯随机性错误.独立性检验的本质是比较观测值与期望值之间的差异,由χ2所代表的这种差异的大小是通过确定适当的小概率值进行判断的.这是一种非常重要的推断方法,不仅有相当广泛的应用,也开启了人类认识世界的一种新的思维方式.课本134页1.对于例1中的抽样数据,采用小概率值α=0.05的独立性检验,分析乙种疗法的效果是否比甲种疗法好.解:根据题意,可得α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根据小概率值α=0.05的χ2独立性检验,推断H0不成立,即认为两种疗法的效果有差异,该推断犯错误的概率不超过0.05.甲种疗法未治愈和治愈的频率分别是乙种疗法未治愈和治愈的频率分别是因此可以推断乙种疗法的效果比甲种疗法好.练习课本134页2.从某学校获取了容量为400的有放回简单随机样本,将所得数学和语文期末考试成绩的样本观测数据整理如下:
依据α=0.05的独立性检验,能否认为数学成绩与语文成绩有关联?数学成绩语文成绩合计不优秀优秀不优秀21261273优秀5473127合计266134400α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:零假设为H0:数学成绩与语文成绩独立,即数学成绩与语文成绩没有关联.根据列联表中数据,经计算得到根据小概率值α=0.05的χ2独立性检验,我们可以推断H0不成立,即认为数学成绩与语文成绩有关联,该推断犯错误的概率不超过0.05.数学成绩语文成绩合计不优秀优秀不优秀21261273优秀5473127合计266134400α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828数学成绩不优秀的人中语文成绩不优秀和优秀的频率分别为数学成绩优秀的人中语文成绩不优秀和优秀的频率分别为由此可以看出,数学成绩优秀的人中语文成绩优秀的频率明显高于数学成绩不优秀的人中语文成绩优秀的频率.根据频率稳定于概率的原理,我们可以推断,数学成绩优秀的人其语文成绩优秀的概率较大.数学成绩语文成绩合计不优秀优秀不优秀21261273优秀5473127合计2661344001.某校为了研究“学生的性别”和“对待某一活动的态度”是否有关,运用2×2列联表进行独立性检验,经计算χ2=7.069,则认为“学生性别与支持某项活动有关系”的犯错误的概率不超过(
)A.0.1%B.1% C.99%D.99.9%解析:∵χ2=7.069>6.635=x0.01,∴认为“学生性别与支持某项活动有关系”的犯错误的概率不超过1%.随堂检测2.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则___在犯错误的概率不超过0.005的前提下推断实验效果与教学措施有关(填“能”“不能”).班级成绩合计优、良、中差实验班48250对比班381250合计8614100能3.世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:
不喜欢西班牙队喜欢西班牙队合计高于40岁pq50不高于40岁153550合计ab100若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为
,则在犯错误的概率不超过______的前提下认为年龄与西班牙队的被喜欢程度有关.5%α0.150.100.050.0250.0100.0050.001xα2.0722.7063.8415.0246.6357.87910.828解析:设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A,所以q=25,p=25,a=40,b=60.依据小概率值α=0.05的独立性检验,认为年龄与西班牙队的被喜欢程度有关,此推断犯错误的概率不超过5%.4.某校对学生课外活动进行调查,结果整理成下表,根据小概率值α=0.005的独立性检验,能否认为“喜欢体育还是文娱与性别有关系”?性别课外活动合计喜欢体育喜欢文娱男212344女62935合计275279解:零假设为H0:喜欢体育还是喜欢文娱与性别没有关系.∵a=21,b=23,c=6,d=29,n=79,根据小概率值α=0.005的χ2独立性检验,我们推断H0不成立,即认为喜欢体育还是喜欢文娱与性别有关系,此推断犯错误的概率不大于0.005.5.某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层随机抽样的方法,收集300位学生每周平均体育运动时间(单位:时)的样本数据.(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 道路施工过程中的技术创新方案
- 施工现场防水事故防范方案
- 工程进度跟踪与调整方案
- 2025江苏省阑尾切除术药物治疗路径专家共识(第一版)课件
- 污水处理厂提标升级项目社会稳定风险评估报告
- 施工现场职业病防治方案
- 混凝土结构维修与养护方案
- 2026辽宁省水利厅直属事业单位面向部分院校招聘14人参考题库含答案
- 污水管网及处理设施提升改造工程经济效益和社会效益分析报告
- 城市燃气管道应急响应预案制定
- 陕西省建筑场地墓坑探查与处理技术规程
- 2022-2023学年四川省乐山市市中区外研版(三起)六年级上册期末测试英语试卷(含听力音频)
- 滕州菜煎饼创新创业计划书
- 2024北京朝阳区初一(上)期末道法试卷及答案
- 假体隆胸后查房课件
- 送货单格式模板
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验
- 关于地方储备粮轮换业务会计核算处理办法的探讨
- 上海农贸场病媒生物防制工作标准
- YY 0334-2002硅橡胶外科植入物通用要求
- GB/T 1773-2008片状银粉
评论
0/150
提交评论