独立性检验例题ppt课件_第1页
独立性检验例题ppt课件_第2页
独立性检验例题ppt课件_第3页
独立性检验例题ppt课件_第4页
独立性检验例题ppt课件_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,1.判断分类变量及其关系的方法: (1)利用数形结合思想,借助等高条形图来判断两个分类变量 是否相关是判断变量相关的常见方法. (2)一般地,在等高条形图中, 与 相差越大,两个 分类变量有关系的可能性就越大.,分类变量关系的分析,2.分析分类变量关系的步骤: (1)作大量的调查、研究,统计出结果. (2)列出列联表利用频率粗略估计. (3)作出等高条形图,从直观上进一步判断分类变量之间的关联关系.,通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出所得结论的可靠程度.,【例1】从发生交通事故的司机中抽取2 000名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事

2、故负有责任将数据整理如下: 试分析血液中含有酒精与对事故负有责任是否有关系.,【审题指导】题目已给出了22列联表,可利用等高条形图定性分析两个分类变量之间的相关性. 【规范解答】作等高条形图如下,图中阴影部分表示有酒精负责任与无酒精负责任的比例,从图中可以看出,两者差距较大,由此我们可以在某种程度上认为“血液中含有酒精与对事故负有责任”有关系.,【变式训练】某学校对在校部分学生课外活动内容进行调查,结果整理成下表: 学生喜欢课外活动的类别与性别有关系吗?试用学过的知识进行分析.,【解析】作出等高条形图如下: 由图可以直观地看出喜欢体育还是喜欢文娱,在性别上有较大差异,说明学生喜欢课外活动的类别

3、与性别在某种程度上有关系.,有关“相关性检验” 解决一般的独立性检验问题的步骤: (1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查下表确定临界值k0.,(2)根据22列联表,利用公式 计算随机变量K2的观测值k. (3)如果kk0,就推断“X与Y有关系”,这种推断犯错误的 概率不超过;否则,就认为在犯错误的概率不超过的前 提下不能推断“X与Y有关系”,或者在样本数据中没有发现 足够证据支持结论“X与Y有关系”.,通常认为k10.828, 所以在犯错误的概率不超过0.001的前提下认为“生产合格品 与设备改造有关系”.,【变式训练】为了调查患慢性气管炎是否与吸烟

4、有关,调查了339名50岁以下的人,调查结果如下表: 根据上表分析患慢性气管炎是否与吸烟有关?,【解析】a=43,b=162,c=13,d=121,a+b=205,c+d=134,a+c=56, b+d=283,n=339 代入公式得K2的观测值: 7.468 86.635. 所以在犯错误的概率不超过0.01的前提下认为“患慢性气管 炎与吸烟有关”.,【例】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:,(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿

5、者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.,附: 【审题指导】解答第(2)问时,可先计算K2的值,再对照表格作出判断.,【规范解答】(1)调查的500位老年人中有70位需要志愿者提 供帮助,因此该地区老年人中,需要志愿者提供帮助的老年 人的比例的估计值为 (2) 9.967.由于9.9676.635,所 以在犯错误的概率不超过0.01的前提下认为该地区的老年人 是否需要志愿者提供帮助与性别有关.,(3)由(2)的结论知,该地区的老年人是否需要志愿者提供帮助与性别有关,并且从样本数据能看出该地区男性老

6、年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,这比采用简单随机抽样方法更好.,【变式备选】用两种检验方法对某食品做沙门氏菌检验,结果如下表,能否在犯错误的概率不超过0.001的前提下认为两种方法和阳性结果有关系?,【解题提示】由于题目要求“犯错误的概率不超过0.001”,故需求解K2的观测值,再利用临界值的大小来判断假设是否成立.,【解析】由等高条形图(如图)可知,采用荧光抗体法与检验 结果呈阳性有关系,而通过计算可知:,查表可知,P(K210.828)0.001,而113.185远大于 10.828,所

7、以它们之间有关系的概率大于0.999,也就是说, 在犯错误的概率不超过0.001的前提下认为它们之间有关系.,独立性检验的综合应用 判断变量X与Y有无关系的三种方法: (1)22列联表:由22列联表中ad-bc的大小判断. (2)等高条形图:观察条形图中的阴影比例大小判断. (3)独立性检验:计算K2的观测值k,再利用临界值的大小判断. 其中独立性检验的方法相对较准确.,【例3】为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、等高条形图、

8、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关? 【审题指导】本题要求分别用列联表、等高条形图、独立性检验的方法分析,要注意三种方法的判断思路.,【规范解答】(1)22列联表如下: 由列联表可得ad-bc|=|98217-4938|=12 750. 相差较大,可在某种程度上认为“质量监督员甲是否在现场与产品质量有关系”.,(2)画等高条形图. 如图可知,在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.,(3)由22列联表中数据,计算得到K2的观测值为 因此,在犯错误的概率不超过0.00

9、1的前提下,认为质量监 督员甲在不在生产现场与产品质量好坏有关系.,【互动探究】将本题中的产品质量问题改为成绩优秀问题. 某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀分别与物理、化学、总分也优秀哪个关系较大? 注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.,【解析】(1)列出数学与物理优秀的22列联表 将表中数据代入公式 得观测值k1270.114 3.,(2)列出数学与化学优秀的22列联表 将表中数据代入公式计算得观测值 k2240.611 2.,(3)列出数学与总分优秀的22列联表: 将表中数

10、据代入公式计算得观测值 k3486.122 5.,由上面分析可知,数学成绩优秀分别与物理、化学、总分优秀都有关系,经计算观测值都大于6.635,说明在犯错误的概率不超过0.01的前提下,认为数学优秀分别与物理、化学、总分优秀都有关系,k3k1k2,与总分关系最大,物理次之.,【典例】(12分)(1)下表是某地区的一种传染病与饮用水的 调查表: 这种传染病是否与饮用水的卫生程度有关,请说明理由;,(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异. 【审题指导】(1)根据表中的信息计算K2的观测

11、值,并根据临界值表来分析相关性的大小,对于(2)要列出22列联表,方法同(1).,【规范解答】(1)假设H0:传染病与饮用水无关.把表中数据代入公式得: K2的观测值 54.21, 3分 54.2110.828,所以拒绝H0. 因此在犯错误的概率不超过0.001的前提下认为该地区这种传染病与饮用不干净水有关. 5分,(2)依题意得22列联表: 此时,K2的观测值 5.785. 9分 由于5.7852.706 所以在犯错误的概率不超过0.1的前提下认为该种疾病与饮用 不干净水有关. 10分,两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中在犯错误的概率不超过0.001的前提下

12、肯定结论的正确性,(2)中在犯错误的概率不超过0.1的前提下肯定结论的正确性. 12分,【误区警示】对解答本题时易犯错误具体分析如下:,【即时训练】某高校“统计初步”课程的教师随机调查了一些学生的专业情况,得到如下22列联表(单位:名): 为了判断主修统计专业是否与性别有关系,根据表中的数据计算得到K2的观测值k4.84.因为k3.841,所以认为“主修统计专业与性别有关系”.这种判断出错的可能性为_.,【解析】由k4.84,可知我们有95%的把握认为“主修统计专业与性别有关系”,故判断出错的可能性为5%. 答案:5%,1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌

13、有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是( ) (A)100个吸烟者中至少有99人患有肺癌 (B)1个人吸烟,那么这个人有99%的概率患有肺癌 (C)在100个吸烟者中一定有患肺癌的人 (D)在100个吸烟者中可能一个患肺癌的人也没有,【解析】选D.独立性检验的结果与实际问题有差异,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性存在差异.,2.分类变量X和Y的列联表如下,则( ) (A)ad-bc越小,说明X与Y的关系越弱 (B)ad-bc越大,说明X与Y的关系越强 (C)(ad-bc)2越大,说明X与Y的关系越强 (D)(ad-bc)2越接近于0,说明X与Y的关系越强,【解析】选C.由K2的计算公式可知,(ad-bc)2越大,则K2越大,故相关关系越强.,3.若由一个22列联表中的数据计算得K24.013,则两个变量有关系的概率为_. 【解析】因随机变量K2的观测值k=4.0133.841.所以在犯错误的概率不超过0.05的前提下,认为两个变量有关系. 答案:0.95,4.根据下表计算k_. 【解析】根据列联表中的数据得K2的观测值 1.78. 答案:1.78,5.运动员参加比赛前往往做热身运动,下表是一体育

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论