1.2独立性检验的基本思想及其初步应用_第1页
1.2独立性检验的基本思想及其初步应用_第2页
1.2独立性检验的基本思想及其初步应用_第3页
1.2独立性检验的基本思想及其初步应用_第4页
1.2独立性检验的基本思想及其初步应用_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.2独立性检验的基本思想及初步应用,一、创设情境,课前实习作业:课题“高中生喜欢甜食与性别的关系”,喜欢不喜欢,男女,二、探究思考,变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量,分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国籍,年龄,出生月份等等。,(1)分类变量:,二、探究思考,(2)列联表:列出的两个分类变量的频数表,表1高中生是否喜欢甜食与性别列联表,列联表是两个或两个以上分类变量的汇总统计表,现阶段我们仅限于研究两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表称为22列联表。,二、探究思考,(2)列联表:列出两个分类变量的频数表,表1高中生是否喜欢甜食与性别列联表,二、探究思考,表1高中生是否喜欢甜食与性别列联表,研究方法,二、探究思考,表1高中生是否喜欢甜食与性别列联表,研究方法(1)计算比例男同学中喜欢甜食者的比例:女同学中喜欢甜食者的比例:,二、探究思考,研究方法(2)绘制图表,二、探究思考,思考:怎样才能精确地判断两个分类变量是否有关呢?,我们从比例、图形上可以得到结论:男和女喜欢甜食的可能性存在差异,但又不能从正面严格证明,所以我们可以考虑什么方法呢?提示:正难则反,二、探究思考,思考:怎样才能精确地判断两个分类变量是否有关呢?,为使研究的问题更具有一般性,我们用字母代替列联表的中数据,表2分类变量X与Y的22列联表,二、探究思考,思考:怎样才能精确地判断两个分类变量是否有关呢?,为使研究的问题更具有一般性,我们用字母代替列联表的中数据,表2分类变量X与Y的22列联表,二、探究思考,其中n=a+b+c+d为样本容量,假设H0:喜欢甜食与性别无关,则男、女生喜欢甜食的比例差不多,即,|adbc|越小,说明我们的假设H0成立的可能性就越大,即性别与是否喜欢音乐之间的关系越弱.,表2分类变量X与Y的22列联表,其中n=a+b+c+d为样本容量,|adbc|越小,说明无关的可能性就越,假设H0:喜欢甜食与性别无关,基于上述分析,统计学上构造一个随机变量:,|adbc|越大,说明无关的可能性就越,二、探究思考,表2分类变量X与Y的22列联表,第二步:列出22列联表,第一步:假设H0:喜欢甜食与性别无关,怎样用K2说明两个分类变量是否相关呢随机变量:,第三步:计算K2的观测值,二、探究思考,第四步:查对临界值表,作出判断,怎样用K2说明两个分类变量是否相关呢随机变量:,二、探究思考,(3)独立性检验:利用随机变量K2来判断“两个分类变量有关系”的方法,二、探究思考,反证法原理与独立性检验原理的比较,二、探究思考,三、例题讲解,例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.能否在犯错误不超过0.01的前提下认为秃顶与患心脏病有关系?,三、例题讲解,例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.能否在犯错误不超过0.01的前提下认为秃顶与患心脏病有关系?,假设H0:秃顶与患心脏病没有关系,根据列联表计算K2的观察值为:,在犯错误不超过0.01的前提下认为秃顶与患心脏病有关系,三、例题讲解,1.如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()(A)性别与喜欢理科无关(B)女生中喜欢理科的比为80%(C)男生比女生喜欢理科的可能性大些(D)男生不喜欢理科的比为60%,四、应用巩固,2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用22列联表进行独立性检验,经计算K2=8.01,则认为“喜欢乡村音乐与性别有关系”的会犯错误的概率不超过(),(A)0.999(B)0.99(C)0.01(D)0.001,四、应用巩固,3.(2017年全国)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,四、应用巩固,(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;,四、应用巩固,(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;,四、应用巩固,4.(2018全国)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:,四、应用巩固,(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:,(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?,四、应用巩固,1.独立性检验的步骤,2.反证法和独立性检验原理的比较,1.习题1.2P16第1.2题2.导与练P58P51523.实习作业:请同学们根据自己对身边事物的观察,通过查阅资料、讨论等方式,确定要研究

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论