独立性检验的基本思想及其初步应用课件_第1页
独立性检验的基本思想及其初步应用课件_第2页
独立性检验的基本思想及其初步应用课件_第3页
独立性检验的基本思想及其初步应用课件_第4页
独立性检验的基本思想及其初步应用课件_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、32独立性检验的基本思想及其初步应用32独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用1了解分类变量的意义2了解22列联表的意义3了解随机变量K2的意义4通过对典型案例分析,了解独立性检验的基本思想和方法. 1了解分类变量的意义122列联表的意义(重点)2随机变量K2的计算及应用(重点)3独立性检验的基本思想(难点) 122列联表的意义(重点)独立性检验的基本思想及其初步应用饮用水的质量是人类普遍关心的问题据统计,饮用优质水的518人中,身体状况优秀的有466人;饮用水质一般的312人中,身体状况优秀的有218人人的身体健康状况与饮用水的质量有关系吗?饮用水的质量是人类普遍关

2、心的问题据统计,饮用优质水的518122列联表(1)分类变量的定义变量的不同“值”表示,像这样的变量称为分类变量(2)22列联表的定义假设有两个分类变量X和Y,它们的取值分别为 和,其样本频数列联表(也称为22列联表)为:个体所属的不同类别x1,x2y1,y2122列联表个体所属的不同类别x1,x2y1,y2y1y2总计x1ababx2cdcd总计acbdabcdabcd y1y2总计x1ababx2cdcd总计acbda3独立性检验的定义及判断方法(1)独立性检验的定义利用随机变量K2来判断“ ”的方法,称为独立性检验(2)独立性检验的方法有列联表法、等高条形图法及K2公式法两个分类变量有关

3、系3独立性检验的定义及判断方法两个分类变量有关系1如果根据性别与是否爱好运动的列联表得到K23.8523.841,所以判断性别与运动有关,那么这种判断犯错的可能性不超过()A2.5%B0.5%C1% D5%解析:P(K23.841)0.05,故“判断性别与运动有关”出错的可能性为5%.答案:D1如果根据性别与是否爱好运动的列联表得到K23.8522假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其22列联表为:y1y2总计x1ababx2cdcd总计acbdabcd2假设有两个分类变量X和Y,它们的值域分别为x1,x2对同一样本,以下数据能说明X与Y有关的可能性最大的一组为(

4、)Aa5,b4,c3,d2 Ba5,b3,c4,d2Ca2,b2,c4,d5 Da2,b3,c4,d5独立性检验的基本思想及其初步应用解析:对于同一样本,|adbc|越小,说明x与y相关性越弱,而|adbc|越大,说明x与y相关性越强,通过计算知,对于A,B,D都有|adbc|1012|2.对于选项C,有|adbc|158|7,显然72.答案:C独立性检验的基本思想及其初步应用3统计推断,当_时,有95%的把握说事件A和B有相关关系;当_时,认为没有充分的证据显示事件A与B是有相关关系的解析:结合K2临界值表可知,当K23.841时有95%的把握说事件A与B有关;当K22.706时认为没有充分

5、的证据显示事件A与B是有关的答案:K23.841K22.7063统计推断,当_时,有95%的把握说事件A和4巴西医生马廷恩收集犯有各种贪污、受贿罪的官员与廉洁官员寿命的调查资料:500名贪官中有348人的寿命小于平均寿命,152人的寿命大于或等于平均寿命;590名廉洁官员中有93人的寿命小于平均寿命,497人的寿命大于或等于平均寿命这里,平均寿命是指“当地人均寿命”能否在犯错误的概率不超过0.01的前提下认为官员在经济上是否清廉与他们寿命的长短之间有关系?4巴西医生马廷恩收集犯有各种贪污、受贿罪的官员与廉洁官员寿解析:据题意列22列联表如下:解析:据题意列22列联表如下:独立性检验的基本思想及

6、其初步应用独立性检验的基本思想及其初步应用(2019湖南高考)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110(2019湖南高考)通过随机询问110名性别不同的大学生是P(K2k)0.0500.0100.001k3.8416.63510.828P(K2k)0.0500.0100.001k3.8416.参照附表,得到的正确结论是()A在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C有99%以上的把握认为“爱好该项运动与性别

7、有关”D有99%以上的把握认为“爱好该项运动与性别无关”参照附表,得到的正确结论是()解析:根据独立性检验的定义,由K27.86.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,故选C.答案:C独立性检验的基本思想及其初步应用在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人请你根据所给数据,能否在犯错误不超过0.1的前提下认为在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机?在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情独立性检验的基本思想及其初步应用解题过程根据题意,列出22

8、列联表如下:晕机不晕机总计男乘客243155女乘客82634总计325789解题过程根据题意,列出22列联表如下:晕机不晕机总计独立性检验的基本思想及其初步应用题后感悟解独立性检验问题的基本步骤(1)认真读题,指出相关数据,得出22列联表;(2)根据22列联表中的数据,计算K2的观测值k;(3)通过观测值k与临界值k0的比较;(4)在犯错误的概率不超过的前提下能否推断“X与Y有关系”独立性检验的基本思想及其初步应用1.磨牙不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每晚都磨牙与肠道中有寄生虫有关吗?肠道中有寄生虫肠道中没有寄生虫合计每晚都磨牙22430254不磨

9、牙241 3551 379合计2481 3851 6331.磨牙不仅影响别人休息,而且可能与患某种疾病有关,下表是一独立性检验的基本思想及其初步应用某校在高三数学测试后,随机抽取部分学生进行测试成绩统计,抽取出来的所有学生,按男、女分为两组,得到如下数据:据此资料是否认为男生比女生成绩差成绩小于90分成绩不小于90分合计男生3070100女生2575100合计55145200某校在高三数学测试后,随机抽取部分学生进行测试成绩统计,抽独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用题后感悟(1)给出的随机变量K2的值k,其值越大,说明“X与Y有关系”成立的可能性越大,其值越小,说

10、明“X与Y有关系”成立的可能性越小(2)若k2.706,则认为学生成绩与性别有关独立性检验的基本思想及其初步应用2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人试分析学生选报文、理科与对外语的兴趣是否有关? 独立性检验的基本思想及其初步应用解析:根据题目所给的数据得到如下列联表:理科文科总计有兴趣13873211无兴趣9852150总计236125361解析:根据题目所给的数据得到如下列联表:理科文科总计有兴趣独立性检验的基本思想及其初步应用在国家未实

11、施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人进行问卷调查,只有80人志愿加入国家西部建设,而国家公布实施西部开发战略后,随机抽取1 200名应届大学毕业生进行问卷调查,有400人志愿加入国家西部建设问:实施西部开发战略的公布是否对应届大学毕业生的选择产生了影响?在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随独立性检验的基本思想及其初步应用规范解答据题意列出22列联表如下表: 6分志愿者非志愿者总计开发战略公布前809201 000开发战略公布后4008001 200总计4801 720 2 200规范解答据题意列出22列联表如下表:志愿者非志愿者总独立性检验的

12、基本思想及其初步应用题后感悟解此类问题的基本思路:一、先判断题目是不是判断两分类变量的相关关系;二、列22列联表,确定a,b,c,d的值;三、求K2的观测值;四、由K2值判断两分类变量的相关关系独立性检验的基本思想及其初步应用3.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件试分别用列联表、等高条形图、独立性检验的方法分析监督员甲对产品质量好坏有无影响能否在犯错误的概率不超过0.001的前提下认为质量监督员甲在不在生产现场与产品质量好坏有关系?独立性检验

13、的基本思想及其初步应用解析:(1)22列联表如下:合格品数次品数总计甲在生产现场9828990甲不在生产现场49317510总计1 475251 500解析:(1)22列联表如下:合格品数次品数总计甲在生产现由列联表可得|adbc|982174938|12 750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”独立性检验的基本思想及其初步应用(2)相应的等高条形图如图所示图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样本中次品数的频率从图中可以看出,甲不在生产现场样本中次品数的频率明显高于甲在生产现场样本中次品数的频率因此可以认为质量监督员甲在不在生产现场与

14、产品质量好坏有关系(2)相应的等高条形图如图所示独立性检验的基本思想及其初步应用1如何分析两个分类变量的相关关系?(1)通过图形直观判断两个分类变量是否相关,如等高条形图(2)独立性检验通过22列联表,计算K2的观测值,定量判断,“两个分类变量有关系” 这一结论成立的可信程度提醒这里所说的“变量”和“值”不一定是具体的数值例如性别变量,其取值为男和女两种1如何分析两个分类变量的相关关系?2独立性检验的基本思想与反证法的思想有何相似之外?反证法独立性检验要证明结论A要确认“两个分类变量有关系”在A不成立的前提下进行推理假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下计算K2推出矛盾意味着结论A成立由观测数据计算得到的K2的观测值k很大,则在一定可信程度上说明假设不合理没有找到矛盾,不能对A下任何结论,即反证法不成立根据随机变量K2的含义,可以通过概率P(K2k0)的大小来评价该假设不合理的程度有多大,从而得出“两个分类变量有关系”这一结论成立的可信程度有多大2独立性检验的基本思想与反证法的思想有何相似之外?反证法独为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论