




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.2独立性检验的基本思想及其初步应用,第一章统计案例,学习目标,1.了解分类变量的意义.2.了解22列联表的意义.3.了解随机变量K2的意义.4.通过对典型案例的分析,了解独立性检验的基本思想与方法.,问题导学,达标检测,题型探究,内容索引,问题导学,知识点一分类变量及22列联表,思考某城市随机抽取一年(365天)内100天的空气质量指数API(AirPollutionIndex)的监测数据,结果统计如下:,若本次抽取的样本数据有30天是在供暖季,其中有7天为重度污染,完成下面表格.,23,7,30,65,5,70,88,12,梳理(1)分类变量变量的不同“值”表示个体所属的,像这样的变量称为分类变量.(2)列联表定义:列出的两个分类变量的,称为列联表.22列联表一般地,假设有两个分类变量X和Y,它们的取值分别为和,其样本频数列联表(也称为22列联表)为下表.,不同类别,频数表,x1,x2,y1,y2,知识点二等高条形图,1.与表格相比,图形更能直观地反映出两个分类变量间是否,常用等高条形图展示列联表数据的特征.2.如果通过计算或等高条形图发现和相差很大,就判断两个分类变量之间.,相互影响,频率,有关系,知识点三独立性检验,1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.,其中nabcd为样本容量.3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定.,临界值k0,(2)利用公式计算随机变量K2的.(3)如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在不超过的前提下不能推断“X与Y有关系”,或者在样本数据中支持结论“X与Y有关系”.,观测值k,kk0,犯错误的概率,没有发现足够证据,1.利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.()2.在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算K2的观测值k27.63,根据这一数据进行分析,我们有理由认为打鼾与患心脏病是无关的.()3.在独立性检验中,当K26.635时,我们有99%的把握认为两分类变量有关,是指“两分类变量有关”这一结论的可信度为99%,而不是两分类变量有关系的概率为99%.(),思考辨析判断正误,4.独立性检验的基本思想类似于反证法.()5.利用K2进行独立性检验,可对推断犯错误的概率作出估计,其估计可靠性与样本容量n无关.()6.列联表仅对两个分类变量汇总统计.(),题型探究,例1为调查某生产线上某质量监督员甲在不在场对产品质量的好坏有无影响,现统计数据如下:质量监督员甲在场时,990件产品中合格品有982件,次品有8件;甲不在场时,510件产品中合格品有493件,次品有17件.试分别用列联表和等高条形图对数据进行分析.,类型一直观分析两个分类变量的关联性,解答,解根据题目所给数据得如下22列联表:,由列联表看出|adbc|982174938|12750,数较大,所以可在某种程度上认为“质量监督员甲在不在场与产品质量有关”.等高条形图如图所示.,所以由等高条形图可知,在某种程度上,可认为“质量监督员甲在不在场与产品质量有关”.,反思与感悟(1)利用列联表直接计算adbc,如果差的绝对值很大,就判断两个分类变量之间有关系.(2)在等高条形图中展示列联表数据的频率特征,比较图中两个深色条的高可以发现两者频率不一样而得出结论.这种直观判断的不足之处在于不能给出推断“两个分类变量有关系”犯错误的概率.,跟踪训练1某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,试作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.,解答,解考前心情紧张与性格类型列联表如下:,adbc33238121394106470,|adbc|比较大,说明考前心情是否紧张与性格类型有关.,图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向占的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情是否紧张与性格类型有关.,例2对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示.,类型二由K2进行独立性检验,试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别.,解答,解假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系,由表中数据得a39,b157,c29,d167,ab196,cd196,ac68,bd324,n392,由公式得K2的观测值,因为k1.7792.706,所以不能得出病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术有关系的结论,即这两种手术对病人又发作过心脏病的影响没有差别.,反思与感悟(1)独立性检验的关注点在22列联表中,如果两个分类变量没有关系,则应满足adbc0,因此|adbc|越小,关系越弱;|adbc|越大,关系越强.(2)独立性检验的具体做法根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界,然后查表确定临界值k0.,如果kk0,推断“X与Y有关系”这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.,跟踪训练2某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图.,(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;,解答,解由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053(人),记为A1,A2,A3;25周岁以下组工人有400.052(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).,(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?,解答,解由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.2515(人),“25周岁以下组”中的生产能手有400.37515(人),据此可得22列联表如下:,又因为1.7866.635,有99%的把握认为“中老年人”比“青少年人”更关注“创城”活动.,1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 微型铣床基础知识培训课件
- 微乐脊柱养生课件
- 征管保障基础知识培训课件
- 枣庄科技职业学院《汽车造型设计2》2024-2025学年第一学期期末试卷
- 五人制防守知识培训总结
- 县级医院管理创新实践路径
- 商品退换条例解读
- 胃恶性肿瘤护理要点
- 抢救药品用法及其说明
- 企业实习总结汇报
- 住友变频器说明书-翻译
- 2024品牌服务合同范本
- 注塑缺陷的原因分析与解决对策培训教程
- 常见职业病危害和预防基础知识
- 2025年九省联考新高考 物理试卷(含答案解析)
- 办公耗材项目验收方案
- 2025届广州市高三年级阶段训练(8月市调研摸底) 数学试卷(含答案)
- 《旅馆建筑设计原理》课件
- 2024-2030全球与中国探地雷达市场现状及未来发展趋势
- 火龙果病虫害
- 电梯维保服务考核标准及评分办法
评论
0/150
提交评论