版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《独立性检验的基本思想及其初步应用》疑难点拨一、分类变量解读分类变量也称属性变量或定性变量,它的不同“值”表示个体所属的不同类别.分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的不同类别,如性别变量,只取男、女两个值,商品的等级变量,只取一级、二级、三级等.例1(★☆☆)下列不是分类变量的是()A.近视B.成绩C.血压D.饮酒二、22列联表列联表是两个或两个以上分类变量的汇总统计表,其实质为样本频数列联表.高中阶段只研究两个分类变量的列联表,并且每个分类变量只取两个值.列联表有助于直观地观测数据之间的关系.越小,说明两个分类变量之间的关系越弱;越大,则表明两个分类变量之间的关系越强.例2(★★☆)对服用某种维生素对婴儿头发稀疏和稠密的影响调查如下:服用维生素的婴儿有60人,其中头发稀疏的有5人;不服用维生素的婴儿有60人,其中头发稀疏的有46人.请作出列联表.解题导引分清22列联表中分类变量及其值是关键.本题的研究对象有两类:维生素和头发,维生素有两类取值,即服用维生素和不服用维生素;头发也有两类取值,即头发稀疏和头发稠密.三、等高条形图等高条形图与表格相比,更能直观地反映出两个分类变量是否相互影响,常用等高条形图展示列联表数据的频率特征.观察等高条形图发现和相差很大,就判断两个分类变量之间有关系.一般地,假设有两个分类变量和,它们的取值分别为和,其22列联表为:若要推断的论述为:与有关系.可以用如下方法判断成立的可能性.在等高条形图中,可以估计满足条件的个体中具有的个体所占的比例为,也可以估计满足条件的的个体中具有的个体所占的比例为,两个比值相差越大,成立的可能性就越大.例3(★★☆)研究人员选取170名青年男女大学生,对他们进行一种心理测验.发现60名女生对该心理测验中的最后一个题目的反应是:作肯定的有18名,否定的有42名.110名男生在相同的题目上作肯定的有22名,否定的有88名.试判断性别与态度之间是否有关系.解题导引四、独立性检验1.随机变量为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量,,其中为样本容量.2.独立性检验利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验.3.独立性检验的基本思想独立性检验的基本思想类似于反证法,要判断“两个分类变量有关系”,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们所构造的随机变量应该很小.若由观测数据计算得到的的观测值很大,则说明假设不成立,即认为“两个分类变量有关系”;若观测值很小,则说明在样本数据中没有发现足够证据拒绝假设.反证法原理与独立性检验原理的比较4.独立性检验的做法可以利用独立性检验来判断两个分类变量是否有关系,并且能较精确地给出这种判断犯错误的概率.具体做法是:(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值;(2)根据观测数据计算随机变量的观测值;(3)如果,就推断“与有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”,或者在样本数据中没有发现充分的证据显示“与有关系”.在实际应用中,获取样本数据之前,常通过查阅下表确定临界值.例如:(1)若观测值,则在犯错误的概率不超过0.001的前提下认为“与有关系”;(2)若观测值,则在犯错误的概率不超过0.01的前提下认为“与有关系”;(3)若观测值,则在犯错误的概率不超过0.1的前提下认为“与有关系”;(4)若观测值,则认为在犯错误的概率不超过0.1的前提下不能判断“与有关系”,但也不能认为“与没有关系”,即不能判断与有没有关系.例4(★★☆)为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名居民是否能做到“光盘”,得到如下的列联表:附:参照附表,得到的正确结论是()A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解题导引求出的观测值对照临界值表得到结论例5(★★☆)在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?附表:解题导引分析数据绘制出列联表画等高条形图计算得结论
参考答案例1答案:B解析:近视变量有近视与不近视两种类别;血压变量有高、正常、低三种类别;饮酒变量有饮酒与不饮酒两种类别.故选B.导师点睛判断一个变量是不是为分类变量的依据是变量的取“值”不同,个体所属的类别不同,注意这里所说的“值”并不一定是一个实数.例2答案:见解析解析:如下表所示:导师点睛分清22列联表中分类变量及其值是关键.一般是两大类,每类有两个不同的取值,然后找出相关数据,列表即可.例3答案:见解析解析:根据题目所给的数据建立如下列联表:相应的等高条形图如图所示.比较来看,女生中肯定的人数的比例要高于男生中肯定的人数的比例,因此可以在某种程度上认为性别与态度之间有关系.导师点睛等高条形图是对列联表中统计数据进行处理的一种直观图形.等高条形图能更直观地看出在两分类变量频数相等的情况下,各部分所占的比例情况,因而也能粗略地判断两个分类变量是否有关系,但这种情况无法精确地给出所得结论成立的可靠程度.例4答案:C解析:由题设知:,所以的观测值,2.706<3.0303<3.841.由附表可知,有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.故选C.导师点睛解决一般的独立性检验问题,首先由所给的列联表确定的值,然后代入随机变量的计算公式求出的观测值,将与临界值进行对比,确定有多大的把握认为两个分类变量有关系.例5答案:见解析解析:(1)根据题目所给的数据画出列联表:相应的等高条形图如图所示,比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程度上认为“秃顶与患心脏病有关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 平顶山工业职业技术学院《高等数学理论教学》2024-2025学年第二学期期末试卷
- 赣南科技学院《儿歌弹唱与表演》2024-2025学年第二学期期末试卷
- 山东特殊教育职业学院《现代传感技术》2024-2025学年第二学期期末试卷
- 怀化学院《新媒体产品设计与项目管理》2024-2025学年第二学期期末试卷
- 青岛酒店管理职业技术学院《当代世界社会主义》2024-2025学年第二学期期末试卷
- 周口理工职业学院《数据库原理》2024-2025学年第二学期期末试卷
- 上海城建职业学院《外国档案管理》2024-2025学年第二学期期末试卷
- 黑龙江司法警官职业学院《食品微生物检验》2024-2025学年第二学期期末试卷
- 黑龙江旅游职业技术学院《智能信息处理综合实践》2024-2025学年第二学期期末试卷
- 黔南民族师范学院《乐理与视唱练耳四》2024-2025学年第二学期期末试卷
- 辽宁省大连市名校2026届八年级物理第一学期期末监测试题含解析
- 2025年智慧商业行业分析报告及未来发展趋势预测
- 《机械基础(第七版)》课件(中)
- 2025年健康服务与管理专升本健康管理试卷(含答案)
- 2025年党政领导干部选拔任用考试模拟试卷及答案(共两套)
- 企业年度预算制定与执行分析模板
- 2025年云南职教高考真题及答案
- 汽车维修基础知识培训总结
- DB44∕T 2544-2024 黑木相思栽培技术规程
- 2025年浙江省纪委监委公开遴选公务员笔试试题及答案解析
- 开店基础知识培训课件
评论
0/150
提交评论