版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.3列联表与独立性检验
第八章
成对数据的统计分析1.知识梳理为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用_____表示.知识点一分类变量实数知识点二2×2列联表1.2×2列联表给出了成对分类变量数据的
.2.定义一对分类变量X和Y,我们整理数据如下表所示:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d像这种形式的数据统计表称为2×2列联表.交叉分类频数知识点三独立性检验1.定义:利用χ2的取值推断分类变量X和Y
的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.2.χ2=
,其中n=a+b+c+d.3.独立性检验解决实际问题的主要环节(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.(3)根据检验规则得出推断结论.(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.是否独立思考独立性检验与反证法的思想类似,那么独立性检验是反证法吗?答案不是.因为反证法不会出错,而独立性检验依据的是小概率事件几乎不发生.1.分类变量中的变量与函数的变量是同一概念.(
)2.等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小.(
)3.事件A与B的独立性检验无关,即两个事件互不影响.(
)4.χ2的大小是判断事件A与B是否相关的统计量.(
)思考辨析判断正误SIKAOBIANXIPANDUANZHENGWU√√××2.题型探究一、等高堆积条形图的应用例1
为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别尿棕色素合计阳性数阴性数铅中毒病人29736对照组92837合计383573试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?解等高堆积条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.跟踪训练1
网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用等高堆积条形图判断学生学习成绩与经常上网有关吗?解根据题目所给的数据得到如下2×2列联表:学习成绩上网合计经常不经常不及格80120200及格120680800合计2008001000得出等高堆积条形图如图所示:比较图中阴影部分高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为学习成绩与经常上网有关.命题角度1有关“相关的检验”例2
某校对学生课外活动进行调查,结果整理成下表:试根据小概率值α=0.005的独立性检验,分析喜欢体育还是文娱与性别是否有关系.二、由χ2进行独立性检验性别喜欢合计体育文娱男生212344女生62935合计275279解零假设为H0:喜欢体育还是喜欢文娱与性别没有关系.∵a=21,b=23,c=6,d=29,n=79,根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为喜欢体育还是喜欢文娱与性别有关.跟踪训练2
甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:零件尺寸x1.011.021.031.041.05零件个数y甲37893乙7444a由表中数据得y关于x的经验回归方程为
=-91+100x(1.01≤x≤1.05),其中合格零件尺寸为1.03±0.01(cm).完成下面列联表,并依据小概率值α=0.01的独立性检验,分析加工零件的质量与甲、乙是否有关.机床加工零件的质量合计合格零件数不合格零件数甲
乙
合计
所以a=11.由于合格零件尺寸为1.03±0.01cm,故甲、乙加工的合格与不合格零件的数据表为:机床加工零件的质量合计合格零件数不合格零件数甲24630乙121830合计362460零假设为H0:加工零件的质量与甲、乙无关.因为χ2=10>6.635=x0.01,根据小概率值α=0.01的独立性检验,我们推断H0不成立.即认为加工零件的质量与甲、乙有关.命题角度2有关“无关的检验”例3
下表是某届某校本科志愿报名时,对其中304名学生进入高校时是否知道想学专业的调查表:
知道想学专业不知道想学专业合计男生63117180女生4282124合计105199304根据表中数据,则下列说法正确的是____.(填序号)①性别与知道想学专业有关;②性别与知道想学专业无关;③女生比男生更易知道所学专业.②所以性别与知道想学专业无关.跟踪训练3
某省进行高中新课程改革,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;解2×2列联表如下表所示:教师年龄对新课程教学模式合计赞同不赞同老教师101020青年教师24630合计341650(2)试根据小概率值α=0.01的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关系.解零假设为H0:对新课程教学模式的赞同情况与教师年龄无关.≈4.963<6.635=x0.01,根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,即认为对新课程教学模式的赞同情况与教师年龄无关.随堂练习1.下面是一个2×2列联表:12345解析∵a+21=73,∴a=52,b=a+8=52+8=60.XY合计Y=0Y=1X=0a2173X=182533合计b46
则表中a,b处的值分别为A.94,96 B.52,50 C.52,60
D.54,52√2.某班主任对全班50名学生进行了作业量的调查,数据如下表:性别作业量合计大不大男生18927女生81523合计262450则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过A.0.01 B.0.005 C.0.05
D.0.001√12345∴犯错误的概率不超过0.05.性别作业量合计大不大男生18927女生81523合计262450123453.(多选)若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有√√解析独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.123454.根据如图所示的等高堆积条形图可知喝酒与患胃病____关系.(填“有”或“没有”)有解析从等高堆积条形图上可以明显地看出喝酒患胃病的频率远远大于不喝酒患胃病的频率.123455.某销售部门为了研究具有相关大学学历和能按时完成销售任务的关系,对本部门200名销售人员进行调查,所得数据如下表所示:
能按时完成销售任务不能按时完成销售任务合计具有相关大学学历574299不具有相关大学学历3665101合计93107200根据上述数据能得出结论:有_____以上的把握认为“销售人员具有相关大学学历与能按时完成销售任务是有关系的”.99%12345因为9.67>6.635=x0.01,所以有99%以上的把握认为“销售人员具有相关大学学历与能按时完成销售任务是有关系的”.12345对点练习1.观察下列各图,其中两个分类变量x,y之间关系最强的是基础巩固12345678910111213141516解析观察等高堆积条形图易知D选项两个分类变量之间关系最强.√2.(多选)给出下列实际问题,其中用独立性检验可以解决的问题有A.两种药物治疗同一种病是否有区别B.吸烟者得肺病的概率C.吸烟是否与性别有关系D.网吧与青少年的犯罪是否有关系√√√解析独立性检验是判断两个分类变量是否有关系的方法,而B是概率问题,故选ACD.123456789101112131415163.为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,经计算χ2=8.01,则所得到的统计学结论是认为“性别与喜欢乡村音乐有关系”的把握约为A.0.1% B.0.5%C.99.5% D.99.9%解析因为χ2=8.01>7.879=x0.005,所以认为性别与喜欢乡村音乐有关系的把握有99.5%.√123456789101112131415164.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:年龄饮食习惯合计偏爱蔬菜偏爱肉类50岁以下481250岁以上16218合计201030则可以说其亲属的饮食习惯与年龄有关的把握为A.95% B.99% C.99.5% D.99.9%√12345678910111213141516所以有99.5%的把握认为其亲属的饮食习惯与年龄有关.123456789101112131415165.考察棉花种子处理情况跟生病之间的关系得到下表数据:种子种子合计处理未处理得病32101133不得病61213274合计93314407根据以上数据,可得出A.种子是否经过处理跟生病有关
B.种子是否经过处理跟生病无关C.种子是否经过处理决定是否生病
D.以上都是错误的√12345678910111213141516≈0.164<2.706=x0.1,即没有把握认为种子是否经过处理跟生病有关.123456789101112131415166.χ2的大小可以决定是否拒绝原来的统计假设H0,如果χ2值较大,就拒绝H0,即接受两个分类变量____关系.(填“有”或“无”)有123456789101112131415167.下表是关于男婴与女婴出生时间调查的列联表:
时间合计晚上白天男婴45AB女婴E35C合计98D180那么,A=____,B=____,C=____,D=____,E=____.479288825312345678910111213141516123456789101112131415168.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:性别专业合计非统计专业统计专业男131023女72027合计203050为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2=
≈4.844,因为χ2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为____.5%12345678910111213141516解析因为χ2>3.841=x0.05,所以依据小概率值α=0.05的独立性检验,认为主修统计专业与性别有关,出错的可能性最大为5%.123456789101112131415169.在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:分数段29~4041~5051~6061~7071~8081~9091~100午休考生人数23473021143114不午休考生人数175167153017312345678910111213141516(1)根据上述表格完成列联表;
人数合计及格人数不及格人数午休
不午休
合计
12345678910111213141516解2×2列联表如下表所示:
人数合计及格人数不及格人数午休80100180不午休65135200合计14523538012345678910111213141516(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义?
人数合计及格人数不及格人数午休80100180不午休65135200合计14523538012345678910111213141516由P1>P2,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态.1234567891011121314151610.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:性别打篮球合计喜爱不喜爱男生
6
女生10
合计
48已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为
.(1)请将上面的2×2列联表补充完整(不用写计算过程);12345678910111213141516解列联表补充如下:性别打篮球合计喜爱不喜爱男生22628女生101020合计32164812345678910111213141516(2)根据小概率值α=0.05的独立性检验,能否据此推断喜爱打篮球与性别有关?解零假设H0:喜爱打篮球与性别无关,根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为喜爱打篮球与性别有关.12345678910111213141516(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.解喜爱打篮球的女生人数X的可能取值为0,1,2.故X的分布列为12345678910111213141516综合运用11.(多选)下列关于回归分析与独立性检验的说法不正确的是A.回归分析和独立性检验没有什么区别B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变
量之间的不确定关系C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是
否具有某种关系的一种检验D.独立性检验可以100%确定两个变量之间是否具有某种关系√√√解析由回归分析及独立性检验的特点知,选项C正确.1234567891011121314151612.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是A.男人、女人中患色盲的频率分别为0.038和0.006C.男人中患色盲的比例比女人中患色盲的比例大,可以认为患色盲与性
别是有关的D.调查人数太少,不能说明色盲与性别有关√12345678910111213141516故认为患色盲与性别是有关的.1234567891011121314151613.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是
表1性别成绩合计不及格及格男61420女102232合计16365212345678910111213141516
表2性别视力合计好不好男41620女122032合计16365212345678910111213141516
表3性别智商合计偏高正常男81220女82432合计16365212345678910111213141516
表4性别阅读量合计丰富不丰富男14620女23032合计163652A.成绩
B.视力
C.智商
D.阅读量√123456789101112131415161234567891011121314151614.世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:年龄西班牙队合计不喜欢喜欢高于40岁pq50不高于40岁153550合计ab10012345678910111213141516若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为
,则有超过______的把握认为年龄与西班牙队的被喜欢程度有关.临界值表:α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.82895%12345678910111213141516解析设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A,所以q=25,p=25,a=40,b=60.故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关.12345678910111213141516拓广
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- FTA原理VSFID原理在可燃气LEL监测领域的应用
- 深度解析(2026)《GBT 35798-2018化妆品中香豆素及其衍生物的测定 高效液相色谱法》
- 深度解析(2026)《GBT 35737-2017多绳缠绕式矿井提升机》
- 深度解析(2026)《GBT 35488-2017联合收割机监测系统》:专家视角下的技术全景与产业前瞻
- 深度解析(2026)《GBT 35433-2017信息与文献 图书馆及相关组织的注册服务》
- 小学英语单词释义练习题及答案
- 北京市通州区2025届高三语文一模试题【含答案】
- 注册林业工程师森林培育学题库及解析
- 初级美容师皮肤护理试题及答案
- 大学物理牛顿定律题目及分析
- 2025年广东省高考政治试卷真题(含答案解析)
- 良肢位摆放叙试题及答案
- T/CCMA 0168-2023土方机械电控手柄技术要求及试验方法
- 商业购物中心广告氛围形象管理规范课件分享
- 2025年统计学期末考试题库:时间序列分析核心考点解析
- DG-TJ08-2177-2023建筑工程消防施工质量验收标准
- 2024版股份合资企业运营管理及风险控制合同3篇
- 磷石膏固废资源化利用技术及应用前景
- 【MOOC】声乐教学与舞台实践-江西财经大学 中国大学慕课MOOC答案
- 试卷保密工作流程
- 中药塌渍的护理
评论
0/150
提交评论