版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一课时分类变量与列联表8.3列联表与独立性检验课标要求素养要求1.通过实例,理解2×2列联表的统计意义.2.理解判断两个分类变量是否有关系的常用方法.通过学习2×2列联表,提升数学抽象、直观想象及数据分析素养.新知探究饮用水的质量是人类普遍关心的问题,根据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人.问题人的身体健康状况与饮用水的质量之间有关系吗?提示我们可以根据2×2列联表找到人的身体健康与饮用水之间的关系,也就是本节课所要学习的内容.1.分类变量这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为__________,分类变量的取值可以用______表示.分类变量实数2.2×2列联表
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉__________.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为分类频数
y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d3.等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的______特征,依据________________的原理,我们可以推断结果.频率频率稳定于概率拓展深化[微判断]1.分类变量中的变量与函数中的变量是同一概念. (
)
提示分类变量中的变量是指一定范围内的两种现象或性质,与函数中的变量不是同一概念.2.列联表中的数据是两个分类变量的频数. (
)3.列联表、频率分析法、等高条形图都可初步分析两分类变量是否有关系. (
)×√√[微训练]1.下列不是分类变量的是(
) A.近视
B.成绩 C.血压
D.饮酒
解析
近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.故选B.
答案B2.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.
80分及80分以上80分以下合计试验班321850对照班24m50合计5644n答案26
100[微思考]1.是否吸烟、是否患肺癌是什么变量?
提示
分类变量.2.吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?
提示
不是.解2×2列联表如下:
年龄在六十岁以上年龄在六十岁以下合计饮食以蔬菜为主432164饮食以肉类为主273360合计7054124将表中数据代入公式得【训练1】假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1y2x11018x2m26则当m取下面何值时,X与Y的关系最弱(
)A.8 B.9 C.14 D.19解析由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.答案C题型二用等高堆积条形图分析两分类变量间的关系【例2】某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.
性格内向性格外向合计考前心情紧张332213545考前心情不紧张94381475合计4265941020相应的等高堆积条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前心情紧张与性格类型有关.规律方法利用等高堆积条形图判断两个分类变量是否相关的步骤:【训练2】在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解根据题目给出的数据作出如下的列联表:
色盲不色盲合计男38442480女6514520合计449561000根据列联表作出相应的等高堆积条形图:从等高堆积条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的.一、素养落地1.通过本节课的学习,进一步提升数学抽象、直观想象及数据分析素养.2.列联表与等高堆积条形图
列联表由两个分类变量之间频率大小的差异说明这两个变量之间是否有相关关系,而利用等高堆积条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系.二、素养训练1.与表格相比,能更直观地反映出相关数据总体状况的是(
) A.列联表 B.散点图 C.残差图 D.等高堆积条形图
答案D2.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,则性别与喜欢吃甜食的2×2列联表为________.答案
喜欢吃甜食不喜欢吃甜食合计男117413530女492178670合计60959112003.根据如图所示的等高堆积条形图可知吸烟与患肺病________关系(填“有”或“没有”).解析从等高条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率.答案有4.(多空题)下面是一个2×2列联表:
y1y2合计x1a2173x222527合计b46100则表中a=________,b=__________.答案52
545.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:
患病未患病合计服用药104555未服用药203050合计3075105第二课时独立性检验8.3列联表与独立性检验课标要求素养要求了解随机变量χ2的意义,通过对典型案例分析,了解独立性检验的基本思想和方法.通过运用列联表进行独立性检验,提升数学抽象及数据分析素养.新知探究山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:问题如何判定“喜欢体育还是文娱与性别是否有联系”?提示可通过表格与图形进行直观分析,也可通过统计分析定量判断.1.临界值χ2
统计量也可以用来作相关性的度量.χ2
越小说明变量之间越独立,χ2越大说明变量之间越相关2.独立性检验
基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立
,可以认为X和Y独立.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验(testofindependence).下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8283.应用独立性检验解决实际问题的大致步骤 (1)提出零假设H0:X和Y相互独立,并给出在问题中的解释; (2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较; (3)根据检验规则得出推断结论; (4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.拓展深化[微判断]1.概率值α越小,临界值xα越大. (
)2.独立性检验的思想类似于反证法. (
)3.独立性检验的结论是有多大的把握认为两个分类变量有关系. (
)√√√
[微训练]1.如果根据小概率α=0.01的χ2检测试验,认为H0成立,那么具体算出的数据满足(
)
附表:α0.050.0250.0100.0050.001xα3.8415.0246.6357.87910.828A.χ2>6.635 B.χ2>5.024C.χ2>7.879 D.χ2>3.841答案A2.某校为了研究“学生的性别”和“对待某一活动的态度”是否有关,运用2×2列联表进行独立性检验,经计算χ2=7.069,则认为“学生性别与支持某项活动有关系”的犯错误的概率不超过(
) A.0.1% B.1% C.99% D.99.9%解析∵χ2=7.069>6.635=x0.01,∴认为“学生性别与支持某项活动有关系”的犯错误的概率不超过1%.答案B[微思考]1.有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺病有关,是指每100个吸烟者中就会有99个患肺病的.”你认为这种观点正确吗?为什么?
提示
观点不正确.犯错误的概率不超过0.01说明的是吸烟与患肺病有关的程度,不是患肺病的百分数.2.应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗?
提示
不一定.所有的推断只代表一种可能性,不代表具体情况.题型一有关“相关的检验”【例1】某校对学生课外活动进行调查,结果整理成下表,用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?
体育文娱合计男生212344女生62935合计275279解零假设为H0:喜欢体育还是喜欢文娱与性别没有关系∵a=21,b=23,c=6,d=29,n=79,根据小概率值α=0.005的χ2独立性检验,我们推断H0不成立,即认为喜欢体育还是喜欢文娱与性别有关系,此推断犯错误的概率不大于0.005.【训练1】打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:
患心脏病未患心脏病合计每一晚都打鼾30224254不打鼾2413551379合计5415791633根据独立性检验,能否在犯错误的概率不超过0.001的前提下认为每一晚都打鼾与患心脏病有关系?解零假设为H0:打鼾与患心脏病无关系由列联表中的数据,得≈68.033>10.828=x0.001.根据小概率值α=0.001的χ2独立性检验,我们推断H0不成立,即认为打鼾与患心脏病有关系,此推断犯错误的概率不大于0.001.题型二有关“无关的检验”【例2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科生对外语有兴趣的有138人,无兴趣的有98人,文科生对外语有兴趣的有73人,无兴趣的有52人.试分析学生选报文、理科与对外语的兴趣是否有关?
解零假设为H0:选报文、理科与对外语的兴趣无关.
列出2×2列联表
理文合计有兴趣13873211无兴趣9852150合计236125361代入公式得χ2的观测值∵1.871×10-4<2.706=x0.1,根据小概率值α=0.1的χ2独立性检验,没有充分证据推断H0不成立,即选报文、理科与对外语的兴趣无关.规律方法独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.【训练2】某教育机构为了研究成年人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:
积极支持教育改革不太赞成教育改革合计大学专科以上学历39157196大学专科以下学历29167196合计68324392解零假设为H0:成年人具有大学专科以上学历(包括大学专科)和对待教育改革态度无关.根据表中数据,计算得因为1.78<2.706=x0.1,根据小概率值α=0.1的χ2独立性检验,没有充分证据推断H0不成立,所以我们没有理由说成年人具有大学专科以上学历(包括大学专科)和对待教育改革态度有关.题型三独立性检验的综合应用【例3】某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层随机抽样的方法,收集300位学生每周平均体育运动时间(单位:时)的样本数据. (1)应收集多少位女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别的列联表,并判断是否认为“该校学生的每周平均体育运动时间与性别有关”.附:α0.1000.0500.0100.005xα2.7063.8416.6357.879(2)由频率分布直方图得学生每周平均体育运动时间超过4小时的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75=225(人)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.样本数据中有210份是关于男生的,90份是关于女生的,可得每周平均体育运动时间与性别的列联表如下:
男生女生合计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225合计21090300零假设为H0:该校学生的每周平均体育运动时间与性别无关.结合列联表可算得根据小概率值α=0.1的χ2独立性检验,我们推断H0不成立,即认为“该校学生的每周平均体育运动时间与性别有关”,此推断犯错误的概率不大于0.05.【训练3】某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀有关系?
物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699解零假设为H0:数学成绩优秀与物理、化学、总分成绩优秀都无关系.列出数学成绩与物理成绩的2×2列联表如下:
物理优秀物理非优秀合计数学优秀228132360数学非优秀143737880合计3718691240列出数学成绩与化学成绩的2×2列联表如下:
化学优秀化学非优秀合计数学优秀225135360数学非优秀156724880合计3818591240列出数学成绩与总分成绩的2×2列联表如下:
总分优秀总分非优秀合计数学优秀26793360数学非优秀99781880合计3668741240根据小概率值α=0.001的χ2独立性检验,我们推断H0不成立,即认为数学成绩优秀与物理、化学、总分成绩优秀都有关系,此推断犯错误的概率不大于0.001.一、素养落地1.通过本节课的学习,提升数学抽象及数据分析素养.2.对独立性检验思想的理解
独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算χ2的值,如果χ2值很大,说明假设不合理,χ2越大,两个分类变量有关系的可能性越大.二、素养训练1.对两个分类变量A,B的下列说法中正确的个数为(
) ①A与B无关,即A与B互不影响; ②A与B关系越密切,则χ2的值就越大; ③χ2的大小是判定A与B是否相关的唯一依据 A.0 B.1 C.2 D.3
解析①正确,A与B无关即A与B相互独立;②不正确,χ2的值的大小只是用来检验A与B是否相互独立;③不正确,例如借助三维柱形图、二维条形图等.故选B.
答案B2.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:
优秀及格合计甲班113445乙班83745合计197190则χ2的观测值约为(
)A
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 科技企业知识产权保护与管理制度
- 物流行业绿色运输管理制度
- 项目一-教学设计 - 3 计算机网络新技术
- 医疗服务质量评价监管制度
- 江苏省苏州市第一初级中学校2025-2026学年八年级下学期阶段学情调研物理试题(含答案)
- 全国职业院校汽车维修专业考试题库冲刺卷
- 祥符五年级英语作文练习冲刺押题卷
- 护理管理中的护理团队领导与激励
- 卫生院2024年疟疾防治知识培训前测试题
- 防震减灾(教学设计)2025-2026学年初三下学期教育主题班会
- 合肥兴泰金融控股(集团)有限公司招聘9人参考题库附答案解析
- 招标项目绩效考核体系设计方案
- 2026年消防设施操作员之消防设备初级技能考试题库150道及完整答案(全优)
- 危货驾驶员安全职责
- 江苏南京市2025-2026学年高一上生物期末学业水平测试试题含解析
- 水利安全三类人员b证考试题库及答案解析
- 肺癌全程护理计划
- 2025年国家能源集团企业文化考试题库及答案
- 车载光通信专题学习
- 2025年120院前急救知识考核试题及答案
- 混凝土结构实体检测方案
评论
0/150
提交评论