(人教A版)选择性必修三高中数学同步考点讲与练专题8.3 列联表与独立性检验(解析版)_第1页
(人教A版)选择性必修三高中数学同步考点讲与练专题8.3 列联表与独立性检验(解析版)_第2页
(人教A版)选择性必修三高中数学同步考点讲与练专题8.3 列联表与独立性检验(解析版)_第3页
(人教A版)选择性必修三高中数学同步考点讲与练专题8.3 列联表与独立性检验(解析版)_第4页
(人教A版)选择性必修三高中数学同步考点讲与练专题8.3 列联表与独立性检验(解析版)_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题8.3列联表与独立性检验(重难点题型精讲)1.分类变量为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.2.2×2列联表假设两个分类变量X和Y,它们的可能取值分别为{,}和{,},其2×2列联表为2×2列联表给出了成对分类变量数据的交叉分类频数.3.等高堆积条形图常用等高堆积条形图展示列联表数据的频率特征(如图),由此反映出两个分类变量间是否相互影响.(1)等高堆积条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显(即和相差很大),就判定两个分类变量之间有关系.

(2)利用等高堆积条形图虽可以比较各个部分之间的差异,明确展现两个分类变量的关系,但不能知道两个分类变量有关系的概率大小.4.独立性检验(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.则.(2)利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验.

(3)独立性检验中几个常用的小概率值和相应的临界值.【题型1列联表的应用】【方法点拨】利用列联表直接计算和,如果两者相差很大,就判断两个分类变量之间有关系的可能性较大.【例1】(2023·全国·高二专题练习)假设有两个分类变量x与y的2×2列联表如下表:yyxabxcd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(

)A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5 D.a=2,b=3,c=5,d=4【解题思路】计算每个选项中的ad−bc,比较大小后可得出结论.【解答过程】对于两个分类变量x与y而言,ad−bc的值越大,说明x与y有关系的可能性最大,对于A选项,ad−bc=5×2−4×3=2对于C选项,ad−bc=2×5−3×4=2显然D中ad−bc最大,故选:D.【变式1-1】在一次独立性检验中,得出列联表如图:且最后发现,两个分类变量A和B没有任何关系,则a的可能值是(

)AA合计B2008001000B180a180+a合计380800+a1180+aA.200 B.720 C.100 D.180【解题思路】把列联表中所给的数据代入求观测值的公式,建立不等式,代入验证可知a的可能值.【解答过程】解:因为两个分类变量A和B没有任何关系,所以K2代入验证可知a=720.故选:B.【变式1-2】假设两个分类变量X和Y,他们的取值分别为{x1,yy总计xaba+bxcdc+d总计a+cb+da+b+c+d对于以下数据,对同一样本说明X与Y有关的可能性最大的一组是(

)A.a=10,b=5,c=8,d=6 B.a=9,b=5,c=7,d=8C.a=12,b=6,c=9,d=5 D.a=12,b=8,c=6,d=7【解题思路】依据|ad−bc|越大,说明X与Y有关的可能性越大,即可判定.【解答过程】一般地,|ad−bc|越大,说明X与Y有关的可能性越大.选项A中,|ad−bc|=|60−40|=20;选项B中,|ad−bc|=|72−35|=37;选项C中,|ad−bc|=|60−54|=6;选项D中,|ad−bc|=|84−48|=36.故选:B.【变式1-3】假设有两个分类变量X和Y的2×2列联表如下:注:K2的观测值k=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=n(aA.a=45,c=15 B.a=40,c=20 C.a=35,c=25 D.a=30,c=30【解题思路】根据独立性检验的方法和2×2列联表,即可得解.【解答过程】根据独立性检验的方法和2×2列联表可得,当aa+10与cc+30相差越大,则分类变量X和Y有关系的可能性越大,即a,c相差越大,aa+10故选A.【题型2等高堆积条形图的应用】【方法点拨】可以从等高堆积条形图中直观判断列联表数据的频率特征,这种直观判断的不足之处在于不能直接给出推断“两个分类变量有关系”犯错误的概率.【例2】为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是(

)A.是否倾向选择生育二胎与户籍无关B.是否倾向选择生育二胎与性别有关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数【解题思路】结合所给比例图,依次分析判断4个选项即可.【解答过程】对于A,城镇户籍中40%选择生育二胎,农村户籍中80对于B,男性和女性中均有60%对于C,由于男性和女性中均有60%对于D,倾向选择不生育二胎的人员中,农村户籍有50×20%=10人,城镇户籍有【变式2-1】观察下面频率等高条形图,其中两个分类变量x,y之间的随机变量χ2的观测值最小的是(

A. B.C. D.【解题思路】直接由等高条形图中x1,x【解答过程】等高的条形图中x1,x【变式2-2】观察下列各图,其中两个分类变量x,y之间关系最强的是(

)A. B.C. D.【解题思路】由等高条形图的定义和性质依次分析,即得解【解答过程】观察等高条形图发现x1x1故选:D.【变式2-3】为考查A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是(

)A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果【解题思路】根据等高条形图中的数据即可得出选项.【解答过程】根据两个表中的等高条形图知,药物A实验显示不服药与服药时患病差异较药物B实验显示明显大,所以药物A的预防效果优于药物B的预防效果,故选:B.【题型3独立性检验的应用】【方法点拨】可以利用独立性检验来推断两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法:(1)根据实际问题需要的可信程度(或容许犯错误概率的上界)确定临界值;(2)利用公式,由观测数据计算得到的值;(3)对照临界值表,即可得出结论.【例3】新型冠状病毒感染,主要是由新型冠状病毒引起的,典型症状包括干咳、发热、四肢无力等,部分人群会伴有流鼻涕、拉肚子等症状.病人痊愈的时间个体差异也是比较大的,新型冠状病毒一般2-6周左右能恢复.某兴趣小组为进一步了解新型冠状病毒恢复所需时间,随机抽取了200名已痊愈的新型冠状病毒患者(其中有男性100名,女性100名)进行调查,得到数据如下表所示:痊愈周数性别1周2周3周4周5周6周大于6周男性4502412622女性24022161064若新型冠状病毒患者在3周内(含3周)痊愈,则称患者“痊愈快”,否则称患者“痊愈慢”.(1)分别估计男、女新型冠状病毒患者“痊愈快”的概率?(2)完成下面2×2列联表,并判断是否有95%的把握认为患者性别与痊愈快慢有关?痊愈快慢性别痊愈快痊愈慢总计男性女性总计附:K2P0.0500.0100.001k3.8416.63510.828【解题思路】(1)根据表中数据的统计,结合古典概型的概率公式即可求解,(2)根据数据统计完成二联表,即可计算K2【解答过程】(1)由表中数据可知:男性患者在三周以及以内康复的人有4+50+24=78,女性患者在三周以及以内康复的人有2+40+22=64,故男性新型冠状病毒患者“痊愈快”的概率为78100=0.78(2)二联表如下表:痊愈快慢性别痊愈快痊愈慢总计男性7822100女性6436100总计14258200故K2=【变式3-1】2021年7月24日中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》(以下简称“双减”),各省、市精心组织实施,强化目标管理,治理校外培训行为.为了调查人们对“双减”的满意程度,抽取了男、女各25人对“双减”的满意度进行调查,统计数据如表所示.满意非常满意合计男性18725女性61925合计242650(1)根据上表,如果随机抽查1人,那么抽到此人对“双减”满意的概率是多少?抽到此人对“双减”非常满意且是女性的概率是多少?(2)能否有99.9%的把握认为性别和满意度有关?附:K2=P(0.0500.0100.001k3.8416.63510.828【解题思路】(1)根据古典概型的概率公式即可求得答案;(2)计算K2【解答过程】(1)随机抽查1人,抽到满意的概率是18+650=12(2)根据2×2列联表,可得K2∴有99.9%的把握认为性别和满意度有关.【变式3-2】国际足联世界杯(FIFAWorldCup),简称“世界杯”,是由全世界国家级别球队参与,象征足球界最高荣誉,并具有最大知名度和影响力的足球赛事.2022年卡塔尔世界杯共有32支球队参加比赛,共有64场比赛.某社区随机调查了街道内男、女球迷各200名,统计了他们观看世界杯球赛直播的场次,得到下面的列联表:少于32场比赛不少于32场比赛总计男球迷a+20a+20女球迷a+40a总计(1)求a的值,并完成上述列联表;(2)若一名球迷观看世界杯球赛直播的场次不少于32场比赛,则称该球迷为“资深球迷”,请判断能否有95%参考公式:K2=n参考数据:P0.100.050.0100.001k2.7063.8416.63510.828【解题思路】(1)根据球迷总人数可构造方程求得a的值,进而补全列联表;(2)由列联表数据可计算得到K2【解答过程】(1)由题意得:a+20+a+20+补全列联表如下:少于32场比赛不少于32场比赛总计男球迷100100200女球迷12080200总计220180400(2)由(1)得:K2∴有95%【变式3-3】人们曾经相信,艺术家将是最后被AⅠ所取代的职业,但技术的进步已经将这一信念敲出了裂痕,这可能是AⅠ第一次引起人类的恐慌,由novalAⅠ,DALL-E2等软件创作出来的给画作品风格各异,乍看之下,已与人类绘画作品无异,AⅠ会取代人类画师吗?某机构随机对60人进行了一次调查,统计发现认为会取代的有42人,30岁以下认为不会取代的有12人,占30岁以下调查人数的25(1)根据以上数据完成如下2×2列联表:年龄理解情况总计会取代不会取代30岁以下1230岁及以上总计4260(2)依据小概率值α=0.010的独立性检验,能否认为年龄与理解情况有关?并说明原因.α0.100.050.0100.0050.001x2.7063.8416.6357.87910.828参考公式:χ2=n【解题思路】(1)根据题设中的数据即可求解;(2)代入卡方公式求出值与表对比即可求解.【解答过程】(1)完成2×2列联表如下:年龄理解情况总计会取代不会取代30岁以下18123030岁及以上241630总计421860(2)设H0由题意,χ2所以根据小概率α=0.010的独立性检验,我们推断H0即认为年龄与理解情况无关,此推断犯错误的概率不大于0.010.【题型4独立性检验与统计知识的综合应用】【方法点拨】独立性检验与统计知识结合在一起考查是一个很好的结合点,解题的关键是正确从图表中得到相关数据.【例4】某省级综合医院共有1000名医护员工参加防疫知识和技能竞赛,其中男性450人,为了解该医院医护员工在防疫知识和技能竞赛中的情况,现按性别采用分层抽样的方法从中抽取100名医护员工的成绩(单位:分)作为样本进行统计,成绩均分布在400~700分之间,根据统计结果绘制的医护员工成绩的频率分布直方图如图所示,将成绩不低于600分的医护员工称为优秀防疫员工(1)求a的值,并估计该医院医护员工成绩的平均数、中位数(同一组中的数据用该组区间的中点值作代表);(2)若样本中优秀防疫员工有女性10人,完成下列2×2列联表,并根据小概率值α=0.05的独立性检验,能否认为该医院医护员工的性别与是否为优秀防疫员工有关联?优秀防疫员工非优秀防疫员工合计男女合计(3)采用分层抽样的方法从样本中成绩在450,500,600,700的医护员工中抽取8人,再从这8人中随机抽取3人,记被抽取的3名医护员工中优秀防疫员工的人数为随机变量X,求X的分布列及数学期望.附:χ2=nα0.100.050.0100.0050.001x2.7063.8416.6357.87910.828【解题思路】(1)首先根据频率和为1求出a值,再求出成绩平均数,再根据中位数概念求出中位数即可;(2)进行零假设,补全2×2列联表,计算计算χ2(3)求出分层抽样的各层人数,计算概率得到分布列,则得到其期望.【解答过程】(1)第一步:根据频率之和为1求a的值由题意知50×0.001×2+0.003+0.006+0.005+a=1,解得第二步:根据平均数与中位数的定义求解,估计该医院医护员工成绩的平均数,x=425×0.05+475×0.15+525×0.3+575×0.25+625×0.2+675×0.05=552.5因为0.001+0.003+0.006×50=0.5(2)第一步:写出零假设零假设为H0第二步:补全2×2列联表由题可知,样本中男性有450×110=45人,女性有1000−450优秀防疫员工非优秀防疫员工合计男153045女104555合计2575100第三步:计算χ2根据列联表中的数据,得到χ2第四步:得出结论所以根据小概率值α=0.05的独立性检验,我们没有充分证据推断H0(3)第一步:利用分层抽样的知识求抽取的8人中成绩在450,500与600,700中的人数由题意及频率分布直方图可得,从成绩在450,500的医护员工中抽取3人,从成绩在600,700的医护员工中抽取5人,第二步:写出随机变量X的所有可能取值,所以X的所有可能取值为0,1,2,3.第三步:分别求出X取每个值的概率,得分布列PX=0=C33C8所以随机变量X的分布列为P0123X115155第四步:计算数学期望EX【变式4-1】相关统计数据显示,中国经常参与体育锻炼的人数比例为37.2%,城乡居民达到《国民体质测定标准》合格以上的人数比例达到90%以上.某市一健身连锁机构对其会员进行了统计,制作成如下两个统计图,图1为会员年龄分布图(年龄为整数),图2为会员一个月内到健身房次数分布扇形图.若将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以上)两类,将一个月内到健身房锻炼16次及以上的会员称为”健身达人”,15次及以下的会员称为“健身爱好者”,且已知在“健身达人”中有56(1)现从该健身连锁机构会员中随机抽取一个容量为100的样本,根据图的数据,补全下方2×2列联表,并判断是否有95%的把握认为“健身达人”与年龄有关?年轻人非年轻人合计健身达人健身爱好者合计附:P0.100.050.0250.0100.0050.001k2.7063.8415.0246.6357.87910.828K(2)将(1)中相应的频率作为概率,该健身连锁机构随机选取3名会员进行回访,设3名会员中既是“年轻人”又是“健身达人”的人数为随机变量X,求X的分布列和数学期望.【解题思路】(1)根据条件完善列联表,然后算出K2(2)随机变量X满足二项分布X~B3,【解答过程】(1)根据年轻人标准结合图1可得年轻人占比为80%,则年轻人人数为100×80%=80,则非年轻人为20人,根据图2表格得健身达人所占比60%,所以其人数为100×60%=60,根据其中年轻人占比56,所以健身达人中年轻人人数为60×年轻人非年轻人合计健身达人501060健身爱好者301040合计8020100K2(2)由(1)知,既是年轻人又是健身达人的概率为12则随机变量X满足二项分布X~B3,12PX=0=CPX=2=故X的分布列:X0123P1331则X的数学期望为EX【变式4-2】某超市为改善某产品的销售状况并制订销售策略,统计了过去100天该产品的日销售收入(单位:万元)并分成六组制成如图所示的频率分布直方图.(1)求a的值并估计过去100天该产品的日销售收入的平均值x;(同一区间数据以中点值作代表)(2)该超市过去100天中有30天将该商品降价销售,在该商品降价的30天中有18天该产品的日销售收入不低于0.6万元,判断能否有97.5%的把握认为该商品的日销售收入不低于0.6万元与该日是否降价有关.附:K2=nP0.0500.0250.010k3.8415.0246.635【解题思路】(1)由频率分布直方图总面积为1列方程求a,由定义求均值;(2)作出列联表,求得K2【解答过程】(1)依题意有1.5+2.5+a+2.0+0.8+0.2×0.1=1,得a=3.0x=0.35×0.15+0.45×0.25+0.55×0.30+0.65×0.20+0.75×0.08+0.85×0.02=0.537(2)依题意作2×2列联表:降价非降价总计不低于0.6万元181230低于0.6万元125870总计3070100K2因为18.367>5.024,所以有97.5%的把握认为该商品的日销售收入不低于0.6【变式4-3】为积极响应“反诈”宣传教育活动的要求,某企业特举办了一次“反诈”知识竞赛,规定:满分为100分,60分及以上为合格.该企业从甲、乙两个车间中各抽取了100位职工的竞赛成绩作为样本.对甲车间100位职工的成绩进行统计后,得到了如图所示的成绩频率分布直方图.(1)估算甲车间职工此次“反诈”知识竞赛的合格率;(2)若将频率视为概率,以样本估计总体.从甲车间职工中,采用有放回的随机抽样方法抽取3次,每次抽1人,每次抽取的结果相互独立,记被抽取的3人次中成绩合格的人数为X.求随机变量X的分布列;(3)若乙车间参加此次知识竞赛的合格率为60%,请根据所给数据,完成下面的2×2列联表,并根据列联表判断是否有992×2列联表甲车间乙车间合计合格人数不合格人数合计附参考公式:①χ2=n②独立性检验临界值表α0.100.050.0100.0050.001x2.7063.8416.6357.87910.828【解题思路】(1)根据频率分布直方图的性质,可得答案;(2)根据二项分布的分布列的解题步骤,可得答案;(3)由题意,补全列联表,利用独立性检验的解题步骤,可得答案.【解答过程】(1)根据频率分布直方图可求得甲车间此次参加“反诈”知识竞赛的合格率=0.02×10+0.03×10+0.02×10+0.01×10=0.8,即80%(2)由题意可知X=0,1,2,3,由于每次抽取的结果是相互独立的,故X∼B3,0.8PX=k所以PX=0PX=2故随机变量X的分布列为X0123P0.0080.0960.3840.512(3)根据题中统计数据可填写2×2列联表如下,甲车间乙车间合计合格人数8060140不合格人数204060合计100100200χ2所以有99%专题8.3列联表与独立性检验(重难点题型检测)一.单选题1.在统计中,研究两个分类变量是否存在关联性时,常用的图表有(

)A.散点图和残差图 B.残差图和列联表C.散点图和等高堆积条形图 D.等高堆积条形图和列联表【解题思路】根据这些统计量的定义逐个分析判断.【解答过程】散点图是研究两个变量间的关系,列联表是研究两个分类变量的,残差图是体现预报变量与实际值间的差距,等高堆积条形图能直观的反映两个分类变量的关系,故选:D.2.如表是2×2列联表,则表中的a、b的值分别为(

)yy合计xa835x113445合计b4280A.27、38 B.28、38 C.27、37 D.28、37【解题思路】根据列联表的数据,补全表格,即可判断选项.【解答过程】解:a=35−8=27,b=a+11=27+11=38.故选:A.3.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如等高条形图:根据图中的信息,下列结论中不正确的是(

)A.样本中多数男生喜欢手机支付B.样本中的女生数量少于男生数量C.样本中多数女生喜欢现金支付D.样本中喜欢现金支付的数量少于喜欢手机支付的数量【解题思路】根据两等号条形图的信息,逐个分析判断即可.【解答过程】对于A,由右图可知,样本中多数男生喜欢手机支付,A对;对于B,由左图可知,样本中的男生数量多于女生数量,B对;对于C,由右图可知,样本中多数女生喜欢手机支付,C错;对于D,由右图可知,样本中喜欢现金支付的数量少于喜欢手机支付的数量,D对.故选:C.4.假设有两个变量x与y的2×2列联表如下表:yyxabxcd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(

)A.a=20,b=30,c=40,d=50 B.a=50,b=30,c=30,d=40C.a=30,b=60,c=20,d=50 D.a=50,b=30,c=40,d=30【解题思路】计算每个选项中ad−bc的值,最大的即对同一样本能说明x与y有关系的可能性最大.【解答过程】对于A,ad−bc=200,对于B,ad−bc=1100,对于C,对于D,ad−bc=300显然B中ad−bc最大,该组数据能说明x与y5.利用χ2对随机事件A与B的独立性检验时,提取了关于A,B的如下四组2×2列表,其中认为A与B相互独立的把握性最大的是(

附:χP0.0500.0100.0050.001k3.8416.6357.87910.828A.AAB1020B3040B.AAB1040B2030C.AAB100200B300400D.AAB100400B200300【解题思路】计算出卡方,再根据独立性检验的思想判断即可;【解答过程】解:对于A:χ2=100对于C:χ2=1000因为卡方的值越大,两个事件的相关性就越大,所以认为A与B相互独立把握最大的为A选项;故选:A.6.通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:跳绳性别合计男女爱好402060不爱好203050合计6050110已知K2P0.050.010.001k3.8416.63510.828则以下结论正确的是(

)A.根据小概率值α=0.001的独立性检验,爱好跳绳与性别无关B.根据小概率值α=0.001的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001C.根据小概率值α=0.01的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”D.根据小概率值α=0.01的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别无关”【解题思路】由题计算出K2【解答过程】由题知K因为7.822<10.828,所以爱好跳绳与性别无关且这个结论犯错误的概率超过0.001,故A正确,B错误,又因为7.822>6.635,所以有99%以上的把握认为“爱好跳绳与性别有关,或在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别有关.故C和D错误.故选:A.7.针对时下的“航天热”,某校团委对“是否喜欢航天与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢航天的人数占男生人数的45,女生中喜欢航天的人数占女生人数的35,若依据α=0.05的独立性检验,认为是否喜欢航天与学生性别有关,则被调查的学生中男生的人数不可能为(P0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7801.3232.0722.7063.8415.0246.6357.87910.828A.25 B.45 C.60 D.75【解题思路】设男生的人数为5n(n∈N【解答过程】解:设男生的人数为5n(n∈N∗),根据题意列出单位:人喜爱度性别合计男生女生喜欢航天4n3n7n不喜欢航天n2n3n合计5n5n10n则χ2∵依据α=0.05的独立性检验,认为是否喜欢航天与学生性别有关,∴χ2即10n21≥3.841,解得n≥8.0661,∴5n≥40.3305,又n∈N8.某中学共有1000人,其中男生700人,女生300人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:周平均体育锻炼时间不少于4小时),现在用分层抽样的方法从中收集200位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图.已知在样本数据中,有40位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理(

)附:K2=nP0.100.050.010.005k2.7063.8416.6357.879A.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”B.有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有90%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”【解题思路】根据分层抽样以及频率分布直方图列联表,再计算K2【解答过程】由频率分布直方图可知,平均体育锻炼时间不少于4小时的频率为2×0.15+0.125+0.075+0.025=0.75,故经常进行体育锻炼的学生200×0.75=150人.又其中有40位女生的每周平均体育锻炼时间超过4小时,故有150−40=110位男生经常锻炼.根据分层抽样的方法可知,样本中男生的人数为7001000×200=140,女生有男生女生总计经常锻炼11040150不经常锻炼302050总计14060200故K2=200故有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”.故选:B.二.多选题9.为了调查A,B两种药物预防某种疾病的效果,某研究所进行了动物试验.已知参与两种药物试验的动物的品种,状态,数量均相同,图1是A药物试验结果对应的等高堆积条形图,图2是B药物试验结果对应的等高堆积条形图,则()A.服用A药物的动物的患病比例低于未服用A药物的动物的患病比例B.服用A药物对预防该疾病没有效果C.在对B药物的试验中,患病动物的数量约占参与B药物试验动物总数量的60%D.B药物比A药物预防该种疾病的效果好【解题思路】根据两个等高堆积条形图,逐个分析选项即可判断出结论.【解答过程】根据题中两组等高堆积条形图,可知服用A药物的动物的患病比例低于未服用A药物的动物的患病比例,所以A正确;服用A药物未患病的动物的频率明显大于未服用A药物的,所以可以认为服用A药物对预防该疾病有一定效果,所以B不正确;在对B药物的试验中,患病动物的数量占参与B药物试验动物总数量的比例为20+40200B药物试验结果对应的等高堆积条形图显示未服用药与服用药动物的患病数量的差异较A药物试验的大,所以B药物比A药物预防该种疾病的效果好,所以D正确.故选:AD.10.某校高三一名数学教师从该校高三学生中随机抽取男、女生各50名进行了身高统计,得到男、女身高分别近似服从正态分布N173,11和N喜欢不喜欢合计男生37m50女生n3250合计5545100参考公式:χα0.010.0050.001x6.6357.87910.828则下列说法正确的是(

)A.m=13,n=18B.男生身高的平均数约为173,女生身高的平均数约为164C.男生身高的标准差约为11,女生身高的标准差约为9D.依据α=0.01的独立性检验,认为喜欢体育锻炼与性别有关联【解题思路】A选项,根据列联表中数据分析求出m,n,A正确;BC选项,由男、女身高分别近似服从正态分布N173,11和N【解答过程】对于A.因为37+m=50,n+32=50,算得m=13,n=18,故A正确:对于B,在正态分布Nμ,σ2对于C,在正态分布Nμ,σ2中,σ2为方差,对于D,由χ2=100×11.为了提高学生体育锻炼的积极性,某中学需要了解性别因素与学生对体育锻炼的喜好是否有影响,为此对学生是否喜欢体育锻炼的情况进行普查,得到下表:体育性别合计男性女性喜欢280p280+p不喜欢q120120+q合计280+q120+p400+p+q附:χ2=nα0.050.0250.0100.001x3.8415.0246.63510.828已知男生喜欢体育锻炼的人数占男生人数的710,女生喜欢体育锻炼的人数占女生人数的35,则下列说法正确的是(A.列联表中q的值为120,p的值为180B.随机对一名学生进行调查,此学生有90%的可能性喜欢体育锻炼C.根据小概率值α=0.01的独立性检验,男女生对体育锻炼的喜好有差异D.根据小概率值α=0.001的独立性检验,男女生对体育锻炼的喜好没有差异【解题思路】根据题意求出q、p,补全2×2列联表,分析数据,利用卡方计算公式求出K2【解答过程】A:由题意知,男生喜欢该项运动的人数占男生人数的710,女生喜欢该项运动的人数占女生人数的35,则280=710(280+q)B:补全2×2列联表如下:男性女性合计喜欢280180460不喜欢120120240合计400300700所以随机抽一名学生进行调查,喜欢该项运动的概率约为P=460C:K2=n所以根据小概率值α=0.01的独立性检验,男女生对体育锻炼的喜好有差异D:由选项C知,根据小概率值α=0.001的独立性检验,男女生对体育锻炼的喜好没有差异.故选:ACD.12.某工厂有25周岁及以上工人300名,25周岁以下工人200名.统计了他们某日产品的生产件数,然后按“25周岁及以上”和“25周岁以下”分成两组,再分别将两组工人的日生产件数分成5组“50,60,60,70,70,80,80,90,90,100”加以汇总,得到如图所示的频率分布直方图.规定生产件数不少于80件者为“生产能手”,零假设H0:生产能手与工人所在的年龄组无关.(

注:χ2α0.10.050.010.0050.001χ2.7063.8416.6357.87910.828A.该工厂工人日生产件数的25%分位数在区间60,70内B.日生产件数的平均数“25周岁及以上组”小于“25周岁以下组”C.从生产不足60件的工人中随机抽2人,至少1人25周岁以下的概率为7D.根据小概率值α=0.005的独立性检验,我们推断H0【解题思路】A选项,利用分位数的计算公式进行求解;B选项,分别计算出25周岁及以上组的平均数和25周岁以下组的平均数,比较得到结论;C选项,利用组合知识求解古典概型的概率;D选项,计算出卡方,与7.879比较得到结论.【解答过程】该工厂工人一共有200+300=500人,则500×250其中25周岁及以上组在区间50,60的人数为300×0.005×10=15,25周岁以下组在区间50,60的人数为200×0.005×10=10,25周岁及以上组在区间60,70的人数为300×0.035×10=105,25周岁以下组在区间60,70的人数为200×0.025×10=50,因为15+10=25<125,15+10+105+50=180>126,故该工厂工人日生产件数的25%分位数在区间60,70内,A正确;25周岁及以上组的平均数为55×0.005×10+65×0.035×10+75×0.035×10+85×0.02×10+95×0.005×10=73.5,25周岁以下组的平均数为55×0.005×10+65×0.025×10+75×0.0325×10+85×0.0325×10+95×0.005×10=75.75,因为73.5<75.75,所以日生产件数的平均数“25周岁及以上组”小于“25周岁以下组”,B正确;生产不足60件的工人一共有25人,其中25周岁及以上组有15人,25周岁以下组有10人,所以从生产不足60件的工人中随机抽2人,至少1人25周岁以下的概率为C10填写列联表,如下:生产能手非生产能手总计25周岁及以上组7522530025周岁以下组75125200合计150350500则χ2=n故选:ABD.三.填空题13.下列是关于出生男婴与女婴调查的2×2列联表晚上白天总计男婴45AB女婴E35C总计98D180那么D=82.【解题思路】根据2×2列联表,可得方程,解之即可得到结论.【解答过程】解:由题意,45+E=98,A+35=D,45+A=B,E+35=C,B+C=180∴A=47,B=92,C=88,D=82,E=53故答案为:82.14.为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中新增了一项登山活动,并对“学生喜欢登山和性别是否有关”做了一次调查,其中被调查的男女生人数相同,得到如图所示的等高条形统计图,则下列说法中正确的有①③.①被调查的学生中喜欢登山的男生人数比喜欢登山的女生人数多②被调查的女生中喜欢登山的人数比不喜欢登山的人数多③若被调查的男女生均为100人,则可以认为喜欢登山和性别有关④无论被调查的男女生人数为多少,都可以认为喜欢登山和性别有关【解题思路】由等高堆积条形统计图可判断A、B;利用独立性检验,计算出χ2【解答过程】因为被调查的男女生人数相同,由等高堆积条形统计图可知,喜欢登山的男生占80%,喜欢登山的女生占30%,所以A正确,B错误;设被调查的男女生人数均为n,则由等高堆积条形统计图可得列联表如下男女合计喜欢0.8n0.3n1.1n不喜欢0.2n0.7n0.9n合计nn2n由公式可得:χ2当n=100时,χ2而χ2=50n99,所以χ215.有两个分类变量x和y,其中一组观测值为如下的2×2列联表:yy总计xa15−a15x20−a30+a50总计204565其中a,15−a均为大于5的整数,则a=9时,在犯错误的概率不超过0.01的前提下为“x和y之间有关系”.附:KP0.100.050.0250.0100.005k2.7063.8415.0246.6357.879【解题思路】由题意,计算K2,列出不等式求出a的取值范围,再根据题意求得a【解答过程】解:由题意知:K2≥6.635,则解得:a≥8.65或a≤0.58,因为:a>5且15−a>5,a∈Z,综上得:8.65≤a<10,a∈Z,所以:a=916.某中学共有学生5000名,其中男生3500名,女生1500名,为了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现用分层随机抽样的方法从中收集300名学生每周平均体育锻炼时间的样本数据(单位:h),其频率分布直方图如下:已知在样本数据中,有60名女生的每周平均体育锻炼时间不少于4h,根据独立性检验原理,我们有95%的把握认为该校学生每周平均体育锻炼时间与性别有关.【解题思路】根据频率分布直方图可得男女同学每周锻炼时间少于4小时和不少于4小时的2×2列联表,计算χ2【解答过程】由题意,得从5000名学生中抽取一个容量为300的样本,其中男生、女生各抽取的人数为300×35005000=210,300×15005000=90,由频率分布直方图,可知每周平均体育锻炼时间不少于4h的人数的频率为0.75,所以在300名学生中每周平均体育锻炼时间不少于4h的人数为300×0.75=225性别体育锻炼情况男女总计每周平均体育锻炼时间少于4453075每周平均体育锻炼时间不少于416560225总计21090300由列联表可得χ2=300×所以有95%的把握认为该校学生每周平均体育锻炼时间与性别有关.故答案为:95%.四.解答题17.在对人们的休闲方式的一次调查中,共调查了110人,其中女性50人,男性60人.女性中有30人主要的休闲方式是看电视,另外20人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外40人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)由列联表判断性别与休闲方式是否有关系.【解题思路】(1)根据2×2的列联表要求列表.(2)根据列联表中的数据,分别算出女性、男性中休息方式为看电视的频率即可判断.【解答过程】(1)2×2的列联表:看电视运动合计女302050男204060合计5060110(2)根据列联表中的数据,可得女性中休息方式为看电视的频率为3050=0.6,男性中休息方式为看电视的频率为18.某省即将实行新高考,不再实行文理分科.某校为了研究数学成绩优秀是否对选择物理有影响,对该校2020级的1000名学生进行调查,收集到相关数据如下:根据以上提供的信息,完成2×2列联表,并完善等高条形图.选物理不选物理总计数学成绩优秀数学成绩不优秀260总计6001000【解题思路】根据列联表所给的数据和等高条形图即可完成列联表,进而完善等高条形图即可.【解答过程】根据题意填写列联表如下:选物理不选物理总计数学成绩优秀420320740数学成绩不优秀18080260总计6004001000等高条形图,如图所示:19.某学校为研究高三学生的身体素质与体育锻炼时间的关系,对该校400名高三学生(其中女生220名)平均每天体育锻炼时间进行调查,得到下表:平均每天体育锻炼时间(分钟)0,1010,2020,3030,4040,5050,60人数4072881008020将日平均体育锻炼时间在40分钟以上的学生称为“锻炼达标生”,调查知女生有40人为“锻炼达标生”.(1)完成下面2×2列联表,试问:能否有99.9%以上的把握认为“锻炼达标生”与性别有关?锻炼达标生锻炼不达标合计男女合计400附:K2=nP(0.100.050.0100.001K2.7063.8416.63510.828(2)在“锻炼达标生”中用分层抽样方法抽取5人进行体育锻炼体会交流,再从这5人中选出2人作重点发言,这2人中至少有一名女生的概率.【解题思路】(1)利用题意完成列联表,然后计算K2(2)根据分层抽样抽取男生3人,女生2人,然后列举出抽取两人的基本事件和至少有一名女生的事件,即可求解.【解答过程】(1)锻炼达标生锻炼不达标合计男60120180女40180220合计100300400K2=400×60×180−40×120(2)“锻炼达标生”中男女人数之比为60:40=3:2,故抽取的男生有3人,女生有2人,用A,B,C表示男生,用D,E表示女生,基本事件有AB,AC,AD,AE,BC,BD,BE,CD,CE,DE共10个,其中至少有一名女生的事件有AD,AE,BD,BE,CD,CE,DE共7个,故所求概率为71020.2018年8月16日,中共中央政治局常务委员会召开会议,听取关于吉林长春长生公司问题疫苗案件调查及有关问责情况的汇报,中共中央总书记习近平主持会议并发表重要讲话.会议强调,疫苗关系人民群众健康,关系公共卫生安全和国家安全.因此,疫苗行业在生产、运输、储存、使用等任何一个环节都容不得半点瑕疵.国家规定,疫苗在上市前必须经过严格的检测,并通过临床实验获得相关数据,以保证疫苗使用的安全和有效.某生物制品研究所将某一型号疫苗用在动物小白鼠身上进行科研和临床实验,得到统计数据如下:未感染病毒感染病毒总计未注射疫苗40px注射疫苗60qy总计100100200现从未注射疫苗的小白鼠中任取1只,取到“感染病毒”的小白鼠的概率为35(1)求2×2列联表中的数据p,q,x,y的值;(2)能否有99.9%(3)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取5只进行病例分析,然后从这五只小白鼠中随机抽取3只对注射疫苗情况进行核实,记X为3只中未注射疫苗的小白鼠的只数,求X的分布列和期望.附:K2=nP(0.050.010.0050.001k3.8416.6357.87910.828【解题思路】(1)根据已知条件,结合频率与频数的关系,以及列联表之间的数据关系,即可求解.(2)根据已知条件,结合独立性检验公式,即可求解.(3)通过比例可知抽取的5只小白鼠中,有3只未注射疫苗,2只已注射疫苗,从中抽取3只,则X的可能取值为1,2,3,分别求出对应的概率,再结合期望公式,即可求解.【解答过程】(1)∵从未注射疫苗的小白鼠中任取1只,取到“感染病毒”的小白鼠的概率为35∴40x=1−35=25,解得x=100(2)∵K2=n(ad−bc)(3)由于在感染病毒的小白鼠中,未注射疫苗和注射疫苗的比例为3:2,故抽取的5只小白鼠中,有3只未注射疫苗,2只已注射疫苗,从中抽取3只,则X的可能取值为1,2,3,P(X=1)=C22C3故X的分布列为:X123P331故期望为E(X)=1×321.2014年7月18日15时,超强台风“威马逊”登陆海南省.据统计,本次台风造成全省直接经济损失119.52亿元.适逢暑假,小明调查住在自己小区的50户居民由于台风造成的经济损失,作出如下频率分布直方图.(1)根据频率分布直方图估计小区平均每户居民的平均损失;(2)台风后区委会号召小区居民为台风重灾区捐款,小明调查的50居民捐款情况如下表,在表格空白处填写正确数字,并说明是否有95%经济损失4000元以下经济损失4000元以上合计捐款超过500元30捐款低于500元6合计(3)台风造成了小区多户居民门窗损坏,若小区所有居民的门窗均由李师傅和张师傅两人进行维修,李师傅每天早上在7:00到8:00之间的任意时刻来到小区,张师傅每天早上在7:30到8:30分之间的任意时刻来到小区,求连续3天内,有2天李师傅比张师傅早到小区的概率.附:临界值表k2.0722.7063.8415.0246.6357.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论