专题 成对数据的统计问题教案高考数学总复习_第1页
专题 成对数据的统计问题教案高考数学总复习_第2页
专题 成对数据的统计问题教案高考数学总复习_第3页
专题 成对数据的统计问题教案高考数学总复习_第4页
专题 成对数据的统计问题教案高考数学总复习_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题22成对数据的统计问题

探究1:成对数据的分析

【典例剖析】

例1.(2022•浙江省模拟)创新是民族的灵魂,某大型企业对其产品进行研发与创新,根

据市场调研与模拟,得到所发投入”(亿元)与研发创新的直接收益y(亿元)的数据统计如

11.8;模型②:y=

当x>17时,确定y与乃满足的线性回归方程为:y=-0.7x+a.

(1)根据下列表格中的数据,比较当OVxW17时模型①、②的决定系数产,并选择拟合精

度更高、更可靠的模型,预测该企业对产品创新改造的投入为17亿元时的直接收益.

回归模型模型①模型②

回归方程y=4.1x+11.8产=21.3代-14.4

7

(,)

Wf2182.479.2

i=l

(附:刻画回归效果的决定系数R2=l-呼叫,V17«4.1,决定系数数值越大,说明

也。「刃

拟合效果越好)

(2)为鼓励科技创新,当研发的投入不少丁-20亿元时,国家给予公司补贴收益10亿元,以回

归方程为预测依据,比较研发改造投入17亿元与20亿元时公司实际收益的大小.

(附g=£%♦%一戒少_幻(%一刃ZX

(一信一必(有-幻2a=y—bx)

(3)研发改造后,该公司产产品的效率X大幅提高,X服从正态分布N(0.52,0.O"),公司对研

发团队的奖励方案如下:若F产品的效率不超过50%,大予奖励:若尸产品的效率超过50%

但不超过53%,每件F产品奖励2万元;若F产品的效率超过53%,每件F产品奖励5万元.求

每件产产品获得奖励的数学期望.

(附:随机变量f服从正态分布则P(〃一。<§<〃+。)=0.6826,P(〃-2。<fV

〃+2。)=0.9544)

/✓

\选题意图:成对数据的统计相关性及一元线性回归模型.常以解答题的形式考查简单的实际问题,

!难度一般.试题具有图表丰富、数据与阅读信息量大的特点,考查数据分析、数学运

:算、数学建模等核心素养.例1熔合考查模型的选择与应用及正态分布,对分析问题的

!能力、运算能力要求较高.

!思维引导:第(1)问什算R2的值,选择合适的模型;第(2)问利用回归方程进行预测;第(3)

【变式训练】

练1-1(2022•福建省模拟-多选)某班级学生开展课外数学探究活动,将一杯冷水从冰箱

中取出后静置,在25国的室温下测量水温y(单位:。口随时间工(单位:min)的变化关系,在

测量了15个数据后,根据这些实验数据®・,%)(i=1,2,…,15)得到如卜的散点图:

,,温度/匕

25........................-;;vv;-s-v

20.......................——

15--V------------------------------

10--.........................................

5-1.......-..............

~O102030―时同/min

现需要选择合适的同归方程进行回归分析,则根据散点图,合适的回归方程类型有()

C2X

A.y=25-cxe~B.y=25+\]cxx+c2

C.y=25-D.y=Ci(x-25)+c2

练1-2(2022•湖北省武汉市联考)2018年9月10日,全国教育大会在北京召开,习近平总

书记在会上提出“培养德智体美劳全面发展的社会主义建设者和接班人”.某学校贯彻大会

精神,为学生开设了一门模具加工课,经过一一段时间的学习,拟举行一次模具加工大赛,

学生小明、小红打算报名参加大赛.

(1)赛前,小明进行了一段时间的强化训练,加工完成一个模具的平均速度y(秒)与训练天数

%(天)有关,经统计得到如下表数据:

N天)1234567

y(秒)990990450320300240210

经研究发现,可用y=Q+$作为回归方程模型,请利用表中数据,求出该回归方程,并预测

小明经过50天训练后,加工完成一个模具的平均速度y约为多少秒?

(2)小明和小红拟先举行一次模拟赛,每局比赛各加工一个模具,先加工完成模具的人获胜,

两人约定先胜4局者赢得比赛.若小明每局获胜的概率为1已知在前3局中小明胜2局,小红

胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率,参考数据:(其中0=;)

77

t=ii=l

18450.370.55

参考公式:对于•组数据[小,巧),(u2,v2)»•••»Qn,%),其回归直线畲=a+的斜率和

截距的最小二乘估计公式分别为"鬻器署,"=方-外正

【规律方法】

1.判断相关关系的两种方法

①散点图法:如果样本点的分布从整体上看大致在某•曲线附近,变量之间就有相关关

系;如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.

②决定系数法:利用决定系数判定,R2越趋近1,拟合效果越好,相关性越强.

2.求经验回归方程:

①利用公式5=零"誓求反利用式=9-放求6,写出经验回归方程.

Zi=i勺一

②经验回归方程的拟合效果,可•以利用相关系数|r|判断,当|r|越趋近于1时,两变量的线

性相关性越强.或利用决定系数R2判断,R2越大,拟合效果越好.

3.非线性经验网归方程转化为线性经验网归方程;

①若9=6+64,设1=«,则9=4+石£;

②若满足对数式:y=a+hlnx,设t=仇x,则歹=a+6t;

③若满足指数式:V~Qe,2x,两边取对数伍y=big+c2x,设z=lny,a=lncltb=

lnc2y则2=a+bx.

探究2:独立性检验

【典例剖析】

例2,(2022•湖北省联考)为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试

验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按

[0,20),[20,40),[40,60),[60,80),[80,100]分组,绘制频率分布直方图如图所示.试验发

现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只.

假设小白鼠注射疫苗后是否产生抗体相互独立.

(1)填写下面的2x2列联表,并根据列联表及a=0.05的独立性检验,判断能否认为注射疫

苗后小白鼠产生抗体与指标值不小于60有关.

单位:只

指标值

0025

抗体小于60不小于60合计

有抗体O.(M)K75

000751

没有抗体().(10625

00025□

一L

合计02040仅)80100后标值

(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进

行第二次注射疫苗,结果又有20只小白鼠产生抗体.

⑴用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率p;

(ii)以⑴中确定的概率p作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记九

个人注射2次疫苗后产生抗体的数量为随机变量X.试验后统计数据显示,当X=99时,P(X)

取最大值,求参加人体接种试验的人数九及£(X).

2

参考公式:等==)(黑黑Oi(其中"a+b+c+d为样本容量)

PCx2>30.500.400.250.150.1000.0500.025

k00.4550.7081.3232.0722.7063.8415.024

选题意图:独立性检验可以单独考查,也可与概率、随机变量的分布列、期望等交汇考查,通

过对统计案例的分析,掌握独立性检验的方法,体会独立性检验的基本思想在解决

实际问题中的应用,借助例2梳理独立性检验的步骤.

思维引导:笫(1)问分析频率分布直方图中的数据,填写2x2列联表,计算犬的值,从而判

断犯错概率不大于0.05;第(i)问利用正难则反的思想,先求2次疫苗后均未产生

抗体的概率,再求其对立事件的概率;笫(ii)问中,X-B(n,0.9),将P(X=9)最

大,转化为P(X=9)NP(X=8),P(X=9)2P(X=10),从而求出九及E(X).

【变式训练】

练2-1(2022•湖北省黄石市月考•多选)为了增强学生体育锻炼的枳极性,某中学需要了

解性别因素与学生对体育殿炼的喜好是否有影响,为此对学生是否喜欢体育锻炼的情况进

行普查.得到下表:

性别

合计

男性女性

喜欢280P280+p

不喜欢q120120+q

合计280+q120+p400+p+q

附”一…(3)('s+d),na+b+c+d.

P(K2>k。)0.150.100.050.0250.0100.00/

ko2.0722.7063.8415.0246.63510.828

已知男生喜欢该项运动的人数占男生人数的《,女生喜欢该项运动的人数占女生人数的看

JLUO

则下列说法正确的是()

A.列联表中"的值为120,p的值为180

B.随机对一名学生进行调查,此学生有90%,的可能喜欢该项运动

C.有99%的把握认为学生的性别与其对该项运动的喜好有关系

D.没有99.9%的把握认为学生的性别与其对该项运动的喜好有关系

练2-2(2022•山东省潍坊市模拟)根据以往的经验,某工程施工期间的降水量X(单位:

mm)对工期的影响如下表:

降水量X[0,300)[300,600)[600,900)[900,+oo)

工期延误天数y0258

历史气象资料表明:该工程施工期间降水量X小于300,600,900的概率分别为0.3,0.7,

0.9.

(1)求工期延误天数y的均值与方差;

(2)求在降水量X至少是300的条件下,工期延误不超过5天的概率;

(3)由于该工程在7〜8月施工,故当气温较高时,工人可能无法按时完成当口计划工作量.已

知在某个40天的施工周期内,有30天的最高气温不低于35K,这其中仅有12天完成了当日

的工作量;剩余10天中,有8天完成了当日的工作量.依据小概率值a=0.005的/独立性检

验,判断“当日最高气温不低于35笃”和“工人能完成当日的工作量”是否相互独立,并写

出零假设.

n(ad-bc)2

附:临界值&.005=7.879.

(a+c)(b+d)(b+c)(Q+d)

【规律方法】

1.在2x2列联表中,如果两个变量没有关系,则应满足ad—be心0.|ad—尻|越小,说明

两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.

2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般

步骤;

(1)根据样本数据制成2x2列联表:

nCad-bc)2

(2)根据公式X?=计算

(a+b)(a+c)(b+d)(c+d)

⑶通过比较%2与临界值的大小关系来作统计推断.

探究3:概率与统计的综合问题

【典例剖析】

例3.(2022•江西省景德镇市模拟)十三届全国人大四次会议3月11H表决通过了《关于

国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议》,纲要指出:“加

强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现

离子注入机全谱系产品国产化,包括中束流、大束流、高能特种应用及笫三代半导体等离

子注入机,工艺段覆盖至28nm,为我国芯片制造产业链补上重要一环,为全球芯片制造企

业提供离子注入机一站式解决方案.此次技术的突破可以说为国产芯片的制造做出了重大贡

献,该企业使用新技术对某款芯片进行试生产,该款芯片的性能以某项指标值

k(70<k<100)为衡量标准,性能指标的等级划分如表:

性能指标值k90WkV10085</c<9080</c<8575WkV8070Sk<75

等级ABCDE

为了解该款芯片的生产效益,该企业从试生产的产品进行随机抽样并测量了每件产品的指标

值,若以组距为5画频率分布直方图时,发现丫(设“誓=丫”)满足:r=

组距

(2n-25vI7

300,n-(neN\5n</c<5n+5).

U-22O-n,n>17

(1)试确定n的所有取值,并求a;

(2)从样本性能指标值不小于85的产品中采用分层抽样的方法抽取5件产品,求样本中等级4

产品与等级8产品的件数.然后从这5件产品中一次性随机抽取2件产品,并求出2件都是4级

品的概率.

\选题意图:概率统计试题具有应用性、情境性、综合性的特点,试题注重基本概念的理解,着眼于

!知识在理解的基础上应用,考查常规的、熟悉的知识内容.例3难度一般,考查概率与统

计的综合应用,考查学生数据分析、数学运算的核心素养.

:思维引导:第(1)问分析数据,利用频率之和为1,求出田第(2)问考查古典概型求概率,列举

!出所有的样本点,从而求出事件”所求2件都是A级品''的概率.

【变式训练】

练3-1(2022•广东省东莞市月考)足球是一项大众喜爱的运动.2022卡塔尔世界杯揭幕战

将在2022年11月21日打响,决赛定于12月18日晚进行,全程为期28天.

(1)为了解喜爱足球运动是否与性别有关,随机抽取了男性和女性各100名观众进行调查,

得到2x2列联表如下:

喜爱足球运动不喜爱足球运动合计

男性6040100

女性2080100

合计80120200

依据小概率值a=0.001的独立性检验,能否认为喜爱足球运动与性别有关?

(2)校足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球

时,传球者都等可能的将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次

传球都能被接到.记开始传球的人为第1次触球者,第n次触球者是甲的概率记为几,即/=

1.

⑴求尸3(直接写出结果即可);

(〃•)证明:数列{匕为等比数列,并判断第19次与第20次触球者是甲的概率的大小.

a0.1000.0500.0250.0100.001

Xa2.7063.8415.0246.63510.828

练3-2(2022•福建省联考)近年来,我国大学生毕业人数呈逐年上升趋势,各省市出台优

惠政策鼓励高校毕业生自主创业,以创业带动就业.某市统计了该市其中四所大学2021年

的毕业生人数及自主创业人数(单位:千人),得到如下表格:

4大学8大学C大学。大学

当年毕业人数千人)3456

自主创业人数y(千人)0.10.20.40.5

(1)已知y与工具有较强的线性相关关系,求y关于%的线性回归方程9=a+bx;

(2)假设该市政府对选择巨主创业的大学生每人发放1万元的创业补贴.

(i)若该市E大学2021年比业生人数为7千人,根据(1)的结论估计该市政府要给E大学选择

自主创业的毕业生创业补贴的总金额:

(ii)若力大学的毕业生中小明、小红选择自主创业的概率分别为p,2p-lQ<p<l),该市

政府对小明、小红两人的自主创业的补贴总金额的期望不超过L4万元,求p的取值范围.

参考公式:回归方程?=a+Bx中斜率和截距的最小二乘法估计公式分别为

r_^iXjy-rix-y-”

》一言布于”一,

【规律方法】

概率与统计作为考查考生应用意识的重要载体,己成为近几年高考的一大亮点和热点.它与

其他知识融合、渗透,情境新颖,充分体现了概率与统许的工具性和交汇性.概率与统计案

例的综合应用常涉及相互独立事件同时发生的概率、频率分布直方图的识别与应用、数字特

征、独“性检验等基础知识,考杳学生的阅读理解能力、数据处理能力、运算求解能力及应

用意识.

专题22成对数据的统计问题一答案解析

182.479.2

例1.【解析】(1)由表格口的数据,有182.4>79.2,即:2t

£"仇一力2H=1(y-y)

所以模型①的R2小于模型②,说明回归模型②刻画的拟合效果更好,

所以当%=17亿元时,研发改造直接收益的预测值为

y=21.3XT17-14.4«21.3x4.1-14.4=72.93(亿元),

(2)由已知可得:(-20=1+2+?4+5=3-=23,

—,八8,5+8+7.5+6+6--—re

y-60=-------------------=7.2o=y=67.2,

所以Q=歹+0.7x=67.2+0.7X23=83.3,

所以当%>17亿元时,y与%满足的线性回归方程为9=-0.7%+83.3,

当x=20亿元时,研发改造直接收益的预测值为9=-0.7X20+83.3=69.3;

当欠=20亿元时,实际收益的预测值为69.3+10=79.3亿元,72.93亿元,

所以研发改造投入20亿元时,公司的实际收益更大;

(3)因为P(0.52-0.02V><0.52+0.02)=0.9544,

所以P(X>0.50)=1+誓44=09772,P(X<0.50)=~誓44=8,

0022

因为P(0.52-0.01<X<0,52+0.01)=0.6826,

所以P(X>0.53)=J°詈6=o1587,

所以P(O50<X<0,53)=0.9772-0.1587=0.8185,

设每件F产品获得奖励为y(万元),则y的分布列为:

Y025

P0.02280.81850.1587

所以每件F产品获得奖励的期望值为:

E(y)=0x0.0228+2x0.8185+5x0.1587=2.4305〔万元).

练卜1.【解析】散点图的特点是单调递增,增长速度越来越慢,且水温yV25.

对A选项,符合散点图的特点;

对8选项,y=25+7^彳备225不符合散点图的特点;

对C选项,符合散点图的特点;

对。选项,y=臼(工一25)+。2的增长速度不变,不符合散点图的特点.

故选:AC.

练1-2.【解析】(1)由题意,y=1(990+990+450+320+300+240+210)=500,

令t=[,设y关于t的线性回归方程为?=+6,则

公_£乙”以一7而_1845-7x0.37x500_.

b=/说-尔=一屈一=10n0nn°'

则a=500-1000x0.37=130,

.-.y=1000t+130,又£J,

y关于x的回归方程为?=1^+130,

故x=50时,y=150,

・•.经过50天训练后,加工完成一个模具的平均速度y约为150秒;

(2)设比赛再继续进行X局小明最终赢得比赛,则最后一局一定是小明获胜,

由题意知,最多再进行4局就有胜负,X可能的取值为2、3、4.

当X=2时,小明4:1胜,P(X=2)='X'=£

当X=3时,小明4:2胜,「(*=3)=6乂\(1一百乂泊黑,

当X=4时,小明4:3胜,口(¥=4)=©><K(1一射爆二孚,

••・小明最终赢得比赛的概率为得+票+挈二探.

25125625625

例2.【解析】(1)由频率分布直方图,知200只小白鼠按指标值分布为:

在[0,20)内有0.0025x20x200=10(只);

在[20,40)内有0.00625x20X200=25(H):

在[40,60)内有0.00875x20x200=35(只):

在[60,80)内有0.025x20x200=100(只):

在[80,100]内有0.0075X20X200=30(只).

由题意,有抗体且指标值小于60的有50只;而指标值小于60的小白鼠共有10+25+35=

70只,所以指标值小于60且没有抗体的小白鼠有20只,同理,指标值不小于60且没有抗体

的小白鼠有20只,故列联表如下:

单位:只

指标值

抗体合计

小于60不小于60

有抗体50110160

没有抗体202040

合计70130200

零假设为%:注射疫苗后小白鼠产生抗体与指标值不小于60无关联.

根据列联表中数据,得才2_200x(50x20—20x110)2

__160x40x70x130-x4.945>3.841=x005♦

根据a=0.05的独立性检验,推断%不成立,即认为注射疫苗后小白鼠产生抗体与指标值

不小于60有关,此推断犯错误的概率不大于0.05.

(2)(i)令事件力="小白鼠第一次注射疫苗产生抗体”,事件8="小白鼠第二次注射疫苗

产生抗体”,事件C="小白鼠注射2次疫苗后产生抗体”.

记事件4B,C发生的概率分别为P(4),P(B),P(C),

则P(4)=温=08P(B)=寨=OSP(C)=1-P(彳)P(耳)=1-0.2x0.5=0.9.

所以一只小白鼠注射2次疫苗后产生抗体的概率p=0.9.

(ii)由题意,知随机变量X〜8mo.9),P(X=/c)=CjJx0.9kx0.ln-k(k=0,1,2,

x0.9"x0.1n-">屋8X0.998xo.ln-98

因为P(X=99)最大,所以

x0.9"x0.1n-">盘°°xO,9100x0.1nT°°

解得109W"Ml叫,因为九是整数,所以九=109或n=110,所以接受接种试验的人数

为109或110.

①当接种人数为109时,E(X)=np=109x0.9=98.1;

②当接种人数为110时,E(X)=np=110x0.9=99.

练2-1.【解析】男生喜欢该项运动的人数占男生人数的耦=看,解得q=120,

女生喜欢该项运动的人数占女生人数的函=|,解得p=180,故A正确;

随机对一名学生进行调等此学生有点黑=焉磊%=摆«0・66的可能喜欢该项

运动,故B错误;

对于CD,

性别

合计

男性女性

喜欢280180460

不喜欢120120240

合计400300700

700(280x120-120x180)2

所以%2=7.609>6.635,

400x300x460x240

所以有99%的把握认为学生的性别与其对该项运动的喜好有关系,故C正确:

_700(280x120-120x180)2

而矛2«7.609<10.828,

400x300x460x240

所以没有99.9%的把握认为学生的性别与其对该项运动的喜好有关系,故D正确.

故选:ACD.

练2-2.【解析】(1)由已知条件和概率的加法公式有:P(X<300)=0.3,P(300<X<

600)=P(X<600)-P(X<300)=0.4,

P(600<X<900)=P(X<900)-P(X<600)=0.2,P(X>900)=1-P(X<900)=

0.1,

所以y的分布列为:

y0258

P0.30.40.20.1

于是,E(Y)=0x0.3+2x0.4+5x0.24-8x0.1=2.6,

22

D(F)=(0-2.6)x0.3+(2-2.6)2x04+(5-2.6)2x024-(8-2.6)x0.1=6.24.

故工期延误天数y的均值为2.6,方差为6.24;

(2)由对立事件的概率公式可得尸(X>300)=1-P(X<300)=0.7,

又P(300<X<900)=P[X<900)-P(X<300)=0.6,

由条件概率得P(Y<5]X>300)=P(黑或:)=照=1

故在降水量X至少是300nnn的条件下,工期延误不超过5天的概率是*

(3)零假设“当日最高气温不低于35。(:”与“工人能完成当日工作量”相互独立,

根据题意可得到如卜的列联表:

工人完成当日工作城I:人未完成当日I:作量

最高气温低于3SC82

最高气盘不低于35(1218

hl|Jy2=n(Qd-bc)2=40(8x18-12X2)2q

z_(a+c)(b+d)(b+c)(a+d)—10x30x20x20〜/心、

因而不能拒绝原假设,

因此,可•以认为“当日最高气温不低于35久”和“工人能完成当日的工作量”相互独立.

例3.【解析】(1)根据题意,70</c<100,按组距为5可分成6个区间,

分别是[70,75)、[75,80)、[80,85)、[85,90)、[90,95)、[95,100),

因为70WkV100,由<5(九+1),nGN\可知n的取值集合为

(14,15,16,17,18,19),

每个小区间对应的频率值为5y=f鬃'nW{14,15,16,17}.

(5a-22°-n,ne{18,19]

所以,“'+5ax(2?+2)=30a+1=1,解得Q=3.

OU□5U

(2)等级A产品的频率为5x3x⑵+2)=3等级B产品的频率为笔津=焉

□U3OUZU

所以,等级A产品和等级2产品的频率之比为福4=4:1,

所以,从样本性能指标值不小「85的产品中采用分层抽样的方法抽取5件产品,

等级A产品的件数为4,分别记为由、g、。3、。4,等级B产品的件数为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论