高考数学考点复习:统计与统计案例(讲)【解析版】_第1页
高考数学考点复习:统计与统计案例(讲)【解析版】_第2页
高考数学考点复习:统计与统计案例(讲)【解析版】_第3页
高考数学考点复习:统计与统计案例(讲)【解析版】_第4页
高考数学考点复习:统计与统计案例(讲)【解析版】_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一篇热点、难点突破篇

专题21统计与统计案例(讲)

真题体验感悟高考

1.(2022•全国•统考高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽

取1()位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座

后问卷答题的正确率如下图:

100%

95%沐

90%■*...........

耨85%

售80%*讲座前

田75%•讲座后

70%

65%*...........*

60%....*冰.......

。;12345678910

居民编号

贝()

A.讲座前问卷答题的正确率的中位数小于70%

B.讲座后问卷答题的正确率的平均数大于85%

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

【答案】B

【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.

【详解】讲座前中位数为‘0%;75%>70%,所以A错;

讲座后问卷答题的正确率只有•个是80%,4个85%,剩卜全部大于等于90%,所以讲座后问卷答题的正确率的平

均数大于85%,所以B对;

讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C

错;

讲座后问卷答题的正确率的极差为100%-80%=20%,

讲座前问卷答题的正确率的极差为95%-60%=35%>20%、所以口错.

故选:B.

2.(2022•全国•统考高考真题)甲、乙两城之间的长途客车均由4和8两家公司运营,为了解这两家公司长途客

车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:

准点班次数未准点班次数

A24020

B21030

(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;

(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?

附:心—

0.1000.0500.010

k2.7063.8416.635

127

【答案】(1)力,4两家公司长途客车准点的概率分别为百,-

13o

⑵有

【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果:

(2)根据表格中数据及公式计算长2,再利用临界值表比较即可得结论.

【详解】(1)根据表中数据,力共有班次260次,准点班次有240次,

设A家公司长途客车准点事件为M,

〃共有班次240次,准点班次有210次,

设B家公司长途客车准点事件为N,

则P(N)=C210==7.

2408

A家公司长途客车准点的概率为j|;

B家公司长途客车准点的概率为:.

O

(2)列联表

准点班次数未准点班次数合计

.424020260

B21030240

合计45050500

n(ad-be)2

K2

(a+b)(c+d)(a+c)(b+d)

500x(240x30-210x20)2

»3.205>2.706,

260x240x450x50

根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.

3.(2022•全国•统考高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木

的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面枳(单位:nf)和材积量(单位:n?),

得到如下数据:

样本号i12345678910总和

根部横截面积七0.040.060.040.080.080.050.050.070.070.060.6

材积量乃0.250.400.220.540.510.340.360.460.420.403.9

101010

并计算得=0038,»2=L6l5B,»a=82474.

i=li=li=l

(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材枳量;

(2)求该林区这种树木的根部横截面枳与材积量的样本相关系数(精确到0.01);

(3)现测曷了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为96m2.已知树

木的材积最与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积最的估计值.

力-FS一刃

附:相关系数/"寸------:---------.,VL896«1.377.

心(D专(凹-歹了

【答窠】(1)0,061/;0.39m3

⑵0.97

⑶1209m3

【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一

棵的根部横截面积与平均一棵的材枳量;

(2)代入题给相关系数公式去计算即可求得样本的相关系数值;

(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值.

【详解】(I)样本中10棵这种树木的根部横截面积的平均值了=笔=0.06

样本中10棵这种树木的材积量的平均值了=存=0.39

据此可估计该林区这种树木平均一棵的根部横截面积为0.06m2,

平均一棵的材积量为0.39n?

io10

Z(V可5一力》乂7。双

(?))•=1II==.11

0.2474-10x0.06x0.390.01340.0134八~

=,=,/a-------=0.97

7(0.038-10x0.062)(1.6158-10x0.392)V0.00018960.01377

则r=0.97

3

(3)设该林区这种树木的总材积晶的估计值为ym,

又已知树木的材积量与其根部横截面积近似成正比,

可得痂=歹,解N得y=1209n?.

则该林区这种树木的总材积量估计为1209m3

总结规律预测考向

(一)规律与预测

1.统计知识在小题中常考查随机抽样、样本的数字特征和统计图表等内容,往往以实际问题为背景.统计图表也

有在解答题中出现的情况.

2.统计案例常以解答题形式出现,主要独、'/:考查回归方程或独汇性检验,难度中等.亦有与概率知识交汇命题的

情况,试题难度中等偏上.

(二)本专题考向展示

考点突破典例分析

考向一抽样方法

类别共同点各自特点联系适用范围

简单随①抽样过程中每

从总体中逐个抽取总体个数较少

机抽样个个体被抽到的

可能性相等;

分层②每次抽出个体将总体分成几层,分层进各层抽样时,采用简单总体由差异明显的几

抽样后不再将它放回,行抽取随机抽样部分组成

即不放回抽样

【典例分析】

典例1.(2022秋•福建宁德•高三校考期末)为了贯彻落实中央新疆工作座谈会和全国对口支援新疆工作会议精

神,促进边疆少数民族地区教育事业发展,某省派出r200名教师援疆.现采用分层抽样的方法从中抽取一个容

量为40的样本,调查他们的援疆工作情况,若样本中女教师比男教师少8人,则该省此次援疆女教师人数为

()

A.16B.40C.8()D.120

【答案】C

【分圻】先求出样本女教师人数,由分层抽样的定义列式求解即可.

【详解】设样本中女教师为r人,则40-x・x=8Dx=l6,二援毓女教师人数为16'毁=80

40

故选:C

典例2.总体由编号为01,()2,…,29,30的3()个个体组成,现从中9抽取一个容量为6的样本,请以随机

数表第1行第3列开始,向右读取,则选出来的第6个个体的编号为()

7029171213403312382613895103

5662183735968350877597125593

A.12B.13C.03D.40

【答案】C

【解析】

从随机数表第1行第3列开始由左到右依次选取两个数字中小于30的编号依次为29,17,12,13,26,03,

则第6个个体的编号为26.

故选C

【规律方法】

1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.

2.分层抽样的前提和遵循的两条原则

(D前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较个,每层中所抽

取的个体数可按各层个体数在总体的个体数中所占比例抽取.

⑵遵循的两条原则:

①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;

②分层抽样为保证每个个体等可能人样,需遵循在各层中进行简单随机抽样,每层样木数量与每层个体数量的

比等于抽样比.

考向二频率分布直方图的应用

【核心知识】

1.频率分布直方图

频率_频率

(1)纵轴表示舄,即小长方形的高=扁■:

组距组距

频率

(2)小长方形的面积=组距X岛=频率:

(3)各个小方形的面积总和等于1.

2.频率分布直方图中的常见结论

(1)众数的估计值为最高矩形的中点对应的横坐标.

(2)平均数的估计值等;频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.

(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.

【典例分析】

典例3.(2022•天津•统考高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张

压数据(单位:kPa)的分组区间为[12,⑶/3,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为

第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有2()人,

第三组中没有疗效的有6人,则第三组中有疗效的人数为()

16D.18

【答案】B

【分析】结合已知条件和频率分布直方图求出志愿者的总人数,进而求出第三组的总人数,从而可以求得结

果.

20

【详解】志愿者的总人数为(O.24+0.6)G=5。,

所以第三组人数为50x0.36=18,

有疗效的人数为18—6=12.

故选:B.

典例4.(2023秋・河南三门峡•高三统考期末)某果园新采摘了一批苹果,从中随机抽取50个作为样本,称出它

们的重量(单位:克),将重量按照[120,140),[140,160),[160,180同180,200]进行分组,得到频率分布直方图如

图所示(同一组中的数据以该组区间的中点值为代表).

⑴估计这批苹果的重量的平均数;

(2)该果园准备把这批苹果销售给一家超市,据市场行情,有两种销售方案;

方案一:所有苹果混在一起,价格为2.5元/千克;

方案二:将不同重量的苹果分开,重量不小于16()克的苹果的价格为3元/千克,重量小于160克的苹果的价格

为2元/千克,但果园需支付每1000个苹果5元的分拣费.

分别估计并比较两种方案下果园销售10000个苹果的收入.

【答案】(1)平均数约为159.6克

(2)答案见解析

【分析】(1)根据频率之和为1列出方程,求出。=0.01,进而求出平均数;

(2)计算出两种方案的销售收入,比较后得到结论.

【详解】(1)由题意.得(0.016+0015+4+0.009)x20=1,解得〃=0.01.

50个苹果重:量的平均数为»=0.2xl30+0.3xl50+0.32xl70+0.18xl90=159.6,

故估计这批苹果的重量的平均数约为159.6克;

2.5

(2)若采用方案一,估计销佻收入约为159.6xl0000x=3990(元)

1000

若采用方案二,重量小于160克的苹果的总重量约为

(10000x0.2xl30+10000x0.3xl50)x——=710(千克),

1000

重量不小于160克的苹果的总重量约为

1

(10000x0.32x170+10000x0.18xl90)x=886(千克),

1000

估计销售收入约为710x2+886x3—50=4028(元),

因为3990<4028,因此,方案二的销售收入更高.

【总结提升】

1.,/?数1=频率,此关系式的变形为罂=样本容量,样本容量x频率=频数

样本容量频率

2.易借提醒:

频率

频率分布直方图的纵坐标是焉■,而不是频率

组距

考向三统计图表

条形图、折线图及扇形图

(I)条形图:建立直角坐标系,用横釉(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,

根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排

列起来,这样一种表达和分析数据的统计图称为条形图.

(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值

和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,

这样的•种表示和分析数据的统计图称为折线图.

(3)扇形图:用•个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分

占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.

【典例分析】

典例5.(2020•海南•高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天

复工复产指数折线图,下列说法正确的是

A.这11天友工指数和复产指数均逐口增加;

B.这11天期间,复产指数增量大于复工指数的增量;

C.第3天至第11天复工复产指数均超过80%;

D.第9天至第11天复产指数增量大于复工指数的增量;

【答案】CD

【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,

可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD正确.

【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第1()天到第11曼工指数

减少,第8天到第9天复产指数减少,故A错误;

由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复

产指数增量小于复工指数的增量,故B错误;

由图可知,第3天至第11天复工复产指数均超过80%,故C正确;

由图可知,第9天至第11天复产指数增量大于复:工指数的增量,故D正确;

典例6.(2023春•四川广安•高三校考开学考试)2021年11月10口,中国和美国在联合国气候变化格拉斯哥大

会期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共

同努力,并与各方一道,加强《巴黎协定》的实施,双方同意建立“21世纪20年代强化气候行动工作组”,推

动两国气候变化合作和多边进程.为响应《宣言》要求,某地区统计了2020年该地区一次能源消费结构比例,

并规划了2030年一次能源消费结构比例,如图所示:经测算,预估咳地区2030年一次能源消费量将增长为2020

年的2.5倍,预计该地区()

2020年•次能源消费结构2030年规划•次能源消费结构

A.2030年煤的消费量相对2020年减少了

B.2030年天然气的消费量比2020年的消费量增长了5倍

C.2030年石油的消费量相对2020年不变

D.2030年水、核、风能的消费量是2020年的7.5倍

【答案】D

【分析】设2020年该地区一次能源消费总量为。,计算出2030年该地区煤、石油、天然气以及水、核、风能

的消费量,逐项判断可得出合适的选项.

【详解】设2020年该地区一次能源消费总量为

2020年煤的消费量为0.6a,规划2030年煤的消费量为ax2.5x0.3=0.75a>0.6a,故A错误;

2020年天然气的消费量为0.1a,规划2030年天然气的消费量为ax2.5x0.2=0.5a,比2020年增长了4倍,故

B错误;

2020年石油的消费量为0.2a,规划2030年石油的消费量为ax2.5x02=0.5。>0.2a,故C错误;

2020年水、核、风能的消费量为0.1*规划2030年水、核、风能的消费量为ax2.5x0.3=0.75a=7.5x0.1a,

故D正确.

故选:D.

【规律方法】

统计图表问题的解决方法

1.首先要准确地识图《即要明确统计图中纵轴、横轴及折线、区域等所表示的意义,尤其注意数字变化的趋势等.

2.其次要准确地用图,会根据统计图中的数字计算样本的数字特征,会用统计图估计总体.

考向四用样本的数字特征估计总体的数字特征

【核心知识】

1.中位数、众数、平均数的定义

(1)中位数

将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.

(2)众数

一组数据中出现次数量型的数据叫做这组数据的众数.

(3)平均数

一组数据的算术平均数即为这组数据的平均数,〃个数据小,用,…,X。的平均数+照+•••+X).

n

2.样本的数字特征

如果有〃个数据由,*2,…,X»,那么这〃个数的

22

⑴标准差5=Aj^[(Xl—X)+(X2~X)2H-----\-(Xn—X)].

1—————

222

⑵方差s2=[(X]-x)+(X2-X)H-----F(xw—X)]•

3.平均数、方差的公式推广

⑴若数据乂,Xi,的的平均数为则加M+4mx2-\-ch勿照+4…,4+a的平均数是就+&

(2)若数据小,物…,工的方差为屋,则数据axi+b,ax2+Z?,•••,&照+。的方差为44.

4.方差的简化计算公式:4=匕(或+忌+~+忌)一〃回]或写成4=1(就+忘+~+/)一便,即方差等于原数据

nn

平方的平均数减去平均数的平方.

【典例分析】

典例7.【多选题】(2021•全国高考真题)有一组样本数据玉,x2,x„,由这组数据得到新样本数据必,

必,…,尤,其中匕=玉+。«=1,2,…,〃),c为非零常数,则()

A.两组样本数据的样本平均数相同

B.两组样本数据的样本中位数相同

C.两组样本数据的样本标准差相同

D.两组样数据的样本极差相同

【答案】CD

【解析】

A、C利用两组数据的线性关系有E(y)=E(x)+c、D(y)=D(x),即可判断正误;根据中位数、极差的定义,

结合已知线性关系可判断B、D的正误.

【详解】

A:E(y)=E(x+c)=E(x)+c且cwO,故平均数不相同,错误;

B:若第一组中位数为王,则第二组的中位数为必=x,+c,显然不相同,错误;

C:D(y)=D(x)+D(c)=Z)(x),故方差相同,正确;

D:由极差的定义知:若第•组的极差为几.-工川「则第二组的极差为

Wax-Znin=(/m+。)一(/m+。)=%一/in,故极差相同,正确:

故选:CD

典例8.(2021・全国•统考高考真题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有

无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:

旧设备9.810.310.010.29.99.810.010.110.29.7

新设备10.110.410.110.010.110.310.610.510.410.5

旧设备和新设备生产产品的该项指标的样本平均数分别记为嚏和〉样本方差分别记为5:和

⑴求11,5:,学;

(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果歹一尸22小上萨,则认为新设备

生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).

【答案】(1)E=10j=10.3,^=0.036,^=0.04;(2)新设备生产产品的该项指标的均值较旧设备行显著提高.

【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.

(2)根据题目所给判断依据,结合(1)的结论进行判断.

-—-9.8+10.3+10+10.2+9.9+9.8+10+10.1+10.2+9.7⑺

[详解](1)x=-------------------------------------------------------------------------=10,

-10.1+10.4+10.1+10+10.1+10.3+10.6+10.5+10.4+10.5,八.

y=----------------------------------------------------------------------------------=10.3,

10

20.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+032〜

S]==un.u3o,

10

20.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.22

5;=----------------------------------------------------------------------------------=0A.04

10

(2)依题意,]_1=0.3=2x0.15=2j0.152=2j0.0225,2^°,°-^0,°4=2>/0.0076,

5一42后^~,所以新设备生产产品的该项指标的均值较旧设备有显著提高.

【规律方法】

利用洋本的数字特征解决优化决策问题的依据

①平均数反映了数据取值的平均水平;标准差、方差描述了组数据围绕平均数波动的大小.标准差、方差越

大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.

②用洋本估计总体就是利用样本的数字特征来描述总体的数字特征.

考向五回归分析

两个变量的线性相关

(I)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线

性相关关系,这条直线叫做回归直线.

(2)回归方程为其中

八2(七-三)(乂-刃Aji-nxy

♦="1d------------------;-=-4------------------------,a=y-bx

七(七-工)-欣2

1=1»=1

回归直线y=bjc~\~a必过样本点的中心(z•y)•这个结论既

是检脸所求回归直.线方程是否准确的依据•也是求参数的

一个依据.

(4)相关系数:

①样本数据的相关系数

_£(为"B)y』一fl)

(为一辟/官8,一亚

反映洋本数据的相关程度,)1越大,则相关性越强.

②当,>o时、表明两个变量亚M;

当/<0时,表明两个变量负相关.

/■的绝对值越接近于1,表明两个变量的线性相关性越强一/•的绝对值越接近于0,表明两个变量之间几乎不存

在线性相关关系.通常|“大于0.75时,认为两个变量有很强的线性相关性.

【典例分析】

典例9.(2023•四川绵阳・绵阳中学校考模拟预测)近期记者调查了热播的电视剧《狂飙》,发现年龄段与爱看的

比例存在较好的线性相关关系,年龄在[10/4],[15,19],[20,24],[25,29],[30,34]的爱看比例分别为10%,

18%,20%,30%,/%,现用这5个年龄段的中间值x代表年龄段,如12代表[10,14],17代表[15,19],根据

前四个数据求得工关于爱看比例y的线性回归方程为夕=("-4.68)%,由此可推测/的值为()

A.33B.35C.37D.39

【答案】B

【分析】求出前四组数据的样本中心点口J)的坐标,代入回归直线方程求出A的值,再将x=32代入回归直线

方程可得出f的值.

【详解】因为比例和线性回归方程均带有%,故为了方便计算,以下数据省略%,

-12+17+22+^710+18+20+30

前四组的平均数为x=±吆'=19.5,y=19.5,

4~7~

代入线性回归方程V=狂-4.68得19.5=Rx19.5-4.68,解得攵=1.24,

所以,线性回归方程为y=L24x-4.68,

当x=32时,y=1.24x32—4.68=35,由此可推出,的值为35.

故选:B.

典例10.(2020•全国•统考高考真题)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为

调查咳地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取

20个作为样区,调查得到样本数据j,i)(i=l,2,…,20),其中3和W分别表示第,个样区的植物覆盖面积

20202020

(单位:公顷)和这种野生动物的数量,并计算得£玉=60,2必=1200,Z(X—"=80,£(»「歹)2=9000,

/=1/=!r=l

20

X(%—亍)(),,一>)=800.

(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘

以地块数);

(2)求样本Q*j”)(i=l,2,2。)的相关系数(精确到0.01);

(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数

量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.

附:相关系数尸皆------:---------•,力L414.

JSa-工)吃(乂一刃2

V沁।/-I

【答案】(1)12000;(2)0.94;(3)详见解析

【分析】(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可:

2。__

Z(x,.7)(j,,r)

(2)利用公式-=—===二----L计算即可:

”司2之8-才

1-1

(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.

120|

【详解】(1)样区野生动物平均数为高2%=高'1200=60,

地块数为200,该地区这种野牛.动物的估计值为200x60=12000

(2)样本2,...»20)的相关系数为

800272

/-=।-「一一=---x0.94

;780x90003

必丫。2(%-歹)2

Vr=l/=1

(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,

由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,

采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,

从而可以获得该地区这种野生动物数量更准确的估计.

典例11.(2023秋•河南三门峡•高三统考期末)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过

年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:

A区B区C区D区

外来务工人数X/万3456

就地过年人数w万2.5344.5

(1)请用相关系数说明),与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程.&泡以.

(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.

①若亥市£区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E区就地过年的人员发放的补贴

总金额;

②若4区的外来务工人员中甲、乙选择就地过年的概率分别为p,2〃-1,其中;该市政府对甲、乙两

人的补贴总金额的期望不超过1400元,求p的取值范围.

Yx<y>~nxy

参考公式:相关系数,”/一,回归方程,健洱胎中斜率和截距的最小二乘估计公式分别为

崔产—〃炉

.—

企2%»一〃町,

---------,鼠

£巧-nx~

r=l

【答窠】(1»与X之间的线性相关程度非常强,强0.7X+0.35

(14

(2)①1750万兀:②

【分析】(1)根据相关系数,•的绝对值越接近1,线性回归模型的拟合效果越好,即可以根据直接计算相关系数

/•的值来判断y与x之间的线性相关程度的强弱;y关「X的线性回归方程直接用参考公式求解.

(2)(1)将x=2代入(1)中的线性回归方程,即可求出片区就地过年的人数;

(ii)由X的所有可能取值为0,1,2,并分别求出相应的概率,即可得到分布列,然后求出期望,最后列出不

等式求出P的取值范围.

-3+4+5+6-2.5+3+4+4.5

【详解】⑴)由题'”1-=4.5,y==3.5,

4

z

=3x2.5+4x3+5x4+6x4.5=66.5,

r=1

4

Z2

%=32+42+52+62=86,

T

4

2

Z匕-2.52+32+42+4.52-51.5,

«=1

66.5-4x4.5x3.53.5八“

所以相美系数〃=/,-/、=-7T-=099,

y86-4x4.5,xV51.5-4x3.5'J5xj2.5

因为y与x之间的相关系数近似为0.99,说明y与x之间的线性相关程度非常强,所以可用线性回归模型拟合y

与x之间的关系.

由66.5-4x4.5x3.5^一X

^=-86^4^4?-=0-7,涯》-阪=3.5-0.7x4.5=0.35,

故y关于戈的线性1叫归方程为逞0.7.V+0.35.

(2)①将x=2代入握0.7X+0.35,得逞0.7x2+0.35=1.75,

故估计该市政府需要给E区就地过年的人员发放的补贴总金额为1.75X1000=1750(万元).

②设甲、乙两人中选择就地过年的人数为X,则X的所有可能取值为0,1,2,

P(X=0)=(l-p)(2-2p)=2p2-4p+2,

尸(X=l)=(l_p)(2p_l)+M2_2p)=-4p2+5p_l,

P(X=2)=P(2p-l)=2p2-p.

所以旗丫)=0+(-4〃2+5〃一1卜1+(2//一〃卜2=3〃-1,

所以E(1000X)=1000(3p-l),

4

由1000(3〃-1)41400.j.

114

又不<P<1,所以三,

(141

故p的取值范围为.

【规律方法】

一、线性回归分析问题的类型及解超方法

1.求线性I可归方程

⑴利用公式,求出回归系数3,2

(2)待定系数法:利用I可归直线过样本点的中心求系数.

2.利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.

3.利用回归直线判断正、负相关,决定正相关还是负相关的是系数3.

二、模型拟合效果的判断

(1)残差平方和越小,模型的拟合效果越好.

(2)相关指数配越大,模型的拟合效果越好.

(3)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.

B■■«■MM■■MSB■■MB・■■■MHB■■■■■■■OHB■■■■■■•MMB■■■・OBM■■MM・・■■MM・■■■MHB■■MM■■IB■■・^B■■MM・■fli^B■■■■■■■■■■■■

考向六独立性检验

【核心知识】

(1)2*2列联表

(2)独立性检验

n(ad-bc)2

利用值机变量烂(也可表示为,2)的观测值K(其中〃=a+b+c+d为样本容量)

(a+b)(c+d)(a+c)(b+d)

来判断“两个变量有关系''的方法称为独立性检验.

颁五砂将编票好的不交塞方关系而币看漉度而到麻…而元息奸箕真香有芙素的西惭二

【典例分析】

典例12.(2021•全国高考真题(文))甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比

较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:

一级品二级品合计

甲机床15050200

乙机床12080200

合计270130400

(1)甲机床、乙机床生产的产品中•级品的频率分别是多少?

(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?

陆一(u

0.0500.0100.001

k3.8416.63510.828

【答案】(1)75%;60%;

(2)能.

【解析】

本题考查频率统计和独立性检验,属基础题,根据给出公式计算即可

【详解】

(1)甲机床生产的产品中的一级品的频率为胃=75%,

乙机床生产的产品中的一级品的频率为g=60%.

200

400(150x80-120x50)2

卷〉10>6.635,

(2)K2=

270x130x200x200

故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.

典例13.(2023秋呐蒙古阿拉善盟•高三阿拉善盟第一中学校考期末)盲盒里面通常装的是动漫、影视作品的周

边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开后才会知道自己买到了什么,因此

这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某款盲盒内装有正版海贼王手办,且每个盲盒只装一个.某销售

网点为调查该款盲盒的受欢迎程度,随机抽取了40()人进行问卷调查,并全部收回.经统计,有30%的人购买了

该款盲盒,在这些购买者当中,男生占;;而在未购买者当中,男生、女生各占50%.

(1)完成下面的2x2列联表,并判断是否有99.5%的把握认为是否购买该款盲盒与性别有关?

女生男生总计

购买

未购买

总计

(2)从购买该款盲盒的人中按性别用分层抽样的方法随机抽取6人,再从这6人中随机抽取3人发放优惠券,求

抽到的3人中恰有1位男生的概率.

4、七八1"2n(ad-bc)2_.,,

参考公式:K=--------------,其中〃=〃+/)+<?+1.

(a+b)(c+d)(a+c\b+d)

参考数据:

〃(K』o)0.100.050.0250.0100.0050.001

%2.7063.8415.0246.6357.87910.828

【答案】。)列联表见解析,有99.5%的把握认为是否购买该款盲盒与性别有关

【分析】(1)结合题意可完成2x2列联表,结合公式即可计算片处9.428,即可判断是否有99.5%的把握认为

是否购买该款盲盒与性别有关

(2)列举基本事件个数,结合古典概型的概率计算公式即可求解.

【详解】(1)由题可得:购买了该款盲盒的人数为400x30%=120人,其中购买了该款盲盒的男生人数为

120x;=40人,则购买了该款盲盒的女生为80人,

所以未购买者总人数为280人,男生、女生各占50%为140人,则2x2列联表为:

女生男生总计

购买8040120

未购买140140280

总计220180400

根据列联表中的数据,可得尸=400x(80x140-40x140)2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论