高考数学 成对数据的统计分析(精练:基础+重难点)解析版_第1页
高考数学 成对数据的统计分析(精练:基础+重难点)解析版_第2页
高考数学 成对数据的统计分析(精练:基础+重难点)解析版_第3页
高考数学 成对数据的统计分析(精练:基础+重难点)解析版_第4页
高考数学 成对数据的统计分析(精练:基础+重难点)解析版_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【一轮复习讲义】2024年高考数学高频考点题型归纳与方法总结(新高考通用)

第49练成对数据的统计分析(精练)

刷真题明导向

一、单选题

1.(2023•天津•统芍高考真题)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=O.X243,

下列说法正确的是()

A.花瓣长度和花萼长度没有相关性

B.花瓣长度和花萼长度呈现负相关

C.花瓣长度和花萼长度呈现正相关

D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245

【答案】C

【分析】根据散点图的特点可分析出相关性的问题,从而判断ABC选项,根据相关系数的定义可以判断D

选项.

【详解】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误

散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,C选项正确;

由于〃=0.8245是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的

相关系数不一定是0.8245,D选项错误

故选:C

二、解答题

2.(2023•全国•统考高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其

中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白

鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:

对照组的小白鼠体重的增加量从小到大排序为

15.218.820.221.322.523.225.826.527.530.1

32.634.334.835.635.635.836.237.340.543.2

试验组的小白鼠体重的增加量从小到大排序为

7.89.211.412.413.215.516.518.018.819.2

19.820.221.622.823.623.925.128.232.336.5

⑴计算试验组的样本平均数;

(2)(i)求40只小白鼠体重的增加量的中位数再分别统计两样本中小于身与不小于,〃的数据的个数,

完成如下列联表

(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增

加量有差异?

n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)1

P(K2>k)0.1000.0500.010

k2.7063.8416.635

【答案】(1)19.8

(2)(i)加=23.4;列联表见解析,(ii)能

【分析】(1)直接根据均值定义求解;

(2)(i)根据中位数的定义即可求得机=23.4,从而求得列联表;

(ii)利用独立性检验的卡方计算进行检验,即可得解.

【详解】(1)试验组样本平均数为:

卷(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2

396

+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=荒=19.8

(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21

位数据的平均数,

由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,…,

故第20位为23.2,第21位数据为23.6,

23.2十23.6

所以〃?==23.4

2

故列联表为:

<m>m合计

对照组61420

试验组14620

合计202040

40x(6x6-14xl4)2

(ii)由(i)可得,K2=6.400>3.841,

20x20x2()x20

所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.

3.(2022・全国•统考高考真题)甲、乙两城之间的长途客车均由A和8两家公司运营,为了解这两家公司长

途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:

准点班次数未准点班次数

A24020

B21030

(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;

(2)能否有90%的把握认为甲,乙两城之间的长途客车是否准点与客车所属公司有关?

n(ad-bc)2

附:K2=

(a+b)(c+d)[a+c)(/?+d)

2

P(K..k)0.1000.0500.010

k2.7063.8416.635

I?7

【答案】(1)A,B两家公司长途客车准点的概率分别为总,(

13o

⑵有

【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;

(2)根据表格中数据及公式计算K?,再利用临界值表比较即可得结论.

【详解】(1)根据表中数据,A共有班次260次,准点班次有240次,

设A家公司长途客车准点事件为M,

则叫嗡

B共有班次240次,准点班次有210次,

设B家公司长途客车准点事件为N,

2107

则P(N)=通

8

1?

A家公司长途客车准点的概率为正;

7

B家公司长途客车准点的概率为

O

(2)列联表

准点班次数未准点班次数合计

A24020260

B21030240

合计45050500

n(ad-be)'_590x(240x30-210x20)?

«3.205>2.706,

(a+b)(c+d)(a+c)(b+d)260x240x450x50

根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.

4.(2022.全国•统考高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种

树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:

nd),得到如下数据:

样本号i12345678910总和

根部横截面积0.040.060.040.080.080.050.050.070.070.060.6

材积量X0.250.400.220.540.510.340.360.460.420.403.9

101010

并计算得ZH=0038,=1.6158,、>方=02474.

i=li=li=l

(1)估计该林区这种树木平均一棵E勺根部横截面积与平均一棵的材积量;

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);

(3)现测最了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已

知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.

附:相关系数—7卢----------------■,Vi标。1.377.

Vi=ii=i

【答案】(1)0.060?;0.39m3

(2)0.97

⑶1209m3

【分析】(D计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平

均一棵的根部横截面积与平均一棵的材积量;

<2)代入题给相关系数公式去计算即可求得样本的相关系数值;

(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计

值.

【详解】(1)样本中10棵这种树木的根部横截面积的平均值工=需=0.06

样本中10棵这种树木的材积量的平均值9=千39=039

据此可估计该林区这种树木平均一棵的根部横截面积为0.06m2,

平均一棵的材积量为0.39m'

1010

2(西-工)5-刃入乂一1际

Or=~I1'=|==,=

"曲4掂一回停2一回

0.2474-10x0.06x0390.01340.0134八八)

=,--------------=.=«--------------------X0.97[nilr~O97

7(0.038-10x0.062)(1.6158-10>:0.392)x/o.00018960.01377,人J〜.

(3)设该林区这种树木的总材积量的估计值为Yn?,

又已知树木的材积量与其根部横截面积近似成正比,

可得图=等,解之得y=1209n?.则该林区这种树木的总材积量估计为1209m3

5.(2021・全国•统考高考真题)甲、乙两台机床生产同种产品,产品按质量分为一-级品和二级品,为了比较

两台机床产品的质量,分别用两台机床各生产了20()件产品,产品的质量情况统计如下表:

一级品二级品合计

甲机床15050200

乙机床12080200

合计270130400

(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?

(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?

n(ad-be)2

(a+b)(c+d)(a+c)(b+d)

P[K2>k)0.0500.0100.001

k3.8416.63510.828

【答案】(1)75%;60%;

(2)能.

(3)【分析】根据给出公式计算即可

【详解】(1)甲机床生产的产品中的一级品的频率为蹙=75%,

乙机床生产的产品中的一级品的频率为芸120=60%.

2

⑵^=400(150X80-120X50)=400>I0>6^

270x130x200x20039

故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.

【A组在基础中考查功底】

一、单选题

1.已知X与),之间的一组数据:

X0123

y।357

则y与x的线性回归方程$,=以+4必过点()

A.(0.5,3)B.(1.5,0)C.(1,2)D.(1.5,4)

【答案】D

【分析】根据线性回归方程过样本中心点进行求解即可.

【详解】由题中数据可得:-=Otl+2+3=15-=l+34-5±7=4>

44

所以该线性回归方程必过点(154),

故选:D

2.中国茶文化博大精深、茶水的口感与茶叶的类型和水的温度有关,某数学建模小组建立了茶水冷却时间

%和茶水温度),的一组数据(内,》),经过分析,提出了四种回归模型,①②③©四种模型的残差平方和

寸凹->)的值分别是1.23、0.80、0.12、1.36.则拟合效果最好的模型是()

f=1'7

A.模型①B.模型②C.模型③D.模型④

【答案】C

【分析】根据残差平方和与拟合效果的关系判定即可.

【详解】残差平方和越小则拟合效果越好,而模型③的值最小,所以C正确.

故选:C

3.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:

文化程度与月收入列联表(单位:人)

收入

月收入2000元以下月收入2000元及以上合计

文化程度

高中文化以上104555

高中文化及以下203050

合计3075105

由上表中数据计算得V=l°5(l°x3。-45x20)一。6/09.如果认为文化程度与月收入有关系,那么犯错误的

55x50x30x75

概率不会超过()

附表:

a0.1()0.050.0100.0050.001

xa2.7063.8416.6357.87910.828

A.0.01B.0.025C.0.03D.0.05

【答案】D

【分析】根据卡方的计算,由表中数据即可得到求解.

【详解】因为/。6.109>3.841=%。5,所以认为文化程度与月收入有关系,那么犯错误的概率不会超过

0.05.

故选:D.

4.下列说法错误的是()

A.决定系数N越大,模型的拟合效果越好

B.若变量X和),之间的样本相关系数为r=-0.982,则变量T和y之间的负相关程度很强

C.残差平方和越小的模型,拟合的效果越好

D.在经验回归方程),=-3工+0.8中,当解释变量x每增加1个单位时,响应变量S平均增加3个单位

【答案】D

【分析】根据已知条件,结合相关系数、决定系数的定义,以及线性回归方程的性质,即可求解.

【详解】用决定系数齐来刻画回归效果,心越大,表示残差平方和越小,即模型的拟合效果越好,故A

正确;

若变量X和y之间的样本相关系数为r=7).982,i•接近则变量x和y之间的负相关很强,故B正确;

比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好,故C正

确;

在经验回归方程y=-3x+0.8中,当解释变量X每增加1个单位时,响应变量y平均减小3个单位,故D

错误.

故选:D.

5.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:

优秀非优秀总计

甲班10b

乙班C30

总计105

已知在全部105人中随机抽取1人,成绩优秀的概率为我则下列说法正确的是()

A.列联表中c的值为30,♦的值为35

B.列联表中。的值为15,一的值为50

C.列联表中c的值为20,〃的值为50

D.由列联表可看出成绩与班级有关系

【答案】D

【分析】根据成绩优秀的概率求得。,进而求得力,结合比例判断出正确答案.

【详解】依题意喘解得c=20,由10+20+6+30=105解得〃=45.

补全2x2列联表如下:

优秀非优秀总计

甲班1()4555

乙班203050

总计3075105

甲班的优秀率为三1()=?5,乙班的优秀率为2选0二2三,

22

所以成绩与班级有关•所以D选项正确,ABC选项错误.

11J

故选:D

6.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析•.方案一:根据图中所有数据,得

到回归直线方程丁=/小十%,相关系数为,i;方案二:剔除点(10,32),根据剩下的数据得到回归直线方程

A.Ovqv”lB.

C.一IvqvqvOD.-1<与<q<0

【答案】D

【分析】根据相关系数的意义:其绝对值越接近1,说明两个变量越具有线性相关,以及负相关的意义作判

断即可.

【详解】由散点图可知这两个变量为负相关,所以4<。,5<0.

因为剔除点(10,32)后,剩下点的数据更具有线性相关性,|用更接近1,

所以—1<与<4<。.

故选:D.

7.为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2x2列联表进行独

立性检验,经计算*ng.OI,则所得到的统计学结论是认为“性别与喜欢乡村音乐有关系”的把握约为()

附:

2/2心)0.100.050.0100.005

2.7063.8416.6357.879

A.0.1%B.0.5%

C.99.5%D.99.9%

【答案】C

【分析】根据题意结合临界值表判断即可

【详解】因为/=8.01>7.879=%3

所以认为性别与喜欢乡村音乐有关系的把握有99.5%.

故选:C

8.如图给出了某种母类生长枝数y(枝)与时间/(月)的散点图,那么此种立类生长枝数与时间的关系用

下列函数模型近似刻画最好的是()

A.y=2rB.y=log,tC.y=tD.y=2'

【答案】D

【分析】根据散点图确定正确答案.

【详解】从所给的散点图可以看出图象大约过。,2)和(2,4),

把这两个点代入所给的四个解析式发现只有),=7最合适,

另外,根据图象可知,图象呈指数增长的形式,也可在y=h最合适.

故选:D.

9.已知一组成对数据(七,y)a=12・-6)中),关于X的一元非线性回归方程),=加2+],已知£%2=]2,

/=!

工再=4,工另=18,贝IJ/?=()

J=lJ=1

A.3B.1C.-1D.-3

【答案】B

【分析】求出x:、X的均值,根据样本中心在回归直线上求参数匕即可.

66

11

zz

--

66=3,贝1]3=bx2+l,可得b=l.

f=lr=1

故选B

10.如图,5个(・%),)数据,去掉D(3,10)后,下列说法正确的是()

rf・E(10.12)

•0(3,10)

•C(4,5)

•8(2,4)

7(1,3)

O

A.样本相关系数,•变小

B.残差平方和变大

C.决定系数片变大

D.解释变量x与响应变量),的相关性变弱

【答案】C

【分析】根据题意,结合散点图与相关系数,残差平方和以及决定系数的定义,即可得到结果.

【详解】由散点图可知,去掉点。后,x与y的相关性变强,且为正相关,所以,•变大,配变大,残差平

方和变小.

故选:c

H.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检•批产品测得数据列于表中.已知该产品的色

度和色差x之间满足线性相关关系,且y=0,8x+a,现有一对测量数据为(30,,〃),若该数据的残差为0.6,

则阳=()

色差X21232527

色度),15181920

A.23.4B.23.6C.23.8D.24.0

【答案】A

【分析】先由x、y的平均值和(24,18)代入方程,求得。=一1.2,从而得到),=0.8x-L2,再将”=30代入并

加上残差0.6即可得出答案.

[=21+23+25+27=2415+18+19+20IO

【详解】由题意可知,y=-------------=18,

44

将(24,18)代入),=()&-+〃,即18=0.8x24+〃,解得a=-1.2,

所以y=0.81.2,

当x=3()时,),=0.8x30-1.2=22.8,

贝(1m=22.8+0.6=23.4.

故选:A.

12.某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,据统计得出了昼

夜温差x(°c)与实验室种子浸泡后的发芽数y(颗)之间的线性回归方程:),=2.在+3且对应数据如表:

温差M,c)12345

发芽数y/颗3781012

如果昼夜温差为10C时,那么种子的发芽数大约是()

A.21颗B.23颗C.25颗D.27颗

【答案】B

【分析】根据给定的数据,求出样本的中心点,进而求出。值,再代入计算作答.

■■―1+2+3+4+5“_3+7+8+10+12

[详解]X=-------------=3,y=---------------=8,

则样本点的中心的坐标为(3,8),代入),=2.Lr+。,得,=8-2.lx3=1.7.

可得》=2.比+1.7,取工=1(),得,=2.1x10+1.7=22.7,

・•.如果昼夜温差为10C时,那么种子的发芽数大约是23颗,

故选:B.

13.某中学课外活动小组为了研究经济走势,根据该市1999-2021年的GDP(国内生产总值)数据绘制出

下面的散点图:

500

450

u

400

d350

a300

250

D

200

150

100

50

234567891011121314151617181920212223

年份代码x(代码1-23分别对应年份1999-2021)

该小组选择了如下2个模型来拟合GDP值),随年份x的变化情况,模型一:),=依•+伙攵>0,x>0);模型二:

y=ke+b(k>0,x>0),下列说法正确的是()

A.变量y与x负相关

B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况

C.若选择模型二,),=杷'+。的图象一定经过点(月刃

D.当x=13时,通过模型计算得GDP值为70,实际GDP的值为71,则残差为1

【答案】D

【分析】对丁AB,由散点图的变化趋势分析判断,对于C,由线性回归方程的性判断,对丁D,结合残差

的定义判断.

【详解】对于A,由散点图可知y随年份x的增大而增大,所以变量y与x正相关,所以A错误,

对于B,由散点图可知变量y与x的变化趋向于一条曲线,所以模型二能更好地拟合GDP值随年份的变化

情况,所以B错误,

对于C,若选择模型二:y=ke^b(k>^x>O)f令/=/,则了=卜+。的图象经过点「亍),所以C错误,

对于。,当X=13时,通过模型计算得GDP值为7U,实际GDP的值为71,则残差为71-70=1,所以D

正确,

故选:D

14.新型冠状病毒引起的肺炎疫情暴发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的

成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示:

周数(X)12345

治愈人数(V)21736103142

由表格可得y关于大的非线性回归方程为5,=6/+4,则此回归模型第5周的残差为()

A.0B.2C.3D.—2

【答案】D

【分析】利用样本中心点求出〃,得到回归方程,可计算第5周的预测值和回归模型第5周的残差.

11

【详解】因为丁=一(1+4+9+16+25)=11,y=-(2+17+36+103+142)=60,所以a=60-6xl1=-6,

55

所以R6f-6,取x=5,得§,=6x52-6=144,所以第5周的预测值为144,

则此回归方程第5周的残差为142-144=-2.

故选:D

15.某学习小组用计算机软件对一组数据(七,£)(i=l,Z3,…,8)进行回归分析,甲同学首先求出经验回归方

程y=2x+5,样本点的中心为(2/〃).乙同学对甲的计算过程进行检查,发现甲将数据(3,7)误输成(7,3),

1Q

数据(4,6)误输成(4,-6),将这两个数据修正后得到经验回归方程),=三%+%则实数人()

3419

A・—6B-------C•一D•一

332

【答案】D

【分析】根据样本点的中心为(2,加),求得m=9,然后利用样本点的中心,由甲求得E+…+4=5,

为+…+然=9x8=75,再由乙求得样本点的中心,代人回归直线方程求解.

【详解】解:由题可知机=2x2+5=9,假设甲输入的(阳,%)为(7,3),(4,%)为(4,-6),

所以7+4+%,+…+K=2X8=16,3-6+%+…+M=9x8=72,

所以刍+…+/=5,%+…+”=9x8=75,

所以改为正确数据时得3+4+当+…+/=12,7+6+%+…+%=9x8=88,

所以样本点的中心为你11}

139

将其代入回归直线方程),=导+"得A=,

故选:D

16.已知由样本数据点集合{a,)j)|i=L2,L・〃},求得的回归直线方程4为»l.5x+0.5,且工=3.现发

现两个数据点(132.1)和(4.7,7.9)误差较大,去除这两点后重新求得的回归直线方程右的斜率为1.2,则正

确的是()

A.变量%与y具有负相关关系

B.去除后y的估计值增加速发变快

C.去除后回归方程为RI.2X+I.6

D.去除后相应于样本点(2,3.75)的残差为-0.05

【答案】D

【分析】运用回归直线方程的性质、残差的基本概念等进行解题.

【详解】解:选项A:因为去除前回归直线4的斜率为1.5,重新求得的回归直线I的斜率为1.2,两者均大

于0,所以变量x与)'具有正相关关系,所以选项A错误;

选项B:去除前回归直线4的斜率为1.5,去除后回归直线4的斜率为1.2,去除前的斜率大于去除后的斜率,

所以去除后y的估计值增加速度变慢,所以选项B错误;

选项C:去除前亍=3,则可得了=5,设内=1.3,工=4.7,y=2.1…=7.9,则去除后样本中心设为(7,区),

_$+再+占+…+1”-1・3-4.7_3〃-6

所以后=玉丁二:々=3,

〃一2n-2n-2

%+…+y”=M+%+)3+…+”-2.1-7.9=5〃-10=5

n-2n-2n-2

又因为回归直线方程,2的斜率为L2,所以去除后的回归直线方程为£=1.2x+1.4,

所以选项c错误;

选项D:由C选项可知,去除后的回归直线方程为a=L2x+1.4,当x=2时,5,=3.8,则残差为

3.75-3.8=-0.05,所以选项D正确;

故选:D.

二、多选题

17.下面的各图中,散点图与相关系数一符合的是()

【答案】ACI)

【分析】根据相关系数的定义,结合选项中的散点图,逐项判定,即可求解.

【详解】因为相关系数r的绝对值越接近L线性相关程度越强,且,,0时正相关,一<0时负相关,

A中,变量X),的散点图是一条斜率小于0的直线上,所以相关系数尸=-1,所以A正确:

B中,变量工,),的散点图是一条斜率大于0的直线上,所以相关系数r=1,所以B不正确;

C中,变量其丁的散点图从左到右是向下的带状分布,所以相关系数所以C正确;

D中,变量x,y的散点图中,x,y之间的样本相关关系非常不明显,所以相关系数「接近于0,所以D正确.

故选:ACD.

18.某制药公司为了研究某种治疗高血压的药物在饭前和饭后服用的药效差异,随机抽取了200名高血压

患者开展试验,其中100名患者饭前服药,另外100名患者饭后服药,随后观察药效,将试验数据绘制成

如图所示的等高条形图,已知/—〃纥,)-且P(/>6.635)=001,则下列说法正确的

(a+b)(c+d)(a+c)(b+d)'7

是()

人数

100[—

Sol­

do

匚]药效弱

40口药效强

20

0

饭前饭后

4

A.饭前服药的患者中,药效强的频率为不

B.药效弱的患者中,饭后服药的频率为需

C.在犯错误的概率不超过0.01的条件下,可以认为这种药物饭前和饭后服用的药效有差异

D.在犯错误的概率不超过0.01的条件下,不能认为这种药物饭前和饭后服用的药效有差异

【答案】AC

【分析】根据等高条形图即可得饭前饭后药效强和弱的人数,即可判断AB,计算卡方与临界值比较即可判

断CD.

4

【详解】对于A,饭前服药的100名患者中,药效强的有80人,所以频率为故A正确;

对于B,饭前服药的有2。人药效弱,饭后服药的有70人药效弱,所以药效弱的有90名患者,饭后服药的

频率为",故B错误;

200x(80x70-20x30尸

对于C,D,因为/=50.505>6.635,

100x100x110x90=99

故在犯错误的概率不超过0・01的条件下,可以认为这种药物饭前和饭后服用的药效有差异,故C正确,D

错误.

故选:AC

19.以下四个命题,其中不正确的是()

A.在对吸烟与患肺病这两个分类变量的独立性检验中,(参考数据:P(/>6.635)=0.01)若/的观测

值满足/26.635,那么在100个吸烟的人中约有99人患有肺病

B.两个随机变量的线性相关性越强,相关系数就越接近于1

C.对于独立性检验,/的观测值越大,判定“两变最有关系''的把握越大

D.回归方程5,=/;X+4对应的直线至少经过其样本数据点中的一个点

【答案】ABD

【分析】根据独立性检验以及回归直线相关知识逐项分析判断.

【详解】对于选项A、B:/的观测值越大,判定“两变量有关系,,的可能性越大,故C正确

若/的观测值满足/26.635,则有99%的可能性认为两者有关,故A不正确;

对于选项B:两个随机变量的线性相关性越强,相关系数的绝对值就越接近于1,故B不正确;

对于选项D:因为数据点均匀分布在回归方程$,=去+。的两侧,不一定在回归方程》=九+G上,故D不正

确;

故选:ABD.

20.“一粥一饭,当思来之不易”,道理虽简单,但每年我国还是有2000多亿元的餐桌浪费,被倒掉的食物

相当于2亿多人一年的口粮.为营造“节约光荣,浪费可耻”的氛围,某市发起了“光盘行动”•某机构为调研

民众对“光盘行动”的认可情况,在某大型餐厅中随机调杳了90位来店就餐的客人,制成如下表所示的列联

2

表,通过计算得到/的观测值为9.已知P(/26.635)=0.010,P(Z>10.828)=0.001,则下列判断正确的

是()

2Mad-be)

/­=n=a+b+c+d.

(a+b)(c+d)(a+c)(Z?+d)'

认可不认可

40岁以下2020

40岁以上(含40岁)401()

A.在该餐厅用餐的客人中大约有66.7%的客人认可“光盘行动”

B.在该餐厅用餐的客人中大约有99%的客人认可“光盘行动”

C.有99%的把握认为“光盘行动”的认可情况与年龄有关

D.在犯错误的概率不超过0.001的前提下,认为“光盘行动”的认可情况与年龄有关

【答案】AC

【分析】根据列联表求出客人认可“光盘行动”的频率,可判断AB;再根据/的观测值的范围并结合临界

值,可判断CD.

【详解】由列联表得到在该餐厅用餐的客人中,客人认可“光盘行动”的频率约为果=66.7%,

由频率估计概率得,在该餐厅用餐的客人中大约有66.7%的客人认可“光盘行动”,故A正确,B错误;

因为/的观测值为9,且6.635<9<10.828,

故有99%的把握认为“光盘行动”的认可情况与年龄有关,

或者说在犯错误的概率不超过0.01的前提下,认为“光盘行动”的认可情况与年龄有关,故C正确,D错误.

故选:AC.

21.如图是从2013年到2018年六年间我国公共图书馆业机构数与对应年份编号的散点图(为便于计算,

将2013年编号为1,2014年编号为2,…,2018年编号为6,把每年的公共图书馆业机构数作为预报变量,

把年份编号作为解释变量进行回归分析),得到回归直线方程为y=13.743X+3095.7,其相关系数r=0.9817,

下列结论正确的是()

3

39()

38R0

3

360

350

340

330

320

310

00

A.公共图书馆业机构数与年份编号的正相关性较强

B.在2014—2()18年间,2016年公共图书馆业机构数增加量最多

C.公共图书馆业机构数平均每年约增加14

D.可预测2022年公共图书馆业机构数为3232

【答案】AC

【分析】根据散点图和回归方程逐个分析判断即可.

【详解】因为散点图中各点散布在从左下角到右上角的区域内,所以为正相关,因为「=0.9817接近于1,

所以公共图书馆业机构数与年份编号的相关性较强,故A正确;

由图可知,在2014—2018年间,2015年公共图书馆业机构数增加量最多,故B错误;

因为回归直线的斜率为13.743,所以公共图书馆业机构数平均每年约增加14,故C正确;

将工=10代入回归直线方程丫=13,743X+3095.7,解得y=3233.13«3234,所以可预测2022年公共图书馆

业机构数为3234,故D错误.

故选:AC

22.若冬季昼夜温差x(单位:。C)与某新品种反季节大豆的发芽数量y(单位:颗)具有线性相关关系,

根据一组样本数据(4凹)(,=1,23..,〃),用最小二乘法近似得到线性回归方程为尸38.3,则下列结论

中正确的是()

A.),与x具有正相关关系

B.相应于点(15,48)的残差为-6

C.若冬季昼夜温差的大小为10°C,则该新品种反季节大豆的发芽数一定是35颗

D.若冬季昼夜温差增加1℃,则该新品种反季节大豆的发芽数约增加3.8颗

【答案】ABD

【分析】根据线性回归方程的相关计算,结合题意,进行逐一分析即可.

【详解】对A,因为回归直线的斜率为3.8,所以丁与工具有正相关关系,A正确;

对B,当x=15时,y-3.8x15-3-54,则残差为4854=6,B正确;

对C,回归直线方程只可预测,不是确定的值,故C错误.

对D,冬季昼夜温差增加「C,则发芽数量的增加量即为回归直线方程的斜率,

则该新品种反季节大豆的发芽数约增加3.8颗,D正确;

故选:ABD.

23.在一次/独立性检验中得到如下2x2列联表:

A4总计

42008001000

B2180m180+/n

总计380800+118()+〃?

2

已知/~〃(fP(z>2.706)=0.100,根据上面的2x2列联表,若依据小概率值

(a+b)(c+d)(a+c)(b+d)

a=0.1(X)的z2独立性检验,可以认为这两个分类变量A和8没有关系,则卜.列选项中m可能取到的为()

A.200B.720C.100D.800

【答案】BD

【分析】根据每个选项中m的值,计算/的值,根据独立性检验的基本思想,即可判断答案.

……黑霖瑞鬻T

(1180+200)(200x200-800x180)2

对于A,当〃7=200时,Z2«130.37>2.706

380x1000x1000x(180+200)

(1180+200)(200x720-800x1801

对于B,当机=720时,Z2=0<2.706,

380x1520x1(X)0x(180+720)

(1180+100)(200X100-800X180)2

对于C,当,〃=100时,2«205.53>2.706,

z=380x1900x1000x(180+100)

对于D,当W时,六嗤部弁前

«0.85<2.706,

故只有B,D符合题意,可以认为这两个分类变量A和B没有关系,

故选:BD

24.某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为小),=0.68X+金,计算

其相关系数为4.经过分析确定点尸为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的

方程为,2:y=%+0.68,相关系数为以下结论中,正确的是()

厂(6,5)

4(5,2.8)

C(3,2J)•戌4,2.5)

.・8(2,1.5)

41J1)厂

~O\x

A.4>0,弓>。B.r]>r2

C.a=0.12D.0<^<0.68

【答案】ACD

【分析】去掉“离群点呼后,两变量的线性相关性更强,由此可判断A,B的正误;回归直线小5,=0.681+。

必经过样本中心点(3.5,2.5),可求判断C的正误;回归直线/”5,=八+0.68必经过样本中心点(3,2),

可求6,判断D的正误.

【详解】由题图可知两变量呈现正相关,故4>。,4>0,故A正确;

去掉“离群点叩后,两变量的线性相关性更强,故(<弓,故B错误;

设去掉“离群点叩前的样本中心点为(工,[),

由散点图可得:,=4(1+2+3+4+5+6)=3.5,^=-(1.1+1.54-2.1+2.5+2.8+5)=2.5,

66

可知回归直线4:£=0.68x+a必经过样本中心点(3.5,2.5),

所以。=2.5-0.68x3.5=0.12,故C正确;

设去掉“离群点叩后的样本中心点为(兀,以),

由散点图可得:w=g(l+2+3+4+5)=3,y2=-(1.14-1.5+2.14-2.5+2.8)=2,

回归直线4:y=Ar+0.68必经过样本中心点(3,2),

所以2=5x3+0.68,得/;=0.44,即0<屋0.68,故D正确,

故选:ACD.

三、填空题

25.下列命题:

①线性回归直线必过样本数据的中心点(H);

②如果两个变量的相关性越强,则相关性系数「就越接近于1;

③当相关性系数,,0时,两个变量正相关;

④残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;

⑤甲、乙两个模型的R?分别约为0.88和0.80,则模型乙的拟合效果更好.

其中正确的命题有.(填序号)

【答案】①③

【分析】根据回归直线方程的性质与相关系数的概念及相关指数的概念判断即可;

【详解】解:①线性回归直线必过样本数据的中心点(工亍),正确;

②如果两个变量的相关性越强,则相关性系数〃就越接近于1,不正确,

应为相关性系数〃的绝对值就越接近于1;

③当相关性系数,:0时,两个变量正相关,正确;

④残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高,不正确;

⑤甲、乙两个模型的川分别约为0.88和0.80,则模型乙的拟合效果更好,不正确,

应为模型甲的拟合效果更好.

故答案为:①③

26.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶震生产产量(单位:万盒)的数据如表所

示:若大,)'线性相关,线性回归方程为R0.7X+4,则当x=6时,的预测值为万盒.

X(月份)12345

)'(万盒)56568

【答案】8.1

【分析】根据样本中心点求得3,进而求得预测值.

1+2+3+4+5—5+6+5+6+8

【详解】=3,y=-----------------=6,

x=—

所以6=0.7x3+a,1=3.9,所以亍=0.7%+3.9,

当工=6时,$=0.7x6+3.9=4.2+3.9=8.1万盒.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论