人教版高中数学精讲精练选择性必修三82 一元线性回归模型及应用(解析版)_第1页
人教版高中数学精讲精练选择性必修三82 一元线性回归模型及应用(解析版)_第2页
人教版高中数学精讲精练选择性必修三82 一元线性回归模型及应用(解析版)_第3页
人教版高中数学精讲精练选择性必修三82 一元线性回归模型及应用(解析版)_第4页
人教版高中数学精讲精练选择性必修三82 一元线性回归模型及应用(解析版)_第5页
已阅读5页,还剩29页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2一元线性回归模型及应用

知识呈现

一元线性回归模型及其应用

——元线性回归模型

-模型—F=bx+"e,

(E(e)=O,D(e)=a2

Y称为因变量或响应变量,x称为自变量或解释变量

a称为截距参数

李用「b称为斜率参数

J西葭—e是Y与bx+a之间的随机误差

‘Ie=0,那么Y与x之间的关系就可以用一元线性函数模型来描述

最小二乘法

一定义—尚=独+。称为F关于”的经验回归方程,膏经验回归函数或经验回归公式

L苫"Xn-y)第5一"*亍

b--I

—4么式TC-----石N“下郎N一〃小

AA

L=y.

残差

定对于晌应变量匕通过观测得到的数据称为观测值,通过经验回归

方程得到的》♦称为预测值,观测值减去预测值称为残差.

残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画

」-数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工

作称为残差分析

残差图法

在残差囱中,如果残差比较均匀地集中在以横轴为对称轴的水平带

状区域内,则说明经验回归方程较好地刻画了两个变量的关系

模残差平方和法:残差平方和之(y「万越小,模型的拟合效果越好

画用法

可以用用来比较两个模型的拟合效果,出越大,模型拟合效果越好,

S(yi-y)2

用越小,模型拟合效果越差.R2=I--^........—

E(yi-y)2

1-1

例题剖析

一元线性回归模型及应用

考法——元线性回归模型-------------考法四经验回归模型的选择

考法二残差的计算-------------考法五非线性回归方程

考法三回归效果的刻画方式------

考法——元线性回归模型

【例(2024•四川绵阳)已知变量-),之间的线性回归方程为5=2”I,且变量­,之间的一组相关

数据如表所示,

X2468

y58.213m

则下列说法正确的是()

A.“2=17

B.变量y与x是负相关关系

C.该回归直线必过点(5,11)

D.x增加1个单位,y一定增加2个单位

【答案】C

_--山叼+—2+4+6+8—5+8.2+13+〃,26.2+机

【解/析】依题意,X=-----;----=5,),=-------;------=——;—,

444

由262+/〃=2X5+1,解得〃?=17.8,A错误;

4

回归方程9=2x+l中,2>0,则变量y与文是正相关关系,B错误;

由于样本中心点为(5,11),因此该回归直线必过点(5,11),C正确;

由回归方程知,x增加1个单位,>大约增加2个单位,D错误.

故选:C

【例1-2](2024湖南长沙)党的十八大以来,全国各地区各部门持续加大就业优先政策实施刀度,促进居

民收入增长的各项措施持续发力,居民分享到更多经济社会发展红利,居民收入保持较快增长,收入结构

不断优化,随着居民总收入较快增长,全体居民人均可支配收入也在不断提升.下表为某市2014~2022年

全体居民人均可支配收入,将其绘制成散点图(如图1),发现全体居民人均可支配收入与年份具有线性相

关美系.

年份201420152016201720182019202020212022

全体居民人均可支配收入(元)183522011022034241532638628920308243380335666

全年居民可人均支配收入

40000

35000

30000

25000

20000

15000

10(100

5000

0

20132014201520162017201820192020202120222023

图1

参考数据:»'i=24.03,Zx/=133.39.

参考公式:对于一组数据(4,匕),他$),…,(〃”,匕),其回归直线方程6=氏+存的斜率和截距的最小二乘估

计分别为力=『-----------,&=节一百i.

Z(2)2

f=l

⑴设年份编号为X(2014年的编号为1,2015年的编号为2,依此类推),记全体居民人均可支配收入为y(单

位:万元),求经验回归方程卞=加+6(结果精确到0.01);

⑵为进一步对居民人均可支配收入的结构进行分析,某分析员从2014~2022中任取2年的数据进行分析,

将选出的人均可支配收入超过3万的年数记为X,求随机变量X的分布列与数学期望.

【答案】⑴>0必+1.57

2

⑵分布列见解析,E(X)=-

【解析】(1)由题意得了二^>(1+2+…+9)=5,J=-E-V>=ox2403=2-67*

yy了=1y

=16+9+4+14-0+1+4+9+16=60.^(x/.-x)(x-y)=^x/y/.-9x-y=133.39-24.03x5=13.24,,

f«lf=l/=!

“2(—)5一田於24-1324

故6=~^-------------------=—«0.22,所以2二9一6・5=2.67-^^x5a|.57.

十/_\26060

1=1

故回归方程为>0.22X+1.57;

(2)由图表知,人均可支配收入超过3万的年份有3年,

故X的可能取值为QL2,

2

则P(X=0)=言C=1京5*5,P(X=1)

C;24p—2)噌总后

故随机变量X的分布列为:

12

12-3,

【例1-3](2023河南南阳)在线性回归方程¥=〃+及中,方为回归系数,下列关于6的说法中不正确的是

()

A.8为回归直线的斜率

B.b>ot表示随X增加,y值增加,b<0,表示随X增加,y值减少

c.〃是唯一确定的值

D.回归系数〃的统计意义是当X每增加(或减少)一个单位,y平均改变〃个单位

【答案】c

【解析】对于A,线性回归方程),=〃+法中的6为回归直线的斜率,A正确;

对于B,〃>o,表示随汇增加,下值增加,。<0,表示随1增加,y值减少,B正确;

对于c,b是由总体的一个样本利用一定的方法计算得到的,选择不同的样本

或不同的计算方法得到的人一股是不同的,C错误;

对于D,回归系数力的统计意义是当X每增加(或减少)一个单位,y平均改变〃个单位,D正确.

故选:c

【一隅三反】

1.(2023青海海南)某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:年)与当

年所需要支出的维修费用.V(单位:万元)有如下统计资料:

X23456

y2.23.85.56.57

根据表中的数据可得到线性回归方程为5,=L23x+d则该型机床已投入生产的时间为10年时,当年所需要

支出的维修费用估计为()

A.12.9万元B.12.36万元

C.13.1万元D.12.38万元

【答案】D

■力〃-2+3+4+5+6-2.2+3.8+5.5+6.5+7.0_

[解析]:x=-------------=4,y=---------------------=5,

••・中心点(4,5)代入回归方程得5=1.23x4+4,解得。=0.08,.J,=L23x+0.08,

故当x=10时,5=12.38,即当年所需要支出的维修费用估计为12.38万元,故选:D

2.(2024•甘肃陇南)(多选)某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:

年)与当年所需要支出的维修费用〉,(单位:万元)有如下统计资料:

X23456

y2.23.85.56.57

根据表中的数据可得到经验回归方程为.y=L23x+2则()

A.a=0.08

B.y与工的样本相关系数厂>。

C.表中维修费用的第60百分位数为6

D.该型机床已投入生产的时诃为10年时,当年所需要支出的维修费用一定是12.38万元

【答案】ABC

【解析】根据题意可得,x=4.还2.2+3.8+:5+6.5+7=5,

所以样本中心点为(4,5),

对干A,将样本中心点(4,5)代入回归方程y=L23x+》,可得4=0.08,故A正确;

对于B,由表中数据可得》随着x增大而增大,x与N正相关,所以相关系数r>0,故B正确;

对于C,维修费用从小到大依次为223.8,556.5,7,第60百分位数为驾竺二6,故C正确;

对于D,根据回归分析的概念,机床投入生产的时间为10年时,所需要支出的维修费用人概是12.38万元,

故D错误.

故选:ABC.

3.(2024・陕西)某村在推进乡村振兴的过程中,把做活乡村产业作为强村富民的重要抓手,因地制宜推进

茶叶种植,成立了茶叶合作社.为了对茶叶在销售旺季进行合理定价,合作社进行了市场调研,得到了销

售旺季时销量(吨)关于售价x(元/公斤)的散点图.

,,销量(吨)

160

140

120

100

80

60

40

20

•IIIa•I.

O200220240260280300320x^(元/公斤;

⑴求)'关于X的线性回归方程;

⑵该合作社2023年茶叶总产量为150吨,如果在销售旺季时售价为250元/公斤,在销售旺季没能售出的,

年底以每公斤100元的价格卖给批发商,则该合作社2023年的总销售额为多少万元?

2—)(y二)

公式及参考数据:>关于x的线性回归方程为»=瓜+。,其中右二上七-----------,a=y-by,1=250,

EU-^)2

i=l

y-no,£(七一元)(£_》)__5600,£(%-元)2-7000.

;=!;=1

4

【答案】⑴)=一三/+300

(2)3万元

.£(—)(一)-004

[解析](1)由已知/?=J-------

z(门)2700045

X250=300

所以)'关于1的线性回归方程为力=-4/+300;

4

(2)由(1)得当x=25O时,y=一一x250+300=100,

5

即旺季时的俏量约为100吨,剩下的约为50吨,

所以该合作社2023年的总销售额(100x250+50x100)x103=30000000(元),

即该合作社2023年的总销售额为3000万元.

考法二残差的计算

【例2】(2024•云南大理)已知某种商品的广告费支出工(单位:万元)与销售额)'(单位:万元)之间有

如下表对应数据:

X13457

y1520304045

根据表中数据得到)'关于x的经验回归方程为3=551+4,则当x=7时,残差为.(残差=观测值•

预测值)

【答案】-1.5

【解析】x=1x(l+3+4+5+7)=4,y=ix(15+20+30+40+45|=30,

因为回归直线过点(4,30),代入£=5.5工+4,可得30=5.5x4+4,4=8,

当工=7时,>'=5.5x7+8=38.5+8=46.5,

所以残差为45-46.5=-1.5.

故答案为:-1.5

【一隅三反】

1.(2023黑龙江双鸭山)色差和色度是衡量玩具质量优劣的重要指标,己知该产品的色度)'和色差x之间

满足线性相关关系,.且),=0.8x-1.8,现有一对测量数据为(30,22.8),则该数据的残差为()

A.0.6B,0.4C.-0.4D.-0.6

【答案】A

【解析】当4=30时,>0.8x30-1.8=22.2,所以该数据的残差为22.8-22.2=0.6.故选:A.

2.(2023•河南)已知一组样本数据(方,匕),(巧,与),,(・%%),根据这组数据的散点图分析》与)'之间的

线性相关关系,若求得其线性回归方程为9=-30.4+135-则在样本点(9,53)处的残差为()

A.38.1B.22.6C.-38.1D.91.1

【答案】C

【解析】因为观测值减去预测值称为残差,所以当X=9时,2-30.4+13.5x9=91.1,

所以残差为53-91.1=-38.1.故选:C.

3.(2024•云南楚雄)对具有线性相关关系的变量苍丁有一组观测数据(菁,£)(/=1,2,..,10),其经验回归方

程为$=-3.2x+4,且[=](),亍=8,则相应于点(1057)的残差为.

【答案】|/0.6

【解析】•••经验回归直线£'=-3.2%+々过样本点的中心(10,8),,8=—3.2x10+3,••.4=40,

•••经验回归方程为9=-3.2X+40.当x=10.5时,》=-3.2x10.5+40=6.4,.•.残差为7—6.4=06.

故答案为:0.6.

考法三回归效果的刻画方式

【例3-1](2024吉林长春)(多选)对两组线性相关成对数据进行回归分析,得到不同的统计结果,第•组

和第二组成对数据的样本相关系数,残差平方和,决定系数分别为4,S:,僧和4,S;,8,则()

A.若则第一组成对数据的线性相关关系比第二组的强

B.若,则第一组成对数据的线性相关关系比第二组的强

C.若S:<S,则第二组成对数据的经验回归模型拟合效果比第•组的好

D.若苗<8,则第二组成对数据的经验回归模型拟合效果比第一组的好

【答案】BD

【解析】由卜|越趋近1,数据的线性相关关系越强知,A错误;B正确;

由残差平方和越小,则数据的经验回归模型拟合效果越好知,C错误;

由决定系数越大,则数据的经验回归模型拟合效果越好知,D正确,

故选:BD

【例3-2](2024黑龙江哈尔滨)如图,5个(X,),)数据,去掉。(3,10)后,下列说法正确的是()

rf•E(10,12)

•0(3,10)

•C(4,5)

•8(2,4)

7(1,3)

O

A.样本相关系数,•变小

B.残差平方和变大

C.决定系数片变大

D.解释变量x与响应变量),的相关性变弱

【答案】C

【解析】由敢点图可知,去掉点。后,X与丁的相关性变强,且为正相关,所以「变大,R2变大,残差平

方和变小.故选:c

【一隅三反】

1.(2024河北邢台)中国茶文化博大精深、茶水的I】感与茶叶的类型和水的温度有关,某数学建模小组建

立了茶水冷却时间x和茶水温度丁的一组数据(七,丫),经过分析,提出了四种I可归模型,①②③④四种

模型的残差平方和gbi-yj的道分别是1.23、0.80、0.12、136.则拟合效果最好的模型是()

A.模型①B.模型②C.模型③D.模型④

【答案】C

【解析】残差平方和越小则拟合效果越好,而模型③的值最小,所以C正确.故选:C

2.(2023四川成都)收集一只棉铃虫的产卵数与温度工的几组数据后发现两个变量有相关关系,按不同

的曲线来拟合〉马戈之间的回归方程,并算出了对应的决定系数R?如下表:

拟合曲线直线指数曲线抛物线二次曲线

O.27x-3.84

y与x的回归方程y=19.8x-463.7y=ey=0.367x2-202y=J(x-0.78)2-1

R20.7460.9960.9020.002

则这组数据模型的同归方程的最好选择应是()

A.y=19.8.r-463.7B.产产―

2

C.),=0.367/-202D.y=A/(x-0.78)-1

【答案】B

【解析】由决定系数*来刻画回归效果,R2的值越大越接近1,说明模型的拟合效果最好.由表可知指数

模型的决定系数最接近1.

故选:B.

3.(2023•江苏徐州)(多选)某研究小组采集了5组数据,作出如图所示的散点图.若去掉力(3,10)后,下

列说法正确的是()

£(10,12)

・。(3/0)

C(4,5)

•5(2,4)

"(1,3)

Ox

A.相关系数/■变小

B.决定系数解变大

C.残差平方和变大

D.解释变量X与预报变量了的相关性变强

【答案】BD

【解析】根据散点图可知,去掉点。(3,10)后,y与X的线性相关性加强,且为正相关,

相关系数〃变大,则A错D对,

去掉点。(3,10)后,残差平方和变小,则齐变大,B对C错.

故选:BD.

4.(2024重庆.开学考试)(多选)为研究女儿身高.V与母亲身高工的关系,现经过随机抽样获得成对样本数

据(公,%),(X2,丁2),…,(小”),下列说法正确的是()

A.落在回归直线上的样本点越多,回归直线方程的拟合效果越好

B.样本相关系数卜I越大,变显x,y线性相关程度越强

C.决定系数R2越小,残差平方和越大,模型的拟合效果越好

D.决定系数R2越大,残差平方和越小,模型的拟合效果越好

【答案】BD

【解析】对于A:回归直线方程拟合效果的好坏是由决定系数叱来判断的,故A错误:

对于B:因为吊01,且相关系数卜|越接近1,变量覆丁线性相关程度越强,故B正确;

对于C:决定系数店越小,残差平方和越大,模型的拟合效果越差,故C错误;

对于D:决定系数代越大,残差平方和越小,模型的拟合效果越好,故D正确.故选:BD

考法四经验回归模型的选择

【例4・1】(2023河南信阳•期末)如图是两个变量的散点图,关于x的回归方程可能是()

y木

4-

•3

A.>'=3In|x|+2B.y=3exC.y=-2x3+2D.y=-----x+2

10

【答案】c

【解析】由散点图可知,与X负相关,故排除A,B,对J":y=-x+2,点伍y)偏离),=-\x+2较大,

而点(乂力近似在曲线),=-2/+2附近,所以),关于x的回归方程是C的可能性大.

故选:C.

【例4-2】(2023江苏)在一次数学建模活动中,某同学采集到如下一组数据:

X-2-10123

y0.240.5112.023.988.02

以下四个函数模型(小〃为待定系数)中,最能反映),与工的函数系的是()

A.y=a+bxB.y=a+bxC.y=a+logi,xD.y=a+-

x

【答案】B

【解析】由表格中的数据•,作出数据的散点图,如图所示,

数据散点图和指数型图数的图象类似,所以选项B最能反映x,y之间的函数关系.

故选:B.

【一隅三反】

1.(2023河南)已知关于变量X/有相关关系,由观测数据得到的样本数据散点图如图所示,则该组观测

数据中)'关于x的回归方程可能是()

C.y=-3x2+4x+0.5D.y=.v3-x+0.5

【答案】D

【解析】由散点图可知,所求回归方程先减后增,选项中A,B均为定义域上的增函数,不符合题意;

选项C中的函数图象为开口向下的抛物线,不符合题意;

而选项D中的函数图象增减性与散点图符合题意,故D正确.

故选:D.

2.(2023福建福州)某个国家某种病毒传播的中期感染人数),和天数x的散点图如图所示,下列最适宜作

为感染人数),和天数x的经验【可归方程类型的是()

Y

®

A.y=a+bxB.y=a+bex

C.y=a+/"nxD.y=a+h\[x

【答案】B

【解析】由图可知,图象随着x的增大而增高,且增长速度越来越快,

结合选项,可判断y=a+岳工最适宜作为感染人数),和时间x的回归方程.故选:B

考法五非线性回归方程

【例5-1](2023•四川遂宁)某池塘中水生植物的覆盖水塘面积x(单位:dm?)与水生植物的株数),(单位:

株)之间的相关关系,收集了4组数据,用模型),=ce"(c>0)去拟合x与),的关系,设z=lny,%与z的数

据如表格所示:

X3467

Z22.54.57

得到x与z的线性回归方程$=1.2x+》,贝代=.

【答案】e-2/\

e

■i—।A.-rzra-3+4+6+7_2+2.5+4.5+7

【解析】由已知可得,x=---------——=5,z=---------------------=4,

44

所以,有4=12x5+。,解得4=一2,

所以,z=L2x-2,

由z=lny,得lny=12r-2,

2x222x

所以,y=e'~=e~-e'-f则。=©-2.

故答案为:e-2

【例5-2](2024江西♦期中)2020年是具有里程碑意义的一年,我们将全面建成小康社会,实现第一个百年

奋斗目标;2020年也是脱贫攻坚决战决胜之年.为贯彻落实党中央全面建设小康社会的战略部署.某贫困地区

的广大党员干部深入农村积极开展"精准扶贫”工作.经过多年的精心帮扶,2020年8月,为估计该地能否

在2020年全面实现小康,统计了该地当时最贫困的一个家庭2020年1至7月的人均月纯收入,作出散点

图如下.观察散点图,发现其家庭人均月纯收入)'(元)与时间代码”之间不具有线性相关关系(记2020年1月

、2月…分别为x=l,x=2,…,依此类推),现考虑用对数函数模型产。+力1门和指数函数模型),=cd分

别对两个变量的关系进行拟合.

(1)根据散点图判断,),=〃+川nx与),=c・d'(c,d均为大于零的常数)哪一个适宜作为家庭人均月纯收入

)'关于时间代码x的回归方程类型;(给出判断即可,不必说明理由)

(2)根据(1)的判断结果及参考数据,求)'关于x的回归方程.

参考数据:

yV10°54

/-Ir-l

匕=igX1.54253550.123.47

其廿中।匕=他1男,-^=亍1之弋外.

//=1

参考公式:对于一组数据(%,匕),(町匕),…,(心匕),其回归直线;="+例的斜率和截距的最小二乘估

y'jijVj-nuv

计公式分别为夕=号£--“-;---脑丁,a=v-fiu.

【答案】(1)),=cd适宜;(2)y=3.47xlOo25t.

【解析】(1)根据散点图判断,函数y=c•十适宜作为家庭人均月纯收入关于时间代码x的回归方程类型.

(2)由),=°.,,两边同时取常用对数得lgy=lg(cM')=lgc+xlgd

设lg.y=v,所以u=lgc+xlg”,

因为x=4,v=1.54,>X=140,

1=1

2%匕-7.2

50.12-7x4x1.547…

所以lgd=l-l______________----------------;----=-=0.25.

£5140-7x4228

/=1

把(4』.54)代入;;=lgc+kgd,得1gc=0.54,

所以;=0.54+0.25x,即电y=0.54+0.25A,所以),=]0a54>a25v=3.47x1Oo25v,

即了关于x的回归方程为y=3.47x10025\

【一隅三反】

1.(2023・全国•模拟预测)以函数模型y=ce3,(c>0)去拟合一组数据(当,匕),(々,/),…,(/,"),设z=I”,

£>=12,t>=48,则c的值为.

/=1<=1

【答案】/

[解析]由y=e"(c>0),两边同时取对数可得In),=In(ce3v)=lnc+lne3x=lnc+3x,

由z=lny,可得z=lnc+3;v.

因为元=工£苦=2,Z=-XZr=8'

Gr=l6M

所以直线Z=hic+3x过点(2,8),

所以8=lnc+6,得以c=2,所以c=e?.

故答案为:e2

2.(2024山东•开学考试)某市为繁荣地方经济,大力实行人才引进政策,为了解政策的效果,统计了2018-2023

年人才引进的数量)'(单位:万人),并根据统计数据绘制了如图所示的散点图(工表示年份代码,年份代

码1-6分别代表2018-2023年).

M万人)

0

9

8

7

6

5

4

3

2

o\'234567~~?

⑴根据散点图判断y=b]rtx+a与y=et+d'(均为常数)哪一个适合作为了关于工的回归方程类型;(给

出结论即可,不必说明理由)

(2)根据(1)的结果及表中的数据,求出)'关于x的回归方程,并预测该市2025年引进人才的数量;

⑶从这6年中随机抽取4年,记引进人才数量超过4万人的年数为X,求X的分布列和数学期望.

参考数据:

EU-J)2玄%-可(力-刃£(七-可(叱-沔

yW

i=!1=1f=!

5.151.5517.520.953.85

16

244254

其中刃=-2叱,叱=Iny.,e®11.47,e之12.68.

6,=1

参考公式:对于一组数据(%,匕),("2,岭)"一口,匕),其回归直线y=a+&”的斜率和截距的最小二乘估计分

别为:B=J,-----疝=H-丽.

£(%-万)2

r=l

【答案】⑴选择y=e心更合适.

(2)y=e°22x.078,12.68万人

⑶分布列见解析,2

【解析】(1)根据散点图可知,选择‘,=e"〃更合适.

(2)因为),二小,所以两边同时取常用对数,得ln),=c+&

设w=lny,则印=0+公,先求卬关于x的线性回归方程.

1+2+3+4+5+6与二

因为工==3.3,

6

.Z(若一可(叫一记)

d=4

之(七-亍)2篝=3

/=!

c=w-0.22x=1.55-0.22x3.5=078,

所以y_eO.22x-H).78

把工=8代入上式,得),=-1268,

故预测该市2025年引进人才的数量为12.68万人.

(3)这6年中,引进人才的数量超过4万人的年数有3个,所以X的所有可能取值为1,2.3.

P(X=1)=等y="°y(X=2°)=^="y(X=°3)=譬='

所以X的分布列为

3.(2024浙江宁波)某企业对2023年上半年的月利润情况进行调查统计,得到数据如下:

月份X123456

净利润)’(万元)510265096195

⑴根据散点图判断,_>,=比公与),=〃+版b,c,d均为大于零的常数)哪一个更适宜作为描述了与x关

系的回归方程类型?(给出判断田可,不必说明理由)

⑵根据(1)的判断结果求出)'关于x的回归方程;

⑶已知该企业的产品合格率为90%,现随机抽取9件产品进行检测,则这9件产品中合格的件数最有可能

是多少?

参考数据:

之(%-对-5『

Xy历2a-可®-而)ZU-^)(x-7)

1-1r-lr-lM

3.5063.673.4917.509.4912.95519.01

其中&=3.

参考公式:用最小二乘法求经验回归直线方程$,=良+。的系数公式为,

b=*F一■元一,a=y-bx.

E(37)

1=1

【答案】(l).y=ce”'

(2)y=ea74x+ow

(3)8件或9件

【解析】(1)由于散点图呈现在曲线附近,所以选择),=人心

(2)两边取对数,得lny=dr+lnc,

设ln.v=3,lnc=e,建立/关于N的回归方程应=去+2,

乎可一而)(七一五)12,95n_.

则(1=---------;——=-----=0.74,

Z6a一寸17.50

/-I'

e=a)-clx=3.49-0.74x3.50=0.90,

所以勿关于x的回归方程为由=0.74X+0.90,所以£=/74,+。如

(3)设抽到的产品中有X件合格品,则乂~8(9,0.9),

所以P(X=A)=C•0.9*0.19-*(k=0,1,2,...,10),

P(X=k)>P(X=k+\)Jc10.9仙0.19-*>C$+,-0.9"”•0.18-*

"(x=A)2pjx=k-i,'即[c;-o.9*•o.”>cJT•0.91・。严

,9!•0。•0.”>-————-•0.9川.0.”

kl(9-k)l(左+1)!(8_k)!

9!

z-o.9*•()/j>-——-2:——

七(9一攵)!仅一1)!(10-左)!

解得8KAK9,

所以最有可能是8件或9件.

强化练习

一.单选题

1.(2024•全国•模拟预测)已知工与丁之间的一组数据:

则y与5的线性回归方程5,=九十。必过定点()

A.(0.5,3)B.(1.5,4)

C.(1,2)D.(2,4)

【答案】B

【解析】由表格中的数据,可得;=0+1:2+3=1.5,'=1+3:5+7=4,

44

即数据的样本中心为(1.5,4),所以问归直线方程$,=去+否必过定点(154).

故选:B.

2.(2024安徽)下表数据为2017〜2021年我国生鲜零售市场规模(单位:万亿元),根据表中数据可求得

市场规模)'关于年份代码x的线性回归方程为y=0.34x+〃,则〃=()

年份20172018201920202021

年份代码X12345

市场规模)’4.24.44.75.15.6

A.1.01B.3.68C.3.78D.4.7

【答案】C

【解析】由题意得,7=3,亍=4.8,所以〃=亍一爪=4.8-0.34x3=3.78.故选:C.

3.(2024江西上饶)根据如下样本数据,得到回归直线方程$=加+名,则()

X345678

y-3.0-2.00.5-0.52.54.0

A.〃>(),b>()B.〃>(),i<()

C.d<0»b>0D.«<0♦B<0

【答案】c

【解析】做出散点图,由散点图判断出的正负.

1234Sg7S

从整体上看这些点大致分布在一条直线的周围,且该回归直线的斜率为正,在)'轴上的截距为负则&<0,

6>0

故选:C

4.(2024辽宁)下列有关回归分析的说法正确的是()

A.样本相关系数〃越大,则两变量的相关性就越强.

B.回归直线就是散点图中经近样本数据点最多的那条直线.

C.回归直线方程不一定过样本中心点(其田.

D.回归分析中,样本相关系数,•<(),则两变量是负相关关系.

【答案】D

【解析】由知识点:两变量的相关性就越强,则相关系数r越接近1或-1可知A不正确;由回归直线是基于

样本数据使残差平方和最小的拟合直线可判断B不正确;由回归直线方程一定过样本中心点(无方可知C不

正确;由当相关系数,o0时两个变量正相关,厂<0时两个变量负相关可得D正确.

故选:D

5.(2023•江苏苏州)为研究某地区疫情结束后一段时间内的复工率,用模型(1)和模型(2)模拟复工率

y(%)与复工时间x(X的取值为5,10,15,20,25,30天)的回归关系:模型(1)》⑴=〃+",模型

(2)y(2)=e,+d]设两模型的决定系数依次为R:和后.若两模型的残差图分别如下,则()

模型(1)的残差图模型⑵的残差图

6

残3

差0差0

%%

10152025301015202530

A.B.R:二R;

C.R;>R;D.R;、&关系不能确定

【答案】A

【解析】根据残差点图,模型(2)残差点比较均匀地落在水平的带状区域中,带状区域宽度窄,拟合精度

较高,所以R;<R;,故选:A.

6.(2024河南)两个变量丁与x的回归模型中,分别选择了4个不同的模型,其中拟合效果最好的模型是

()

A.模型1的决定系数*=0.05B.模型2的决定系数六=0.49

C.模型3的决定系数代=0.89D.模型4的决定系数2=0.98

【答案】D

【解析】决定系数K越大(接近1),模型的拟合效果越好;决定系数尺'越小,模型的拟合效果越差.模

型4的决定系数最大、最接近1,其拟合效果最好.

故选:D.

7.(2024天津)下列说法中正确的个数为()个

①互斥事件一定是对立事件.

②在回归直线方程夕=().支+1()中,当解释变量x每增加一个单位时,预报变量》增加10.1个单位;

③两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;

④在回归分析模型中,若相关指数配越大,则残差平方和越小,模型的拟合效果越好.

A.1B.2C.3D.4

【答案】C

【解析】对于①,对立事件一定是互斥事件,但互斥事件未必是对立事件,①错误;

对于②,根据回归直线方程中回归系数的含义可知:当解释变量x每增加一个单位时,预报变量增加0.1

个单位,②正确;

对F③,根据相关系数的计算公式可知:相关系数的绝对值越接近1,两个变显的线性相关性越强,③正

确;

对于④,根据回归分析的基本思想可知:相关指数支越大,残差平方和越小,模型的拟合度越高,④正

确.

故选:C.

8.(2024・浙江)假设变量%与变量y的〃对观测数据为(x,y),伍,%),…,(天,”),两个变量满足一元线性

3/、,

回归模型1Y(=>bx+0e,*)=尸要利用成对样本数据求参数匕的最小二乘估计人A即求使QS)[(£一姐)一

取最小值时的〃的值,则()

一.

■Z%)',.Zx,

A.&=R­B.3T一

E,v;

i-l/=!

n.

人-7)(凹一方

C飞;加D飞二他GT

【答案】A

【解析】因为0(。而=支(%-如『=宜(十一2如.%+1%2)=/基j一处之与必十为y:,

c=lf=lr»1r=lr=l

上式是关于〃的二次函数,因此要使Q取得最小值,当且仅当人的取值为人=号一.故选:A.

r=l

二.多选题

9.(2024河南)已知变量乂)’之间的经验回归方程为y=-?x+。,.且变量尤y的数据如下表所示:

X5681214

y108651

则下列说法正确的是()

A.变量X,)'之间负相关B.〃=]3

C.当x=3时,可估计)'的值为11D.当x=8时,残差为-1

【答案】AC

【解析】对于A选项,由-■!<(),可得变量x,y之间负相关,盘A选项正确:

6

对于B选项,:=(x(5+6+8+12+14)=9,亍=(x(10+8+6+5+1)=6,

_527

将工=9,),=6代入经验回归方程,有6=-7乂9+4,可得。=?,故B选项错误;

62

5275”

对于C选项,由上知),=一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论